为测试主流大模型的数理水平,6月8日,新京报组织专项测评,让六款AI大模型作答2026年新高考I卷数学试题。测评结果出炉,讯飞星火以148分的总分位居榜首,成绩优于Kimi、DeepSeek、智谱、MiniMax、ChatGPT。在专业教师看来,当下大模型的数学比拼,早已从单纯算出答案,转向解题过程、逻辑严谨性的综合较量,而这正是讯飞星火的优势所在。它的每一道题目解答都流程规范,推理过程清晰易懂,过程分和结果分保持一致,不存在步骤缺失、推导混乱等问题。压轴题作为复杂推理能力的分水岭,最能体现各模型的差距,多数模型在此类题目中后继乏力。评审的北京市中学数学特级教师直言,讯飞星火在数形结合、图形几何性质研究方面,能力远超其他参评模型。作答时,它不仅解法简洁高效,还会主动提供多种解题思路,灵活运用各类数学知识化解难题。整体而言,讯飞星火在高考数学场景中,兼具准确率、规范性与逻辑深度,综合解题实力在一众大模型中处于领先位置。
#人工智能国家队##大模型国家队##全栈自主可控#
