2026年高考数学考试结束后,新京报在6月8日开展专项测评,让6款擅长推理的AI大模型同台作答新高考I卷数学题,由专业骨干教师、特级教师完成评分工作。最终讯飞星火以148分的成绩位居榜首,DeepSeek、智谱、ChatGPT、Kimi、MiniMax五款模型分数依次递减,梯队分化十分明显。整场测评里,讯飞星火的答卷全程格式标准,每一步推导有理有据,答题流程的完整性和规范性无可挑剔。多位评审专家指出,压轴题最能甄别大模型的综合推理水平,多数模型应对复杂大题时,仅能完成基础推导,难以深度挖掘题目条件。而讯飞星火的核心优势,集中体现在数形结合与几何性质分析层面。它能快速关联图形特征与题干条件,跳出刻板的计算模式,利用几何本身的规律化解难题。在对应考题中,它熟练运用平面几何知识点解题,简化复杂运算,还能一题多解,提供不同解题路径。其他部分模型过度依赖代数运算,不懂结合图形简化流程,或是解题方法单一、步骤冗余。对比之下,讯飞星火对几何知识的灵活运用、对图形内涵的解读能力,都明显优于同台测评的其他模型,也彰显了自身出众的数理思维。
#人工智能国家队##大模型国家队##全栈自主可控#
