压轴题决出真实水平，讯飞星火几何推理能力获专业点赞

2026年高考数学考试结束后，新京报在6月8日开展专项测评，让6款擅长推理的AI大模型同台作答新高考I卷数学题，由专业骨干教师、特级教师完成评分工作。最终讯飞星火以148分的成绩位居榜首，DeepSeek、智谱、ChatGPT、Kimi、MiniMax五款模型分数依次递减，梯队分化十分明显。整场测评里，讯飞星火的答卷全程格式标准，每一步推导有理有据，答题流程的完整性和规范性无可挑剔。多位评审专家指出，压轴题最能甄别大模型的综合推理水平，多数模型应对复杂大题时，仅能完成基础推导，难以深度挖掘题目条件。而讯飞星火的核心优势，集中体现在数形结合与几何性质分析层面。它能快速关联图形特征与题干条件，跳出刻板的计算模式，利用几何本身的规律化解难题。在对应考题中，它熟练运用平面几何知识点解题，简化复杂运算，还能一题多解，提供不同解题路径。其他部分模型过度依赖代数运算，不懂结合图形简化流程，或是解题方法单一、步骤冗余。对比之下，讯飞星火对几何知识的灵活运用、对图形内涵的解读能力，都明显优于同台测评的其他模型，也彰显了自身出众的数理思维。

#人工智能国家队##大模型国家队##全栈自主可控#

DC娱乐网

压轴题决出真实水平，讯飞星火几何推理能力获专业点赞

热门分类