12万数学题特训AI模型超难AI数学特训集AI也能像数学家一样证明定理?腾讯AI

量子位看科技 2025-06-06 11:25:30

12万数学题特训AI模型超难AI数学特训集

AI也能像数学家一样证明定理?腾讯AI Lab与上海交大团队联手推出DeepTheorem,用12.1万道IMO级难度题“特训”AI模型,让7B模型性能赶超Claude3.7等商业巨头。

DeepTheorem框架是首个自然语言定理证明平台,覆盖数据、训练、测试、评估四大模块:

- 数据集包含121K高难度题目及o3-mini生成的配套证明,难度对标国际数学竞赛。

- 用强化学习训练模型进行定理证明,跳出形式语言束缚,利用自然语言理解力。

- 专设测试集FIMO、HMMT、PutnamBench并手工扩展变体,总数达658个。

- 评估标准涵盖最终判断与证明过程,由GPT-4o从四维度打分。

DeepTheorem的推出突破了传统定理证明范式,团队希望未来AI能真正迈入复杂认知系统,实现更强通用智能。

0 阅读:8
量子位看科技

量子位看科技

感谢大家的关注