千问发布全球最强推理模型Qwen3-Max-Thinking，刷新多项性能纪录

千问发布全球最强推理模型Qwen3-Max-Thinking，刷新多项性能纪录

阿里推出参数超万亿的千问旗舰模型Qwen3-Max-Thinking，在科学、数学、编程等关键评测中登顶全球，并首次实现“边思考边调用工具”的原生智能体能力。

核心重点内容：
1.性能登顶：在GPQA Diamond（科学）、IMO-AnswerBench（数学）、LiveCodeBench（编程）等权威测试中刷新全球纪录，19项基准测试多项第一。
2.推理革新：采用“测试时扩展”机制，通过自我迭代提炼推理经验，在HLE测试中得分58.3，显著领先GPT-5.2与Gemini 3 Pro。
3.原生Agent：无需人工干预，自主调用搜索、记忆、代码解释器三大工具，实现专业级任务协作，幻觉大幅降低。
4.免费开放：开发者、企业与普通用户均可通过QwenChat、百炼API及千问客户端免费体验。

DC娱乐网

千问发布全球最强推理模型Qwen3-Max-Thinking，刷新多项性能纪录

热门分类