千问发布全球最强推理模型Qwen3-Max-Thinking,刷新多项性能纪录 阿里推出参数超万亿的千问旗舰模型Qwen3-Max-Thinking,在科学、数学、编程等关键评测中登顶全球,并首次实现“边思考边调用工具”的原生智能体能力。 核心重点内容: 1.性能登顶:在GPQA Diamond(科学)、IMO-AnswerBench(数学)、LiveCodeBench(编程)等权威测试中刷新全球纪录,19项基准测试多项第一。 2.推理革新:采用“测试时扩展”机制,通过自我迭代提炼推理经验,在HLE测试中得分58.3,显著领先GPT-5.2与Gemini 3 Pro。 3.原生Agent:无需人工干预,自主调用搜索、记忆、代码解释器三大工具,实现专业级任务协作,幻觉大幅降低。 4.免费开放:开发者、企业与普通用户均可通过QwenChat、百炼API及千问客户端免费体验。

