AI行业已全面进入“ Agent 时代”,在这个新范式中, AI 模型的功能远不止生成文本——它们现在可以在数天而不是几秒钟的时间内积极地规划、执行和纠正复杂的任务。
因此,看到阿里旗下 Qwen AI 研究团队发布了一款能够连续多天执行自主 Agent AI 工作的模型,或许并不令人惊讶:该模型以Qwen3.7-Max的形式出现,该公司在一篇博客文章中报告称,该模型实现了“约35小时的连续自主执行”——尽管它采用的是专有格式,而不是像之前的Qwen团队版本那样是开源的。
这也在意料之中——今年早些时候,Qwen团队几位核心领导离 职后,许多分析师和行业专家就担心会出现这种情况。但至少从短期来看,这对阿里巴巴的财务状况来说是合理的:训练 AI 模型,尤其是像Qwen3.7-Max这样强大的模型,成本很高,而像开源模型那样几乎免费提供,并不能立即弥补任何成本。
从这个意义上讲,阿里巴巴只是在与 OpenAI 和谷歌等美国 AI 巨头保持一致,仅通过付费 API 和订阅或付费网络套餐提供最新最好的模型,而通过开源提供性能稍差的模型。
尽管如此,Qwen3.7-Max 的推出为企业和个人用户提供了更多选择,也为美国的 AI 实验室带来了更多竞争——这对各个预算水平的消费者来说通常都是一件好事。然而,该模型只能从中国境内的终端访问,这意味着它对那些希望在履行政府合同时最大限度地提高合规性和安全性,甚至仅仅是试图遵守所有相关的州、地方和国家数据主权法规的美国和欧洲企业的吸引力可能有限。
AI 的马拉松时代
要了解 Qwen3.7-Max 与之前的模型有何不同,必须了解它的训练方式以及它在实践中的运行方式。
语言模型在被迫在数千次对话中保持单一思路时,性能通常会下降;它们会忘记指令、产生错误的变量,或者陷入逻辑循环。Qwen3.7-Max 被专门设计为一个“多功能智能体基础”,能够进行“长时域推理”,以克服这一瓶颈。
Qwen团队详述的一项自主工程任务最能体现这一能力。该模型被授予访问一台配备T-Head ZW-M890 PPU的独立服务器的权限——这是该模型在训练过程中从未接触过的硬件架构。它的任务是优化一个注意力内核
在连续 35 个小时内


