两个重磅消息接踵而来,让外媒直接炸锅了,美学者大胆断言,美国基本退出了! 先是美国《纽约时报》曝出Meta要放弃最强大的开源AI模型Behemoth,转而开发闭源模型;紧接着英伟达CEO黄仁勋访华时,直言阿里云的通义千问和中国初创公司的DeepSeek都是世界顶尖的开源大模型。 先说Meta的动向。Meta这些年一直是开源AI的重要推手,像Llama系列模型,从Llama1到Llama4,每次发布都在刷新开源模型的性能上限。 特别是2025年4月推出的Llama4,采用混合专家架构,参数规模达到4000亿,多模态能力更是领先。可谁能想到,仅仅三个月后,Meta就动了放弃开源的念头。 要知道,Behemoth可是Meta投入大量资源训练的2万亿参数模型,原本被寄予厚望。现在因为性能不达标,发布无限期推迟,这让Meta高层开始重新审视开源策略。 Meta转向闭源的影响可不小。过去,Meta的开源模型让全球开发者受益,像腾讯云、亚马逊等企业都基于Llama开发应用。要是Meta真的放弃开源,开发者可能得转向其他模型,比如中国的通义千问和DeepSeek。 更关键的是,这可能会影响整个开源AI生态的发展。美国宾夕法尼亚大学的莫里克教授就直言,Meta这一动作意味着美国基本退出了前沿开源大模型的竞争。 再看另一边,黄仁勋访华时对中国开源模型的评价,更是让外媒坐不住了。黄仁勋作为英伟达的CEO,对AI技术的发展趋势有着敏锐的洞察力。他这次访华,特意和阿里云创始人王坚会面,还公开称赞通义千问和DeepSeek是世界顶尖的开源大模型。 通义千问是阿里云的招牌产品,2025年4月开源的Qwen3版本,参数量235B,性能全面超越DeepSeek-R1和OpenAI-o1。它采用混合专家架构,支持多语言,成本还低,4张H20芯片就能部署。 在AIME25测评中,Qwen3拿下81.5分,刷新了开源模型的纪录;在评测中,表现甚至超过Grok3。这些数据可不是随便说说的,都是经过权威测试验证的。 DeepSeek则是中国初创公司深度求索的产品,2025年1月发布的R1版本,一上线就引发全球关注。它在GenEval和DPG-Bench基准测试中击败了StableDiffusion和DALL-E3,下载量更是在短时间内登顶多个国家的应用商店。 DeepSeek-R1的开发成本不到600万美元,却能和OpenAI的模型媲美,这让不少美国投资者大跌眼镜,甚至导致英伟达股价暴跌。 黄仁勋的评价可不是客套话。他深知,中国的开源模型在性能、成本和生态建设上都有明显优势。通义千问和DeepSeek不仅技术过硬,还采用宽松的开源协议,全球开发者都能免费使用和修改。这种开放的模式,正好契合了当下AI技术普惠化的趋势。 这两件事放在一起看,就能看出全球AI格局正在发生深刻变化。美国在开源领域的传统优势正在被削弱,而中国则凭借技术突破和开放策略,逐渐成为开源AI的新领导者。Meta转向闭源,可能是美国企业在竞争压力下的自保之举,但这也给了中国模型更大的发展空间。 从技术层面看,中国的开源模型在多个关键指标上已经达到国际顶尖水平。通义千问的混合推理模型、DeepSeek的多模态能力,都展示了中国AI的创新实力。 更重要的是,中国企业在开源生态建设上做得很扎实。阿里开源了200多个模型,全球下载量超3亿次;DeepSeek也吸引了微软、英伟达等国际巨头的支持。这种生态优势,让中国开源模型在开发者中越来越受欢迎。 从国际竞争的角度看,美国在AI领域的“进攻”和“防卫”战略似乎有些吃力。一方面,美国通过芯片出口管制等手段限制中国AI发展;另一方面,中国却在开源领域另辟蹊径,用开放合作的方式赢得国际认可。黄仁勋的访华和评价,某种程度上也反映了美国科技界对中国AI进步的正视。
两个重磅消息接踵而来,让外媒直接炸锅了,美学者大胆断言,美国基本退出了! 先是美
流水梦寒月影
2025-07-22 15:18:42
0
阅读:1