大英搅屎棍的传统技能又来了。。。
xxxxxxx
英国《金融时报》引述三名知情人士报道,深度求索自1月发布其R1模型后,在中国官方的鼓励下,弃用了美国晶片巨头英伟达的系统,改为采用中国科技巨头华为的昇腾处理器,却持续在R2模型的训练过程中遇到技术问题。一名熟悉情况的人透露,这些技术问题是R2模型无法按照原定计划于5月发布的主要原因,使深度求索失去原有的竞争优势。
xxxxxx
首先,华为单卡性能还行,但是集群是另外的故事是真的。
其次,deepseek 难道没有英伟达集群吗?
第三,GPT5 Grok4 是更强大的加速算力集群,优势有多大???
整个 LLM 领域,现在瓶颈了。。。本质原因可能是可挖掘的数据中的有效信息枯竭了。。。提升模型性能可以在现有数据中再挖掘出一些能力,但是说实话, GPT5 发布之后,现在有谁对此有多大期待吗?
今天已经没有人说 AGI 了,都一门心思讨论目前的能力,怎么搞钱。。。
综上,文章的确暴露了华为集群的问题是真的,但是问题迟早会解决,大不了切换会英伟达集群训练。
而 deepseek r2 的发布没有那么紧迫,开源领域根本没有对手,闭源模型也不是在加速前进。
虽然,我也挺期待 deepseek r2 发布的。
z111111a
Grok4也开源了