DC娱乐网

标签: deepseek

【英伟达表示,中国军方依赖美国技术是“荒谬的”】(汤姆硬件)人工智能巨头兼GPU

【英伟达表示,中国军方依赖美国技术是“荒谬的”】(汤姆硬件)人工智能巨头兼GPU

【英伟达表示,中国军方依赖美国技术是“荒谬的”】(汤姆硬件)人工智能巨头兼GPU制造商英伟达(Nvidia)就其被指控向DeepSeek提供技术援助以提高训练效率一事作出了强硬回应。此前路透社报道了英伟达致信美国商务部长霍华德·卢特尼克(HowardLutnick)的消息,该公司表示,中国军方依赖美国技术是“荒谬的”。英伟达在回复Tom'sHardware的一份声明中表示:“中国拥有足够多的国产芯片,足以满足其所有军事应用需求,甚至还有数百万颗的剩余。正如美国军方使用中国技术是荒谬的一样,中国军方依赖美国技术也是荒谬的。”英伟达进一步表示:“政府的批评者无意中促进了外国竞争对手的利益——美国应该始终希望本国产业参与经过审查和批准的商业竞争,从而保护国家安全,创造美国就业机会,并保持美国在人工智能领域的领先地位。”该公司声明并未直接回应穆勒纳尔提出的关于技术支持的具体指控,也未回应信中明确指出DeepSeek-V3使用NvidiaH800芯片进行训练的说法,这一点在DeepSeek的V-3技术报告中有更详细的阐述。最初的报道援引了DeepSeek-V3训练在效率提升方面的突破,声称众议院中国问题特别委员会主席约翰·穆勒纳尔(JohnMoolenaar)致信卢特尼克(Lutnick),声称“委员会从英伟达获得的文件显示,这一成就是在英伟达提供大量技术援助之后取得的”。具体来说,信中声称“根据NVIDIA的记录,NVIDIA的技术开发人员通过‘算法、框架和硬件的优化协同设计’,帮助DeepSeek实现了训练效率的大幅提升。”信中还声称,一份内部报告吹嘘DeepSeek-V3完整训练所需的GPU小时数显著减少,具体而言,仅需278.8万H800GPU小时。该报告声称,在英伟达的帮助下改进的模型“后来被中国军方使用”。据路透社报道,这些文件涉及2024年以后的活动,穆勒纳尔承认,在提供所谓援助时,并没有公开迹象表明中国军方正在使用DeepSeek的技术。据称,穆勒纳尔写道:“英伟达对待DeepSeek的方式是——将其视为合法的商业合作伙伴,理应获得标准的技术支持。”英伟达此前曾公开反对对其芯片实施出口管制,认为由于此类措施以及中国有利的能源基础设施,中国甚至可能“赢得人工智能竞赛”。
世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有崛起,中国只是恢复了历史地位,自古就是第一强国,他们有很多聪明的头脑,会做出许多伟大的事情,DeepSeek就是其中之一……”可谓是一针见血,振聋发聩!埃隆·马斯克作为特斯拉和xAI的领导者,在2025年1月底的德国WELT经济峰会上发表了这一观点。这次峰会聚焦全球经济与创新议题,马斯克的发言源于对亚洲科技动态的讨论。他强调,中国的发展不是从零起步,而是基于悠久的历史基础。中国古代发明了多项关键技术,如指南针和印刷术,这些成就让其在人类大部分历史时期保持领先。马斯克指出,当代中国通过大量投资教育和研发,培养出海量理工科人才,每年有超过800万STEM毕业生进入职场。这种人才储备直接支撑了人工智能等领域的快速进步。DeepSeek作为2023年成立的公司,短短时间内推出V3和R1模型,这些模型在性能上接近国际前沿,却只需较少计算资源完成训练。例如V3模型使用2048个NvidiaH800GPU,仅耗时57天,总成本约560万美元。这种效率体现了中国工程师在资源优化方面的实力。马斯克的表态并非孤立,他此前多次认可中国工程师的勤奋与创新动力。DeepSeek的崛起源于其创始人背景,该公司脱胎于量化基金高飞者,专注基础研究后转向人工智能开发。V3模型参数达671亿,但通过激活部分参数的机制,大幅降低能耗。在基准测试中,R1模型于2025年1月20日发布,专注于推理任务,成绩接近OpenAI的o1模型。马斯克在峰会上提到,DeepSeek并非彻底变革人工智能,但它是众多成就中的代表。中国人工智能生态通过政策支持和资金倾斜,形成从研发到应用的完整链条。国家每年投入巨额资金,推动企业探索实际场景应用,如在教育中生成个性化学习计划,在医疗中加速病例分析,在商业中提升报告生成速度。这些应用不仅提升效率,还降低门槛,让更多领域受益。马斯克认为,中国的数据资源丰富和计算优化技术,是其竞争优势的关键。中国在可再生能源领域的进展也与之呼应,占据全球40%以上的装机容量,这为人工智能训练提供稳定电力支持。他的观点基于对全球动态的观察,强调人才与资源的结合将催生更多成果。马斯克的发言虽赞扬DeepSeek,但也客观指出其局限。他表示xAI等公司即将推出更优模型,竞争将加剧。这反映出人工智能领域的动态平衡,中国虽在效率上领先,但西方企业在原创算法上仍有积累。DeepSeek的开源策略允许全球开发者修改和商用,促进技术扩散。这导致国际市场波动,例如美国芯片公司市值一度下降5000亿美元,促使更多投资转向高效创新。中国政策将人工智能列为重点方向,提供从人才培养到产业应用的全面支持。麦肯锡报告预测,到2030年全球就业将受人工智能影响,中国可能有1200万至1.02亿人需转型。为此,教育部计划普及中小学人工智能教育,清华大学开设相关通识课程。这些举措旨在应对挑战,确保技术惠及社会。马斯克的表态引发科技圈讨论,DeepSeek团队继续优化模型,扩展行业合作。中国人工智能体系保持扩展态势,同时国际合作也在增加。这体现了在受限环境下的适应能力。马斯克预计2030年人工智能将取代部分岗位,但中国通过教育改革积极应对。全球市场对DeepSeek的关注,也反映出中国技术的影响力增强。美国企业开始研究其架构,寻求合作机会。这次发言虽短暂,却点明全球科技格局的转变,中国不再是追随者,而是参与者与创新者。
美国被彻底震慑?外国记者问:“美国拥有的核弹头可以摧毁世界1000次,难道中国人

美国被彻底震慑?外国记者问:“美国拥有的核弹头可以摧毁世界1000次,难道中国人

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

AI大战加码,阿里、月之暗面和DeepSeek齐亮新招!谁能笑到最后?国内人

AI大战加码,阿里、月之暗面和DeepSeek齐亮新招!谁能笑到最后?国内人

美国被彻底震慑?外国记者疑惑,美国拥有的核弹头可以摧毁世界1000次,难道中国人

美国被彻底震慑?外国记者疑惑,美国拥有的核弹头可以摧毁世界1000次,难道中国人

DeepSeek开源全新OCR模型!弃用CLIP改用Qwen轻量小模型

刚刚,DeepSeek开源了全新的OCR模型— 相较于去年10月20日发布的初代模型,DeepSeek-OCR2的核心突破在于打破了传统模型死板的“光栅扫描”逻辑,实现了根据图像语义动态重排视觉标记(VisualTokens) 为此,DeepSeek-OCR2弃用...
DeepSeek-OCR-2上线,性能大幅提升昨天,深度求索DeepSe

DeepSeek-OCR-2上线,性能大幅提升昨天,深度求索DeepSe

回顾2025年的1月底。2025年1月20日,DeepSeek火出圈。著名大V超

回顾2025年的1月底。2025年1月20日,DeepSeek火出圈。著名大V超

回顾2025年的1月底。2025年1月20日,DeepSeek火出圈。著名大V超逆马曾经断言:中国在人工智能大模型方面只有靠天才才能赶上美国。然而他觉得中国太普通了,做不到。这是他第几次小嘴开过光?回旋镖打得凶狠吧?
作为Ai前辈,文心一言最早出来,为何接连被豆包,deepseek,腾讯元宝给甩的

作为Ai前辈,文心一言最早出来,为何接连被豆包,deepseek,腾讯元宝给甩的

利好AI人工智能,DeepSeek发布DeepSeek-OCR2,AI能够以与

利好AI人工智能,DeepSeek发布DeepSeek-OCR2,AI能够以与

Deepseek V4的最后一块拼图来了?全新OCR架构超越视觉压缩

Deepseek V4的最后一块拼图来了?全新OCR架构超越视觉压缩

1 月 27 日,DeepSeek 发布了《DeepSeek-OCR 2:Visual Causal Flow》论文,并同步开源新一代文档理解模型。这是该公司在 2026 年 1 月的第三次技术更新:月初完善了 R1 论文的技术细节,中旬开源了 Engram 记忆模块,月末又...
DeepSeek开源OCR2这玩意真的要把打工人替代了吧可能不再是简单扫字,是真

DeepSeek开源OCR2这玩意真的要把打工人替代了吧可能不再是简单扫字,是真

有没有觉得DeepSeek的热度已经下去了?现在我基本都在用豆包和元宝了,Dee

有没有觉得DeepSeek的热度已经下去了?现在我基本都在用豆包和元宝了,Dee

DeepSeek开源OCR2新模型DeepSeek也发布了OCR2模型。D

DeepSeek开源OCR2新模型DeepSeek也发布了OCR2模型。D

DS发布《DeepSeek-OCR2:VisualCausalFlow》

DS发布《DeepSeek-OCR2:VisualCausalFlow》

DeepSeek开源OCR2新模型那个“国产大模型黑马”又来卷技术了!DeepS

DeepSeek开源OCR2新模型那个“国产大模型黑马”又来卷技术了!DeepS

这次DeepSeek的OCR模型更新,AI看文档更准了,尤其是处理复杂的PDF或

这次DeepSeek的OCR模型更新,AI看文档更准了,尤其是处理复杂的PDF或

DeepSeek-OCR 2 发布:识别性能提升 3.73%

DeepSeek-OCR 2 发布:识别性能提升 3.73%

DoNews1月27日消息,DeepSeek 今日公布了其最新一代文档识别模型 DeepSeek-OCR 2。很显然,该模型是在 DeepSeek-OCR 的基础上升级而来,核心变化集中在视觉编码器设计上。研究团队提出了一种名为 DeepEncoder V2 的新型编码器...
美国被彻底震慑?外国记者问:“美国拥有的核弹头可以摧毁世界1000次,难道中国人

美国被彻底震慑?外国记者问:“美国拥有的核弹头可以摧毁世界1000次,难道中国人

DeePSeeK开年这一炸可太让人意外了,GPU突然被CPU杀死,这剧情反

DeePSeeK开年这一炸可太让人意外了,GPU突然被CPU杀死,这剧情反

Skills刚火, 就有零Skill的Agent来了…

Skills刚火, 就有零Skill的Agent来了…

刚刷到一个视频,摊位老板占道经营,一个小轿车压到了摊位上的货物,引起了网友们的讨

刚刷到一个视频,摊位老板占道经营,一个小轿车压到了摊位上的货物,引起了网友们的讨

2025年中国人工智能领域最具代表性的10位专家包括:梁文锋、张一鸣、周靖人、陈

2025年中国人工智能领域最具代表性的10位专家包括:梁文锋、张一鸣、周靖人、陈

2025年中国人工智能领域最具代表性的10位专家包括:梁文锋、张一鸣、周靖人、陈天石、王兴兴、彭志辉、杨植麟、闫俊杰、印奇、张鹏。以下为具体介绍:‌梁文锋‌:DeepSeek创始人兼CEO,主导研发开源推理大模型DeepSeek-R1,性能比肩国际顶尖模型,显著降低AI使用成本并推动技术普惠。‌‌‌张一鸣‌:字节跳动创始人,推动公司生态全面AI化,强化大模型应用落地,巩固原生技术领先优势。‌‌‌周靖人‌:阿里云智能CTO,统筹通义千问大模型与云计算算力协同,夯实AI产业基础设施。‌‌陈天石‌:中科寒武纪创始人兼CEO,深耕国产AI芯片研发,带领企业扭亏为盈,重塑产业估值逻辑。‌‌‌王兴兴‌:宇树科技创始人兼CEO,开创低成本高性能足式机器人技术,推动人形机器人产业化,产品成中国智造全球名片。‌‌
黄金还有可能跌回500元一克吗?[哭哭][哭哭]deepseek来回

黄金还有可能跌回500元一克吗?[哭哭][哭哭]deepseek来回

作为全球最懂科技、最敢说真话的世界首富,马斯克的表态,从来都自带风向标属性。他在

作为全球最懂科技、最敢说真话的世界首富,马斯克的表态,从来都自带风向标属性。他在

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,反倒给AI圈扔了颗惊雷

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,反倒给AI圈扔了颗惊雷

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

DeepSeek给普通人的一生财务指南……20-30岁:攒钱打底、试错成

DeepSeek给普通人的一生财务指南……20-30岁:攒钱打底、试错成

DeepSeek开1亿签约奖金抢人!OpenAI、Meta都坐不住了

DeepSeek开1亿签约奖金抢人!OpenAI、Meta都坐不住了

2026年1月,DeepSeek在LinkedIn上发的招聘信息一下就把整个AI圈给引爆,这家中国AI初创公司给出了让硅谷都震惊的薪酬待遇,顶级研究员的签约奖金有1亿元人民币那么多,还有股权激励和住房补贴。好多在美国的华人AI工程师开始...
世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

外国记者问,美国拥有的核弹头足以摧毁世界1000次,难道中国人一点也不害怕吗?对

外国记者问,美国拥有的核弹头足以摧毁世界1000次,难道中国人一点也不害怕吗?对

中国AI企业开源模式未来发展前景广阔。2026年,以DeepSeek为代表的国产

中国AI企业开源模式未来发展前景广阔。2026年,以DeepSeek为代表的国产

力压deepseek登顶SuperCLUE,钛动科技行业大模型商业能力获验证

力压deepseek登顶SuperCLUE,钛动科技行业大模型商业能力获验证

在这份聚焦实战落地的榜单中,钛动科技自研模型Tec-Chi-Think-1.0-32B(中文名“钛极问答推理模型”)以85.82分强势登顶,一举超越了DeepSeek-v3.2-Thinking等通用大模型巨头。这一结果恰恰印证了一位大模型公司创始人对行业...
2026年冲500元!海光信息现价闭眼布局,算力革命+政策硬推+订单炸了:声

2026年冲500元!海光信息现价闭眼布局,算力革命+政策硬推+订单炸了:声

谷歌“大脑”德米斯·哈萨比斯最新访谈:去年西方夸大了对DeepSeek的恐惧,最应该担心的竞争者是字节跳动

去年大家对DeepSeek反应过度了 但字节跳动确实在步步紧逼 面对主持人关于DeepSeek是否构成“危机”的提问,哈萨比斯说:“我不认为这是一场真正意义上的危机,西方当时的反应多少有些过度了。他指出了两个关键事实:一是西方...
梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,反倒给AI圈扔了颗惊雷

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,反倒给AI圈扔了颗惊雷

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,而是他们居然又开发了新的模

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,而是他们居然又开发了新的模

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,反倒给AI圈扔了颗惊雷

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,反倒给AI圈扔了颗惊雷

丢了东西求助DeepSeek,竟然真能找到?AI寻物为何一找一个准

丢了东西求助DeepSeek,竟然真能找到?AI寻物为何一找一个准

死马当活马医,她打开国产AI应用DeepSeek,输入一段网友热传的指令:“我的手链丢了,我最后一次见它是2026年1月20日19时,当时我在洗碗,现在是1月20日20:40。物品特征为银色细链,串了一朵雕花。不到十秒,AI给出三条关键...
梁文锋又冲上热搜了!他们居然又开发了新的模型!1月21日外媒曝光,梁文锋在

梁文锋又冲上热搜了!他们居然又开发了新的模型!1月21日外媒曝光,梁文锋在

DEEPSEEK分析:近期国家队大幅减持宽基意味着什么?关于“国家队”减持,

DEEPSEEK分析:近期国家队大幅减持宽基意味着什么?关于“国家队”减持,

看看梁文锋新模型MODEL1曝光,值得我们关注再提升认知!DeepSeek悄悄

看看梁文锋新模型MODEL1曝光,值得我们关注再提升认知!DeepSeek悄悄

梁文锋又冲上热搜了! 这次既不是团队内讧也不是技术翻车, 反倒给AI圈扔

梁文锋又冲上热搜了! 这次既不是团队内讧也不是技术翻车, 反倒给AI圈扔

1月21日深夜,GitHub上悄然多了28条不起眼的代码更新,署名为“MODEL

1月21日深夜,GitHub上悄然多了28条不起眼的代码更新,署名为“MODEL

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,反倒给AI圈扔了颗惊雷。而

梁文锋又冲上热搜了!这次既不是团队内讧也不是技术翻车,反倒给AI圈扔了颗惊雷。而

用百度搜了下deepseek,结果第一条显示的是这个…

用百度搜了下deepseek,结果第一条显示的是这个…

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

DeepSeek新架构意味着什么看看它自己是如何回答的,挺详细。总结起来就是,可

DeepSeek新模型曝光?

DeepSeek新模型曝光?

恰逢DeepSeek-R1模型发布一周年,DeepSeek新模型“MODEL1”现身开源社区。近日,DeepSeek官方在GitHub更新了一系列FlashMLA代码,涉及的114个文件中,有数十处提到了此前未公开的“MODEL1”大模型标识符。2025年2月,DeepSeek...
DeepSeek新「模型」浮出水面

DeepSeek新「模型」浮出水面

2025年1月20日晚间时间,当DeepSeek-R1满周岁之际,代码库里悄悄浮出了一个陌生的名字:"MODEL1。这个此前从未公开亮相的模型标识符,在DeepSeek更新的FlashMLA代码中被发现了多达28处引用,跨越114个文件。这套藏在代码层面的...
梁文锋还得是你,又冲上了热搜!这次既不是团队内讧也不是技术翻车,反倒给AI圈

梁文锋还得是你,又冲上了热搜!这次既不是团队内讧也不是技术翻车,反倒给AI圈

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

世界首富马斯克再次抛出惊人言论,振聋发聩!他坦言:“中国真的被低估了!中国并没有

DeepSeek新模型MODEL1曝光,性能将超越V3.2?

DeepSeek新模型MODEL1曝光,性能将超越V3.2?

就在大家忙着抢春节车票时,DeepSeek的GitHub仓库悄悄更新了114个代码文件。眼尖的开发者发现,28处出现了神秘的"MODEL1"标识,这个从未公开的模型代号瞬间引爆技术圈。从代码对比来看,MODEL1和现在的V3.2像是两个完全不同的...
DemisHassabis:一年前西方高估了DeepSeek,字节才是中国最

DemisHassabis:一年前西方高估了DeepSeek,字节才是中国最

DeepSeek新模型MODEL1曝光,三大技术突破提前解密

DeepSeek新模型MODEL1曝光,三大技术突破提前解密

想了解DeepSeek下一代AI模型的真实实力?GitHub代码库的意外更新泄露了关键线索。在FlashMLA优化库的114个文件中,28处代码明确标注着与现有V3.2架构完全平行的"MODEL1"标识,这个神秘代号背后藏着三项颠覆性技术革新。KV缓存...
传DeepSeek曝新模型, 梁文锋再放“王炸”?

传DeepSeek曝新模型, 梁文锋再放“王炸”?

曝DeepSeek新模型Model1:疑似“高效推理模型”

曝DeepSeek新模型Model1:疑似“高效推理模型”

直播吧1月21日讯DeepSeek于官方GitHub仓库更新了一系列FlashMLA代码,在这些更新中,一个名为“Model1”的模型引起了广泛关注。据悉,目前这个还很神秘的Model1不仅出现在了代码与注释中,甚至还有与DeepSeek-V3.2并驾齐驱的...
DeepSeek一周年:从爆红到深耕,中国AI的破局之路

DeepSeek一周年:从爆红到深耕,中国AI的破局之路

2025年1月27日,DeepSeek横空出世,以黑马之姿在全球AI领域掀起巨浪。大洋彼岸下载量超越ChatGPT,上线首周累计下载量超1.1亿次,周活跃用户规模最高近9700万,这些数据见证了它的爆红。如今,DeepSeek迎来一周年,它究竟怎么...
DeepSeek预测:5年后世界上的黄金价格走势,分析得太准确了吧

DeepSeek预测:5年后世界上的黄金价格走势,分析得太准确了吧

DeepSeek在GitHub更新代码,出现神秘“MODEL1”标识符,与

DeepSeek在GitHub更新代码,出现神秘“MODEL1”标识符,与

DeepSeek新模型曝光开源圈又出大动作,新模型核心是671B参数量的MoE

DeepSeek新模型曝光开源圈又出大动作,新模型核心是671B参数量的MoE

风向真的变了。去年这时候,DeepSeek的梁文锋在行业座谈会上露面引发不小

风向真的变了。去年这时候,DeepSeek的梁文锋在行业座谈会上露面引发不小

Google重磅发现:DeepSeek靠「精神分裂」变强,脑内互搏让智商翻倍

Google重磅发现:DeepSeek靠「精神分裂」变强,脑内互搏让智商翻倍

DeepSeek新模型曝光:将具备更强的写代码能力!

DeepSeek新模型曝光:将具备更强的写代码能力!

DeepSeek V4新模型近期悄然曝光,核心亮点直指写代码能力的跨越式提升。这场升级绝非行业常见的参数堆砌噱头,而是精准瞄准开发者实际痛点的迭代,跳出“参数越高越强”的内卷怪圈,把重心放在代码落地效率与实用适配性上,...
拒绝DeepSeek的清华学霸,如何拿捏OpenAI的最新大模型?

拒绝DeepSeek的清华学霸,如何拿捏OpenAI的最新大模型?

面对DeepSeek、TikTok、英伟达、谷歌等科技巨头抛来的橄榄枝,他为何最终选择了OpenAI?谈及职业方向,他又为何自称“卖铲子里最面向客户的那位”,并立下目标“我要最大化我在OpenAI Blog上出现的次数”?这场对谈,给出了...
拒绝DeepSeek的清华学霸,如何拿捏OpenAI的最新大模型?

拒绝DeepSeek的清华学霸,如何拿捏OpenAI的最新大模型?

面对DeepSeek、TikTok、英伟达、谷歌等科技巨头抛来的橄榄枝,他为何最终选择了OpenAI?谈及职业方向,他又为何自称“卖铲子里最面向客户的那位”,并立下目标“我要最大化我在OpenAIBlog上出现的次数”?这场对谈,给出了答案...
风向彻底变了,真的变了。去年梁文锋(Deepseek),今年闫俊杰(MiniM

风向彻底变了,真的变了。去年梁文锋(Deepseek),今年闫俊杰(MiniM

智谱新模型也用DeepSeek的MLA,苹果M5就能跑

这一架构此前由DeepSeek-v2率先使用并验证有效,如今智谱也跟进了。从具体结构来看,GLM-4.7-Flash的深度与GLM-4.5 Air和Qwen3-30B-A3B接近,但专家数量有所不同—它采用64个专家而非128个,激活时只调用5个(算上共享专家)。...

DeepSeek核心研究员加盟元戎启行,曾与梁文锋共创9篇论文

DoNews1月20日消息,近日,腾讯汽车获悉,DeepSeek核心研究员阮翀已正式加盟自动驾驶公司元戎启行。这一消息从多个独立信源得到证实。公开资料显示,阮翀 2018 年毕业于北京大学计算语言研究所,2023 年加入 DeepSeek 担任研究...
机器人将再度上春晚,能否迎来它的“deepseek 时刻”

机器人将再度上春晚,能否迎来它的“deepseek 时刻”

蛇年春晚的华丽演出,是否就意味着机器人迎来了颠覆性的“DeepSeek时刻”?答案是:我们听见了响亮的脚步声,春天就在门外,但门还没完全推开。说曙光就在不远处,是因为我们已经看到了惊人的进步。机器人现在能跳舞、能空翻、...

租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂

元旦期间,DeepSeek 发布的 mHC 震撼了整个 AI 社区。简单来说,DeepSeek 提出的 mHC 通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用 Sinkhorn-Knopp 算法将连接矩阵约束在双拟随机矩阵流形上,成功解决了超...

脑机接口第一股来了,“DeepSeek时刻”还没来

脑机接口何时可以迎来“DeepSeek时刻”?商业化落地,脑机接口还面临哪些挑战?不再是科幻概念 严格来说,脑机接口并非新鲜事物。早在1973年,“人类意识可以直接转化为机器能够理解的指令”这一现象被科学家发现,从而提出了...
DeepSeek近几日把硅谷那帮精英搞得坐立难安,结果马斯克跟着就补了一刀狠的。

DeepSeek近几日把硅谷那帮精英搞得坐立难安,结果马斯克跟着就补了一刀狠的。

DeepSeek近几日把硅谷那帮精英搞得坐立难安,结果马斯克跟着就补了一刀狠的。老马这话说的太透了:“东方大国根本不是在崛起,人家那是恢复出厂设置!”这话听着扎心却全是事实。想想1750年那会儿,咱们工业产值占了全球32.8%,那时候欧洲加起来都不够咱打的。再加上历史上那300项重大发明,咱一家就占了173项,这份家底确实厚实。现在的DeepSeek不就是最好的例子吗?不到200人的团队,用这点经费硬是跟GPT掰手腕,还差点把桌子掀了。说白了,这就不是什么逆袭剧本。马斯克也就是看清了这一点:聪明人还是那波聪明人,咱们不过是拿回属于自己的位置罢了。大家对此有什么看法?欢迎讨论留言
没有商业模式--DeepSeek最坚固的“护城河”

没有商业模式--DeepSeek最坚固的“护城河”

OpenAI已薅走10000亿美元融资,为何DeepSeek免费给你用,还不需要

OpenAI已薅走10000亿美元融资,为何DeepSeek免费给你用,还不需要

看完了DeepSeek对未来10年的预测,说实话,心里挺不是滋味的。尤其

看完了DeepSeek对未来10年的预测,说实话,心里挺不是滋味的。尤其

deepseek预则:再过10年房子可能变成“最不值钱的资产”。这话咋一听

deepseek预则:再过10年房子可能变成“最不值钱的资产”。这话咋一听

费加罗报:DeepSeek"震撼弹"一年后,中国谋求在AI赛道超越美国周

费加罗报:DeepSeek"震撼弹"一年后,中国谋求在AI赛道超越美国周

万万没想到!马斯克突然"叛变",一句话点破中国AI真相,全网炸了"中国并没有崛起

万万没想到!马斯克突然"叛变",一句话点破中国AI真相,全网炸了"中国并没有崛起

万万没想到!马斯克突然"叛变",一句话点破中国AI真相,全网炸了"中国并没有崛起,中国只是恢复了历史地位。"这话不是中国人说的,而是出自全球最狂的科技狂人、世界首富马斯克之口。就在几天前,马斯克在一场长达3小时的重磅播客访谈中,亲口承认:中国真的被低估了,DeepSeek只是中国无数伟大创造之一。更让人震惊的是,他直言:2026年,中国在AI算力上将远远甩开全世界。等等——这还是那个去年在社交平台上疯狂质疑DeepSeek、嗤之以鼻的马斯克吗?时间倒回2025年初。当DeepSeek横空出世、以不到600万美元的训练成本打造出媲美GPT-4的大模型时,马斯克的第一反应是什么?嘲讽。他在社交平台上附和"DeepSeek偷偷囤了5万块英伟达H100芯片"的言论,暗示中国AI的低成本神话不过是一场骗局。彼时的马斯克,自信满满地认为自家的xAI能稳坐AI赛道头把交椅。然而一年过去,剧情发生了惊天反转。2026年1月6日,马斯克在德州特斯拉超级工厂接受奇点大学创始人戴曼迪斯的专访。这一次,他的态度发生了180度转变:"中国拥有大量聪明且非常有上进心的工程师,所以应该预料到中国可以做出很多伟大的东西。DeepSeek只是这些伟大造物之一,这其实是中国人才济济的结果。"更耐人寻味的是他接下来这句话:"外界低估中国了。中国并没有崛起,中国只是恢复了历史地位——自古就是第一强国。"一个美国科技巨头,竟然公开承认中国"自古第一"?这番言论一出,全网震动。但马斯克的焦虑远不止于此。在这场访谈中,马斯克抛出了一个颠覆认知的观点:AI竞赛的终极决胜点,不是芯片,不是算法,而是电力。"人们低估了电力供应的难度,"马斯克解释道,"发电、变压、冷却,每一个环节都可能成为瓶颈。"而在这场能源博弈中,中国已经建立了碾压级的优势。马斯克给出了一组令人窒息的数据预测:到2026年,中国的发电量将达到美国的3倍,其中70%来自太阳能。这意味着什么?当美国的AI数据中心还在为电力供应发愁、台积电可能因为"无电可用"而被迫让芯片闲置时,中国的AI基础设施已经在疯狂扩张。马斯克自己旗下xAI的孟菲斯超算中心,为了搞定1吉瓦的电力接入,整整花了一年时间。"中国在能源基建上把我们甩得连尾灯都看不见,"马斯克长叹一声,"他们似乎听了我说的每句话,并且付诸了行动。"这番表态的潜台词是:芯片封锁也好、技术脱钩也罢,当基础设施成为制约AI发展的最大变量时,中国的能源优势将彻底改写东西方竞争的格局。就在马斯克发出感慨的同时,中国AI界正在酝酿另一枚重磅炸弹。据外媒TheInformation报道,DeepSeek下一代旗舰模型V4即将在2026年农历春节前后发布。知情人士透露,内部基准测试显示,V4在编程任务上的表现已全面超越Anthropic的Claude系列和OpenAI的GPT系列。这不是小打小闹的迭代升级。V4据称在处理超长编程提示方面取得了突破性进展,能够更好地理解复杂软件项目架构。更关键的是,它攻克了"训练次数增加导致性能衰退"这一业界难题——这意味着,模型的学习曲线将不再存在天花板。回顾DeepSeek的发展轨迹,你会发现一条清晰的逆袭曲线:2024年12月:DeepSeek-V3发布,以不到600万美元的训练成本震惊全球2025年1月:DeepSeek-R1登顶苹果美区下载榜,超越ChatGPT2025年全年:V3.X持续迭代,性能直逼GPT-52026年1月:连发两篇重磅论文,暗示V4训练已完成2026年2月:V4预计发布,剑指全球AI王座有意思的是,就在上周,DeepSeek把R1的论文从22页扩充到了86页,毫无保留地公开了训练全流程。这种"开源到底"的姿态,与OpenAI等闭源玩家形成了鲜明对比。正如清华大学教授沈阳所言:美国追求的是"把AI变成全球统一工作界面",而中国追求的是"用得起、改得动、跑得快"。两条路线之争,胜负未分。但DeepSeek已经用行动证明:砸钱不是唯一的答案。在这场访谈的尾声,马斯克抛出了一个更具颠覆性的判断:"我们正处于奇点之中。这是一场超音速海啸,未来3到7年将是人类历史上极度撕裂的过渡期。"他预测,AGI(通用人工智能)最快可能在2026年出现;到2030年,AI的智能总量将超过全人类的总和。届时,白领工作将被大规模取代,机器人外科医生的精准度将达到微米级别,而人类需要重新思考"工作"和"意义"的定义。这不是科幻电影的剧情,而是正在发生的现实。而在这场关乎人类命运的竞赛中,马斯克眼中的最大变量,已经不再是OpenAI或谷歌——而是那个"被低估"的中国,以及那条与众不同的中国路径。
【DeepSeek梁文锋戳破中美AI差距真相:不是差两年,是地基与装修的区别】

【DeepSeek梁文锋戳破中美AI差距真相:不是差两年,是地基与装修的区别】

【DeepSeek梁文锋戳破中美AI差距真相:不是差两年,是地基与装修的区别】DeepSeek公司创始人梁文锋在2025年12月接受《暗涌》专访时的一番话,戳破了很多人对中美AI差距的误解。面对“中美AI只差一两年”的说法,他直言这是外行话,“真实的差距是原创和模仿之差,如果这个不改变,中国永远只能是追随者”。这话精准点透了核心:美国搭建了AI的底层地基与框架,从Transformer架构到顶尖算力芯片,从原创算法到基础模型的底层逻辑,都是自主构建;我们更多是在这个基础上“装修”——优化应用场景、降低训练成本、适配本土需求,却没触及最核心的原创突破。梁文锋在采访中透露,国内最好的模型在结构和训练动力学上,与国外先进水平仍有两代差距,要多消耗4倍算力才能达到同等效果。这和多位行业专家的判断不谋而合:中美AI核心差距3-5代、8-10年,短期追赶难以抹平。但承认差距≠自暴自弃,中国早已找到“另辟蹊径”的破局之路,两大优势尤为突出。一是应用落地能力全球领先。就像互联网发端于美国,却在中国绽放出最丰富生态一样,AI领域也在重演这一逻辑。DeepSeek的R1模型开源后,不仅登顶中美苹果应用商店免费榜,还被非洲开发者用来搭建农业病害诊断系统;北大团队基于它开发的“AI数学教练”,让学生解题效率提升40%;义乌商家靠AI用10分钟生成多语种带货视频,把小商品卖到全球。从政务智能响应到工业降本增效,我们把技术转化为实际价值的能力,放眼全球都难逢对手。二是我国在能源方面的优势成为关键底气。马斯克早有预判:中国AI若想超越美国,能源可能是核心变量。AI训练需要海量算力,而算力的背后是电力支撑——中国在清洁能源、基础设施建设上的积淀,为大模型研发提供低成本、高稳定的能源保障。就像DeepSeek用2048张性能受限的H800芯片,通过技术优化把V3模型训练成本压到美国同类模型的二十分之一,背后离不开能源与效率的双重支撑。更值得我国国人骄傲的是,我们已开始向原创突破发力。梁文锋团队不仅发表技术论文突破GPU内存限制,还开源了MLA架构,成为首个登上《自然》年度十大科学人物的中国AI研究者,让硅谷都为之侧目。美国强在“地基扎实”,我们胜在“落地生根+能源托底”。AI的终极价值要回归产业、服务生活,而中国有超大规模市场、完整产业链和旺盛需求,这些都是将优势转化为胜势的底气。与其纠结于在别人的赛道上追赶,不如在应用创新、能源赋能乃至我国具有优势的其它新赛道上跑出加速度!你觉得中国AI赶超美国,还有哪些关键突破口?欢迎在评论区聊聊~
万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有崛起

万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有崛起

从DSA到Engram,一年来DeepSeek层层勾勒V4架构创新

春节临近,DeepSeek-V4的猜测正在AI圈子里发酵。但与其纠结发布日期,不如回溯这家中国AI实验室过去一年留下的技术线索。从DSA到Engram,从mHC到Janus Pro,这些看似晦涩的缩写词,正在拼凑出一幅清晰的画面:当美国同行用更多...
DeepSeek又整新活了!简而言之就是增加了Engram条件记忆机制,给MoE

DeepSeek又整新活了!简而言之就是增加了Engram条件记忆机制,给MoE

DeepSeek的创新水平确实高出一筹。它最新发表的论文揭示了一种新的U形标

DeepSeek的创新水平确实高出一筹。它最新发表的论文揭示了一种新的U形标

万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有崛起

万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有崛起

DeepSeek放大招!百万年薪“抢人”AI江湖再掀风暴

DeepSeek放大招!百万年薪“抢人”AI江湖再掀风暴

2026年开年,AI圈最炸裂的消息莫过于 DeepSeek 的“抢人大战”—这家以技术狂飙著称的AI独角兽,正以 百万年薪、零经验门槛、全球顶尖资源 为筹码,掀起一场席卷全球的人才争夺战。从应届生到顶尖科学家,从算法工程师到产品...
百万年薪抢应届生,DeepSeek“壕”气冲天就在最近,DeepSeek突然放

百万年薪抢应届生,DeepSeek“壕”气冲天就在最近,DeepSeek突然放

DeepSeek联合北大提出Engram记忆机制,革新大模型架构

DeepSeek联合北大提出Engram记忆机制,革新大模型架构

2026年1月12日深夜,DeepSeek团队联合北京大学发布了一篇署名创始人梁文锋的重磅论文,提出名为“Engram”的条件记忆机制,通过“查算分离”架构打破大模型传统范式,引发行业对下一代AI技术路线的高度聚焦。一、核心创新:...
我与DeepSeeK的深度对话之二前文我已留言提问,DeepSeeK深度思考

我与DeepSeeK的深度对话之二前文我已留言提问,DeepSeeK深度思考

我与DeepSeeK深度对话之一我在DeepSeeK提问留言:

我与DeepSeeK深度对话之一我在DeepSeeK提问留言:

梁文锋执掌的幻方量化2025年收益率高达56.6%,《福布斯》榜个人财富也来到了

梁文锋执掌的幻方量化2025年收益率高达56.6%,《福布斯》榜个人财富也来到了

摩根资产管理认为中国科技领域将迎来“更多DeepSeek时刻”

摩根资产管理表示,随着中国加大力度创建更多类似DeepSeek的公司,中国科技股将继续受益于技术突破。“我们确实认为中国在科技领域仍然有很多机会。该公司的全球市场策略师RaisahRasid在新加坡的一次简报会上表示:“你们将会...
万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有崛起

万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有崛起

DeepSeek又出重磅消息!梁文锋论文曝光新技术:突破GPU内存限制!1

DeepSeek又出重磅消息!梁文锋论文曝光新技术:突破GPU内存限制!1

解析梁文锋署名DeepSeek新论文:让记忆和计算分开

解析梁文锋署名DeepSeek新论文:让记忆和计算分开

1月12日晚间,DeepSeek发布梁文锋署名的新论文,主题为《ConditionalMemoryviaScalableLookup:ANewAxisofSparsityforLargeLanguageModels》(直译为基于可扩展查找的条件记忆:大语言模型稀疏性的新维度),这也是2026开年至今...
梁文锋署名DeepSeek新论文,“突破GPU内存限制”

梁文锋署名DeepSeek新论文,“突破GPU内存限制”

[文/观察者网熊超然]1月12日晚间,中国人工智能(AI)初创公司DeepSeek创始人梁文锋与北京大学研究人员共同署名发表了一篇技术论文,提出了一种新的模型训练技术。他们表示,该技术可以通过绕过图形处理单元(GPU)内存限制,...
万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有

万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有

万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有崛起

万万没想到!世界首富马斯克又抛出一个惊人言论:“中国真的被低估了!中国并没有崛起