DC娱乐网

小米深夜上线三大模型小米罗福莉女士:MiMo-V2-Pro、Omni和TTS已发

小米深夜上线三大模型小米罗福莉女士:MiMo-V2-Pro、Omni和TTS已发布。这是我们首个真正为代理时代打造的全栈模型家族。

我将此称为一场无声的伏击——并非因为这是我们事先策划的,而是因为从聊天模式向代理模式的转变发生得如此之快,以至于我们自己都几乎难以置信。在这段过渡时期里,整个过程既令人兴奋,又充满痛苦,同时亦颇为引人入胜。

1T基础模型数个月前已开始训练。最初的目标是提升长语境推理效率。混合注意力机制带来了真正的创新,且未有过分之举——事实证明这恰恰是为“代理时代”奠定的基础。1NM语境窗口。MTP推断用于实现超低延迟和成本优势。这些架构决策并非一时流行之举,而是我们在需求尚未显现之前便已构建出的结构性优势。

改变一切的关键在于首次体验了一种复杂的能动性架构——我称之为精心编排的环境。第一天我便对此感到震惊。我试图说服团队使用这一工具,但未能奏效。于是我便下达了一项强硬指令:MiMo团队中任何明日对话次数少于100次的成员均可选择离职这一举措产生了效果。一旦团队的想象力被能动性系统所能带来的潜力激发出来,这种想象力便直接转化为了研究速度的提升

人们问我们为什么移动如此之快。我亲眼见证了构建深度求索R1的过程。我的诚实总结是:骨干和基础设施研究周期很长。你需要战略信念,一年后才能看到回报。

Posttrain敏捷性是一种不同的肌肉:产品直觉驱动评估,迭代周期缩短,范式转变被早期捕捉。

一以及持续的特质:好奇心、敏锐的技术直觉、果断的执行力、全身心投入,而最容易被低估的是:对你正在构建的世界发自内心的热爱。

我们将在模型足够稳定值得开源时开放源代码。来自北京,很晚了,还没完全清醒。上午5:22·2026年3月19日·45.7K次浏览