DC娱乐网

每秒1000个token，国产最新大模型刚刚刷新了全球推理速度纪录。什么概念？G

2026-06-09 17:03:02 铭铭谈汽车啊汽车

每秒1000个token，国产最新大模型刚刚刷新了全球推理速度纪录。什么概念？GPT-5.5每秒约68个，Claude Opus 4.6约71个，Gemini Flash约192个。技术上用了量化压缩和并行验证，通俗说就是跑得更快、卡得更少。推理速度提升意味着Agent调用不再有漫长的等待，大模型从聊天慢慢想变成实时做决策。该API采用限时体验价，定价为MiMo-V2.5-Pro的3倍，同时提供约10倍的输出速度提升。

小米大模型刷新全球最快推理速度

阅读：10 点赞：0

评论列表

从文明到野蛮 4

2026-06-12 13:18

希望不要用在辅助驾驶上，据说有致命的缺点，就是全量数据100个，这系统会自动舍去其中它认为没有意义的数据大概60个左右。

每秒1000个token，国产最新大模型刚刚刷新了全球推理速度纪录。什么概念？G

评论列表

热门分类