DC娱乐网

每秒1000个token,国产最新大模型刚刚刷新了全球推理速度纪录。什么概念?G

每秒1000个token,国产最新大模型刚刚刷新了全球推理速度纪录。什么概念?GPT-5.5每秒约68个,Claude Opus 4.6约71个,Gemini Flash约192个。技术上用了量化压缩和并行验证,通俗说就是跑得更快、卡得更少。推理速度提升意味着Agent调用不再有漫长的等待,大模型从聊天慢慢想变成实时做决策。该API采用限时体验价,定价为MiMo-V2.5-Pro的3倍,同时提供约10倍的输出速度提升。

小米大模型刷新全球最快推理速度

评论列表

从文明到野蛮
从文明到野蛮 4
2026-06-12 13:18
希望不要用在辅助驾驶上,据说有致命的缺点,就是全量数据100个,这系统会自动舍去其中它认为没有意义的数据大概60个左右。