DC娱乐网

小米大模型刷新全球最快推理速度 小米这次的大模型进展真的有点超出预期了。在通用G

小米大模型刷新全球最快推理速度 小米这次的大模型进展真的有点超出预期了。

在通用GPU上,万亿参数模型直接跑出了1000 tokens/s的速度,这是全球独一份的成绩。以前我们总觉得“又大又快”是个悖论,要么小模型跑得快但能力有限,要么大模型强但要等半天,而小米这次居然把“又快、又强、又通用”三个点同时做到了。

不靠堆硬件,而是靠算法和系统优化榨干了GPU的潜力,把行业天花板又往上抬了一截。对用户来说,最大的感受就是“不用等了”,以前等模型出结果的时间够泡杯咖啡,现在人还没端起杯子,结果就出来了。这种体验的改变,真的会让人用了就回不去。