谷歌：推出一种新人工智能模型，它摆脱了从左到右处理新闻的过程。谷歌的

谷歌：推出一种新人工智能模型，它摆脱了从左到右处理新闻的过程。
谷歌的实验性开源模型不是逐字生成文本，而是使用扩散同时起草整个段落，从而使推理速度提高了4倍。
目前，极其强大的大型语言模型（LLM）仍然像在键盘上打字一样运行，以简单的从左到右的方式处理工作负载。但在本地运行的单用户场景中，这种顺序处理可能会使图形处理单元（GPU）和张量处理单元（TPU）未得到充分利用。
谷歌认为DiffusionGemma模型可以绕过这一瓶颈。新的实验性开放模型生成文本“非常快”，通过扩散技术同时创建整个文本块，而不是通过逐个令牌的处理。该公司表示，与依赖顺序处理的自回归模型相比，这项技术的推理速度提高了4倍。与从左到右的处理形成对比基于谷歌的Gemma 4家族及其Gemini Diffusion研究，DiffusionGemma是一个26B混合专家（MoE）模型，旨在最大限度地生成文本输出。它本质上改变了模型使用硬件的方式，在每个周期为处理器提供了更大的工作量，因此它可以按顺序起草完整的256个令牌段落。谷歌声称，这使得该模型在GPU上生成文本的速度提高了4倍。它在推理过程中仅激活3.8B参数，量化后可以在Nvidia RTX 5090等高端消费级GPU上的18GB VRAM内安装。

DC娱乐网

谷歌：推出一种新人工智能模型，它摆脱了从左到右处理新闻的过程。谷歌的

热门分类

谷歌：推出一种新人工智能模型，它摆脱了从左到右处理新闻的过程。 谷歌的

热门分类

谷歌：推出一种新人工智能模型，它摆脱了从左到右处理新闻的过程。谷歌的