DC娱乐网

谷歌:推出一种新人工智能模型,它摆脱了从左到右处理新闻的过程。 谷歌的

谷歌:推出一种新人工智能模型,它摆脱了从左到右处理新闻的过程。
谷歌的实验性开源模型不是逐字生成文本,而是使用扩散同时起草整个段落,从而使推理速度提高了4倍。
目前,极其强大的大型语言模型(LLM)仍然像在键盘上打字一样运行,以简单的从左到右的方式处理工作负载。但在本地运行的单用户场景中,这种顺序处理可能会使图形处理单元(GPU)和张量处理单元(TPU)未得到充分利用。
谷歌认为DiffusionGemma模型可以绕过这一瓶颈。新的实验性开放模型生成文本“非常快”,通过扩散技术同时创建整个文本块,而不是通过逐个令牌的处理。该公司表示,与依赖顺序处理的自回归模型相比,这项技术的推理速度提高了4倍。与从左到右的处理形成对比基于谷歌的Gemma 4家族及其Gemini Diffusion研究,DiffusionGemma是一个26B混合专家(MoE)模型,旨在最大限度地生成文本输出。它本质上改变了模型使用硬件的方式,在每个周期为处理器提供了更大的工作量,因此它可以按顺序起草完整的256个令牌段落。谷歌声称,这使得该模型在GPU上生成文本的速度提高了4倍。它在推理过程中仅激活3.8B参数,量化后可以在Nvidia RTX 5090等高端消费级GPU上的18GB VRAM内安装。