英伟达推出高效推理模型英伟达开源低成本推理模型NVIDIA开源了全新的推理模型系

量子位看科技 2025-05-06 11:20:23

英伟达推出高效推理模型英伟达开源低成本推理模型

NVIDIA开源了全新的推理模型系列——Llama-Nemotron，主打一个“高效低成本推理”。

该系列共包括三种规格（8B、49B、253B），不仅支持主动开启或关闭推理模式，还全部支持商用，覆盖从轻量到旗舰的全场景需求。

三种模型规格如下：

- LN-Nano（8B）：轻量小模型，适用于中小型场景，部署成本低，响应速度快；

- LN-Super（49B）：性能与资源消耗平衡，适合对推理能力和成本都有要求的中型项目；

- LN-Ultra（253B）：旗舰级大模型，可在8张H100上运行，整体推理能力超过DeepSeek-R1，适配复杂任务和企业级需求。

Llama-Nemotron在技术层面也有诸多亮点：

- Puzzle架构重构：该模型采用了全新的“Puzzle”架构，而非传统Transformer，通过去除注意力机制、压缩FFN模块，大幅提升计算效率；

- 超大规模数据训练：训练数据覆盖3300万条高质量合成样本，其中数学和代码类数据占比高达3200万，显著增强模型在逻辑与推理领域的泛化能力；

- 五阶段训练流程：包括架构搜索、蒸馏、持续预训练、有监督微调与强化学习，每一阶段均经过精细设计，推动模型性能逐层跃升；

- 多步推理能力优化：精调过程中以DeepSeek-R1为教师模型，引入RLOO、GRPO等强化学习策略，在保持泛化能力的同时显著提升对话质量；

- 基础设施深度优化：训练与推理过程中结合cudagraph和FP8推理技术，使GPU利用率稳定超过90%，大幅降低单位推理成本。

在多个权威评测基准上，Llama-Nemotron系列在推理与通用理解任务中表现出色，如GPQA、AIME、MATH500等测试成绩，均属领先水平。

目前，英伟达已将该系列模型连同代码和数据集一同开源，感兴趣的小伙伴可以点击——

模型：

论文：

Dataset：

0 阅读：18

量子位看科技

感谢大家的关注

作者最新文章

1

AI必读Top30论文Ilya精选论文清单OpenAI联合创始人Ilya精选的A

2

吴恩达发文分享招人标准优秀AI应用工程师的必备技能AI大牛吴恩达分享招人标准：优

3

黄仁勋再次驳斥AI末日论Anthropic回应黄仁勋质疑大佬们吵起来了？黄仁勋当

4

DeepMind新模型革新台风预测AI搞定热带气旋路径强度双预测提前15天，就能

5

ChatGPT完败1977年游戏程序ChatGPT承认输给40年前游戏代码Cha

6

芭比娃娃或将内置ChatGPTOpenAI与芭比娃娃合作开发AI玩具Labubu

7

【正在直播】晶上系统生态大会2025晶上系统生态大会2025(SDSoW)暨AI

8

鱼被宰后会经历10多分钟剧烈痛苦科学家将鱼的痛苦量化科学家证明：鱼在被宰后，还会

9

迪士尼环球起诉Midjourney地表最强法务部起诉AI图像生成公司地表最强法务

10

Altman预言2026年AI将颠覆科研AI明年将推动全人类认知发展OpenAI

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

8月8日，河南许昌一小伙，在闲鱼上5300买了一台苹果16pro，结果顺丰配发当

2

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

3

同事iphone13pro有几年了，说电池健康度只有70%了，一天到晚的就见他

4

手机圈来袭！9-10月新机扎堆亮相荣耀Magic8Pro主打超强AI，

5

要买荣耀400Pro的人一定要听劝！后悔可就来不及了，如果只是当做备用机千万

6

你的手机用几年啦？哎，手机坏了，我的华为mate30黑屏两天

7

小米空调的销量增长太恐怖了，很快就会超越董大姐的格力，照这趋势来看，明年有可能登

8

说好的首发呢？真是没想到，首个通过国家3C认证的骁龙8Elite2机型，既不是

9

我去荣耀专卖店看手机，看了荣耀X70，荣耀400、荣耀Power、Magic7等

10

5699的时候，你们说太贵5199的时候，你们又说贵4699的时候，有的人说

科技最新文章

1

小米空调的销量增长太恐怖了，很快就会超越董大姐的格力，照这趋势来看，明年有可能登

2

说好的首发呢？真是没想到，首个通过国家3C认证的骁龙8Elite2机型，既不是

3

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

4

很奇怪，我一直喜欢小屏手机，之前用过的华为Mate50，Mate50Pro，一

5

我手上这台荣耀X70是12G+512G的，上手几天了，算上之前帮亲戚看机时摸过的

6

一天内添置了两台华为手机，一个是给老公买的华为mate70，一台是给婆婆买的华为

7

你的手机用几年啦？哎，手机坏了，我的华为mate30黑屏两天

8

2699元起？华为nova15系列售价曝光，预计10月发布！

9

有点纠结？！如何选也呢？同为12+256G版本的华为Mate70Pro优享版和

10

原来苹果也知道，iPhone128gb不够用啊？看爆料说，iPhone1