DC娱乐网

华为云突放十几款 AI 新品!AI 云入口战,正式开打!

2026 年 6 月 5 日,华为云 INSPIRE 创想者大会在上海西岸国际会展中心举行。作为华为云面向 AI 时代的

2026 年 6 月 5 日,华为云 INSPIRE 创想者大会在上海西岸国际会展中心举行。

作为华为云面向 AI 时代的一次重要新品发布会,本次大会聚焦 Agentic AI,云基础设施、模型服务、智能体开发和行业落地,一口气发布十几款 AI 新品和能力。

这些发布并不是孤立的产品堆叠,而是围绕一条主线展开,AI 正在从“模型生成”走向“智能体自主执行”,云基础设施也要随之重构。

在本次大会上,华为云围绕 Agentic AI 发布了 AICS 灵衢智算集群、AMS Agentic 记忆存储解决方案、CCE Volcano Next 通智一体化调度、AgentSphere Agent 运行环境等基础设施新品;推出面向 Agentic 场景的 ModelArts Next,包含 RL 服务、机密推理、模型路由、模型矩阵四大能力;发布企业级智能体平台智果 AgentArts、智果开源版 openJiuwen、全新 Agentic 华为云入口“智果园”,以及正式商用的华为云码道 CodeArts。

同时,华为云还发布了覆盖 Agent、模型和 Agentic Infra 的全链路安全方案,推出数据安全专区、AI 机密计算等能力。

面向行业落地,华为云发布“行业 AI 梦工厂”四大专区,包括智慧医疗、具身智能、科学计算和智能制造,并推出 CloudRobo 具身智能开发平台、医疗 AI 使能平台、工业智能体平台等行业能力。

从发布数量看,这是一次 AI 新品密集亮相;但从战略指向看,真正的核心是 Agentic Infra。

华为云认为,Agentic AI 时代正在带来计算范式的根本变化。云计算已经进入 Token 工业化时代,后训练正在从传统静态调参走向 Agentic RL 的自主进化,底层基础设施也在走向通智一体化。

在这一背景下,华为云提出 Agentic Infra 新范式,即“高效 Token 工厂、通智一体化调度、持续学习、安全自治”。

通过软硬芯协同,打造 Agentic AI 时代的“硅基黑土地”。

过去讨论 AI 云,外界更关注谁有更多算力、更多模型、更多开发者和更大流量。但进入 Agent 时代,仅有模型和算力已经不够。智能体要真正进入企业业务,需要长时间运行、多轮推理、持续记忆、工具调用、任务编排、权限控制和异常恢复。这背后需要一整套新的云基础设施,而不是简单的 GPU 堆叠。

AICS 灵衢智算集群对应的是高效 Token 工厂。

华为云称,灵衢智算集群具备低时延、高吞吐、高可用三大特征。它基于软件定义的高性能灵衢总线和超大带宽网络,提供统一内存池能力,突破大模型内存墙瓶颈,TPOT 小于 10 毫秒;支持 10 万卡集群规模,单一集群达到 200 EFLOPS 算力。以 DeepSeek 模型为例,千卡每秒吞吐可达 500 万 Tokens。对于多 Agent 协同和复杂长任务来说,Token 的生产效率直接决定了智能体响应速度和应用成本。

AMS Agentic 记忆存储解决方案:解决的是智能体“记不住”的问题。

传统大模型更依赖上下文窗口,任务结束后很难形成长期积累。但企业级 Agent 需要记住业务流程、用户偏好、历史操作和知识资产。华为云 AMS 通过分层记忆实现长上下文、多轮存储、压缩和检索,依托 NPU 直通 CMS 硬件(上下文记忆存储),为 Agent 构筑 PB 级记忆空间,并通过 DRAM 分布式内存池化和分层联动,实现 95% 记忆缓存命中,支撑天级长程任务。

CCE Volcano Next 则对应“通智一体化调度”。

Agent 并不只是在模型里“思考”,它还要调用工具、读写数据、执行任务,背后涉及 CPU、NPU、存储、容器、虚拟机、沙箱等多类资源。CCE Volcano Next 通过 CPU、NPU 等多样算力的拓扑感知调度、动态资源池共池、负载多队列共享和 AI 驱动负载预测,实现训练、推理、Agent 等多样负载的统一调度。华为云称,其典型场景资源利用率提升 30%,让 Agent 从“思考”到“执行”更加高效协同。

AgentSphere 面向的是安全自治。

企业使用 Agent,最担心的不是“会不会回答”,而是“会不会越权”“会不会泄露凭证”“会不会被操控”“行为能不能追溯”。AgentSphere 通过内核级沙箱隔离、双向网络防护、会话级权限管控和恶意意图防护,为 Agent Serving 和 Agent RL 提供安全运行环境。同时,其羽量级沙箱可实现 100ms 级启动、十万级每分钟批量创建,支撑大规模智能体训练和迭代。

在基础设施之上,华为云进一步推出 ModelArts Next,重新定义 MaaS。

它不是简单提供模型 API,而是围绕 Agentic 场景提供 RL 服务、机密推理、模型路由和模型矩阵。其中,RLaaS 让企业可以快速创建强化学习任务,让 Agent 代码直接训练、在线迭代;模型路由则通过语义感知、实时负载感知和体验感知,按体验优先、效率优先或均衡策略自动选择最优模型。

华为云称,目前已提供 15 款以上 SOTA 模型服务,模型调度精准率超过 95%,调用成本平均降低 20% 以上。

更靠近用户入口的是“智果园”。

华为云提出,未来智能体也会成为云平台的重要用户和使用者。“智果园”是华为云面向智能体时代的新入口,未来云服务将全面 Skill 化、CLI 化。未来用户通过一个对话框,就可以让智能体完成买云、建云、用云、管云等操作,相当于为客户提供由销售、架构师和运维专家组成的专属 AI 团队。

从这个角度看,华为云本次发布的十几款新品,其实可以归纳为四层:底层是 Agentic Infra,中间是 MaaS 和后训练服务,上层是 AgentArts、openJiuwen、CodeArts、智果园等智能体开发和入口,再往上则是行业 AI 梦工厂,将能力落到医疗、制造、具身智能、科学计算等具体场景。

这也解释了华为云为什么反复强调“硅基黑土地”。

华为公司董事、华为云 CEO 周跃峰在媒体见面会上表示,华为云的差异化首先来自独立自主的算力、也就是全国产化算力硬件系统;其次来自华为多年在 ICT、数学、算法和软件工程上的积累,可以在硬件基础上构建差异化的软件算法体系;第三是更加开放地构建 AI 和智能体生态,尤其是面向行业深耕,汇聚伙伴能力,让 AI 真正实现普惠。

在谈到华为云如何在激烈的 AI 云竞争中走出差异化路径时,周跃峰表示,华为云与互联网云厂商的侧重点并不相同。相比单纯追求 Token 总量或收入规模,华为云更看重 AI 技术能否真正进入企业,尤其是国计民生行业,并带来实实在在的生产力提升。

他提到,在国产化算力正在发展的背景下,华为云并不将 Token 规模作为唯一衡量标准,而是更关注国产化算力系统生产出的每一个 Token 背后,是否对应着医疗健康水平的提升、能源消耗的降低,以及行业效率的改善。换句话说,华为云希望 Token 不只是带来情绪价值,而是转化为一条条鲜活生命的守护、一度电一度电的节约,以及真实可衡量的生产力。

在落地路径上,华为云也更强调中国行业客户的现实需求。政府机构、国有企业、央企以及国计民生相关行业,对数据安全和算力本地化部署普遍有较高要求。因此,华为云坚持公有云与面向国计民生行业的混合云、私有云并重,通过“两条腿走路”的方式,让 AI 技术更贴合不同行业的安全、合规和本地化需求。

此外,周跃峰表示,华为云还会继续坚持自主自强和国产化路线,构建“第二个算力平面”,通过持续开放的生态,为全球 IT 从业者提供更多技术路线和生态选择。这也是华为云区别于其他云厂商的重要方向。

行业 AI 梦工厂则是这一差异化路线的落地抓手。

智慧医疗专区面向病理诊断等场景,推动优质医疗 AI 能力向地市级、县域医院复制;具身智能专区通过 CloudRobo 平台提供从数据生产、模型训练、仿真强化到部署的全链路能力;

科学计算专区面向生命科学、材料化学、气象海洋等领域,汇聚模型、数据集和科研 Agent;智能制造专区则基于工业智能平台 iDME.X,沉淀工业本体、知识图谱和多模态数据能力,支撑材料研发、电子电路设计、汽车造型设计、系统建模仿真等场景。

华为云并不只是向企业提供一个模型接口,而是希望将算力、模型、数据、工具链、智能体平台和行业资产整合起来,让 AI 从技术演示进入真实生产系统。

Agentic AI 的竞争,正在从“大模型本身”转向“模型如何被训练、调用、记忆、调度、执行和监管”。

在这个新阶段,云厂商的比拼也不再只是卡的数量、模型的数量或 Token 的总量,而是能否构建支撑智能体长期稳定运行的系统工程能力。

华为云这次一口气发布十几款 AI 新品,表面上是产品密集上新,实质上是在回答一个更大的问题,当 AI 进入 Agent 时代,企业到底需要什么样的云?

华为云给出的答案是,不是单点算力,也不是单个模型,而是一片足够厚、足够安全、足够开放、足够面向行业的“硅基黑土地”。