华为云突放十几款 AI 新品！AI 云入口战，正式开打！

2026 年 6 月 5 日，华为云 INSPIRE 创想者大会在上海西岸国际会展中心举行。

作为华为云面向 AI 时代的一次重要新品发布会，本次大会聚焦 Agentic AI，云基础设施、模型服务、智能体开发和行业落地，一口气发布十几款 AI 新品和能力。

这些发布并不是孤立的产品堆叠，而是围绕一条主线展开，AI 正在从“模型生成”走向“智能体自主执行”，云基础设施也要随之重构。

在本次大会上，华为云围绕 Agentic AI 发布了 AICS 灵衢智算集群、AMS Agentic 记忆存储解决方案、CCE Volcano Next 通智一体化调度、AgentSphere Agent 运行环境等基础设施新品；推出面向 Agentic 场景的 ModelArts Next，包含 RL 服务、机密推理、模型路由、模型矩阵四大能力；发布企业级智能体平台智果 AgentArts、智果开源版 openJiuwen、全新 Agentic 华为云入口“智果园”，以及正式商用的华为云码道 CodeArts。

同时，华为云还发布了覆盖 Agent、模型和 Agentic Infra 的全链路安全方案，推出数据安全专区、AI 机密计算等能力。

面向行业落地，华为云发布“行业 AI 梦工厂”四大专区，包括智慧医疗、具身智能、科学计算和智能制造，并推出 CloudRobo 具身智能开发平台、医疗 AI 使能平台、工业智能体平台等行业能力。

从发布数量看，这是一次 AI 新品密集亮相；但从战略指向看，真正的核心是 Agentic Infra。

华为云认为，Agentic AI 时代正在带来计算范式的根本变化。云计算已经进入 Token 工业化时代，后训练正在从传统静态调参走向 Agentic RL 的自主进化，底层基础设施也在走向通智一体化。

在这一背景下，华为云提出 Agentic Infra 新范式，即“高效 Token 工厂、通智一体化调度、持续学习、安全自治”。

通过软硬芯协同，打造 Agentic AI 时代的“硅基黑土地”。

过去讨论 AI 云，外界更关注谁有更多算力、更多模型、更多开发者和更大流量。但进入 Agent 时代，仅有模型和算力已经不够。智能体要真正进入企业业务，需要长时间运行、多轮推理、持续记忆、工具调用、任务编排、权限控制和异常恢复。这背后需要一整套新的云基础设施，而不是简单的 GPU 堆叠。

AICS 灵衢智算集群对应的是高效 Token 工厂。

华为云称，灵衢智算集群具备低时延、高吞吐、高可用三大特征。它基于软件定义的高性能灵衢总线和超大带宽网络，提供统一内存池能力，突破大模型内存墙瓶颈，TPOT 小于 10 毫秒；支持 10 万卡集群规模，单一集群达到 200 EFLOPS 算力。以 DeepSeek 模型为例，千卡每秒吞吐可达 500 万 Tokens。对于多 Agent 协同和复杂长任务来说，Token 的生产效率直接决定了智能体响应速度和应用成本。

AMS Agentic 记忆存储解决方案：解决的是智能体“记不住”的问题。

传统大模型更依赖上下文窗口，任务结束后很难形成长期积累。但企业级 Agent 需要记住业务流程、用户偏好、历史操作和知识资产。华为云 AMS 通过分层记忆实现长上下文、多轮存储、压缩和检索，依托 NPU 直通 CMS 硬件（上下文记忆存储），为 Agent 构筑 PB 级记忆空间，并通过 DRAM 分布式内存池化和分层联动，实现 95% 记忆缓存命中，支撑天级长程任务。

CCE Volcano Next 则对应“通智一体化调度”。

Agent 并不只是在模型里“思考”，它还要调用工具、读写数据、执行任务，背后涉及 CPU、NPU、存储、容器、虚拟机、沙箱等多类资源。CCE Volcano Next 通过 CPU、NPU 等多样算力的拓扑感知调度、动态资源池共池、负载多队列共享和 AI 驱动负载预测，实现训练、推理、Agent 等多样负载的统一调度。华为云称，其典型场景资源利用率提升 30%，让 Agent 从“思考”到“执行”更加高效协同。

AgentSphere 面向的是安全自治。

企业使用 Agent，最担心的不是“会不会回答”，而是“会不会越权”“会不会泄露凭证”“会不会被操控”“行为能不能追溯”。AgentSphere 通过内核级沙箱隔离、双向网络防护、会话级权限管控和恶意意图防护，为 Agent Serving 和 Agent RL 提供安全运行环境。同时，其羽量级沙箱可实现 100ms 级启动、十万级每分钟批量创建，支撑大规模智能体训练和迭代。

在基础设施之上，华为云进一步推出 ModelArts Next，重新定义 MaaS。

它不是简单提供模型 API，而是围绕 Agentic 场景提供 RL 服务、机密推理、模型路由和模型矩阵。其中，RLaaS 让企业可以快速创建强化学习任务，让 Agent 代码直接训练、在线迭代；模型路由则通过语义感知、实时负载感知和体验感知，按体验优先、效率优先或均衡策略自动选择最优模型。

华为云称，目前已提供 15 款以上 SOTA 模型服务，模型调度精准率超过 95%，调用成本平均降低 20% 以上。

更靠近用户入口的是“智果园”。

华为云提出，未来智能体也会成为云平台的重要用户和使用者。“智果园”是华为云面向智能体时代的新入口，未来云服务将全面 Skill 化、CLI 化。未来用户通过一个对话框，就可以让智能体完成买云、建云、用云、管云等操作，相当于为客户提供由销售、架构师和运维专家组成的专属 AI 团队。

从这个角度看，华为云本次发布的十几款新品，其实可以归纳为四层：底层是 Agentic Infra，中间是 MaaS 和后训练服务，上层是 AgentArts、openJiuwen、CodeArts、智果园等智能体开发和入口，再往上则是行业 AI 梦工厂，将能力落到医疗、制造、具身智能、科学计算等具体场景。

这也解释了华为云为什么反复强调“硅基黑土地”。

华为公司董事、华为云 CEO 周跃峰在媒体见面会上表示，华为云的差异化首先来自独立自主的算力、也就是全国产化算力硬件系统；其次来自华为多年在 ICT、数学、算法和软件工程上的积累，可以在硬件基础上构建差异化的软件算法体系；第三是更加开放地构建 AI 和智能体生态，尤其是面向行业深耕，汇聚伙伴能力，让 AI 真正实现普惠。

在谈到华为云如何在激烈的 AI 云竞争中走出差异化路径时，周跃峰表示，华为云与互联网云厂商的侧重点并不相同。相比单纯追求 Token 总量或收入规模，华为云更看重 AI 技术能否真正进入企业，尤其是国计民生行业，并带来实实在在的生产力提升。

他提到，在国产化算力正在发展的背景下，华为云并不将 Token 规模作为唯一衡量标准，而是更关注国产化算力系统生产出的每一个 Token 背后，是否对应着医疗健康水平的提升、能源消耗的降低，以及行业效率的改善。换句话说，华为云希望 Token 不只是带来情绪价值，而是转化为一条条鲜活生命的守护、一度电一度电的节约，以及真实可衡量的生产力。

在落地路径上，华为云也更强调中国行业客户的现实需求。政府机构、国有企业、央企以及国计民生相关行业，对数据安全和算力本地化部署普遍有较高要求。因此，华为云坚持公有云与面向国计民生行业的混合云、私有云并重，通过“两条腿走路”的方式，让 AI 技术更贴合不同行业的安全、合规和本地化需求。

此外，周跃峰表示，华为云还会继续坚持自主自强和国产化路线，构建“第二个算力平面”，通过持续开放的生态，为全球 IT 从业者提供更多技术路线和生态选择。这也是华为云区别于其他云厂商的重要方向。

行业 AI 梦工厂则是这一差异化路线的落地抓手。

智慧医疗专区面向病理诊断等场景，推动优质医疗 AI 能力向地市级、县域医院复制；具身智能专区通过 CloudRobo 平台提供从数据生产、模型训练、仿真强化到部署的全链路能力；

科学计算专区面向生命科学、材料化学、气象海洋等领域，汇聚模型、数据集和科研 Agent；智能制造专区则基于工业智能平台 iDME.X，沉淀工业本体、知识图谱和多模态数据能力，支撑材料研发、电子电路设计、汽车造型设计、系统建模仿真等场景。

华为云并不只是向企业提供一个模型接口，而是希望将算力、模型、数据、工具链、智能体平台和行业资产整合起来，让 AI 从技术演示进入真实生产系统。

Agentic AI 的竞争，正在从“大模型本身”转向“模型如何被训练、调用、记忆、调度、执行和监管”。

在这个新阶段，云厂商的比拼也不再只是卡的数量、模型的数量或 Token 的总量，而是能否构建支撑智能体长期稳定运行的系统工程能力。

华为云这次一口气发布十几款 AI 新品，表面上是产品密集上新，实质上是在回答一个更大的问题，当 AI 进入 Agent 时代，企业到底需要什么样的云？

华为云给出的答案是，不是单点算力，也不是单个模型，而是一片足够厚、足够安全、足够开放、足够面向行业的“硅基黑土地”。

DC娱乐网

华为云突放十几款 AI 新品！AI 云入口战，正式开打！

热门分类

华为云突放十几款 AI 新品！AI 云入口战，正式开打！

猜你喜欢

热门分类