DC娱乐网

满足所有工作负载的至强6+发布,英特尔为未来做好准备

飞象原创(魏德龄/文)过去几年,数据中心的工作负载正在发生变化,单单从名字上就能发现,已经开始有人将其改称为智算中心,原因正在于ai工作负载的快速增长,现在基础工作负载与ai工作负载的增长大致各占一半。英特尔公司执行副总裁兼数据中心事业部总经理kevorkkechichian就发现,除了基础工作负载以及当前以训练为主的“前沿模型”之外,越来越多的需求正在向推理侧迁移。

至强6+满足未来工作负载

工作负载需求的变化也影响着解决方案的定位与设计,而正由于推理工作负载与训练工作负载存在显著差异,让英特尔能够更好地发挥自身技术优势。根据预测,到2030年,现有数据中心底层架构仍将持续发挥价值,且会承载近50%的工作负载。x86架构的优势在于,cpu内置的各类加速器与引擎,性能已能够满足需求,无需额外添置其他的加速设备。

刚刚发布的至强6+恰恰是对于满足如今基础工作负载与ai工作负载各占50%的形象诠释,在其已有的实际应用案例中,爱立信通过在分组核心网中部署测试至强6+,在基础工作负载方面,与上一代e-core相比,在相同内核数量下,性能提升了30%,每瓦性能提升了60%以上,同时运行期间机架功耗降低了38%。

另外在ai工作负载方面,德国电信的t-systems借助英特尔至强6+的海量内核数量与出色的能效,来助力t-cloud私有智能体ai基础设施的运行,通过提高效率、简化运营的高密度基础设施来应对数据中心现代化需求。

两方面工作负载需求的满足,得益于至强6+在硬实力上的提升。

解决行业三大核心需求

刚刚正式发布的至强6+基于intel18a制程工艺构建,提供业界最高的内核密度,拥有多达288个能效核,支持高达8000mt/s的ddr5内存,以及高达576mb的末级缓存(llc),这一缓存容量较上一代产品提升超过5倍。

至强6+受益于最新的intel18a工艺技术,包括采用powervia技术实现更短、更直接的供电路径,从而有效降低功耗。为增强性能一致性,还采用ribbonfet技术以降低待机功耗。

英特尔还引入了应用能效遥测技术,可让数据中心运营商,在工作负载层级实时查看cpu核心的功耗与运行状态,进而实现能效更优的资源编排、精准成本分摊,并针对负载优化应用落地能效激励机制。

另外,通过sgx与tdx技术提供机密计算,并新增了密码学算法加速能力。不仅能够保护当前的工作负载,更在塑造未来可信计算的标准,打造一个旨在成为企业与云信任基石的工程平台。

至强6+能够为客户带来更低的基础设施tco。例如,从第二代至强升级时,可实现高达9:1的服务器整合比例,从而显著降低数据中心在物理空间占用、电力、冷却需求以及持续运营成本方面的投入。

“行业当前有三大核心诉求:提升性能密度,在减少机架空间的同时处理更多的任务;提升每瓦性能,降低tco;为关键业务部署提供高可靠性保障。至强6+正是为解决这三个关键问题而设计的。”英特尔至强产品总监kiraboyko表示。

e835推动系统效率优化

“随着数据密集型工作负载向云原生和边缘驱动型架构转型,网络不能再仅仅满足于‘足够快’,还必须积极推动系统效率优化。”数据中心芯片工程团队负责人timwilson表示英特尔还同步对以太网产品进行了精心设计,使其超越了简单的数据传输,从而提供一个针对工作负载进行优化的基石。

同期推出的以太网解决方案e835,旨在通过专注于四个关键领域来提供优化的网络,这四个领域分别是:性能、可靠性、灵活性和效率。

e835基于统一的分布式管理栈,通过标准化接口实现跨系统管理,大幅提升硬件通信效率与运维效率,适合大规模部署场景。

在性能层面,e835系列实现了最高200gbe的网络能力,并支持从25g到200g的灵活配置,能够适配不同规模的数据中心网络架构。同时通过多端口组合与配置工具,提供更高的部署灵活性。

在安全性方面,产品构建了包括硬件级rootoftrust、支持rsa3k/sha2-384、签名spdm等特性的完整硬件级安全体系。

与竞争对手相比,e835功耗仅为主要竞争对手的一半,并且在单位功耗下能完成更多的工作,从而在性能需求增长时,仍能维持可持续发展的基础设施。原因在于e835专为高能效比而设计,使得其能在不超出原有数据中心既定功耗和散热预算的前提下,提升网络密度和性能。

代号“crescentisland”的数据中心gpu

英特尔还对外介绍了代号“crescentisland”的数据中心gpu,拥有增强的内存带宽、大容量内存,并针对云和企业级推理工作负载进行了性能调优,同时拥有更低的tco。

“crescentisland”可谓为智能体ai而生,在350w的功耗下,可以在现有的风冷数据中心中运行。凭借兼容pcie的外形规格,在扩展方面也极具灵活性。支持最广泛的ai数据类型,使其成为ai领域极具吸引力的产品。同时,由于支持原生fp64,能够确保对广泛的应用的支持。

英特尔还专门采用lpddr内存以及高密度的背面通道,将内存容量提升到了高达480gb,lpddr热设计功耗控制在350瓦。

“我们正致力于将对英特尔至强处理器和英特尔gpu平台的支持合并到上游,以减少部署阻力,并使推理服务在实际应用环境中更具可用性。”英特尔anil在介绍数据中心gpu产品时表示。

在软件生态的支持上,英特尔围绕四个原则构建统一的xe软件栈,即开放、规模化性能、优秀的用户体验以及支持异构基础设施。英特尔在ai服务框架上遵循上游优先原则,如pytorch、vllm和sglang编排,并允许开发人员在熟悉的生态系统和编排工具中工作。

“我们的数据中心战略,核心在于在所有工作负载之间进行扩展。英特尔在数据中心业务上深耕已久。”kevorkkechichian表示,无论未来以何种方式到来,英特尔都已做好准备。