GTC大会临近,LPU新架构带来算力形态新变化
2025年12月,Groq宣布已与英伟达达成一项非独占技术许可协议。Groq专注于高性能AI推理,其芯片被称为“语言处理单元(LPU)”。随着AI应用由实验室阶段走向规模化落地,推理侧需求正从单纯追求吞吐量逐步转向低延迟、高确定性执行能力。
相较传统GPU架构,LPU在推理场景中展现出一定差异化优势:
1 :片上SRAM存储模型权重:通过将权重常驻片上SRAM,实现最高约80TB/s片内带宽,显著降低DRAM访问带来的延迟不确定性;
2 :编译时静态调度架构:采用Compile-time确定性执行逻辑,使数据流在固定时钟周期内完成,提高推理稳定性与可预测性;
3 :先进封装趋势探索:业内预计未来可能借鉴类似AMDX3D的3D堆叠思路,将大规模SRAM单元作为独立裸片,通过混合键合等先进封装技术垂直集成于计算核心之上。
即将于3月16日召开的GTC大会,市场预期将推出LPU,为Feynman架构引入新的算力单元设计。
Rubin系列逐步进入拉货周期,正交背板技术推进顺利
根据产业链跟踪,英伟达Rubin系列相关PCB上游自今年1月开始小批量拉货,2月起逐步放量,预计6月后R系列出货占比将明显提升,B系列产品将逐步向Rubin平台切换。104层正交背板方案验证进展顺利,未来在RubinUltra平台中应用的概率较高。
持续推荐关注PCB核心受益标的:胜宏科技、沪电股份、鹏鼎控股、深南电路、东山精密等。
