【国产算力突破!昇腾910C成功训练1.6万亿参数大模型DeepSeek-V4-Pro】
深圳河套学院联合哈工大(深圳)、深圳市大数据研究院、华为及深智城,在昇腾910C国产AI算力集群上完成DeepSeek-V4-Pro全参数后训练,验证国产算力支撑顶级大模型训练的技术可行性。
-----
深圳河套学院AI训练平台项目团队携手哈尔滨工业大学(深圳)、深圳市大数据研究院、华为技术团队及深智城AI算力平台,共同推进国产AI算力在大模型训练领域的关键突破 。
依托自主可控的昇腾910C AI芯片构建的高性能算力集群,团队顺利完成1.6万亿参数规模的大语言模型DeepSeek-V4-Pro的全参数后训练任务 。
这一成果标志着我国在高端AI基础设施领域迈出坚实一步——不仅可支撑大规模业务推理,更能胜任从零开始的全量模型训练 。
相较仅调用已有模型进行推理,全参数训练对算法优化、分布式通信、显存管理及硬件稳定性提出更高要求 。
此次成功实践,为国产大模型研发提供了可复用的技术路径与工程范式 。
新知博主烈焰童子说科技妈咪
