DC娱乐网

2026年元旦,DeepSeek发布开年重磅论文,创始人梁文锋领衔推出mHC(流

2026年元旦,DeepSeek发布开年重磅论文,创始人梁文锋领衔推出mHC(流形约束超连接)架构。该架构针对传统超连接训练不稳定、内存开销大的痛点,通过流形约束恢复恒等映射特性,从根源杜绝信号爆炸。实测显示,其仅增6.7%训练开销,便在27B参数模型的BBH、DROP任务中分别提升2.1和2.3个百分点,为大模型架构创新树立国产标杆。