智元机器人发布了通用具身基座模型——智元启元大模型(GenieOperator-

2025-03-10 18:29:53 友鸿看汽车汽车

智元机器人发布了通用具身基座模型——智元启元大模型(GenieOperator-1)，Vision-Language-Latent-Action (ViLLA) 架构，由VLM(多模态大模型) + MoE(混合专家)组成：

VLM借助海量互联网图文数据获得通用场景感知和语言理解能力，

MoE中的Latent Planner(隐式规划器)通过视频数据获得通用的动作理解能力

MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力

利用人类视频学习，完成小样本快速泛化

机器人时代ai时代微博新知

阅读：0 点赞：0

DC娱乐网