上证报中国证券网讯(记者窦世平)随着人工智能技术向物理世界深度延伸,具身智能已从实验室概念探索迈入产业落地的关键阶段,硬件迭代速度加快、场景化需求逐步显现,成为当前科技领域的核心赛道之一。尤其今年被业内普遍视作“具身智能量产元年”,行业对技术突破、规模落地及商业化闭环的期待持续升温。
智源研究院院长王仲远日前接受上海证券报记者采访时,针对具身智能量产规模与增速、所需核心能力以及产业发展中的确定性趋势等问题,结合智源的实践经验与行业观察,分享了系统性见解。
量产核心在真实需求短期难现“机器人满街跑”
在回应量产元年的期待时,王仲远首先强调硬件出货量增长的价值。他表示,今年部分灵巧手企业出货量突破万台,是产业进步的关键一步,硬件需要反复打磨,只有出货量达到一定规模,才能暴露设计、制造中的潜在问题,通过持续迭代从“可用”走向“好用”。在他看来,小批量试产仅能验证基础功能,大规模量产才是对硬件可靠性的真正考验,也是产业成熟的必经之路。
在肯定出货量的同时,王仲远分享了硬件的实际困境。“很多机器人现在还需要‘专人看护’,比如有的机械臂运行一小时就停机冷却,这种状态远未达到量产商用标准,仍停留在科研验证阶段”。他表示,智源曾采购10台同型号机器人,一两个月内就有5台故障;实验室机械臂频繁触发过热保护,需额外配风扇散热,硬件稳定性不足,正是制约量产规模的核心瓶颈。
谈及量产关键,王仲远将“需求真实性”放在首位。他认为,若量产是政策或示范项目催生的短期需求,而非市场自发需求,热潮退去后易陷入停滞。最令人担心的是“伪需求量产”,需求方为“尝新”采购,一旦发现机器人未达预期不再复购,产业可能冷却甚至泡沫破裂。只有真实需求驱动的量产,才能支撑硬件、模型持续迭代,形成良性循环。
对于产业的“确定性”,王仲远给出清晰判断。他表示,未来两三年很难出现“机器人满街跑”的场景。他认为,大众需正视具身智能发展的长期性,避免过度拔高短期目标。
视频数据为基座通用大模型尚处早期
在技术路径选择上,王仲远首先明确视频数据的核心地位。他认为,在真机海量数据难获取的现阶段,视频数据是训练具身大模型的最优解。“遵循第一性原理,人类通过眼睛观察学习世界,视频数据包含时空因果、文字、声音、图像等所有关键要素,是唯一可规模化获取的高质量数据”。王仲远说。
针对视频数据的短板,王仲远表示,视频无法涵盖触觉、力控等精细化信息,是当前行业缺口。“我们实验室已配备带力反馈的采集设备,星动纪元灵巧手也有力控能力,力反馈未来会成重要模态——能让机器人感知‘握力大小’‘物体软硬’,只是目前尚未完全融入现有数据体系”。他认为,补齐这一短板是未来1-3年技术突破重点,也是机器人实现精细化操作的关键。
谈及“世界模型”,王仲远认为,不能将“视频生成”等同于“世界模型”,世界模型核心是理解物理规律、预测时空状态,指导机器人决策与动作,视频生成只是“下一时空状态预测”的一种形式,还可以是图文、动作指令等”。他以谷歌Gemini3为例,指出其虽无视频生成能力,但能理解网球物理逻辑、给战术反馈,符合世界模型特质。
对于明年能否出现“具身智能ChatGPT时刻”,王仲远持谨慎态度。他表示,通用型具身大模型技术路线尚未收敛,连“什么是具身大模型”都无行业共识,谈通用突破为时尚早,但补充专用场景“小突破”可能出现,比如特定分拣、搬运场景中,机器人智能化水平或明显提升。
创业先“活下来”中国协同优势显著
谈及具身智能创业热潮,王仲远首先给出创业公司生存法则。他认为,当前赛道周期长、变数多,可能面临技术瓶颈、资金断裂甚至行业寒冬,创业公司首要目标是“活下来”。“很多创业公司一来就想做‘万能具身机器人’,能跳舞、搬运、精细操作,这很危险,不如聚焦一个场景打磨到极致,比如让机器人在产线7×24小时稳定分拣,先解决问题、拿订单,再谈扩张”。王仲远说。
在人才层面,具身智能正吸引自动驾驶、传统机器人、消费电子领域人才涌入。“人才密度提升是好事,高人才密度才能快速迭代,但也导致理念嘈杂,有人侧重仿真数据,有人侧重真机数据,有人先做硬件,有人先做模型”。王仲远认为,这种“百花齐放”会持续1-2年,之后逐步形成共识路径。
针对数据痛点,王仲远透露智源的解决方案。“很多创业公司订单有限,没能力采集大量真机数据。我们推出RoboCOIN数据标准和数据集,呼吁企业共享非隐私数据,谁家贡献多,我们训练的具身大脑在其产品上就更好用,比如A公司贡献分拣数据,那具身大脑在其分拣机器人上准确率更高。”他表示,这种模式能平滑企业训练成本,形成“数据共享-模型优化-产品更好用”的良性循环,破解数据短缺难题。
谈及国际竞争优势,王仲远认为中国核心优势在生态协同。他介绍,一年前智源在具身智能领域鲜有声音,如今已聚集顶尖学者、硬件厂商、场景方,甚至需求方主动对接,国际上难见这么多竞争与合作方交流:硬件公司愿分享故障数据,模型公司愿开放技术,场景方愿提真实需求。他认为,中国具身智能的未来不在单点突破,而在生态协同效率,只要保持开放协同,中国一定能在全球赛道占重要位置。