DC娱乐网

前段时间,特斯拉把Optimus机器人的硬件专利开源了。消息刚出来的时候,首页刷

前段时间,特斯拉把Optimus机器人的硬件专利开源了。

消息刚出来的时候,首页刷到了很多解读,有人认为特斯拉是在带动整个行业,也有人觉得这是特斯拉在打压供应链竞争对手,

但我觉得还差一个问题:身体出来了,然后呢?

硬件开源解决的是造出来的问题。但造出来之后,机器人靠什么判断该不该抬手?靠什么理解你说的让它去取个苹果?

这些决策,都要靠一个足够聪明的大脑。

就在特斯拉开源硬件专利后不久,一家中国公司做出了一个完全不同方向的回应。这次不是硬件,而是机器人的大脑。

这家公司叫智平方,发布了一个叫AlphaBrain Platform的开源社区。我花了几天时间研究这家公司,确实有点东西。

1为什么开源大脑比开源身体要难得多?

硬件专利开源,本质上是给你一份图纸。结构复杂度、精度,终究是物理上可以描述、可以测量、可以制造的东西。有了图纸,照着造就行了。

但开源一个模型平台不同,这不是一个文件,而是一套别人可以真实跑起来、复现结果、接着迭代的完整体系。

两者的难度完全不在一个量级。这要求你对每一个训练步骤、每一个数据格式、每一个评测标准都足够清楚,才能真正对外开放出去。

这也是为什么具身智能领域里,真正好用的开源模型一直很少。不是公司不愿意开源,而是能开源到这种程度的公司本来就不多。

2我看了很多科技公司的开源,大多数都是发布一个模型,附上论文,然后放个代码仓库。

想复现?不好意思,你得自己去找数据、配环境、调超参数,碰到问题了自己去社区找答案。

这种开源对顶级研究者来说够用,但对绝大多数开发者来说,难度堪比登天。

但AlphaBrain Platform这次开源,智平方联合港科大(广州)熊辉团队一起,不只是开放模型本身,还把从数据到训练、从训练到评测整个链路都打通了。

统一数据格式、统一评测基准、统一训练入口,开发者不需要在环境配置上消耗精力。

3这次开源包含三个在我看来相当值得关注的方向。

第一个是类脑模型。人脑用的是脉冲信号,不是持续的电流,所以能耗极低,反应极快。传统AI模型一直在用连续值运算,在能耗和延迟上有天然的劣势。

智平方开源的NeuroVLA,是第一个在类脑控制任务上做到顶尖水平的开源模型。放到FPGA芯片上,功耗只有0.4W,遇到碰撞的响应时间低于50毫秒。

而且,它支持部署阶段的在线学习,机器人在实际工作中可以持续更新自己,不需要回到实验室重新跑训练。

这不只是学术上的方向探索,在工业场景里的意义非常实际,因为耗电和反应速度都是真实成本。

第二个是RL加VLA的组合。VLA是目前主流的机器人大模型架构,可以把视觉、语言、动作生成整合在一起。强化学习RL可以让模型在特定任务上做到更精准。

问题是,把两个东西拼在一起的时候,很容易出现一个经典bug:学了新任务,把旧的能力忘掉了,也就是业内说的灾难性遗忘。

AlphaBrain Platform开源的方案,是在RL微调过程中把VLA的主体完全冻结,只训练外面的一个轻量级模块。

好处是,旧能力不会被破坏,训练成本也大幅降低。

这是全球第一个基于RL Token的开源VLA训练架构,已经在仿真环境里跑通了。对于想在具体场景落地机器人的开发者来说,这个技术组合的价值是非常直接的。

第三个是世界模型工具链。世界模型是最近行业里最热的词之一,核心思路是让机器人在动手之前,先在脑子里预演一遍会发生什么,然后做出更合理的决策。

智平方这次开源的可插拔世界模型架构,支持多个主流世界模型骨干的一键切换,而且共享同一个动作解码器。

V-JEPA、Cosmos Predict、Wan这几个方向,过去需要分别搭环境、分别测试,现在可以在同一个平台上直接切换对比。

开发者可以在同一个平台上,用同样的任务和评测标准,自由切换不同的世界模型,直接对比效果,能省掉大量的重复劳动。

4提到开源,PI(Physical Intelligence)是行业里不得不提的一个参照。

PI做的是单模型开源,质量很高,是行业内的标杆。开源一个优秀的模型,给社区提供了一个高质量的起点。

但智平方这次开源的,不只是自己的模型。

平台里除了智平方自己的顶尖模型,还集成了其他头部模型,开发者可以在同一个地方自由选择、组合、对比不同来源的模型。

如果说PI是给了你一把很好的锤子,那智平方就是给了你一个工具箱。里面有锤子、扳手、卷尺、水平仪,而且这些工具之间互相兼容,还配了一套说明书告诉你在什么场景用什么工具。

这在商业上是一个挺有意思的选择,因为你等于是在帮竞争对手做分发。

但反过来想,如果你的平台成了开发者做具身智能的默认起点,那么不管谁的模型更好,流量都会留在你这里。

5智平方这家公司,被很多投资人描述为最像特斯拉的中国机器人团队。

这个标签背后,是特斯拉同时做到了模型强、硬件强、商业强,三件事能同时做好的公司在全球都非常稀少。

但智平方,恰好也是这样一家全栈公司。

这次智平方用AlphaBrain Platform做出的回应,是把机器人大脑领域里最前沿的几个技术方向,以一个开发者可以直接用起来的形式,完整地放了出来。

至于开源社区能不能真的建立起足够活跃的开发者生态,绝不只是发布当天的热度,还有六个月之后有多少人在上面做了有价值的事。