DC娱乐网

[AI]《Kairos: A Native World Model Stack

[AI]《Kairos: A Native World Model Stack for Physical AI》K T F Wang, S You, Q Zhang, T Huang… [Kairos Team] (2026)

在具身智能领域,长效物理一致性与实时部署的矛盾是一个悬而未决的难题。过去的方法受困于视频生成与动作控制的脱节,本质原因是通用视频模型缺乏原生动作感知,且二次方复杂度的注意力机制导致长序列推理时物理状态不可避免地漂移与崩溃。

本文的核心洞见是:把世界模型重新看作一个集成“理解-生成-预测”的原生动作基座。由此,混合线性时间注意力(Hybrid Linear Temporal Attention)这一关键操作使问题得以解开:利用滑动窗口捕捉局部动态,并引入带门控的线性增量更新(GLA)作为持久全局记忆,在数学上证明了误差累积的收敛性,实现了无限长序列下的物理守恒。

这项工作真正留下的遗产是构建了首个支持“自我进化”闭环的具身世界模型全栈架构。它为后来者打开的新门是在消费级硬件上实现低延迟、高保真物理仿真与控制的统一,但尚未跨过的门槛是如何在大规模异构数据(互联网视频与稀缺机器人轨迹)的极度不对称中,实现更深层的因果逻辑对齐。

arxiv.org/abs/2606.16533 机器学习 人工智能 论文 AI创造营