DC娱乐网

[AI]《Self-Improvement for Fast, High-Qua

[AI]《Self-Improvement for Fast, High-Quality Plan Generation》R Gieselmann, H v Huelsen, M Samson, M Meyer… [Amazon] (2026)

在自动规划中,快速生成高质量计划是一个悬而未决的难题。过去方法受困于只追求可行解,本质原因是最优规划代价高,训练数据质量封住了模型上限。

本文的核心洞见是:把生成式规划器重新看作可自我改进的候选计划工厂。由此,用模型采样建状态图,再以图搜索提短计划,反哺微调模型。

这项工作真正留下的遗产是让近最优规划从一次性监督变成循环提纯。它打开的新门是秒级泛化规划器,但尚未跨过的门槛是仍需初始解集,且最优动作必须在模型采样范围内。

arxiv.org/abs/2605.03625 机器学习 人工智能 论文 AI创造营