DC娱乐网

[CL]《GameCraft-Bench: Can Agents Build P

[CL]《GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine?》T Luo, R Wang, J Bi, C Xu… [The Chinese University of Hong Kong & Shenzhen Loop Area Institute] (2026)

在 AI 游戏生成领域,如何自动化构建可运行、可交互的完整系统是一个悬而未决的难题。过去的方法受困于 Web 简易环境或局部代码片段,本质原因是游戏开发高度依赖引擎底层语义、资产耦合及实时反馈,而非单纯的逻辑合成。

本文的核心洞见是:将游戏生成重新看作一种基于交互的端到端验证任务。由此,要求 Agent 提交完整 Godot 工程并附带交互轨迹的关键操作,使评估从静态代码检查跃迁为对真实运行画面的多模态评测,还原了游戏作为交互系统的本质。

这项工作真正留下的遗产是确立了引擎锚定、成品完备与交互验证的三大评估准则。它为 Agent 跨入真实生产环境打开了新门,但尚未跨过的门槛是:当前模型虽能复现基础机制,但在内容深度、视觉反馈及系统级润色上仍显乏力。

arxiv.org/abs/2606.17861 机器学习 人工智能 论文 AI创造营