[CL]《GameCraft-Bench: Can Agents Build P

[CL]《GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine?》T Luo, R Wang, J Bi, C Xu… [The Chinese University of Hong Kong & Shenzhen Loop Area Institute] (2026)

在 AI 游戏生成领域，如何自动化构建可运行、可交互的完整系统是一个悬而未决的难题。过去的方法受困于 Web 简易环境或局部代码片段，本质原因是游戏开发高度依赖引擎底层语义、资产耦合及实时反馈，而非单纯的逻辑合成。

本文的核心洞见是：将游戏生成重新看作一种基于交互的端到端验证任务。由此，要求 Agent 提交完整 Godot 工程并附带交互轨迹的关键操作，使评估从静态代码检查跃迁为对真实运行画面的多模态评测，还原了游戏作为交互系统的本质。

这项工作真正留下的遗产是确立了引擎锚定、成品完备与交互验证的三大评估准则。它为 Agent 跨入真实生产环境打开了新门，但尚未跨过的门槛是：当前模型虽能复现基础机制，但在内容深度、视觉反馈及系统级润色上仍显乏力。

arxiv.org/abs/2606.17861 机器学习人工智能论文 AI创造营

DC娱乐网

[CL]《GameCraft-Bench: Can Agents Build P

热门分类