DC娱乐网

[CL]《Toward Generalist Autonomous Resear

[CL]《Toward Generalist Autonomous Research via Hypothesis-Tree Refinement》J Jin, Y Hu, K Qiu, Q Dai… [Microsoft Research & Renmin University of China] (2026)

在自主研究场景中,现有AI Agent面临一个核心矛盾:虽然能执行长时间任务,但缺乏将多次实验转化为累积性假设改进的机制。过去的系统要么将研究简化为预定义工作流,要么逐个修正单一路径,本质原因是它们没有持久化的研究状态来连接假设、实验证据和失败教训,导致每次尝试都是局部的,无法形成系统性的研究过程。

本文的核心洞见是:把研究状态显式化为一棵持久的假设树(Hypothesis Tree),每个节点绑定假设内容、实现分支、实验证据和提炼洞察。由此,长期协调器负责全局搜索策略和树的演化,短期执行器在隔离环境中测试单个假设并返回结构化证据,树的向上传播机制将局部发现抽象为可复用的约束和先验,这一操作使研究从无序试错变为证据驱动的迭代精炼。

这项工作真正留下的遗产是将自主研究从"能执行多久"转向"能否积累知识":假设树让竞争方向共存、失败变为可复用证据、合并决策可审计,在六个真实任务和MLE-Bench Lite上取得最佳留出成绩,证明了显式研究状态管理的有效性。它为后来者打开的新门是将科学发现的长期记忆和策略规划从prompt工程提升为系统级设计范式,但尚未跨过的门槛是多目标优化、开放式问题重构能力,以及从AI工程泛化到生物学、物理等领域时的评估器设计和领域知识整合。

arxiv.org/abs/2606.11926 机器学习 人工智能 论文 AI创造营