[LG]《Visored: A Controlled-Natural-Langu

[LG]《Visored: A Controlled-Natural-Language Prover for LLM-Generated Mathematics》X Zhai, X Chen, Y Wang, R Zhou… [University of Washington] (2026)

在形式化数学中，非形式证明到机器可检验代码的转化是瓶颈。LLM能生成自然语言证明，但现有系统要求直接映射到Lean/Rocq这样的低阶证明器，迫使模型同时处理：符号查询、类型强制、偏函数侧条件、库引理选择。这些非局部决策无法从自然语言表面推断，导致转化失败时返回单一的accept/reject信号，用户无法定位具体障碍。

本文的核心洞见是：将自动形式化分解为两层。不让LLM直接跳到Lean，而是引入Visored——一个中间表示，其表面是数学自然语言（CNL），其核心将隐含决策（类型、强制、侧条件）显式化为可检验的工作项。由此，将单一的全局检验拆分为逐步局部检验，每一步失败都返回具体位置的诊断。

这项工作真正留下的遗产是证明工程的设计模式转变：从"让模型学会目标语言"转向"让中间层吸收语言鸿沟"。它为后来者打开的新门是将CNL作为LLM的第一公民接口——自动形式化、密集奖励信号生成、数据合成——而非仅作UX层。尚未跨过的门槛是透明的大规模Lean排放（当前中位膨胀250倍）和超竞争基准的覆盖（IMO问题仅35%）。

arxiv.org/abs/2606.17581 机器学习人工智能论文 AI创造营

DC娱乐网

[LG]《Visored: A Controlled-Natural-Langu

热门分类