#AI智能体也有半衰期##为什么AI没法连续编程十小时# 为什么AI能够坚持编程一个小时,却没有办法坚持十个小时? 哲学家Toby Ord提基于METR的早先的研究成果,提出了一个新颖的概念:AI智能体也有“半衰期”。 简单说,在AI执行任务的每“分钟”内,都有一个固定的、不变的失败概率,任务持续的时间越长,累积失败的概率就越大。【图1】 比如说,假设每10分钟步骤有10%的出错概率,那么成功率就会发生如下变化:1小时53%,4小时8%,10小时则下降到0.002%! 所谓的“半衰期”,指的就是这个成功率下降到一半所需的时间。 这个概念和Yann LeCun一直强调的LLM指数级错误累积很相像,他本人也出现在了转发区,高调表示:我早就说过!【图2】 不过,这并不意味着大模型被“宣判死刑”。实际上,只要想方法将错误率降低,模型处理长时间任务的能力就会大大提升。 比如,如果每10分钟的错误率能从10%降至1%,就能让模型处理长达10小时的任务。 好消息是,根据过去的经验来看,大模型的错误率每四个月就会减半。 换个角度来看,人类也存在着任务失败的概率。不过相较于AI,人类任务成功率的下降速度甚至比恒定风险率更低。【图3】 这可能是因为人类具备系统2型的认知能力,擅长修正前期失败的子任务。 如果能理解这一点背后的具体原因,或许能帮助我们更好的提升AI智能体在长任务下的能力。 原文链接:-life
#AI智能体也有半衰期##为什么AI没法连续编程十小时# 为什么AI能够坚持编程
量子位
2025-06-19 18:24:18
0
阅读:1