【别神话矢量检索:为什么AI Agent最爱的依然是老古董Grep?】
最新论文《Is Grep All You Need?》揭示了一个反直觉事实:在AI Agent的检索任务中,古老的命令行工具grep居然在准确率上击败了时髦的矢量检索。
这背后的深层原因并非技术倒退,而是人类社会的“逆向工程”。几十年来,我们早就被训练得习惯于为了“好搜索”而组织内容——写注释、规范命名、把相关代码放在同一行。这种人造的结构化秩序,天然就是grep的温床。
更重要的是,Agent拥有多轮交互能力。它不是一锤子买卖,而是像人一样,能根据第一次grep的结果不断修正关键词,进行精准的链式探索。
当然,这不意味着矢量检索没用。在处理模糊概念或跨语境关联时,语义检索依然是刚需。真正的行业解法是给Agent配齐两套工具,让它在精确匹配与模糊联想之间自主切换。
arxiv.org/abs/2605.15184
