53个资深高考咨询师,被一个AI“卷”到了。
这不是段子,是一份刚刚发布的独立测评报告里的真实数据。
6月23日,友松实验室发布了《高考志愿AI测评基准》——国内第一份专门给高考志愿AI做的“考试”。考生只有一个:千问高考Agent。监考老师是53位平均干了4.6年的志愿咨询师。
考卷分四个部分:基本政策和规则常识、模拟志愿填报、开放式咨询问答、最终志愿推荐方案。
第一关,44道客观题目,千问高考Agent全对,满分通过。人类咨询师这边,平均正确率89.3%。差了十个百分点。
第二关,模拟填报。千问高考Agent排出了6个可录取志愿,没有违背任何已知的考生偏好,而且事后回头看,精准踩中了“最优解”。咨询师平均排出5.3个可录取志愿。
但故事没有一边倒。报告同时指出,在涉及就业收入判断、亲子沟通协调这些"需要人味儿"的环节上,咨询师依然有明显优势。AI能快速搞定海量数据和方案初筛,但最后那个"拍板"的决定,还是需要人来把最后一道关。
所以,这份报告真正想要说的,不是AI赢了谁,而是——高考志愿填报这件事,终于有了一套可以量化比较的标准。AI和人类各有所长,配合使用才是正解。


