谷歌刚发了个Gemini 3.1 Pro,不是大更新,但大家都慌了。它没改名字,没吹参数,就悄悄把推理能力塞进API里,结果测试分数直接跳高一截——连ARC-AGI这种专门难为AI的题都刷到77%。 这玩意儿不是新训练出来的,是把之前“Deep Think”里验证过的那套核心智能,直接打包成能用的版本。以前那是实验室玩具,现在你能调用它干正事。比如看100万字合同+三张CT图+一段手术录像,它真能串起来分析;还能按《呼啸山庄》的阴郁感生成网页,不是套模板,是把文字情绪翻译成UI风格。 价格一点没涨,输入还是2美元,输出4美元。但同样一道ARC题,成本从快10美元降到不到1块。医生试了病历+影像联合判断,准确率从47%提到67%;律师查合同条款冲突,从57%到74%。不是嘴上说说,是实打实进了医院和律所的测试流程。 开放得挺快,Android Studio、Vertex AI、Google AI Studio当天就能接。但NotebookLM只对Pro和Ultra用户放开全部功能——明显是拿它当旗舰体验区,让你先习惯“让AI自己拆任务、跑流程”的感觉。 有人问:考试分数高,真能用在工厂产线质检上吗?100万字上下文看着爽,但实时回话会不会卡半秒?还有,以后每个月来个3.1.1、3.1.2,工程师真能跟上节奏不翻车? 它没加千亿参数,没换新架构,就做了一件事:把“想得更深”变成一项可买、可算、可嵌进App里的服务。不用等大版本,也不用换SDK,今天调API,明天就多出一层推理深度。 版本号缩成“.1”,不是偷懒,是把“智能”当成水电一样切片供应。你付的钱没变,但它在后台多转了三圈,还不出声。



