DC娱乐网

美国前沿模型送审,安全评测开始前置对模型公司、企业采购方和合规团队来说,前沿模型

美国前沿模型送审,安全评测开始前置

对模型公司、企业采购方和合规团队来说,前沿模型的发布节奏正在被安全评测改写。新模型不只是做完 benchmark 就上线,还要面对政府侧的预部署测试。美国 NIST 官方公告显示,商务部下属 **Center for AI Standards and Innovation(CAISI)**已与 Google DeepMind、Microsoft、xAI签署新协议,用于前沿 AI 模型的预部署评测和安全研究。

CAISI 称,这些协议允许政府在模型公开前开展评估,并支持发布后的评测和其他研究;截至公告时,CAISI 已完成 40 多项评估,其中包括尚未公开的先进模型。Reuters 转引报道称,OpenAI 和 Anthropic 此前也已参与相关自愿测试安排。这条新闻的现实变量是规则和发布时间。

对头部模型厂商来说,安全评测可能成为发布前的一道固定流程;对企业客户来说,经过政府评测的模型更容易进入敏感行业采购。小趋势是美国前沿模型竞争正在从“谁先发布”转向“谁能在监管和安全测试下发布”。接下来要看自愿协议会不会变成更硬的审批机制,以及中国、欧盟是否推出相似的前置评测要求。