OpenAI发布GPT-5.2，专攻专业任务，性能宣称超越人类专家

北京时间12月12日凌晨，OpenAI正式发布GPT-5.2模型，并向ChatGPT付费用户及API开发者开放。该模型系列包含Instant、Thinking和Pro三个版本，专注于提升现实工作中的专业任务处理能力。

OpenAI应用CEO 菲吉·西莫(Fidji Simo）表示，GPT-5.2的设计目标是“为用户创造更多经济价值”。据其报告，ChatGPT企业版重度用户每周可节省超过10小时。在涵盖44个职业知识型任务的GDPval测试中，GPT-5.2 Thinking在70.9%的任务中表现达到或超过了人类专家水平。

在编程能力上，GPT-5.2 Thinking在更具挑战性的SWE-Bench Pro测试中取得55.6%的成绩。该模型能根据单一提示生成完整的单页应用，例如海浪模拟器、节日贺卡生成器等。

模型在事实准确性与长文本处理上也有显著提升。相较于GPT-5.1，其“幻觉率”在一组查询中降低了约30%。在长达256k token的上下文测试中，首次实现了接近100%的准确率。

此次发布正值激烈竞争。上周，为应对谷歌Gemini 3等产品的压力，OpenAI CEO萨姆·奥特曼宣布公司进入“Code Red”红色警报状态，将所有资源集中回流至ChatGPT主线。奥特曼向CNBC表示，竞争的影响小于预期，预计明年1月解除警报。

在商业化方面，OpenAI同日宣布与迪士尼达成三年授权协议，并获得后者10亿美元投资。彭博社报道，ChatGPT的“成人模式”预计于2026年第一季度上线。

DC娱乐网

OpenAI发布GPT-5.2，专攻专业任务，性能宣称超越人类专家

热门分类