DC娱乐网

OpenAI发布GPT-5.2,专攻专业任务,性能宣称超越人类专家

北京时间12月12日凌晨,OpenAI正式发布GPT-5.2模型,并向ChatGPT付费用户及API开发者开放。该模型系列包含Instant、Thinking和Pro三个版本,专注于提升现实工作中的专业任务处理能力。 OpenAI应用CEO 菲吉·西莫(Fidji Simo)表示,GPT-5.2的设计目标是“为用户创造更多经济价值”。据其报告,ChatGPT企业版重度用户每周可节省超过10小时。在涵盖44个职业知识型任务的GDPval测试中,GPT-5.2 Thinking在70.9%的任务中表现达到或超过了人类专家水平。 在编程能力上,GPT-5.2 Thinking在更具挑战性的SWE-Bench Pro测试中取得55.6%的成绩。该模型能根据单一提示生成完整的单页应用,例如海浪模拟器、节日贺卡生成器等。 模型在事实准确性与长文本处理上也有显著提升。相较于GPT-5.1,其“幻觉率”在一组查询中降低了约30%。在长达256k token的上下文测试中,首次实现了接近100%的准确率。 此次发布正值激烈竞争。上周,为应对谷歌Gemini 3等产品的压力,OpenAI CEO萨姆·奥特曼宣布公司进入“Code Red”红色警报状态,将所有资源集中回流至ChatGPT主线。奥特曼向CNBC表示,竞争的影响小于预期,预计明年1月解除警报。 在商业化方面,OpenAI同日宣布与迪士尼达成三年授权协议,并获得后者10亿美元投资。彭博社报道,ChatGPT的“成人模式”预计于2026年第一季度上线。