OpenAI 于 6 月 27 日正式推出了 GPT-5.6 系列模型。根据美国政府的要求,目前该系列模型仅向部分“可信合作伙伴”提供预览访问权限,尚未全面开放。
OpenAI 此次发布了三个不同档次模型:
此外,OpenAI 还宣布已优化了提示词缓存机制,这将使得重复提示词的调用成本更低且更具可预测性。
在性能方面,OpenAI 表示 GPT-5.6 Sol 是其迄今为止最强大的模型,具备新的 Max 推理强度,并引入 Ultra 模式,通过子智能体加速复杂任务的处理。
在编程能力测试中,GPT-5.6 Sol 在 Terminal-Bench 2.1 基准测试上表现出色。在标准模式下,其得分达到 88.8%,超越了 Claude Mythos 5 的 88.0%;而在启用 Ultra 模式后,得分更是提升至 91.9%。
在生物学领域的 GeneBench v1 测试中,GPT-5.6 Sol 在消耗更少 token 的情况下,性能优于 GPT-5.5。
网络安全领域也迎来了显著提升,GPT-5.6 Sol 在漏洞研究和利用等长链路安全任务上表现突出。在 ExploitBench 测试中,其输出 token 量仅为 Mythos Preview 的约三分之一,但性能相当。
OpenAI 在安全设计上采用了分层防护体系,包括模型内置的拒答机制、生成过程中的实时分类器、账户级别的风险审查、差异化访问策略以及监控和执法机制。对于高风险场景,系统可以暂停生成并由更强大的推理模型进行复核,若判定为违规,内容将在展示前被拦截。
关于开放时间,OpenAI 计划在未来几周内正式上线 GPT-5.6 Sol、Terra 和 Luna。
同时,OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol,该版本速度最高可达每秒 750 token,初期将仅对部分客户开放。