OpenAI 最强 AI 模型：GPT-5.6 系列登场，编程跑分超 Claude Mythos 5 - 壹号娱乐app

2026-06-26

OpenAI 于 6 月 27 日正式推出了其最新的 GPT-5.6 系列模型，但目前尚未向公众全面开放。应美国政府的要求，该系列模型现阶段仅提供给少数“可信合作伙伴”进行预览。

本次发布的 GPT-5.6 系列包含三个不同档次：

旗舰版 Sol：输入成本为每 100 万 Tokens 5 美元（约合 34 元人民币），输出成本为每 100 万 Tokens 30 美元（约合 204.3 元人民币）。
均衡版 Terra：输入成本为每 100 万 Tokens 2.5 美元（约合 17 元人民币），输出成本为每 100 万 Tokens 15 美元（约合 102.1 元人民币）。
Luna：专注于速度和成本，输入成本为每 100 万 Tokens 1 美元（约合 6.8 元人民币），输出成本为每 100 万 Tokens 6 美元（约合 40.9 元人民币）。

此外，OpenAI 还改进了提示词缓存机制，以降低重复提示词的调用成本并提高可预测性。

在能力方面，OpenAI 将 GPT-5.6 Sol 描述为其迄今为止最强大的模型，引入了新的 Max 推理强度，并配备了通过子智能体加速复杂任务的 Ultra 模式。

在编程领域，GPT-5.6 Sol 在 Terminal-Bench 2.1 测试中取得了新的最高分，标准模式下得分为 88.8%，优于 Claude Mythos 5 的 88.0%。在启用 Ultra 模式后，得分更是达到了 91.9%。

在生物学领域的 GeneBench v1 测试中，该模型在消耗更少 token 的情况下，性能表现超越了 GPT-5.5。

在网络安全方面，GPT-5.6 Sol 在漏洞研究和利用等复杂的安全任务上表现出显著提升。在 ExploitBench 测试中，其输出 token 量仅为 Mythos Preview 的约三分之一，即可达到相似的性能水平。

安全设计方面，OpenAI 表示 GPT-5.6 Sol、Terra 和 Luna 采用了多层防护体系，包括内置的拒答机制、实时生成过程分类器、账户级风险审查、差异化访问控制以及监控和执法机制。对于高风险情况，系统能够暂停生成，并由更强大的推理模型进行复核，若检测到违规，内容将在展示前被拦截。

OpenAI 计划在未来几周内正式上线 GPT-5.6 Sol、Terra 和 Luna。

此外，OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol，届时其处理速度最高可达每秒 750 token，初期将仅面向部分客户开放。

联系我们