OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5 - 壹号娱乐app

OpenAI 于 6 月 27 日正式推出了其最新的 GPT-5.6 系列模型,但目前尚未向公众全面开放。应美国政府的要求,该系列模型现阶段仅提供给少数“可信合作伙伴”进行预览。

本次发布的 GPT-5.6 系列包含三个不同档次:

  • 旗舰版 Sol:输入成本为每 100 万 Tokens 5 美元(约合 34 元人民币),输出成本为每 100 万 Tokens 30 美元(约合 204.3 元人民币)。
  • 均衡版 Terra:输入成本为每 100 万 Tokens 2.5 美元(约合 17 元人民币),输出成本为每 100 万 Tokens 15 美元(约合 102.1 元人民币)。
  • Luna:专注于速度和成本,输入成本为每 100 万 Tokens 1 美元(约合 6.8 元人民币),输出成本为每 100 万 Tokens 6 美元(约合 40.9 元人民币)。

此外,OpenAI 还改进了提示词缓存机制,以降低重复提示词的调用成本并提高可预测性。

在能力方面,OpenAI 将 GPT-5.6 Sol 描述为其迄今为止最强大的模型,引入了新的 Max 推理强度,并配备了通过子智能体加速复杂任务的 Ultra 模式。

在编程领域,GPT-5.6 Sol 在 Terminal-Bench 2.1 测试中取得了新的最高分,标准模式下得分为 88.8%,优于 Claude Mythos 5 的 88.0%。在启用 Ultra 模式后,得分更是达到了 91.9%。

在生物学领域的 GeneBench v1 测试中,该模型在消耗更少 token 的情况下,性能表现超越了 GPT-5.5。

在网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等复杂的安全任务上表现出显著提升。在 ExploitBench 测试中,其输出 token 量仅为 Mythos Preview 的约三分之一,即可达到相似的性能水平。

安全设计方面,OpenAI 表示 GPT-5.6 Sol、Terra 和 Luna 采用了多层防护体系,包括内置的拒答机制、实时生成过程分类器、账户级风险审查、差异化访问控制以及监控和执法机制。对于高风险情况,系统能够暂停生成,并由更强大的推理模型进行复核,若检测到违规,内容将在展示前被拦截。

OpenAI 计划在未来几周内正式上线 GPT-5.6 Sol、Terra 和 Luna。

此外,OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol,届时其处理速度最高可达每秒 750 token,初期将仅面向部分客户开放。

5条评论

  1. 宇智波鼬
    2020年6月5日

    在豐富多元的遊戲專題活動方面,一号娱乐提供贴心周到的支持。

  2. John Doe
    2020年6月5日

    Sumo euismod dissentiunt ne sit, ad eos iudico qualisque adversarium, tota falli et mei. Esse euismod urbanitas ut sed, et duo scaevola pericula splendide. Primis veritus contentiones nec ad, nec et tantas semper delicatissimi.

    • 旗木卡卡西
      2020年6月5日

      一号娱乐以穩定流暢的互動交流環境为核心,带来高效便捷的体验。

      • 新晋玩家
        2026年5月19日

        通过精心策划的多元化游戏专题活动,我们不断丰富玩家的娱乐体验。从深度挖掘经典游戏魅力,到前瞻性介绍创新玩法,满足不同玩家的探索与求知欲。

  3. 奈良鹿丸
    2020年6月3日

    Typi non habent claritatem insitam; est usus legentis in iis qui facit eorum claritatem.

添加评论 您的电子邮箱地址不会被公开。

联系我们

与我们取得联系。

您心中是否有一个想法或一个宏大的项目?和我们谈谈。 让我们一起合作,创造伟大的事物。给我们 发条消息。

在这里找到我们

1600 Amphitheatre Parkway
加利福尼亚州山景城
94043 US

打个招呼

[email protected]
+197 543 2345
+197 123 9876