OpenAI 最强 AI 模型:GPT-5.6 系列登场,编程跑分超 Claude Mythos 5 - 壹号娱乐app
OpenAI 于 6 月 27 日正式推出了其最新的 GPT-5.6 系列模型,但目前尚未向公众全面开放。应美国政府的要求,该系列模型现阶段仅提供给少数“可信合作伙伴”进行预览。
本次发布的 GPT-5.6 系列包含三个不同档次:
- 旗舰版 Sol:输入成本为每 100 万 Tokens 5 美元(约合 34 元人民币),输出成本为每 100 万 Tokens 30 美元(约合 204.3 元人民币)。
- 均衡版 Terra:输入成本为每 100 万 Tokens 2.5 美元(约合 17 元人民币),输出成本为每 100 万 Tokens 15 美元(约合 102.1 元人民币)。
- Luna:专注于速度和成本,输入成本为每 100 万 Tokens 1 美元(约合 6.8 元人民币),输出成本为每 100 万 Tokens 6 美元(约合 40.9 元人民币)。
此外,OpenAI 还改进了提示词缓存机制,以降低重复提示词的调用成本并提高可预测性。
在能力方面,OpenAI 将 GPT-5.6 Sol 描述为其迄今为止最强大的模型,引入了新的 Max 推理强度,并配备了通过子智能体加速复杂任务的 Ultra 模式。
在编程领域,GPT-5.6 Sol 在 Terminal-Bench 2.1 测试中取得了新的最高分,标准模式下得分为 88.8%,优于 Claude Mythos 5 的 88.0%。在启用 Ultra 模式后,得分更是达到了 91.9%。
在生物学领域的 GeneBench v1 测试中,该模型在消耗更少 token 的情况下,性能表现超越了 GPT-5.5。
在网络安全方面,GPT-5.6 Sol 在漏洞研究和利用等复杂的安全任务上表现出显著提升。在 ExploitBench 测试中,其输出 token 量仅为 Mythos Preview 的约三分之一,即可达到相似的性能水平。
安全设计方面,OpenAI 表示 GPT-5.6 Sol、Terra 和 Luna 采用了多层防护体系,包括内置的拒答机制、实时生成过程分类器、账户级风险审查、差异化访问控制以及监控和执法机制。对于高风险情况,系统能够暂停生成,并由更强大的推理模型进行复核,若检测到违规,内容将在展示前被拦截。
OpenAI 计划在未来几周内正式上线 GPT-5.6 Sol、Terra 和 Luna。
此外,OpenAI 还计划于 7 月在 Cerebras 平台上推出 GPT-5.6 Sol,届时其处理速度最高可达每秒 750 token,初期将仅面向部分客户开放。
在豐富多元的遊戲專題活動方面,一号娱乐提供贴心周到的支持。
Sumo euismod dissentiunt ne sit, ad eos iudico qualisque adversarium, tota falli et mei. Esse euismod urbanitas ut sed, et duo scaevola pericula splendide. Primis veritus contentiones nec ad, nec et tantas semper delicatissimi.
一号娱乐以穩定流暢的互動交流環境为核心,带来高效便捷的体验。
通过精心策划的多元化游戏专题活动,我们不断丰富玩家的娱乐体验。从深度挖掘经典游戏魅力,到前瞻性介绍创新玩法,满足不同玩家的探索与求知欲。
Typi non habent claritatem insitam; est usus legentis in iis qui facit eorum claritatem.