GPT-6 代码与推理
性能暴涨40%,全面碾压GPT-5.4
40%
代码能力提升
40%
推理能力提升
被Anthropic狠狠摆了一道
最近Brockman亲自在播客上承认了,OpenAI之前光顾着刷榜单,结果在编程领域被Anthropic狠狠摆了一道,大量用户被抢走。Claude Code、Cowork、OpenClaw这类基于AI编程产品的爆火,让OpenAI猛然意识到"原来只靠文本,真的有可能通往AGI"。
GPT-6的编程能力
据知情人士透露,GPT-6在代码相关任务上的表现比GPT-5.4提升了约40%。这意味着GPT-6将能够更好地:
- 理解代码结构和架构
- 修复复杂bug
- 编写新功能和模块
- 参与完整工程流程
推理能力的突破
GPT-6在复杂推理任务上也有显著提升:
- 逻辑推理:更准确的逻辑推导和演绎
- 数学问题:更高难度的数学问题求解
- 多步推理:长链路、多步骤的复杂推理
Sonnet级别的定价,Mythos级别的智能
如果拿Claude来对标,那就是拥有Mythos级别的智能,却只收Sonnet级别的定价。