产品发布 · 小互解读
GPT-5.5 发布会,我替你蹲了两小时
官方画的饼有多大、能信几分?我把关键 demo 逐帧扒了一遍,挑出真值得看的三处。
先说结论:这事没有标题党说得那么玄,但也确实有几处值得你认真看。我把官方放出来的材料逐条对了一遍,再用一个你熟悉的类比,把里面最关键的机制讲清楚。
💡 一句话类比
它就像一个会自己回头检查作业的学生。做完不直接交,而是先扮成老师给自己挑错,再改一遍。
下面这张图,是我把官方给的关键指标按阶段拆出来的。你能明显看到第四个阶段的拐点,那才是这次真正的进步所在,而不是发布会上反复强调的那几个数字。
哪些是官方坐实的、哪些只是外界推测,我分两栏摆清楚。判断可以大胆,事实必须老实,没给的数字一个都不编。
✓ 官方确认
- 上下文窗口翻倍,长文档处理是这次实打实的升级。
- 原生多模态,图像和音频走同一套表征,不再外挂。
- 推理价格下调,面向开发者的调用成本明显降了。
≈ 外界推测
- 参数规模:官方没给,所有数字都是猜的,别当真。
- 训练数据来源:只字未提,无从核对。
- 所谓「接近博士水平」:是某个特定测试集的成绩,不等于通用能力。
再看大家最关心的跑分。我把官方给出的三项拉成横条,注意:跑分只说明在这套题上的表现,换一套题未必成立。
长文档检索92
多模态理解78
代码生成84
「能把复杂讲简单,靠的不是省略,而是先把自己搞懂。」
这一篇正文到这里。重点是:上下那层中性的外壳,导航、来源条、相关解读、页脚,无论正文换成哪套配色字体,都稳稳地框住它,不抢戏。这就是「画框」和「画」的关系。