两个随手发的命令行更新,其实是战略表态:全行业涌向「对话式精准改图」,它偏把「撞见意外风格」做成工业级。
真赌注不在手机编程,而在把开发者改造成 AI 的代码审查官,顺手占住你下班那块屏。
Opus 4、Sonnet 4 在 SWE-bench 分别拿 72.5% 和 72.7%;定价沿用上代,Sonnet 4 免费用户也能用。
GPT-5.5八成偏左、Grok反觉醒实偏左,唯Gemini 93%两面兼顾
实验室已验证可制造;性能 +50%、能效 +70% 是相对 2nm 的预测值,非实测
官方画的饼有多大、能信几分?我把关键 demo 逐帧扒了一遍,挑出真值得看的三处。
一句话:它学会了给自己挑错。我用一个做菜的类比,把核心机制讲给你听。
我翻了 30 个团队的真实用法,挤掉水分,只留下能落地的那部分。
钱多不稀奇,怎么花才见真章。三张图看懂这家公司的算盘。
厂商说得天花乱坠,我冷静用了三天,把好用和不好用都摆出来。
不是科幻,是实验室里能复现的现象。我把论文里的关键实验讲白。
信息太碎?我做了一条可交互时间线,一屏看完这一年的来龙去脉。
降价的尽头是免费?我算了笔账,结论可能跟你想的不一样。