全部解读 · 小互 · AI 解读站

产品发布

№ 048

LAUNCH

来源 · Midjourney 官推⚑ 厂商内容

对手卷对话改图，Midjourney押注「随机撞风格」

两个随手发的命令行更新，其实是战略表态：全行业涌向「对话式精准改图」，它偏把「撞见意外风格」做成工业级。

MidjourneyAI图像生成06-26 · 4 分钟

产品发布

№ 047

LAUNCH

来源 · OpenAI Developers⚑ 厂商内容

Codex 进手机，把你从码农变工头

真赌注不在手机编程，而在把开发者改造成 AI 的代码审查官，顺手占住你下班那块屏。

CodexOpenAI06-26 · 5 分钟

产品发布

🎧№ 046

LAUNCH

来源 · Anthropic⚑ 厂商内容

Claude 4 发布：双模型主攻编程与 Agent

Opus 4、Sonnet 4 在 SWE-bench 分别拿 72.5% 和 72.7%；定价沿用上代，Sonnet 4 免费用户也能用。

Claude 4AI 编程06-26 · 4 分钟

研究解读

№ 045

RESEARCH

来源 · The Decoder

AI政治偏见测评：多数偏左，Gemini例外

GPT-5.5八成偏左、Grok反觉醒实偏左，唯Gemini 93%两面兼顾

AI偏见政治立场06-26 · 3 分钟

研究解读

№ 043

RESEARCH

来源 · IBM Newsroom⚑ 厂商内容

IBM 把芯片做进 0.7 纳米：密度比 2nm 翻倍

实验室已验证可制造；性能 +50%、能效 +70% 是相对 2nm 的预测值，非实测

IBM半导体06-26 · 4 分钟

产品发布

№ 042

LAUNCH

来源 · OpenAI 官方博客

GPT-5.5 发布会，我替你蹲了两小时

官方画的饼有多大、能信几分？我把关键 demo 逐帧扒了一遍，挑出真值得看的三处。

GPT-5.5发布会06-24 · 8 分钟

研究解读

№ 041

RESEARCH

来源 · arXiv 2506.xxxxx

让模型「自己改作业」的论文，到底神在哪

一句话：它学会了给自己挑错。我用一个做菜的类比，把核心机制讲给你听。

对齐自我修正06-22 · 11 分钟

深度

№ 040

DEEP DIVE

来源 · 小互实测 + 多方访谈

AI 编程一年，谁在真用、谁在演

我翻了 30 个团队的真实用法，挤掉水分，只留下能落地的那部分。

AI 编程Agent06-20 · 15 分钟

商业动态

№ 039

BUSINESS

来源 · 公开财报 + 路透

Anthropic 这轮融资，钱要花在哪

钱多不稀奇，怎么花才见真章。三张图看懂这家公司的算盘。

融资Anthropic06-18 · 6 分钟

产品发布

№ 038

LAUNCH

来源 · 厂商发布 + 小互实测⚑ 厂商内容

又一个「颠覆搜索」的产品，成色如何

厂商说得天花乱坠，我冷静用了三天，把好用和不好用都摆出来。

AI 搜索实测06-16 · 9 分钟

研究解读

№ 037

RESEARCH

来源 · Nature 子刊

大模型会「说谎」吗？一个关于诚实的实验

不是科幻，是实验室里能复现的现象。我把论文里的关键实验讲白。

对齐安全06-14 · 10 分钟

深度

№ 036

DEEP DIVE

来源 · 小互整理

把这一年的 AI 大新闻，按月捋一遍

信息太碎？我做了一条可交互时间线，一屏看完这一年的来龙去脉。

年度时间线06-12 · 12 分钟

商业动态

№ 035

BUSINESS

来源 · 公开报价 + 测算

国产大模型价格战，到底是谁在补贴谁

降价的尽头是免费？我算了笔账，结论可能跟你想的不一样。

国产模型定价06-10 · 7 分钟