今天这期少看一点。

过去几天,AI 新闻一直在讲 Agent:进工作群、接开发工具、管权限、算成本。今天最值得看的不是又多了一个新入口,而是 OpenAI 第一次把 Codex 的使用数据摊出来:用户真的开始把长任务交给 AI 跑了。

这件事比“模型又升级”更值得普通人记住。因为它说明 AI 的牌桌正在换:以前比的是谁回答得漂亮,现在要比谁能把任务跑完,谁能被检查,谁能少返工。

今天主要看 2 件事

1. OpenAI 用 Codex 使用数据说明:Agent 正在从“聊天”变成“干活”

发生了什么:OpenAI 发布一篇经济研究,拿 Codex 使用数据说明 Agent 正在接更长、更复杂的任务。到 2026 年 5 月,70.2% 的抽样个人用户至少发起过一次预计超过 1 小时人工工作的 Codex 请求,非技术用户增长也很快。

为什么重要:这不是又一个“AI 提效”口号,而是把 Agent 的使用方式讲清楚了:用户开始把任务拆出去,让它跑半小时、一小时,甚至更久。AI 工具的竞争会越来越像“谁能稳定交作业”。

对我们有什么影响:普通人用 AI 的下一步,不是多问几句,而是学会把任务派出去。你要写清楚目标、资料、边界和验收标准,然后看它能不能少返一次工。不会派工的人,手里有再强的模型,也容易把它用成一个高级聊天框。

2. 美国政府继续推动 Meta 加入前沿模型预发布审查

发生了什么:多家媒体报道,美国政府正在推动 Meta 把高级 AI 模型提交给政府做发布前安全审查。OpenAI、Anthropic、Google、Microsoft、xAI 等已经加入类似安排,Meta 表示正在处理细节,希望尽快签署。

为什么重要:前沿模型现在不只是产品发布,还牵涉网络安全、军事用途、关键基础设施风险。以后大模型公司发布强模型,可能会越来越多地被放进“能力评估、漏洞评估、发布边界”的框架里。

对我们有什么影响:这条适合做监管和安全线的跟踪,不适合写成阴谋论。真正能讲的是:AI 越强,发布前的验收、责任和权限边界越重要,普通团队做 Agent 也要学会先问“它能碰什么,不能碰什么”。

3. 今天少追一条,也是一种判断

发生了什么:过去 24-48 小时里还有一些 AI 相关消息,比如 Google Gemini 3.5 Pro 延期传闻、GitHub AI 编程使用增长、Meta 内容审核系统调整等。但它们要么缺少一手确认,要么更像业务侧报道,今天不适合硬拎出来当主线。

为什么重要:日报最怕凑数。弱新闻如果被包装成主线,读者最后只会得到一句空话:“AI 又改变工作了。”这句话听多了没有用,真正有用的是知道哪条新闻值得追,哪条新闻先放一放。

对我们有什么影响:今天重点跟 OpenAI Codex 研究,其次观察 Meta 模型审查。其他消息先放进观察池,等它有一手来源、产品变化或真实工作流影响时,再拿出来讲。

为什么放在一起看

Codex 数据讲的是“AI 能不能接长任务”,模型审查讲的是“强模型上线前要不要先过一遍风险”。一个在工作流里,一个在发布门口,看起来离得很远,其实都在问同一件事:

AI 不再只是给你一个答案,它开始进入有后果的位置。

一旦进入有后果的位置,问题就会变得朴素:谁给它派活?谁看它做完没有?它能碰哪些东西?出了问题谁负责?这比“今天哪个模型更聪明”更接近真实世界。

我的判断

今天最值得记住的,不是某家公司又发了一条新闻,而是人的位置又被重新定义了一次。

以后很多活,AI 会更快地写、更快地算、更快地试。人的手会少做一些执行,但人的责任不会自动变轻。谁来定义任务,谁来验收结果,谁来判断风险,谁来决定要不要真的上线,这些事情反而更重。

所以我现在看 AI 新闻,会先问一句:这条新闻改变了哪个工作流?

如果答案只是“模型又强了一点”,我会先放一放。如果答案是“某个行业、某个岗位、某个系统里的做事方式变了”,那就值得留下。

可以直接带走

今天可以做一个很小的动作:给你正在用的 AI 工具补一张“验收卡”。

不用复杂,就写四行:

  1. 这次让 AI 做什么?
  2. 结果怎么才算过关?
  3. 哪些地方必须人工看一眼?
  4. 出错以后怎么撤回?

越是看起来强的 AI,越需要这种朴素的验收动作。

其他信号

  • AI SDK 7:对开发者的价值在于把模型调用、工具、评测和 Agent 框架放进同一套 TypeScript 接口。团队少拼胶水代码,更多时间花在失败处理和上线验收。
  • Google Finance 全新 Android 应用与投资组合功能上线:Google Finance 把投资组合录入从手填变成截图、文件或文字导入,再配 AI 问答和市场简报。看点是金融产品把 AI 放进日常决策入口。
  • General Intuition 完成 3.2 亿美元融资,用游戏数据训练通用 AI 智能体:用游戏操作数据训练真实世界 Agent,说明训练数据不只来自网页文本。游戏平台、机器人和自动驾驶的数据价值会被重新定价。
  • AI被认为会取代工程岗位,但新数据显示工程是2025年最具韧性的岗位:这条能纠正“AI 先杀工程师”的简单叙事。会用 AI 的工程岗位反而可能更稳,招聘变化要看具体岗位和公司类型。
  • Teaching agents product design at Vercel:Vercel 把问题从“能生成 UI”推进到“能不能理解产品设计标准”。对做 AI 前端、设计工具和代码 Agent 的团队很有参考价值。
  • Anthropic称阿里巴巴非法获取了Claude AI模型的功能:这条提醒模型竞争会进入能力、蒸馏和知识产权争议区。企业选模型时要关注来源、授权和合规,不只是效果好不好。