今天这期不看谁又把模型参数往上推了一截。

更值得看的,是 GitHub 做了一次很反直觉的优化:让 Copilot CLI 少叫子 Agent 干活。结果不是变笨,而是工具失败更少、等待时间更短。

这件事对普通人也有用。很多 AI 工作流的问题,不是 AI 不够努力,而是任务被拆得太碎、交接太多、验收太晚。最后看起来很自动化,实际全在返工。

今天只看这 2 件事

1. GitHub Copilot CLI 学会少派活给子 Agent

发生了什么:GitHub 把 Copilot CLI 的子 Agent 委派策略调得更克制,已经推到 100% 生产流量。简单任务不再动不动拆给 helper agent,复杂任务才并行处理。

为什么重要:这说明 Agent 不是“派越多越强”。GitHub 实测后,工具失败少了 23%,等待时间也降了。真正有用的 Agent,要知道什么时候自己做、什么时候叫人。

对我们有什么影响:这条很适合转成工作流判断:别迷信多 Agent。普通人写任务单时,也要先把“哪些事独立、哪些事别拆”说清楚,才能少返工。

2. Vercel Workflow SDK 原生支持 Nitro v3

发生了什么:Vercel 让 Workflow SDK 可以在 Nitro v3 里原生运行,步骤和应用共用同一个 runtime,开发服务器还能直接看 workflow 调试界面。

为什么重要:AI 应用最后都要落到“后台步骤能不能稳定跑”。这次不是模型更新,而是把工作流运行、调试、打包这几个卡点往前推了一步。

对我们有什么影响:如果以后做 AI 小工具或自动化服务,这类底层更新比热闹 demo 更实用。它提醒我们:交付不是一句 prompt,而是一条能监控、能调试、能部署的流程。

为什么今天还值得讲 Agent

昨天已经讲过模型可用性和工作流备选路线,今天不重复那条线。

今天的新信息在于:Agent 系统开始从“多派几个帮手”回到“把边界收清楚”。GitHub 这次不是发一个漂亮 demo,而是拿生产流量里的工具失败率和等待时间做判断。Vercel 的更新也不是让模型更会说话,而是让后台步骤更容易调试和部署。

这说明 Agent 的竞争会越来越像工程管理:不是谁喊来的人最多,而是谁能把任务拆得刚好、让每一步有结果、有日志、有退路。

我的判断

今天最值得记住的,是一个很朴素的判断:AI 系统要变可靠,第一步可能不是加人,而是少交接。

子 Agent、workflow、备用模型、伙伴网络,这些东西听起来都在扩张。但真正落到一个任务里,扩张一定会带来管理成本。每多一个环节,就多一次误解任务、丢上下文、输出没人验的机会。

所以我会把今天这条 GitHub 新闻当成一个提醒:以后判断一个 AI 工具,不只看它能不能自动做很多事,还要看它有没有能力说“这件事不用拆,我自己做完就好”。

可以直接带走

今天可以做一个很小的动作:给你正在用的 AI 工具补一张“少委派卡”。

不用复杂,就写四行:

  1. 这次让 AI 做什么?
  2. 哪些步骤必须拆出去,哪些步骤最好不要拆?
  3. 每个交接点怎么判断结果过关?
  4. 出错以后谁接手、从哪里恢复?

如果这四行写不清,先别急着堆更多 Agent。先把任务边界写清楚,通常比多接一个工具更能少返工。

其他信号

  • Fusion API:半价达 Fable 级智能:看点:强模型访问不稳时,开发者需要可切换、可控成本的备用入口。
  • OpenAI 推出 Partner Network:看点:AI 正在从单个产品销售,转向靠伙伴网络完成企业交付。
  • /architect:Fable 统筹审核,Codex 负责构建:看点:省 token 不只是换便宜模型,也可以重新设计模型分工。
  • Anthropic 暂停新模型访问,引发印度 AI 讨论:看点:模型能力之外,企业还要算供应稳定和政策风险。
  • Meta 据称撤销 20 亿美元 Manus 交易:看点:AI 并购不只看技术和价格,也会被跨境监管重新定价。