今天这期继续看 Agent,但换一个角度。

过去几天我们已经讲过权限、成本、安全交付和企业部署。今天还值得继续讲,是因为 Agent 不再只站在 IDE 或聊天框里等你提问,它开始被拉进工作群、接进开发者工具台,再被包装成生命科学这种专业场景里的可调用技能。

这一步不炫,但很要命。AI 一旦进入群聊和业务系统,问题就不只是“它会不会做”,而是谁能喊它、它能看什么、用哪个模型、花谁的钱、做完以后谁验收。

今天只看这 3 件事

1. Anthropic 发布 Claude Tag,把 Claude 放进 Slack 团队协作

发生了什么:Anthropic 6 月 23 日发布 Claude Tag。团队可以在 Slack 频道里直接 @Claude,让它读取被授权的频道、工具、数据和代码库,然后拆任务、执行任务、在 thread 里回结果。它先面向 Claude Enterprise 和 Team 客户 beta。

为什么重要:这不是普通聊天机器人进 Slack,而是把 Claude Code 的任务模式搬进团队协作现场。管理员能控权限、看日志、设 token 花费上限,说明大公司正在把 Agent 从个人工具推到组织级工作流。

对我们有什么影响:今天最值得跟的是“团队版 Agent 怎么落地”。普通人也可以借这个新闻讲清楚:AI 不只会写代码,下一步是被拉进群、接任务、留痕迹、受预算约束。以后真正值钱的能力,可能不是单独写一句 prompt,而是把任务说清楚,把权限边界划清楚,再看它交回来的东西能不能进下一步。

2. GitHub Copilot app 支持 BYOK,可接自己的模型供应商

发生了什么:GitHub 6 月 23 日宣布 Copilot app 支持 bring your own key。用户可以把 OpenAI、Azure OpenAI、Microsoft Foundry、Anthropic、LM Studio、Ollama 或 OpenAI-compatible endpoint 接进来,每次 agent session 自选模型。

为什么重要:AI Coding 工具开始从“平台给你什么模型”变成“你带自己的模型和账单”。本地模型、企业云、内部网关、合规区域都能进入同一个 Copilot 工作台,模型路由会变成开发者的日常配置。

对我们有什么影响:这条适合继续拆“AI 编程不是只选工具,而是选模型、费用、数据边界和任务类型”。同一个 Copilot 工作台里,云模型、本地模型、企业网关都能上桌,开发者以后要管的不是一个按钮,而是一套模型账本。

3. NVIDIA BioNeMo Agent Toolkit 把生命科学模型包装成 Agent 可调用技能

发生了什么:NVIDIA 6 月 23 日介绍 BioNeMo Agent Toolkit,把结构预测、分子生成、对接、序列分析、基因组等能力包装成 BioNeMo Skills,并提供 MCP server wrappers,让 Claude、Codex 这类 agent runtime 可以调用。

为什么重要:这条的重点不是又一个科研模型,而是专业模型正在被封装成“Agent 能读懂、能选择、能调用、能解释失败”的技能。NVIDIA 给出的测试里,接入 Skills 后任务完成率从 57.1% 提到 100%。

对我们有什么影响:它适合做一条更大的判断:未来很多行业不会等通用大模型全会,而是把专业能力做成 Agent 可调用工具。普通人理解这件事,比单纯追模型参数更有用。你要看的不是“AI 会不会懂生物医药”,而是专业工具有没有被做成它能选择、能调用、能解释失败的工作环节。

为什么放在一起看

这三件事放在一起看,讲的是 Agent 的三个新位置。

Claude Tag 是进群,Copilot BYOK 是进工具台,BioNeMo Skills 是进专业能力库。一个负责接任务,一个负责选模型,一个负责调用行业工具。

所以今天不是重复昨天的“AI 要被治理”。今天更具体:AI 开始坐到真实工作的工位上了。它旁边有同事、有账号、有预算、有模型选择,也有专业工具。以前你问 AI “能不能帮我做”,现在更像是在问“这件事能不能派给它,它用哪套工具做,做完谁签字”。

我的判断

今天最值得记住的,不是 Claude、Copilot 或 NVIDIA 各自发了什么,而是工作分配方式正在变。

以前团队里分任务,是人找人:谁来查资料,谁来写代码,谁来跑分析,谁来回消息。现在多了一个新对象:能不能把一部分任务派给 AI?它能不能读这个频道?能不能碰这份代码?能不能用这个模型?能不能调用这套专业工具?

这会让人的位置变得更像调度员和验收人。你不一定亲手做每一步,但你要知道哪一步能交给 AI,哪一步必须自己看,哪一步交出去会出事。

这也是我今天更看重 Claude Tag 的原因。它不是最炫的技术新闻,但它把一个问题摆到普通团队面前:当 AI 真的进了工作群,你准备让它坐在哪个位置?

可以直接带走

今天可以做一个很小的动作:给你正在用的 AI 工具补一张“派工卡”。

不用复杂,就写四行:

  1. 这次让 AI 做什么?
  2. 它可以看哪些资料,不能碰哪些资料?
  3. 它用哪个模型或工具,费用算在哪里?
  4. 结果怎么才算过关,谁来签字?

别急着把 AI 当万能同事。先把派工规则写清楚。任务、权限、工具、验收这四件事说不清,AI 越强,后面的返工和风险越难收拾。

其他信号

  • GitHub Copilot CLI 新终端界面正式可用:实用看点是入口变轻:AI 编程工具正在从网页/IDE 扩到终端里的日常操作。对重度开发者来说,少切一次窗口就少丢一次上下文。
  • NVIDIA DFlash 用块扩散推测解码提升 Blackwell 推理速度:实用看点是成本和等待时间:Agent 任务越长,推理速度越像基础设施问题。模型很强还不够,谁能把延迟和吞吐压下来,谁更接近可用的生产系统。
  • NVIDIA Halos for Robotics:给实体机器人补安全底座:实用看点是实体 AI 的硬门槛:机器人走进真实场景,最先被问的不是聪不聪明,而是出错时谁兜底、怎么认证、能不能和人安全共处。
  • Deploy from Claude Design to Vercel:实用看点是原型交付:设计工具和部署平台开始直接打通,适合需要快速给客户、同事或粉丝看在线 demo 的人。它解决的不是审美,而是少一次导出、少一次部署。
  • GitHub联合开源联盟呼吁修改加州AI透明度法案以保护开源:实用看点是开源 AI 的责任边界:监管不是只管大公司,也会影响小团队能不能放心发布模型、库和工具。做开源 AI 项目的人要开始关注政策口径。
  • 在 Transformers.js 中实验提议的跨源存储 API:实用看点是浏览器端 AI 的体验:模型下载慢、占缓存,是普通用户最容易感知的卡点。这个方向如果跑通,Web AI 应用会更像网页,而不是每次都重新装工具。