今天这期继续看前沿模型,但别只盯“哪个模型更强”。
昨天我们讲过 GPT-5.6 先限量开放。今天还值得继续讲,是因为这条线又多了两个信号:一边是最强模型越来越像“有资格才能拿到的生产资源”,另一边是替代模型、输入法、低成本方案开始抢普通用户和企业入口。
这对普通人不是远处的监管新闻。以后你能不能用上最强模型,可能不只看你愿不愿意付钱,还要看你的身份、用途、所在地区、平台合作关系,以及公司愿不愿意把预算花在这条路上。
今天主要看 3 件事
1. 前沿模型开始进入“政府审核 + 可信客户”发布模式
发生了什么:OpenAI 的 GPT-5.6 先给少数可信伙伴预览,Anthropic 的 Mythos 5 也只恢复给一小批网络防御和基础设施机构。新变化不是“谁更强”,而是强模型先按客户资格和安全用途分发。
为什么重要:模型发布开始像高风险基础设施,不再只是一次产品上线。政府、模型公司、客户名单、网络安全能力会绑在一起,未来最强模型可能先变成少数机构的生产资源。
对我们有什么影响:做内容可以从“普通人什么时候能用到”切入。真正要盯的是访问门槛、价格、API / Codex 可用性、哪些任务被限制,而不是只追跑分。
2. 亚洲 AI 创业公司趁窗口推类 Mythos 模型
发生了什么:当前沿模型的开放节奏变慢,亚洲 AI 创业公司开始推出接近 Mythos 能力定位的模型,试图接住企业侧对替代方案的需求。
为什么重要:被限制的不只是模型,也会倒逼供应链重排。企业不会因为最强模型难拿就停工,它们会找能落地、能签约、能控制成本的替代品。
对我们有什么影响:普通团队选模型时,别只问“是不是第一梯队”。更现实的问题是:这个模型能不能稳定接入你的业务,价格能不能扛住,出了问题有没有人负责。很多时候,第二梯队但可用、便宜、能部署,反而先上桌。
3. AI 入口和账单压力同时往前推
发生了什么:阿里千问输入法上线 macOS 版,把 AI 润色和语音输入放进打字入口;同时有报道提到,一些美国企业因为 AI 账单压力转向 DeepSeek 等低成本方案。
为什么重要:AI 的竞争不只在模型榜单,也在入口和账单。输入法这种入口离用户最近,成本控制则决定企业能不能长期使用。
对我们有什么影响:普通人要看两张表:一张是入口表,你每天最常用的写字、搜索、表格、代码工具有没有 AI;另一张是成本表,这个 AI 是偶尔玩一下,还是能长期放进工作流。
为什么今天还值得继续讲强模型访问权
过去几天我们反复讲 agent、权限、验收和长任务。如果今天还只是说“AI 进入真实工作流”,就重复了。
今天真正的新东西在访问权。
强模型不是简单地从发布会流向所有人。它会先流向政府认可的场景、大客户、网络防御机构、基础设施单位,或者平台认为可信的合作方。你在朋友圈看到的“模型来了”,和你自己的工具栏里真的能稳定调用,中间隔着一整套资格、预算和责任边界。
这就像一张新牌已经印出来了,但不是所有人都能马上坐到那张牌桌上。
我的判断
今天最值得记住的是:AI 的差距开始从“知不知道”变成“拿不拿得到、用不用得起、放不放得稳”。
听说 GPT-5.6 没有用,关键是它什么时候进你能用的产品。知道 Mythos / Fable 被限制也没有用,关键是你的行业会不会因此换供应商。看到 DeepSeek 被企业拿来降账单,也别急着站队,先问它能不能跑完你的任务、能不能被验收、能不能省下长期成本。
普通人的主线任务不是追每一个模型名,而是把自己的工作流拆清楚:哪一步必须用最强模型,哪一步用便宜模型就够,哪一步只需要一个输入法、一个脚本、一个本地小工具。
以后真正会用 AI 的人,不一定是最早知道新模型名字的人,而是知道该把哪张牌打在哪个位置的人。
可以直接带走
今天可以做一个很小的动作:给你常用的 AI 任务做一张“模型分层表”。
不用复杂,就写三列:
- 必须用强模型:比如复杂代码改造、严肃资料核对、多步骤推理。
- 便宜模型就够:比如批量改写、格式整理、初稿扩写、关键词提取。
- 不该交给模型:比如最终事实确认、敏感决策、需要你承担责任的结论。
写完你会发现,很多 AI 账单不是因为模型贵,而是因为你把所有任务都塞给了同一张牌。
其他信号
- Show HN: Adrafinil – keep a lid-closed Mac awake only while agents work:这个小工具解决的是 agent 长任务的真实摩擦:电脑合盖休眠、任务中断、跑到一半失联。AI coding 要稳定,外围工具也得补上。
- 国家统计局:1-5月规上工业企业利润增18.8%,电子行业利润增103.9%贡献43.1%:这条把 AI 热度落到产业利润上:电子行业利润高增,背后是高端算力芯片和存储需求爆发,说明 AI 基建已经在财报里留下痕迹。