Anthropic 下线旧模型,表面看是模型版本迭代,实际影响的是每个把 Claude API 接入生产系统的团队:模型名是否写死、提示词是否依赖旧模型习惯、评测是否覆盖关键任务、预算和延迟是否重新计算、灰度和回滚是否真的可用。
截至 2026 年 6 月 16 日核对 Anthropic 官方文档,Claude Sonnet 4 的 claude-sonnet-4-20250514 和 Claude Opus 4 的 claude-opus-4-20250514 已在 2026 年 6 月 15 日退休。官方说明是:对这些模型的请求现在会返回错误,并建议分别迁移到 Claude Sonnet 4.6 和 Claude Opus 4.8。另一个需要提前处理的是 Claude Opus 4.1:claude-opus-4-1-20250805 已在 2026 年 6 月 5 日被标记为 deprecated,API 计划在 2026 年 8 月 5 日退休,推荐迁移到 Claude Opus 4.8。
如果你正在做 Claude Code、AI Agent、RAG、自动化办公、客服机器人或内容生成系统,可以继续阅读站内 Claude Code 教程、AI Agent 工作流、API 集成教程 和 AI 工具最新动态。
摘要:这次下线不是新闻,而是生产系统风险提醒
对普通用户来说,模型下线可能只是模型选择器里少了一个选项;对开发者来说,它意味着线上请求可能从“质量略有变化”直接变成“接口报错”。这次 Anthropic 文档给出的信号很明确:旧模型退休后,继续调用会返回错误,因此只要代码、环境变量、队列任务、第三方平台配置或客户私有部署里仍然保留旧模型名,就可能出现生产故障。
开发者应该把这件事看成一次模型依赖治理:先盘点哪里在用旧模型,再选定替代模型,然后用离线评测、灰度流量和监控指标验证质量、成本、延迟和稳定性。最危险的做法,是只在一个配置文件里把模型名改掉,然后直接全量上线。
本文会按工程视角拆解:哪些模型已经退休、哪些即将退休、为什么模型迁移不只是改名字、不同产品线该怎么迁移、上线前要测什么、上线后要盯什么,以及团队如何把模型退役变成长期机制。

官方时间线:哪些模型已经不能继续用
Claude Sonnet 4 和 Claude Opus 4 已在 2026 年 6 月 15 日退休
Anthropic API release notes 在 2026 年 6 月 15 日记录:Claude Sonnet 4 模型 claude-sonnet-4-20250514 和 Claude Opus 4 模型 claude-opus-4-20250514 已退休,所有发往这些模型的请求现在都会返回错误。官方推荐的替代路径是:Sonnet 4 迁移到 Claude Sonnet 4.6,Opus 4 迁移到 Claude Opus 4.8。
这意味着如果你的系统仍然在任何地方拼接或保存这两个模型名,问题不再是“未来可能不稳定”,而是“当前请求已经会失败”。它会影响定时任务、后台队列、低频管理工具、企业客户自定义配置、历史 workflow、SDK 示例代码和文档中复制出来的旧配置。
Claude Opus 4.1 已进入弃用期,8 月 5 日是关键日期
Anthropic 模型弃用文档显示,Claude Opus 4.1 的 claude-opus-4-1-20250805 在 2026 年 6 月 5 日被通知弃用,计划在 2026 年 8 月 5 日退休,推荐替代模型为 Claude Opus 4.8。对还在用 Opus 4.1 做复杂推理、代码代理、长上下文任务的团队来说,现在还有迁移窗口,但不应拖到最后一周。
更稳妥的节奏是:本周完成依赖扫描和评测集整理,下周完成替代模型压测,两到三周内完成灰度,然后保留至少一个完整业务周期观察质量和成本。模型迁移越接近退役日,越容易被业务高峰、假期、审批、客户变更冻结卡住。
模型状态表要纳入工程资产
Anthropic 的 model deprecations 页面列出了模型当前状态、弃用日期和预计退休日期。团队不应该只在迁移当天看一次,而应把模型状态当成依赖清单的一部分,和 npm 包、Docker 镜像、数据库版本一样纳入周期性审计。
尤其是 SaaS 产品、AI 插件、内部平台和多租户 Agent 系统,经常允许客户或运营在后台选择模型。如果这些选择项没有跟官方模型状态同步,前端还显示可选,后端却已经请求失败,就会形成很差的用户体验。
对开发者的第一层影响:硬编码模型名会直接变成故障点
不要只搜一个仓库
很多团队以为模型名只在主服务里配置一次,但真实情况通常更复杂:后端服务、worker、脚本、测试夹具、CI 任务、演示项目、客户私有配置、低代码平台、提示词管理后台、数据标注工具和文档示例里都可能保存旧模型名。
建议至少搜索这些位置:代码仓库、环境变量、Secret 管理器、Kubernetes ConfigMap、CI/CD 变量、任务调度平台、数据库配置表、缓存、A/B 实验平台、内部文档和客户交付包。只改主仓库不够,旧模型名可能藏在低频任务里,等月底报表、周报生成或客户批处理运行时才爆出来。
把模型名抽象成可治理配置
模型名可以配置,但不能失控。理想状态是系统里有一个模型注册表,记录模型供应商、正式 API 名称、内部别名、用途、状态、推荐替代、负责人、迁移截止日期和回滚策略。业务代码只引用内部别名,例如 anthropic_default_reasoning 或 anthropic_fast_content,底层再映射到当前可用模型。
这样做的好处是:当 Anthropic 下线旧模型时,你可以在一处控制默认模型,同时仍然允许关键业务线单独灰度。它也能降低“有人在新功能里复制旧模型名”的概率。
接口失败要有清晰错误处理
旧模型退休后,请求会返回错误。开发者不应该让这个错误变成通用的“AI 服务异常”,而要在日志和告警中识别为模型不可用、模型已退休或模型配置过期。这样值班人员才能快速定位,不会误判为网络、鉴权或额度问题。
对于用户可见产品,可以准备更清晰的降级提示:当前模型配置已过期,系统正在切换到推荐模型或需要管理员更新配置。不要把底层模型 ID、密钥、完整请求体暴露给终端用户。
第二层影响:替代模型不是完全等价的同名升级
提示词行为可能变化
即使推荐替代模型来自同一模型家族,新模型在遵循格式、推理风格、拒答边界、工具调用倾向、代码修改策略、长上下文注意力和输出长度上也可能不同。旧提示词在旧模型上稳定,不代表在新模型上完全稳定。
内容生成系统可能出现语气变化,代码代理可能更主动修改文件,客服机器人可能更保守或更详细,RAG 系统可能引用证据方式变化。迁移时要用真实样本评测,而不是只跑几条 demo。
成本和延迟需要重新估算
从 Sonnet 到 Sonnet 的迁移、从 Opus 到 Opus 的迁移,并不意味着成本、输出长度、缓存命中率和延迟完全相同。尤其是复杂 Agent、长文档分析和批量生成任务,模型切换后 token 用量、重试率、工具调用轮数和缓存策略都可能变化。
上线前至少要记录四类指标:单次请求输入 token、输出 token、平均延迟、失败率。上线后再对比新旧模型在同一任务集上的差异。如果成本显著上升,不一定要立即回退,也可以通过缩短提示词、加强缓存、拆分任务或调整模型路由来优化。
参数兼容性也要看
Anthropic 官方文档还提到 API 参数弃用问题:在 Claude Opus 4.7 及之后的模型上,temperature、top_p、top_k 设置为非默认值会返回 400 错误,推荐省略这些参数并通过提示词控制行为。由于 Claude Opus 4.8 也属于这个范围,迁移到 Opus 4.8 的团队要特别检查采样参数。
这类变化很容易被忽略,因为很多 SDK 封装会在默认配置里自动带上参数。你以为只改了模型名,实际新模型可能因为旧参数组合直接拒绝请求。

不同类型项目应该怎么迁移
聊天助手和内容生成工具
这类产品最容易被用户感知到语气和格式变化。迁移前要准备典型任务集:标题生成、长文改写、摘要、FAQ、表格输出、JSON 输出、翻译、风格化写作、拒答边界和多轮上下文。每类任务至少保留若干真实样本,比较新旧模型输出是否符合产品定位。
如果你的产品承诺固定格式,例如 WordPress HTML、Markdown 模板、SEO 字段、JSON Schema,迁移后一定要测格式合规率。模型变聪明不等于更听话,格式错误可能直接影响发布链路。
AI Agent 和工具调用系统
Agent 系统迁移风险更高,因为模型不仅生成文本,还会选择工具、组织计划、调用 API、修改文件或触发业务动作。新模型可能更积极,也可能更谨慎。迁移前要回放真实任务轨迹,观察工具调用次数、错误恢复能力、是否越权、是否重复执行、是否正确等待人工确认。
建议把高风险动作放在显式审批后面,例如删除数据、发送外部邮件、改生产配置、退款、权限变更和批量发布。模型迁移期间不要顺手扩大 Agent 权限,先保持动作边界稳定。
代码生成和 Claude Code 工作流
代码类任务需要特别关注回归测试、代码风格、最小修改原则和多文件理解能力。新模型可能在重构上更大胆,也可能给出不同的补丁结构。迁移时要用真实 issue、失败 CI、已有代码库和历史 PR 做评测,而不是只问算法题。
对团队内部的 Claude Code 流程,可以把模型升级和项目规则一起检查:是否仍然遵守 AGENTS.md、是否正确读取测试命令、是否避免修改无关文件、是否能在失败后给出可执行诊断。
RAG 和知识库问答
RAG 系统的风险不只在模型本身,还在检索、引用和拒答策略。新模型可能更擅长整合上下文,但也可能在证据不足时给出更自然的推测。迁移时要重点测:是否引用正确来源、是否能承认资料缺失、是否遵守“只根据文档回答”、是否能处理冲突资料。
迁移清单:从发现旧模型到稳定上线
第一步:做全量模型依赖扫描
先列出所有 Anthropic 模型调用入口,并标出是否使用了 claude-sonnet-4-20250514、claude-opus-4-20250514 或 claude-opus-4-1-20250805。扫描范围包括代码、配置、数据库、Secret、CI/CD、后台任务、客户配置和文档。
输出结果不要只是一串 grep 日志,最好整理成表:服务名、负责人、旧模型、推荐替代、调用量、业务风险、迁移状态、计划上线时间。这样迁移才可追踪。
第二步:选定替代模型和路由策略
官方建议 Sonnet 4 迁移到 Sonnet 4.6,Opus 4 和 Opus 4.1 迁移到 Opus 4.8。实际项目中还可以按任务分层:简单摘要和分类走更快的模型,复杂推理、代码代理和长上下文任务走更强模型。不要把所有任务无差别迁到最贵模型,也不要为了省钱把高风险任务降级到不合适的模型。
第三步:建立迁移评测集
评测集要来自真实业务,而不是临时编造。至少包含成功样本、边界样本、历史失败样本、高价值客户样本和高风险动作样本。每个样本要有预期结果或人工评分标准,例如格式是否合规、事实是否正确、引用是否充分、工具调用是否安全。
第四步:检查参数和 SDK 封装
如果迁移到 Opus 4.8,要检查是否仍然给 temperature、top_p、top_k 设置非默认值。还要确认 SDK 版本、beta header、上下文窗口、缓存策略、工具定义和流式输出处理是否与目标模型兼容。
第五步:灰度上线并设置回滚
不要直接全量切换。可以按内部用户、低风险租户、少量流量、特定任务类型逐步放量。灰度期间同时记录质量反馈、错误率、延迟、成本、重试率、输出截断率和人工接管率。回滚不一定是退回已退休模型,而是切到另一个可用替代模型或临时关闭高风险功能。

上线验证工作流:建议团队这样执行
建立迁移分支和配置开关
先把模型映射抽到配置层,加入 feature flag 或运行时开关。这样可以在不重新部署全部服务的情况下调整模型路由。对于多租户产品,还可以按租户或任务类型控制放量。
用离线回放做第一轮筛选
把过去一段时间的真实请求脱敏后用于回放,比较旧模型记录、新模型输出和人工评分。注意不要把用户隐私、密钥或敏感业务数据直接写入评测日志。离线回放的目标不是证明新模型完美,而是发现明显不兼容的提示词和任务。
用线上影子流量观察差异
对关键业务可以采用 shadow mode:线上用户仍然使用当前稳定路径,同时把同一请求复制到新模型,结果只记录不返回给用户。这样能看到真实分布下的延迟、失败率和输出特征,但不会影响用户体验。
设置迁移后的监控面板
监控不能只看 HTTP 500。建议增加模型维度的指标:每个模型的请求量、错误码、平均输入输出 token、P95 延迟、超时率、重试率、工具调用失败率、JSON 解析失败率、内容审核触发率和单位任务成本。
准备客户和内部说明
如果你的产品面向企业客户,模型迁移可能涉及合规、安全评审或客户验收。提前说明迁移原因、官方退休日期、替代模型、影响范围、测试方式和回滚策略,通常比故障后解释更容易被接受。
常见错误:这些做法会放大风险
只改环境变量,不跑业务样本
模型迁移最常见的错误,是把它当成基础设施配置变更,而不是产品行为变更。只要模型输出会被用户阅读、被代码执行、被工作流消费,就必须跑业务样本。
忽略后台和低频任务
很多事故发生在低频任务:每周报告、月底账单、批量内容生成、客户导入、历史数据补全、知识库重建。这些任务平时调用少,监控弱,但一旦失败影响范围很大。
没有记录模型版本
如果日志里只记录“调用 Anthropic 成功”,而不记录具体模型名、内部路由别名、提示词版本和工具版本,迁移后很难复盘。模型治理的第一步,是让每次调用可追踪。
把回滚理解成退回旧模型
当旧模型已经退休,回滚不能指望回到旧模型。真正的回滚是切换到另一个仍然可用的替代模型、降低功能范围、暂停高风险动作或启用人工处理。这个策略要在上线前设计好。
对开发者的长期启示:模型也是会退役的依赖
Anthropic 这次下线旧模型提醒开发者:大模型不是永久稳定的黑盒服务,而是会持续升级、弃用、退休、调整参数兼容性和平台能力的外部依赖。工程团队需要像管理数据库、云服务、SDK 和浏览器版本一样管理模型生命周期。
更成熟的做法是建立模型治理机制:模型注册表、调用审计、定期迁移演练、评测集、成本面板、灰度开关、回滚路径和客户沟通模板。这样下一次模型弃用公告出现时,团队不需要临时救火,而是按流程推进。
对开发者来说,Anthropic 下线旧模型的真正含义不是“又要追新模型”,而是“AI 应用进入了依赖治理阶段”。谁能把模型变化纳入工程流程,谁就能在模型快速迭代中保持产品稳定。
FAQ
Anthropic 这次下线了哪些旧模型?
截至 2026 年 6 月 16 日,Anthropic 官方文档显示 claude-sonnet-4-20250514 和 claude-opus-4-20250514 已在 2026 年 6 月 15 日退休。继续请求这些模型会返回错误。
推荐迁移到哪些模型?
官方建议 Claude Sonnet 4 迁移到 Claude Sonnet 4.6,Claude Opus 4 迁移到 Claude Opus 4.8。Claude Opus 4.1 计划在 2026 年 8 月 5 日退休,推荐迁移到 Claude Opus 4.8。
是不是只要改模型名就可以?
不建议这样做。模型迁移会影响输出风格、格式稳定性、工具调用、成本、延迟、参数兼容性和错误处理。至少应该做依赖扫描、评测、灰度和监控。
旧模型退休后请求会怎样?
Anthropic release notes 明确说明,发往已退休 Claude Sonnet 4 和 Claude Opus 4 旧模型的请求现在会返回错误。因此生产系统应尽快移除这些模型名。
Claude Opus 4.1 现在还能用吗?
官方文档显示 Claude Opus 4.1 已在 2026 年 6 月 5 日进入 deprecated 状态,计划在 2026 年 8 月 5 日退休。是否可用应以 Anthropic API 实时状态和账号权限为准,但开发者应立即规划迁移。
迁移到 Opus 4.8 要注意什么参数?
Anthropic 文档提示,Claude Opus 4.7 及之后模型在 temperature、top_p、top_k 设置为非默认值时会返回 400 错误。迁移到 Opus 4.8 时应检查 SDK 和默认参数。
低频任务也需要迁移吗?
需要。低频任务往往更容易遗漏,例如周报、月报、批处理、客户导入、知识库重建和历史数据补全。旧模型名只要还存在,就可能在未来某次任务运行时触发失败。
如何降低下一次模型退役带来的影响?
建立模型注册表、内部别名、调用审计、迁移评测集、灰度开关、监控面板和回滚策略。不要让业务代码到处硬编码供应商模型名。
参考来源
本文事实信息参考 Anthropic 官方 Model deprecations 页面和 Claude API release notes。模型状态、推荐替代和退休日期可能继续变化,正式迁移前请以官方最新文档为准。
工具选型与提示词资料
适合阅读工具评测、工具推荐、对比测评类文章后继续转化。