Anthropic 下线旧模型，对开发者意味着什么

Anthropic 已在 2026 年 6 月 15 日退休 Claude Sonnet 4 和 Claude Opus 4 的旧 API 模型，继续请求这些模型会返回错误；Claude Opus 4.1 也已进入弃用期，计划在 2026 年 8 月 5 日退休。对开发者来说，这不是简单改一个模型名，而是一次模型依赖、提示词、评测、成本、延迟、回滚和供应商适配的工程检查。

Anthropic 下线旧模型，表面看是模型版本迭代，实际影响的是每个把 Claude API 接入生产系统的团队：模型名是否写死、提示词是否依赖旧模型习惯、评测是否覆盖关键任务、预算和延迟是否重新计算、灰度和回滚是否真的可用。

截至 2026 年 6 月 16 日核对 Anthropic 官方文档，Claude Sonnet 4 的 claude-sonnet-4-20250514 和 Claude Opus 4 的 claude-opus-4-20250514 已在 2026 年 6 月 15 日退休。官方说明是：对这些模型的请求现在会返回错误，并建议分别迁移到 Claude Sonnet 4.6 和 Claude Opus 4.8。另一个需要提前处理的是 Claude Opus 4.1：claude-opus-4-1-20250805 已在 2026 年 6 月 5 日被标记为 deprecated，API 计划在 2026 年 8 月 5 日退休，推荐迁移到 Claude Opus 4.8。

如果你正在做 Claude Code、AI Agent、RAG、自动化办公、客服机器人或内容生成系统，可以继续阅读站内 Claude Code 教程、AI Agent 工作流、API 集成教程和 AI 工具最新动态。

摘要：这次下线不是新闻，而是生产系统风险提醒

对普通用户来说，模型下线可能只是模型选择器里少了一个选项；对开发者来说，它意味着线上请求可能从“质量略有变化”直接变成“接口报错”。这次 Anthropic 文档给出的信号很明确：旧模型退休后，继续调用会返回错误，因此只要代码、环境变量、队列任务、第三方平台配置或客户私有部署里仍然保留旧模型名，就可能出现生产故障。

开发者应该把这件事看成一次模型依赖治理：先盘点哪里在用旧模型，再选定替代模型，然后用离线评测、灰度流量和监控指标验证质量、成本、延迟和稳定性。最危险的做法，是只在一个配置文件里把模型名改掉，然后直接全量上线。

本文会按工程视角拆解：哪些模型已经退休、哪些即将退休、为什么模型迁移不只是改名字、不同产品线该怎么迁移、上线前要测什么、上线后要盯什么，以及团队如何把模型退役变成长期机制。

开发者首先要把模型退休日期变成内部迁移截止日期，而不是等接口报错后再处理。

官方时间线：哪些模型已经不能继续用

Claude Sonnet 4 和 Claude Opus 4 已在 2026 年 6 月 15 日退休

Anthropic API release notes 在 2026 年 6 月 15 日记录：Claude Sonnet 4 模型 claude-sonnet-4-20250514 和 Claude Opus 4 模型 claude-opus-4-20250514 已退休，所有发往这些模型的请求现在都会返回错误。官方推荐的替代路径是：Sonnet 4 迁移到 Claude Sonnet 4.6，Opus 4 迁移到 Claude Opus 4.8。

这意味着如果你的系统仍然在任何地方拼接或保存这两个模型名，问题不再是“未来可能不稳定”，而是“当前请求已经会失败”。它会影响定时任务、后台队列、低频管理工具、企业客户自定义配置、历史 workflow、SDK 示例代码和文档中复制出来的旧配置。

Claude Opus 4.1 已进入弃用期，8 月 5 日是关键日期

Anthropic 模型弃用文档显示，Claude Opus 4.1 的 claude-opus-4-1-20250805 在 2026 年 6 月 5 日被通知弃用，计划在 2026 年 8 月 5 日退休，推荐替代模型为 Claude Opus 4.8。对还在用 Opus 4.1 做复杂推理、代码代理、长上下文任务的团队来说，现在还有迁移窗口，但不应拖到最后一周。

更稳妥的节奏是：本周完成依赖扫描和评测集整理，下周完成替代模型压测，两到三周内完成灰度，然后保留至少一个完整业务周期观察质量和成本。模型迁移越接近退役日，越容易被业务高峰、假期、审批、客户变更冻结卡住。

模型状态表要纳入工程资产

Anthropic 的 model deprecations 页面列出了模型当前状态、弃用日期和预计退休日期。团队不应该只在迁移当天看一次，而应把模型状态当成依赖清单的一部分，和 npm 包、Docker 镜像、数据库版本一样纳入周期性审计。

尤其是 SaaS 产品、AI 插件、内部平台和多租户 Agent 系统，经常允许客户或运营在后台选择模型。如果这些选择项没有跟官方模型状态同步，前端还显示可选，后端却已经请求失败，就会形成很差的用户体验。

对开发者的第一层影响：硬编码模型名会直接变成故障点

不要只搜一个仓库

很多团队以为模型名只在主服务里配置一次，但真实情况通常更复杂：后端服务、worker、脚本、测试夹具、CI 任务、演示项目、客户私有配置、低代码平台、提示词管理后台、数据标注工具和文档示例里都可能保存旧模型名。

建议至少搜索这些位置：代码仓库、环境变量、Secret 管理器、Kubernetes ConfigMap、CI/CD 变量、任务调度平台、数据库配置表、缓存、A/B 实验平台、内部文档和客户交付包。只改主仓库不够，旧模型名可能藏在低频任务里，等月底报表、周报生成或客户批处理运行时才爆出来。

把模型名抽象成可治理配置

模型名可以配置，但不能失控。理想状态是系统里有一个模型注册表，记录模型供应商、正式 API 名称、内部别名、用途、状态、推荐替代、负责人、迁移截止日期和回滚策略。业务代码只引用内部别名，例如 anthropic_default_reasoning 或 anthropic_fast_content，底层再映射到当前可用模型。

这样做的好处是：当 Anthropic 下线旧模型时，你可以在一处控制默认模型，同时仍然允许关键业务线单独灰度。它也能降低“有人在新功能里复制旧模型名”的概率。

接口失败要有清晰错误处理

旧模型退休后，请求会返回错误。开发者不应该让这个错误变成通用的“AI 服务异常”，而要在日志和告警中识别为模型不可用、模型已退休或模型配置过期。这样值班人员才能快速定位，不会误判为网络、鉴权或额度问题。

对于用户可见产品，可以准备更清晰的降级提示：当前模型配置已过期，系统正在切换到推荐模型或需要管理员更新配置。不要把底层模型 ID、密钥、完整请求体暴露给终端用户。

第二层影响：替代模型不是完全等价的同名升级

提示词行为可能变化

即使推荐替代模型来自同一模型家族，新模型在遵循格式、推理风格、拒答边界、工具调用倾向、代码修改策略、长上下文注意力和输出长度上也可能不同。旧提示词在旧模型上稳定，不代表在新模型上完全稳定。

内容生成系统可能出现语气变化，代码代理可能更主动修改文件，客服机器人可能更保守或更详细，RAG 系统可能引用证据方式变化。迁移时要用真实样本评测，而不是只跑几条 demo。

成本和延迟需要重新估算

从 Sonnet 到 Sonnet 的迁移、从 Opus 到 Opus 的迁移，并不意味着成本、输出长度、缓存命中率和延迟完全相同。尤其是复杂 Agent、长文档分析和批量生成任务，模型切换后 token 用量、重试率、工具调用轮数和缓存策略都可能变化。

上线前至少要记录四类指标：单次请求输入 token、输出 token、平均延迟、失败率。上线后再对比新旧模型在同一任务集上的差异。如果成本显著上升，不一定要立即回退，也可以通过缩短提示词、加强缓存、拆分任务或调整模型路由来优化。

参数兼容性也要看

Anthropic 官方文档还提到 API 参数弃用问题：在 Claude Opus 4.7 及之后的模型上，temperature、top_p、top_k 设置为非默认值会返回 400 错误，推荐省略这些参数并通过提示词控制行为。由于 Claude Opus 4.8 也属于这个范围，迁移到 Opus 4.8 的团队要特别检查采样参数。

这类变化很容易被忽略，因为很多 SDK 封装会在默认配置里自动带上参数。你以为只改了模型名，实际新模型可能因为旧参数组合直接拒绝请求。

模型迁移要同时评估质量、成本、延迟、参数兼容性和失败处理。

不同类型项目应该怎么迁移

聊天助手和内容生成工具

这类产品最容易被用户感知到语气和格式变化。迁移前要准备典型任务集：标题生成、长文改写、摘要、FAQ、表格输出、JSON 输出、翻译、风格化写作、拒答边界和多轮上下文。每类任务至少保留若干真实样本，比较新旧模型输出是否符合产品定位。

如果你的产品承诺固定格式，例如 WordPress HTML、Markdown 模板、SEO 字段、JSON Schema，迁移后一定要测格式合规率。模型变聪明不等于更听话，格式错误可能直接影响发布链路。

AI Agent 和工具调用系统

Agent 系统迁移风险更高，因为模型不仅生成文本，还会选择工具、组织计划、调用 API、修改文件或触发业务动作。新模型可能更积极，也可能更谨慎。迁移前要回放真实任务轨迹，观察工具调用次数、错误恢复能力、是否越权、是否重复执行、是否正确等待人工确认。

建议把高风险动作放在显式审批后面，例如删除数据、发送外部邮件、改生产配置、退款、权限变更和批量发布。模型迁移期间不要顺手扩大 Agent 权限，先保持动作边界稳定。

代码生成和 Claude Code 工作流

代码类任务需要特别关注回归测试、代码风格、最小修改原则和多文件理解能力。新模型可能在重构上更大胆，也可能给出不同的补丁结构。迁移时要用真实 issue、失败 CI、已有代码库和历史 PR 做评测，而不是只问算法题。

对团队内部的 Claude Code 流程，可以把模型升级和项目规则一起检查：是否仍然遵守 AGENTS.md、是否正确读取测试命令、是否避免修改无关文件、是否能在失败后给出可执行诊断。

RAG 和知识库问答

RAG 系统的风险不只在模型本身，还在检索、引用和拒答策略。新模型可能更擅长整合上下文，但也可能在证据不足时给出更自然的推测。迁移时要重点测：是否引用正确来源、是否能承认资料缺失、是否遵守“只根据文档回答”、是否能处理冲突资料。

迁移清单：从发现旧模型到稳定上线

第一步：做全量模型依赖扫描

先列出所有 Anthropic 模型调用入口，并标出是否使用了 claude-sonnet-4-20250514、claude-opus-4-20250514 或 claude-opus-4-1-20250805。扫描范围包括代码、配置、数据库、Secret、CI/CD、后台任务、客户配置和文档。

输出结果不要只是一串 grep 日志，最好整理成表：服务名、负责人、旧模型、推荐替代、调用量、业务风险、迁移状态、计划上线时间。这样迁移才可追踪。

第二步：选定替代模型和路由策略

官方建议 Sonnet 4 迁移到 Sonnet 4.6，Opus 4 和 Opus 4.1 迁移到 Opus 4.8。实际项目中还可以按任务分层：简单摘要和分类走更快的模型，复杂推理、代码代理和长上下文任务走更强模型。不要把所有任务无差别迁到最贵模型，也不要为了省钱把高风险任务降级到不合适的模型。

第三步：建立迁移评测集

评测集要来自真实业务，而不是临时编造。至少包含成功样本、边界样本、历史失败样本、高价值客户样本和高风险动作样本。每个样本要有预期结果或人工评分标准，例如格式是否合规、事实是否正确、引用是否充分、工具调用是否安全。

第四步：检查参数和 SDK 封装

如果迁移到 Opus 4.8，要检查是否仍然给 temperature、top_p、top_k 设置非默认值。还要确认 SDK 版本、beta header、上下文窗口、缓存策略、工具定义和流式输出处理是否与目标模型兼容。

第五步：灰度上线并设置回滚

不要直接全量切换。可以按内部用户、低风险租户、少量流量、特定任务类型逐步放量。灰度期间同时记录质量反馈、错误率、延迟、成本、重试率、输出截断率和人工接管率。回滚不一定是退回已退休模型，而是切到另一个可用替代模型或临时关闭高风险功能。

最可靠的迁移不是一次性改配置，而是扫描、评测、灰度、监控、回滚五步闭环。

上线验证工作流：建议团队这样执行

建立迁移分支和配置开关

先把模型映射抽到配置层，加入 feature flag 或运行时开关。这样可以在不重新部署全部服务的情况下调整模型路由。对于多租户产品，还可以按租户或任务类型控制放量。

用离线回放做第一轮筛选

把过去一段时间的真实请求脱敏后用于回放，比较旧模型记录、新模型输出和人工评分。注意不要把用户隐私、密钥或敏感业务数据直接写入评测日志。离线回放的目标不是证明新模型完美，而是发现明显不兼容的提示词和任务。

用线上影子流量观察差异

对关键业务可以采用 shadow mode：线上用户仍然使用当前稳定路径，同时把同一请求复制到新模型，结果只记录不返回给用户。这样能看到真实分布下的延迟、失败率和输出特征，但不会影响用户体验。

设置迁移后的监控面板

监控不能只看 HTTP 500。建议增加模型维度的指标：每个模型的请求量、错误码、平均输入输出 token、P95 延迟、超时率、重试率、工具调用失败率、JSON 解析失败率、内容审核触发率和单位任务成本。

准备客户和内部说明

如果你的产品面向企业客户，模型迁移可能涉及合规、安全评审或客户验收。提前说明迁移原因、官方退休日期、替代模型、影响范围、测试方式和回滚策略，通常比故障后解释更容易被接受。

常见错误：这些做法会放大风险

只改环境变量，不跑业务样本

模型迁移最常见的错误，是把它当成基础设施配置变更，而不是产品行为变更。只要模型输出会被用户阅读、被代码执行、被工作流消费，就必须跑业务样本。

忽略后台和低频任务

很多事故发生在低频任务：每周报告、月底账单、批量内容生成、客户导入、历史数据补全、知识库重建。这些任务平时调用少，监控弱，但一旦失败影响范围很大。

没有记录模型版本

如果日志里只记录“调用 Anthropic 成功”，而不记录具体模型名、内部路由别名、提示词版本和工具版本，迁移后很难复盘。模型治理的第一步，是让每次调用可追踪。

把回滚理解成退回旧模型

当旧模型已经退休，回滚不能指望回到旧模型。真正的回滚是切换到另一个仍然可用的替代模型、降低功能范围、暂停高风险动作或启用人工处理。这个策略要在上线前设计好。

对开发者的长期启示：模型也是会退役的依赖

Anthropic 这次下线旧模型提醒开发者：大模型不是永久稳定的黑盒服务，而是会持续升级、弃用、退休、调整参数兼容性和平台能力的外部依赖。工程团队需要像管理数据库、云服务、SDK 和浏览器版本一样管理模型生命周期。

更成熟的做法是建立模型治理机制：模型注册表、调用审计、定期迁移演练、评测集、成本面板、灰度开关、回滚路径和客户沟通模板。这样下一次模型弃用公告出现时，团队不需要临时救火，而是按流程推进。

对开发者来说，Anthropic 下线旧模型的真正含义不是“又要追新模型”，而是“AI 应用进入了依赖治理阶段”。谁能把模型变化纳入工程流程，谁就能在模型快速迭代中保持产品稳定。

FAQ

Anthropic 这次下线了哪些旧模型？

截至 2026 年 6 月 16 日，Anthropic 官方文档显示 claude-sonnet-4-20250514 和 claude-opus-4-20250514 已在 2026 年 6 月 15 日退休。继续请求这些模型会返回错误。

推荐迁移到哪些模型？

官方建议 Claude Sonnet 4 迁移到 Claude Sonnet 4.6，Claude Opus 4 迁移到 Claude Opus 4.8。Claude Opus 4.1 计划在 2026 年 8 月 5 日退休，推荐迁移到 Claude Opus 4.8。

是不是只要改模型名就可以？

不建议这样做。模型迁移会影响输出风格、格式稳定性、工具调用、成本、延迟、参数兼容性和错误处理。至少应该做依赖扫描、评测、灰度和监控。

旧模型退休后请求会怎样？

Anthropic release notes 明确说明，发往已退休 Claude Sonnet 4 和 Claude Opus 4 旧模型的请求现在会返回错误。因此生产系统应尽快移除这些模型名。

Claude Opus 4.1 现在还能用吗？

官方文档显示 Claude Opus 4.1 已在 2026 年 6 月 5 日进入 deprecated 状态，计划在 2026 年 8 月 5 日退休。是否可用应以 Anthropic API 实时状态和账号权限为准，但开发者应立即规划迁移。

迁移到 Opus 4.8 要注意什么参数？

Anthropic 文档提示，Claude Opus 4.7 及之后模型在 temperature、top_p、top_k 设置为非默认值时会返回 400 错误。迁移到 Opus 4.8 时应检查 SDK 和默认参数。

低频任务也需要迁移吗？

需要。低频任务往往更容易遗漏，例如周报、月报、批处理、客户导入、知识库重建和历史数据补全。旧模型名只要还存在，就可能在未来某次任务运行时触发失败。

如何降低下一次模型退役带来的影响？

建立模型注册表、内部别名、调用审计、迁移评测集、灰度开关、监控面板和回滚策略。不要让业务代码到处硬编码供应商模型名。

参考来源

本文事实信息参考 Anthropic 官方 Model deprecations 页面和 Claude API release notes。模型状态、推荐替代和退休日期可能继续变化，正式迁移前请以官方最新文档为准。

工具评测文章

工具选型与提示词资料

适合阅读工具评测、工具推荐、对比测评类文章后继续转化。

工具选型表 按场景、价格、上手难度和核心能力筛选合适的 AI 工具。 查看资料包 提示词模板包 提供写作、运营、编程、图片和视频生成常用提示词模板。 查看资料包