微软和AMD研究员都在吐槽Claude Code质量下降疑似是为了节省tokens

#人工智能 Claude Opus 4.6 和 Claude Code 质量显著下降引起诸多用户和开发者不满，Anthropic 被指调整 Claude Code 模型努力程度减少算力消耗。AMD AI 总监和微软 AI 研究员也都吐槽 Claude Code 现在已经无法用于复杂工作流程，即便将努力程度调整到最高也仍然出现指令忽略和重复错误。查看详情：https://ourl.co/112670

美国财富杂志日前发布专门文章报道 Claude Code 近期遭遇的性能下降问题，目前有不少开发者和重度用户在社交网站、GitHub 和 Reddit 论坛表达不满，质疑模型变笨以及指令遵循能力下降等。

部分开发者认为发生这种情况的根本原因是 AI 算力紧张，所以 Anthropic 故意将面向非企业的订阅用户模型质量下调，目的是减少用户在执行任务时的 tokens 消耗。

性能下滑的具体表现：

目前开发者反馈的问题集中在 Claude Opus 4.6 模型和 Claude Code 编码工具在复杂工作流中的表现明显退化，包括无法严格遵循指令、倾向于采用不恰当的快捷方式、在多步骤任务中出错增多、过早停止任务或者反复询问不必要的许可。

这导致原本以研究优先方式处理任务的模型转向编辑优先，进而导致模型在上下文阅读方面不足、错误率上升，更频繁地需要用户进行人为干预修正模型的执行方向。

AMD AI 高级总监斯特拉・劳伦佐 (Stella Laurenzo) 在 GitHub 上发布详细分析称，这些变化让 Claude 已经无法用于复杂的工程任务，斯特拉通过数据对比发现，模型思考程度显著下降，代码阅读和修改能力恶化，API 重试次数也明显增加。

微软研究院 AI 前沿实验室首席研究员迪米特里斯・帕帕伊利奥普洛斯 (Dimitris Papailiopoulos) 称，最近两周使用 Claude Code 时体验极差，即使将努力程度调整到最高，模型仍然出现指令忽略和重复错误。

Claude Code 开发团队回应：

Claude Code 团队主管鲍里斯・切尔尼 (Boris Cherny) 发布回应称，近期确实有调整来减少 tokens 的消耗，也就是将努力程度从较高水平下调到中等水平，目的是减少每个请求的 tokens 数量，从而降低整体的算力消耗。

鲍里斯称这次调整主要是解决用户反馈的配额消耗太快的问题，在 2 月初 Claude Opus 4.6 引入自适应思考，允许模型自主决定推理深度；3 月初推理程度被设置为中等。

鲍里斯还强调这次调整已经通过界面弹窗提醒用户，并非故意降低模型能力，不过很多开发者认为通知不够醒目，这些变更也严重缺乏透明度。

而 Anthropic 还计划测试对 Claude Teams 和 Claude Enterprise 默认启用高程度努力，也就是这些订阅用户将获得更高的推理程度，这会增加 tokens 的消耗并且可能会增加延迟时间。

说到变更透明度，早前蓝点网提到 Claude Code 从 1 月～3 月多次调整缓存生存时间 (TTL)，这些调整同样没有公开说明，而更短的 TTL 会导致 tokens 消耗增加，这会让用户更快把配额消耗掉。

是否是降低成本准备上市的原因？

目前已经有消息称 Anthropic 正在秘密计划 IPO，如果要准备上市的话那肯定得把财务报表做得更好看，所以一方面就是提高收入，另一方面就是降低成本。

财富杂志称，用户不满与透明度争议的背后，是 Anthropic 算力紧缺的问题所在，这导致 Claude 快速扩展但无法提供足够的算力支撑，如果 Anthropic 无法妥善解决此类问题，可能会导致更多用户转向竞争对手。