#人工智能 Claude Opus 4.6 和 Claude Code 质量显著下降引起诸多用户和开发者不满,Anthropic 被指调整 Claude Code 模型努力程度减少算力消耗。AMD AI 总监和微软 AI 研究员也都吐槽 Claude Code 现在已经无法用于复杂工作流程,即便将努力程度调整到最高也仍然出现指令忽略和重复错误。查看详情:https://ourl.co/112670
美国财富杂志日前发布专门文章报道 Claude Code 近期遭遇的性能下降问题,目前有不少开发者和重度用户在社交网站、GitHub 和 Reddit 论坛表达不满,质疑模型变笨以及指令遵循能力下降等。
部分开发者认为发生这种情况的根本原因是 AI 算力紧张,所以 Anthropic 故意将面向非企业的订阅用户模型质量下调,目的是减少用户在执行任务时的 tokens 消耗。
性能下滑的具体表现:
目前开发者反馈的问题集中在 Claude Opus 4.6 模型和 Claude Code 编码工具在复杂工作流中的表现明显退化,包括无法严格遵循指令、倾向于采用不恰当的快捷方式、在多步骤任务中出错增多、过早停止任务或者反复询问不必要的许可。
这导致原本以研究优先方式处理任务的模型转向编辑优先,进而导致模型在上下文阅读方面不足、错误率上升,更频繁地需要用户进行人为干预修正模型的执行方向。
AMD AI 高级总监斯特拉・劳伦佐 (Stella Laurenzo) 在 GitHub 上发布详细分析称,这些变化让 Claude 已经无法用于复杂的工程任务,斯特拉通过数据对比发现,模型思考程度显著下降,代码阅读和修改能力恶化,API 重试次数也明显增加。
微软研究院 AI 前沿实验室首席研究员迪米特里斯・帕帕伊利奥普洛斯 (Dimitris Papailiopoulos) 称,最近两周使用 Claude Code 时体验极差,即使将努力程度调整到最高,模型仍然出现指令忽略和重复错误。
Claude Code 开发团队回应:
Claude Code 团队主管鲍里斯・切尔尼 (Boris Cherny) 发布回应称,近期确实有调整来减少 tokens 的消耗,也就是将努力程度从较高水平下调到中等水平,目的是减少每个请求的 tokens 数量,从而降低整体的算力消耗。
鲍里斯称这次调整主要是解决用户反馈的配额消耗太快的问题,在 2 月初 Claude Opus 4.6 引入自适应思考,允许模型自主决定推理深度;3 月初推理程度被设置为中等。
鲍里斯还强调这次调整已经通过界面弹窗提醒用户,并非故意降低模型能力,不过很多开发者认为通知不够醒目,这些变更也严重缺乏透明度。
而 Anthropic 还计划测试对 Claude Teams 和 Claude Enterprise 默认启用高程度努力,也就是这些订阅用户将获得更高的推理程度,这会增加 tokens 的消耗并且可能会增加延迟时间。
说到变更透明度,早前蓝点网提到 Claude Code 从 1 月~3 月多次调整缓存生存时间 (TTL),这些调整同样没有公开说明,而更短的 TTL 会导致 tokens 消耗增加,这会让用户更快把配额消耗掉。
是否是降低成本准备上市的原因?
目前已经有消息称 Anthropic 正在秘密计划 IPO,如果要准备上市的话那肯定得把财务报表做得更好看,所以一方面就是提高收入,另一方面就是降低成本。
财富杂志称,用户不满与透明度争议的背后,是 Anthropic 算力紧缺的问题所在,这导致 Claude 快速扩展但无法提供足够的算力支撑,如果 Anthropic 无法妥善解决此类问题,可能会导致更多用户转向竞争对手。
