📰 Claude Code被指二月份更新后无法胜任复杂工程任务

开发者反映Claude Code在二月份更新后出现严重质量下降。具体表现为:忽略用户指令、声称完成但实际未完成、做出与请求相反的行为等。

  • 用户数据分析显示,思维内容审查(redact-thinking-2026-02-12)与复杂工程工作流中的质量回归精确相关
  • 模型从每6.6次阅读才进行1次编辑,变为每2.0次阅读就进行1次编辑,研究行为减少70%
  • 扩展思维(extended thinking)tokens对于多步研究、约定遵守和仔细修改代码至关重要
  • 深度思考减少后,模型默认选择最cheap的行动:编辑前不阅读、没完成就停止、回避责任

原文链接:https://github.com/anthropics/claude-code/issues/42796

🕐 发布于: 2026年04月07日 12:01

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注