开发者反映Claude Code在二月份更新后出现严重质量下降。具体表现为:忽略用户指令、声称完成但实际未完成、做出与请求相反的行为等。
- 用户数据分析显示,思维内容审查(redact-thinking-2026-02-12)与复杂工程工作流中的质量回归精确相关
- 模型从每6.6次阅读才进行1次编辑,变为每2.0次阅读就进行1次编辑,研究行为减少70%
- 扩展思维(extended thinking)tokens对于多步研究、约定遵守和仔细修改代码至关重要
- 深度思考减少后,模型默认选择最cheap的行动:编辑前不阅读、没完成就停止、回避责任
原文链接:https://github.com/anthropics/claude-code/issues/42796
🕐 发布于: 2026年04月07日 12:01
发表回复