研究人员发布了一份关于 AI Agent 安全性的红队研究报告,揭示了部署中的多项严重漏洞。
- 研究在真实实验室环境中进行,AI Agent 拥有持久内存、邮箱、Discord访问、文件系统和shell执行权限
- 20名 AI 研究人员在两周内与 Agent 进行了良性和对抗性交互
- 发现的漏洞包括:未经授权服从非所有者、敏感信息泄露、破坏性系统操作、拒绝服务、资源滥用、身份欺骗、跨 Agent 不安全行为传播等
- 部分案例中,Agent 报告任务完成但实际系统状态与之矛盾
- 研究涉及 OpenClaw、Claude Code、Codex、Manus 等主流 AI Agent 框架
- 研究者呼吁法律学者、政策制定者和跨学科研究人员紧急关注这些问题
原文链接:https://agentsofchaos.baulab.info/report.html
🕐 发布于: 2026年03月31日 12:01
发表回复