ARC-AGI-3是一个交互式推理基准测试,旨在挑战AI代理在新环境中探索、即时获取目标、建立适应性世界模型并持续学习的能力。获得100%分数意味着AI代理能够像人类一样高效地完成每个任务。与静态谜题不同,代理必须在每个环境中通过经验学习——感知重要内容、选择行动并适应策略,而非依赖自然语言指令。该基准测试通过随时间测试智能来缩小AI与人类学习之间的差距,捕捉规划视野、记忆压缩和根据新证据更新信念的能力。设计原则包括:人类易于快速上手、无预加载知识或隐藏提示、清晰目标与有意义反馈、防止暴力记忆的新颖性。
原文链接:https://arcprize.org/arc-agi/3
🕐 发布于: 2026年03月26日 12:05
发表回复