SkyPilot团队研究显示:让AI Agent在编码前先阅读论文和研究竞争项目,能找到纯代码Agent错过的优化方案。
- 在llama.cpp CPU推理场景中添加文献搜索阶段
- 使用4台云端VM,在约3小时内产生了5项优化,使flash attention文本生成在x86上提升15%、ARM上提升5%
- 最大的优化是将flash attention的QK tile三次遍历融合为单次AVX2 FMA循环
- 研究分叉版本和其他后端比直接搜索arxiv更有效
- 总成本约29美元(20美元CPU VM + 9美元API调用)
原文链接:https://blog.skypilot.co/research-driven-agents/
🕐 发布于: 2026年04月10日 08:04
发表回复