SkyPilot团队展示了让AI Agent在写代码前先读论文和研究竞争项目的好处:
- 在llama.cpp上添加文献搜索阶段,使用4台云虚拟机
- 约3小时内产生5项优化,使flash attention文本生成在x86上+15%、ARM上+5%更快
- 最大优化:将flash attention的QK tile三次遍历融合为单一AVX2 FMA循环
- 研究fork和其他后端比搜索arxiv更有成效
- 总成本约29美元(20美元CPU虚拟机 + 9美元API调用)
原文链接:https://blog.skypilot.co/research-driven-agents/
🕐 发布于: 2026年04月10日 12:01
发表回复