– 作者发现使用Claude Code处理大型代码库时遇到性能问题:agent无法直接找到内容时会回退到grep、读取完整文件或启动子代理,这消耗大量token且经常错过相关代码
– 解决方案:结合静态Model2Vec嵌入(使用最新的静态模型potion-code-16M)与BM25算法,通过RRF融合并重新排序
– 性能优势:在1250个查询/文档对的基准测试中,比grep+read使用98%更少的token,达到99%的最优transformer设置检索质量,同时速度提高约200倍

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注