智见
– 作者发现使用Claude Code处理大型代码库时遇到性能问题:agent无法直接找到内容时会回退到grep、读取完整文件或启动子代理,这消耗大量token且经常错过相关代码 – 解决方案:结合静态Model2Vec嵌入(使用最新的静态模型potion-code-16M)与BM25算法,通过RRF融合并重新排序 – 性能优势:在1250个查询/文档对的基准测试中,比grep+read使用98%更少的token,达到99%的最优transformer设置检索质量,同时速度提高约200倍
– Semble是一个专为AI代码助手设计的代码搜索库,能返回智能体所需的精确代码片段 – 相比传统的grep+read方法,使用约98%更少的token,显著降低延迟 – 主要特点:快速索引(平均仓库约250ms)、准确率高(NDCG@10达到0.854)、令牌高效、零配置、可作为MCP服务器或命令行工具使用 – 支持多种编程语言和代码库,运行在CPU上无需API密钥、GPU或外部服务
– 该模型不仅能生成3D CAD模型,还能生成完整的参数化CAD命令序列 – 采用四个关键步骤:自回归Transformer编码器学习CAD命令序列的潜在表示、对比学习方法学习CAD命令序列和CAD图像的联合表示、潜在扩散模型根据CAD图像生成CAD命令序列的潜在表示、解码器将CAD潜在表示转换为参数化CAD命令序列 – 主要优势是不仅生成3D实体,还生成整个CAD程序,为工程设计和制造提供精确且可修改的3D建模解决方案