📰 开发者利用 Gemini 2 实现视频秒级语义搜索:支持文字描述定位

开发者基于 Google Gemini Embedding 2 构建了一款名为 SentrySearch 的工具,实现对行车记录仪视频的亚秒级语义搜索。

  • Gemini Embedding 2 原生支持视频嵌入,无需转录或帧标注,直接将视频像素投影到 768 维向量空间
  • 用户可以用自然语言描述(如”红色卡车闯红灯”)直接搜索视频,系统自动返回匹配片段
  • 1 小时视频索引成本约 2.84 美元
  • 自动跳过静止画面减少 API 调用,进一步降低成本
  • 搜索结果可自动裁剪并保存为新视频片段

原文链接:https://github.com/ssrajadh/sentrysearch

🕐 发布于: 2026年03月25日 12:02

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注