📰 Gemma 4 多模态微调工具发布:可在 Apple Silicon 上训练图像和音频模型

开源项目 gemma-tuner-multimodal 发布,允许用户在 Mac 上对 Google Gemma 4/3n 模型进行文本、图像和音频的微调。

  • 唯一在 Apple Silicon (MPS) 上原生支持音频+文本微调的工具
  • 支持从 GCS 或 BigQuery 流式传输数据,无需将 TB 级数据拷贝到本地
  • 无需 NVIDIA GPU,普通 Mac 即可完成训练
  • 适用于特定领域的语音识别、图像标注、文档理解、低资源语言适配等场景
  • 数据全程保留在本地设备上,确保隐私安全

原文链接:https://github.com/mattmireles/gemma-tuner-multimodal

🕐 发布于: 2026年04月08日 08:04

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注