📰 StepFun 3.5 Flash成OpenClaw任务性价比之王

在UniClaw的AI模型评测中,StepFun 3.5 Flash在300场实战测试中获得最高性价比评价。该模型仅有110亿参数,却能在实际任务中取得与大型模型相当的分数。

  • 评测基于真实AI任务,包括租房搜索、文件整理等复杂场景
  • 虽然价格最低,但得分却常常超越同价位的竞争对手如Kimi
  • 有用户指出该模型存在”幻觉”问题,会编造不存在的房源信息
  • 讨论认为这证明了低价模型同样可以在实际应用中发挥作用

原文链接:https://app.uniclaw.ai/arena?tab=costEffectiveness&via=hn

🕐 发布于: 2026年04月02日 18:02

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注