在UniClaw的AI模型评测中,StepFun 3.5 Flash在300场实战测试中获得最高性价比评价。该模型仅有110亿参数,却能在实际任务中取得与大型模型相当的分数。
- 评测基于真实AI任务,包括租房搜索、文件整理等复杂场景
- 虽然价格最低,但得分却常常超越同价位的竞争对手如Kimi
- 有用户指出该模型存在”幻觉”问题,会编造不存在的房源信息
- 讨论认为这证明了低价模型同样可以在实际应用中发挥作用
原文链接:https://app.uniclaw.ai/arena?tab=costEffectiveness&via=hn
🕐 发布于: 2026年04月02日 18:02
发表回复