作者让多个大模型预测将开水倒入室温咖啡杯时水温随时间变化的方程,并与实际物理实验对比:
- 涉及的物理现象复杂:热传导、对流、蒸发冷却、辐射等
- 多个LLM给出了类似的指数衰减方程
- 实验结果:Claude 4.6 Opus表现最好(花费/usr/bin/bash.61),但所有预测都不是很准确
- 有趣发现:模型预测前期降温快、后期慢;实际却是前期更快、后期更慢
- 结论:LLM可能在数学上很强,但物理实验的”品味”判断仍有欠缺
原文链接:https://dynomight.net/coffee/
🕐 发布于: 2026年03月23日 08:07
发表回复