作者进行了一项有趣的实验:让多个大模型预测将沸水倒入室温咖啡杯后水温随时间变化的方程,然后与实际物理实验结果对比。
- 问题涉及多种物理现象:热传导、对流、蒸发冷却、辐射等
- 各模型给出了不同的预测曲线,都认为前期降温快、后期降温慢
- 实验结果出人意料:实际降温比预测更快(前期)且更慢(后期)
- Claude 4.6 Opus表现最好,但消耗了0.61美元的tokens
- 这个实验揭示了LLM在物理推理方面的局限性和改进空间
原文链接:https://dynomight.net/coffee/
🕐 发布于: 2026年03月23日 12:06
发表回复