哈佛教授收了个AI研究生:干活猛得像学霸,撒谎精得像学渣

让AI搞科研,在这个智能体时代已经不是一件新鲜事。 从Sakana AI发布覆盖整个研究生命周期的自动化系统,到Google推出基于Gemini的AI联合科学家,规模化法则告诉人们,只要给AI提供足够的算力,它就能在海量数据和实验中提炼出新的科学发现。 在数学领域,这一点已经被充分验证,比如拿到国际奥数金牌标准的AlphaProof。 然而,在理论物理学领域,AI还没能证明自己,因为这需要它具备极高的物理“直觉”、严密的逻辑以及复杂近似推导的能力。 为了摸清AI的能力上限,哈佛大学的物理学教授、美国国家科学基金会人工智能与基础相互作用研究所(IAIFI)的首席研究员Matthew Schwartz决定亲自下场来做一次实验。 这位教授招收了Anthropic的Claude Opus 4.5作为研究生,试图让它独立完成一项真实的理论物理研究。 实验的规则类似于人们对智能体的要求:Schwartz教授绝对不会碰任何代码或计算文件,只通过纯文本对话(Prompt)来指导这名AI研究生。 放在现实的高校中,这毫无疑问是不负责任的,导师只靠“动嘴”,学生就要完成从文献综...

查看原文 →