OpenAI新模型Day0就被嫌弃，排名拉垮，不如一月底发布的国产模型

作者 · 量子位来源 · 36kr浏览 · 5次2026-03-18

OpenAI刚推出的GPT-5.4 mini，Day0就已经被嫌弃了。根据公开的大语言模型评测基准Vals，今天新出的GPT-5.4 mini仅排行第13名，优于OpenAI半年前发布的GPT-5。值得一提的是，排行第12的是一月底出的的Kimi 2.5，而Kimi 2.5比新出的5.4mini便宜一倍多，延迟还更低。在同步的拓扑证明中，新出的mini和nano模型在全球范围内表现也只是中规中矩，分别排行第九第十，不如早前发布的Kimi、Qwen、DeepSeek等模型。（OpenAI后来居下这一块）还有人指出，这次GPT‑5.4 mini的baseline对比的是老GPT‑5 mini（运行速度快两倍），也就是大半年前的版本，而不是其他厂家的新模型。不少网友甚至直言，换新GPT‑5.4 mini“还真没必要”。虽然OpenAI的博客表示，在输出tokens 上，性能近似的mini版本比GPT‑5.4便宜三倍，nano版本则几乎便宜十二倍。但如果你拿GPT‑5.4 mini与旧版GPT‑5 mini对比，会发现同为...