OpenAI新模型Day0就被嫌弃,排名拉垮,不如一月底发布的国产模型

OpenAI刚推出的GPT-5.4 mini,Day0就已经被嫌弃了。 根据公开的大语言模型评测基准Vals,今天新出的GPT-5.4 mini仅排行第13名,优于OpenAI半年前发布的GPT-5。 值得一提的是,排行第12的是一月底出的的Kimi 2.5,而Kimi 2.5比新出的5.4mini便宜一倍多,延迟还更低。 在同步的拓扑证明中,新出的mini和nano模型在全球范围内表现也只是中规中矩,分别排行第九第十,不如早前发布的Kimi、Qwen、DeepSeek等模型。 (OpenAI后来居下这一块) 还有人指出,这次GPT‑5.4 mini的baseline对比的是老GPT‑5 mini(运行速度快两倍),也就是大半年前的版本,而不是其他厂家的新模型。 不少网友甚至直言,换新GPT‑5.4 mini“还真没必要”。 虽然OpenAI的博客表示,在输出tokens 上,性能近似的mini版本比GPT‑5.4便宜三倍,nano版本则几乎便宜十二倍。 但如果你拿GPT‑5.4 mini与旧版GPT‑5 mini对比,会发现同为...

查看原文 →