“记住,英伟达是一家加速计算公司,而不是一家 GPU 公司! ” 前几天举起“token 之王”奖牌的黄仁勋,在最近的一次采访中这样强调。 在他看来,目前的 AI 竞赛,已经从拼算力变成拼产出,问题不再只是“算得有多快”,而是:能否迅速、便宜地做出高质量结果。 这样看来,虽然 GPU 本质也算加速计算,但显然它只“计算”这一环是远远不够的,现在 AI 的新挑战,早已外溢到数据搬运、内存、网络和推理流程。整条链路都必须一起提速。 这就像木桶效应,只要链路里有一环慢,最终的产出就会被卡住。 该示意图由 AI 生成 那最终的“产出”如何衡量? 一个简单直接的方式就是看 token,这个 AI 时代的“产出单位”。 黄仁勋直言道,你可以把 token 看作 AI 时代的核心货币,token 越聪明,你就能卖得越贵。 当然,这实际上并不是指 token 本身“聪明”,毕竟其本质只是文本单位,真正“聪明”的是生成这个 token 的模型。 如果一个模型用更少的 token,就能一次性给出更准确、更有用的结果,那这些 token 的“价值”就更高。 ...
