黄仁勋喊出“推理拐点”,边缘推理的机会窗口打开了吗

上周,纽约时报报道了硅谷一个新风气叫 tokenmaxxing,Meta 和 OpenAI 的工程师在内部搞 token 消耗量排行榜,比谁烧得多。黄仁勋在 GTC 2026 上更激进,提议企业给工程师发 token 预算,作为工资之外的第二份薪酬。 OpenAI 的数据则显示,过去一年企业客户的推理 token 消耗量暴涨了约 320 倍。 需求侧在爆炸,供给侧呢? 黄仁勋在同一场 keynote 上搬出了 Tokenomics 这个概念,把它从加密货币的语境里拎出来,重新定义为 AI 推理的经济学。核心指标叫 Tokens per Watt,衡量每瓦特电力能产出多少 token。他说推理拐点已经到了,NVIDIA 预计 Blackwell 和 Vera Rubin 芯片订单量到 2027 年将达到 1 万亿美元。 国内大模型厂商一直在讲类似的事情,只是换了说法叫“推理成本”或者“token 单价”。不管哪种说法,指向的问题是一样的,当 token 变成 AI 时代的水电煤,谁来建发电厂和电网? 过去三年,行业给出的答案是,建更大的数据中心,塞更多的 GPU。这在...

查看原文 →