IT之家 3 月 17 日消息,今天(3 月 17 日)在美国加州圣何塞举行的 2026 年 GTC 大会上,英伟达针对智能体 AI(Agentic AI)的长上下文推理,发布 BlueField-4 STX 模块化存储参考架构。IT之家援引博文介绍,传统数据中心提供大容量通用存储,但缺乏快速响应能力,无法支持 AI 智能体跨步骤、跨工具的无缝交互。随着上下文信息的增加,传统存储路径会严重拖慢 AI 推理速度,并导致 GPU 利用率大幅降低。STX 架构为解决这一痛点,让存储节点更靠近计算资源并实现规模化访问,促使智能体 AI 工厂在推理、训练和分析环节实现更高的吞吐量与响应速度。其首个机架级部署方案集成了全新的 NVIDIA CMX 上下文内存存储平台。该平台通过高性能上下文层扩展了 GPU 内存,与传统通用存储设备相比,其每秒处理的 Token 数量提升了高达 5 倍。STX 架构基于英伟达 Vera Rubin 平台打造,其核心搭载了专为存储优化的 BlueField-4 处理器(内部集成 Vera CPU 与 ConnectX-9 超级网卡),并协同 Spectrum-X 以太...
