NVIDIA 发布 SemiAnalysis InferenceX 性能数据,显示其 Blackwell Ultra 平台(GB300 NVL72)相比 Hopper 平台,每兆瓦吞吐量提升高达 50 倍,每 token 成本降低 35 倍。此前 Blackwell 平台已被多家推理提供商采用,将每 token 成本降低 10 倍。
AI 代理和编码助手推动编程相关查询占比从去年的 11% 增长至约 50%。NVIDIA 通过芯片、系统架构和软件的协同优化,在低延迟和长上下文场景中实现突破,尤其适用于多步骤工作流的智能体应用。
看英文原文 →