英伟达Vera CPU交付首批客户,甲骨文承诺部署数十万颗

英伟达首款专为智能体AI设计的CPU Vera已完成首批交付,甲骨文计划从2026年开始部署数十万颗。Vera搭载88个Olympus核心,单核性能较前代Grace提升50%,内存带宽1.2 TB/s,支持FP8精度。该CPU还将作为Vera Rubin超级芯片平台的主机处理器,推动英伟达向全栈AI计算平台转型。

英伟达首款专为智能体AI(Agentic AI)设计的CPU——Vera,已完成对Anthropic、OpenAI、SpaceX AI及甲骨文云(Oracle Cloud)的首批交付。英伟达创始人兼CEO黄仁勋在本届GTC大会上将其定位为公司“下一个数十亿美元级业务”。

专为智能体AI优化的CPU架构

与传统CPU追求核心数量最大化的设计思路不同,Vera架构专为高吞吐推理、工具调用及代码生成优化。该处理器搭载88颗英伟达自研的奥林巴斯(Olympus)核心,满载下单核性能较前代Grace提升50%,内存带宽达到1.2 TB/s。同时支持FP8精度,可直接承接AI推理与强化学习任务,无需GPU中转数据,从而提升AI流水线的整体效率。

黄仁勋曾指出,当企业坐拥价值500亿美元的GPU时,绝不能让它们因CPU处理速度慢而闲置。Vera存在的意义在于,当AI智能体需要同时处理规划任务、检索长上下文或调用API时,以极致的单线程性能和能效,确保昂贵的GPU满负荷运转。

英伟达Vera CPU产品图
英伟达Vera CPU产品图

甲骨文云大规模部署计划

甲骨文产品管理负责人卡兰·巴塔透露,甲骨文云基础设施(OCI)计划从2026年开始部署数十万颗英伟达Vera CPU。他指出,智能体AI需要在规模下维持持续性能,Vera的架构专为高吞吐推理设计,这正是为下一代企业AI提供动力所需的效率。

从独立CPU到超级芯片平台

Vera不仅是独立的CPU产品,更将成为即将发布的Vera Rubin超级芯片平台的主机处理器。通过NVLink-C2C与两颗Rubin GPU配对,形成统一内存架构,以更高能效为AI工厂供能。这种“CPU+GPU”异构协同的全栈AI算力方案,正在推动英伟达从单一GPU厂商向全栈AI计算平台提供商转型。英伟达表示,Vera的高速核心与互连设计能够以传统基础设施两倍的能效,完成向GPU馈送数据所需的调度、控制与数据搬移工作。

本文参考来源:快科技

发表回复