地表最强英伟达:下一代Rubin GPU曝光 挺进AI PC市场

“19世纪90年代末,尼古拉·特斯拉发明了AC Generator,而英伟达发明了AI Generator,正创造具有无限可能性的Token,这两者都产生了巨大的市场机会,而AI Generator也将引发一场新的工业革命。”在英伟达CEO黄仁勋昨日在主题为“开启产业革命的全新时代”的演讲中,黄仁勋重申了英伟达AI Generator的重要性。

显然,英伟达有这样的底气和实力。黄仁勋进一步表示,价值3万亿美元的IT行业,即将催生出能够直接服务于100万亿美元产业的创新成果。它不再仅仅是信息存储或数据处理的工具,而是成为AI工厂为每个行业生成智能体,这样的变革以前从未发生过。我们所处的已不仅仅是一个AI时代,而是一个生成式AI引领的新纪元。

在全面梳理了AI历史进程以及英伟达软硬件革新、生态合作以及未来路线之外,黄仁勋还总结,AI的下一步将是物理AI,需要基于物理并理解物理定律的AI,而机器人技术将基于此快速发展,未来将彻底改变人类的生活和工作方式。

打造AI超级工厂 买得越多省得越多

沿着计算历史的脉络,黄伟勋认为,行业发展至今已有60年的历史,但只有两三次重要的技术变革,包括PC、智能手机等,但如今生成式 AI 使人类得以再次见证一次技术变革。

这背后的推进力量来自加速计算和AI。黄仁勋表示,随着数据计算量以指数级增长,CPU的性能扩展难以应对,导致算力通胀。为此英伟达发明了一种创新架构,将GPU与CPU有效结合,并持续架构创新提升加速计算和AI能力。黄仁勋强调了持续创新的高性价比:在短短8年间,英伟达从第一代Pascal到最新Blackwell B100,8年间GPU的算力增长了1000倍,而能耗降低350倍,将原本需要高达1000GWh的能量降低到仅需3GWh,且生成一个token的能耗降至8年前的1/45000。这在PC和数据中心行业都得到了有效印证。

而每一次应用的加速都意味着计算成本的显著降低,100倍的加速可以带来高达97.96%的成本节省。随着英伟达将计算加速从100倍提升至200倍,再飞跃至1000倍,计算的边际成本持续下降。在过去十年间,英伟达利用特定算法将计算的边际成本降低了惊人的100万倍,这让大模型训练成为可行,并引发全行业的变革。

在这一过程中,黄仁勋还强调了软件在实施加速计算中的重要作用。“要实现加速计算,软件必须进行全面重写,这也是整个过程中最具挑战性的。”黄仁勋表示,“英伟达通过在CUDA持续着力,目前拥有超过350个软件库,包括uDNN深度学习库、计算光刻平台Coolitho、基因测序库Pair of Bricks等,成为生态系统的关键组成部分,使得加速计算得以广泛应用。”

黄仁勋还提到,CUDA在全球拥有500万开发者,覆盖医疗保健、金融服务、计算机行业、汽车行业等领域,并吸引了OEM和云服务提供商,从而创造了巨大的机遇。CUDA已实现良性的发展循环,能够在运算基础不断增长的情况下,扩大生态系统,令成本不断下降,进一步推动更多应用的加速发展。

迎接AI时代“泼天的富贵”,还在于英伟达已不再是一个芯片供应商,而是一个难以望其项背的平台供应商。通过在NVlink、Infiniband以及以太网领域的持续着力,英伟达已推出包括配置8款Blackwell芯片的DGX系统,其采用空气冷却技术,可兼容X86,并已应用于已发货的服务器中。此外还有采用液体冷却技术的全新系统MGX,共有九个节点72个GPU,从而构成了一个庞大的计算集群,也带来了成本和效益的全面提升。

黄仁勋对比了一组数据,相较于上一代的8个GPU,性能提升9倍,同时带宽增加了18倍,AI FLOPS(每秒浮点运算次数)提升了45倍,而功率仅增加了10倍。“一个价值十亿美元的数据中心,在添加价值5亿美元的GPU后,将转变为一个强大的AI工厂,如今这种变革正在全球发生,而节省的费用是实实在在的!”黄仁勋“买得越多、省得越多”的生意经看起来仍将通行无阻。

完整的AI超算技术栈,让英伟达深厚的护城河愈加牢固:NVLink已进阶到第五代,InfiniBand已广泛使用并且增长迅速。为适应众多企业的以太网生态,英伟达推出了Spectrum X,通过网络级RDMA、阻塞控制、适应性路由、噪声隔离,将以太网改造成了适合GPU之间点对点通信的网络,成功地为AI工厂提供了高性能、低延迟的网络解决方案。Spectrum-X800提供每秒51.2 TB的速度和256路径(radix)的支持,为数万个GPU而设计,一年后推出的X800 Ultra将支持高达512路径的512 radix,进一步提升了网络容量和性能,为数十万个GPU而设计;再下一代的X1600则可扩展至数百万个GPU。

对此黄仁勋强调,随着全技术栈的不断进步,数百万个GPU的数据中心时代已经指日可待。

一年升级一代 将一切推向技术极限

“随着数据生成的增长,对计算能力的需求也将相应增加。我们即将迈入一个新时代,在这个时代中,人工智能将能够学习物理定律,理解并基于物理世界的数据进行决策和行动。”黄仁勋预计,AI模型将继续扩大,对GPU性能的要求也将越来越高。

因而,英伟达也在持续发力下一代产品路线。在3月的GTC2024大会重磅发布Blackwell之后,黄仁勋在此次演讲中宣布Blackwell现已开始投产,预计将于2024年晚些时候正式发货,而下一代Blackwell Ultra GPU将于2025年推出。

不止如此,再下一代AI平台名为“Rubin”,将于2026年发布,Rubin架构将首次支持8层HBM4高带宽存储。随后在2027年,将推出Rubin Ultra GPU,将集成12颗HBM4版本。据悉,Rubin平台的其他突出特性还包括高达3600 GB/s的新一代NVLink 6 Switch,以及高达1600 GB/s的CX9 SuperNIC组件。据外媒介绍,Rubin GPU将采用4x光罩设计,并将使用台积电3nm制程,以及CoWoS-L封装技术。

我们知道英伟达的每一代GPU都会以科学家名字来命名。这次也不例外,即将推出的最先进的Rubin GPU是以维拉·弗洛伦斯·库珀·鲁宾(Vera Florence Cooper Rubin)的名字命名,他是一位开创性的天文学家,他证实了暗物质的存在。

同时,英伟达也展示了代号“Vera”强大的新CPU,将与Rubin GPU同时推出,将组成Vera Rubin超级芯片,取代当前的Grace Hopper。

黄仁勋着重说,英伟达将以“一年一代”的节奏推出新的AI芯片,目前这些芯片都处于100%的全面开发阶段。无论采用何种工艺、封装、内存、光学技术等等,英伟达将一切推向技术极限,所有芯片都100%兼容,丰富的软件也将持续扩容。且不仅仅是GPU,而是构建整个平台,将整个平台集成到AI超级工厂中,以一年一个的节奏构建数据中心规模。

摩根大通研报指出,英伟达预计第二财季保持增长,主要得益于客户对AI/加速计算计划的持续支出,以及对其Hopper H100和新H200 GPU平台(Blackwell GB200/B200/B100)的强劲需求。预计Blackwell相关新品在第三财季初步生产出货,并在第四财季实现大规模出货。

染指AI PC市场 加码Arm CPU开发

在英伟达的AI工厂蓝图中,英伟达推出的加速计算推理的新型软件——NIM不可或缺。

据介绍,这一容器中有大量的软件,包括用于推理服务的Triton推理服务器、优化的AI模型、云原生堆栈等等。黄仁勋介绍,全球2800万开发者都可下载NIM到自己的数据中心,托管使用,在几分钟内就可轻松构建生成式AI应用程序。与此同时,NIM还支持Meta Llama 3-8B,可以在加速基础设施上生成多达3倍的token。这样一来企业可使用相同的计算资源,生成更多的响应。

而基于NIM打造的各类应用,也将迸发涌现,包括数字人、数字孪生等等。黄仁勋认为,未来更希望以更人性化的方式——即数字人,来进行互动。“数字人不仅具有成为出色交互式代理的潜力,它们还更加吸引人,并可能展现出更高的同理心。”

黄仁勋认为,PC将成为数字人主要载体。在演讲中,黄仁勋披露了英伟达进军AI PC的企图心。黄仁勋强调,英伟达在每一个RTX GPU中安装了张量核心处理器,目前全球已有1亿台GeForce RTX AI PC投入使用,未来将达到2亿台。

在本次 Computex 2024展会上,英伟达将展示四款新的令人惊叹的笔记本电脑。黄仁勋表示,“它们都能够运行AI,运行由AI增强的应用程序,未来的PC将不断提供多种多样的AI增强,成为非常重要的AI平台。”

英伟达此举大有深意。一方面,AI PC市场将成为AI芯片新的驱动力。据Gartner最新发布的预测报告显示,2023 年全球AI芯片销售收入为536亿美元,2024年将同比增长33%至710亿美元,来自 AI PC、汽车和其他通用计算机设备的AI芯片收入将达334亿美元。AI PC将会引领2024年以后的AI芯片收入增长,预测2026年AI PC渗透率将达100%。

另一方面,以英伟达在云端AI领域的统治地位,面对生成式AI开始从云端进入到边缘端的趋势,英伟达凭借其强大的GPU能力、近年来在自研Grace Arm CPU上积累的经验以及与产业链多年来的深度合作,有望在AI PC市场创造新的市场空间。

有传言称,英伟达着手将推出将下一代 Arm Cortex CPU内核与其Blackwell GPU内核相结合的芯片,主要面向Windows on Arm的AI PC领域。

如今的英伟达四面出击高歌猛进,也为国内GPU厂商的整合敲响了警钟。有专家指出,英伟达不断加快步伐,突破极限。凭借250亿美元的银行存款和今年预计超过1000亿美元的收入,以及可能再有500亿美元的银行存款,它有能力突破新的极限,引领行业走向未来。而如果国内继续一盘散沙的话,只会越差越远。


夕夕海 » 地表最强英伟达:下一代Rubin GPU曝光 挺进AI PC市场

发表回复