英伟达这一次发布会,其实不仅仅是RTX 50系列,还包括了个人超算、加速物理AI、AI基础模型等各方面的内容。实质上是整个英伟达战略蓝图的分享会,堪称一场盛宴,说是科技春晚也不为过。
先来说直接面向消费者的RTX 50系显卡,这也是大多数人最关注的。
现在显卡主要就看两件事——游戏表现,AI性能。游戏表现自然不必说,显卡从诞生之初就是为了游戏而生。随着AI PC、端侧模型的普及,显卡的AI能力也成为重中之重。
现在显卡的传统光栅性能依然在改进,但幅度并不是指数级提升,通过AI加持才能够使得性能得到飞跃。这次在RTX 50系上就引入诸多的AI特性来强化游戏性能,换而言之用AI来反哺游戏——
- 首发的DLSS4,借助 AI 可为每个渲染帧生成多达三帧以进一步提高帧率。与传统渲染技术相比,性能提升至高可达8倍。
- DLSS 4 引入了Transformer 模型, DLSS 超分辨率和光线重建模型具备 2 倍的参数量和 4 倍的计算量,可提高画面稳定性,减少伪影,增加细节并增强抗锯齿效果。
- 引入NVIDIA RTX 神经网络着色器 (RTX Neural Shaders),将小型 AI 网络融入可编程着色器,为实时游戏带来电影级的材质、光照等。
- NVIDIA ACE 技术,使游戏角色能够像真人玩家一样感知环境、制定计划并付诸行动,例如绝地求生当中的AI队友可以和你进行更加智能的配合。游戏当中的NPC不再是呆若木鸡的“人机”,而是有着自主行为能力的队友。
最吸引人眼球的莫过于这一张图。RTX 5070的游戏帧数表现就能够达到上一代RTX 4090,价格却只有前代的三分之一。
当然了,RTX 5070显存是12G,比起RTX 4090的24GB也只有一半。买了4090的用户也不必担心被背刺。
如果对比同级别的显卡,例如RTX 5090 D对RTX 4090 D那么提升幅度也是巨大的。
RTX 50系的主要规格如下。RTX 5090 D的显存容量从上一代的24GB提升到了32GB,算力也飙升到了2375 AI TOPS。据我所知,不少用户都会使用90系的旗舰卡,训练神经网络。更大的显存可以更加充分利用算力,组更多的batch,加速整个训练流程。
目前产品中国区的定价出了RTX 5090D和RTX 5080,分别是16499和8299。RTX 5070/ti只有海外定价。
笔记本电脑端的RTX 50系列上市会略晚一些。RTX 5090、5080、5070Ti将会在3月上市,RTX 5070则会在4月,届时联想拯救者Y9000P、惠普暗影精灵 Max、Alienware Area-51都会发布。
我个人其实特别关注的是英伟达这次宣布的Project DIGITS。现在谈起AI,动不动就是8卡H100,或者是重达1.2吨的72卡Blackwell机柜。这实际上这使得AI成为了一件距离普通人非常遥远的事情。
但英伟达这次宣布的Project DIGITS,搭载英伟达全新GB10超级芯片,可以把数据中心级别的性能放入身材小巧的NUC当中。
从性能参数来说,1PFLOPS的AI算力,128G的LPDDR5x统一内存,4TB的SSD,可以运行200B参数量的大语言模型。如果两台主机,就可以运行当下高达405B参数量的llama 3。运行DIGITS的功耗也不会太高,普通电源即可使用。
我相信目标客户群体也不仅仅是所谓的开发者、发烧友极客,更可以让每个家庭人手一台,人人都能享受到私有超算和AI红利。
说完了硬件方面,再来看看英伟达给软件方面的AI提供的支持。
英伟达这次为拥有超高算力的RTX AI PC提供了 NIM 微服务和 AI Blueprint服务。NIM服务当中提供了大量的基础模型,方便用户快速调用,从而实现LLM、RAG、计算机视觉、PDF提取等场景的快速应用。
NIM服务集成了来自Meta、Mistral、Black Forest Lab的顶尖模型。同时英伟达还推出了Llama Nemotron的开源模型,基于Llama的优秀模型底座,经过英伟达的微调,在各类Agent任务当中有着不俗的表现。无论是指令遵循、工具调用、聊天和代码方面都更加出色。
在开源社区当中,英伟达的llama Nemotron一直广受好评。英伟达此次开源的模型还针对不同的用途,分为三种大小的模型基底,Nano、Super、Ultra。
AI Blueprint则是一套可以在RTX AI PC上的AI工作流。
AI Blueprint能够提供类似于NotebookLM的功能,让用户能够将PDF文档快速转化为播客。AI Blueprint能够提取文本、图片,快速生成播客脚本,并生成音频。原本枯燥无味的技术文档,可以转化为播客这样的形式,让用户和AI播客主持人对话,详细追问。
AI Blueprint还可以引导用户生成精美的艺术图片,并将这些素材导入到渲染其中生成3D资产,和Blender、ComfyUI无缝衔接。
当然,这场发布会上,老黄其实还讲了更多的伟大蓝图。
例如,老黄化身美国队长,手持晶圆盾牌。Blackwell系统的无处不在。现在我们日常使用的chatGPT、Claude,都是由英伟达的芯片所支持的。
针对AI的发展,老黄总结了Scaling Law的三阶段,从预训练到后训练,再到推理侧的Test time scaling。每个阶段都需要更强的AI算力,来达到更多的智能。
针对当下火热的自动驾驶,英伟达推出的Omniverse系统,提供了从训练、测试到端侧部署的全套解决方案。Thor Blackwell平台,可以同时处理多路视频和雷达信号,从而使得本地端侧的低延时响应成为可能。
而针对下一个阶段的机器人,或者说具身智能,英伟达同样在谋篇布局。未来机器人也将走进千家万户。
总体来说,我想这场CES 2025年的开幕演讲,并不仅仅是RTX 50系列显卡,更像是为下一个十年的智能发展开幕启航。