点名表扬中国车企,回应RTX 5090的超高定价,承认AI PC人才不足□□□、需求尚未爆发,提出三大Scaling Law将共存的观点
英伟达本次发布的RTX 5090旗舰产品与次旗舰在价格□□□、性能上有显著差异,黄仁勋称这一选择是是为了满足极致发烧友的需求,而入门级产品较低的显存配置是为了和其算力平衡。现场有记者试图套线系列的细节,但他称自己无可奉告。
近期,Sca㊣ling Law终结和变化的讨论依旧持续,黄仁勋认为未来一段时间里,三大Scaling Law将会共存,即算力的提升□□、测试时计算和推理过程中的数据反哺,自己没有看到AI发展的物理瓶颈。
尽管英伟达市值已站稳3万亿美元大关,但黄仁勋展现出极为克制□□□□、精简□□□□、专注的发展策略。英伟达不会涉足电力等算力基建,近期没有新的收购计划,不过多涉足计算层和库层,也不打算直接服务企业,将集中精力去做那些只有英伟达才能做成的产品,最新的Digits个人超算□□、NVLink 72都是此类产品的代表。
AI PC领域发布不断,但销量还未完全起飞。黄仁勋认为设计师□□□□、开发者等群体的AI PC需求真实存在,他们将通过WSL2这一虚拟平台将云端的AI技术带到PC之中。
物理AI是老黄眼中的重要趋势之一,它将帮助AI理解世界,但我们至今仍然缺少一个物理世界的基础模型,英伟达希望通过Cosmos催生GPT-3级别的物理模型,这对机器人和智能驾驶的落地有重大意义。
Agent是AWS□□、微软等企业押注的重点,英伟达也推出了面向企业的agent蓝图,但老黄称英伟达不会与这些企业直接竞争,主要是为企业agent开发提供基础和帮助。
以下是对黄仁勋本次采访的完整编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改):
1□□、记者:首先恭喜你们。这是很棒的一年。你们仍然领先业界至少两年。去年你们为计算机定义了新的一年,也就是数据中心。我完全同意。你必✅须从建设工作开始,再往后发展。现在你们已经完成了整个系统的工作,包括GB200 NVL72。是不是该让英伟达开始考虑基础设施□□□□、电力和系统中的其他部分了?
黄仁勋:英伟达的规则是只做别人没做的事,或者我们能做得明显更好的事。所以我们开始做事的标准其实很高。这就是为什么我们实际上不算是一家老牌企业。我们之所以做我们做的事,是因为如果我们不去造NVL72,谁会去造呢?谁有能力制造?如果我们不制造Spectrum X这类交换机,谁能做呢?
我们虽然有32000人,还仍然是相对较小的公司,我们仍然是一家小公司,需要确保我们的资源高度集中在我们能做出独献的领域。
2□□、记者:去年在GDC大会上,你分享了你们在以色列增加投资和活动的情况。加强了你们作为该国最大雇主之一的地位。你们在2024年继续扩张,收购了两家以色列公司。你们打算如何进一步增加在以色列的投资?具体来说,我们很快会听到一个正在进行中的新交易吗?
黄仁勋:我们在全球范围内吸引优秀人才。目前收到了超过一百万份简历申请,公司在以色列的员工已达到近5000人。我们已成为以色列发展最快的企业雇主之一,这让我感到非常骄傲。
即使在当前局势紧张的情况下,我们的以色列团队依然展现出卓越的表现。他们始终保持专注,交出了令人惊叹的成绩单。仅在过去七周内,团队就成功开发出了Spect㊣rum X和Bluefield 3等重要产品。我为他们的专业能力和敬业精神深感自豪。
3□□□□、记者:你们昨晚发布了很多关于AI PC的消息。这些产品的销量今年还没有真正起飞。你认为英伟达能帮助改变这种状况,推动这些产品的采用吗?是什么阻碍了它们的发展?
黄仁勋:这是一个很好的问题。AI技术最初是在云端环境下发展起来的。如果回顾英伟达过去几年的增长轨迹,你会发现主要集中在云计算领域,这是因为训练AI模型需要强大的超级计算机。这些模型规模庞大,在云端部署和通过API调用是很容易的。
我们认为,仍然有设计师□□□、软件工程师□□、创意人员和爱好者喜欢使用PC来开发这些东西。当然,其中一个挑战是,由于AI在云端,而且云端投入了大量精力和工程开发,开发AI PC的人很少。
不过,我们也注意到有大✅量的设计㊣师□□□、软件工程师□□□□、创意人员和技术爱好者,他们更倾向于在PC上进行AI开发工✅作。其中✅一个挑战在于,由于AI生态系统主要集中在云端,加上云服务提供商投入了大量资源进行开发,导致端侧AI开发的人才相对较少。
但令人欣喜的是,Windows PC完全有能力支持AI开发。特别是通过WSL2(Windows Subsystem for Linux 2)这个强大的虚拟化平台,我们可以将原本为云端打造的AI技术引入到PC中。我们正在努力确保PC硬件和WSL2平台能够完美支持这些技术。
我坚信这是未来的正确方向。我个人对此充满热情,所有PC制造商也都表现出极大的兴趣。我们正在与合作伙伴一起,让所有PC都具备运行AI的能力,包括优化Windows系统,这样我们就能把云端的AI生态系统完整地带到个人电脑上。
4□□□□、记者:昨晚CES开幕演讲的某些部分感觉就像是在SIGGRAPH大会上,非常技术性。现在你们的受众更㊣广了,我想请你解释一下这些内容的意义。
黄仁勋:首先,我承认我的讲解不够清晰,但这不是主要问题。要知道,英伟达本质上是一家技术公司,而不是消费品公司。我们的技术会影响并塑造消费电子产品的未来。虽然他们很热情地邀请我们,但我们始终是一家专注技术的公司。当然,这并不能成㊣为我没有把技术解释得更好的借口。
我们昨天宣布的一个最重要的突破是开发出了一个能够理解物理世界的基础模型。就像GPT是理解语言的基础模型,stable diffusion是理解图像的基础模型,我们现在创造了一个能够理解物理世界的基础模型。
它能够理解摩擦□□□□、惯性□□□□、重力□□□□、物体的存在和持续性,以及几何和空间关系等概念。这些其实都是儿童与生俱来就能理解的东西,儿童对物理世界的理解方式是目前的语言模型所无法企及的。
我们坚信一个能理解物理世界的基础模型是必不可少的。现在有了这个模型,所有你能用GPT和stable diffusion完成的任务,都可以用Cosmos来实现。比如说,你可以与它进行对话。
你可以跟这个世界模型交谈,询问它当前环境中的情况。基于它通过摄像头获取的信息,它能理解并描述”有很多人围坐在桌前,他们在一个房间里”这样的场景。
Cosmos本质上是一个理解现实世界的模型。那么为什么我们需要这样的模型呢?因为如果你希望AI能在现实世界中自然地运作和互动,它就必须具备这种理解能力。
应用场景在哪里?自动驾驶汽车需要理解物理世界,机器人需要理解物理世界。这个基础模型就是实现这些应用的关键起点。Cosmos会让机器人成为现实。
5□□□□、记者:昨晚你提到,我们在见证一些新的Scaling Law的出现,特别是测试时计算(Test-time Compute)。我认为OpenAI的o3模型表明,从计算机的角度来看,扩展推理的成本非常高。英伟达在提供更具成本效益的AI推理芯片方面做了什么?从更广的角度来看,你们如何从测试时计算的扩展中获益?
黄仁勋:首先,对于测试时计算来说,无论是在性能还是成本效益方面,最直接的解决方案就是提升我们的计算能力。新架构的推理性能可能比上一代Hopper高30到40倍。通过将性能提高30到40倍,我们就能将成本降低30到40倍。因为数据中心的其他成本基本保持不变。
所以改进的最佳方式,也是摩尔定律在计算历史上如此重要的原因,就是它降低了计算成本。我之所以提到我们的GPU性能在过去10年增长了1000到10000倍,是因为这反过来说明成本降低了1000到10000倍。在过去20年里,我们将计算的边际成本降低了100万倍。这使得机器学习变得如此合理。只需让计算机从这里到那里。
所以最好的改进方式就是降低计算成本,这也是为什么摩尔定律在计算发展史上如此重要。我提到过去10年我们的GPU性能提升了千倍到万倍,这同时也意味着成本以相同的幅度下降了。
在过去20年中,我们把计算的边际成本降低了百万倍。正是这种成本的大幅下降,让机器学习变得切实可行。未来我们会继续推动计算能力的提升,也将继续带来计算成本的降低。
从另一个角度来看这个问题。现在通过测试时计算㊣的扩展来获得答案需要多次尝试。这些答案会被用作下一轮训练的数据。这些数据又会成为预训练数据。所有我们收集的数据都会被用于预训练和后训练的数据池中。通过不断改进超级计算机的性能并降低训练成本,我们最终可以让每个人使用AI推理的成本都变得更低。
这个过程需要一定时间。这三个扩展定律会在未来持续发挥作用,并且相互影响。从技术角度看,每一次迭代我们都在提升模型的智能水平。同时,用户对AI的要求也在不断提高,他们提出更具挑战性的问题,这就要求系统具备更强的智能。这种需求的增长会导致测试时扩展的持续发展,形成一个良性且不断扩大的循环。
6□□□□、记者:关于DLSS4,你昨晚做了一些演示。我想请你详细讲解一下,比如多帧生成技术。它是否仍然是渲染两帧,然后在中间生成并进行插值?还有关于文本重压缩的内容,在你们的材料中,在视频里提到的。这是游戏开发商需要专门采用的技术吗?还是是驱动程序层面的功能,可以让所有游戏或至少大部分PC游戏受益?
黄仁勋:我们在㊣Blackwell中让着色器处理器能够运行神经网络。这样就可以在着色器管线中混合使用代码和神经网络。这一点非常重要,因为纹理和材质都是在着色器中处理的。
如果着色器不能运行AI,就无法利用神经网络在算法上带来的进步,比如压缩㊣技术。现在的纹理压缩效果比过去30年使用的算法要好得多。压缩比有了很大提升,对于很多纹理可以额外压缩5倍。考虑到现在游戏体积都很大,这是一个重要的进步。
第㊣二点是关于材质。材质决定了光线在表面的传播方式,它的各向异性特性会让光线以特定方式反射,从而展现出金漆或纯金等不同效果。这种特性本质上是在原子层面发生的。用数学方法很难描述这个过程,但我们可以用AI来学习它。这种神经材质技术将是一个重大突破,能让计算机图形变得更加生动逼真。
关于DLSS,帧生成不是插值关系,而是字面意义上的预测。你是在预测未来。没错,你是在预测未来。你不是在对过去进行插值,你是在预测未来。这样做的原因是因为我们试图提高帧率。
7□□□□、记者:AI现在是不是在PC游戏中扮演了更决定性的作用,传统需要渲染的几何特征是不是都转向生㊣成了?
黄仁勋:不是的,让我解释一下为什么。在ChatGPT最初推出时,虽然很多人认为可以直接进行生成,但内部人员都知道这并不现实。因为系统需要真实的基础数据作为条件。就像我们现在用上下文来引导聊天或提示一样,在回答问题前必须理解背景。这个背景可能是PDF文件□□□、网络㊣搜索结果,或者是明确的提示词。
游戏也是㊣同样的道理。你需要提供上下文,不仅要考虑剧情,还要考虑空间关系。通过提供初始的几何形状或纹理作为条件,系统才能生成新内容或提升分辨率。这种方式和ChatGPT使用上下文是一样的。在企业应用中,我们称之为梯度检索增强生成。未来㊣的3D图形将建立在这种3D条件生成的基础上。
以DLSS 4为例。4帧画面总共有3300万像素,但我们只渲染了其中的200万。神奇的是,我们用这200万像素生成了另外3100万像素。关键在于这200万像素必须精确定位。有了这个基础,我们就能生成剩余的3100万像素。更重要的是,因为节省了计算资源,这200万像素可以渲染得非常精美,为生成其他像素提供了优质的参考。
这种变革将影响游戏的方方面面,从像素到几何形状和动画。这个过程花了六年时间。当初宣布DLSS时很多人都不相信,部分原因是我没有解释清楚。但现在大家都认识到生成式AI就是未来。关键是要有条件设置,要有艺术家的创意指导。
Omniverse和Cosmos的关系也是如此。Omniverse作为Cosmos的3D引擎,本质上是一个生成引擎。我们可以精确控制渲染的程度,减少直接渲染来生成更多内容。当减少控制和模拟时,我们就能模拟更大的世界。因为在背后,我们有一个强大的生成引擎在创造线GB显存与算力达成平衡
8□□、记者:我有✅一个关于游戏玩家和消费者的问题。我们注意到RTX 5090和5080之间存在巨大差距。5090的CUDA核心数量是5080的两倍多,价格也翻了一番。为什么你们要在旗舰产品和次旗舰产品之间做出如此大的差异?
当然,2000美元确实不是小数目,这确实是一个相当高的价值。但要记住,这项技术将用于你的家庭影院级别的PC环境。而那台PC,你已经在显示器和音响上投资了约1万美元,你肯定会想要最好的GPU。所以我们很多客户,他们就是追求绝对最好的。
9□□、记者:我是来自韩国的记者。作为一名游戏玩家,我感到非常兴奋。因为当您谈到内存时,特别提到了HBM,为什么没有选择三星的?
这没什么特别的原因。如您所知,SK和三星是两家最大的制造商。我不太确切知道具体情况,可能也不是什么重要的事情需要记录。他们正在努力。是的,他们正在✅努力,一定会成功的。我对三星能够成功开发HBM充满信心。
我对三星的成功充满信心。要知道,三星最早创造了HBM。英伟达使用的第一批HBM内存就来自三星。他们会重新崛起的,他们是一家伟大的公司。韩国人非常有雄心壮志,这是好事。虽然他们需要重新设计,但我相信他们一定能做到。他们正在快速推进,对此非常投入。SK和三星都是优秀的公司,尤其在内存领域。所以我相信他们会继续取得成功。你们昨天也看到了我们产品中使用了多少HBM内存,HBM内存对我们来说非常重要。
10□□、记者:我的问题是,为什么5070仍然只使用12GB显存?现在很多游戏都需要更大的显存,特别是在目标分辨率下。
11□□□□、记者:看到昨晚的5070的性能和4090差不多,价格还降了那么多,很让人兴奋。你对60系列有什么期待吗?
12□□□□、记者:英伟达的Blackwell架构在统一性方面有什么优势?这种统一架构对开发者和最终用户带来了哪些好处?
选择统一架构的核心原因是为了给软件开发者提供一个无缝的开发平台。开发者只需要开发一次,就能确保他们的程序可以在任何搭载英伟达芯片的平台上运行。就像我昨天提到的教育智能化是什么,我们可以在云端开发AI模型,然后轻松地将其部署到个人电脑上运行。这种能力是独一无二的。
13□□、记者:虽然超大规模客户对你们产品的需求已经很明显,但我想了解你们在扩大收入来源方面的紧迫感。特别是在开拓新的企业客户和政府数据中心市场,以及在超大规模计算领域,尤其是在亚马逊等公司开发自己的AI芯片的情况下。你们感㊣受到多大压力?能否详细介绍一下你们在企业和政府客户方面的进展?
关于企业市场,现在主要有两大服务行业。我们的策略是与这两个领域合作,帮助他们打造解决方案。NeMo□□□□、NIMs和Blueprints都是开发Agentic AI的工具包。比如我们与ServiceNow的合作就很成功,他们即将推出一系列基于这些技术的agent服务。这就是我们的基本策略。我们也会与埃森哲等解决方案提供商合作。埃森哲在帮助客户采用这些系统方面做得很好。所以第一步就是提供帮助。
14□□□□、记者:许多公司都在开发㊣Agentic AI,你们要如何与AWS□□□、微软和ServiceNow这样的企业竞争或是合作呢?
英伟达并不是一家直接服务企业的公司,而是一家技术平台公司。我们正在为ServiceNow开发工具包□□□、库和AI模型。这是我们的工作重点。我们主要与ServiceNow□□□、SAP□□□□、Orac㊣le□□□、Synopsys□□□、Cadence□□□□、西门子等公司合作。虽然我们在专业领域有很强的优势,但我们不想过多涉足AI的计算层和库层。我们的任务是为这些公司开发工具。这个工作很有挑战性,因为我们实际在做的事情就是得把ChatGPT整合到容器中。优化这些端点和微服务非常复杂。不过一旦完成,客户就可以在任何云平台上使用我们的产品。
我们最近推出了一款小型设备。它体积小巧,可以放在桌面上,支持无线连接。使用起来就像在操作云服务一样方便,相当于一个私人AI云。为什么要开发这样的设备?因为开发者需要频繁使用计算资源。
16□□□、记者:我想问问昨天发布的新模型㊣产品,特别是小型的模型。这些模型能在智能眼镜上运行吗?在开发时你们有考虑过智能眼镜吗?因为按照你们的发展㊣方向,智能眼镜似乎会成为人们体验AI助手的重要平台。
是的,我对能回答“我在看什么?怎么去㊣那里?”这类问题的智能眼镜很感兴趣。它可以帮助阅读,与AI结合带来的可能性令人兴奋。我会这样使用Cosmos:云端的Cosmos负责视觉理解,如果要在设备本地运行,就用Cosmos提炼出一个小型模型。这样Cosmos就成了知识迁移的工具,可以把知识转移到更小的AI模型中。
这是可行的,因为小型AI模型虽然通用性较差,但在特定领域非常专注。这就是为什么可以进行定向的知识迁移。我们总是先建立基础模型,然后逐步提炼出更小的模型。
17□□□□、记者:我想问一个关于自动驾驶汽车的问题。2017年英伟达在CES上展示了一辆演示车,并在5月GDC与丰田合作。从2017年到2025年,这项技术有了哪些变化?当时存在什么问题,现在又有什么技术突破?
我认为,未来所有可移动的设备都会具备自动化功能。不会再有需要人力的普通工作。20年后如果还看到有人开着车回家,那会很有趣,但这显然毫无必要。未来的汽车虽然保留了手动驾驶选项,但都必须具备自动驾驶功能。现在路上的10亿辆汽车几乎都不能自动驾驶,但20年后,这10亿辆车都将具备自动驾驶能力。我们仍然可以选择自己开车,但这个趋势已经非常明显了。
5年前,我们对这项技术的稳定性(Robustness)还没有把握,但现在已经非常确定了。传感器□□□□、计算机和软件技术都已经相当成熟。有充分证据表明,新一代汽车,尤其是电动汽车,几乎都会配备自动驾驶功能。
技术的成熟和我们对它的认知都需要时间,但现在形势非常好。Waymo是我们重要的合作伙伴,他们在旧金山的表现非常出色。
18□□□、记者:你们昨天发布产品是个好的开始,但神经渲染面临的一大挑战是DirectX中的各种窗口。你们需要做什么来减少引擎运行的阻力?你们是怎么和微软合作的?
特别是从✅DLSS 2/3/4开始,一旦完成集成,即使游戏是为3开发的,也能享受到4带来的部分改进。所以我们必须为基于场景语义的AI处理搭建管道。这确实是必须要做的事。
19□□□□、记者:重大的技术变革从来不是一家公司能完成的。比如互联网□□、个人电脑,还有最近的绿色技术。但这些技术最终都会在某个时刻汇聚,带来巨大的转变。说到AI,你觉得现在还有什么缺失的部分㊣会阻碍我们的发展,还是说一切都已经准备就绪了?我知道AI比较复杂,应用方式也很多,但我想知道你认为还有什么不足的地方。
让我从两个方面说明。首先是语言和认知AI方面。我们正在提升AI的认知能力,让它具备多模态和良好的推理能力。其次是如何把这项技术应用到AI系统中。AI不是单个模型,而是一个知识系统。Agentic AI就是把各种模型整合在一起——有检索模型□□□、搜索模型□□□□、图像生成模型□□□□、推理模型□□、规划模型等。这是一个完整的知识系统。
这几年,业界不仅在改进基础AI,也在探索AI的应用。但我们还缺少一个关键要素,那就是物理AI。物理AI需要像认知AI那样有基础模型。就像GPT-3是第一个达到实用水平的语言基础模型,让我们能在上面开发各种功能。
贸易战背景下将尽力满足需求20□□、记者:关于贸易战,现在仍然还㊣比较活跃。你担心这会影响大家的盈利前景吗?
无论结果如何,都尽力帮助客户和市场。我们可以再看看形势的发展。21□□□、记者:英伟达是如何考虑市场策略的?AI发展的下一步需要什么? 是否存在物理限制?
我们不会为了抢占份额而进入一个已有的市场,这不是我们的风格。我们更愿意开拓全新的市场。比如说,市场上没有Digits这样的产品。如果我们不开发它,可能永远都不会有人开发,因为软件系统太复杂了。同样,如果我们不开发高级神经图形学,也不会有其他人去做。这些都是我们必须承担的使命。
22□□□□、记者:我来自以色列。在过去几年里,AI特别是生成式AI在经济上有了很大发展。我想请教您,那些参与这个浪潮的公司,它们现在的发展速度是否可持续?短期内能否维持这样的发展势头?
谈到AI的发展前景,就我所知并没有物理限制。我们之所以能快速推进AI计算,是因为我们能够统一开发CPU□□□□、GPU□□、NVLink以及所有软件和系统。如果这些工作分散在20个不同的公司,整合起来会非常耗时。正是因为我们掌握了所有集成技术和软件支持,才能如此快速地推进系统发展。从Hopp✅er□□□、H100到H200再到下一代,我们将持续提升每个单元的性能。
第二点,由于我们能够优化整个系统,实际性能提升远超单纯的晶体管性能提升。虽然摩尔定律已经放缓,晶体管性能的代际提升不大,但我们的系统整体性能仍在逐年大幅提升。所以我认为目前没有明显的物理瓶颈。
23□□□、记者:我来自中国台湾。主题演讲提到Digits AI超算CPU正在与联发科合作。您能谈谈与联发科和台积电等台湾企业的合作吗?英伟达还会在台湾建设总部吗?
关于联发科,我们在多个领域都有合作。比如在自动驾驶汽车领域,我们一起为行业提供完全软件定义的智能汽车解决方案。
这是个很好的收尾问题。让我先分享下个人经历,再谈谈对新一代学生的建议。我这一代是第一个必须学会使用计算机做科研的世代。上一代人还在用计算器□□□□、计算尺和纸笔。我们这代人必须学会用计算机编程□□□、设计芯片□□□、模拟物理。计算机是我们工作的工具。而下一代则需要学会运用AI工作,因为AI就是新时代的计算机。
未来在生物学□□、林业□□、农业□□□□、化学□□、量子物理等各个领域,都需要思考如何借助AI开展工作。在计㊣算机科学领域,则是研究如何用AI推进AI本身的发展。供应链管理□□□□、运筹学等领域也是如此。
相关推荐