黄仁勋两万字访谈实录：盼望英伟达拥有 5 万名员工和 1 亿个 AI 助手

分享到

财经 2024-11-11 09:49 701人浏览 0人回复

收藏分享邀请

摘要

NVIDIA（英伟达）公司 CEO 黄仁勋近期做客「Open Source」双周对话，同 Brad Gerstner 与 Altimeter 合资人 Clark Tang 一起探究了与关于推动智能向通用人工智能（AGI）发展的主题。在 AI 和呆板学习范畴深耕多年，

NVIDIA（英伟达）公司 CEO 黄仁勋近期做客「Open Source」双周对话，同 Brad Gerstner 与 Altimeter 合资人 Clark Tang 一起探究了与关于推动智能向通用人工智能（AGI）发展的主题。

在 AI 和呆板学习范畴深耕多年，黄仁勋对 AI 发展近况和前景的评价一针见血：这是一场彻底的革命。

推理迎来爆炸式增长，开源模子需求量爆棚，完备兼容的 AI 底子设施不停落地……这个 AI 大行其道的时代，黄仁勋大胆构想，盼望未来的英伟达能够拥有 5 万名员工和 1 亿个 AI 助手。

当谈及英伟达在当今 AI 天下的竞争壁垒和定位时，黄仁勋对自身上风十分自信清醒，同时也有着不小的野心：英伟达最善于的是算法，我们的使命是为新天下构建一个无处不在的计算平台。

当然，有别于夺取市场份额，这颗野心只关乎「开辟」。

在时长近一个半小时的访谈中，黄仁勋眼光犀利地剖析了呆板学习如何重塑计算天下，AI 如何带来亘古未有的技术革命，并终极掀起巨大的革命海潮。此外，还涉及 AI 的安全性和开源争议等话题。

看似高冷的皮夹克之下，是黄仁勋对 AI 范畴的炽热初心：我会认真对待工作，认真对待责任，认真对待社会贡献以及我们所处的时代。

本次访谈的信息密度相当之大，对于 AI 行业的探究也亘古未有的深入，不容错过！

原访谈视频链接：

我们对黄仁勋在本次访谈中的重要观点做了简要梳理，如下：

个人 AI 助手将很快出现，并且会随时间不停进化；
我们已经从人类编程转向了呆板学习，整个技术栈都在实现创新和增长；
促进 AI 的加速进化，必要对「飞轮」的每个部分都进行加速；
未来的计算（应用步调开辟）将高度依赖呆板学习和 AI，并且会有智能体来帮助人类使用这些应用步调；
AI 不会取代工作，它将改变工作，并将对人们如何看待工作产生深远影响；
AI 的安全是底子，不肯定必要为每一项告急技术单独立法，也不能让监管过度扩展到不必要的范畴；
必须有开源模子来推动 AI 的创建，开源对于许多行业的激活是必要的；

以下是由 APPSO 编译的访谈全文：

从人类编程转向呆板学习

Brad Gerstner：现在是 10 月 4 日星期五，我们在英伟达总部，就在 Altimeter 街下。我们将在周一召开年度投资者会议，讨论 AI 的所有影响，以及我们在智能扩展速率上的盼望。

我真的想不出比你更合适的人来开启这个话题了，你既是股东，也是我们的智囊同伴，和你一起探究想法总能让我们变得更加明智。我们对这段友谊表现感激，所以感谢你的到来。

黄仁勋：很高兴来到这里。

Brad Gerstner：今年的主题是将智能扩展到通用人工智能（AGI）。

令人震撼的是，两年前我们做这个的时间，主题是 AI 时代，而那是在 ChatGPT 发布前两个月。想到这统统变化，真的是让人惊奇。所以我想我们可以以一个思想实验来开始，大概还可以做个预测。

如果我把通用人工智能（AGI）简单明白为我口袋里的个人助手，正如我所明白的那样，它知道我所有的事变，拥有关于我的完美记忆，能够与我沟通，可以为我预订旅店，甚至可以为我预约大夫。在你看来，今天这个天下的变化速率如此之快，你认为我们什么时间能够拥有这种口袋里的个人助手？

黄仁勋：很快会以某种形式出现。谁人助手会随着时间的推移变得越来越好。这就是我们所了解的技术的美好之处。所以我认为，刚开始时它会非常有用，但并不完美。然后随着时间的推移，它会变得越来越完美。就像所有技术一样。

Brad Gerstner：当我们观察变化速率时，我记得 Elon 曾说过，唯一告急的事变是变化速率。我们确实感到变化的速率大大加速了，这是我们在这些题目上见过的最快的变化速率，因为我们在 AI 范畴已经研究了大约十年，而你甚至更久一些。在你的职业生涯中，这是你见过的最快的变化速率吗？

黄仁勋：是的，因为我们重新发明了计算。这些变化很洪流平上是因为我们在已往 10 年内将计算的边际成本降低了 10 万倍。如果按照摩尔定律计算，这个过程大约是 100 倍的提升，但我们做到了远远高出这一点。我们通过几种方式实现了这一目的。

起首，我们引入了加速计算，将在 CPU 上服从不高的工作转移到 GPU 上。

其次，我们发明了新的数值精度，开辟了新的架构，筹划了集成焦点，改进了系统的构建方式，MVLink 增加了超快的内存（HBM），并通过 MVLink 和 InfiniBand 实现了全栈扩展。基本上，所有我描述的关于英伟达服务方式的细节，都促成了超越摩尔定律的创新速率。

现在，真正令人惊叹的是，正因为如此，我们从人类编程转向了呆板学习。

而呆板学习最令人惊奇的地方在于，事实证实它的学习速率非常快。所以，随着我们重新界说计算的分布方式，我们进行了多种形式的并行处置处罚：张量并行、流水线并行，以及各种各样的并行计算方式。我们在这一底子上发明了新算法，并开辟了新的训练方法。所有这些发明都在相互之间产生了复合效应。

回到已往，如果你看看摩尔定律当时的运作方式，会发现软件是静态的。它被预设为像包装好的产品一样静态存在，然后硬件则以摩尔定律的速率发展。而现在，我们是整个技术栈在增长，整个栈都在进行创新，我认为这就是近况。

现在突然之间我们看到了惊人的扩展，当然，这是非凡的变化。但我们以前讨论的是预训练模子以及在这个层面上的扩展，如何通过将模子大小翻倍，得当地将数据量也翻倍。

因此，每年所需的计算能力都会增加 4 倍。这当时是个大事。但现在我们看到了在后训练阶段的扩展，也看到了推理阶段的扩展，对吧？人们已往常认为预训练很难，而推理相对容易。

现在统统都变得很难，这种观点实在是合理的，毕竟将所有人类的头脑都归结为一次性完成的过程是荒谬的。所以头脑肯定存在快头脑和慢头脑、推理、反思、迭代、模拟等概念，而现在这些概念正在逐渐融入进来。

Clark Tang：我认为，就这一点而言，关于英伟达最被误解的一件事就是英伟达的真正技术上风有多大，对吧？我认为外界有一种见解，认为一旦有人发明了一种新芯片或者更好的芯片，他们就赢了。

但事实是，已往十年你们一直在构建完备的技术栈，从 GPU 到 CPU，再到网络，尤其是那些让应用步调能够在英伟达平台上运行的软件和库。你认为今天英伟达的技术上风比三到四年前更大还是更小？

黄仁勋：我很感谢你意识到计算已经发生了变化。事实上，人们之所以认为（现在许多人仍旧这么认为）筹划一款更好的芯片就行了，是因为它有更多的浮点运算能力（flops），有更多的翻转、字节和位，你懂我的意思吗？你看他们的主题演讲幻灯片，上面都是这些翻转和浮点运算，另有各种条形图、图表之类的。

这些都很好，我的意思是，性能当然很告急，所以这些基本上确实很告急。然而，不幸的是，这是老旧的头脑方式。因为当时的软件只是在 Windows 上运行的某个应用步调，软件是静态的，这意味着你能改进系统的最好方式就是制造越来越快的芯片。

但我们意识到，呆板学习不是人类编程。呆板学习不仅仅是关于软件，它是关于整个数据通路的。事实上，呆板学习的焦点飞轮（flywheel）是最告急的东西。那么，你是如何考虑在推动这个飞轮的同时，让数据科学家和研究职员能够在这个飞轮中高效工作的？而这个飞轮从最最初的阶段就开始了。

许多人甚至没有意识到，实际上必要 AI 来整理数据，来辅导另一个 AI。而仅仅这个 AI 本身就已经相当复杂了。

个人 AI 助手将很快以某种方式出现（图源：NITCO）

加速飞轮的每一步

Brad Gerstner：那它本身也在改进吗？它是否也在加速？你知道，当我们再一次思考竞争上风时，对吧？这实际上是所有这些因素的组合效应。

黄仁勋：完全精确，正是因为更智能的 AI 来整理数据，现在我们甚至有了合成数据天生以及各种不同的数据整理和呈现方式。所以在你进行训练之前，就已经涉及到大量的数据处置处罚。而人们总是想到 PyTorch 是整个天下的出发点和终点。

它确实非常告急，但不要忘了，在使用 PyTorch 之前有大量的工作，使用 PyTorch 之后也有大量工作。而关于飞轮的概念，实际上是你应该思考的方式。你知道，我应该怎么去思考整个飞轮？我该如何筹划一个计算系统，一个计算架构，帮助你让这个飞轮尽大概高效运转？这并不是一个应用训练的单一步调，对吧？这只是此中一步，好吗？

飞轮的每一步都很困难，所以你应该起首思考的不是如何让 Excel 更快运行，也不是如何让《毁灭战士》更快运行，那是已往的老路，对吧？

现在你必要考虑的是如何让这个飞轮更快。而这个飞轮包罗了许多不同的步调，正如你们所知道的，呆板学习没有什么是简单的，OpenAI 所做的事变，或者 X 所做的事变，或者 Gemini 团队和 DeepMind 所做的事变，都没有什么是简单的。

因此我们决定，这才是你应该真正思考的。这是整个过程，你必要加速每一个部分。你要恭敬阿姆达（Amdahl）定律，阿姆达定律会告诉你，如果这个部分占用了 30% 的时间，我将它加速了 3 倍，我并没有真的将整个过程加速太多，明白吗？

你真的必要创建一个能加速每一步的系统，只有通过加速整个过程，你才气真正显著改善这个循环时间，而谁人学习速率飞轮，终极就是导致指数式增长的缘故原由。

所以我要说的是，一个公司的观点实际上会反映在它的产品上。注意，我一直在谈论这个飞轮。

Clark Tang：你是说整个周期。

黄仁勋：没错，而且我们现在加速了统统。现在的重要焦点是视频。许多人都专注于物理 AI 和视频处置处罚。试想一下前端，每秒有数 TB 的数据进入系统。给我举个例子，说明处置处罚这些数据的管道是如何运行的，从数据摄取到准备进行训练的全过程，而这统统都是 CUDA 加速的。

Clark Tang：现在人们只在思考文本模子，但未来还包括视频模子，同时使用一些文本模子，比如 o1，来在我们开始处置处罚之前先处置处罚大量的数据。

黄仁勋：语言模子将会涉及到每一个范畴。行业花费了大量技术和精力来训练语言模子，来训练这些大型语言模子。现在我们在每一步都使用更低的计算成本。这真的非常了不得。

Brad Gerstner：我不想过于简单化这个题目，但我们确实常常从投资者那边听到如许的题目，对吧？是的，但定制化芯片呢？是的，但他们的竞争壁垒会不会因此被冲破？

我听到你所说的是，在这个组合系统中，上风是随着时间增长的。所以我听你说，我们今天的上风比三四年前更大，因为我们在改进每一个组件。而这种组合效应，意味着你知道，比如作为一个贸易案例研究，英特尔曾经在技术栈中占据主导地位，而你们今天相对他们而言处于什么位置？

大概可以简单概括一下，比力一下你们今天的竞争上风与他们在顶峰时期的竞争上风。

黄仁勋：英特尔是非凡的。英特尔之所以非凡，是因为他们大概是第一家在制造工艺工程和生产方面极其出色的公司，而在制造工艺的底子上更进一步的是筹划芯片，对吧？他们筹划了芯片，构建了 x86 架构，并且不停制造更快的 x86 芯片。这是他们的聪明之处。他们将这一点与制造工艺加以结合。

我们的公司稍微有些不同，因为我们认识到，事实上，平行处置处罚并不必要每个晶体管都非常完美。串行处置处罚要求每个晶体管都必须完美无缺，而平行处置处罚必要大量的晶体管以实现更高的成本效益。

我宁愿要多 10 倍的晶体管，速率慢 20%，也不肯要少 10 倍的晶体管，速率快 20%。明白吗？他们则更喜煌｀反的选择，因此单线程性能和单线程处置处罚与平行处置处罚非常不同。所以我们意识到，实际上我们的天下并不是追求往下做得更好。我们想做到尽大概的好，但我们的天下真正关心的是如何往上做得更好。

并行计算、并行处置处罚很难，因为每个算法都必要根据架构以不同的方式重构和重新筹划。人们没有意识到的是，你可以有三种不同的 CPU，它们都有各自的 C 编译器，你可以把软件编译到相应的 ISA（指令集架构）上。这在加速计算中是不大概的，在并行计算中也是不大概的。

开辟出架构的公司必须开辟出本身的 OpenGL。所以我们彻底改变了深度学习，因为我们有一个特定范畴的库，叫做 CUDNN。没有 CUDNN，就没有今天的深度学习。

没有人谈论 CUDNN，因为它是在 PyTorch 和 TensorFlow 之下的一层。早期另有 Caffe 和 Theano，现在有 Triton，另有许多不同的框架。谁人特定范畴的库，像 CUDNN，另有 Optics，一个特定范畴的库叫做 CuQuantum，Rapids，另有其他许多库。

Brad Gerstner：行业特定的算法就位于谁人大家都关注的 PyTorch 层之下，比如我常常听到人们说，如果没有这些底层库的话……

黄仁勋：如果我们没有发明它，任何顶层的应用步调都无法运行。你们明白我在说什么吗？从数学上讲，英伟达真正善于的是算法，它融合了上层的科学与下层的架构，这是我们真正善于的。

黄仁勋在访谈中

我们已经进入推理时代

Clark Tang：现在所有的关注点终于集中到了推理上。但是我记得两年前，Brad 和我和你共进晚餐时，我们问你一个题目：你认为英伟达在推理范畴的技术上风会像在训练范畴一样强大吗？

黄仁勋：我肯定说过，它会更强大。

Clark Tang：你刚才提到了许多因素，比如模块化组合，不同组合的总成，有时我们并不完全了解。对于客户来说，能够在这些之间机动切换非常告急。但你能不能再谈谈，现在我们已经进入了推理时代。

黄仁勋：推理就是大规模的推理训练，对吧？所以，如果你训练得好，那么很有大概你的推理也会很好。如果你在这种架构上进行训练而没有任何调解，它将能够在这种架构上运行。

当然，你依然可以为其他架构进行优化，但至少，因为它已经是在英伟达的架构上构建的，所以它能够在英伟达的架构上运行。

另一个方面，当然，另有资本投资方面的题目。当你训练新模子时，你会盼望使用最新最好的装备进行训练，而这会留下之前使用过的装备。而这些装备非常得当用于推理。因此，会有一条免费的装备路径。

新的底子设施背后有一条免费的底子设施链，这些装备与 CUDA 兼容。所以我们非常严谨，确保整个过程的兼容性，如许我们留下的装备依然能够保持杰出性能。

同时，我们也投入了大量精力，不停重新发明新的算法，以确保当机遇到暂时，Hopper 架构的性能会比刚购买时提升 2 到 4 倍，从而让底子设施继承保持高效。

所以，我们在改进新算法、新框架方面所做的所有工作，不仅帮助了我们每一个安装的底子架构，Hopper 因此变得更好，Ampere 也因此变得更好，甚至 Volt 也因此变得更好。

我记得 Sam 刚刚告诉我，他们近来刚从 OpenAI 退役了他们的 Volt 底子设施。所以，我认为我们留下了这些安装底子架构的陈迹。正如所有计算底子架构一样，安装底子架构是很告急的。

英伟达的产品遍布每一个云端、内部摆设，直到边缘装备。因此，在云端创建的 Vela 视觉语言模子无需修改便能完美运行于边缘的呆板人上。这统统的底层都是 CUDA。所以，我认为架构兼容性的概念对大型项目非常告急。这和 iPhone 或其他装备的兼容性概念没有什么不同。

我认为，安装底子架构对推理非常告急，但我们真正受益的是，因为我们在新的架构上训练这些大型语言模子时，我们能够思考如何创造出在未来非常良好的推理架构。

所以我们一直在思考迭代模子和推理模子，如何为你的个人智能体创造非常交互性的推理体验，比如当它必要停下来思考一段时间时，如何快速与你互动。

所以，我们是如何实现这一目的的？答案是 NVLink。你知道，NVLink 让我们能够使用这些得当训练的系统，但当训练完成后，它的推理性能也非常杰出。你盼望优化的是初次 Token 的相应时间，而实现初次 Token 的相应时间非常困难，因为这必要大量的带宽。

如果你的上下文也非常丰富，那么你还必要大量的计算能力。因此，你必要在同一时间拥有无限的带宽和计算能力，才气实现几毫秒的相应时间。而这种架构非常难以实现。为此，我们发明了 Grace Blackwell NVLink。

NVIDIA Blackwell 架构（图源：NVIDIA）

英伟达正在构建完备的、兼容的 AI 底子设施

Brad Gerstner：你知道，我这周早些时间和 Andy Jassy 共进晚餐，Andy 说：「我们有 Tranium，另有即将到来的 Inferencia」。我认为大多数人，还是认为这些对于英伟达是个挑衅。

但紧接着他说「英伟达是我们一个非常告急的合作同伴，而且未来还将继承是我们非常告急的合作同伴，至少在我所能预见的未来」。

天下依靠英伟达运行，对吧？所以，当你想到这些为特定应用开辟的定制 ASIC，比如 Meta 的推理加速器，或者 Amazon 的 Tranium，或者 Google 的 TPUs，另有你当前面对的供应短缺题目时，这些因素会改变你们之间的动态，还是说它们只是对你们系统的补充？

黄仁勋：我们只是在做不同的事变，我们试图实现不同的目的。英伟达正在尝试为这个新天下构建一个计算平台，这个呆板学习的天下，这个天生式 AI 的天下，这个智能体 AI 的天下。

我们想要创造的是，颠末 60 年的计算，我们重新发明了整个计算栈，从编程到呆板学习的方式，从 CPU 到 GPU 的软件处置处罚方式，从软件到人工智能的应用方式，对吧？软件工具、人工智能——计算栈的每个方面，技术栈的每个方面都发生了变化。

我们想要做的是创建一个无处不在的计算平台，这实际上是我们工作的复杂性地点。如果你思考我们在做什么，我们是在构建一个完备的 AI 底子设施，我们把它看作是一台计算机。

我以前说过，数据中央现在是计算的基本单位。对我来说，当我思考一台计算机时，我不是在想那块芯片，我是在想这个概念：它是我的心智模子，内里包括所有的软件、编排和所有的呆板部分。这是我的使命，这是我的计算机，我们每年都在试图构建一台全新的计算机。

是的，这太疯狂了，之前没有人这么做过。我们每年都在尝试构建一台全新的计算机，而且每年我们都交付两到三倍的性能提升。每年我们都会将成本降低两到三倍，每年我们都会将能效提高两到三倍。

所以我们告诉客户，不要一次性购买所有装备，每年购买一点，好吗？缘故原由是，我们盼望他们能够徐徐进入未来，所有的架构都是兼容的，好吗？

现在，仅仅以如许的速率构建这个平台就已经非常难了，而双倍的难度在于，我们不仅要贩卖底子设施或服务，而是把它们拆解开来，然后将它们集成到 GCP 中，集成到 AWS 中，集成到 Azure 中，集成到其他平台中，明白吗？

每个平台的集成都不一样。我们必须把所有的架构库、所有的算法和所有的框架集成到他们的系统中。我们把我们的安全系统集成到他们的系统中，我们把我们的网络集成到他们的系统中，对吧？然后我们每年进行大概 10 次如许的集成。而这就是奇迹地点。

Brad Gerstner：这就是奇迹地点，为什么？我的意思是，这太疯狂了。你每年都在做这些事，这真的很疯狂。想一想，是什么驱动你每年都如许做的？

然后再说到这一点，你知道 Clark 刚从中国台湾、韩国和日本回来，见了你所有的供应合作同伴——那些你已经有十多年合作关系的同伴。这些合作关系对于构建谁人竞争壁垒的组合效应有多告急？

黄仁勋：是的，当你系统性地分解时，大家越是分解，就越会感到惊奇，整个电子行业生态系统今天是如何致力于与我们合作，终极构建出这个计算机的立方体，并将其整合到所有不同的生态系统中的？而且和谐是如此无缝。显然，我们向后转达了 API、方法学、业务流程和筹划规则，向前转达了方法学、架构和 API。

Brad Gerstner：这些已经被强化了几十年。

黄仁勋：强化了几十年，同时也在不停演进。但这些 API 在必要的时间必须整合在一起——所有这些在中国台湾和天下各地制造的东西，终极会落到 Azure 的数据中央。它们会组合到一起。

Clark Tang：有人只必要调用 OpenAI API，它就能正常工作。

黄仁勋：没错，完全是那种疯狂的感觉。这就是我们发明的东西，我们发明了这个巨大的计算底子设施，整个天下都在和我们一起构建它。

它被整合到了各个范畴，你可以通过戴尔贩卖它，可以通过惠普（HPE）贩卖它，它托管在云端，也延伸到了边缘装备。人们现在在呆板人系统中使用它，在人形呆板人中使用它，它们在主动驾驶汽车中使用，它们都在架构上兼容，这真的非常疯狂。

Clark，我不盼望你误以为我没有回答你的题目，事实上，我已经回答了。我所指的与你的 ASIC 相关的题目是如许的。

我们作为公司，只是在做不同的事变。作为一家公司，我们盼望能够对情况有清楚的认知。我对我们公司及其生态系统四周的统统都非常清楚，对吧？

我知道所有在做不同事变的人以及他们在做什么。有时间，这对我们来说是对抗性的，有时间不是。我对此非常清楚。但这并不会改变我们公司的目的。公司唯一的目的就是构建一个可以无处不在的架构平台，这就是我们的目的。

我们并不想从任何人那边抢占市场份额。英伟达是市场的开辟者，而不是份额的夺取者。如果你看我们的公司报告，你会发现我们从来不谈市场份额，从来没有一天我们会在公司内部谈论市场份额。

我们所有的讨论都是关于如何创造下一个东西？我们如何办理飞轮中的下一个题目？我们如何为人们做得更好？我们如何将已往必要一年的飞轮周期收缩到一个月？你知道，这相当于飞轮的光速，不是吗？我们在思考所有这些不同的题目，但有一件事是确定的，我们对四周的统统都有清醒的认识，但我们对本身的使命非常明确。

唯一的题目是，这个使命是否必要，是否有意义。所有巨大的公司都应该有如许的使命。

从根本上讲，题目是你在做什么？唯一的题目是，它是否必要，是否有价值，是否有影响力，是否能帮助到别人？我非常确定，如果你是一名开辟者，一家天生式 AI 初创公司，正在决定如何成为一家公司，你唯一不必要考虑的选择就是支持哪个 ASIC。

如果你只支持 CUDA，那么你可以在任何地方使用它，你以后随时可以改变主意，但我们是进入 AI 天下的入口，不是吗？一旦你决定进入我们的平台，其他决议都可以延后，你以后随时可以开辟本身的 ASIC，我们对此绝不介意。

当我与 GCP 合作时，GCP、Azure 等公司，我们会提前几年向他们展示我们的路线图。他们不会向我们展示他们的 ASIC 路线图，这也不会得罪我们，明白吗？如果你的目的明确且有意义，并且你的使命对你本身和他人都很告急，那么你就可以保持透明。

注意，我的路线图在 GTC 上是公开的，而我的路线图在 Azure、AWS 等合作同伴那边会更深入。我们在这些方面没有任何困难，即使他们正在开辟本身的 ASIC。

NVIDIA 的使命是构建完备兼容的 AI 底子设施（图源：The Brand Hopper）

AI 正在改变行业未来

Brad Gerstner：我觉得，当人们观察这个行业时，你近来说过，对 Blackwell 的需求是「疯狂的」。你还说，工作中最难的一部分就是在这个计算资源短缺的天下里，忍受对别人说「不」所带来的情感负担。

但品评者说，这只是一个时间节点，他们认为这就像 2000 年思科过度建设光纤一样，将会履历繁荣与冷落。你知道，我想到 2023 年年初我们一起用饭的时间，当时的预测是英伟达 2023 年的营收会到达 260 亿美元，但你们实际做到了 600 亿，对吗？

黄仁勋：承认吧，这是天下上有史以来最大的预测失败。

Brad Gerstner：当时间我们在 2022 年 11 月特殊冲动，因为像来自 Inflection 的 Mustafa 和来自 Character 的 Noam 等人来到我们办公室讨论投资他们的公司。他们说，如果你们不能直接投资我们的公司，那就买英伟达吧，因为全天下都在争相得到英伟达的芯片，用来构建那些将要改变天下的应用。

当然，随着 ChatGPT 的出现，这一「寒武纪时刻」到来了。然而，即便如此，这 25 位分析师仍旧着迷于「加密隆冬」，无法想象天下上正在发生的事变，对吧？所以终极结果远超预期。

你明确表现，对 Blackwell 的需求非常疯狂，并且未来会一直如此。当然，未来是未知且不可知的，但为什么品评者的见解错得如此离谱？这不会像 2000 年思科那样成为过度建设的局面。

黄仁勋：思考未来的最佳方式是从基本原理推理出来，对吧？所以题目是，我们现在在做的事变的基本原理是什么？第一，我们在做什么？我们在做什么？我们正在重新发明计算，不是吗？

我们刚刚说过，未来的计算将高度依赖呆板学习，对吗？我们险些所有的应用步调，无论是 Word、Excel、PowerPoint、Photoshop、Premiere、AutoCAD，无论你给我举什么例子，所有这些都是手工筹划的。我向你保证，未来这些都会高度依赖呆板学习，不是吗？

并且，在这些工具之上，你还会有智能体来帮助你使用它们。

所以，到现在为止，这已经是个事实了，对吧？我们重新发明了计算，我们不会回头。整个计算技术栈正在被重新界说。

好了，现在我们已经做到了这一点，我们说软件将会不同，软件的编写方式将会不同，使用软件的方式也会不同。所以，让我们承认这些是我的基本事实。是的，那么题目来了，接下来会发生什么？

那么让我们回顾一下，已往的计算是怎么做的。我们有一万亿美元的计算机装备。看看已往的数据中央，打开门看看，你会说那些是你想要用来面对未来的计算机吗？答案是否定的。

你看到那些 CPU，我们知道它能做什么，不能做什么。我们也知道现在有价值一万亿美元的数据中央必要现代化。因此，眼下，如果我们要在未来四五年内进行现代化改造，那是完全合理的，也是明智的。

Brad Gerstner：所以我们已经在和那些必要进行现代化改造的人沟通，他们正在使用 GPU 进行现代化改造，没错。

黄仁勋：我的意思是，让我们做个假设。你有 500 亿美元的资笔僻出，你会选择 A 选项：为未来建设资笔僻出，还是 B 选项：按照已往的模式建设资笔僻出？你已经有了已往的资笔僻出，就在那边放着，反正它不会变得更好。

摩尔定律基本上已经竣事了，所以为什么要重修呢？我们只必要把这 500 亿美元投入到天生式 AI 中，不是吗？如许你的公司就会变得更好。那么你会把这 500 亿中的多少投入进去？我会把 100% 的 500 亿都投入进去，因为我已经有了四年的旧底子设施。

所以现在，从基本原理出发，你只是从这个角度来推理，而这正是他们正在做的事变。聪明的人在做聪明的事变。

现在第二个部分是如许的：我们有一万亿美元的容量要去建设，对吧？一万亿美元的底子设施，大概投入了 1500 亿美元，对吧？所以我们在未来 4 到 5 年内要建设一万亿美元的底子设施。

我们观察到的第二点是，软件的编写方式不同了，而未来软件的使用方式也会不同。我们将会有智能体，不是吗？

我们公司将会有数字员工，他们会在你的收件箱里，在未来，这些小点点、小头像会变成 AI 的图标，不是吗？我会向他们发送任务。我不再用 C++ 编程了，我会用提示词来「编程」AI，不是吗？这和我今天早上写了一堆邮件没有什么不同。

我给我的团队下达了指示，对吧？我描述了背就连说明了我知道的基本限制，并描述了他们的任务。我会给他们足够的方向感，让他们明白我必要什么，我盼望对预期结果尽大概明确。但我也会留出足够的创造空间，让他们可以给我带来惊喜，不是吗？

这和我今天如何提示 AI 没有什么不同，这正是我提示 AI 的方式。所以在我们现代化改造的底子设施之上，将会有一个全新的底子设施。这套新底子设施就是将操纵这些数字人的 AI 工厂，它们会全天候地运行。

我们将在全球所有的公司中拥有它们，在工厂中拥有它们，在主动化系统中拥有它们，对吗？所以这个天下必要创建一整层计算布局，我称之为 AI 工厂的底子设施，这些现在还不存在。

所以题目是，这个规模有多大？目前我们还无法知道，大概是几万亿美元的规模，但美好的是，现代化改造的数据中央架构与 AI 工厂的架构是相同的。

Brad Gerstner：这就是美好之处。你已经说得很清楚了，你有一万亿美元的旧底子设施必要现代化改造，同时至少另有一万亿美元的新 AI 工作负载正在到来，今年大约会有 1250 亿美元的收入。

你知道，曾经有人告诉你们这家公司永世不会高出 10 亿美元的市值。而现在你坐在这里，如果你只占到了几万亿总市场（TAM）的 1250 亿收入，有什么理由让你认为你们未来的收入不会是现在的 2 倍、3 倍？有什么理由让你们的收入不会继承增长？

黄仁勋：没有，没错。你知道，这并不是关于现在的事变。公司只会受到「池塘」大小的限制，你知道，金鱼只能长到与池塘相匹配的大小。

所以题目是，我们的池塘有多大？这必要许多想象力，这也是为什么市场开辟者会思考未来，而不是只在现有的池塘里竞争。

如果你只是回顾已往、试图抢占市场份额，这很丢脸清未来。市场份额的夺取者只能做到这么大，而市场的开辟者可以变得非常大。所以，我认为我们公司的幸运之处在于，从公司建立的第一天起，我们就必须为本身创造市场空间。

人们当时没有意识到这一点，但我们险些从零开始创造了 3D 游戏 PC 市场。我们基本上发明了这个市场以及所有相关的生态系统，包括显卡的生态系统。我们发明了这统统。所以，创造一个全新的市场来服务它，对我们来说是一件非常熟悉的事变。

Brad Gerstner（左）和 Clark Tang（右）在访谈中

不可思议的 OpenAI 和 X.AI

Brad Gerstner：没错，作为一个发明了新市场的人来说，这确实如此。让我们稍微转移话题，谈谈模子和 OpenAI。你知道，OpenAI 这周筹集了 65 亿美元，估值到达约 1500 亿美元。我们都到场了这次融资。

黄仁勋：真的为他们感到高兴，真的很高兴这统统顺遂告竣。是的，他们做得很棒，团队也表现得非常出色。

Brad Gerstner：有报告称他们今年的收入或收入运行率大约是 50 亿美元，来岁大概到达 100 亿美元。如果你看今天的业务规模，它的收入大约是谷歌在 IPO 时的两倍。

他们有 2.5 亿的每周活跃用户，我们估计这是谷歌 IPO 时用户量的两倍。而如果你看它的业务倍数，如果你信赖他们来岁能到达 100 亿美元收入，那么他们的市值大约是来岁收入的 15 倍，这和谷歌和 Meta 在 IPO 时的倍数差不多，对吧？当你想到这家公司 22 个月前还没有任何收入和每周活跃用户时，这非常惊人。

黄仁勋：Brad 对汗青有着不可思议的把握。

Brad Gerstner：当你想到这一点时，和我们谈谈 OpenAI 作为你们的合作同伴，以及它在推动公众对 AI 的认知和使用方面的告急性。

黄仁勋：嗯，这是我们时代最具影响力的公司之一。这是一家纯粹的 AI 公司，追求通用人工智能（AGI）的愿景。

无论 AGI 的界说是什么，我险些不认为它的界说完全告急，也不信赖时间节点的告急性。我所知道的一件事是，AI 将在未来的时间里不停显现出一系列能力。这些能力的发展路线图将会非常惊人。在到达任何人所界说的 AGI 之前，我们就会将其广泛应用。

你现在要做的就是去和数字生物学家、气候科技研究职员、材料研究职员、物理科学家、天体物理学家、量子化学家对话。你可以去找视频游戏筹划师、制造工程师、呆板人专家，选择你喜欢的行业，深入此中，和那些告急的人对话，问他们，AI 是否彻底改变了他们的工作方式？然后你把这些数据点带回来，再问问本身，你到底有多怀疑？

因为他们不是在谈论 AI 未来某天的概念性长处，他们正在谈论现在就使用 AI。无论是农业科技、材料科技、气候科技，选择你想要的科技范畴或科学范畴，它们正在进步，AI 正在帮助他们推进他们的工作。

就在我们说话的这一刻，每个行业、每家公司、每所大学都在使用 AI，难以置信，不是吗？它绝对会在某种水平上改变贸易，我们知道这一点，对吧？我的意思是，这种变化是如此真实，正在发生。所以我认为 ChatGPT 所引发的 AI 觉醒完全是不可思议的。我喜欢他们的速率和他们推动这一范畴的单一目的，所以它真的非常具有影响力。

Brad Gerstner：他们构建了一个可以为下一代模子融资的引擎。我认为硅谷的共识正在增加，即整个模子层正在逐渐商品化，Llama 让许多人可以以非常低的成本构建模子。

所以一开始，我们有许多模子公司，比如 Character、Inflection、Cohere、Mistral 等等。许多人质疑这些公司是否能够到达经济引擎的「逃逸速率」，继承为下一代模子提供资金。我的感觉是，这也是为什么我们看到市场的整合，对吧？

显然，OpenAI 已经到达了谁人「逃逸速率」，他们可以为本身的未来融资。但对我来说，不清楚的是，许多其他公司能否做到这一点。这是否是对模子层近况的一个公平概述？就像我们在其他许多市场中看到的一样，市场领导者会有一个经济引擎和应用来让他们继承投资。

黄仁勋：起首，模子和人工智能之间有一个根本区别，对吧？模子是人工智能的一个必要但不敷的组成部分，对吧？人工智能是一种能力，但为了什么？应用是什么？

主动驾驶汽车的人工智能与人形呆板人的人工智能有关，但它们并不相同。它们与谈天呆板人的人工智能有关，但也不相同，对吧？所以你必要明白这个栈的分类。在栈的每一层都会有机会，但并不是每一层都有无限的机会。

我刚刚说了一些话，你所必要做的就是把「模子」一词替换为「GPU」。事实上，这是我们公司 32 年前的重大发现——GPU 图形芯片与加速计算之间有一个根本区别。加速计算与我们在 AI 底子设施中所做的工作不同，虽然相关，但并不完全相同。它们是创建在相互之上的，但并不完全相同。每一层抽象都必要完全不同的技能。

一个非常善于构建 GPU 的人，大概完全不知道如何成为一家加速计算公司。有许多人在构建 GPU，而我们发明了 GPU，但今天并不是只有我们一家在制造 GPU，对吧？天下上有许多 GPU，但并不是所有的公司都是加速计算公司。而且有许多加速器应用步调，但这与加速计算公司不同。例如，一个非常专门的 AI 应用步调大概会非常乐成。

Brad Gerstner：这就是 MTIA。

黄仁勋：没错，但它大概不会成为一个具有广泛影响力和能力的公司。所以你必须决定你想处于哪个位置。在这些不同的范畴大概都有机会，但就像创建公司一样，你必须注意生态系统的变化，以及哪些东西随着时间推移被商品化，分清楚什么是功能、什么是产品、什么是公司，这是肯定的。好吧，我刚刚谈到了许多不同的思绪。

Brad Gerstner：当然，另有一个新参加者拥有资金、聪明才智和雄心，那就是 X.AI，对吧？外界有报道称，你和 Larry 以及 Elon 共进了晚餐。他们说服你放弃了 10 万个 H100s，他们去了孟菲斯，在几个月内创建了一个大型的超级计算集群。

黄仁勋：起首三个点不在一条线上，我和他们共进了晚餐，因果关系仅仅就是如许。

Brad Gerstner：你怎么看他们构建超级计算集群的能力？外界还在讨论他们想要再增加 10 万个 H200s 来扩展这个超级集群的规模。

起首，和我们谈谈 X 公司的雄心壮志以及他们已经取得的成绩。同时，我们是否已经进入了 20 万或 30 万个 GPU 集群的时代？

黄仁勋：答案是肯定的。起主要承认他们的成绩是应得的。从概念阶段到数据中央的建成，并准备好让英伟达的装备进驻，到我们供电、连接装备并进行初次训练，这一过程。

起首，制作如许一个巨大的工厂，采用液冷技术、完成能源供应、得到许可，并在这么短的时间内完成。我是说，这简直是超人的成绩。就我所知，全天下只有一个人能做到这一点，埃隆·马斯克在工程、建筑、大型系统和资源调配方面的明白是独一无二的，简直难以置信。

当然，他的工程团队也非常出色，软件团队、网络团队、底子设施团队都很棒。埃隆对此有着深入的明白。从我们决定启动项目的那一刻起，我们的工程团队、网络团队、底子设施计算团队、软件团队都进行了充分的准备。

然后，所有的底子设施、物流以及当天进入的数据量和装备量，另有英伟达的底子设施和计算技术，统统都在 19 天内完成了训练。

你知道这意味着什么吗？有谁睡觉了吗？24 小时不停地工作，毫无疑问，没有人睡觉。起首，19 天的时间真是不可思议，但如果退一步思考，这只是短短几周。你能看到的技术装备数量简直令人难以置信。

所有的布线和网络连接，与英伟达装备的网络连接与超大规模数据中央的网络连接完全不同。一个节点上的电线数量，计算机背部全都是电线。仅仅是把这座技术高峰整合起来，再加上所有的软件，简直难以置信。

所以我认为埃隆和他的团队所做的事变非常了不得，我也很感激他承认我们在工程和规划方面与他们的合作。但他们所取得的成绩是独一无二的，亘古未有。

为了让你更好地明白，10 万个 GPU，毫无疑问，这是地球上速率最快的超级计算机。这只是一个集群。通常你制作一台超级计算机必要三年时间来规划，对吧？然后交付装备并花一年时间让它全部运行起来。而我们在谈论的是 19 天。

ChatGPT 所引发的 AI 觉醒是不可思议的（图源：artnet）

推理将迎来爆炸式增长

Clark Tang：英伟达平台的上风是什么呢？它的整个流程都已经颠末强化，对吧？

黄仁勋：是的，统统都已经在运行。当然，另有一大堆 X 算法、X 框架和 X 堆栈，我们还必要进行大量的集成。但它的前期规划非常出色，仅仅是预规划就已经令人印象深刻了。

Brad Gerstner：Elon 是独一无二的存在，但你刚刚回答时提到，20 万到 30 万个 GPU 集群已经存在了，对吧？它能扩展到 50 万个吗？它能扩展到 100 万个吗？你们产品的需求是否取决于这些集群能否扩展到百万级？

黄仁勋：最后一个题目的答案是否定的。我的见解是，分布式训练必须起作用，我认为分布式计算将会被发明出来，某种形式的联邦学习和分布式、异步计算将会被发现。我对此非常有信心，也非常乐观。

当然，必要意识到的是，已往的扩展法则重要是关于预训练。现在我们已经进入了多模态，我们开始了合成数据天生。后训练阶段的扩展变得非常快，合成数据天生、嘉奖系统、基于强化学习的训练都发展迅速。现在推理阶段的扩展也到达了极限。

这个想法是，在模子回答题目之前，它已经进行了 10000 次内部推理，这大概并不浮夸。它大概已经进行了树搜刮，大概已经基于这个题目进行了强化学习，大概进行了某种模拟，肯定进行了大量反思，大概查阅了一些数据和信息，对吧？所以它的上下文大概相当巨大。

我想，这种智能就是我们正在做的，不是吗？这就是我们正在做的。所以，如果你对这种扩展进行计算，将模子规模和计算规模每年扩展 4 倍，再加上使用需求不停增长……

我们是否认为我们必要数百万个 GPU？毫无疑问，是的。这是目前的一个确定性题目。那么题目是，我们如何从数据中央的角度来架构它？这在很洪流平上取决于数据中央是一次性到达千兆瓦级，还是每次 250 兆瓦？我的见解是，这两种情况都会出现。

Clark Tang：我觉得分析师总是关注当前的架构选择，但我认为从这次对话中最大的收获之一就是，你们是在思考整个生态系统，以及未来多年的发展。

因此，英伟达扩展规模，岂论是纵向还是横向扩展，都是为了应对未来，而不是仅仅依赖一个有 50 万或 100 万个 GPU 集群的天下。到分布式训练真正到来时，你们已经编写了支持它的软件。

黄仁勋：没错，记住我们和合作同伴在大约七年前开辟的 Megatron。如果没有它，这些大规模训练任务的扩展是不大概的。我们发明了 Megatron，我们发明了 Nickel、GPU Direct，另有我们通过 RDMA 所做的所有工作，这使得流水线并行处置处罚变得更加容易。

所有的模子并行处置处罚，所有分布式训练的分解、批处置处罚等所有这些技术，都是因为我们做了早期的工作，现在我们也在为未来的下一代技术做准备。

Brad Gerstner：那么我们来谈谈 Strawberry 和 o1 吧。

起首，我觉得他们把 o1 定名为 o1 签证是很酷的，对吧？o1 签证是为了吸引全球最良好、最聪明的人才来到美国，我知道我们都对此深有热情。

我非常喜欢这个想法，制作一个能思考、推动我们走向智能扩展新高度的模子，向那些通过移民来到美国的天才致敬，正是他们成绩了今天的我们。

黄仁勋：肯定是一种外星智能。

Brad Gerstner：当然，这个项目是由我们的朋友 Noah Brown 领导的，他曾到场 Pluribus 和 Cicero 的工作，都是 Meta 的项目。推理时间推理作为一个完全新的智能扩展维度，与仅仅构建更大模子的方式大相径庭，这有多告急？

黄仁勋：这非常告急，极其告急。许多智能无法预先完成，你知道吗？甚至许多计算都不能预先重新排序。乱序实行可以提前完成，但许多事变只能在运行时完成。

所以无论是从计算机科学的角度来看，还是从智能的角度来看，许多东西都必要上下文和情境，你所寻找的答案范例有时简单的快速答案已经足够了，而答案的后果取决于你使用这个答案的性质。

所以有些答案可以花一个晚上思考，有些答案大概必要一周的时间，对吧？我完全可以想象，我给我的 AI 发送一个提示词，告诉它，想一晚上，不要立刻告诉我，对吧？我想让你整晚思考，然后明天早上告诉我你最好的答案，并为我推理分析。

因此，我认为智能的分层，从产品角度来看，会有一次性的版本，也会有一些必要五分钟来完成的。

Brad Gerstner：这个智能层能够将这些题目与合适的模子和使用场景相匹配。昨晚我们在使用先进的语音模式和 o1 预览版，我正在辅导我儿子的 AP 汗青考试，感觉就像天下上最好的 AP 汗青老师坐在你旁边一起思考这些题目，真是非凡的体验。

黄仁勋：我的导师现在是 AI。

Brad Gerstner：当然，他们今天已经存在了。这也回到了这个话题，你知道，你们今天有高出 40% 的收入来自推理。但推理将因为「推理链」而迎来爆炸式增长，对吧？

黄仁勋：推理的增长将会是十亿倍的。

Brad Gerstner：翻倍，再翻十亿倍。

黄仁勋：对。这是大多数人还没有完全明白的部分。这正是我们之前谈论的行业变革，这是工业革命。

Brad Gerstner：这是智能的生产，对吧？

黄仁勋：它将增长十亿倍。

Brad Gerstner：大家都高度关注英伟达，认为它重要是用于更大模子的训练。是不是如许，如果你们今天的收入有 50% 来自训练，那么未来推理的规模将远远高出训练。训练固然告急，但推理的增长将会远超训练的增长，我们盼望如此，险些不大概有其他情况。

黄仁勋：我们盼望如此，是的，上学是功德，但终极目的是你能在社会中有所贡献。所以训练这些模子是好的，但终极目的是要让它们产生影响。

Brad Gerstner：你们是否已经在使用「推理链」和类似 o1 的工具来改进你们本身的业务？

黄仁勋：我们今天的网络安全系统离不开我们本身的智能体。我们有智能体帮助筹划芯片，如果没有这些智能体，Hopper 芯片就不大概实现，Blackwell 也不大概实现，Rubin 就更不用说了。

我们有 AI 芯片筹划师、AI 软件工程师、AI 验证工程师，而且我们都是在公司内部开辟的，因为我们有这个能力，我们更愿意使用这个机会本身探索这项技术。

推理的增长将会是十亿倍的（图源：NVIDIA）

我们必要更高效，更安全的 AI

Brad Gerstner：你知道，今天我走进这栋楼时，有人走过来对我说，你知道，问问 Jensen 关于文化的事变，统统都与文化有关。我看着你们的业务，我们谈了许多关于适应性和服从的事变，扁平化的组织布局可以快速实行，小团队运作。

你知道，英伟达在这个范畴独树一帜，每位员工平均创造了大约 400 万美元的收入，每位员工大约创造了 200 万美元的利润或自由现金流。你们创建了一种服从文化，真正开释了创造力、创新力、责任感和主人翁意识，你冲破了传统的职能管理模式。大家都喜欢谈论你有多少直接报告的员工。

AI 的使用是否是让你们在保持高度创造力的同时保持高效的关键？

黄仁勋：毫无疑问。我盼望有一天，英伟达今天有 32000 名员工，我们在以色列有 4000 个家庭，我盼望他们统统安好。我盼望有一天英伟达会成为一个拥有 50000 名员工和 1 亿个 AI 助手的公司。

在每个团队中，我们都会有一个 AI 目次，内里有一批善于做各种事变的 AI。我们还会有一个收件箱，内里布满了我们合作过并且知道很善于我们技能范畴的 AI 目次。因此，AI 会招募其他 AI 来办理题目。AI 也会在 Slack 频道中相互交换。

Brad Gerstner：并且与人类一起合作。

黄仁勋：和人类一起合作。所以我们将会是一个巨大的员工群体，一部分是数字化和 AI，一部分是生物学上的人类员工，我盼望未来另有一些是机电一体化的员工。

Brad Gerstner：从贸易角度来看，我认为这常常被误解。你刚刚描述了一家公司，它的产出相当于拥有 15 万员工的公司，但实际上你只用了 5 万员工。你并没有说你要裁掉所有员工，你仍在增加员工数量，但这家公司的产出将会显著增加，对吧？

黄仁勋：这是常常被误解的地方。AI 不会取代工作，它将改变每一个工作。AI 将对人们如何看待工作产生深远影响，这一点我们必须承认，对吧？

AI 有大概带来巨大的长处，也有大概造成伤害，我们必须构建安全的 AI，没错，这一点必须作为底子。但是被忽视的部分是，当公司使用人工智能提高生产力时，它很大概会带来更好的收益或更好的增长，或者两者兼而有之。而当这发生时，CEO 的下一封邮件不太大概是裁人通知。

Brad Gerstner：当然，因为公司在增长。

黄仁勋：是的，缘故原由是我们有比我们能够探索的更多的想法，我们必要人们来帮助我们思考，然后再去主动化这些想法。而主动化的部分，AI 可以帮助我们实现。

显然，它也会帮助我们进行思考，但我们仍旧必要去弄清楚我们想要办理什么题目。我们可以办理无数的题目，但公司必须选择那些最必要办理的题目，然后找到一种方式来实现主动化并扩大规模。

因此，随着我们变得更高效，我们将会雇佣更多的人。人们常常忘记这一点。如果回顾汗青，显然我们今天有比 200 年前更多的想法。这也是 GDP 和就业增长的缘故原由，只管我们一直在疯狂地进行主动化。

Brad Gerstner：这正是我们进入这一时期的告急点，险些所有的人类生产力和繁荣都是已往 200 年技术和主动化的副产品。你可以回顾一下，从亚当·斯密到熊彼特的创造性粉碎，已往 200 年人均 GDP 的增长图表，它不停加速发展。这让我想到一个题目。

如果你看 90 年代，美国的生产力增长率大约是每年 2.5% 到 3%。然后到了 2000 年代，它放缓到大约 1.8%。而已往十年，是记录上生产力增长最慢的时期。这指的是我们在固定的劳动力和资本投入下的产出增长，是我们有记录以来最慢的。

许多人对此进行了讨论。但如果天下如你所描述的那样，并且我们将使用和制造智能，那么我们是否正处于人类生产力即将出现巨大扩展的边缘？

黄仁勋：这是我们的盼望。这是我们的盼望，当然，你知道，我们生活在这个天下中，因此我们有直接的证据，对吧？我们有直接的证据，比如个别研究职员使用 AI，现在可以在亘古未有的规模上探索科学，这就是生产力的体现。

或者我们筹划出如此复杂的芯片，并以如此快的速率完成筹划，而公司的员工规模并没有以相同速率增长，这也是生产力的体现，对吧？我们开辟的软件也越来越好，因为我们在使用 AI 和超级计算机帮助我们，而员工数量险些是线性增长的。

这又是一个生产力的证实。所以无论我深入到哪个行业，我都可以自我检查，我可以亲身验证这些表现是否普遍存在。毫无疑问，智能是天下上最有价值的资源，而现在我们将大规模生产它。

我们都必须学会如安在四周都是 AI 的情况中生活，这些 AI 能够非常出色地完成任务，甚至比我们更好。当我反思这一点时，我发现这就是我的生活。

我有 60 个直接报告的部属，对吧？他们都是各自范畴的天下级人才，做得比我好得多。我和他们合作没有任何题目，我也没有题目去引导他们、与他们沟通。因此，我认为人们将要学到的是，他们都将成为 AI 智能体的 CEO。

他们必要拥有创造力、刻意，以及一些知识，知道如何分解题目，从而能够编程这些 AI 来帮助他们告竣目的，就像我管理公司一样。

Brad Gerstner：你提到了一个题目，就是关于对齐、安全 AI 的讨论。你也提到了中东正在发生的悲剧。你知道，现活着界的不同地方都有许多自主性和 AI 的应用。

所以我们来谈谈不良举动者、安全 AI，以及与华盛顿的和谐题目。你现在的感受如何？我们是否走在精确的门路上？我们的和谐是否足够？我记得马克·扎克伯格曾说，战胜坏 AI 的方式是让好 AI 变得更好。你会如何描述我们如何确保 AI 对人类有积极净效益，而不是让我们陷入一个无目的的反乌托邦天下？

黄仁勋：关于安全的讨论非常告急，也很有意义。抽象的观点，即将 AI 视为一个大型的神经网络，这种见解就不太好。而缘故原由是，我们知道，人工智能和大语言模子虽然相关，但并不相同。

现在有许多正在进行的工作，我认为非常出色。第一，开放源代码模子，使得每个行业、每家公司和整个研究界都能打仗到 AI，并学习如何使用这种能力来应用于他们的范畴。非常好。

第二，AI 的发展技术气力正在专注于发明如何使 AI 更加安全。AI 被用来筛选数据、筛选信息、训练其他 AI，创造出对齐的 AI，天生合成数据的 AI，扩展 AI 的知识，淘汰幻觉的 AI，以及所有被创造出来的用于矢量图像、图形等 AI，来告知和监控其他 AI 的系统，这些用于创建安全 AI 的 AI 系统还没有得到足够的承认。

Brad Gerstner：这些系统已经被构建出来了。

黄仁勋：对，我们正在制作这些系统，整个行业的所有人都在如许做。包括红队测试、流程控制、模子卡、评估系统、基准系统等等，所有这些安全机制正在以惊人的速率被构建出来。这些积极还没有得到应有的赞誉，你们懂的。

Brad Gerstner：是的，目前没有任何当局法规要求你们如许做。这是当前行业中的到场者们正在严肃对待这些关键题目，并围绕最佳实践进行和谐。

黄仁勋：完全精确，这些积极没有得到足够的承认，也没有被充分明白。人们必要开始讨论 AI 作为一个由多种 AI 组成的系统，以及它作为一个颠末良好工程筹划的系统的本质。

关于监管，我们要记住，AI 是一种能力，它可以应用于许多范畴。不肯定必要为每一项告急技术单独立法，但是也不能让监管过度扩展到不必要的范畴。

大部分的监管应该针对具体的应用来进行，例如 FAA（联邦航空管理局）、NIH（美国国立卫生研究院）、FDA（美国食品药品监督管理局）等机构已经在管理技术应用了，现在他们必要开始管理包罗 AI 的技术应用。

因此，不要误解这一点，不要忽视我们将必要激活的现有大量监管体系。不要仅依赖一个全球 AI 委员会，因为每个监管机构的设立都是有缘故原由的。这些不同的监管机构存在的缘故原由，就是为了应对不同的挑衅。让我们再次回到基本原则。

Clark Tang 在访谈中

AI 开源推动行业激活

Brad Gerstner：如果我不回到开放源代码这个题目上，我的同伴 Bill Gurley（编者注：本场访谈 Bill 缺席）大概会求全谴责我。你们近来发布了一个非常告急、非常强大的开源模子。显然，Meta 也在为开源做出重大贡献。

我在读 Twitter 时发现，关于开放与封闭的讨论非常热烈。你怎么看待开源，尤其是你们本身的开源模子与前沿技术保持同步的能力？这是第一个题目。

第二个题目是，拥有开源模子以及为贸易运营提供动力的封闭模子，这是否是你们未来的愿景？这两者是否能为 AI 安全创造一种健康的张力？

黄仁勋：开源与闭源的讨论与安全性有关，但不仅仅是关于安全性。例如，拥有闭源模子作为经济模子的引擎来维持创新，这是完全没有题目的，我对此经心全意支持。

我认为，将题目单纯地界说为闭源对抗开源是一种错误的头脑方式。应该是闭源和开源，对吧？因为开源对许多行业的激活是必要的。

如果现在没有开源，所有这些不同的科学范畴如何能够在 AI 上激活？因为他们必须开辟本身的范畴专属 AI，并且他们必要使用开源模子来创建范畴专属 AI。这两者是相关的，但并不相同。

仅仅因为你有一个开源模子，并不意味着你就拥有了 AI。因此，你必须有开源模子来推动 AI 的创建。所以，金融服务、医疗保健、交通运输，以及许多其他范畴的科学和行业，都是因为开源的推动而得以激活的。

Brad Gerstner：难以置信，你们的开源模子需求量很大吧？

黄仁勋：我们的开源模子？当然，Llama 的下载量，对吧？显然，Mark（扎克伯格）和他的团队所做的工作，令人难以置信，需求量爆棚，彻底激活了每个行业和每个科学范畴。

我们创建 Nemotron 的缘故原由是为了合成数据天生。直觉上，认为某个 AI 会一直循环天生数据来学习本身，听起来好像不太可靠。你能在谁人无限循环里转多少圈，这值得怀疑。不外，我的心中有一个形象，就像把一个超级聪明的人关在一个软包房里，一个月后再出来，大概并不会变得更聪明。

但是，如果有两三个人在一起讨论，我们有不同的 AI 模子，拥有不同的知识分布，能够相互问答、来回交换，那么我们三个人都会变得更聪明。所以 AI 模子之间相互交换、互动、来回讨论、辩论，进行强化学习和合成数据天生，这个想法直观上是有意义的。

因此，我们的 Nemotron 350B、340B 是天下上最好的嘉奖系统模子。它是最好的品评性模子，确实非常出色。所以，这是一个增强所有其他模子的奥妙工具，岂论其他模子多么良好，我都发起使用 Nemotron 340B 来进行增强，让它变得更好。而我们已经看到 Llama 变得更好，所有其他模子也因此受益。