焦点:英伟达进入 CPU 市场
英伟达在上周举办的 GPU 科技峰会(GPU Technology Conference ,以下简称「GTC」)上发布一系列新产品,比如 GPU 新系列 A10、A30,与旗舰的 A100 采用同样安培架构,但在功耗、性能上做了优化与调整,旨在面向承担不起 A100 GPU 的客户。
再比如针对自动驾驶场景的 Atlan 芯片系列,英伟达将其称之为「车轮上的 AI 数据中心」,其算力可以达到 1000 Tops,面向的是 L4 乃至 L5 级别的自动驾驶,下图是英伟达发布会上的一张对比图,值得一提的是,2019 年发布的、提供 254 Tops 算力的 Orin 要到 2022 年才会出货:
这也意味着,英伟达已经提前四年规划了汽车 AI 芯片的算力发展,沃尔沃汽车也宣布会在 2022 年的新车上使用英伟达的 Orin 芯片。
而在上述传统产品之外,此次英伟达最引人瞩目的则是其正式踏入到 CPU 市场,英伟达展示了首款基于 ARM 架构 CPU 产品 Grace,这是一个面向数据中心的 CPU 产品线,相关的产品参数可参考这里,该产品将在 2023 年正式发货。
相比于 GPU、车载 AI 芯片的新产品,英伟达的 CPU 布局值得格外关注。
首先,英伟达目前的产品线,既有传统的 GPU 系列,同时还有去年发布的 DPU(data processing units)和 CPU,我曾在英伟达发布 DPU 之后的「AI Insider」里写道:
从产品定位上看,这是一个面向数据中心的数据处理产品,如果说 CPU 是通用场景计算方案,那么 DPU 则是数据计算专属方案,加上本身在图形计算领域优势明显的 GPU,英伟达向数据中心又迈出重要一步。
而此次推出 CPU 之后,英伟达将通用计算、数据计算以及特定场景计算的需求完全覆盖,形成了一个面向数据中心计算的完整产品线。
其次,相比于 X86 架构 CPU 的通用计算能力,英伟达更在意 CPU 的 AI 计算能力,发布会上,英伟达不断强调 Grace 在处理深度学习模型,特别是语音与 NLP 中的巨大提升。按照英伟达 CEO 黄仁勋给出的数据,服务器用上这款 CPU 后, AI 性能将超过 x86 架构CPU 的 10 倍。
这也符合当下数据中心、云服务中激增的 AI 计算需求,不管是需要极致算力的 GPU 还是需要通用场景 AI 算力的 CPU,英伟达都有自己的产品。
在英伟达 Grace 发布后,资本市场很快对英特尔投出了自己的选择。
信息革命的发展史,也是一场关于算力的竞逐史,2010 年代我们看到了英特尔一边「挤牙膏」一边呼喊「摩尔定律未死」,同时也体会到由 GPU 驱动的 AI 算力指数级增长,接下来的 2020 年代,可能会成为自 CPU 之后人类计算历史上最重要的一个阶段,新的计算形态、计算架构以及新的材料,会成为推动 AI、自动驾驶、生物科技的最底层力量。
|