英国芯片战略、阿里云财报与云上大模型竞争、生成式 AI 风险投资思考框架

☕️ Editor’s Note

今天是 2023 年 8 月 17 日，您正在阅读的是第 178 期 AI Insider。

本期「计算」专栏关注英国半导体政策、美国百亿美元芯片补贴分配、中国公司与中东国家抢购英伟达芯片。

「巨头」部分透过阿里云财报和分析师会议，解析大模型带给云计算公司的启示；AWS 自研芯片如何成为其竞逐大模型赛道的「秘密武器」，也是这部分探讨的议题。

「市场」专栏分享第二季度全球 AI 投融资洞察以及一份 AI 风险投资的思考框架，通过数据和投资人的视角，进一步了解 AI 市场的真实一面；与此同时，你还会看到大模型的「对抗式攻击」、麦肯锡 AI 适应性报告分享等。

接下来，欢迎和我一起复盘近期围绕数据与智能的产业关键事件。

大模型·计算

在半导体成为国家竞争关键的当下，各国政府也在相继加大对半导体的资金和政策扶持，英国政府近期出台的一系列政策表明，该国不会效仿美国、欧盟等国家为半导体工厂提供巨额补贴，而是基于现有产业优势，比如利用 ARM 公司的芯片设计能力，强化英国在半导体产业链中的优势地位。

看几个数字对比：

美国「芯片法案」提供高达 520 亿美元的补贴；
欧盟为半导体产业准备了 430 亿欧元的预算；
德国政府向英特尔一座工厂补贴数十亿欧元；
英国未来十年的半导体预算为 10 亿磅；

与此同时，英国政府还公布了半导体咨询委员会名单，包括树莓派创始人、ARM 公司架构师在内的半导体产业专业人士位列其中，该委员会的目的是向英国政府提供半导体国家战略的咨询和建议。

再来看美国数百亿芯片刺激计划——特别是面向芯片制造的资金——如何分配。美国商务部从华尔街投行、咨询机构等招募了一支团队，在商务部部长雷蒙德的领导下，这个小组更像是一家「政府里的投资机构」，其工作方式也和华尔街投行类似，比如有专门的投资人负责每个项目，根据申请信息进行数据收集、建立定量模型等。

在德国，台积电将与英飞凌、恩智浦和博世合作，共同建设一座位于德累斯顿的芯片制造工厂。该工厂的总投资预算超过 110 亿欧元，德国政府为这个工厂的补贴高达 55 亿欧元，台积电也为此投资 35 亿欧元。

台积电拥有这座工厂 70％的股权，英飞凌、恩智浦和博世将分别持有 10％的股权。工厂计划在 2027 年底之前开始制造芯片，重点是生产汽车和工业领域的芯片。

尽管包括德国在内的欧洲多个国家都在强调在本地建立芯片工厂，但人才短缺的现实已经成为各国构建芯片产业链的重要难题。在德国萨克森州的众多芯片工厂，巨大的技术人员和工程师需求只能通过从其他国家聘请工人来解决。

最近的一项研究指出，德国半导体行业存在 6.2 万名工人短缺，尤其是电气工程和软件开发领域的工人更为稀缺，由此也引发了是否开放技术移民的讨论。

再来聊聊英伟达。上周英伟达发布了面向服务器、并集成 GPU 和 CPU 的 GH200 Grace Hopper 超级芯片，其最高 141 GB 的 HBM3 内存以及每秒 5TB 的带宽，可以说是一款专门面向 ChatGPT 等大语言模型训练的芯片。

该芯片将于 2024 年第二季度开始生产，其战略意义可能比纸面的参数更大，毕竟，英伟达直接竞争对手的 AMD，正在努力在今年内正式发售最新款的 MI300 芯片，并在 2024 年提供足够的产量。下图是 MosaicML 公司展示的两家公司在软硬件方面的产品布局：

回到市场的角度，现阶段更多还是如何「抢购」更多英伟达已经发售的 AI 芯片，比如，包括百度、字节跳动、腾讯和阿里巴巴在内的中国科技巨头，已经至少为英伟达支付了 50 亿美元的订单，未来两年获得专为中国市场定制的 A800 芯片。

中国公司「抢购」的原因也不难理解。其一，在算法相对公开（大量论文）、数据训练集门槛不高（可以用钱解决的问题从来都不是问题）的背景下，算力就成为各大公司推进大模型产品的瓶颈，英伟达的 AI 芯片已经在 OpenAI、微软等公司的大模型训练中展示了作用，自然而言成为其他公司的选择，几个细节：

字节跳动内部已经储备了至少 1 万个英伟达 GPU，并已经订购了近 7 万个 A800 芯片，2024 年交付；
字节内部研发了一个名为「Grace」的 AI 聊天机器人，目前还在内测；
阿里巴巴已收到数千个英伟达的 A800 芯片；

一位百度员工更是直言，「没有这些芯片，我们无法进行大语言模型训练」。

另一方面，在中美地缘政治冲突短期内无解的背景下，半导体领域的任何政策调整都会对企业发展产生巨大影响，利用现阶段相对清晰的政策环境，赶快囤货才是关键。

中东国家也加入「抢购」英伟达芯片的阵营。沙特 Kaust 大学目前购买了至少 3000 个英伟达最新的 H100 芯片。价值 1.2 亿美元，值得一提的是，这所大学还拥有 200 个英伟达 A100 芯片，并在建造一台名为「Shaheen III」的超级计算机。

阿联酋也获得了数千个英伟达芯片，该国的开源大型语言模型 Falcon，就使用了 384 个英伟达 A100 芯片进行训练。

FT 从供应链处获得的数据显示，英伟达预计在 2023 年销售 50 万个 H100 芯片，主要供应给美国公司。

大模型·巨头

阿里云上周发布新一季度财报，营收同比增长 4% 至 251.23 亿人民币，经调整 EBITA 利润增长 106% 至 3.87 亿元人民币。

大语言模型显然给阿里云带来不小的增长机遇，新闻稿里强调，AI 热潮带来的算力和模型服务需求，推动本季营收的增长；与此同时，阿里巴巴架构调整后的并表业务及金融服务、教育、电力和汽车行业的客户驱动，也是本季度营收增长的关键。

在随后的阿里巴巴财报分析师会议上，张勇进一步解读了阿里云所面临的情况，一方面，需要理性看待阿里云增长放缓的状况，这很大程度与疫情期间的企业数字化选择有关，「我们正在调整策略聚焦公有云和核心客户，以实现长期稳定增长。预计在AI等新业务带动下,今年下半年增速将逐步回升」。

其次，为了更好应对云计算增速放缓的情况，阿里云将「积极推进公有云转型，因为公有云用户量大、需求稳定，有利于实现规模化效益」，同时优化运营流程和供应链来提升效率，以实现规模经济。

值得一提的是，就在财报发布后，多家媒体援引阿里内部的消息称，钉钉或将从阿里云内部独立，回归到阿里巴巴的体系里。此举意味着「云钉一体」战略的终结，而通过削减钉钉的运营成本，阿里云可以继续追求大客户和高利润，从而在上市的时候获得更好的市场回应。

第三，阿里云在大模型领域的布局包括两个方面：

开源：深耕开源社区，继续升级自研模型，并开源部分模型。
商业化：通过提供底层计算力实现变现，在鼓励客户提供二次产品的同时，积极推出面向行业的垂直模型；

透过阿里云财报和分析师会议记录，我们也可以一窥大模型带给云计算产业的几点启示：

算力需求正在激增，阿里云现阶段也只能满足部分客户对于大模型训练的算力需求，这凸显出大模型时代计算能力的竞争会成为关键，这也从另一个侧面展示英伟达等芯片公司为何持续被追捧；
通用大模型的价值远不如行业模型，原因在于，前者缺乏落地实际场景，还需要更多「Know How」以及工程化的工作，而后者能给企业快速带来价值。

算力成为云上大模型的竞争的关键之一，这也是 AWS 的的核心竞争力之一，过去几年，AWS 在自研芯片领域进行了大量布局：

2013 年发布一款名为 Nitro 的专用硬件，你可以将其理解为 AWS 的计算加速器，目前已经部署到 AWS 所有云服务器；
2015 年，随着亚马逊收购以色列芯片创业公司 Annapurna Labs，AWS 的自研芯片进入快车道；
2018 年 AWS 发布首款基于 ARM 架构的服务器芯片 Graviton；
也是在 2018 年，AWS 发布 AI 推理芯片 Inferentia；
2021 年，AWS 发布 AI 训练芯片 Trainium，并在 2022 年发布第二代；

利用自研芯片，AWS 能够减少对于上游服务器芯片公司——英特尔、AMD——的依赖，从而为云产品的降价提供空间；而自研硬件也能够与软件产品实现更好的协同，进一步优化云服务的体验。

不过，自研芯片是否能够应对大模型时代的算力需求，目前还是一个未知数，就像 AWS 从来不会透露云服务中的自研 CPU 和英特尔 CPU 之间的比例一样（除特定芯片的计算实例外），外界也不会轻易知道 AWS AI 芯片在 AI 云服务中的比重。

对于 AWS 和阿里云这两大中美云计算巨头来说，过去十几年在产品、客户层面的积累，才是他们接下来利用大模型发展机遇，实现新一轮增长的关键。毕竟，任何一个大模型应用都需要数据、算法的加持，如果客户此前就使用 AWS 或阿里云的服务，那么数据就存储在 S3 或 OSS（对象存储）里；而大模型应用的部署，也需要和其他产品——包括但不限于 CDN、数据库——实现协同，这些复杂而真实的开发场景，远非一家大模型公司——即便是 OpenAI——所能覆盖。

从这个角度去看，我依然看好云计算公司会成为大模型竞争的受益者，甚至是比英伟达等一众芯片公司更长期的受益者。

大模型·市场

先看关注两笔投融资案例：

德国创业公司 Deepset GmbH 获得 3000 万美元融资，这家公司面向开发者提供可方便构建自然语言应用的开源框架 Haystack，Alphabet 旗下的投资部门 GV 参与了此次投资；
明星创业公司 Anthropic 日前获得韩国 SK 电信的 1 亿美元投资，并共同开发面向电信市场的大语言模型；韩国 SK 电信参与过 Anthropic 公司今年 5 月的一笔总额 4.5 亿美元的融资，不过 SK 电信并未透露其投资比例；

CB Insights 统计了 2023 年第二季度全球 AI 市场投融资案例，给出以下一组发现：

其一，全球第二季度 AI 领域的投融资交易总额为 94 亿美元，环比下降 38%，主要是因为 OpenAI 在一季度获得 100 亿美元融资，如果减去 OpenAI 的这笔巨额融资，二季度增长了 81%。

其二，第二季度融资最高的 5 笔融资里，有 4 笔流入生成式 AI 领域；而本季度新增加的 7 个 AI「独角兽公司」（估值超过 10 亿美元的创业公司）里，生成式 AI 公司占了 5 个：Cohere、Replit、Runway, Synthesia、Typeface。

对于生成式 AI 市场的发展，风险投资公司 Mosaic 上周发布了一份投资思考框架，提到几个关注角度：

市场机会：一家公司提供的产品要么是增强现有产品、要么是替代现有方案，如何理解这其中的机会与困难？
产品：大模型从来不是产品，提示词也不是产品，真正的产品是如何把大模型、提示词落地到用户使用情景之中；
护城河：这是一个古老的命题，但在大模型时代格外需要注意，毕竟有大量产品建立在对大模型调参的基础之上，这几乎没有多少「防御能力」；
从关注开发到聚焦市场：大模型领域的快速发展，不断降低基于模型创业的门槛，开发门槛、成本也在大幅下降，如何商业化运营产品，并在市场、营销层面进行迭代创新，正在变得越来越重要。

几家明星创业公司近期都遭遇一些争议。文本生成图像创业公司 Stability AI 面临内部一系列动荡。3 月份以来，至少有 6 名高管离职，关于该公司 CEO Emad Mostaque 能力、人品的质疑也层出不穷，受此影响，Stability AI 新一轮高达 40 亿美元的融资过程面临诸多困难。

OpenAI 的 ChatGPT 成为「对抗性攻击」的研究对象，与之前的「越狱」不同，后者可通过自动化的方式构建，攻击者可创建无限量的内容。

和图像类的「对抗性攻击」类似，研究者在一些开源大模型以及 ChatGPT 等闭源模型上，仅使用一些后缀字符串就能让模型「变坏」，下图是研究者的示例（有可能包含令你感到不适的内容）：

你可以在这里阅读这篇研究论文。

这项研究至少有两个方面的价值：其一，过度关注所谓「模型对齐」——简单理解为模型和人类在核心价值观上基本一致——意义不大，系统输出的稳定性更重要；其二，任何时候都不要让大模型自行做决定，因为这类「对抗性攻击」基本无解。

最后分享一份咨询公司麦肯锡的 AI 适应性报告，数据和图表较多，感兴趣的朋友可以通过这里详细查看。如果用一句话总结：2023 生成式 AI 的应用快速增长，但整体使用还处于早期阶段，鉴于该技术的不确定性，大公司的部署使用非常谨慎。

以上就是本期「AI Insider」的全部内容，再次感谢您的支持，有任何问题或建议，欢迎写邮件给我：zhaosaipo@gmail.com

这封邮件是 Dailyio Pro 及 Premium 的专属内容，但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。

更新您的邮箱信息
查看网页版
点击这里退订