今天是 2023 年 8 月 17 日,您正在阅读的是第 178 期 AI Insider。
本期「计算」专栏关注英国半导体政策、美国百亿美元芯片补贴分配、中国公司与中东国家抢购英伟达芯片。
「巨头」部分透过阿里云财报和分析师会议,解析大模型带给云计算公司的启示;AWS 自研芯片如何成为其竞逐大模型赛道的「秘密武器」,也是这部分探讨的议题。
「市场」专栏分享第二季度全球 AI 投融资洞察以及一份 AI 风险投资的思考框架,通过数据和投资人的视角,进一步了解 AI 市场的真实一面;与此同时,你还会看到大模型的「对抗式攻击」、麦肯锡 AI 适应性报告分享等。
接下来,欢迎和我一起复盘近期围绕数据与智能的产业关键事件。
在半导体成为国家竞争关键的当下,各国政府也在相继加大对半导体的资金和政策扶持,英国政府近期出台的一系列政策表明,该国不会效仿美国、欧盟等国家为半导体工厂提供巨额补贴,而是基于现有产业优势,比如利用 ARM 公司的芯片设计能力,强化英国在半导体产业链中的优势地位。
看几个数字对比:
与此同时,英国政府还公布了半导体咨询委员会名单,包括树莓派创始人、ARM 公司架构师在内的半导体产业专业人士位列其中,该委员会的目的是向英国政府提供半导体国家战略的咨询和建议。
再来看美国数百亿芯片刺激计划——特别是面向芯片制造的资金——如何分配。美国商务部从华尔街投行、咨询机构等招募了一支团队,在商务部部长雷蒙德的领导下,这个小组更像是一家「政府里的投资机构」,其工作方式也和华尔街投行类似,比如有专门的投资人负责每个项目,根据申请信息进行数据收集、建立定量模型等。
在德国,台积电将与英飞凌、恩智浦和博世合作,共同建设一座位于德累斯顿的芯片制造工厂。该工厂的总投资预算超过 110 亿欧元,德国政府为这个工厂的补贴高达 55 亿欧元,台积电也为此投资 35 亿欧元。
台积电拥有这座工厂 70% 的股权,英飞凌、恩智浦和博世将分别持有 10% 的股权。工厂计划在 2027 年底之前开始制造芯片,重点是生产汽车和工业领域的芯片。
尽管包括德国在内的欧洲多个国家都在强调在本地建立芯片工厂,但人才短缺的现实已经成为各国构建芯片产业链的重要难题。在德国萨克森州的众多芯片工厂,巨大的技术人员和工程师需求只能通过从其他国家聘请工人来解决。
最近的一项研究指出,德国半导体行业存在 6.2 万名工人短缺,尤其是电气工程和软件开发领域的工人更为稀缺,由此也引发了是否开放技术移民的讨论。
再来聊聊英伟达。上周英伟达发布了面向服务器、并集成 GPU 和 CPU 的 GH200 Grace Hopper 超级芯片,其最高 141 GB 的 HBM3 内存以及每秒 5TB 的带宽,可以说是一款专门面向 ChatGPT 等大语言模型训练的芯片。
该芯片将于 2024 年第二季度开始生产,其战略意义可能比纸面的参数更大,毕竟,英伟达直接竞争对手的 AMD,正在努力在今年内正式发售最新款的 MI300 芯片,并在 2024 年提供足够的产量。下图是 MosaicML 公司展示的两家公司在软硬件方面的产品布局:
回到市场的角度,现阶段更多还是如何「抢购」更多英伟达已经发售的 AI 芯片,比如,包括百度、字节跳动、腾讯和阿里巴巴在内的中国科技巨头,已经至少为英伟达支付了 50 亿美元的订单,未来两年获得专为中国市场定制的 A800 芯片。
中国公司「抢购」的原因也不难理解。其一,在算法相对公开(大量论文)、数据训练集门槛不高(可以用钱解决的问题从来都不是问题)的背景下,算力就成为各大公司推进大模型产品的瓶颈,英伟达的 AI 芯片已经在 OpenAI、微软等公司的大模型训练中展示了作用,自然而言成为其他公司的选择,几个细节:
一位百度员工更是直言,「没有这些芯片,我们无法进行大语言模型训练」。
另一方面,在中美地缘政治冲突短期内无解的背景下,半导体领域的任何政策调整都会对企业发展产生巨大影响,利用现阶段相对清晰的政策环境,赶快囤货才是关键。
中东国家也加入「抢购」英伟达芯片的阵营。沙特 Kaust 大学目前购买了至少 3000 个英伟达最新的 H100 芯片。价值 1.2 亿美元,值得一提的是,这所大学还拥有 200 个英伟达 A100 芯片,并在建造一台名为「Shaheen III」的超级计算机。
阿联酋也获得了数千个英伟达芯片,该国的开源大型语言模型 Falcon,就使用了 384 个英伟达 A100 芯片进行训练。
FT 从供应链处获得的数据显示,英伟达预计在 2023 年销售 50 万个 H100 芯片,主要供应给美国公司。
阿里云上周发布新一季度财报,营收同比增长 4% 至 251.23 亿人民币,经调整 EBITA 利润增长 106% 至 3.87 亿元人民币。
大语言模型显然给阿里云带来不小的增长机遇,新闻稿里强调,AI 热潮带来的算力和模型服务需求,推动本季营收的增长;与此同时,阿里巴巴架构调整后的并表业务及金融服务、教育、电力和汽车行业的客户驱动,也是本季度营收增长的关键。
在随后的阿里巴巴财报分析师会议上,张勇进一步解读了阿里云所面临的情况,一方面,需要理性看待阿里云增长放缓的状况,这很大程度与疫情期间的企业数字化选择有关,「我们正在调整策略聚焦公有云和核心客户,以实现长期稳定增长。预计在AI等新业务带动下,今年下半年增速将逐步回升」。
其次,为了更好应对云计算增速放缓的情况,阿里云将「积极推进公有云转型,因为公有云用户量大、需求稳定,有利于实现规模化效益」,同时优化运营流程和供应链来提升效率,以实现规模经济。
值得一提的是,就在财报发布后,多家媒体援引阿里内部的消息称,钉钉或将从阿里云内部独立,回归到阿里巴巴的体系里。此举意味着「云钉一体」战略的终结,而通过削减钉钉的运营成本,阿里云可以继续追求大客户和高利润,从而在上市的时候获得更好的市场回应。
第三,阿里云在大模型领域的布局包括两个方面:
透过阿里云财报和分析师会议记录,我们也可以一窥大模型带给云计算产业的几点启示:
算力成为云上大模型的竞争的关键之一,这也是 AWS 的的核心竞争力之一,过去几年,AWS 在自研芯片领域进行了大量布局:
利用自研芯片,AWS 能够减少对于上游服务器芯片公司——英特尔、AMD——的依赖,从而为云产品的降价提供空间;而自研硬件也能够与软件产品实现更好的协同,进一步优化云服务的体验。
不过,自研芯片是否能够应对大模型时代的算力需求,目前还是一个未知数,就像 AWS 从来不会透露云服务中的自研 CPU 和英特尔 CPU 之间的比例一样(除特定芯片的计算实例外),外界也不会轻易知道 AWS AI 芯片在 AI 云服务中的比重。
对于 AWS 和阿里云这两大中美云计算巨头来说,过去十几年在产品、客户层面的积累,才是他们接下来利用大模型发展机遇,实现新一轮增长的关键。毕竟,任何一个大模型应用都需要数据、算法的加持,如果客户此前就使用 AWS 或阿里云的服务,那么数据就存储在 S3 或 OSS(对象存储)里;而大模型应用的部署,也需要和其他产品——包括但不限于 CDN、数据库——实现协同,这些复杂而真实的开发场景,远非一家大模型公司——即便是 OpenAI——所能覆盖。
从这个角度去看,我依然看好云计算公司会成为大模型竞争的受益者,甚至是比英伟达等一众芯片公司更长期的受益者。
先看关注两笔投融资案例:
CB Insights 统计了 2023 年第二季度全球 AI 市场投融资案例,给出以下一组发现:
其一,全球第二季度 AI 领域的投融资交易总额为 94 亿美元,环比下降 38%,主要是因为 OpenAI 在一季度获得 100 亿美元融资,如果减去 OpenAI 的这笔巨额融资,二季度增长了 81%。
其二,第二季度融资最高的 5 笔融资里,有 4 笔流入生成式 AI 领域;而本季度新增加的 7 个 AI「独角兽公司」(估值超过 10 亿美元的创业公司)里,生成式 AI 公司占了 5 个:Cohere、Replit、Runway, Synthesia、Typeface。
对于生成式 AI 市场的发展,风险投资公司 Mosaic 上周发布了一份投资思考框架,提到几个关注角度:
几家明星创业公司近期都遭遇一些争议。文本生成图像创业公司 Stability AI 面临内部一系列动荡。3 月份以来,至少有 6 名高管离职,关于该公司 CEO Emad Mostaque 能力、人品的质疑也层出不穷,受此影响,Stability AI 新一轮高达 40 亿美元的融资过程面临诸多困难。
OpenAI 的 ChatGPT 成为「对抗性攻击」的研究对象,与之前的「越狱」不同,后者可通过自动化的方式构建,攻击者可创建无限量的内容。
和图像类的「对抗性攻击」类似,研究者在一些开源大模型以及 ChatGPT 等闭源模型上,仅使用一些后缀字符串就能让模型「变坏」,下图是研究者的示例(有可能包含令你感到不适的内容):
你可以在这里阅读这篇研究论文。
这项研究至少有两个方面的价值:其一,过度关注所谓「模型对齐」——简单理解为模型和人类在核心价值观上基本一致——意义不大,系统输出的稳定性更重要;其二,任何时候都不要让大模型自行做决定,因为这类「对抗性攻击」基本无解。
最后分享一份咨询公司麦肯锡的 AI 适应性报告,数据和图表较多,感兴趣的朋友可以通过这里详细查看。如果用一句话总结:2023 生成式 AI 的应用快速增长,但整体使用还处于早期阶段,鉴于该技术的不确定性,大公司的部署使用非常谨慎。
这封邮件是 Dailyio Pro 及 Premium 的专属内容,但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。