☕️ Editor’s Note

今天是 2021 年 12 月 15 日,您看到是第 115 期「AI Insider」

本期「焦点」专栏,我将通过分析 AWS 上周严重宕机的原因,探讨云计算发展的几个不变需求,毕竟,如贝佐斯所言,「企业的战略应该建立在不变的事物之上」。

2022 年,狭义层面的 AI 领域会有哪些看点或趋势,我给出了三个方面的思考,包括语言模型、低代码以及元宇宙。

本期还将关注:

  • 地区:一份全新的中美 AI 竞争报告、五角大楼新 AI 管理者职位;
  • 研究:NeurIPS 2021 大会一览、DeepMind 向化学领域发展;
  • 市场:AI 公司 IPO、融资与微软收购遭遇反垄断审查;
  • 伦理:韩国/英国的面部识别应用、AI 算法伦理探讨等;

焦点·洞察


宕机、多云、成本与新机会

上周,AWS 遭遇长达五小时的宕机事故,从 Netflix、Roku 到麦当劳以及自家的电商业务、物流业务 Amazon Flex 都被波及,这既显示出 AWS 庞大的客户群体,同时也向企业客户提出一个问题:企业只使用 AWS 或单一云服务商,够吗?

根据 AWS 发布的事故原因分析报告,此次宕机的原因是 AWS 内部网络服务之间的联系出现问题。简单来说,AWS 通过内部网络支撑其 AWS 网站上的海量产品和服务,客户利用控制台或命令行终端购买、部署这些服务,而当 AWS 内部网络运行出现故障的时候,一些严重依赖 AWS 内网的产品就出现了问题。

更进一步,由于 AWS 内部网络与产品之间复杂的设计,尽管并不是所有 AWS 服务受到影响,但某个产品里的 API 无法使用,也意味着这个产品不可用,甚至连客户反馈问题的「联络中心」也因为网络问题无法使用,当然,用于监控服务可用性的监控面板也不可用……

也是在上周,一家主打多云战略的公司 HashiCorp 上市,或许是 AWS 的负面案例太过明显,市场对多云公司给出了积极回应,这家售卖多云管理工具的公司,市值已突破 150 亿美元。

过去十几年时间里,「弹性可扩展」、「低成本」、「敏捷性」、「可靠性」等等词汇不断出现在云计算的市场宣传里,这些词构成了云区别与传统 IT 或自建数据中心的优势与特点,但现在,我们有必要重新审视一番云的这些优势。

其一,云计算公司在提供「弹性可扩展」的同时,也通过复杂的产品服务组合稀释「低成本」。

想了解 AWS 的账单以及计算方式有多复杂,只需通过「aws bill+optimization」作为搜索关键词就能看到巨大的市场供应。

投资公司 a16z 今年发表了一篇质疑云计算的分析文章,像极了皇帝穿着「新衣」上街,只有一个「小孩儿」提出问题的情形,它试图指出一种可能:公司,特别是创业公司,不要被云计算的低成本入门产品所迷惑,稍有不慎,云计算成本就会吞噬公司的利润。

其二,任何一个系统,都不可能维持 100% 的可靠性。主流的云计算公司会给出 99.9999% 的可靠性承诺,但哪怕到了小数点后面第几位,再强大的云服务商依然有宕机的可能,AWS 几乎每年都有一到两次的长时间故障,微软 10 月份经历了 10 个小时的宕机,这些被广而告之的故障,连同更多因为影响范围小而没有披露问题,构成了当下云计算的「可靠性」。

在这个背景下,一开始为了解决「云厂商锁定」的多云产品也有了新的用武之地,HashiCorp 在其 IPO 招股说明书给出了一个数字,约 79% 的财富 500 强公司已经下载了该公司的工具。这既说明了 HashiCorp 的产品能力,同时也将多云的市场需求展示出来了。

美国连锁零售巨头 Target 就是一个典型案例,通过使用 HashiCorp 的多云管理工具,Target 的应用既运行在自己的数据中心,也使用了微软 Azure、Google Cloud 的服务。而在 Target CIO Mike McNamara 看来,之所以这么做,与所谓「多云」并没有太直接的关系,该公司希望保持对 Target 内部部署和管理的控制,这样如果 Google Cloud 变得昂贵,就可以将工作负载转移到 Azure,反之亦然。

亚马逊创始人贝佐斯曾说过这么一番话

I very frequently get the question: ‘What’s going to change in the next 10 years?’ And that is a very interesting question; it’s a very common one. I almost never get the question: ‘What’s not going to change in the next 10 years?’ And I submit to you that that second question is actually the more important of the two – because you can build a business strategy around the things that are stable in time. …

贝佐斯大意是说,不要关注未来十年有什么新变化,公司应该把战略放在那些不变的事情上,在云计算领域,公有云也好,混合云也罢,「低成本」、「弹性可扩展性」、「可靠性」等,这些都是客户不变的需求,这是云计算公司的新挑战,也是新机遇。

产业·观点

 

2022 年我关注哪些 AI 技术趋势

过去几年,AI 的各项技术陆续从实验室进入商业场景,伴随着希望与失望的复杂情绪,「AI」这个词已然变成两极分化的评价,一方面,我听到各种关于「人工智能是像电力一样的通用技术」的说法,而在另一个维度上,「人工智能是现代炼金术」的评价不绝于耳。

上述两类说法有意无意简化了关于人工智能、机器学习、深度学习、机器人、自动驾驶、自动化之间的复杂关系,上述两个广义上的 AI 判断除了市场宣传与标题党吸引流量之外,毫无意义。

作为一个长期观察 AI 产业发展的内容从业者,站在 2021 年末的时间点向前看,我从狭义的层面梳理了几个 2022 年 AI 发展的技术和产业趋势,供各位参考。

首先,更有效率的语言模型。近两年来,语言模型领域不断取得突破,超大规模语言模型越发成为大量对话应用创新的底层技术,但另一方面,训练超大规模语言模型的巨大计算成本与超高功耗,也让这个领域变成了巨头的赛道。

继续增大规模的趋势在 2022 年当然不会出现根本变化,比如 2022 年可能发布的 GPT-4,其规模预计是前一代的 500 倍,但我认为,在规模之外,小样本训练数据、持续降低的功耗将会成为新的趋势,比如上周,DeepMind 发布了全新语言生成模型 RETRO,其创新点在于,可以在极小规模(70 亿参数)的情况下实现更高的性能,其性能大约相当于 25 倍参数规模的模型,换句话说,就是以更少的资源办更多的事情。

其次,低代码/无代码的 AI 服务会越来越多。缺乏 AI 人才是当下行业的现实问题,特别是缺乏如何将机器学习或深度学习技术应用到解决行业问题的人才。

这也让低代码/无代码的 AI 服务有了更多用武之地,过去的 2021 年,从 AWS、微软、阿里云等行业巨头到诸多创业公司,陆续推出了一系列「组件化」、「可拖拽」的 AI 服务,这些服务封装了大量机器学习的工作流程,简化了从数据收集到模型推理的步骤,让「业务人员直接使用 AI」的口号会成为 2022 年的重要趋势。

第三,「元宇宙」如何与 AI 互动融合,是一个非常有趣的方向。坦白来说,我对「元宇宙」的炒作不感兴趣,但作为「元宇宙」重要推动力量的 Meta(原 Facebook),其强大的 AI 工程化能力让我觉得「元宇宙」和 AI 的互动,会给 2022 年的 AI 产业变化带来诸多变数,而我也从不同渠道了解到,一大批中国 AI 创业公司,已经或正在将自己迁入「元宇宙」。

AI Insider Monthly(2021-11)

本期将关注以下议题:

  • 产业·焦点:企业市场的元宇宙;
  • 产业·洞察:机器学习/大数据与 AI 的产业全景图、持续亏损的中国 AI 独角兽们;
  • 市场·数据:Q3 全球 AI 投资分析;
  • 巨头·云计算:阿里云财报、Google 云进入金融领域、微软发布 GPT-3 云服务;
  • 巨头·AI:英伟达财报、微软人事调整、腾讯 AI 芯片与智能云战略;
  • 市场·融资:过去一个月,哪些 AI/云创业公司获得融资?
  • 政府·政策:新加坡/法国的 AI 国家战略进展、基辛格谈 AI 监管;

本期还提供了 PDF,您可通过以下地址快速下载:

请查收 2021 年 11 月的 AI 与云计算产业发展报告。

研究·语言模型

NeurIPS 2021 大会一览。这是深度学习领域最重要的学术会议之一,某种意义上也是深度学习基础研究的风向标。

先看一组数据:

  • 2021 年论文提交数量同比下降了 3.5%,共计 9122 篇;
  • 2021 年入选论文数量为 2344 篇,同比增加了 23%,入选率达到 26%,数量和入选率近几年最高;

综合两个数字,我们无法倒推出所谓「AI 炒作」是否结束的结论,或许这只是今年的一个特殊现象。

以论文作者所在的公司来统计的话,以下是前几位的公司:

  • Google:177 篇论文;
  • 微软:116 篇论文;
  • DeepMind:81 篇论文;
  • Meta(Facebook):78 篇;

中国的公司分布:

  • 阿里巴巴:20 篇论文;
  • 腾讯:19 篇论文;
  • 百度:16 篇论文;

另外,苹果有 10 篇论文,这与苹果苛刻的公司保密文化相关。

学校层面:

  • MIT:142 篇论文;
  • 斯坦福大学:139 篇;
  • CMU:117 篇;

中国的清华大学(90 篇)、北京大学(63 篇)位列第五和第八。

今年 NeurIPS 的一个热点依然是 Transformer 模型,这是 Google 在 2017 年提出的一种神经网络架构。过去几年,Transfomer 模型从语言领域已经延伸到计算机视觉领域,2020 年出现的 Vision Transformer,在图像分类、检测、分割三个场景里获得较好成绩,包括特斯拉在内的一些自动驾驶公司悄然将 Transfomer 模型应用到处理车辆摄像头数据的场景中。

DeepMind 开始研究电子如何化学系统中相互作用。通过一款名为 DeepMind 21 的工具,研究者们展示了一种基于机器学习理解化学的可能性,你可以通过 DeepMind 的博客文章进一步了解这个工具,同时发表《科学》杂志上的论文详细介绍了这个方法。

Meta 展示新 AI 系统如何快速识别社交媒体上的「有害内容」,目前这个系统还处在早期阶段,不过 Meta 官方博客称,这是「重要里程碑」,该系统的「学习方式」与人类类似,并不是仅仅通过打标签的方式,而是把几十亿语言案例、带标签的数据等放在一起训练,该系统相比之前的模型提升了 12%。

将语言模型应用到人类辩论里。这个由英伟达研究者开发的 Transformer 模型,接受了包括英文维基百科、6200 万新闻、Reddit 论坛的海量数据训练,并在近期参加牛津大学联盟组织的「人工智能伦理」辩论,该模型给出了几个「论点」:

  • 避免 AI 军备竞赛的唯一方法是完全没有 AI;
  • AI 不够聪明,它只是一个工具,工具可以用于好和坏。

脑机接口 Neuralink 或将在明年开始向人类植入芯片,这是 Elon Musk 所希望的样子,根据 Musk 透露的消息,Neuralink 的研究在猴子身上的测试结果很好,同时他很表示「Neuralink 的标准要远远高于 FDA 的要求」。

当然,Elon Musk 话——特别是时间表——有多不靠谱,各位应该也很清楚。

国家·政策

又一份中美 AI 竞争格局的报告,这份报告的初衷是向白宫提供 AI 战略咨询,后来经过拓展,从而形成一份分析报告。

在我看来,这份报告有两大主调:其一,将中国作为美国在 AI 领域的「全方位竞争对手」,同时也是美国有史以来最强大的竞争对手;其二,将 AI 看作未来十年最有可能影响安全和经济的关键技术。

这份报告呈现了几个 AI 领域的竞争态势:

  • 面部识别领域的竞争已经结束,中国是毫无疑问的胜者;
  • 人才领域的竞争也不相上下;
  • 全球 10 家估值最高的 AI 创业公司里,美国有 7 家,中国有 3 家;
  • 中国不断加大在半导体、5G、生物技术领域的投资

你可以在这里免费获取这份 52 页的报告。

在 AI 国际竞争中,欧洲似乎一直处于「边缘地位」,但真实情况并非如此,一组数据显示,欧洲地区对机器学习的热情非常高,比如 2021 年 8 月到 10 月之间,欧洲公司的机器学习招聘工作数量最高。

img

这份数据由追踪各个行业招聘职位变化的 GlobalData 提供,可以作为一个观察行业技术趋势的切入口。具体到国家,德国地区的机器学习职位占据整个招聘市场的 2.5%,高于去年 1.5%,增长最快。

img

而在城市分布上,华盛顿、班加罗尔、旧金山的机器学习工作职位最多。

五角大楼将增加新职位,该职位名称为「首席数字和人工智能官(CDAO)」,将统筹美国国防部的联合人工智能中心(JAIC)、国防数字服务(DDC)和首席数据官(CDO)的工作,这个职位将向国防部副部长 Kathleen Hicks 汇报。

市场·业界

上市。在被美国财政部列入「中国军工复合体企业名单」之后,商汤科技本周表示将推迟在港上市计划,该公司的声明称:「为保障有意投资者的利益以及考虑该事态发展对其投资决定的潜在影响,公司董事会决定在港全球发售及上市将会延迟。」

公开资料显示,软银和阿里巴巴旗下淘宝是商汤科技的两大股东,分别持股 14.88% 和 7.59%,另外还有包括银湖资本、富达、高通在内的美资股东。

而在另一个 AI 公司上市计划里,软银也扮演了重要角色,由沃尔玛投资的 AI 机器人公司 Symbotic 将与软银旗下的 SVF Investment Corp 3 合并,从而以 SPAC 的形式完成 IPO。

Symbotic 公司的 Symbot 机器人可以在物流中心从事商品卸载、存储等工作,沃尔玛既是该公司的投资机构之一,又是其大客户,Symbotic 预计市值将达到 55 亿美元。

融资。自动驾驶创业公司 Robotic Research 完成 2.28 亿美元的融资,投资机构包括软银、启蒙资本等,这家公司的主要客户是美国军方,其产品也是针对军事场景,比如如何在道路崎岖、没有 GPS 导航的时候实现自动驾驶等,新一轮融资将帮助 Robotic Research 推进在民用自动驾驶领域的技术研发。

一家面向企业市场提供虚拟人物制作的创业公司 Synthesia 完成 B 轮 5000 万美元的融资,利用该公司的产品,企业客户通过输入文本,即可生成一个虚拟人像开始演讲或会议,这家公司的愿景也非常大,「在笔记本电脑上创作一部好莱坞电影」。

监管。欧盟上周批准微软对语音公司 Nuance 的收购,微软在今年 4 月宣布了这份作价 197 亿美元的收购要约,旨在通过整合 Nuance 的语音技术以及医疗资源,强化其在医疗云计算领域的能力。

6 月的时候,美国市场监管部门已经批准了这笔交易。

但英国市场监管机构上周则表示,将启动对该收购的第一阶段全面调查,研究其收购是否会减少市场竞争。最近英国对科技公司的收购审查非常严厉,上月,英国市场监管机构以交易损害市场竞争为由,要求 Meta(Facebook)卖出 Giphy。

伦理·面部识别

为了追踪新冠疫情感染者,韩国政府正在富川市进行面部识别系统的测试工作,通过分析城市监控摄像头里的数据追踪感染者,包括确定他们的轨迹、与哪些人互动以及是否佩戴口罩等。

根据路透社获取的一份计划,这个项目将在明年 1 月正式启动,韩国政府为其投入了 130 万美元,希望可以减少从事流行病学调查工作者的工作负荷。

每日邮报》也披露英国南威尔士警察使用面部识别的案例,目前这项计划还处在早期测试阶段,70 名常年在外的警察人员会安装一个面部识别应用程序,警察可以将现场拍摄的人像照片上传到该系统,一旦系统确认这是可能的嫌疑人,警察将采取进一步行动。

该系统由日本 NEC 公司开发,NEC 是目前全球重要的面部识别解决方案提供商,特别是在中国 AI 创业公司无法进入欧美主流市场的背景下,NEC 的市场非常广泛。

基于数据预测是否犯罪的场景不仅是科幻电影《少数派报告》的情节,也在成为现实,《卫报》上月获取一份从事该领域的 Voyager 公司的文件,洛杉矶警局(LAPD)与该公司拥有密切合作关系(无法确定是否是客户关系)。

根据文件透露的信息,Voyager 能够帮助客户构建一个基于社交媒体的数据库,涵盖了一个人的地理位置、好友信息等庞大数据,该系统可以搜集一个人或一个话题的所有公开信息——包括帖子、联系甚至表情符号——对其进行分析和索引,然后在某些情况下与非公开信息进行交叉引用。

关于 AI 算法的偏见,PAI(Partnership on AI,一家致力于负责任地使用人工智能的非营利组织)本月发表了一篇报告,针对当下 AI 算法的偏见以及对抗偏见的方法提出了几个新思考。

AI 算法存在偏见已经成为行业共识,而一般减少算法偏见的办法之一就是增加一些数据,比如增加不同种族、肤色的人口数据,来平衡涉及人口的算法,PAI 这篇报告否定了这种做法,「为收集更多的数据来支持公平并不总是答案,实际上会加剧或引入对边缘化个人和群体的伤害」,你可以在这里免费下载这份报告。

以上就是本期「AI Insider」的全部内容,再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com
这封邮件是 Dailyio 的付费邮件,但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。并希望您向更多人推荐「AI Insider」。

取消订阅

Sanlitun Soho, Beijing, Beijing, 100000, China

Powered by EmailOctopus