从未来愿景看 AI 的现实挑战、Deepfake 引领 AI 「犯罪」、如何认识中美军事的 AI 竞争

Issue #059 2020-08-20

📢 Editor’s Note

不管 AI 是不是产业的未来，人类的未来一定伴随着 AI 产品与技术。透过 6 位从业者对于 AI 未来挑战的预测，或许我们可以看清当下的众多难题。本期，我将从未来愿景入手，阐述 AI 在当下所面临的技术、社会挑战，以及 AI 在企业以及创业公司中的巨大不太确定性。

与此同时，您还将看到 AWS 在量子计算与汽车领域的扩张，、Google 云计算的数据分析产品分享和 IBM 新处理器。本期的「AI Insider」还准备了一系列 AI 在行业里的应用，包括社交媒体、零售、飞机、F1 赛事、医疗影像扫描等。

另外，本期还将提供两份分析报告，一份从 Deepfake 如何成为 AI 潜在犯罪的角度展现一个略显可怕的未来，另一份报告聚集在中美两国军事领域的 AI 竞争，关于中国在 AI 方面的数据优势，或许并非我们想象的那么简单。

从未来愿景看 AI 的现实挑战

《华尔街日报》有一个关于未来畅想的专栏叫「The Future of Everything」，站在技术与思想的前沿，畅谈关于技术的未来故事。上周，这个专栏推出一个主题「AI 带来的挑战」，邀请六位 AI 领域的从业者和研究者，或从学术角度、或从行业视角，多角度展现了人工智能未来发展所面临的挑战。

这些挑战既有技术层面，比如深度学习的局限性，结合 MIT 的一份研究，通过分析已经发表的 1058 篇深度学习论文，得出的结论是：深度学习的发展很大程度上依赖于计算能力的提升。

换句话说，当下以深度学习为代表的 AI 发展热潮，背后是巨大的计算消耗，更准确一点，是能源消耗。

2019 年 6 月，美国马萨诸塞州大学阿默斯特分校的一份报告显示，训练和搜索某种模型所需的电量涉及约 626000 磅二氧化碳排放量，这相当于美国普通汽车使用寿命内排放量的近 5 倍。

另一方面，上述这些挑战又是社会层面的，比如当医疗、金融系统越来越依托算法做决策，那么不仅需要破解当下深度学习的「黑盒子」——即你无法知道这些算法是如何运作的——还需要从公司到行业，设置类似监督委员会的机构，重新审视算法的公平性与透明性。

更具体来看，企业应用 AI 以及围绕 AI 的创业也进入到一个新的阶段。Wired 的一篇分析认为，对于人工智能在各个行业的普及程度，我们应该警惕所谓的调查数据。

Wired 给出的理由是，这些调查往往集中由咨询公司（比如麦肯锡、普华永道）等组织，其调查对象也是大公司高层，这也很容易呈现出一种「幸运者偏差」。

与此同时，LinkedIn 数字显示，从 3 月疫情在全球蔓延开始，AI 相关职位人才招聘的广告增加了 14%；而 Google 的开源深度学习框架 Tensorflow 仅仅在今年 5 月就下载超过 1000 万次。

这些数字当然展现出 AI 的热度，但无论是人才招聘还是使用 Tensorflow，都是一个昂贵——需要花钱招聘到会使用 Tensorflow 的工程师——而且时间非常长的落地过程，这对于深受疫情影响的各类中小企业显然不是一件乐观的事情。

投资公司 a16z 站在投资人视角向创业者发出了警告：AI 创业领域的长尾效应会「杀死」创业公司。

a16z 的核心观点是，机器学习/深度学习与软件工程一样，都是需要迭代与实验，但与软件工程不同，整个人工智能更侧重实验，也就是说，需要不断测试模型在新数据上表现，然后不断重复。如果创业者花大量时间去调整模型的参数，很容易进入到长尾分布的「尾」，即便你的模型足够好用，但因为其客户群体过小/需求过于分散，也无法支撑其未来的业务发展。

a16z 为此还提出了几个建议，比如通过整合数据管道降低数据成本，利用构建自己的基础设施平台减少对于云服务的需求，这两个方面可以为 AI 创业公司节约大量资金，剩下的就是进一步压缩机器学习模型，并在不断训练中提升模型精度。

Deepfake 正在成为 AI 犯罪的主要形式

加州大学洛杉矶分校（以下简称 UCL）的一份研究指出，基于 Deepfakes（不限于图像，包括音频视频）的犯罪已经成为 AI 犯罪的主要类型，并按照危害等级、资金损失等四个维度做了区分，如下图所示：

目前来看，基于音视频的 Deepfake 正在成为主要威胁。这也是相对开放/开源的 AI 研究成果与越来越便宜的计算能力相结合的「产物」。而通过自然语言相关的犯罪行为还很少，但我们也不能过分乐观，毕竟 GPT-3 已经展示了足够的潜力。

你可以在这里免费下载 UCL 的研究报告。

行业·应用

FB AI 实验室与纽约大学医学院的一项研究将 MRI 扫描速度提升了四倍，相关研究已经开源，你可以在这里了解这项研究

当 F1 采用机器学习进行排名。F1 组委会与亚马逊机器学习方案实验室合作，通过分析 1983 年以来参赛选手的数据，比如赛车手的弯道表现等，构建了一个名叫 Faster Driver 的项目，以此来预测当下 F1 赛车手的表现。

不过值得关注的是，社交媒体对于这个项目的反应似乎并不一致，关于局限性的争议还有很多。

加拿大零售连锁巨头 Candadia Tire 的 AI 应用。去年开始这家公司采用一套机器学习系统分析店内产品销量与外部环境变化，疫情期间，这套系统较快发现了自行车需求在西海岸门店快速上升，从而使得公司决策者可以及时调整产品配给。

WSJ 展示了一个由机器学习驱动的未来飞行愿景。比如通过整合第三方天气数据以及安检等候时间数据，为乘客前往机场提供更精准的时间安排，减少在机场等候时间。

当然，飞机机器人（自动化飞行）的研究一直没有停止，前不久，空客就进行了一次飞机起飞、滑行与降落的全自动化测试。

通过机器学习复原古罗马的皇帝图像。这是一个非常有趣的应用领域，机器学习可能让我们认识古人，你可以在这里详细查看这些古罗马皇帝。

Facebook 汇报 AI 内容审核成果。FB 表示，二季度删除的内容数量同比增加了 134%，疫情期间，FB 加大 AI 内容审核的投入力度，特别是在西班牙语、阿拉伯语、印尼语的内容审核上，AI 内容审核都立了功。

关于 FB 如何应用 AI 检测并删除仇恨言论，可参考快公司的这篇报道。

政策·政府

贵州「新基建」的成绩单。我很想汇总一份国内各省「新基建」投入与项目，不过目前的公开资料比较少，贵州省统计了 2020 年 1 到 7 月的数字和项目：

计划完成投资 140 亿元，1₇ 月完成投资75亿元；
建成 5G 基站 10513个，实现 5G「县县通」；
贵阳·贵安国际互联网专用通道、腾讯数据中心项目一期工程建成；
苹果 iCloud 数据中心、华为云数据中心主体工程基本完工；
通信光缆达 120.6 万公里，出省带宽达1.31 万Gbps

关于苹果在华数据中心，再补充一个信息，苹果还在内蒙古的乌兰察布建设另一个数据中心，接下来关于「新基建」的新闻里，你会经常看到乌兰察布的名字。

白宫披露最新的 AI/量子投资计划。白宫希望在 2021 财年增加 30% 预算至 22 亿美元，其中 AI 相关领域投资为 15 亿美元，量子相关投资为 6.99 亿美元。这些资金主要用于包括美国农业部在内的联邦机构的 AI 项目研究和发展。

当 AI 应用到军事领域，「数据就是石油」还成立吗？如何理解军事 AI 应用中的数据优势？Cset 对此做了一番简要分析，其中的几个要点：

所谓的数据优势应该分清是「Raw 数据」多，还是特定领域的数据多；
在特定领域，数据只有经过数字化、清洗、标注化并适合机器学习模型使用，才可以说这是数据优势；
商业数据与军事领域的数据不同，不能等同；

你可以在这里下载这份报告。

巨头

AWS 量子计算平台 Braket 正式可用。该产品是 AWS 2019 年推出的面向量子计算的平台，AWS 整合了包括 D-Wave、Rigetti 等量子计算能力，客户可以在这个服务上构建、测试量子算法。AWS 还提供了一个早期的案例。

你可以在这里详细了解这个产品。

GCP 云端大会期间的数据分析 Session 推荐。GCP 云端大会还在持续进行中，如果你对数据分析感兴趣，可以看看这 12 个关于数据分析的 Seetion。我个人认为，GCP 在数据分析领域拥有较强的竞争力，可能是 GCP 突围的另一个方向。

另外，本周我还读到一篇前 Google 员工 Steve Yegee 的文章，他对于 Google 内部文化如何影响 GCP 的业务发展提出了很多想法，语言有点偏激但是逻辑还是很成立的，大家可以通过他的博客阅读这篇文章。

腾讯、百度财报，云和 AI 业务遮遮掩掩。上周，腾讯、百度先后发布财报，在关于 toB 业务方面，两家公司都遮遮掩掩，其中腾讯表示，「金融科技及企业服务业务第二季的收入同比增长30%至人民币298.62亿元……以及因公有云消耗量增多（尤其是互联网服务及民生服务行业）带动云服务收入的增长」。

而百度二季度财报里，根据百度董事长兼 CEO 李彦宏的说法，AI 新业务收入在第二季度实现两位数的同比增长。

正如雷锋网所言，百度已经悄然把自动驾驶 Apollo 从 AI 业务里剥离出来，放在「Others Highlights」，这也从一个侧面展现出百度 Apollo 内部位置的变化，在百度 CTO 王海峰统管百度 toB 业务之后，「云+AI」成为百度整个 AI 业务的核心。

AWS 与丰田合作，搭建基于云的数据中心服务。路透社援引丰田公司的信息称，这个数据中心将可以更好处理汽车数据以及来自车主共享的数据。

公开资料显示，AWS 在汽车领域已经拥有众多客户，上月，AWS 签下了德国大众，另外在汽车供应链、出行服务、自动驾驶等方面都有不少公司使用 AWS，比如 Uber。

IBM 发布 Power 10 芯片。这款芯片的三个要点：

采用 7 纳米制程，三星代工；
面向数据中心，主要为了优化红帽的混合云平台；
2021 下半年正式商用。

一份研究称，亚马逊的语音助理 Alexa 对于爱尔兰口音的理解非常困难。值得一提的是，不久前亚马逊 Alexa 团队还详细介绍了对话管理背后的「科学原理」，感兴趣的朋友在这里)阅读这篇博客。

以上就是本期「AI Insider」的全部内容，再次感谢您的支持，有任何问题或建议，欢迎写邮件给我：zhaosaipo@gmail.com

这封邮件是 Dailyio 的付费邮件，但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。并希望您向更多人推荐「AI Insider」。

您可以更新邮箱信息或者取消订阅。