AI 算力革命刚开始/愚弄 AI 算法的后果/AI 招聘中的争议

Issue #018 2019-11-12

本期导读：

学术：DeepMind 算法在游戏领域的新突破、FB 如何识别 Deepfake 视频、中科院基于 AI 的心率预测工具；
研究：OpenAI 发布完整版 GPT-2，机器生成的文章到底有多吓人？
研究：从愚弄特斯拉自动驾驶算法到干扰无人机图像，愚弄 AI 算法的后果很可怕；
洞察：为什么说 AI 的算力革命才刚刚开始？
巨头：三星与 IBM 合作、NLP 助力 Google 搜索升级、微软面向企业的数据结构化工具、亚马逊如何定义语音助理的未来；
应用：AI 在企业招聘中的潜力与争议、医疗 AI 应用的三大障碍；
应用：星巴克、肯德基的 AI 应用；
创业公司：两家新晋的 AI 独角兽公司以及两家医疗 AI 创业公司；

学术·开源

DeepMind 在「星际争霸2」中获得最高的「宗师」等级，超过了 99.8% 的人类玩家。此次「代表」DeepMind 出战的「AlphaStar」，是 DeepMind 探索强化的学习重要突破。与此前挑战的围棋等棋类游戏不同，「星际争霸2」是一个信息完全不确定的领域，通过在这个游戏里的表现，也让外界进一步感受到了强化学习的巨大潜力，以下是其在 Nature 论文的视频介绍。

Facebook 展示实时识别「Deepfake」类视频的技术。这个研究来自 FB AI 实验室，通过机器学习实时识别视频图像里的关键面部特征，以此判断该视频内容是否属于「Deepfake」，相关研究的论文在近期的计算机视觉国际会议 ICCV 上发布，大家可以先从下面的视频里感受一下这个研究。

中科院基于 AI 的心率预测工具。这个工具根据一个人的面部（甚至面部视频）来预测其心跳，研究人员在论文中介绍了 RhythmNet，它基于 AI 和光电容积描记（photoplethysmography，业内简称为 PPG）去检测血容量的变化。这项研究的意义在于，过往心率检测必须依赖于接触式的检测设备，而这个研究展现了一种检测心率的全新方法。

OpenAI 发布完整版 GPT-2。这是一个利用机器学习自动生成文本的算法，我曾在之前的会员通讯里讨论过它，感兴趣的朋友可以在这里查看。

根据 OpenAI 此前的说法，由于担心被滥用，该机构一直非常谨慎地公开 GPT-2 的进展，并一直拒绝发布完整版的算法。关于 GPT-2 的详细介绍参见这里。

如果你对这个算法感兴趣，可以在这里体验一下，只需输入一句或一小段英文，系统会自动生成一大段话。在我的实际体验中，我很难评价这个算法到底是否聪明，在多次尝试把玩的过程里，我发现它会经常生成很多令人毛骨悚然的段落，各位可以试一试。

愚弄 AI 算法的后果很严重。最新一期的 MIT TR 介绍了 AI 可能在战争中的一系列应用，其中也谈到了对于 AI 算法的愚弄。

比如在 2018 年 3 月，腾讯的安全人员就尝试通过干扰特斯拉电动车自动驾驶的图像算法来实现对于车辆的「算法攻击」，实验结果也显示了其攻击非常有效，你可以在这里查看当时 MIT TR 的报道。

从特斯拉的案例引申，当下军事领域无人机的决策机制，很大程度上都依赖于对于图像的分析，那么是否也会存在类似特斯拉这样的「算法攻击」呢？

事实上，上述这些攻击都属于「对抗性网络攻击」，通过引入某个特征，在对抗网络的帮助下形成对于特定算法的反制甚至愚弄。在上周的法国 AI 大会上，Google 旗下 Google Brain 团队科学家 Nicolas Papernot 坦言，目前情况下我们并不能避免这样的攻击。

Nicolas Papernot 还列举了一个案例，如下图所示，左边是机器学习所识别的正确图片，中间是一张人类眼睛看不清的像素图，右边则是叠加了像素图后的机器学习识别结果，尽管在人类眼睛看来，左右两张图没有区别，但机器显然已经不再准确出图片了。

你可以在这里查看这篇论文。

也是在上周，来自 IBM、MIT 以及中国东北大学的研究者们利用对抗生成网络生成一个图案，如果一个人将这个图案印在普通 T 恤并穿上它，那么可以成功躲避脸部识别系统的检测，更准确地说，AI 系统不会「看见」这个人，你可以在这里查看这个研究。

洞察·观点

AI 时代的算力革命才刚刚开始

OpenAI 上周更新了发表于 2018 年 5 月的 AI 算力报告，详细报告在这里，主要修正了对于摩尔定律的描述，从原来 18 个月翻一倍修订为 24 个月（也就是两年）。

如何理解算力？简单来说，就是计算硬件让算法计算的能力，从这个角度上看，算力当然是越强越好。

为何要发表这份报告呢？OpenAI 给出的原因是，当下 AI 技术的主要推动力是算法、数据量和算力。前两者，算法无法直接量化，一个算法的好与坏、先进与落后，业界很难有一个共识，而数据量则是一个根本不能量化的维度。

也因此，OpenAI 选择用算力来展现 AI 时代的发展速度。下图是一个综合的展现，简言之，自 2012 年开始，过去 7 年时间 AI 对算力的需求增长了 30 万倍，而如果按照摩尔定律的发展速度，这期间的芯片算力只能增长 7 倍。更进一步，OpenAI 发现最先进的 AI 模型，其对算力的需求是每 3.4 个月翻一倍，而摩尔定律中的芯片则是两年翻一倍。

这不仅宣告了摩尔定律在 AI 时代失效，同时也将 CPU 这一过往定义信息革命的基石从 AI 时代排除出去，而当 CPU 无法支撑其 AI 计算之后，留个产业的，也是一个巨大的真空市场。

比如 GPU。OpenAI 发现，在 2012 年之前，几乎没有人将 GPU 应用到机器学习中，而从 2012 年——2014 年，GPU 的应用逐渐增多，从 10 个 GPU 到 100 个GPU，算力开始有了大幅提升，这也成就了英伟达股价翻十倍的业界神话。

而在 2016 年，随着 Google 率先推出专属 AI 芯片 TPU，AI 算力革命也进入到专属硬件时代，硬件上的革新带来了更快的网络连接，也释放了算法进步带来的红利，可以说过去三年 AI 各领域的突破，都是算力提升带来的显著结果。

自 2018 年年末到现在接近一年的时间里，全球科技巨头们都在布局与 AI 专属硬件相关的领域。

2018 年 12 月，AWS 率先发布了面向云端机器学习推理的专属芯片Inferentia，相比于 TPU 只支持 TensorFlow，几乎所有的主流机器学习框架都可以运行在 Inferentia 之上。 2019 年，百度的「昆仑」、华为的「昇腾」、阿里巴巴的「含光」相继问世，并被高度集成在自家的云服务中，结合自研软件和算法的创新，比如并行计算的出现，就进一步提升了的计算能力。

短期来看，AI 算力还将是昂贵的，OpenAI 曾预测，支撑一个大规模机器学习训练模型的成高达上百万美元，这也从另一个角度解释了为何 Google、AWS 如此热衷宣传自己的机器学习云服务平台，巨头们将算力以「零售」的模式卖给不同规模的企业，最终也实现了机器学习硬件成本的分摊。

而站在长期的角度来说，所谓的 AI 专属硬件还会不断革新，当下包括 GPU、TPU 在内的硬件，尽管算力高，但功耗也非常高，而且仅适合算数运算，并不适合逻辑计算，近几年国内外逐步升温的光学计算和光神经网络，也在成为学术领域关注的焦点，相比于 GPU、TPU，基于光学的芯片和计算带来创新可能性非常大。

与此同时，围绕 AI 芯片的创业公司也在全球各地出现，所有这些都将持续推动 AI 算力的新发展甚至革命性的突破。

业界·应用

巨头

三星与 IBM 合作。双方将开发一个新平台，利用云计算、AI 和 5G 等技术来改善急救人员、警察和消防员的工作环境。据了解，该平台将通过三星的智能手表实时获取这些人的健康数据，并通过实时的数据分析向负责人提供该员工的健康状况。

NLP 技术助力 Google 搜索升级。根据 Google 官方的说法，这是该公司近几年来最大规模的搜索技术升级，影响到 10% 的搜索查询。其技术源动力来自 NLP 模型BERT，它可以通过关注句子中的每个单词的相关关系来呈现答案，能够提供更符合人类语言习惯的搜索结果。

微软的 AI 工具可以将企业数据转化为类似维基百科的页面。这个名叫 Project Cortex 的工具利用 AI 模型自动检索企业存储在微软服务里的数据，比如电子邮件、企业文档、日历等，然后自动生成不同主题的结构化文本，类似于维基百科的条目。

Alexa 首席科学家称，语音助理的未来是从被动互动向主动互动转变。这篇来自 MIT TR 的文章采访了亚马逊 Alexa 首席科学家 Rohit Prasad。所谓的主动互动，其实是一种基于数据逻辑关系的交互方式，比如在旅行的时候，当 Alexa 知道你的航班延误，那么语音助手应该主动调整你到达目的地的安排，甚至可以主动打电话给接机司机与酒店前台，通知你的新行程安排。要实现这一点，也意味着语音助手还需要更多的数据支持。

AI 与招聘

将 AI 引入企业人才招聘正在被企业所接受。FT 的一篇报道指出，过往人类阅读简历并一遍遍面试的招聘流程正在终结。作为求职者，必须接受算法的评估，这些算法综合求职者的过往资料，并设计一系列问题去评估求职者的技能、创造力以及对压力的应对能力。

FT 列举了此前白宫顾问 Michael Rosenbaum 构建的 AI 招聘平台 Catalyte，一位名叫 Tim Reed 的员工在这个平台上进行了测试，整个测试并不是要得到所谓的「正确答案」，而是通过不同维度的问题，更好地了解员工的创造力和抗压能力。

但一个不容忽视的问题是，招聘领域的 AI 应用还有诸多争议。上周，《华盛顿邮报》就报道了围绕 HireVue 公司 AI 招聘系统的隐私争议。

根据报道，一家名为「Electronic Privacy Information Center」的权利组织呼吁 FCC 介入对网络招聘公司 HireVue 的调查，该机构指出，HireVue 的招聘系统在评估应聘者时会扫描面部和声音数据。同时，由于整个评估算法是保密的，因此应聘者无从知晓自己的数据如何被使用以及是否得到了有效保护。

MIT TR 的另一篇报道则称，HireVue 并不是市场上唯一一家利用 AI 评估应聘者的网络招聘公司。这类工具还可能因为数据偏见，依靠小规模的数据来得出白人应聘者更合适的结论。文章也很悲观地认为，这个问题是无解的。

当 AI 应用于医疗

来自咨询机构 KLAS 和 CHIME（College of Healthcare Information Management，一个面向医疗机构 IT 负责人的组织）调查了 57 家医疗机构的 IT 负责人，这些医疗机构都采用了机器学习以及 NLP 等技术。

调查指出，一些在医疗领域较早开始探索 AI 应用的机构，已经在临床上有了初步成绩，比如可以预测病人再入院时间以及避免某些病人的急诊。

医疗领域的 AI 应用潜力巨大，但同样面临诸多困境，其中最大的挑战就是监管以及 AI 技术的黑箱问题，上月，《哈佛商业评论》的一篇文章列举了若干个挑战，包括以下几个：

监管框架需要更新。FDA 的监管方式的确在与时俱进，但技术领域的发展更快；
FDA 的批准制度。AI 算法更新速度非常快，当药物或设备中的算法被更新，都需要 FDA 的重新批准，这对制药公司或医疗设备公司提出了新的挑战，比如如何设计更好的算法迭代流程；
AI 是一个黑匣子。为了赢得医生的认可，AI 必须展示自己的能力，比如利用图像分析帮助放射科医生更好识别图片，但 AI 算法的不透明性，人类医生无从知晓 AI 的决策方式，这一定程度上影响了 AI 的应用范围。

零售、餐饮领域的 AI 应用

肯德基希望利用 AI 算法来帮助顾客更好地点餐。餐饮领域 AI 应用的核心还是提升用户体验，肯德基的思路是尽量减少驾车顾客下车的频率，也因此，未来肯德基可能会采用车牌识别系统，以此确定顾客过往的消费习惯，从而智能推荐相关产品，加快点餐、取餐的速度。

另一个应用 AI 的传统企业是星巴克。上周的财报分析师会议上，星巴克 CEO 凯文·约翰逊表示，该公司利用 AI 工具「Deep Brew」来管理库存，同时基于星巴克会员积分制度制定更好的推荐机制。过去的这个季度，星巴克门店的销售额增加了 6%。与此同时，未来一年里，星巴克将为美国各门店部署 Mastrena 咖啡机，这个机器配备了可以收集每一次操作的传感装置，数据实时传入星巴克的服务中心，作为衡量设备运行正常与否的重要参考。

随着欧美购物季临近，零售、电商企业的仓库工作又将进入一个高峰期，WSJ 报道了这个领域正在兴起的机器人趋势。由于劳动力短缺，仓储机器人成为新的需求，这些机器人使用摄像机、激光和传感器在仓库过道中导航，引导工人到正确的货架上，或者在工作站之间运输装满产品的箱子。值得一提的是，很多零售企业并不采购机器人，而是通过租赁的形式应对购物季激增的订单需求。

创业·融资

Rsikified。这是一家来自以色列特拉维夫的 AI 独角兽（估值超过 10 亿美元的创业公司）。这家公司主要利用 AI 算法来保障支付系统安全同时防止电商领域的诈骗。这个市场潜力巨大，公开资料显示，预计到 2021 年，全球电商将因欺诈损失 64 亿美元，更重要的是，由于算法标记不精确，电商公司还会将有效交易误标记为欺诈，每年会损失 4400 亿美元。你可以在这里详细了解这家公司。

Coveo。这是一家面向企业市场提供数据分析的 AI 创业公司。WSJ 的报道称，该公司在完成一笔 2.27 亿美元的融资之后，估值已经超过 10 亿美元。数据分析之外，Coveo 正在利用 AI 加快个性化推荐和搜索平台的发展。你可以在这里详细了解这家公司。

两家医疗创业公司。Viz.ai 通过 AI 帮助医疗机构发现患者中风的早期症状，这家公司刚刚完成了一笔 5000 万美元的 B 轮融资，投资机构包括 Alphabet 旗下的投资机构，你可以在这里详细了解这家公司的业务。

Medopad 是一家利用数据和机器学习预测慢性疾病的创业公司，通过整合医生、移动设备以及患者的可穿戴设备上的数据进行预测。这家公司刚刚完成了 2500 万美元的 B 轮融资，制药巨头拜耳领投。你可以在这里详细了解这家公司。

感谢您的订阅，如有疑问，欢迎写邮件给我：zhaosaipo@gmail.com

取消订阅