人工智能的「秋天」/亚马逊微软相继停售面部识别/Deepfake 检测任重道远

Issue #048 2020-06-15

本期导读：

头条：为什么现在是人工智能的秋天？
巨头：亚马逊微软相继停售面部识别、OpenAI 发布首款商业产品、FB Deepfake 挑战赛落幕；
研究：MIT 新芯片、杜克大学图像研究、合成数据与真实数据训练的卫星监控系统；
创业公司：医疗保险公司 Alpha、数据科学平台公司 Domino 等；

头条：为什么现在是人工智能的秋天

上周《经济学人》杂志发布了第二季度的「科技季刊」，主题是人工智能当下的局限性以及未来前景，这一部分用 7 篇文章将人工智能拆分为数据、算法、算力，逐一解读其现状以及潜在挑战，并且以自动驾驶为例，进一步展现数据、算法、算力的局限性。

整个专题内容完整、逻辑清晰，非常推荐大家阅读，你可以在《经济学人》官网阅读这些内容。

在本期「AI Insider」里，我列举一些我认为的要点，基本也是按照「数据、算法、算力」的维度，供大家参考。

第一，当下人工智能的数据问题表现在两个方面：

缺乏足够多的有效数据；
数据偏见不可避免；

数据领域的两个行业趋势：

大公司利用数据增强等方式自己「生产数据」；
数据产业链的规模越来越大，成为中小公司获取数据的主要方式；

其次，人工智能的的落地进度并不相同。一个基本现状是：互联网公司从人工智能获益并不代表其他行业也可以快速落地并从中获益。

大公司部署人工智能的难点包括：

公司战略转型慢；
数据少；
人才缺失；

更进一步，即便是在人工智能实践效果非常好的互联网公司，「人」依然是人工智能产业链上的重要一环。

第三，人工智能的算力需求正在改变整个 IT 行业的格局，包括：

人工智能创业公司疯狂采购云计算公司的计算产品，推动云计算巨头高速增长；
越来越多的技术公司放弃传统计算架构，英特尔的行业地位受到巨大影响；
中美英的人工智能芯片产品迎来新的增长机遇；
量子计算与神经计算等新一代计算架构开始流行，但依然处在早期的阶段；

第四，在自动驾驶领域，「数据」与「算法」的局限性非常突出：

数据：驾驶领域的数据量需求大，当下难以完整覆盖所有场景；
算法：深度学习无法应对突发状况；

这里让我想到一点：如果说驾驶是反人类天性的行为（因为要求司机长时间保持注意力），那么自动驾驶就是反机器学习的行为（因为驾驶过程中有大量没有训练过的意外数据）。

第五，结论。《经济学人》的结论与我去年在 #027 期「AI Insider」里的判断一样，我在当时写道：

这个时期更像是「秋天」，无论资本市场还是国内外的巨头公司，正在更理性地看待 AI 技术与产品，同时也在评估其对于未来行业发展的影响。

那么现在的问题是：如果秋天来了，那么冬天还会远吗？

巨头

亚马逊与微软相继表态：不再向警察提供面部识别产品。相对于微软，亚马逊的态度稍显谨慎。根据其官方博客的信息，亚马逊将停止向警察部门销售面部识别产品 Rekognition 一年，希望国会拥有足够多的时间评估和制定相关监管规则。该公司同时强调，在此期间，亚马逊将继续向儿童救助机构等组织提供Rekognition。

不过正如 TechCrunch 所言，亚马逊并未透露是否会继续与包括美国移民及海关执法局在内的联邦政府合作。

关于 Rekognition 产品的详细介绍，可参见 AWS 官方文档。

根据 MIT TR 的报道，过去两年时间里，数十个民权组织通过公开信、游行的方式要求亚马逊停止向政府提供面部识别产品，但亚马逊从未做出回应。

亚马逊表态一天后，微软表示，在全国性监管法律出台前，将不会向警察部门出售面部识别技术。

IBM、亚马逊与微软的表态，凸显出科技公司对于面部识别技术的监管诉求。与此同时，面部识别技术的固有缺陷，比如种族（肤色）偏见等，依然需要研究人员不断攻关。

Facebook 举办的 Deepfake 检测挑战赛落幕。根据 FB 官方透露的信息，共有 2114 人参与了这次比赛，提交了 35000 个模型，获胜者是一位来自地图公司 Mapbox 的工程师，他的模型在检测 Deepfake 视频中达到 65% 的准确率。

但这些模型并没有真正发现 Deepfake 视频里的数字特征（比如像素特点），更多的时候，这些模型不过是发现一些「特别」的地方，一如人类观看这些视频时觉得「不对劲」一样，而且 65% 的准确率也无法真正应用到生产环境中，这也从另一个侧面说明：人类要完全战胜 Deepfake，还需要漫长的过程。

OpenAI 发布商业化产品。OpenAI 早已不再是单纯的研究机构，上周，这家公司发布了一度被称为「危险」的文本生成服务 GPT-API，企业客户可以利用这个 API 构建聊天机器人或者构建自己的文本分析产品等，目前的客户包括 Reddit、Algolia（搜索服务商）等。

研究·学术

杜克大学的图像生成新研究。这项研究通过人工智能的方法修复模糊照片里的细节，研究论文可参见这里。简单来说，研究人员利用 GANs 构建了一个工具，应用到脸部照片的修复中，NextWeb 记者体验了这个工具。

MIT 的新类脑芯片。这个芯片不仅体积小，还可以模拟人脑的神经网络结构处理信息，在测试过程里，相比于其他芯片，MIT 这颗芯片的表现更好，相关研究结果已经发表在 Nature 上。

利用合成数据的卫星监控。本期「AI Insider」谈到 AI 发展中的数据稀缺难题，因此利用 AI 算法生成模拟数据的需求就非常强烈，一家名为 Q Tel 的公司展示了如何通过合成数据提升卫星监控的精准度，这家公司的研究人员与另一家研究机构合作，开发了一个数据集 RarePlanes，该数据集既有真实飞机数据，还有大量合成的数据，你可以在这里阅读这篇论文。

值得一提的是，Q Tel 公司得到美国中情局的支持。

创业公司

Alpha 健康，这是一家利用机器学习技术处理医疗保险索赔的创业公司，根据 WSJ 的最新信息，这家公司刚刚获得 a16z 的 2000 万融资。

EnsoData，该公司通过 AI 相关技术简化对于人体健康状况的分析，其主要方式是分析大量人体传感器中的数据，并生成一份「易于阅读」的诊断建议，该公司也在近期完成一笔 900 万美元的融资。

Domino Data Lab，这家公司面向大型企业的数据科学团队，提供包括模型优化、模型自动化更新等产品，其客户包括戴尔、瑞银等。VB 的一篇报道指出，该公司最近完成一笔 4300 万美元的融资，并发布一个名为「Domino Model Monitor」的产品，旨在解决机器学习模型中的偏见问题。

这封邮件是 Dailyio 的付费邮件，但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。并希望您向更多人推荐「AI Insider」。
以下是您的订阅信息：
- 邮箱：<<邮箱地址>>
- 订阅日期（日/月/年）：<<订阅日期>>
- 到期日期（日/月/年）：<<到期日期>>
再次感谢您的支持，有任何问题或建议，欢迎写邮件给我：zhaosaipo@gmail.com

想修改您的订阅信息？
你可以更新邮箱信息或者取消订阅.