骗子、新工人与失业者，AI 背后的三种人类

Issue #010 2019-08-22

本期导读：

开源：一本读懂计算摄影的开源图书；
研究：又一个制造假新闻的 AI 应用；
学术：自然语言理解测试新基准 SuperGLUE 出炉；
观点：骗子、工人与失业者，AI 技术潮流背后的三种人类；
业界：AI 芯片热潮，英特尔、特斯拉与华为的新动作；
业界：微软发布新一代小冰并加大对台湾的 AI 投资；
报告：美国各地区的 AI 独角兽；
案例：AI 在影视、财务以及法院的应用；
观点：彼得·蒂尔的 AI 观；
艺术：将 10000 张手工拍摄、标注的照片组成一张照片；

研究·开源

一本读懂计算摄影的开源图书。得力于智能手机上的 AI 能力提升，手机也成为计算摄影的新利器，上半年沸沸扬扬的「华为 P30 拍月亮」事件，其反映的也是行业对于计算摄影的不同看法。在这本开源的电子书里，作者@Vas3k 详细解释了计算摄影的前世今生以及其行业意义，即便你不是工科生，这本书的阅读难度也非常小，强烈推荐大家下载阅读。你可以在原文提供的 Dropbox 里下载，或者通过我提供的国内镜像下载，包含 PDF、Mobi 和 Epub 三种格式。

研究者推出又一个制造假新闻的 AI 应用。来自艾伦 AI 研究所和华盛顿大学的研究者们开发了这个名叫 Grover 的智能系统，它可以根据标题生成假新闻。据了解，该系统通过 120GB 的新闻文章数据训练，其测试效果也非常不错，测试者尝试用「为什么特朗普每天吃 100 个汉堡」作为标题，系统也可以生成一篇颇具说服力的文章，可以在这里试读。你也可以在这里尝试自己生成一篇新闻。

语言理解测试新基准 SuperGLUE。来自 FB AI 实验室、DeepMind、华盛顿大学以及纽约大学的学者们共同提出了这个测试基准，该基准使用 Google 开源的 NLP 模型 BERT 作为测试模型。事实上，自然语言理解测试标准 GLUE 在过去一年里被微软、Google 和 FB 频发刷榜，这也凸显出该领域技术突破速度之快。你可以通过 FB 的一篇博客详细了解这个标准。

Google 大脑团队开发了一个足球视频游戏。这个视频游戏并不是供玩家玩耍，而是开放给研究人员测试强化学习算法，该项目基于真实足球比赛的模拟，你可以通过这篇论文详细了解这个项目。

研究者将机器学习应用于能源研究。来自马塞诸塞嗲阿默斯特分校的研究人员开发了一个工具，利用机器学习和激光雷达来确定哪些地点的屋顶太阳能资源最丰富，这款名叫「DeepRoof」的工具，准确率可以达到 91.1%。

洞察·观点

AI 背后的三种人类

上周 WSJ 报道了一家名为 Engineer.ai 的创业公司，这家声称可以通过 AI 完成应用自动化开发的公司，去年底拿到软银旗下 2900 万美元融资，但 WSJ 发现，这家「AI 公司」的核心竞争力并非 AI 技术，而是印度的廉价工程师：

Documents reviewed by The Wall Street Journal and several people familiar with the company’s operations, including current and former staff, suggest Engineer.ai doesn’t use AI to assemble code for apps as it claims. They indicated that the company relies on human engineers in India and elsewhere to do most of that work, and that its AI claims are inflated even in light of the fake-it-till-you-make-it mentality common among tech startups.

Engineer.ai only started to build the technology needed to automate app-building in the last two months, a person familiar with the company’s operations said, adding that the company was more than a year away from being able to use any AI for its core service.

这让我想起「土耳其下棋机器人」故事，它是一个 18 世纪晚期的自动下棋装置，如下图所示，一个酷似土耳其（奥斯曼）的假人坐在棋盘前，而棋盘底部的箱子里藏着一位人类棋手来操作机器，由于藏在里面的棋手都是高手，因此这个「机器人」赢了大部分棋局，一路从欧洲赢到了美洲，更多的介绍可以参见维基百科的词条解释。

Engineer.ai 的做法无疑就是现代版的「土耳其行棋机器人」，都是将机器包装为可以解决复杂业务的「智能机器」，但箱子底部真正解决问题的都是人类。

AI 背后的第二种人类来自亚马逊的创造。

2005 年的时候，亚马逊推出了一个名叫 Amazon Mechanical Turk（简称Turk）的服务。与一个多世纪前的所谓机器人类似，亚马逊 Turk 背后的主力军也是人类，这项服务将亚马逊电商网站上众多无法标准化的工作分成一个个简单的流程，通过一个开放的平台市场外包给全球用户¹。

从产品模式上看，这是一种典型的「威客模式」，但在其他威客网站相继失败的市场环境里，亚马逊的 Turk 业务却蒸蒸日上，不仅在亚马逊内部充分应用，还向全球企业客户开放，供他们随时调动全球线上劳动力为其服务。

2018 年 12 月的 AWS re:Invent 大会上，AWS 在其面向机器学习平台服务的 Sagemaker 里增加了一项新服务 Ground Truth，官方的说法是「可帮助您快速构建用于机器学习的高准确度培训数据集」，换句话说，这是一个数据标注服务。更进一步去看，这项服务还「通过与 Amazon Mechanical Turk 集成，获得超过 500000 台标识器的公共劳动力。或者，如果您的数据需要保密或特殊技能，您可以使用 Amazon 预先筛选的专业标记公司」。

这意味着，亚马逊为 AI 领域提供了一个数据工人的外包服务，这在「有多少人类，就有多少智能」的行业语境下颇为重要，此前已经有多个媒体渲染过中国数据工人如何推动中国 AI 发展。而最近，不管是苹果 Siri、亚马逊 Alexa 还是微软 Cortana，这些所谓智能语音助手背后，还有一大批廉价的合同工去监听语音交互的过程并标注数据。

上述这些数据标注工人构成了 AI 背后的第二种人，但 AI 还在影响第三种人。

无论再怎么列数据、讲事实，AI 的发展，一定会造成职业的变化，由此产生一批因为 AI 而失业的人群，这是每一次技术发展的必然，我们也无需恐慌，但必须看到，AI 造成的就业与失业，是一个硬币的两个面。

另一方面，从企业管理者的角度去看，AI 带来的自动化提升，如果能够减少人力成本，企业当然欢迎这样的技术，即便是在各种公开场合信誓旦旦地表示 AI 不会取代人类，但这些企业高管依然在探索自动化取代人类员工的种种可能性。

也因此，AI 背后的第三种人类俨然成了技术发展的代价，常常有人提及：汽车的出现的确让马夫失业，但他们中的很多人后来成了司机。但一个被忽视的前提是，如果你的职业只是「马」呢？

关于亚马逊机器人的详细介绍，可参考 IEEE 的这篇文章。 ↩

商业·应用

AI 芯片

Hot Chips 会议上，英特尔首次发布 AI 芯片。这两款芯片 Nervana NNP-T 和 Nervana NNP-I，分别用于训练和推理。其中 Nervana NNP-T 基于台积电 16 纳米制程，主要应用在数据中心的 AI 训练，能够支持 TensorFlow、PaddlePaddle、PYTORCH 训练框架；而 Nervana NNP-I 的芯片主要应有在数据中心的 AI 推理，基于 10 纳米的 IceLake 架构，英特尔表示这款产品能够利用最小的能量来处理高负载的工作。

于此同时，特斯拉也展示了自己的 AI 芯片。如下图所示，根据特斯拉的官方说法，该芯片拥有 60 亿个晶体管，非常「智能」，足以应对特斯拉全自动驾驶的场景，与早期使用的英伟达芯片相比，性能提升了 21 倍。

NYT 报道了创业公司 Cerabras 发布的堪称「有史以来最大的芯片」。根据 Cerebras 公司的说法，该芯片的平均尺寸为普通芯片的 100 倍，拥有 1.2 亿个晶体管。这是整个 AI 领域对计算能力不断提升的必然要求，此前 OpenAI 的一份报告曾指出，自 2012 年到 2018 年，AI 计算需求几乎每 3.5 个月就会翻上一番。

另外，根据新华网的英文报道，华为也或在周五发布自己的 AI 芯片以及 AI 框架。

报告：美国各地的 AI 独角兽们

独角兽是资本市场对于估值超过 10 亿美金的创业公司的称呼，尽管这几年「独角兽」一词被大量滥用和误用，但作为一个评价标准，依然具有一定的可用性。CB Insights 日前发布了一份美国各地 AI 独角兽报告，提供了一个观察不同地区 AI 产业发展的机会。

首先，美国 AI 投资市场持续火爆，2018 年这个市场完成 93 亿美元的融资，相比于 2013 年的 11 亿美元，短短 5 年时间增长了 8 倍。

其二，加州、纽约和马塞诸塞州是 AI 投融资以及收购交易的主用地区。

第三，目前融资总额最高的 AI 公司是自动驾驶公司 Nuro，截止到 2019 年 7月，这家位于加州的公司已经融资 10 亿美元，其中包括来自软银的 9400 万美元；

第四，CB Insights 披露了目前的 9 个 AI 独角兽，分别是：

机器人过程自动化供应商 UiPath（71亿美元）
自动驾驶汽车软件供应商 Argo AI（70 美元）
农业创业公司 Indigo Agriculture（35 亿美元）
Nuro（27 亿美元）
贷款创业公司 Avant （19 亿美元）
人工智能预测销售平 InsideSales.com（17亿美元）
销售领域 AI 创业公司Afiniti（16亿美元）
医疗保健创业公司 Butterfly Network（13亿美元），
商业销售沟通平台Outreach（11亿美元）

Loup Venture 的年度语音助手评测

这份测试设计了 800 个问题，问题涵盖了搜索附近吃喝玩乐的地方、订购商品以及导航等，然后分别向 Google 助理、Siri 以及 Alexa 提问，考验其理解能力与回答准确率。

结果显示，Google 助理答对了其中 93% 的问题，并且理解了全部 800 个问题；Siri 理解了 798 个问题，答对了 83% 的问题；Alexa 的回答准确率只有 80%，但只有一个问题没有理解。

这个测试部分意义上展现了 Siri 进步明显，但考虑到地区差异以及不同设备差异，因此这个测试结果并不能总体反映三大语音助理产品的真实能力。

亚马逊推出 Alexa 自定义界面的 API

这是亚马逊在 Alexa Gadgets 开发套件里的新功能，旨在让开发者可以更好地将 Alexa 语音与自身设备界面相融合，从而建立起更好的人机交互界面。比如，亚马逊希望将 Alexa 与智能迷你钢琴协同工作，帮助用户快速学习钢琴。但 Engadegt 指出，开发者是否愿意将这个功能引入自己的产品还是个未知数。

案例：空中客车的 AI 应用

WSJ 介绍道，空客部署了一个名叫「AppZen」的 AI 系统，主要应用在内部员工的费用审核。此前，空客财务部门对于费用报销的审核非常耗时，有时也会因为不同语言的费用信息而导致审核时间更长，效率低下。AppZen 可以自动识别 100 多种语言，并与空客的供应商系统打通，从而可以快速确定费用是否合规。WSJ 透露，这个系统可以给空客每年节约数百万美元。

案例：AI 在影视预告片的应用越来越多

不久前 Netflix 财报会议上，该公司首席产品官 Gregory Peters 表示 AI 可以为影视剧自动制作预告片，从而可以减少人类员工的繁琐工作，提升预告片制作的效率。而最近，IBM 也和 20 世纪福斯合作，利用 AI 技术为恐怖电影 Morgan 制作预告片。事实上，国内爱奇艺已经在类似应用场景中做出多个尝试。

案例：北京互联网法院里的 AI 虚拟法官

这个项目是搜狗与北京互联网法院联合发布。但这个说法有点牵强，这个所谓全球首个「AI虚拟法官」，基本工作为用户提供导诉服务，也就是根据用户的需求，提供一些功能建议，引导用户更流畅地使用网络诉讼平台，与法官的定位并不相符。

微软发布新一代小冰

微软上周在华发布了第七代小冰和全新的 AI 框架。升级的核心包括核心对话引擎、全双工语音及多模态交互感官等。另外，「Avatar Framework」是一套 AI 框架工具包，包含对话工具、情绪构建等功能，可用于语音机器人、游戏人物构建等场景，这个工具包与微软小冰框架同源，可以搭建出类似小冰这样的对话机器人。

与此同时，根据福布斯的报道，微软将加大在台湾的 AI 投资。微软将给位于台湾的 AI 研究中心提供 3400 万美元的支持，主要用于企业 AI 的研发。

观点：彼得·蒂尔的 AI 观

知名投资人彼得·蒂尔在 NYT 的这篇文章虽然有着浓浓的「反 Google」意味，但他作为投资人，的确看到了 AI 在军事领域里的巨大应用潜能，这种潜能势必会改变军事行动、决策的流程，这也是代表了美国一部分技术专业人士的看法，还记得不久前国内社交媒体如何翻冷饭炒作 Oracle 创始人 Larry Ellison 的采访吗？

UPS 开始投资自动驾驶卡车

根据 WSJ 的报道，UPS 旗下的风险投资部门已经收购了自动驾驶卡车公司 TiSimple 的部分股权，这也标志着 UPS 正式踏入自动驾驶领域。

公开资料显示，Tusimple 成立于 2015 年，正在开发可以应用在重型卡车上的自动驾驶技术，其产品主要是利用摄像头来实现自动驾驶，该公司在中国和美国都有办公室，目前的估值超过 10 亿美元。

AI 与艺术

英国艺术家 Anna Ridler 将在伦敦「AI，不止人类」的展览中展示了自己收集、拍摄的 1 万张郁金香图片。Ridler 亲自前往荷兰拍摄这些照片，然后挨个标注（比如颜色和条纹），她将这 10000 万张照片拼成了一幅大约 150 平米的巨型图片，你可以在这里查看 Anna Ridler 的所有作品。

感谢您的订阅，如有疑问，欢迎写邮件给我：zhaosaipo@gmail.com

点击这里退订