自动驾驶的 2019/深度学习与硬件（芯片）/AI 驱动互联网领域变革

Issue #019 2019-11-29

本期导读：

研究：对于「可解释 AI」的新研究突破；
学术：Jeff Dean 论文讨论深度学习对计算硬件的影响；
开源：Google 开源 MobileNetV3、Netflix 开源 Polynote；
洞察：自动驾驶的 2019，只有「失望」两个字；
巨头：英特尔的 oneAPI、微软 AI 人事变动、华为在新加坡成立 AI 实验室；
应用：Instagram 首次披露机器学习的使用方式、微软如何改进 Bing 搜索结果、DeepMind 优化 Google Play 推荐等；
案例：德意志银行、UPS 以及空客的 AI 落地案例分享；

学术·开源

汇总近期值得关注的 AI 学术领域研究结果以及AI 开源项目。

可解释的 AI

长期以来，机器学习的「黑盒子效应」备受质疑，即便是作为编写算法的工程师，也无从知晓其最后输出结果的逻辑是什么，这也可能导致数据偏见。在 NLP 领域，Google 发布的 BERT 模型被认为是业界标杆之一，但 NYT 援引著名计算机科学家 Robert Munro 的研究表示，BERT 存在严重的性别偏见，其对于女性相关的词汇（比如「她的」）识别率非常低。

业界的确也在努力解决这个问题。比如美国非盈利研究机构艾伦 AI 研究所最近发布了 NLP 解释工具 AllenNLP Interpret。这是一个辅助解释 NLP（自然语言处理）结果的工具套件，它可以识别不同输入文本如何影响 NLP 模型，并预测可能发生的变化。你可以在这里查看其演示 Demo，论文地址在这里。

Google 上周推出了「可解释 AI」的云服务。根据 Google Cloud 最新公布的消息，该公司推出的「可解释 AI 服务」可以量化每个数据因素对于特定机器学习模型的影响，这可以有效帮助学者和开发者理解 AI 决策的逻辑。

深度学习与硬件

Google AI 研究负责人 Jeff Dean 上周的一篇论文非常值得关注，这篇论文聚焦在深度学习如何影响计算架构与芯片设计，Jeff Dean 提供了一个认识深度学习、计算架构与芯片的认知框架，不需要太多技术背景，便能理解其发展方向，比如他这样论述深度学习为何需要专属硬件：

Deep learning models have three properties that make them different than many other kinds of more general purpose computations. First, they are very tolerant of reduced-precision computations.

Second,the computations performed by most models are simply different compositions of a relatively small handful of operations like matrix multiplies, vector operations, application of convolutional kernels, and other dense linear algebra calculations [Vanhoucke et al. 2011]. Third, many of the mechanisms developed over the past 40 years to enable general-purpose programs to run with high performance on modern CPUs, such as branch predictors, speculative execution, hyperthreaded-execution processing cores, and deep cache memory hierarchies and TLB subsystems are unnecessary for machine learning computations. So, the opportunity exists to build computational hardware that is specialized for dense, low-precision linear algebra, and not much else, but is still programmable at the level of specifying programs as different compositions of mostly linear algebra-style operations.

你可以在这里阅读这篇论文。

洞察·观点

自动驾驶的 2019，只有「失望」两个字

即便还有一个月的时间才能迎来 2020 年，但现在总结 2019 年自动驾驶领域并非不合时宜。过去这一年也是失望大于希望的一年，在那个共同的机遇面前，来自技术、资金、监管与公众情绪的压力和挑战让整个行业陷入到不安与停滞之中。

1 创业公司

作为 AI 学术大佬吴恩达夫人创建的公司，Drive.ai 从一开始就吸引了全球媒体以及投资人的关注，但这家公司在 2019 年却极为惨淡地卖身苹果，甚至在被苹果收购之前已经烧光了所有资金，虽然苹果并未透露收购金额，但可以肯定的是，Drive.ai 已经没有了谈判的筹码。

Drive.ai 从创立之初就将深度学习作为攻克自动驾驶的技术，他们研发了面向车厂的「深度学习套件」。从产品上看，这的确是最快切入市场的选择，但在技术层面，他们无法彻底解决深度学习系统决策中的「黑盒子」问题，这意味着，人类驾驶员无法确切理解车辆驾驶过程中的决策逻辑。

更重要的一点，Drive.ai 被收购前后，围绕该公司管理层的质疑此起彼伏，管理不善、内部混乱等问题，或许也是杀死这家一度估值超过 2 亿美元创业公司的原因之一。

另一家创业公司 Voyage，他们采用了深度强化学习技术来解决自动驾驶难题。这是一个很有 PR 色彩的词汇，在产品层面，Voyage 可以完美实现「模拟自动驾驶」。但对于自动驾驶来说，它本身不是一个简单的算法问题，而更像是一个个偶然性问题，这意味着，仅仅利用算法来模拟自动驾驶是非常不够的。

2 互联网巨头

Waymo 的确在进步，他们在凤凰城的「自动驾驶出租车」计划还在运行中，但即便是 Waymo 母公司 Alphabet 的一位高管也不得不承认，自动驾驶领域充满了炒作，而与之遥相呼应的则是摩根斯坦利调低了 Waymo 的估值。

仔细去看 Waymo 在凤凰城的实验，充满了一些令人困惑的细节，比如这个测试场拥有宽阔的道路、少量的行人（甚至在夏天都没有行人），或者可以理解为这更像一个在现实里的「自动驾驶理想驾驶场」。

当然，Waymo 可以说这是为了符合监管需求，同时为了保证行人安全，但这个解释的另一层解释可能是：当下自动驾驶车辆的能力，无法满足监管部门对于安全的要求。

类似的，国内百度 Apollo 在长沙、沧州的自动驾驶出租车测试，也反映了这样的现实困境。

3 车企

通用汽车旗下的自动驾驶公司 Cruise 曾表示会在 2019 年推出自动驾驶车队，显然这个目标已经落空了，而包括福特、沃尔沃在内的车企，也推迟了自动驾驶落地的时间。

汽车巨头戴姆勒也在本月便是，戴姆勒会「优化」在自动驾驶出租车和该技术领域的投入，并重新审视自动驾驶出租车项目的可行性。

上述来自大型车厂的一系列动作都在说明一个事实：作为最接近车辆设计与生产的企业，他们已经意识到了来自自动驾驶技术、体验对于汽车驾驶安全的巨大挑战，并且短期内无法实现真正的突破。

车企里有一个另类，特斯拉。这家公司之前表示将在 2020 年实现百万自动驾驶车辆目标，如今来看，这个目标更像是融资的口号。特斯拉的确在自动驾驶领域做出了重多令人印象深刻的突破，不过，你只需在 Youtube 上以「Tesla failures」为关键词搜索，就可以看到特斯拉的自动驾驶系统到底有多脆弱。

4.写在最后

2019 年的自动驾驶领域令人失望，那么 2020 年呢？我认为依然会延续今年的状况，即便是特斯拉这样已经拥有自动驾驶系统的车辆，其实现完全自动驾驶的可能性几乎为零。

更进一步，这个领域的参与者们，还需要至少五年时间才能兑现自己的承诺，接下来的五年，从网络（比如 5G 的商用）到视觉（激光雷达降价、视觉算法提升）到其他产业巨头参与（比如苹果推出汽车）再到监管部门认可（比如开放更多城市道路），都将对自动驾驶领域产生重大影响。

业界·巨头

芯片巨人英特尔正在全力拥抱 AI。CNET 的报道称，根据英特尔 AI 芯片负责人 Naveen Rao 的说法，很多人已经开始在电脑、笔记本上体验到 AI 能力。他表示，电脑的用途正在转型为一台 AI 机器，这也是英特尔在电脑处理器领域发力的方向，其最新的 CPU Ice Lake 就拥有 AI 能力，包括一款可以处理语音命令的 Gaussian 神经网络加速器。

英特尔上周还发布 oneAPI。这是很有迷惑性的产品名称，简单来说，英特尔希望通过统一代码来实现跨多个硬件（比如 CPU、GPU）的AI 计算，类似于「编写一次，多处运行」的机制，如下图所示：

oneAPI 将 AI 计算硬件的中间件和框架抽离出来，可以实现硬件对于代码的兼容，这个工具包已经在英特尔开发云上开始测试。

微软人事变动之后。随着负责 AI 研发的沈向洋即将离职，微软重新规划了其 AI 团队领导者，ZDNet 的消息称，自 2020 年 2 月起，微软 CTO Kevin Scott 将负责 AI 研发工作。

沈向洋的离职，也代表了微软 AI 战略的调整，微软已经明确表示，自 2020 年 1 月 31 日开始不再支持 iOS、Android 上的语音助手 Cortana（微软小娜），这恰恰是沈向洋过去几年所主导的重要项目（另一个是微软小冰）。

华为在新加坡成立 AI 实验室。根据 ZDNet 的报道，这个实验室将提供 AI 测试平台、华为云服务以及 AI 开发平台 ModelArts 等，此举也被认为是华为在当地业务拓展的一部分，该公司近期与新加坡多家公司签署了合作备忘录。

应用·行业

互联网

Instagram 如何利用机器学习推荐内容。这篇来自 IG 工程师 Ivan Medvedev 的博客文章也是首次向外披露该公司的个性化推荐机制。其中的一个要点，为了将相似的用户识别并关联起来，IG 利用了一个名为「词语嵌入」的通用机器学习方法。与此同时，IG 还引出三层排序机制，可以实现秒级 9000 万模型预测以及 6500 万特征提取。

Twitter 利用机器学习对抗假新闻。Twitter 的开发博客里透露了一些线索，比如系统会自动在某些推文旁边贴上警告，提醒用户这条内容可能是虚假的新闻；另外，Twitter 的算法还会将「误导性、可能威胁到别人人身安全」的内容删除。

微软利用类 BERT 的NLP 模型提升 Bing 搜索质量。微软在一篇博客里表示，自 2019 年 4 月开始，微软引入了大规模的 Transformer 模型，极大提升了 Bing 的搜索效果。鉴于类 BERT 模型巨大，微软在博客里还介绍了他们的优化方法，比如利用 Azure 的 NV6 GPU 计算实例来运行该模型，可以大幅降低延时。

DeepMind 如何优化 Google Play 商店的应用推荐。根据 DeepMind 透露的信息，他们采用了三个机器学习模型：「候选生成器」、「重排器」以及「多目标优化」。其中「候选生成器」负责深度分析上百万个应用程序，从而确定「候选」，而「重排器」则是利用多维度数据来预测用户喜好，并与「多目标优化」模型协同工作，最终形成更精准的推荐。该系统已经在今年早些时候部署到了 Google Play。

应用·其他行业

德意志银行利用机器学习程序替代人类员工，过去几年，机器人已经帮助这家银行完成了 500 万笔交易。
UPS 将 AI 与传感器结合，追踪包裹。这项服务主要针对医疗客户，可以实时追踪包裹位置，并提供更精准的投送时间预测。
空客正在研究单一「AI 飞行员」的飞机，空客 CTO Grazia Vittadini 认为，AI 可以处理飞行的日常任务，人类飞行员可以专注于重要决策。

感谢您的订阅，如有疑问，欢迎写邮件给我：zhaosaipo@gmail.com

取消订阅