AI 领域的「骗子」与「宗师」/农业领域的 AI 挑战/OpenAI 可解魔方的机器手

Issue #016 2019-10-22

本期导读：

研究：详解 OpenAI 可解魔方的机器手及背后争议；
学术：DeepMind 新算法预测希腊铭文字符、AI 在乳腺癌诊断的准确率非常高；
学术：面部识别系统无法有效识别性别、FB 与法国研究者的新 AI 模型可帮助认知障碍人群；
开源：创业公司 Streamlit 的开源产品；
洞察：AI 领域的「骗子」与「宗师」；
案例：农业领域的 AI 挑战是什么、面部识别在机场的应用；
应用：Google、NYT 等产品里的 AI 应用场景、企业招聘与 AI；
业界：AI 人才短缺、阿布扎比的 AI 大学、Google 放弃 Clips 等；

学术·开源

OpenAI 发布可单手解魔方的机器手

上周，OpenAI 的一篇论文展示了其在 AI 领域的最新进展。根据其论文的说法，研究人员开发了一种称为自动域随机化（ADR）的新方法，该方法会在模拟中不断产生越来越困难的环境，这使这个名叫 Dactyl 的机器手摆脱了对真实世界的精确模型的束缚，并能够将在模拟中学习到的迁移神经网络能够应用于真实世界。

其最终展示出来的效果如下图所示：

MIT TR 指出，OpenAI 的这个论文有两个意义，其一，整个训练过程中采用了强化学习的方法；其二，整个训练都是在模拟中实现的，但却可以在现实世界里呈现出来，这也从某种程度上展示了该技术落地的可能性。

但 OpenAI 的这个成果依然有诸多争议的地方，知名 AI 学者 Gary Marcus 提出了自己的思考，他用一个图片回应了这个事件：

某种意义上说，Marcus 作为坚定的「反机器学习流派」代表人物，他的这些意见也是在质疑机器学习的前景。而从我的角度去看，OpenAI 也好，Marcus 也罢，他们在各自技术理念的左右下提出了迈向真正智能时代的不同方法，在「智能」这个词还没有业界共识的前提下，两个阵营的做法无所谓对与错。

现阶段，机器学习以及所衍生的深度学习、强化学习的确在很多领域有突破，而且拥有了诸多应用场景，但要进化到真正的 AI，机器学习以及其他流派，还有巨大的发展空间。我们应该更理性地看待未来机器学习以及 AI 领域探索，这些探索值得鼓励，但并不一定可以成功。

DeepMind 新神经网络可以预测古希腊铭文的缺失字符。这个名叫「Pythia」神经网络综合语法、形状、布局以及上下文等数据，为人类专家提供 20 条可能的建议，帮助人类专家在研究古希腊铭文内容时获得更高的效率，其论文显示，人类对于缺失字符预测的错误率比机器高 30%。

纽约大学研究指出：AI 在乳腺癌诊断上准确率达到 90%。这项研究里，一个机器学习工具结合 14 名放射科医生的诊断，并学习了 720 张乳腺 X 光扫描照片，其结果进一步展示了 AI 在疾病影像识别中的能力，相关论文发表在这里，同时这次研究中的模型也在 Github 上开源。

当下流行的面部识别系统无法有效识别性别。这是一份来自科罗拉多大学博尔德分校的研究，研究人员将来自 Instagram 上的上千张照片放在包括亚马逊 Rekognition、IBM Watson、微软 Azure 等面部识别系统中识别性别，其中男女性别识别准确率可以达到 98%，但变性男的识别率只有 70%，至于 Nonbinary（非二元的，指不单纯属于男性或女性的自我性别认同），这些系统都无法有效分类。

FB 与法国研究者正在共同研究一个新 AI 模型。这个研究由 FB AI 实验室和法国国家信息/自动化研究所共同参与，旨在通过一个可以简化文本语法和结构的 AI 模型，帮助患有认知障碍的人，相关论文发表在这里。

机器学习创业公司 Streamlit 日前开源了一个新工具，帮助机器学习工程师只需几行代码，就可以创建自定义的应用和数据交互方式，相关代码已经在 GitHub 上开源。

洞察·观点

骗子与宗师

上周，社交媒体上一位「宗师」人设彻底崩塌，这位名叫 Siraj Raval 的「宗师」，拥有 7 万 Twitter 粉丝、70 万 YouTube 订阅者，他向粉丝售卖 AI 学习之道，其创立的 AI 学习社区 School of AI，旨在打造类似三个月速成机器学习达人的课程。

Siraj Raval 最大的问题在于其论文抄袭。来自英国的一位机器学习开发者 Andrew M.Webb 在 Twitter 上对比了这位「宗师」的论文，简直就是「像素级别」抄袭的代表。

由此引发的连锁反应是，包括 Jeff Dean（Google AI 大牛）在内的众多学术大拿纷纷表态，不再关注 Siraj Raval。

Siraj Raval 的「成功」——我这里姑且用「成功」这个词——既离不开自己的「努力」，毕竟在严肃的机器学习领域，能够有一种类似嘻哈、说唱的方式做培训，已经形成了自己的品牌。

但更重要的一点在于，整个 AI 领域的浮躁心态，助长了围绕 AI 的各种培训。WSJ 的报道指出，AI 就业市场里，六位数奖金、巨额股权激励以及远程工作的灵活性，持续吸引人才的加入。

这篇报道还列举了一个数字：AI 领域有经验的开发者和工程师，平均年薪为 20 万美元，高于一年前的 15 万美元。

如此诱惑之下，AI 培训成为一种「向钱看」的功利行为。显出原形的 Siraj Raval 不过只是其中的一个代表罢了，放眼国内，各种 AI 培训、速成班数不胜数，绝大多数还价格不菲。这些培训无非利用了当下 AI 行业人才稀缺而昂贵的现实，通过不断鼓吹「XX月成AI达人，起步10K以上」的口号，忽悠学员，但如果你仔细去看这些机构的 AI 课程，几乎所有的课程都在围绕 Python，这也意味着，学员动辄数万元的培训费用，换来的工作技能可能只会做爬虫。

如果说绝大多数 AI 培训是利用人性欲望制造出来的骗术，那么在另一个依靠人性对于未来不确定性恐惧的赛道上，还在上演几乎同样的故事。

尼克·波斯特罗姆就是其中的典型代表，他所写的《超级智能》在大众层面曾掀起了一阵恐慌，这本书的核心议题是：人类几代人前仆后继地探索可以「帮助人类更好生活的机器」，却在不经意间忘记了这些智能机器或许就是人类的末日，也没人去关注我们是否或者应该如何驯服机器。

这本书的开头是一个寓言故事：

某天，一群弱小的麻雀在一起，讨论「寻找一只猫头鹰协助打理生活」的可能性。大部分麻雀都陶醉于美妙的想像中：这只强大的猫头鹰可以帮它们筑巢、照顾家人、提防天敌——猫……这时，一只叫斯克罗恩科芬克尔的麻雀提出了质疑：「这样做，将是我们的末日。在有这种想法之前，我们为何不先想想驯化猫头鹰的方法呢？」但绝大部分麻雀都听不进去，纷纷出发去寻找猫头鹰蛋了。

而波斯特罗姆的任务就是要成为那个名叫「斯克罗恩科芬克尔」的麻雀，唤醒这个世界上「其他执迷不悟的麻雀」。

过去四五年里，波斯特罗姆的观点得到广泛传播，包括伊隆·马斯克、比尔·盖茨等人先后推荐了他的书。然而即便是波斯特罗姆本人，也对自己写下的「超级智能」一词缺乏明确的定义，他在书中写道：「这个定义十分模糊，按照这个定义，许多系统具有迥然不同的性能特质，都可以被归入超级智能。」

于是，波氏换了一种思路，试图从目前一系列智能表现形式中再次归纳出一个「超级智能」的模样。比如他总结了当下五种通往超级智能的路径：

人工智能：通过编写完全模拟人类思维的程序，并兼具学习进化能力；
全脑仿真：通过精细扫描人类大脑，将原始数据输入计算机，然后构建起一个完全模仿人类大脑的智能程序；
生物认知：通过人工育种实现优生来求得智能上的突破；
人脑与计算机交互：将一块纳米级的芯片植入到人类大脑，实现新型的人机交互；
人类大脑之间互联：这种方式不仅会产生新的人机交互，而且还会产生诸如集体智能等新的智能形式.

波斯特罗姆认为，上述五大路径图中，「最有可能出现的超级智能是人工智能和全脑仿真，尤其是前者。」至此，本书的论题也从所谓的超级智能「平稳过渡」到人工智能。换言之，波斯特罗姆要警告人类，所谓超级智能将给人类带来的危险，也就是人工智能带给人类的危险。

但这个推理依然有诸多硬伤。

首先，当下 AI 领域的技术突破，仅仅是过往神经网络算法与当下海量数据、强大算力共同作用的产物，从根本上说，目前所言的 AI 都不是新技术，而神经网络的局限性，并不能给未来的机器智能带来真正的突破。

其次，或许会有人提及各种新方法、理论将驱动机器智能进步，最终带来「超级智能」，但这个讨论忽略了两个前提：是否真的存在这种有效方法；即便有这个方法，需要多久才能实现？

2015 年《纽约客》对该书的评论里就这样写道：这本书有一种「优雅」的悖论：一面展示了逻辑清晰的分析和论述，另一面又不时流露出像弥赛亚一样拯救世人的迫切。

这种迫切感让波斯特罗姆提出了一系列「没有节制的猜测」，比如他假设人工智能的 IQ 达到了 6455，会发生什么事？再比如他又强调：第一台超智能机器将是人类创造的最后一台机器，当然前提条件是这台机器足够听话并告诉我们要怎样才能控制它。

但正如来自微软的学者 Jaron Lanier 所言，这看似是在讨论技术，本质上却是一种宗教，波氏以形而上学的方式来应对人类的状况，以一种「戏剧化的方式展示自己对于末日场景的信仰」。在「超级智能」的口号下，波斯特罗姆俨然成为新的宗师，而他的信徒们，则早已遍布全球各地。

当然，我不能直接将波斯特罗姆定义为「骗子」，但历史经验告诉我，「宗师」与「骗子」之间，不过一张纸的距离。

案例·应用

AI 在农业领域面临的挑战

机器学习已经开始进入到各行各业，每个行业都有其特殊的挑战，比如农业。在这篇来自 IEEE 的报道中，我们可以看到农业领域对于机器学习的特殊需求，不仅需要制造出可以无人驾驶的拖拉机，还需要开发出更先进的可区分所有谷物、品种的机器学习算法。

与此同时，农业也在成为数据集中地。以生产农业设备的约翰·迪尔公司为例，每秒会从全球 13 万台联网设备中收集 500 万到 1500 万测量数据，其中大部分都不是通用格式的数据，该公司的数据量已经达到 PB 级别。

企业招聘中的 AI

在线招聘网站 CareerBuilder 推出一个基于机器学习的招聘平台。根据其公司的说法，该方法可以比传统招聘方法更快找到合适的员工。

简单来说，这个名叫「Talent Discovery Platform」的平台还是利用了 CareerBuild 过去二十五年来积累的海量数据，包括雇主对于职位的需求以及候选人简历数据等，从而实现更优质的职位匹配。

不过，对于将 AI 应用在筛选候选人方面，还有另一种声音，来自 WSJ 的一篇专栏认为，人事招聘经理往往会陷入到「机器高效筛选候选人」的便捷之中，而会忽视某些被隐藏的法律以及伦理问题，文章作者是一位名叫 Lynda Spiegel 的企业家，她这样写道：

As an employer, I would argue that the perceived upside of personality screening in the workplace is overstated. Sure, no one enjoys working with difficult people, but that’s where one-on-one coaching from an HR pro can have an impact.

Artificial Intelligence has greatly improved myriad processes in the workplace, but there’s still a strong argument against its use in recruitment. While the tools save time, they eliminate reliance on human intuition in determining who is best-suited to join our workforce.

面部识别在机场的应用

在英国伦敦的希思罗机场，当一名即将乘坐英国航空公司的旅客抵达机场并进入安检时，他/她会被录入一张面部照片，这张照片将与旅客的登机牌联系在一起，当这位旅客登机时，还会被拍摄一张面部照片，这张照片会同步到该乘客抵达的机场。

这是航空业应用面部识别的典型场景，根据 CNN 的报道，大西洋两岸（欧洲与美国、加拿大）都已开始部署相关技术，美国海关与边境部门给出的官方数字显示，当下美国已经在 15 个机场部署了面部识别系统。

纽约邮报介绍了纽约肯尼迪机场的一个面部识别登机系统，该系统由德国汉莎航空部署，通过识别旅客的面部信息帮助旅客快速登机。据报道，法航、日航以及挪威航空也将在该机场部署类似系统。

关于面部识别技术的争议还在持续中，争议双方围绕便捷/安全与隐私保护之间有不同考量，技术是否被滥用以及面部数据是否可以得到保护成为关键议题。

互联网产品的 AI 应用场景

某种意义上说，这几年 AI 的快速发展，离不开互联网巨头（如 Google）的力推，反过来，AI 领域的技术突破也在帮助这些互联网公司提升自己的产品体验。

比如 Google 就在近期为 Chrome 浏览器加入了一项新功能，这项功能利用机器学习识别网络上的图像，并将其转化为文本，这对于盲人以及弱视者的上网体验意义重大，该功能目前已经可以在 Chrome 设置里启用。

Youtube 如何推荐下一个视频，一篇关于 Youtube 推荐机制论文的解读，可以看到 Google 对于 AI 训练成本的考虑。

虽然不是互联网公司，但《纽约时报》也在探索如何优化网站内容推荐，这篇来自NYT 技术团队的分享介绍了这家老牌媒体如何利用机器学习，你可能会发现，没有万能的技术或解决方案，只有最适合场景的解决方案。

图片分享网站 Pinterest 将 AI 引入到对于社区内容的监控。该公司表示，通过机器学习可以有效识别和隐藏与自我伤害相关的内容，同时还删除了 4600 个相关搜索词和短语。

医生如何看待 AI 在医疗领域的尝试？

这篇来自 WSJ 的专栏文章值得关注，作者是耶鲁大学放射科与公共卫生的教授 Howard Forman，他在文章中谈到自己所在的医疗机构如何与 AI 创业公司合作，并分享了自己的心路历程：

During the adoption phase of this AI, I was concerned that radiologists would be slowed, our workflow would be disrupted, or worse, patient care would be impaired. This has not been the case. Rather, the technology has been remarkably nonintrusive. The most evident use of AI in our department is in triaging cases. AI allows us to read urgent cases earlier than we might otherwise, and allows for earlier management of patients requiring critical intervention. Not surprisingly, the technology has also picked up findings that could have been missed even by our specialty radiologists.

业界·巨头

AI 人才短缺与高校教育

IEEE 的报道指出，机器学习领域的人才短缺还在继续。对于广大公司来说，部署机器学习的一大难题是无法确定自己的人才需求，比如到底什么是数据科学家、什么是数据工程师以及数据分析师。

另一方面，不同规模的公司在落地机器学习时也面临人才错位的问题，小公司里数据科学家可能要兼职多个工作，而随着公司规模扩大，职责分工的变化也需要新的职位。

在这样的行业需求下，高校 AI 教育的重要性开始凸显。伊利诺伊理工学院将在今年开设 AI 本科专业，这也是美国中西部唯一一所提供 AI 本科教育的大学。根据其学校的说法，AI 过去几年的发展，使其可以从计算机科学里脱离出来，单独成为本科教育的内容。

在阿联酋首都阿布扎比，一所 AI 大学即将在 2020 年 9 月开学。根据其当地媒体报道，这所名为「The Mohammad Bin Zayed University of Artificial Intelligence 」的大学也将成为世界上唯一一所专门进行 AI 教育的大学，该大学面向本地和全球招生，提供机器学习、计算机视觉和自然语言处理课程，包括硕士（两年）和博士（四年）。

AI 融资或将再创新高。截止到 2019 年第三季度，来自美国的 965 家 AI 相关公司共融资 135 亿美元，相比于 2018 年全年 168 亿美元的融资总额，今年整体 AI 创业市场的融资有望超过去年的成绩。

VB 的这篇报道指出，AI 领域的投融资波动性比较大，但目前来看，AI 创业已经进入到了实战阶段，这意味着，整个领域的投资还会持续小规模地增加。

Google 悄然下架了 AI 相机 Clips。Clips 发布于两年前，搭载人工智能的小型相机，定价 249 美元、f/2.4 光圈、130 度超广角的镜头，但这款产品并没有在消费市场引发多大反响，Google 告诉科技媒体 Engadget，该公司会在 2021 年 12 月前继续支持这款产品，不过不会再发布类似的硬件。

亚马逊 AI 服务 Textract。这个产品能够自动从扫描文件里提取文本和数据，可以广泛应用在医疗行业，帮助医生从医疗记录里抽取有用信息，BI 的报道称，亚马逊一直对于医疗行业有巨大野心。

感谢您的订阅，如有疑问，欢迎写邮件给我：zhaosaipo@gmail.com

取消订阅