Issue #017 2019-10-29

本期导读:

  • 学术:医疗领域的肤色偏见;
  • 学术:AI 程序可以像放射科医生一样精准检测脑出血、可提前预测疾病感染的 AI 算法;
  • 开源:计算机视觉能力的新评估标准 VTAB;
  • 洞察:AI「创造」艺术的误解与错解;
  • 政府:德国的 AI 发展建议、美国各州 AI 调查;
  • 业界:FDA 应对 AI 医疗设备申请增长;
  • 案例:AI 治疗癌症中的作用、麦当劳的 AI 实践、社交媒体中的 AI 应用;
  • 应用:美军方如何将 AI 纳入军事领域;

学术·开源

医疗领域的肤色偏见。Science 上的一篇论文指出,在普遍使用算法来评估病人状况的美国医疗机构中,算法更优先考虑白人。根据其论文,研究人员从一份未公开的 50000 多病人记录的数据集里发现,算法对于白人患者风险评级更高,这也意味着,医疗机构会将更多护理和医生诊断资源分配给白人。研究人员大致推算了一下,这种数据偏见将使得黑人患者减少一半以上。

另据《华盛顿邮报》的报道,这篇论文里的算法由保险公司 United Health 开发,这款产品覆盖了全美 7000 万人。

研究显示 AI 应用可以像放射科医生一样精准检测脑出血。来自加州大学的研究者使用 4300 张已经诊断的大脑头部扫描照片训练 AI 应用,结果显示,这个名叫「PatchFAN」的 AI 应用在对脑出血检测上与四位放射科的人类医生具有同等水平,你可以通过这篇论文继续了解这个研究。不过需要提醒一下,这个研究结果并不能说明人类医生可以被取代,更多的还是展现了 AI 在医疗领域的巨大潜力。

可提前预测疾病感染的 AI 算法。由美国国防部和飞利浦公司开展的这个研究,将从 700 万住院患者的数据集里提取 4 万条数据,并分析其中 165 例健康与患病者的生物特征,从而建立起一个预测模型。根据飞利浦公司披露的公开信息,在为期一年半的研发之后,美国国防部计划将这个算法与可穿戴设备整合在一起,用于监控病人的健康,其首要用途是预测士兵的健康状况。

计算机视觉能力的新评估标准 VTAB。过去几年,计算机视觉领域发展迅速,全球各地的学术机构、公司不断提出新的模型和算法,持续推进这个领域的突破,与此同时,评估该领域发展程度的模型和算法也在不断进化,比如 Google 推出的这个标准 VATB,全称为「Visual Task Adaptation Benchmark」。

根据 Google 研究者的说法,这个标准主要测试算法能否使用更少的数据标注来解决一组特定问题。

VATB 这类评估标准正在 AI 各个领域兴起,究其原因,无论是计算机视觉还是自然语言处理,训练算法的数据集越来越大,这些模型也具备了更好的性能,或者说更智能,同时这些功能强大的模型也开始变得非常复杂,需要更好的评估标准去评估其技术实力。

VATB 的代码也在 Github 上开源。

洞察·观点

AI「创造」艺术的误解与错解

上周,一个以 AI 为中心议题的艺术展览在纽约开幕,来自土耳其的艺术家 Refik Anadol 展示了一个名叫「machine Hullucinations」的装置。在一个两层楼高的墙壁上,艺术家通过不断滚动甚至看起来都已经弯曲的图像,来展现出深度学习与大数据的复杂性,你可以在这里观看这个作品,下面是一个截图。

img

AI 与艺术也是过去几年持续升温的话题,在我看来,这两个话题放在一起的原因无外乎人类对于如此需要创造性的工作是否还属于人类的恐慌,在各种棋类竞技、德州扑克以及部分游戏败给机器之后,艺术或许成为人类继续保持「最」智慧生物的几个为数不多的特征之一。

或许也正是这样的恐慌心理,围绕 AI 与艺术的话题中,有太多的误解甚至错解。

首先,AI 与艺术的关系由来已久策展人张海涛曾分享过 AI 与艺术的历史。

某种意义上说,艺术家往往对于技术有着天然的敏感度,他们的「嗅觉」,比常人更能意识到新技术对于人、社会带来的影响,而艺术家的工作,则是用某种形式将这种影响展示出来,比如1956 年(这一年也是「人工智能」一词诞生的年份)匈牙利裔法国艺术家尼古拉斯·舍弗尔创造的能够创作艺术的「CYSP 1」型机器人,如下图所示。

img

这个艺术作品所呈现的,也是对于当时机器人未来如何发展的艺术化表达,当时二战后的乐观情绪以及大量二战期间军方技术项目民用,推动了整个社会对于技术、智能的乐观心态。

过去几年,随着深度学习的再次流行,AI 也再一次成为社会关注的话题,此时的艺术家们,也开始用新的方式去表达技术之于人类的意义,比如英国艺术家 Anna Ridler 就在今年伦敦的「AI,不止人类」展览中展示了自己收集、拍摄的 1 万张郁金香图片。

Ridler 亲自前往荷兰拍摄这些照片,然后挨个标注(比如颜色和条纹),她将这 10000 万张照片拼成了一幅大约 150 平米的巨型图片,你可以在这里查看 Anna Ridler 的所有作品。

从这个角度去看,AI 成为艺术家们观察人类社会发展的一个隐喻,与过往汽车、火车、城市化等技术无异

其二,如果从广义上看,「艺术」还包括了绘画(图像)、小说(文本)、音乐(语音)等多个领域,在这些领域,产生了一些值得关注的变化。

比如下图这个算法生成的「艺术品」被佳士得拍卖行拍出了 43 万美元。

img

而我在上周还发现了一个只售卖「AI 生成图书」的网站,在这个网站上,你会看到由 AI 程序「撰写」的各种科幻小说,更为有趣的是,这个网站上的书评也是由机器自动生成。不过,从文字内容上看,这些图书、书评几乎没有逻辑。

机器「撰写」小说的背后,也是 NLP 领域,特别是文本生成领域的快速发展,以 Open AI 发布的 GPT-2 为例,它展示了一种技术的可能性,即让机器具备自动撰写「一般性」文章的可能性。过去几年所谓新闻行业里的「机器人记者」在 GPT-2 面前根本不值一提,你可以在这里查看 GPT-2 生成的文章,不管是语法、拼写还是逻辑,几乎做到了令人无法分辨的地步。

不久前,北京航空航天大学和中国微软的一组工程师共同开发了一个可自动生成新闻评论程序。这个名叫「DeepCom」的机器人采用了两个递归神经网络,在读取文章之后生成相关内容,从而形成文章评论。

上述这些场景里,从绘画到小说,机器在其中扮演了一个「0 到 1」的过程,这在某种意义上与人类的艺术创造过程类似,这也是过去几年频频出现类似「机器拥有创造力」言论的根源。

但问题并没有这么简单。

如果以上文提及的那个最后 43 万美元成交的 AI 画作为例,它是一个非常典型的「AI 艺术品」。这幅画作的核心是使用大量肖像画(其团队称有 15000 幅) 来训练模型,并使用 GANs(对抗生成网络)生成了这幅「艺术品」。

在这个过程里,AI,或者准确地说神经网络,不过是执行了输入、输出的计算工作,不会涉及任何人类艺术创造过程中的逻辑与情绪。类似地,上文中的 AI「撰写」小说,以及「谱写」乐曲,都是系统在「喂养」海量数据后输出的结果。

更重要的一点,不管是图像还是文本、语音,这些生成的「艺术品」里无一例外都有着幕后操纵者的数据偏见。换句话说,躲在幕后的人类,利用数据类型、计算参数甚至计算时间,左右着这些「艺术品」的成色与模样,到这里,你还会再认为机器可以「创造」艺术吗?

业界·政府

德国。上周,一份来自德国政府授权的数据伦理委员会就 AI 监管给出了建议,这个委员会是去年德国政府倡导组织,其成员涵盖了学术、工业界以及政府监管部门。

根据这份报告,AI 算法系统的设计应该足够安全,尊重人民的权利和自由,在保护民主、安全的同时,避免数据偏见和歧视。

报告还认为,当下 AI 算法中存在巨大风险,比如某些根据不同收入人群的价格系统(或者我们常说的「大数据杀熟」),以及潜在的杀手机器人或战争机器人等。

另外,报告建议政府应制定一个强制性的数据标注计划。也就是说,由政府主导数据标注,而非当下互联网巨头们所做的自我数据标注,这个建议是为了保障所有算法对于涌入的数据一视同仁。

你可以在这里下载这份报告。坦率来说,这份报告展现出了当下红红火火的 AI 的另一面——数据偏见与数据滥用所制造的可怕未来,但这对于大公司来说,并不是一件可以开心的事情,这意味着,他们还需要作出更多的工作(包括但不限于政治游说、数据治理),以适应欧洲的 AI 发展态势。

与此同时,德国政府也在加大对于 AI 基础研究的投资。比如本月初成立了 AI 创造基金,德国政府将拨款 9000 万欧元用于 AI 研究小组的建设,并为大量年轻的 AI 学者/科学家提供支持。

美国。一份由 IBM 和美国国家统计信息办公室的调查,展示了美国各大州 AI 发展的基本情况。报告显示,79% 的受访者称,该地缺乏实现理想中数字政府的资源,但有 48% 的受访者认可 AI、机器人对于政府工作的重要战略意义。

比如在俄亥俄州,利用福利系统中的 Chatbot,有效减少了大量关于福利问题的网络请求,在五周的时间里处理了 3000 个申请案例。

而另一组数字则显示,政府对于 AI 的应用还处在初级阶段。只有 1% 的受访者表示该州已经广泛部署了 AI 应用;超过一半的受访者认为还需要评估相关需求,12% 的受访者表示目前没有部署 AI 的计划。

你可以在这里下载这份报告。

而在华盛顿,两位不同党派的国会参议员宣布与智库 Bipartisan 政策中心合作,共同搭建一个 AI 国家战略框架。根据媒体的报道,两位参议员将与 AI 公司以及学术机构合作,共同探讨「AI 的政策挑战」。

「AI 的政策挑战」非常多,也非常复杂,比如如何应用面部识别,路透社的消息称,美国海关和边境保护局已经申请了包括配备有面部识别功能的摄像头等工具,不过面部识别功能被列入了「潜在兴趣」一栏。

而在机场,面部识别系统正在加速部署,但也存在一些对于大规模部署的隐私担忧。一位来自麻省的参议员在听证会上警告表示,如果没有足够的数据保护与公民自由保护机制,他将反对这项技术的推广。

另一个 AI 所面临的政策挑战则是在医疗领域,尽管 AI 算法、设备已经在医疗领域展现了巨大潜力,但作为医疗监管部门,如 FDA,也需要做出巨大的政策与观念调整,才能适应不断增加的 AI 产品提交速度。在今年,FDA 计划启动一个新的监管框架,以更快地审核各种 AI 医疗设备。

而在上周,英国伦敦警察部门也开创了一个与 AI 公司合作的先河。警方将一段演习中的枪战训练录像发到 Facebook,帮助 Facebook 更好地训练对于枪击射杀影像识别和判断的算法,从而减少并杜绝恐怖分子或极端分子将枪击影像上传到社交媒体上的现象。


应用·案例

AI 将应用在肿瘤的治疗中NYT 的这篇报道以 MIT 教授 Regina Barzilay 的视角,展现了 AI 在肿瘤治疗中的重要作用,Regina Barzilay 曾在 2014 年患上乳腺癌,自此她也开始研究如何用 AI 来预测这一病症,并且开发出一个可以预测未来 5 年是否患病的模型。与此同时,她还在积极探索癌症治疗中的「专属疗法」,利用海量数据训练出一个个不同的「治疗方案」。

机器学习帮助房地美解决 IT 问题。房地美在一年前部署了一套机器学习系统,来分析其 IT 系统的技术问题,这个系统的核心是跟踪系统中的模式异常,系统还可以隔离崩溃的模块,并提出修复方案,WSJ 记者了解到,现在这套机器学习系统已经减少了 IT 工作人员约三分之一的工作量。

社交媒体中的 AI 应用。在 WSJ 举办的技术大会上,FB CTO Mike Schroepfer 分享了机器学习如何帮助 Facebook 解决信息误导问题,你可以在这里观看这个视频。

而根据《财富》杂志的报道,利用自动化的 AI 算法,Twitter 可以在用户举报前自动删除约 50% 的侮辱性推文,过去的这个季度,在所有因为违反 Twitter 公司政策而被删除的推文里,该算法贡献了 43%。

麦当劳的 AI 实践。过去两年,麦当劳收购了多家 AI 创业公司,而这家快餐巨头正在将快餐购物变得与在线购物一样,通过海量的数据挖掘,麦当劳可以实现一天不同时间段的精准推荐,还可以结合顾客过往消费记录和习惯,提供更符合用户口味的产品推荐。

美国军方的两项 AI 应用WSJ 的报道称,美军方希望利用图像识别,优化导弹系统的精准度。这同时也体现在美国防部旗下研究机构 DARPA 的 AI 项目中,比如将即时翻译系统纳入战争场景里。

另外,DARPA 认为 AI 对于无线通讯安全保障至关重要。在上周由 DARPA 举办的无线技术频谱协作挑战赛上,10 支竞赛团队必须设计一种新型的通信设备,并且每次通信都能使用不同的频谱,与过往频谱分配不同,此次比赛的各支队伍都采用了机器学习算法来快速寻找可用的频谱,分别应对军事任务通信、应急响应等五个特定场景,最终一支来自佛罗里达大学的团队获得冠军。

值得一提的是,与过往 DAPRA 在自动驾驶领域举办的竞赛类似,这项无线通讯的技术方案也还处在早期阶段,需要更多研究突破以及资本的支持。

Facebook
Twitter
Website
Email
感谢您的订阅,如有疑问,欢迎写邮件给我:zhaosaipo@gmail.com 

取消订阅