Issue #024 2020-02-12
在这段特别的日子里,请关爱身边爱你的人和你爱的人,保护他们免于现实以及数字世界的伤害。

本期导读:

  • 研究:MIT 学者推出干扰 NLP 模型的工具、医疗数据因果性研究的新突破;
  • 学术:AI 推进新冠肺炎药物发现;
  • 产品:可检测 Deepfake 图片的平台、ARM 发布面向边缘计算的芯片;
  • 洞察:商业化的 Deepfake、云端量子计算、研发 AI 的 AI 工具,解读 2020 年 9 大 AI 趋势;
  • 政府:「大数据联防联控」、欧盟 AI 监管、伦敦与莫斯科民众抗议面部识别;
  • 巨头:AWS 要求总统作证、IBM 新任 CEO、Oracle 数据中心扩张、Adobe 快速崛起;
  • 市场:AI 推动企业市场并购浪潮、云服务商如何受益于区块链技术;
  • 应用:机器学习帮助垃圾分类、星巴克 AI 咖啡机、利用 AI 修复老电影、基于 AI 的房产估值模型等;

研究·产品

对抗式的「文本攻击」。与对抗生成网络可以愚弄图像识别类似,基于文本的对抗攻击也显示出其强大之处。MIT 的研究者们开发了一套名叫 TextFooler 的工具,通过替换单词的方式成功欺骗了 Google NLP 模型 BERT,后者也被认为是当下最领先的 NLP 模型之一。

一个例子是,加入一定干扰后,Google BERT 在识别 Yelp 上的正面与负面评论准确率时下降了 5 到 7 倍。

这个研究的目的,也正如其论文标题「Is BERT Really Robust? A Strong Baseline for Natural Language Attack on Text Classification and Entailment」所指,主要是探讨倘若一个被业界公认的模型如此脆弱,那么其面临的结果也是相当危险的。

你可以访问这里查看这篇论文。

研究者展示从数据中发现因果性。长期以来,相关性一直是大数据研究和应用的主要方式,但根据 MIT TR 的报道,来自英国巴比伦健康中心的一个算法,可以在数据中找到因果性。

该机构通过聊天机器人与患者互动,在了解患者的症状之后,提供医疗建议和可能的诊断,这是目前医疗领域常见的互动形式,但由于医疗数据中的关联性,医疗机构并不会仅仅依靠这些数据来做诊断。

从这个意义上说,巴比伦健康中心的研究具有里程碑的意义,它有可能彻底改变大数据以及机器学习在医疗诊断中作用。不过,正如 MIT TR 所言,尽管其研究已经通过了同行评议,但外界依然有诸多不解和困惑,也期待更多后续细节。

AI 推进新冠肺炎药物发现。作为医疗领域的重要应用场景,药物发现中的 AI 应用越来越多。伦敦理工大学与 AI 医疗公司 BenevolentAI 合作,通过算法将分子结构数据与相关疾病的医学信息联系起来,以锁定潜在药物。

根据 C&En 的报道,目前已经锁定了一个治疗类风湿性关节炎的药物 baricitinib,它具备控制病毒感染人类的能力,研究人员希望可以尽快在临床试验中进行测试。

Alphabet 子公司发布可以检测 DeepFake 的平台。这个名叫 Assembler 的平台由 Alphabet 子公司 Jigsaw 推出,可以检测伪造和篡改的图像,这对媒体从业者快速甄别社交媒体上的图片非常实用,从而可以更好地完成事实核查工作。

你可以在官网详细了解这个项目。

Arm 推出两个面向边缘 AI 计算的芯片Verge 的报道称,这两款芯片的代号分别是Cortex M55 和 Ethos-U55,面向多样化的物联网设备,可提供强大的边缘 AI 计算能力,特别是针对语音的计算。

洞察·观点

2020 年的 9 大 AI 趋势

上周,CB Insights 发布了一份 2020 AI 趋势预测,通过 40 页的篇幅描绘出未来一年值得关注的 9 大趋势。

你可以在这里免费下载这份报告。

结合这份报告,我会从积极性和消极性两个维度去做一些解读。

1. 积极性

过去几年,AI 各项技术快速发展带来了两个显而易见的结果。

其一,从机器学习开源平台,到各种封装组件,大量标准化生产工具的出现,使得 AI 的从业门槛不断降低。

包括 Google、百度、亚马逊等公司还在利用云端的服务,进一步降低 AI 项目的上手门槛,这种「No Code」或「Low Code」的行业现实也和报告里所指出的 AutoML (趋势3)相呼应。

img

其二,AI 继续深刻影响到社会经济的方方面面,而随着与行业结合度越来越紧密,新的技术爆发点也在酝酿。

比如在某些特定行业,必须也只能通过小规模数据实现机器学习预测(趋势7),再比如利用联邦学习实现数据分析与隐私保护兼顾(趋势4)。

更进一步,基于量子计算架构的算力,将继续提升算法效率(趋势8),而以 AWS 等云计算厂商为代表,利用公有云,可以更好地实现量子计算与传统计算架构的搭配与分工,满足不同场景下的计算需求。

最近几年自然语言处理技术的突破(趋势 9),不断改变着过往人与机器交互的方式,从 Google 的 BERT 到百度的 ERINE,整个 NLP 领域的技术进化速度非常快,其应用的场景也越来越多。

2.消极性

不断降低的 AI 从业门槛、层出不穷的 AI 开源工具、数据集,同时也为 AI 作恶提供了可能性。

Deepfake 并没有停止进化(趋势1),这项技术,或者说这个潮流,背后所代表的也是新的利益共同体。CB Insights 报告称,Deepfake 将走向商业化,成为全新的营销工具,持续影响娱乐、游戏以及零售行业。

我将商业化的 Deepfake 列为消极影响的原因在于,如果说过去的 Deepfake 还仅仅是一种恶作剧,那么当下以及未来的 Deepfake,夹杂了太多的利益诉求,其对商业、品牌策略以及受众的心理影响,将不得不经历一个长期负面的阶段。

试问自己一句:你多大程度能接受一个机器生成的Influencer?

伴随 Deepfake 流行的,则是全新的黑客攻击(趋势2),从图像到语音再到物联网,无论是诈骗、攻击还是其他,必然将对各个行业产生阵痛。

3.总结

事实上,这份报告还缺乏政府的维度,比如 AI 监管对于整个行业的影响,再比如一系列公共事件如何强化政府在 AI 方面的认知,一个典型的案例是,此次中国新冠肺炎之后,中国 AI 领域一定会迎来更深刻的变化。

最后的最后,过去几年媒体与资本市场的炒作,使得 AI 越来越成为大家讨厌的词汇,但这个不再「令人激动的领域」反而更具韧性,通过不断与各个行业的融合,反过来也成为推动新技术研发的动力,这才是一项通用技术的应用之义。

政府·大数据

「大数据抗疫」

过去一周,中国官方媒体抗击新冠肺炎疫情报道有了一些新变化。一方面,随着大量来自宣传部门的媒体进入湖北,整个媒体报道的风格已和较早前财新等媒体有了较大差别,另一方面,从中央到各地方媒体,「大数据抗疫」成为宣传的重要切入点。

新华网描述了浙江的「大数据联防」场景:

2月5日,人还没进家门,从疫情重点地区返回浙江衢州常山县的小陈,就收到了居家隔离观察期间的注意事项,以及驻村干部、网格员、联户党员的联系方式。在得知购置日常用品等事皆有着落后,他心里的“石头”落了地。

类似的场景也出现在北京海淀区江西吉安福建福州等地。

这从一个侧面展示了中国各地过去几年大数据项目建设的能力。站在政府的角度来看,通过对于数据的分析,了解社区每个人的行为轨迹,将成为一种常态,而以普通居民的视角,这背后所代表的,还有一种莫名的恐惧,路透社的这篇报道里,你可以看到与上述场景类似,但却是不同角度的感受:

When the man from Hangzhou returned home from a business trip, the local police got in touch. They had tracked his car by his license plate in nearby Wenzhou, which has had a spate of coronavirus cases despite being far from the epicenter of the outbreak. Stay indoors for two weeks, they requested.

After around 12 days, he was bored and went out early. This time, not only did the police contact him, so did his boss. He had been spotted near Hangzhou’s West Lake by a camera with facial recognition technology, and the authorities had alerted his company as a warning.

“I was a bit shocked by the ability and efficiency of the mass surveillance network. They can basically trace our movements with the AI technology and big data at any time and any place,” said the man, who asked not to be identified for fear of repercussions.

这可能是所谓「大数据联防联控」的全部脚本。

AI 监管与面部识别

欧盟地区如何推进 AI 监管成为 2020 年的重要看点之一。不久前一份被称之为欧盟 AI 监管白皮书的文件(点击这里在线查看)泄露,文件谈到了对于不同风险等级 AI 应用的监管,并提到了禁止面部识别。

不管最新的信息是,这个文件只是欧盟委员会讨论 AI 监管的多个文件版本之一,并且已经被废弃欧盟委员会将在 2020 年 2 月 19 日出台相关监管法律

AI 监管不仅规范企业,同时也将对政府做出必要约束。在尼德兰(荷兰),一家法院命令尼德兰政府停止使用自动监控学习程序,这个程序会将公民相关数据,包括受教育水平、个人债务等数据输入到算法系统中,从而预测其在住房与福利方面欺诈的可能性。

法院认为,这个项目为非法监控项目,违反了欧盟的人权条约。

而在伦敦和莫斯科,围绕当地警察部门部署的面部识别系统,抗议人士发出了他们的声音。《卫报》报道了伦敦一个俱乐部通过在面部化上特殊图案来对抗面部识别系统。

我觉得一位组织者的话非常具有代表性,「我们让我们如此显眼只是为了隐藏(We made ourselves so visible in order to hide)」。

类似地,莫斯科的一些民众也利用一些妆容来干扰当地摄像头的面部识别。

img

2020,政府与民众的博弈将进入「全面的 AI 时代」。

巨头·业界

云计算巨头们

对于 AWS 而言,丢掉五角大楼 100 亿美元JEDI 巨额合同不仅是巨大的财务损失,更是一种消极的市场信号,这也将大大影响 AWS 的继续扩张。也因此,自去年五角大楼宣布微软 Azure 中标之后,AWS 以及亚马逊开始了自己的「维权」之路。

在周一提交给联邦法院的文件中,AWS 要求整个 JEDI 项目的决策者们——包括现总统特朗普、两任国防部长——出庭作证,以了解决策过程中是否有白宫方面的干预。

从亚马逊的角度去看,他们要证明自己是「那个被政治迫害」的企业,而并不是自己的技术、产品无法满足国防部的需求,这对 AWS 保持云计算市场的影响力至关重要。

本周,AWS 也签下了一个大客户。知名空调设备供应商 Carrier(开利)公司将自己的应用和服务迁移到 AWS。根据双方发布的声明,目前 Carrier 公司中拥有 4000 个服务器,996 个应用程序,其中的 70% 的应用会上云。

而在金融领域,本周雅虎财经透露的消息称,高盛正在成为 AWS 金融云的潜在竞争对手。雅虎财经获得高盛内部的备忘录,显示这家金融巨头正在建设一个面向金融行业的云平台,既为了解决高盛内部的问题,同时还有可能开放给其他金融公司。

值得注意的是,目前高盛 CIO Marco Argenti,正是出自 AWS 团队。

在 AWS、Azure 等公司统治云计算市场的时候,传统 IT 公司,如 IBM、Oracle 不可避免地被边缘化。即将上任的 IBM 新 CEO Arvind Krisha,这位来自印度的 CEO 会给 IBM 带来怎样的变化,引发行业期待。

WSJ 指出,Arvind Krisha 所负责的领域不仅局限在云部门,他同样在 IBM 认知计算部门拥有影响力。Arvind Krisha 曾在 2019 年谈到他对 AI 的理解,有两个核心观点,其一,AI 应用只在部分领域有作用;其二,IBM 的 AI 平台会建立在客户的实际场景中

再比如 Oracle,作为仅次于微软的全球第二大软件公司,Oracle 在云计算领域的发展一直相当缓慢,关于 Oracle 云计算发展,可以参见这篇报道。根据其官方透露的信息,Oracle 的数据中心建设正在加速,随着位于沙特吉达、澳大利亚墨尔本、日本大阪等五个新数据中心在今年年底投入使用,Oracle 将拥有 36 个数据中心,超过 AWS

在云计算市场,还有一个低调的公司正在快速崛起。过去十年,Adboe 从一家 80 亿美元的小公司成长为 1700 亿美元的巨头,下图展示了 Adobe 与 Oracle、SAP、Salesforce 过去十年的发展轨迹。

img

FT (需订阅,网页存档)的报道指出,Adobe 的快速增长离不开创意与营销市场的爆发,依托一系列面向创意内容的生产工具与营销工具,Adobe 快速占领了市场。

市场

企业软件市场有两个值得关注的趋势。

其一,AI 推动企业软件市场并购

根据技术市场咨询公司 Hampleton 的数据,2019 年下半年,全球企业软件市场有 620 笔并购交易,低于上半年的 669 笔。

综合 2019 年来看,全年企业软件并购交易数量为 1289,高于 2018 年 的 1241 和 2017 年的 1050。

WSJ 援引分析师的观点指出,推动企业软件市场并购的重要动力还是人工智能,未来一年这个趋势还将延续。

根据 PitchBook 数据公司的报告,2019 年 AI 创业公司对于早期投资者的回报率高达 43%,而行业的平均回报率数字则是 3%。

其二,区块链火热,最终惠及云计算公司

负责 IBM 区块链服务的副总裁 Jerry Cuomo 透露了一个数字:企业在区块链上每花费 1 美元,将有 15 美元流入云计算公司。

Jerry Cuomo 这个数字展示了目前区块链在整个企业 IT 领域的局限性,很多公司所追求的区块链解决方案,更多还是一个依托云端的应用程序,Jerry Cuomo 进一步指出,所谓的区块链产品,只有 20% 的区块链技术。

行业·应用

最后来看一组 AI 与云在各行业的应用。

垃圾分类。在北美多个城市的商场和机场,利用机器学习与计算机视觉等技术,这个名叫「奥斯卡」的系统可以帮助人们做好垃圾分类。

你可以在 YouTube 上观看其演示视频。

星巴克计划推出 4000 台 AI 咖啡机。这些咖啡机都内置了星巴克自研的 Deep Brew 系统,可以利用传感器,收集客户点单的数据,并且在硬件出现问题时发出预警,星巴克去年发布了 1900 台这样的机器。

利用神经网络修复旧电影的尝试。一位 Reddit 用户利用公开可用的神经网络技术,修复了被称为史上第一部电影的「火车进站」,使得整部影片看起来更像是现代电影。

机器学习在商业房产价值评估中的应用WSJ 介绍了几个在这个领域耕耘的几家创业公司,这些公司通过收集公寓周边街道的相关数据,包括租金、犯罪情况,形成一个预测模型。文章也提到了几个发现,比如独立咖啡馆周边的租金比连锁咖啡馆周边上涨的更快。

Facebook
Twitter
Website
Email
感谢您的订阅,如有疑问,欢迎写邮件给我:zhaosaipo@gmail.com 

点击这里退订

Email Marketing Powered by Mailchimp