Issue #014 2019-10-08

本期导读:

  • 学术:NLP 领域的新变化:缩小模型;
  • 研究:IBM 新的神经网络语音合成方法、微软推出自动生成新闻评论的机器人;
  • 开源:Google 开源 3000 个 AI 生成的视频数据库,对抗 Deepfake;
  • 洞察:衡量一家 AI 创业公司价值的三个要素;
  • 报告:全球 AI 城市准备指数;
  • 政策:法国启动面部识别的「身份证」系统、FDA 批准机器学习设备;
  • 案例:多伦多机场的 AI 安检、拜耳与诺华的 AI 实践、钢铁并购里的 AI 筹码等;
  • 巨头:iPhone 相机里的机器学习、NEC 的身体识别系统、特斯拉新收购;

研究·开源

NLP 领域的新变化:缩小模型。差不多一年前,在 Google 发布自然语言模型 BERT 之后,NLP 领域就进入一个「模型越大、效果越好」的阶段。BERT 的模型拥有 3.4 亿个参数,随后 OpanAI 发布的 GPT-2 模型参数数量为 15 亿个,英伟达最新的 MegatronLM 模型为 83 亿个参数。

如此庞大的模型也意味着计算的成本非常高,比如 BERT 训练一次的耗电量大概相当于一个美国家庭 50 天的耗电量,这也引发了对于「AI 训练/研究影响环境质量」的担忧。

正是在这样的背景下,NLP 领域最近出现了新的变化:在不影响模型精度的前提下,缩小模型体积。

比如华为最新的这篇论文,提出 TinyBERT 的模型,相比于 Google 的模型,这个模型体积缩小了 7.5 倍,运行速度提升了 10 倍,而性能则无太大差异。而 Google 研究者的这篇论文更激进,直接将模型数量缩小了 60 倍,但在性能上出现了一些问题。

可见的未来里,NLP 模型缩小的趋势还会持续,这也将成为 NLP 部署到移动设备(如智能手机)的前奏。

IBM 提出新的神经网络语音合成方法。虽然深度学习的进步正在改善文本到语音(TTS)系统,但它们仍然依赖于复杂而庞大的神经网络,神经网络训练难度大,而且无法实现实时语音合成。根据 IBM 研究人员的这篇论文,他们提出的新方法比传统的模型更轻量,同时模块化的设计架构也更灵活,该模型由韵律特征预测器、声学特征预测器和神经声码器组成,能够实时合成高质量语音。

微软发布可自动生成新闻评论的机器人。这个名叫「DeepCom」的机器人由北京航空航天大学和中国微软的一组工程师共同开发,根据其论文的介绍,「DeepCom」采用了两个递归神经网络,在读取文章之后生成相关内容,从而形成文章评论。这个研究引发诸多质疑,普林斯顿计算机副教授 Arvind Narayanan 直言,「A paper by Beijing researchers presents a new machine learning technique whose main uses seem to be trolling and disinformation...Cool, cool, cool」

两个将 AI 应用在大脑活动模式分析的研究。这两项研究主要识别患者对于抗抑郁药物的反应,来确定药物是否奏效,两项研究分别发表在《美国精神病学杂志》和《自然人类行为》。

Google 开源了 3000 个 AI 生成的视频数据库,用于对抗 Deepfake。Google 也加入到对抗 Deepfake 的阵营,鼓励研究者、开发者训练出更好识别 Deepfake 的工具和算法。此前,Facebook 也宣布将在年度开源类似的数据库,你可以在这里获取这个数据库。

洞察·观点


如何衡量一家 AI 创业公司的价值

过去几年的 AI 的创业热潮正在进入到收获(或收割)期。以中国计算机视觉领域为例,旷视科技已经向香港证交所提交了 IPO 申请,商汤、依图的 IPO 传言也未停止(可参见 #011 期和 #012 期),这些创业公司在过去五年的时间里高速发展,估值不断翻番,已然成为新巨头。

如果说上述三家公司的价值是通过资本市场的估值认可的,那么在更大的层面,作为行业观察者,或者作为普通读者,又该如何衡量一家 AI 创业公司的价值呢?

2019 年初,CB Insights 曾发布过 AI 100 的创业公司榜单,不久前,福布斯也发布了「福布斯 AI 50 」的创业公司榜单,这两个榜单侧重点不同,入围的公司也不一致,但 AI 创业公司从大类上可以分为两类:

  • 平台型公司:这类公司主要关注 AI 的基础设施,类似于云计算的 IaaS 公司,提供一种通用型的 AI 产品或服务,供开发者、各个行业使用;
  • 垂直型公司:这类公司面向特定行业,以行业技术、解决方案为产品模式;

上述两个大类并无优劣高低之分,从产业发展的角度去看,围绕 AI 的产业突破才刚刚开始,整个市场的想象力非常大,可以容纳各种类型的企业。而不管是平台型还是垂直型公司,在我看来,至少有三个方面可以作为判断 AI 创业公司价值的出发点。

第一,AI 创业公司的技术或产品是如何使用 AI 技术的?必须承认,当下 AI 创业公司里,有很大一部分公司的「AI 技术」是为了取悦投资人,其真实的一面则是利用人力来完成工作。

也因此,当我们深入到 AI 创业公司的产品层面时,应该关注这些产品背后的具体技术,到底是机器学习?深度学习?还是监督(非监督)学习?越具体的技术越能体现其价值,如果一家公司始终将将「AI」放在自己的产品描述里,那么这家公司八成是不靠谱的公司。

第二,与同类公司相比,一家 AI 创业公司的优势竞争力是什么?不要相信名校博士堆在一起就可以成就一家 AI 创业公司的胡话,观察一家 AI 创业公司的优势在于两点:技术的领先以及对于行业的认识。

技术层面的竞争,体现在算法速度如何(可通过公开比赛、论文了解)、计算成本如何(可通过试用获取一手经验);而对行业的认识,主要体现上文提到的垂直类公司里,以医学图像领域为例,技术层面无外乎是图像识别,但真正的比拼是在对于医疗场景的理解,不同的理解会塑造不同的产品。

第三,在 2C 与 2B 之间,后者的价值以及估值更大。目前市场上并没有「真正」面向消费者的 AI 创业公司,当然,我们不能就此得出 2C 不如 2B 的结论。

这个现象的真正原因是技术限制了场景。当下 AI 领域的技术突破,从图像、语音到 NLP,都需要合适的硬件、软件去触达普通消费者。我们可以将不久前的「AI 换脸」产品作为 2C 的 AI 产品,但其价值以及市场估值依然局限在社交产品领域,而在后端提供「AI 换脸」技术的创业公司,比如商汤,则可以称之为「图像领域的 AWS」(技术基础设施提供商),价值与估值显然不同。

上述三个方面,仅仅是我个人对于 AI 创业热潮(乱象)的自我判断,如果可以帮你梳理当下的行业发展态势,这篇文章的目的也就达到了。

商业·应用

报告:全球 AI 城市准备指数

咨询公司 Oliver Wyman(奥纬)日前发布了一份全球 AI 城市准备指数。这份报告通过分析全球 104 个城市公开的社会、经济数据,结合上万人的调查数据,定义了一个新的概念:城市 AI 准备度

所谓城市 AI 准备度,某种意义上也展现了城市对于新技术的接受能力。另一方面,在当下人口越发集中到城市的现实下,AI 在城市里的接受度与应用程度如何,也是检验 AI 技术的最好场景。

这份报告强调了四个维度

  • 远景、优先级和心态;
  • 活跃度;
  • 资产基础;
  • 发展方向;

另外,报告还将不同规模的城市做了分组,包括超大城市、大城市、中等城市和小城市四个组别。以下四个组别的排名:

img img

政策

FDA 批准了一个机器学习医疗设备。这款设备由总部位于新加坡的 Biofourmis 公司研发,可以在佩戴人行走时监测生理数据,并将这些数据与他们的日常活动结合起来。在 FDA 认证后,该设备将用于医疗场景,帮助医生更好地获取病人数据,可以减少急诊的次数。

法国准备启动全国「身份证」计划Bloomberg 的报道称,11 月开始,法国将成为欧洲第一个通过面部识别为公民提供数字身份证的国家。据了解,法国人今后可以通过这个「身份证」使用各种公共服务,尽管政府表示该系统不会监控公民行为,同时也未违反欧盟的 GDPR,但民间团体依然在行动,他们试图通过法庭来推翻这个决定。

巨头

苹果发布 Deep Fusion。上周苹果在 iOS 13.2 测试版里正式加入了 Deep Fusion,这是一项利用机器学习来提升拍照细节的技术,VB 的这篇文章指出,Deep Fusion 所代表的计算摄影趋势,将进一步延展摄影以及手机摄影的边界。

NEC 的身体识别系统。NEC 作为面部识别的巨头,正在计划推出一个身体识别系统,该系统将根据身高、衣服、配饰等身体特征来识别人。WSJ 的报道称,该技术与面部识别使用相同的底层图像匹配技术,可以应用在某些不允许采集脸部数据的场合。

这项技术预计将在明年下半年推向市场,主要面向航空公司、娱乐场所,并与 NEC 的面部识别系统一起使用。一个典型的场景,当乘客在候机楼登机时,NEC 的摄像头识别出这个人的脸部特征,然后扫描上半身来创建一个与这个脸相关联的「身体轮廓」,这个「身体轮廓」又与该顾客的账户相关联,这样,即便这位乘客低头看手机,也可以直接通过登机口。

特斯拉收购了计算机视觉公司 DeepScaleCNBC 的消息称,这笔交易并没有提供交易条款的具体细节。DeepScale 研发了一种技术,可以让低功耗的计算机运行计算机视觉应用程序,这对于未来在汽车里运行高级自主驾驶系统意义重大。DeepScale CEO Forrest Iandola 在领英上表示,他将担任特斯拉的机器学习高级科学家。

AI 的落地案例

多伦多皮尔森国际机场将利用 AI 检测武器。根据加拿大当地媒体的报道,该技术捕捉雷达图像,并使用人工智能对它们进行金属和非金属武器分析,可以探测藏在衣服下或包里的武器,预计到 2020 年部署这项技术。

大通银行的 AI 实践。大通银行是摩根大通旗下的子公司,专注于商业和零售银行业务。根据 Pymnts 的报道,这家银行正在将 AI 技术应用到业务中,比如利用海量数据分析,进一步完善客户的档案体系,从而发现金融欺诈者。另外,AI 也成为大通银行在数据安全中的重要技术。

钢铁业并购,AI 技术成为新筹码。上周美国钢铁业一起并购案中,美国钢铁公司将以 7 亿美元收购总部位于阿肯色州的 Big Rever 钢铁公司近 50% 的股份,并获得了其一系列技术,包括机器学习。WSJ 援引钢铁行业咨询公司 Metal Strategies CEO Christopher Plummer 的话表示,Big Rever 钢铁公司的 AI 代表了钢铁行业的最高水平。

医疗公司拜耳将 AI 应用于加速药物发现美联社的报道称,拜耳一直在测试 AI 如何在加速药物开发与发现复杂疾病方面发挥作用。目前该公司与创业公司和科技公司合作,一起开发应用程序,并与医院、学术研究人员合作,探讨如何将 AI 应用到对于患者数据的分析之中。

诺华全力拥抱云与 AI。瑞士制药公司诺华与微软达成为期五年的合作协议,双方将在 AI 与云上全面合作,包括利用微软的开发工具,开发适用于诺华制药的 AI 应用。根据 FT 的报道,整个合作将分为两个阶段,第一个阶段主要面向诺华的财务和制造部门,第二阶段将探索 AI、深度学习在药物开发上的作用。

Facebook
Twitter
Website
Email
感谢您的订阅,如有疑问,欢迎写邮件给我:zhaosaipo@gmail.com 

取消订阅