如何衡量一家 AI 创业公司/NLP 领域新趋势/全球 AI 城市准备指数

Issue #014 2019-10-08

本期导读：

学术：NLP 领域的新变化：缩小模型；
研究：IBM 新的神经网络语音合成方法、微软推出自动生成新闻评论的机器人；
开源：Google 开源 3000 个 AI 生成的视频数据库，对抗 Deepfake；
洞察：衡量一家 AI 创业公司价值的三个要素；
报告：全球 AI 城市准备指数；
政策：法国启动面部识别的「身份证」系统、FDA 批准机器学习设备；
案例：多伦多机场的 AI 安检、拜耳与诺华的 AI 实践、钢铁并购里的 AI 筹码等；
巨头：iPhone 相机里的机器学习、NEC 的身体识别系统、特斯拉新收购；

研究·开源

NLP 领域的新变化：缩小模型。差不多一年前，在 Google 发布自然语言模型 BERT 之后，NLP 领域就进入一个「模型越大、效果越好」的阶段。BERT 的模型拥有 3.4 亿个参数，随后 OpanAI 发布的 GPT-2 模型参数数量为 15 亿个，英伟达最新的 MegatronLM 模型为 83 亿个参数。

如此庞大的模型也意味着计算的成本非常高，比如 BERT 训练一次的耗电量大概相当于一个美国家庭 50 天的耗电量，这也引发了对于「AI 训练/研究影响环境质量」的担忧。

正是在这样的背景下，NLP 领域最近出现了新的变化：在不影响模型精度的前提下，缩小模型体积。

比如华为最新的这篇论文，提出 TinyBERT 的模型，相比于 Google 的模型，这个模型体积缩小了 7.5 倍，运行速度提升了 10 倍，而性能则无太大差异。而 Google 研究者的这篇论文更激进，直接将模型数量缩小了 60 倍，但在性能上出现了一些问题。

可见的未来里，NLP 模型缩小的趋势还会持续，这也将成为 NLP 部署到移动设备（如智能手机）的前奏。

IBM 提出新的神经网络语音合成方法。虽然深度学习的进步正在改善文本到语音(TTS)系统，但它们仍然依赖于复杂而庞大的神经网络，神经网络训练难度大，而且无法实现实时语音合成。根据 IBM 研究人员的这篇论文，他们提出的新方法比传统的模型更轻量，同时模块化的设计架构也更灵活，该模型由韵律特征预测器、声学特征预测器和神经声码器组成，能够实时合成高质量语音。

微软发布可自动生成新闻评论的机器人。这个名叫「DeepCom」的机器人由北京航空航天大学和中国微软的一组工程师共同开发，根据其论文的介绍，「DeepCom」采用了两个递归神经网络，在读取文章之后生成相关内容，从而形成文章评论。这个研究引发诸多质疑，普林斯顿计算机副教授 Arvind Narayanan 直言，「A paper by Beijing researchers presents a new machine learning technique whose main uses seem to be trolling and disinformation...Cool, cool, cool」

两个将 AI 应用在大脑活动模式分析的研究。这两项研究主要识别患者对于抗抑郁药物的反应，来确定药物是否奏效，两项研究分别发表在《美国精神病学杂志》和《自然人类行为》。

Google 开源了 3000 个 AI 生成的视频数据库，用于对抗 Deepfake。Google 也加入到对抗 Deepfake 的阵营，鼓励研究者、开发者训练出更好识别 Deepfake 的工具和算法。此前，Facebook 也宣布将在年度开源类似的数据库，你可以在这里获取这个数据库。

洞察·观点

如何衡量一家 AI 创业公司的价值

过去几年的 AI 的创业热潮正在进入到收获（或收割）期。以中国计算机视觉领域为例，旷视科技已经向香港证交所提交了 IPO 申请，商汤、依图的 IPO 传言也未停止（可参见 #011 期和 #012 期），这些创业公司在过去五年的时间里高速发展，估值不断翻番，已然成为新巨头。

如果说上述三家公司的价值是通过资本市场的估值认可的，那么在更大的层面，作为行业观察者，或者作为普通读者，又该如何衡量一家 AI 创业公司的价值呢？

2019 年初，CB Insights 曾发布过 AI 100 的创业公司榜单，不久前，福布斯也发布了「福布斯 AI 50 」的创业公司榜单，这两个榜单侧重点不同，入围的公司也不一致，但 AI 创业公司从大类上可以分为两类：

平台型公司：这类公司主要关注 AI 的基础设施，类似于云计算的 IaaS 公司，提供一种通用型的 AI 产品或服务，供开发者、各个行业使用；
垂直型公司：这类公司面向特定行业，以行业技术、解决方案为产品模式；

上述两个大类并无优劣高低之分，从产业发展的角度去看，围绕 AI 的产业突破才刚刚开始，整个市场的想象力非常大，可以容纳各种类型的企业。而不管是平台型还是垂直型公司，在我看来，至少有三个方面可以作为判断 AI 创业公司价值的出发点。

第一，AI 创业公司的技术或产品是如何使用 AI 技术的？必须承认，当下 AI 创业公司里，有很大一部分公司的「AI 技术」是为了取悦投资人，其真实的一面则是利用人力来完成工作。

也因此，当我们深入到 AI 创业公司的产品层面时，应该关注这些产品背后的具体技术，到底是机器学习？深度学习？还是监督（非监督）学习？越具体的技术越能体现其价值，如果一家公司始终将将「AI」放在自己的产品描述里，那么这家公司八成是不靠谱的公司。

第二，与同类公司相比，一家 AI 创业公司的优势竞争力是什么？不要相信名校博士堆在一起就可以成就一家 AI 创业公司的胡话，观察一家 AI 创业公司的优势在于两点：技术的领先以及对于行业的认识。

技术层面的竞争，体现在算法速度如何（可通过公开比赛、论文了解）、计算成本如何（可通过试用获取一手经验）；而对行业的认识，主要体现上文提到的垂直类公司里，以医学图像领域为例，技术层面无外乎是图像识别，但真正的比拼是在对于医疗场景的理解，不同的理解会塑造不同的产品。

第三，在 2C 与 2B 之间，后者的价值以及估值更大。目前市场上并没有「真正」面向消费者的 AI 创业公司，当然，我们不能就此得出 2C 不如 2B 的结论。

这个现象的真正原因是技术限制了场景。当下 AI 领域的技术突破，从图像、语音到 NLP，都需要合适的硬件、软件去触达普通消费者。我们可以将不久前的「AI 换脸」产品作为 2C 的 AI 产品，但其价值以及市场估值依然局限在社交产品领域，而在后端提供「AI 换脸」技术的创业公司，比如商汤，则可以称之为「图像领域的 AWS」（技术基础设施提供商），价值与估值显然不同。

上述三个方面，仅仅是我个人对于 AI 创业热潮（乱象）的自我判断，如果可以帮你梳理当下的行业发展态势，这篇文章的目的也就达到了。

商业·应用

报告：全球 AI 城市准备指数

咨询公司 Oliver Wyman（奥纬）日前发布了一份全球 AI 城市准备指数。这份报告通过分析全球 104 个城市公开的社会、经济数据，结合上万人的调查数据，定义了一个新的概念：城市 AI 准备度。

所谓城市 AI 准备度，某种意义上也展现了城市对于新技术的接受能力。另一方面，在当下人口越发集中到城市的现实下，AI 在城市里的接受度与应用程度如何，也是检验 AI 技术的最好场景。

这份报告强调了四个维度：

远景、优先级和心态；
活跃度；
资产基础；
发展方向；

另外，报告还将不同规模的城市做了分组，包括超大城市、大城市、中等城市和小城市四个组别。以下四个组别的排名：

政策

FDA 批准了一个机器学习医疗设备。这款设备由总部位于新加坡的 Biofourmis 公司研发，可以在佩戴人行走时监测生理数据，并将这些数据与他们的日常活动结合起来。在 FDA 认证后，该设备将用于医疗场景，帮助医生更好地获取病人数据，可以减少急诊的次数。

法国准备启动全国「身份证」计划。Bloomberg 的报道称，11 月开始，法国将成为欧洲第一个通过面部识别为公民提供数字身份证的国家。据了解，法国人今后可以通过这个「身份证」使用各种公共服务，尽管政府表示该系统不会监控公民行为，同时也未违反欧盟的 GDPR，但民间团体依然在行动，他们试图通过法庭来推翻这个决定。

巨头

苹果发布 Deep Fusion。上周苹果在 iOS 13.2 测试版里正式加入了 Deep Fusion，这是一项利用机器学习来提升拍照细节的技术，VB 的这篇文章指出，Deep Fusion 所代表的计算摄影趋势，将进一步延展摄影以及手机摄影的边界。

NEC 的身体识别系统。NEC 作为面部识别的巨头，正在计划推出一个身体识别系统，该系统将根据身高、衣服、配饰等身体特征来识别人。WSJ 的报道称，该技术与面部识别使用相同的底层图像匹配技术，可以应用在某些不允许采集脸部数据的场合。

这项技术预计将在明年下半年推向市场，主要面向航空公司、娱乐场所，并与 NEC 的面部识别系统一起使用。一个典型的场景，当乘客在候机楼登机时，NEC 的摄像头识别出这个人的脸部特征，然后扫描上半身来创建一个与这个脸相关联的「身体轮廓」，这个「身体轮廓」又与该顾客的账户相关联，这样，即便这位乘客低头看手机，也可以直接通过登机口。

特斯拉收购了计算机视觉公司 DeepScale。CNBC 的消息称，这笔交易并没有提供交易条款的具体细节。DeepScale 研发了一种技术，可以让低功耗的计算机运行计算机视觉应用程序，这对于未来在汽车里运行高级自主驾驶系统意义重大。DeepScale CEO Forrest Iandola 在领英上表示，他将担任特斯拉的机器学习高级科学家。

AI 的落地案例

多伦多皮尔森国际机场将利用 AI 检测武器。根据加拿大当地媒体的报道，该技术捕捉雷达图像，并使用人工智能对它们进行金属和非金属武器分析，可以探测藏在衣服下或包里的武器，预计到 2020 年部署这项技术。

大通银行的 AI 实践。大通银行是摩根大通旗下的子公司，专注于商业和零售银行业务。根据 Pymnts 的报道，这家银行正在将 AI 技术应用到业务中，比如利用海量数据分析，进一步完善客户的档案体系，从而发现金融欺诈者。另外，AI 也成为大通银行在数据安全中的重要技术。

钢铁业并购，AI 技术成为新筹码。上周美国钢铁业一起并购案中，美国钢铁公司将以 7 亿美元收购总部位于阿肯色州的 Big Rever 钢铁公司近 50% 的股份，并获得了其一系列技术，包括机器学习。WSJ 援引钢铁行业咨询公司 Metal Strategies CEO Christopher Plummer 的话表示，Big Rever 钢铁公司的 AI 代表了钢铁行业的最高水平。

医疗公司拜耳将 AI 应用于加速药物发现。美联社的报道称，拜耳一直在测试 AI 如何在加速药物开发与发现复杂疾病方面发挥作用。目前该公司与创业公司和科技公司合作，一起开发应用程序，并与医院、学术研究人员合作，探讨如何将 AI 应用到对于患者数据的分析之中。

诺华全力拥抱云与 AI。瑞士制药公司诺华与微软达成为期五年的合作协议，双方将在 AI 与云上全面合作，包括利用微软的开发工具，开发适用于诺华制药的 AI 应用。根据 FT 的报道，整个合作将分为两个阶段，第一个阶段主要面向诺华的财务和制造部门，第二阶段将探索 AI、深度学习在药物开发上的作用。

感谢您的订阅，如有疑问，欢迎写邮件给我：zhaosaipo@gmail.com

取消订阅