Issue #013 2019-09-17

本期导读:

  • 学术:Google 开发可发现皮肤病的 AI 系统、苹果披露内部 AI 产品 Overton 的进展;
  • 研究:化学领域的数据偏见、新研究可将单词翻译为物理动作;
  • 洞察:云上机器学习平台现状,6 大机器学习平台争奇斗艳;
  • 报告:AI 如何影响社会、企业如何看待 AI 发展;
  • 应用:GE AI 医疗设备获得 FDA 批准、DeepCode 发布集成 AI 能力的扩展,创业公司推出奶牛面部识别系统;
  • 案例:Bloomberg 迁移历史市场数据;
  • 投资:Grab 1.5 亿美元押注 AI、麦当劳收购语音识别公司;

学术·研究

Google 开发可发现皮肤病的 AI 系统。根据其论文以及官方博客的描述,这个模型学习了 40 多名医生的 5 万项诊断,利用病人过往医疗数据以及图像去检测、发现皮肤问题,其准确率与人类皮肤科医生几乎一样。你可以在这里查看这篇论文。

苹果披露内部 AI 产品 Overton 的进展。Overton 是苹果面向内部 AI 开发的管理框架,该工具可实现自动化处理机器学习的需求。根据苹果的论文,Overton 可以自动完成多个机器学习模型选择和搭建,甚至可以在不编写代码的情况下构建基于深度学习的应用程序。你可以通过这篇论文详细了解这个项目。

化学领域的数据偏见。来自 Haverford 大学的研究者们发现,化学实验过程中的数据偏差广泛存在。其研究成果发表在《自然》杂志上,研究者利用人工和随机收集的两种数据来测试机器学习算法,结果显示,随机数据所产生的实验结果更好。你可以在这里查看这篇论文。

CMU 学者提出一个新模型,可以将单词翻译为物理动作。这个名叫 JL2P 的模型,结合了自然语言理解与人类的三维姿势模型,能够实现行走、奔跑或者演奏乐器等。相关论文发布在这里,你也可以通过这个视频进一步了解这个模型,

img

两个新研究展现 AI 算法在检测肾活检中的作用。来自布法罗大学雅各布斯医学院的团队开发的算法,通过提取肾小球或肾脏小血管的数据,可以分析肾活检里的数据;另一个研究来自 Radboud 大学,这个项目利用卷积神经网络去分析健康或出问题的肾器官,你可以在这里详细了解这两个研究。

洞察·观点


云上机器学习平台现状

自 2016 年以来,机器学习上云的趋势已经不可阻挡。这里所谓的上云,是利用云服务带来的计算成本与灵活性的优势,将本地机器学习训练、测试、部署的工作放在云上。

从架构上看,云端机器学习平台往下对接芯片、服务器等基础设施,往上则是连接各种 API,如果以云的角度去看,属于 PaaS 层,下图是 AWS 机器学习平台的架构图。

img

1.谁在推动云端机器学习平台的流行

云端机器学习的流行,有两个方面的原因。

其一,机器学习的计算成本非常高,如果在本地通过 GPU 训练模型,且不说价格有多昂贵,只说当下机器学习模型算力的发展速度,早已超越了摩尔定律「18 个月翻一番」的行业规律,根据 2018 年 OpenAI 的调查数据,自 2012 年开始,机器学习训练所用的算力需求,平均每 3.43 个月便会翻倍。

img

这意味着,使用本地 GPU 训练机器学习模型是一个「无底洞」,成本高昂、训练效率低下。

其二,随着企业上云的技术潮流,企业的业务和数据也越来越多地上云。当企业的数据存储在云端,也为云上机器学习以及其他 AI 项目提供了便利。

更重要的是,机器学习是一个相对冗长的流程,涉及到数据收集、数据标注、模型训练、算法调参优化、模型部署等多个阶段,不同阶段有着不同的计算需求,比如,由数据科学家和机器学习研究人员完成模型构建和训练,而部署则由软件工程师、机器学习工程师和数据工程师来完成,再比如,模型训练通常由多人在多台虚拟服务器上完成,而部署模型需要具备扩展能力,能够处理海量的 API 请求,这些多样化的计算需求只有云服务才能满足。

2.中美 6 大机器学习平台

过去三年时间里,云端机器学习平台俨然成为「云+AI」结合典范,这其中的主要玩家包括 AWS、微软、Google、阿里云、华为与百度。

AWS 作为全球公有云领域的绝对巨头,早在 2016 年就推出了一系列面向 SaaS 层的 AI 服务,比如语音、文本的 API,而在 PaaS 层面上,SageMaker 是 AWS 最近两年力推的机器学习平台。

SageMaker 的优势在于,它整合了 AWS 在云计算产品(如存储 S3、计算 EC2)的能力,并且内置了大量机器学习算法,可以最大限度降低企业使用机器学习的成本,想象一下,你完全可以先将数据存放在 S3,然后利用 AWS 的数据湖服务进行清洗,接着在 Sagemaker 里训练或部署。

微软的机器学习平台基于公有云 Azure,包括两个令人有些困惑的产品 :Azure 机器学习工作室Azure 机器学习服务

这两个产品有一点的相似性,但在定位上还是有些许不同。Azure 机器学习工作室面向更广大的企业/开发群体,不管是资深从业者还是新手,都可以找到自己需要的产品。而 Azure 机器学习服务则主要针对数据科学家以及熟悉 Python 的开发者。

Google 在云端机器学习平台上正在力推「AutoML」,这个产品如今还处在 Beta 测试阶段,就像这个产品名称所言,这款产品主打的就是低技术门槛。

与此同时,Google 还打造了机器学习引擎(ML Engine),这是一个面向经验丰富的数据科学家的开发平台,整合了 Google Cloud 的基础设施以及开源框架 Tensorflow 的能力。值得一提的是,Google Cloud 过去几年一直在研发适用于机器学习的芯片,目前已经发布了三代 TPU 产品,对于降低开发者使用机器学习平台的成本意义重大。

阿里云的机器学习平台叫「PAI」(Platform of Artificial Intelligenc)。长期以来这是一个「默默无闻」的产品,PAI 的优势与 AWS 的 Sagemaker 类似,都是与公有云平台的其他产品深度融合。

img

PAI 还封装了大量机器学习算法,并且支持可视化的模型训练,但这个产品设计更偏向部署层面,有着比较明确的业务导向性。

华为在 2018 年发布了 AI 战略,其中也包括机器学习平台 ModelArts。这个产品体现了华为在端、边、云的优势,可以帮助用户将训练好的机器学习模型快速部署到各个终端。

相比于其他云服务商的产品,ModelArts 还处在相对早期的阶段, 未来如何与昇腾处理器以及明年开源的 AI 框架 MindSpore (关于华为的这个框架,我在之前 #011 期的「AI Insider」里做个分析)做整合,值得继续关注。

百度作为国内较早踏入 AI 领域的公司,却在云端 AI 领域没有多少建树。这两年百度发力云计算市场,也将自己的机器学习平台 BML 推向市场,这个产品刚刚在上月商业化运营。

但对百度来说,过去几年在 AI 领域搭建了众多平台,这些平台过去都是以「AI 平台」的方式免费或付费向企业/开发者提供服务,未来,如何整合这些平台,形成完整、统一的机器学习服务入口,对于百度的 AI 发展意义重大。

3.写在最后

不管机器学习是不是 AI 的未来,至少在未来三年以内,围绕机器学习的热潮还将继续。随着越来越多的人开始关注并踏入机器学习市场以及越多越多的企业转向这个领域,云端机器学习平台还将持续火热。

对于上文提及的这些公司,或是通过自研芯片,或是整合打包更多云产品,或是不断简化封装服务接口,都将继续降低云端机器学习平台的使用门槛。

更低技术门槛、更低成本、更省时间,这三个「更」会贯彻接下来机器学习平台大战的始终。

商业·应用


Google 报告:AI 如何影响社会以及如何解决人类问题

上周 Google 发布了一份关于 AI 领域的重要报告,这个报告也是 Google 2018 年发起的「Google AI Impact Challenge」的汇报总结,根据官方透露的信息,在这项价值 2500 万美元的全球挑战赛中,共收到来自 119 个国家的 2600 多份申请。

值得一提的是,这份报告的生成过程主要来自 AI,利用自然语言处理和聚类分析技术审核申请并对其进行内部评估。透过 Google 这份报告,我们也可以进一步了解机器学习在全球范围、各个领域应用中的潜在影响,其中有几个要点。

其一,AI 领域合作的重要性。AI 是一个宽泛的概念,即便是相对具体的机器学习,也涉及到从数据收集到部署的长长链条,没有哪家企业或组织可以自己解决,这就需要不同行业建立起充分的合作关系,可以减少行业里的资源浪费,实现资源的最大化利用。

其次,对 AI 理解的不平衡性。一方面是没有真正理解 AI 的价值,另一方面则是缺乏适合的人才。这既需要市场教育,也需要包括 Google 在内的行业巨头提供更多适合多数人使用的机器学习工具,比如 Tensorflow 这样的开源框架事实上也在加速不同行业的机器学习进程。

第三,机器学习不是万能良药。这背后有两层含义,一方面机器学习作为技术赋能的工具/方法论,需要与各行各业的技术相结合,才能释放最大化的技术红利;另一方面,并不是所有行业问题都需要机器学习或 AI 技术,这是当下技术发展的限制。

你可以在这里下载或在线查看这份报告。

毕马威报告:投资 AI 或许才刚刚开始

上周毕马威发布了一份名为「AI Transforming the Enterprise」的报告,谈到了企业 AI 的落地情况。在对 30 家全球 500 强企业调查后,毕马威发现,有 30% 的企业选择将机器学习的部分功能纳入到自己的产品或服务中,只有 17% 的公司表示他们正在大规模使用 AI 技术。

这份报告还有一些其他的重要发现:

其一,AI 的应用场景。未来两到三年,企业对于在客户管理与市场洞察中使用 AI 持乐观态度,特别是通过个性化的服务提升销售以及利用 AI 提升财务与会计的效率与合规性。

其次,机器人流程自动化(robotic process automation,简称 RPA)是一个值得关注的领域。调查显示,有 26% 的企业正在将 RPA 应用到工作场景中,超过 80% 的受访企业计划在未来三年部署 RPA。

第三,AI 人才投资继续火热。受访公司中,有五家公司平均拥有 375 名全职 AI 员工,这些员工包括数据科学家、工程师以及行业专家等,尽管这些人薪资不菲,但公司对于人才的投资还会继续,上述五家公司表示将在未来三年,增加一倍的人才支出增,同时将人员规模扩充到 500——600 人。

你可以在这里下载这份报告。

GE 的 AI 医疗设备获得 FDA 批准CNBC 的报道称,这款名叫「Critical Care Suite」的 X 光设备将在今年晚些时候投入重症病房,利用 AI 能力辅助医生处理扫描的 X 片并检测气胸。

Bloomberg 正在计划将历史市场数据迁移到云端。根据 CW 的报道,此举将可以更好地利用云端机器学习能力,为客户提供更好的数据访问以及数据洞察。此举意义重大,过往金融市场特别是对冲基金的客户对于信息上云的安全性持怀疑态度,但现在正在发生变化。

DeepCode 发布集成 AI 能力的扩展,可以帮助开发人员利用 AI 来检测 Visual Studio 代码的错误和问题,该扩展支持 Java、JS、Python、TypeScript 以及 XML,值得一提的是,这个扩展也是开源的。

Grab 投资 1.5 亿美元用于 AI 技术应用,侧重 NLP 领域。在完成又一轮 45 亿美元的融资之后,这家公司目前的估值已经达到 140 亿美元。目前该公司拥有 2000 名工程师,其中 300 人参与 AI 领域的工作。Bloomberg 指出,Grab 还将开发一款区域性的超级应用,将覆盖用户从打车到送餐、数字支付甚至社交等场景,非常类似于中国的微信。

全球著名的梅奥诊所将使用 Google 的 AI 服务。据了解,这是一项长达 10 年的合作协议,Google 将在纽约罗切斯特开设办公室,其工程师可以在那里与梅奥科学家密切合作。梅奥计划将其财务、医疗和基因数据存储在云中,并扩大人工智能在临床中的应用。该公司已经使用了一些人工智能技术来筛查患者心脏病的早期症状,并向可能发病的癫痫患者发出警示。

麦当劳又收购了一家 AI 公司CNBC 的消息称,这家名叫「Apprente」的公司主要提供语音识别技术,这也是麦当劳 2019 年第三笔科技领域收购。另外,麦当劳还将在 Apprente 公司所在的山景城建立一个技术实验室,并计划招聘更多员工。

创业公司 MoooFarm 开发了一个奶牛面部识别算法。截至目前,这个模型的准确率高达 95.7%。该模型通过对奶牛面部的各种照片进行训练来区分它们的特征,可以帮助农民区分牛以及确定哪些牛有保险。

Facebook
Twitter
Website
Email
感谢您的订阅,如有疑问,欢迎写邮件给我:zhaosaipo@gmail.com 

取消订阅