洞察·观点
云上机器学习平台现状
自 2016 年以来,机器学习上云的趋势已经不可阻挡。这里所谓的上云,是利用云服务带来的计算成本与灵活性的优势,将本地机器学习训练、测试、部署的工作放在云上。
从架构上看,云端机器学习平台往下对接芯片、服务器等基础设施,往上则是连接各种 API,如果以云的角度去看,属于 PaaS 层,下图是 AWS 机器学习平台的架构图。
1.谁在推动云端机器学习平台的流行
云端机器学习的流行,有两个方面的原因。
其一,机器学习的计算成本非常高,如果在本地通过 GPU 训练模型,且不说价格有多昂贵,只说当下机器学习模型算力的发展速度,早已超越了摩尔定律「18 个月翻一番」的行业规律,根据 2018 年 OpenAI 的调查数据,自 2012 年开始,机器学习训练所用的算力需求,平均每 3.43 个月便会翻倍。
这意味着,使用本地 GPU 训练机器学习模型是一个「无底洞」,成本高昂、训练效率低下。
其二,随着企业上云的技术潮流,企业的业务和数据也越来越多地上云。当企业的数据存储在云端,也为云上机器学习以及其他 AI 项目提供了便利。
更重要的是,机器学习是一个相对冗长的流程,涉及到数据收集、数据标注、模型训练、算法调参优化、模型部署等多个阶段,不同阶段有着不同的计算需求,比如,由数据科学家和机器学习研究人员完成模型构建和训练,而部署则由软件工程师、机器学习工程师和数据工程师来完成,再比如,模型训练通常由多人在多台虚拟服务器上完成,而部署模型需要具备扩展能力,能够处理海量的 API 请求,这些多样化的计算需求只有云服务才能满足。
2.中美 6 大机器学习平台
过去三年时间里,云端机器学习平台俨然成为「云+AI」结合典范,这其中的主要玩家包括 AWS、微软、Google、阿里云、华为与百度。
AWS 作为全球公有云领域的绝对巨头,早在 2016 年就推出了一系列面向 SaaS 层的 AI 服务,比如语音、文本的 API,而在 PaaS 层面上,SageMaker 是 AWS 最近两年力推的机器学习平台。
SageMaker 的优势在于,它整合了 AWS 在云计算产品(如存储 S3、计算 EC2)的能力,并且内置了大量机器学习算法,可以最大限度降低企业使用机器学习的成本,想象一下,你完全可以先将数据存放在 S3,然后利用 AWS 的数据湖服务进行清洗,接着在 Sagemaker 里训练或部署。
微软的机器学习平台基于公有云 Azure,包括两个令人有些困惑的产品 :Azure 机器学习工作室与 Azure 机器学习服务。
这两个产品有一点的相似性,但在定位上还是有些许不同。Azure 机器学习工作室面向更广大的企业/开发群体,不管是资深从业者还是新手,都可以找到自己需要的产品。而 Azure 机器学习服务则主要针对数据科学家以及熟悉 Python 的开发者。
Google 在云端机器学习平台上正在力推「AutoML」,这个产品如今还处在 Beta 测试阶段,就像这个产品名称所言,这款产品主打的就是低技术门槛。
与此同时,Google 还打造了机器学习引擎(ML Engine),这是一个面向经验丰富的数据科学家的开发平台,整合了 Google Cloud 的基础设施以及开源框架 Tensorflow 的能力。值得一提的是,Google Cloud 过去几年一直在研发适用于机器学习的芯片,目前已经发布了三代 TPU 产品,对于降低开发者使用机器学习平台的成本意义重大。
阿里云的机器学习平台叫「PAI」(Platform of Artificial Intelligenc)。长期以来这是一个「默默无闻」的产品,PAI 的优势与 AWS 的 Sagemaker 类似,都是与公有云平台的其他产品深度融合。
PAI 还封装了大量机器学习算法,并且支持可视化的模型训练,但这个产品设计更偏向部署层面,有着比较明确的业务导向性。
华为在 2018 年发布了 AI 战略,其中也包括机器学习平台 ModelArts。这个产品体现了华为在端、边、云的优势,可以帮助用户将训练好的机器学习模型快速部署到各个终端。
相比于其他云服务商的产品,ModelArts 还处在相对早期的阶段, 未来如何与昇腾处理器以及明年开源的 AI 框架 MindSpore (关于华为的这个框架,我在之前 #011 期的「AI Insider」里做个分析)做整合,值得继续关注。
百度作为国内较早踏入 AI 领域的公司,却在云端 AI 领域没有多少建树。这两年百度发力云计算市场,也将自己的机器学习平台 BML 推向市场,这个产品刚刚在上月商业化运营。
但对百度来说,过去几年在 AI 领域搭建了众多平台,这些平台过去都是以「AI 平台」的方式免费或付费向企业/开发者提供服务,未来,如何整合这些平台,形成完整、统一的机器学习服务入口,对于百度的 AI 发展意义重大。
3.写在最后
不管机器学习是不是 AI 的未来,至少在未来三年以内,围绕机器学习的热潮还将继续。随着越来越多的人开始关注并踏入机器学习市场以及越多越多的企业转向这个领域,云端机器学习平台还将持续火热。
对于上文提及的这些公司,或是通过自研芯片,或是整合打包更多云产品,或是不断简化封装服务接口,都将继续降低云端机器学习平台的使用门槛。
更低技术门槛、更低成本、更省时间,这三个「更」会贯彻接下来机器学习平台大战的始终。
|