增长依旧,但速度变慢的云计算巨头
在上周亚马逊、Alphabet 公布新一季财报后,我们又一次可以结合这些略显冰冷的数字,审视当下云计算行业的发展态势。
首先,疫情在全球的蔓延与影响还在持续,这直接导致企业在线服务需求的上升,换句话说,企业需要购买更多的云服务——无论是 SaaS 还是 PaaS——才能维持企业员工远程办公后的工作效率。
这类全球范围、暴增的云计算需求,也直接体现到了云计算巨头的财报里,刚刚过去的这个季度,AWS、微软与 GCP,都是一个营收「丰收季」,下图是 AWS 营收曲线。
其次,但如果将三大云计算巨头的营收增长放在一个更长的时间段里去看,或许我们会发现一些异样,如下图所示,不管是 AWS 还是 GCP,增速都在放缓。
增速放缓的原因当然不是云计算不是未来,更接近所谓「正确答案」的解释应该是企业客户开始思考云服务的成本。
我在上周「AI Insider」里提到,汽车巨头大众旗下的奥迪商业公司,不得不面对云服务账单激增的现实,他们在 3 月到 4 月云服务的支出增加了 12%,于是他们开始调整在 AWS 上订购的云计算服务,除了关闭一些不必要的服务之外,还将部分服务迁移到其他第三方较小的云计算供应商,从而节约成本。
一家来自挪威的旅行公司 Entur AS,疫情期间发现他们的云服务账单还在激增,这家公司于是调整其在 GCP 上订阅的服务,这对于 GCP 而言,就是营收的减少。
类似的问题显然也是华尔街的担忧,亚马逊 CFO Brian Olsavsky 在分析师会议上回应了这类担忧:
So in the AWS segment revenue, what we see are companies are working really hard right now to cut expenses, especially in the more challenged businesses like hospitality and travel but pretty much across the board.
We’re helping them. We’re actively, with our sales force, looking for ways that we can help them save money. This includes things like scaling down the usage where it makes sense or benchmarking their workloads against our architectural best practices. So that’s not going to help our usage growth in the short run, but it will help those customers save money.
第三,在经历了 3、4 月份的云服务需求激增之后,随着疫情在全球各地的趋稳,企业客户也开始更理性地选择、购买、续费相应的云服务。
另一方面,疫情导致的办公新常态,事实上加速了数字经济与在线办公的发展,从诸如 Zoom、Teams 这样的 SaaS 服务到基于 BigQuery、Sagemaker 这类的数据分析与机器学习平台产品,越来越多的企业开始关注并了解这些产品,从而成为潜在的客户,譬如 Google 这一季云服务营收里,协同办公产品 Gsuite 贡献极大。
从这个角度去看,未来几个季度,云计算还将继续成为支撑各自公司发展的重要部门,但云计算的增速变化,也将成为反映不同地区经济恢复情况的重要参考。
数据中心之争的三个关注点
上周,阿里云正式宣布位于南通、杭州和乌兰察布的三座超级数据中心落成投产,加入之前的张北与河源,阿里云已经拥有了五座超级数据中心。
所谓「超级数据中心」,抛去营销的话术之后,可以简单理解为「大」,也就是数据中心占地面积大、服务器多。阿里云的官方新闻稿表示,借助此次三大超级数据中心开服,将新增数百万台服务器。
上月,腾讯位于清远的「百万级服务器」规模的数据中心刚刚开服,同时腾讯今年还在上海、天津拿到数据中心建设用地,未来也将在两个地方建设超大规模的数据中心。
在当局最高层限定的「新基建」项目里,数据中心建设俨然又是重中之重。一方面,数据中心是数字基础设施的「基础设施」,其战略意义重大;另一方面,数据中心不仅是一门关于投资的生意,更是一个展示新技术研发能力与产业链整合能力的舞台。
2020 年上半年,阿里与腾讯先后喊出「三年投入 2000 亿」以及「五年投入 5000 亿」的口号,过去两个月数据中心的你追我赶,算是一场真刀真枪的碰撞。
数据中心的历史由来已久,甚至可以追溯到 1946 年第一台通用计算机 ENIAC 的出现,这台现在看起来的「庞然大物」代表着当时最先进的信息技术。随后的几十年里,围绕这类大型计算机以及配套设施,比如电力设备等,构成了早期数据中心的基本形态,也就是所谓「服务器农场(Server farm)」。
而当计算机逐步兴起,并与互联网共同发展,数据中心也在成为一种「服务」,或是承载传统企业的 IT 架构,或是支撑互联网公司的产品研发,数据中心的这个功能也一直延续到了云计算时代。
从 AWS、微软到阿里云,这些云计算巨头一方面改变了传统 IT 交付服务的方式和方法,另一方面,当越来越来的计算资源集中到了云端,数据中心的变革势在必行。其中最突出的表现就是将数据中心建设推入规模化阶段,咨询机构 Synergy Research 的数据显示,截止到 2020 年第二季度,全球超大规模数据中心的数量为 541 个,相比于 5 年前增加了两倍多。
数据中心的这一趋势也和当下人类社会海量数据处理的需求相匹配,IDC 此前曾预测,从 2009 年到 2020 年,人类社会需要存储的数据将从 0.8ZB(1ZB = 109T)增长到 35 ZB,增长 44 倍,如此大规模的数据也要求数据中心不断增加服务器数量,从而增加数据处理能力。
也因此,阿里、腾讯以及百度、京东,未来还将在大规模数据中心领域展开激烈竞争,而不管各自的产品名称以及营销话术如何,有几个方面值得特别关注。
其一,服务器的数量,特别是定制服务器的数量。阿里云的神龙服务器,腾讯的星星海服务器,都是两家巨头结合云业务实际需求定制的服务器,相对于传统服务器,这些服务器能够提供更好的性能,满足云计算场景里的计算需求。
这个领域的变化会非常有趣,毕竟,虚拟化技术已经 40 多年了,需要突破与革新,才能减少硬件虚拟化后的性能损耗,在降低能耗的同时,进一步提升计算的性能,最终反映到市场的,就是客户可以用更便宜的钱买到更高规格的云计算实例。
其二,能耗,关注 PUE 的值。PUE 的全称为「Power Usage Effectiveness」,这是一个评估数据中心能源效率的数据,其计算公式为:「PUE = 数据中心总设备能耗/数据中心里的 IT 设备能耗」。
换句话说,PUE 是一个比率,基准是 2,越接近 1 也说明整个数据中心的电能都被 IT 设备消耗。2019 年 2 月,国家多部门联合发布《关于加强绿色数据中心建设的指导意见》,明确新建大型、超大型数据中心的电能使用效率值(PUE值)需达到 1.4 以下。
根据公开资料,腾讯清远数据中心的 PUE 低于 1.25,而采用液冷技术的阿里杭州数据中心 PUE 全年接近 1.0。
这个领域的关注点不仅是各种制冷技术的创新,还有直接围绕能源的技术创新,比如微软上周就宣布完成了氢燃料电池的代替柴油的测试,未来将在 Azure 的数据中心里部署使用。
其三,泡沫。「新基建」的政策红利,正在加速另一个数据中心泡沫的出现。从贵州到乌兰察布,大量偏远地区的数据中心建设开始升温,也在形成了另一种房地产式的生意。
对于像阿里、腾讯这样体量的巨头来说,内部的业务需求就已经足够庞大,而其快速增长的云业务,也会不断扩大对于服务器的需求,由此可能形成一个相对健康的数据中心建设、使用循环,但对于绝大第三方的数据中心公司,譬如万国数据、世纪互联等,他们的数据中心更多还是出租给企业与政府,但当越来越多的计算向云端集中,这些公司的传统出租业务正在萎缩,未来的变化也值得长期关注。
当所听所读所看不再真实
上周我体验了一个可以模拟名人声音生成器,类似这样的研究已经很多了,但这位名叫 Brandon Thomas 的开发者将这项实验室技术封装为一个开放服务,用户输入文字后,系统可以模拟比尔·盖茨等名人的声音读出来,感兴趣的朋友可以在这里试一下。
我在体验这个项目的时候想到了目前热议的 GPT-3,加上过去几年持续火热的 Deepfake,当下全球人类不得不接受一个事实:我们所听、所读、所看的内容正被智能化的程序批量造假生成。
一年前我曾在「AI Insider」里分析过类似话题,我把图像、文字、声音造假后的信息误导归结于三点,其中谈到了社交媒体在信息误导中的「作用」:
信息传播速度的加快,以及信息传播平台自身的局限性,都在加速误导信息的传播。这包含了两个层面的议题,一方面,全球范围内信息传播工具的增多,从社交媒体到聊天工具,都将信息的流动;另一方面,无论是 Twitter 还是 Facebook,这些信息传播平台都必须在信息表达自由与信息审查方面作出衡量和妥协。比如 FB 就拒绝删除其平台上一个南希·佩洛西的虚假视频,与之相对的,则是中国信息传播平台越发严厉的删除、过滤机制,这难道又是社会主义的优越性?
就像 Wired 最新的一篇文章所指,「我们必须适应并接受这样一个不再真实的世界」。
行业:英伟达收购 ARM 传闻、AI 芯片算力进步、旷视科技、中国云计算白皮书等
英伟达。上周,FT 报道称,英伟达计划 320 亿美元收购 ARM,这笔收购让人浮想联翩。
ARM 是一家行业里极其特别的公司,它不卖任何芯片,而是出售 IP 授权,也是高通、华为海思与苹果上游芯片授权的唯一供应商,正是这样的利益关系,成就了当下移动互联网的产业链。即便被软银收购,由于软银本身与其业务并没有直接的利益相关性,ARM 还是被认为是一家相对独立与中立的公司。
但 ARM 一旦被英伟达收购,就不再独立。一方面,ARM 一直试图挑战英特尔在数据中心的地位,另一方面,英伟达数据中心业务正在成为其增长的新动力,目前有三分之一的营收来自于数据中心,如果考虑到英伟达过去一年先后收购的 Mellanox 与 Cumulus,这家公司正在加速布局数据中心技术与产品的核心位置。
这也意味着,英伟达收购 ARM 后,将形成一个可以媲美英特尔的数据中心产品组合,比如「GPU+CPU」?当然,这笔交易能否成功还是一个未知数。在我个人看来,即使双方达成交易,各国反垄断部门也会再去评估交易的可行性,毕竟,这是一个事关整个产业链的收购。
英伟达上周还陷入一场「口水战」里,AI 芯片基准测试 MLPerf Training v0.7 测试结果公布,这项训练测试基准包括 图像分类、 翻译、 推荐系统和围棋等 8 个机器学习任务,最终结果是这 8 项任务的训练时间,速度越快则性能越强。
其中 BERT、DLRM 与 Mini-Go 是三个新的测试项目,英伟达刚刚发布的 A100 与 Google 即将发布的 TPUv4 展开了一番较量,英伟达发布的成绩是这样的:
Google 公布的成绩则是这样的:
仔细看的话,英伟达对比的是 Google TPUv3,以自然语言模型 BERT 为例,英伟达仅仅花费了 49 秒,对比 Google 是 56.7 分钟,而 Google 的成绩单里,使用的是还未发布的 TPUv4,仅仅花费了 23 秒就完成了 BERT 模型的训练。
坦白来说,两家公司都没有说谎,只不过各自只说了事实的一面,英伟达不愿承认自己刚刚发布的 AI 最强芯片即将失去第一的事实,而 Google 也不会强调 TPUv4 不会向第三方销售,Google 一直将 TPU 作为 GCP 的核心卖点。
但透过这个榜单,我们已经感受到整个 AI 计算发展的速度,还是以 BERT 模型训练为例,2018 年,需要 3 天才能完成训练,2019 年 4 月的时候,时间缩短到 76 分钟(相关论文在这里),如今,两家公司将训练这个模型的时间降低到秒级,展现出非常大的算力进步。
你可以在这里详细了解这次测试的结果。
旷视科技。第一财经报道,旷视科技上周回应了该公司的多个热门话题,包括以下几个方面:
- 该公司主营业务:个人物联网、城市物联网和供应链物联网三大板块;
- 中止港股上市消息不属实,同时在考虑科创板;
- 美国「实体清单」对 AI 芯片企业影响「不是特别大」,对旷视的Brain++ 等自研的技术产品影响很小,主要集中在芯片替代等方面,去年旷视对部分供应链进行了调整;
UCloud 半年报。UCloud(优刻得)上周发布 2020 半年报,几个核心数字:
- 2020年 1–6月实现营业收入9.12亿元,同比增长 30.50%,;
- 归属于上市公司股东的净利润为亏损7693.59万元,去年同期净利783.93万元;
你可以在这里详细了解其成绩单。
云计算发展白皮书。这份来自中国信息通信研究院的白皮书里,有几个值得关注的趋势,第一,云原生市场正在持续扩大,容器技术与微服务器架构越发流行;第二,疫情之下,SaaS 需求持续上升,而随着国内主要地区进入疫情的新常态,越来越多的企业接受了 SaaS 模式,这个领域还有巨大的市场空间。
你可以在这里免费获取这份白皮书。
算法公开或不公开,这是一个问题。Guardian 称,位于英国的司机与快递员联盟上月向荷兰阿姆斯特丹地区法院提出诉讼,要求 Uber 澄清并公开对于司机的相关算法,比如是否存在算法歧视或不公平待遇等。
很长一段时间里,算法都被科技公司的公司机密,此前 Google 就曾表示公开相关算法会被「坏人利用」。上周的时候,处于舆论关注点的 TikTok 宣布将公开视频的审核算法。
|