Issue #078 2021-01-13

📢 Editor’s Note

过去的 2020 年,持续流行的 MLOps 工具,连同研发这些工具的公司,正在将机器学习引入到一个新阶段,本期将做一些延展分析。

我在此前多期「AI Insider」里讨论过量子计算与量子计算机的基本现状,本期我会结合一份报告,重点谈谈量子计算的商业化。

最近关于汽车的话题都与科技公司有关,从苹果造车进展到百度加入造车行业,从芯片短缺影响汽车产量到梅赛德斯对于下一代汽车的思考,计算与智能,正在将汽车变成一个新设备(形态)。

本期还将关注:Waymo 的「改旗易帜」、OpenAI 新模型、美国政府的 AI 办公室、英国政府的 AI 路线图、地平线融资、RISC-V 被追捧等。

焦点:MLOps 与机器学习创业公司

MLOps 正在流行。

MLOps 来自于 DevOps,传统意义上,DevOps 是开发和运行大规模软件系统的一种常见做法。这种做法具有诸多优势,比如缩短开发周期、提高部署速度、实现可靠的发布等,由于机器学习本身就是一种软件系统,因此可以借鉴 DevOps 的理念,构建机器学习模型持续集成、持续交付的流程。

在 2020 年的「State of AI」的报告里,MLOps 成为开源社区 Github 上增长最快的机器学习关键词,下面这张图很有代表性,这也意味着越来越多的企业开始从构建机器学习模型转向如何运行模型。

img

简言之,越来越多的企业不仅在考虑如何加快机器学习研究,还在加速将机器学习模型引入业务层面。

而在机器学习开发者 Chip Huyen 看来,过去的 2020 年,持续流行的 MLOps 工具,连同研发这些工具的公司,也迎来一次大爆发,他给出了几个值得关注的方向,可以帮我们快速了解该领域机器学习创业公司的发展情况。

其一,资本市场认可机器学习部署应用的潜力。Chip Huyen 统计了来自 184 家创业公司的 284 个 MLOps 项目,其中有 65 家创业公司在 2020 年获得融资,数据、端到端一站式平台、模型训练三个领域的融资公司最多。

img

其二,聚焦 MLOps 工具的创业公司里,硅谷虽然依然是「中心」,但其他国家和地区的公司越来越多,下图给出了一个基本分布。

img

另外一些值得关注的明星创业公司包括:

其三,地缘政治的影响,中美两国的 MLOps 基础设施正在开始割裂。

不过在我看来,这种割裂不仅因为地缘政治、语言等问题,更是因为在机器学习领域,中国的大公司,如阿里、腾讯,具备更大的产业影响力,或者说破坏力,其庞大的产品线挤压了小公司的生存空间。

行业:量子计算商业化

过去的 2020 年,量子计算引发众多关注,特别是中国最高决策机构集体学习量子计算所传递的信号,持续放大量子计算对于公众的吸引力。

我在此前多期「AI Insider」里讨论过量子计算与量子计算机的基本现状,本期我会结合 CB Insights 的一份报告,重点谈谈量子计算的商业化。

首先,量子计算领域的交易(包括融资、收购)正在大幅增加,下图是 CB Insights 统计的自 2015 年到 2020 年的量子计算交易数量和交易总额。

img

有两家创业公司值得关注:

  • PsiQuantum:总融资额超过 2.78 亿美元,微软旗下投资机构参与了该公司融资,正在研发基于光子的量子计算硬件;
  • Cambridge Quantum Computing:这家公司得到 IBM、霍尼韦尔的投资,目前融资总额达到 9500 万,提供面向特定领域的量子计算基础设施;

其次,在量子计算目前可预测的应用领域里,需要重点关注以下这些领域:

  • 医疗:基于量子计算机的巨大算力,在诸如蛋白质折叠、基因组分析以及药物发现等领域有着非常多的用途;
  • 金融:主要还是基于更快的金融数据分析,IBM 此前提到利用量子计算机运行「蒙特卡洛模拟」以更好评估金融风险,另外包括苏格兰皇家银行、高盛、花旗等都投资了一些量子计算创业公司;
  • 网络安全:这是一个最为被大众熟知的领域,所谓「一秒钟破解所有加密密码」正是量子计算在网络安全领域的最大「价值」,不过已经有越来越多的关于「后量子加密方法」的研究,这个领域的变化会非常有趣;
  • 人工智能:这只是一个被看好的趋势,但能否实现以及如何实现,目前还处在非常早期的阶段;
  • 国家安全:包括中国、美国在内的主要国家,在涉及国家安全的量子计算领域投资数十亿美元(无法获得更准确的数字),旨在抢占新技术高地;

最后,还是要重申一点,尽管理想非常美好,但骨感的现实是,量子计算处于非常早期、非常初级的阶段,整个行业还在积极研发、探索,我看到的乐观预测是,真正的量子计算机还要到 2029 年才会出现。

最后的最后,Google 量子人工智能实验室总监 Hartmut Neven 这句话很值得回味:

It looks like nothing is happening, nothing is happening, and then whoops, suddenly you’re in a different world

行业·汽车

最近关于汽车的话题都与科技公司有关。

比如苹果的造车计划,Bloomberg 上周给出的「内幕」信息称,苹果汽车研发还处在早期,需要 5 年时间。

百度也在本周宣布成立一家汽车公司,官方的新闻稿称,「新组建的百度汽车公司将面向乘用车市场,着眼于智能汽车的设计研发、生产制造、销售服务全产业链」。吉利汽车也是这家汽车公司的股东,「下一步双方将基于吉利最新研发的全球领先纯电动架构–浩瀚SEA智能进化体验架构,在智能汽车制造相关领域展开紧密合作,共同打造下一代智能汽车」。

上周,FT 和 WSJ 相继报道了车厂因为芯片短缺导致车辆减产,WSJ 最新消息称,福特公司计划暂停一家位于路易斯维尔的工厂运营,因为这家工厂在计算芯片不足的情况下无法生产。

究其原因,一方面是越来越多的汽车公司加大对于车载计算的关注,从而在需求侧变得非常多;另一方面,疫情催生了巨大的在线办公需求,包括平板、PC 等计算设备的需求大幅增加,消费电子公司成为芯片的重要采购商,使得芯片公司在供给侧无法满足汽车行业的需求。

本周的 CES 上,梅赛德斯奔驰公司展示了一块三合一的车内超级屏幕,可以将仪表盘、信息娱乐与乘客显示屏整合在一起,感兴趣的朋友可以通过这个视频进一步了解。

img

正如该公司 CEO Ola Källenius 所言,屏幕的尺寸并不是关键,真正关键的是用户(驾驶)体验。而驱动这些屏幕与体验的,则是计算芯片,梅赛德斯在 2020 年与英伟达达成合作,预计到 2014 年,英伟达的 Orin SOC 将成为梅赛德斯车辆驾驶平台的计算中枢。

公开资料显示,还未交付的 Orin SOC 包括 170 亿颗晶体管,将英伟达的 GPU 与 ARM Hercules CPU 架构整合在一起,同时还将提供对深度学习、计算机视觉算法的高效支持。

在基于计算机视觉的辅助驾驶软件领域,英特尔旗下的 Mobileye 占据重要市场份额,该公司近期表示,将利用英特尔在芯片领域的积累,生产低成本的激光雷达,从而在 2025 年可以装备到更多自动驾驶车辆上。

该公司还透露,2021 年,Mobileye 的自动驾驶测试车辆将增加四个测试城市,分别是底特律、上海、巴黎和东京。

谈到自动驾驶,Waymo 上周的官方博客宣布,新的一年,Waymo 将不再使用「自动驾驶」的说法,博客里的一句话:

It may seem like a small change, but it’s an important one, because precision in language matters and could save lives.(看起来调整措辞是一个很小的改变,但这个改变相当重要,因为在语言描述中精准很重要,它可能会拯救生命)

我曾不止一次地指出科技行业对「自动驾驶」的渲染是过度的,这不仅造成宣传与现实之间的巨大体验鸿沟,还会对公众的认知产生不利影响,Waymo 所谈的恰好是这一点,包括特斯拉、百度等公司在自动驾驶方面的过度营销,已经酿成了诸多因为司机相信「自动驾驶」而引发车祸的悲剧。

Waymo 同时表示,该公司正在研发的是一种「全自动驾驶」的技术,这是与当下驾驶员辅助技术(其实就是目前所说的「自动驾驶」)不一样的解决方案。

国家·巨头

美国。美国国会上周通过一笔 7410 亿美元的国防预算,这其中包括一笔 64 亿美元的 AI 基金,由联邦政府分配,包括国家科学基金会 48 亿美元、能源部 12 亿美元、美国国家标准和技术研究所 4 亿美元,用于 AI 技术研究。

这也意味着,美国终于有钱支持人工智能国家战略了。

与此同时,白宫也在上周宣布成立人工智能倡议办公室,这个部门的主要职责是监督人工智能国家战略的落地执行,同时还将与企业以及学术界展开相关合作。该部门也有自己的印章,如下图,一只秃鹰(象征美国)、金色桂树叶、一个由相互连接的节点组成的神经网络,底下的七颗星星是指代人工智能自出现到现在的第七个十年(1956——2021)。

img

英国。英国人工智能委员会上周发布英国 AI 路线图,该路线图旨在为英国政府制定 AI 国家战略提供建议和参考,目前这份路线图包括四个方面:

  • 研究创新与投资
  • 教育培训与多样性
  • 数据基础架构与公众信任
  • 政府 AI 的应用

你可以在这里免费获取这份路线图。

OpenAI。OpenAI 上周在其博客上介绍了一个多模态机器学习模型 DALL-E,这个模型实现了计算机视觉与自然语言处理的结合,可以把文本描述中生成图片,官方演示里,下图就是根据「an illustration of a baby daikon radish in a tutu walking a dog(穿着芭蕾舞裙遛狗的小萝卜插图)」的文本所生成。

img

根据 OpenAI 的介绍,DALL-E 也是 GPT-3 的「衍生品」,拥有 120 亿个参数,其数据集侧重「文本与图像」。

本质上说,DALL-E 也是一种「生成网络」,这也引发不少伦理方面的质疑,不过截止本期会员通讯发稿为止,OpenAI 还没有公布该模型的论文,关于这个模型的后续情况,「AI Insider」也将持续关注。

阿里。阿里巴巴上周回应了阿里巴巴人工智能实验室的「最终命运」,这个此前推出天猫精灵等智能音箱产品的部门「已整体并入阿里云智能,由谭平教授带领」。此前,天猫精灵业务已升级为独立事业部,由阿里云 IoT 负责人库伟负责。

阿里云智能数据库事业部负责人李飞飞日前发表署名文章,介绍了数据库的发展趋势,包括:

  • 大数据与数据库一体化
  • 云原生和分布式技术组合
  • 软硬件一体化
  • 安全可信等。

你可以在这里阅读这篇分享。

AWS。在特朗普支持者冲进美国国会后,美国多家科技公司相继停止向极右翼的特朗普支持者提供服务,AWS 上周宣布不再为极右翼社交网站 Parler 提供网络托管服务,目前该网站已经下线。

BuzzFeed 的报道指出,Parler 上的用户非常愤怒,甚至扬言要去「拜访」AWS 的数据中心。

英特尔。英特尔介绍了一个基于本地设备的面部识别系统 RealSense ID。根据该公司的新闻稿,这套系统可以应用在 ATM、信息亭等设备上,所有的面部数据识别与处理都是在本地完成,该设备将在 2021 年第一季度正式推出。

市场·芯片

AI 芯片创业公司地平线上周完成一笔 4 亿美元的 C2 轮融资,由 Baillie Gifford(简称“BG”)、云锋基金、CPE(中信产业基金)、宁德时代联合领投。

加上此前的 C1 轮,地平线的两轮融资共计 5.5 亿美元,距离其 7 亿美元的计划还有一些差距。

地平线定位与车规级智能芯片的前装量产,官网称,(该公司)「形成覆盖从L2到L3级别的『智能驾驶+智能座舱』芯片方案的产品布局」,2021 年该公司将面向 L3/L4 级别自动驾驶推出征程 5 芯片(Journey 5),性能也会对标特斯拉 FSD。

2020 年下半年开始的芯片行业投资热潮还在持续,「要快」成为投资芯片类公司的共识,不然「有些项目还没有立项,只是初步接触,友商已经投了」,更疯狂的做法还包括:

机构会紧盯头部的动向,一旦工商变更的消息出来,这家被投公司会迎来一大批投资机构,“大家要么去问投资机构,投的这家公司好在哪;要么通过工商,拿到被投公司的信息;要么靠过去的机构关系找人。不到10分钟,被投公司可能就会接到下一批投资人的电话,甚至没有时间差,毫不夸张。”

信息还可能提前流出,“有的项目还在过投决,行业内大家就都知道了,个人和机构就都跑来跟投。”

但正如这篇分析所指出的那样,资本的逐利本质与半导体相对缓慢的回报周期之间,需要的是耐心以及对行业规则的敬畏。

在中美关系持续紧张与英伟达收购 ARM 的大背景,开源架构 RISC-V 正在成为新的赛道,这个领域的创业公司也开始加快 PR,比如睿思芯科,这家公司面向 AIoT 场景提供低功耗的 IP 授权以及处理器。

img

另外关于 RISC-V 的行业发展,可参见安信证券的一份分析报告,你可以在这里免费下载。

以上就是本期「AI Insider」的全部内容,再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com
这封邮件是 Dailyio 的付费邮件,但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。并希望您向更多人推荐「AI Insider」。

您可以 更新邮箱信息 或者 取消订阅

Email Marketing Powered by Mailchimp