苹果机器学习与当下机器学习的困境
作为全球影响力最大的科技公司,苹果长期以来在机器学习领域是失声的,原因有两个方面:其一,苹果秉承的「保密文化」,与机器学习领域的开放协作互斥,这导致外部的机器学习从业者无法了解苹果,苹果内部的研究人员不能公开分享自己的研究成果;其二,在消费硬件领域具备全球统治力的苹果,一直排斥对于用户数据的收集与使用,这在「数据越多越智能」的大背景下显得格格不入,相比于 Google、亚马逊的互联网巨头,苹果的机器学习应用,比如 Siri 的表现非常糟糕。
不过,自 2016 年开始,苹果也在适应并定义着自己的机器学习策略,其中的几个重要时间点:
- 2016 年 6 月,iOS 10 亮相 WWDC,苹果为其注入了诸多机器学习特性的能力,并提出「Differential Privacy」,这个概念由微软的C. Dwork 提出,其基本含义就是基于统计学原理,在一个群体层面收集数据,而非像FB、Google 那样收集个体的数据;
- 2016 年 12 月,苹果允许内部机器学习研究者公开发表自己的论文;
- 2017 年 6 月,苹果在 WWDC 上正式发布 CoreML,通过封装 iOS 底层的 AI 能力,帮助开发者在 iOS 平台构建 AI 应用;
- 2017 年 7 月,苹果上线机器学习博客,定期向行业分享研究成果;
- 2018 年,前 Google 机器智能、搜索部门高管、机器学习资深人士 John Giannandrea 加盟苹果,并在当年年末成为管理团队成员,担任「机器学习与 AI 战略高级副总裁」;
- 2019 年,GANs(对抗生成网络)提出者、知名学者 Ian Goodfellow 从 Google 加盟苹果,担任苹果「特殊项目小组」机器学习部分负责人。
上述这些重要时间点勾勒出苹果在机器学习的产品与人才布局,结合 Ars Technica 最近采访 John Giannandrea 以及苹果产品营销副总裁 Bob Borchers 的长文,我们可以更好理解苹果对于机器学习的思考。
首先,苹果对于软硬件领域的绝对控制,为加速机器学习应用提供了巨大优势。一个例子是,当 John Giannandrea 希望利用机器学习优化 iPad 手写体验的时候,由于 iPad、Apple Pencil 的硬件设计与 iPadOS 完全由苹果控制,这使得整个调试、优化的过程可以实现快速推进,并给用户带来完整的体验。
再举一个例子,苹果将机器学习应用到对设备的充电保护,这涉及到电池、设备与系统多个领域,也只有苹果这样掌控整个产业链的公司,才能实现这个循环:利用机器学习系统学习用户使用设备的习惯,形成用户充电习惯模型,从而在保护设备电池的前提下,让用户没有感知充电速度的变化。
其次,苹果持续发力基于端侧的智能能力,其实这类说法还有很多,比如设备智能或终端智能,但本质都是说的一件事情:将数据处理放在设备,完成一系列复杂计算后交付给用户。
端侧智能解决了两个方面的问题。其一,由于数据处理都是放在本地,避免了数据上传到云端可能出现的数据隐私问题;其二,数据处理可以更实时,用户体验也更好。
最新的一个案例,Google 利用 Android 设备上的机器学习能力,展示如何快速识别超市里的产品。
但实现端侧智能的难度也不小,一方面,需要本地设备具备强大的数据处理能力,特别是面向机器学习的特点,提供相应的计算能力;另一方面,不管是智能手机还是平板或笔记本电脑,如何在端侧智能与功耗之间实现平衡,既需要硬件创新也需要系统与软件的优化。
这也构成了观察过去几年苹果设备,特别是 iPhone 创新的重要切入口。从面向开发者的 CoreML 到集成自研的 NPU(现在苹果称为「Apple Neural Engine」),苹果一方面不断增加设备上的智能能力,像 Apple Wacth 的「洗手检测」,就是将设备上的运动传感器(感知手的变化)、麦克风(感知水声变化)与机器学习算法结合起来。
另一方面,苹果在鼓励开发者积极调用 CoreML 的机器学习能力,从而增加应用的智能能力,这也是目前业界争夺的焦点,从 Google 不断开放 Android 上的机器学习 API 到华为 HMS 所开放的机器学习能力,所有这些平台都将机器学习作为吸引开发者的重要途径。
第三,站在用户的角度,机器学习还无法带来革命性的用户体验变化,但变化的确是在累积。
不管你是不是 iPhone 用户,过去几年机器学习在消费电子领域的渗透已经越来越多,并且在一些高频场景,如拍照、语音聊天等场景里有了非常多的应用,但这些应用本质上并没有改变拍照或语音的体验,更多还是在优化、优化与再优化,换句话说,机器学习可以让用户可以拍出更好看的照片,还可以让用户的语音聊天更顺畅。
这也折射出当下机器学习的应用困境,不管是消费领域还是企业市场,即便是包括苹果、华为这样的供应商再努力,不断增加硬件与系统的智能能力,但用户体验层面的感知依然处在非常早期的阶段,这条探索路到底有多长,以及这条路是否是正确的道路,目前我们还无从知晓。
机器学习·政府权力
在全球各国抗疫的过程里,《经济学人》杂志早在 3 月份就发出一个提醒:疫情加速大政府的形成。
一个月后,《经济学人》又用了下面这个封面,进一步强调了政府借助抗疫所进行的权力集中。
事实上,围绕抗疫过程里政府权力如何扩大的议题,可以简单归结为:疫情让政府拥有了对于民众更大的监控(监视)权力,机器学习在其中功不可没。
负责 OpenAI 公共政策的 Jack Clark 也发出了预警,在一篇写给「2025 年世界」的文章里,Clark 警告世界:机器学习在抗疫过程里的应用,特别是在监控领域的应用,将强化政府的监控权力。
Clark 给出了两个原因:其一,越来越多的政府将机器学习监控系统纳入到抗疫之中,从而极大刺激了从学术界到企业界对该领域的研究和资金投入,进一步推动监控领域的技术突破与应用。
其二,不同国家地区对于监控的接受程度以及反制力量的不同,加速围绕机器学习监控应用的分化。这里必须提及中国所扮演的特殊角色,中国相对成功的抗疫成果与无所不用的监控/监视措施展现出一个特殊样本——或是一些国家模仿的对象,或是一些国家努力避免成为的样子。
两个最新的案例,在英国,民众对警察部门使用面部识别的反制取得重要成果,FT 报道称,法院的一项判决指出,英格兰与威尔士警方使用面部识别技术「违反人权」。
在新西兰,政府面向各部门发布了一份统一的「算法检查清单」,要求各部门对照清单,列举各部门部署的机器学习应用里的潜在风险。
Clark 描绘了五年后的可怕现实,无论接受与否,我们都应该看到各个政府利用抗疫与机器学习监控所不断扩大的权力,更何况,疫情还远未结束,最坏的那一天也远未到来。
自动驾驶·行业·应用
小鹏汽车即将 IPO。根据其招股说明书,2019 年小鹏汽车的收入为 23.2 亿人民币,营收同比增长了 238 倍,但依然处在亏损状态。
这家成立于 2015 年的公司,到目前为止推出两款量产车,截止到 2020 年 7 月 31 日,分别交付了 18741 辆和 1966 辆。
这是我首次将小鹏汽车列入「AI Insidr」的选题,原因在于,透过其 IPO 说明书,这家公司希望把自动驾驶作为其核心卖点。小鹏汽车的自动驾驶策略与特斯拉类似,都是软硬件一体化整合,目前小鹏采用的是英伟达 Xavier 芯片,在此基础上构建了 Xpilot 自动驾驶软件。
最新的 G3 车型上,Xpilot 与搭载的 12 个超声波雷达、5 个高清摄像头、3 个毫米波雷达共同组成了 L2.5 级别的自动驾驶系统,你可以在小鹏官网进一步了解这个系统。
除小鹏汽车之外,目前国内自动驾驶的创业公司与产品还有很多,《南华早报》这篇文章梳理了包括百度、滴滴、Auto X 在内的一众玩家们,不过这个名单还不够全,阿里、腾讯、华为也在从不同领域切入到这个市场。
但我必须再提醒一点:整个产业现状与发展速度,距离你我心目中的自动驾驶,还有相对大的差距。与此同时,当下自动驾驶系统的可靠性也充满不确定性,美国汽车协会(AAA)的在过去两年的两项测试进一步佐证了这个事实。
宝马工厂的机器学习与机器人应用。WSJ 披露了宝马在工厂里的机器学习应用,通过图像识别功能来分析汽车装配产线上的静态图片,根据装配误差多少决定是否进入下一个生产线。
WSJ 援引 JP 摩根的一项分析称,利用机器学习和机器人,制造业巨头可以减少疫情中的工人数量并大幅节约成本。
类似地,联邦快递也把机器人安置在仓库里分拣包裹,你可以在这里观看这个机器人的视频,这个机器人由日本 Yaskawa 机器人与 Plus One Rebotics 的软件系统共同组成,可以大幅提升分拣包裹的效率,联邦快递希望在 2021 年实现 80% 的自动化分拣包裹。
值得一提的是,此前分拣包裹的工人们,现在成了机器人的「监工」,一个人类「监工」,可以管理八个机器人。
除此之外,下面还有一组机器学习在各行各业的应用案例。
- 电信:T-Mobile 的预测性分析,从而优化客服体验,案例介绍。
- 零售:英国服饰品牌 Marks and Spencer 基于计算机视觉的创新,案例介绍;
- 服务与维修:可口可乐内部利用 IBM 与苹果 Core ML 提升设备维修效率,案例介绍。
其他
最后看一组最近值得关注的 AI、机器学习领域的新闻。
《MIT 科技评论》推出一个新播客「In Machines We Trust」,其介绍语写道:这是一个关于「Automation of evertthing」的播客,苹果用户可以从这里收听或订阅。
《南华早报》上周披露了中国大陆出现的「AI 电话机器人」,也就是我们常说的「骚扰电话」。
如何理解 AI 芯片市场?这篇分析的价值是下面这张图,读懂这张图也就够了。
微软收购 TikTok 意在其海量数据?《华盛顿邮报》站在 AI 与大数据的角度做了一些分析,比如 TikTok 坐拥 1 亿美国用户的数据,可以成为微软训练 AI 模型的重要「能源」。
一组机器学习领域的图书。这个书单涵盖了从理论、历史到编码实战多个阶段,可以满足不同的需求。
微软投资 AI 芯片创业公司 Syntiant。这家公司面向边缘设备的语音处理需求提供相应的芯片解决方案,此次获得 3500 万美元的 C 轮融资,微软旗下的投资机构 M12 领投。
|