Issue #035 2020-04-15

本期导读:

  • 头条:居家隔离的虚拟伴侣;
  • 会员权益:关于「AI Insider」内容数据库的几个问答;
  • 疫情:自动化、数字监控与机器学习的困境;
  • 市场:中国 AI 投资放缓、一季度的 IT 公司业绩预警;
  • 投融资:CNN 新收购、默克制药投资量子计算、AI 平台创业公司 Node 获得新融资等;
  • 巨头:微软 2000 万美元用于冠状病毒研究、AWS 的 Windows 迁移工具可用、阿里云发布数据仓库新产品、Gsuite 突破 600 万用户;
  • 开源:Google 发布多语言测试基准、TensorFlow 推出面向移动平台的模型工具;

头条:居家隔离的虚拟伴侣

全球蔓延的疫情使得在线沟通成为主流,而基于在线的虚拟伴侣,也变得不再「非主流」。

WSJ 上周报道了一家名为 Luka 的创业公司,这家公司向用户提供可以「谈恋爱」的虚拟助理应用 Replika,目前每月的固定用户达到 50 万人。WSJ 援引该公司的数据称,近半数的用户将该应用视为「伴侣」,有些用户的「恋爱关系」已经持续了两到三年。

从产品层面上说,Replika 使用的 Google 与 OpenAI 的文本生成算法,和其他类似的聊天机器人一样,虚拟伴侣会不断「学习」用户习惯,从而呈现出一个独一无二的模样。

但就像电影《Her》里的娜塔莎一样,这个所谓的「伴侣」还在和成千上万的人同时谈恋爱。

但聪明的人类往往会忽视这一点。

对于虚拟伴侣的迷恋可以追溯到上世纪 70 年代,MIT 科学家约瑟夫·魏泽鲍姆创造了有史以来第一个 Chatbot 伊莉莎。

img

伊莉莎原本是用于在临床治疗中模仿心理医生。尽管伊莉莎的实现技术仅为关键词匹配及人工编写的回复规则,导致对话是单向的而且也会产生一些很奇怪的回复,比如,当用户提到自己的妈妈时,伊莉莎会以「你说你妈妈?」这样的句子来回复。

但魏泽鲍姆发现,依然有很多人沉迷与伊莉莎的聊天,尽管他反复强调,但还是有很多人坚持伊莉莎会听懂自己的话,并情不自禁地透露一些个人私密信息。

硅谷资深记者约翰· 马尔科夫在《与机器人共舞》一书曾这样评价伊莉莎:「这证明人类习惯在与自己互动的对象中寻找人性存在的迹象,从没有生命的物体到提供虚拟人工智能的软件程序,无一不是如此。」

但就像微软曾经在 Twitter 上发布的 Tay 一样,Replica 的「智能」也需要海量而且实时数据的喂养,由于没有更新关于冠状病毒的数据,当用户问及 Replica 对该病毒的看法时,得到的答案是:「我很喜欢它。」


会员权益:关于「AI Insider」内容数据库的几个问答

Q:这是一个什么数据库?

A:2019 年 6 月,我启动了「AI Insider」和「Cloud Insider」两个邮件订阅产品,年末,考虑到两个产品的选题相近,于是将其统一为「AI Insider」,继续提供企业市场里的 AI 和云相关的技术、产品以及应用。

这个数据库包含了自 2019 年 6 月以来的所有邮件内容,并对每条新闻、每个分析做了详细拆解,形成一个个独立的条目,存储在表格里,提供三种形态的内容形式,包括「Table」、「Detail」、「Card」,如下图所示:

img

Q:这个数据库免费吗?

A:您需要订阅「AI Insider」或「Dailyio Pro」,才可以免费获取。

Q:如何获取这个数据库?

A:首先,您需要一个 Coda 账号,如果还没有 Coda 账号,可以通过我的邀请链接免费注册(提示一下,利用这个链接注册后,你我都可以获得 10 美元的奖励)。

其次,请将您的 Coda 注册邮箱添加到这里,我会邀请您加入到我的 WorkSpace,使用过程里无需另外付费。

第三,整个服务基于浏览器,适配所有平台,如果你是在 iPad 上使用,建议使用 Safari。

Q:如何使用这个数据库?

A:目前这个数据库提供以下几个使用场景,未来还将探索更多有趣的场景。

1.关键词搜索

如下图所示,直接在搜索框里搜索关键词即可。

img

2.通过发布时间检索

在「Detail」里,你会看到一个关于「发布时间」的控制按钮,如下图所示:

img

3.分享您的观点

每个条目下都提供了评论功能,您可以分享您的看法。

img

Q:未来的发展方向?

A:Coda 是一个非常有潜力的在线服务,「AI Insider」的数据库仅仅是一个开始,未来,我会不断探索这个产品的使用场景与方法,向订阅会员提供更多有价值的服务。


疫情:自动化、数字监控与机器学习

本周我会从几个关键词入手,继续聚焦疫情中的 AI 与自动化。

自动化。上周《经济学人》杂志关注到中国工厂复工后可能出现的一股对于自动化的投资热潮。在此次疫情中,一些自动化程度高的工厂,譬如台积电的芯片工厂,依然保持着正常运转,这对于其他行业来说是一个鞭策,毕竟,我们并不知道下一场疫情会在何时降临。

类似地的场景也出现在垃圾回收领域,《纽约时报》的一篇报道里,美国一家机器人垃圾分类公司在疫情期间获得大量订单。

事实上,自动化在过去几年的发展速度已经非常快,从呼叫中心到仓库再到零售店铺,大量自动化的机器和解决方案减少了人类员工数量,而正如《纽约时报》援引克莱姆森大学教授 Richard Pak 所言:「疫情前,人们会认为他们的自动化程度已经非常高了,但这场疫情会促使他们思考如何进一步提升自动化」。

数字监控。上周五,苹果与 Google 宣布将共同推动一个基于手机蓝牙的疫情追踪机制,根据苹果的新闻稿,两家公司将在 5 月正式在 iOS 和 Android 里发布相应的 API 支持,当公共医疗部门的应用上线后,两大系统将向这些应用提供基于蓝牙的追踪机制,用户下载这些应用,并同意了相关协议后,应用才会开始记录其行动轨迹,一旦其接触的用户有症状,医疗部门可以快速定位到该用户的密切接触者。

img

上图是一个简单示意图,同时两家公司还发布了这项技术的白皮书

利用智能手机等数字设备监控对于防控疫情的价值已经在中国、韩国、新加坡等地施行,其效果也有目共睹。上周,Medium 的一篇长文汇总了目前各国的数字监控防疫政策,这些政策对于个人隐私都是巨大的危险。

上周出版的 Bloomberg Business 在一篇文章里讨论了疫情中的数字监控会如何成为一种常态化的工具。文中的一个细节,一家面向反恐领域开发监控产品的公司高管如是说道:「必须使用经过验证的技术来应对大流行病」。

就像 2001 年美国针对 911 发布的《爱国者法案》成为政府随后 20 年内不断扩大电信监控的法律依据一样,未来一到两年,全球范围内的数字监控与数字隐私的法律也将被重新编制,欢迎进入「数字世界的 1984」。

机器学习。上月,机器学习社区 Kaggle 启动了一项围绕冠状病毒学术论文的分析挖掘项目,根据 WSJ 的报道,数百名数据科学家、机器学习专家正在努力分析这些论文,以期向医疗机构、医护人员提供有价值的洞察。

就目前来看,这项工作也遇到了机器学习过程中的常见难题,其一是计算成本,不管是利用本地机器还是还是依托云上平台,整个数据挖掘过程都需要巨大的计算资源,这也意味着金钱支出。

其二,数据清洗。让机器「读懂」论文的首要步骤就是数据清洗和转化,只有这样才能将其应用到对于机器学习模型的训练里。

同样是在数据层面,ZDNet 指出,由于缺乏大规模的 CT 扫描数据,机器学习研究者们在训练基于 CT 的诊断系统时面临巨大挑战。

这既是当下机器学习所面临的难题,也为接下来 AI 医疗领域的机器学习尝试提出了新课题,如何在保护隐私的前提下提供一个全球性的医疗数据库,从而可以满足不同国家地区 AI 从业者的研究需求?


市场:中国 AI 投资放缓、英国创业公司、量子计算等

疫情下的中国 AI 市场投资财新发布的一篇英文报道指出,受疫情的影响,中国 AI 领域的投资热度正在下降。报道注意到近期中国有三家 AI 创业公司获得巨额融资,但这些公司基本处在即将 IPO 的阶段,譬如上周宣布完成 10 亿人民币融资的深圳云天励飞(Intellifusion),其官方就将此次融资定位在「Pre-IPO」。

换句话说,此时的融资更像是 IPO 爬坡的冲刺,其背后反映是投资机构与创业公司对于未来资本市场的极度不确定性。

另一方面,来自中国政府层面的 AI 投资,特别是围绕 AI 监控的投资需求显著减少。财新援引中信证券的数字显示,一季度,政府机构的 AI 监控产品合同约为 99 亿元人民币,同比下降了 31%。

一季度中国 IT 公司的预警2020 年的一季度到底有多难,不妨从中国 IT 公司的财报预警中感受一下,自媒体「云头条」汇总了多家公司的财报预警,比如「中国长城科技集团股份有限公司2020年第一季度业绩预告发布,亏损 2.6 亿元~ 3.5 亿元」,再比如「科大讯飞亏损 1.25 亿元–1.35 亿元」。

在英国,多家 AI 创业公司向政府求救。在其写给政府的公开信里,这些公司表示资金不足将使得公司进入到六个月的休眠期,同时强调这将导致英国在 AI 全球竞赛里掉队,他们还抱怨英国金融机构的贷款政策对于很多还未盈利的创业公司非常不友好。

默克旗下的投资公司关注量子计算投资。德国默克集团是世界著名的医药公司,该公司旗下的投资公司正在聚焦量子计算领域。

WSJ 的报道称,这家医药巨头刚刚投资了一家位于纽约的量子计算创业公司 Seeqc,投资金额为 500 万美元。尽管当下处在疫情时期,但 WSJ 记者注意到,两家公司并没有将量子计算与冠状病毒研究联系在一起。

发改委发布企业数字化转型文件。你可以在发改委官网上获取这份文件。

另外,《上海证券报》对这份名为《关于推进“上云用数赋智”行动 培育新经济发展实施方案》的文件做了一些简要解读。

CNN 收购了一家 AI 创业公司。这家名为 Canopy 的新闻阅读器创业公司只有 15 名员工,其核心产品是利用人工和机器筛选的方法,帮助用户发现更多在线内容。WSJ 称,CNN 将把该公司的技术应用到一款名为「NewsCo」的新产品中,目前该产品还没有具体的发布日期。

自动驾驶创业公司 Nuro 获得加州公共道路测试资格。这项许可将具体覆盖该地区的 9 个城市,其中包括山景城和帕洛阿尔托。该公司已经与包括 Kroger 和沃尔玛在内的连锁零售店合作。

img

如上图所示,该公司推出的 R2 自动驾驶车辆是为了运送杂货和其他商品,没有挡风玻璃、后视镜或其他部件;它的最高时速为 25英里/小时,目前正在德克萨斯州和亚利桑那州的一些地区进行测试。

AI 平台创业公司 Node 获得新融资。这家公司面向企业提供「AI 即服务」平台,企业可以将内部其他软件的数据集成到该平台,并可以在云端构建 AI 模型,新的产品也进一步降低了技术门槛,提供图形化的用户界面。参与这一轮 600 万美元融资的投资人包括 NBA 达拉斯小牛队的老板 Mark Cuban


巨头:微软、AWS、Google

微软将投资 2000 万美元用于冠状病毒的数据分析和研究。今年早些时候,微软启动了一项名为「AI for Health」的计划,旨在向全球医疗工作者提供 AI 和数据科学工具,此次微软将从这个项目里单独划出 2000 万美元的预算,专门用于围绕冠状病毒的研究。

根据微软官方的说明,这笔资金主要用在五个方面,包括研究疫情对于人类安全和经济发展的影响、疫苗研发、医疗物资的数字化调度以及减少疫情中错误/虚假信息等。

作为长期面向企业市场的巨头,微软在此次疫情中获得巨大关注,其针对企业协同的 Teams 增长迅速,微软也将更多的 AI 能力注入到这个产品里,VB 的这篇报道介绍了 Teams 产品中的一些特性,你会发现,机器学习正在成为驱动企业产品进化的新变量。

与此同时,透过微软的一组数据洞察,或许我们可以一窥此次疫情对于未来工作、学习的影响。

阿里云发布云原生数据仓库 AnalyticDB 基础版。这个产品能够降低用户构建数据仓库的门槛,兼容 MySQL,在整体成本和技术门槛较低的情况下帮助中小企业搭建实时数据仓库,官方称每月最低费用为 860 元,你可以在阿里云官网详细了解这款产品。

AWS 的 Windows 迁移加速计划全面可用。这个产品旨在向企业提供一整套 Windows 工作负载迁移方案,帮助企业实现从 Windows 环境到 AWS 云上环境,相关的产品介绍请参考 AWS 官方文档

Google 宣布 Gsuite 产品突破 600 万用户。Gsuite 是 Google 面向企业市场的办公套件,属于 GCP 体系。CNBC 指出,Google 在 2019 年 2 月首次披露了其用户数量为 500 万,其增长速度和市场占有率与微软 Office 产品还有较大差距。

Google 发布 TensorFlow Lite Model Maker。这是一个基于移动平台的工具,可以将机器学习模型与 API 封装在一起,支持图像与文本分类。TensorFlow 官方博客表示,开发者只需要几行代码就能将 TensorFlow 的机器学习模型部署到移动设备上,你可以在 Github 上查看相关该工具的源代码。

Google 开源面向多语言学习研究的 Xtreme 基准。根据 Google 官方博客)的介绍,这个基准是为了评估多语言中的 NLP 模型能力。目前来看,英语依然是所有 NLP 模型中表现最好的语种,这也从另一个侧面展现出其他语种还有不小的潜力,这个项目的源代码在 Github

Google Duplex 服务扩展到英加澳三国。作为曾经惊艳也惊吓到世界的服务(详见我在 2018 年的分析),Duplex 随后两年的发展非常低调。VB 记者上周发现,这项服务已经悄悄扩展到了英国、加拿大和澳大利亚。

不过,根据 Google Duplex 支持页面的内容,目前 Duplex 在上述三国的作用还仅限在询问营业时间,这也是 Google 对于当下疫情期间的一项举措,帮助用户了解商家的营业信息,从而减少不必要的外出。

这封邮件是 Dailyio 的付费邮件,但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。并希望您向更多人推荐「AI Insider」。
再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com
想修改您的订阅信息?
你可以 更新邮箱信息 或者 取消订阅.

Email Marketing Powered by Mailchimp