Issue #037 2020-04-22

本期导读:

  • 头条:为什么机器学习预测社会问题是一个危险现象?
  • 巨头:Google 研发消费设备芯片、如何选择 GCP 上的数据库产品、英特尔推出边缘计算教育课程;
  • 自动驾驶:Uber 新论文、百度自动驾驶出租车在长沙运营、车厂或减少自动驾驶预算;
  • 创业公司:盘点 7 家新近获得融资的 AI 创业公司;
  • 资源:从芬兰国家教育课程到 MIT K12 教育网站,推荐一组 AI 免费教育资源;
  • 其他:MIT TR 5 月刊、斯洛文尼亚的 AI 发展、无人机监控数据集、高质量新闻数据集等;

头条:机器学习预测社会问题相当危险

不管是个体还是组织,任何一个「决策」的背后往往蕴含着一种对于未来的预测,那么「预测」从哪里来呢?

很长一段时间里,社会层面的「决策」依赖于各种抽样调查,然后通过分析调查结果形成决策机制。最近几年,随着机器学习系统的流行,利用海量数据的挖掘,改变了过往小数据的调查模式,「大数据」、「全数据」的说法开始流行,这些数据所形成的预测,已然成为决策者的重要参考。

这个变化背后有一个假设:算法在足够多的数据支持下,一定可以比人类做出更精准的预测

但事实却并不乐观。普林斯顿大学今年早些时候发表了一份关于机器学习预测的研究,这个研究设计了一个实验:数百名研究者们利用一个庞大的数据集训练预测算法,试图预测出某些孩子后来的人生轨迹。

结果发现,即便是使用了最多数据量或最先进机器学习技术的研究者,其预测出来的结果也和现实结果不相符,甚至可以用「不准确」来形容。

这个研究至少提供了三个层面的启示:其一,机器学习不是万能工具,「数据越多结果越好」,但这个「结果」并不能保证是准确结果;

其二,将机器学习应用到关乎民生问题的预测进而进行决策相当危险,但无论是美国还是中国,政府机构已经开始热衷这类系统;

其三,当社会、经济被各种数据、各类算法所定义,信息与决策的不透明性会加剧新的不平等。一个正在发生在我身上的例子,我所居住的北京朝阳区,某天开始成为算法定义的「疫情高风险区」,但没有人告诉我为什么以及应该做什么。


巨头

Google。上周有消息称,Google 正在研发面向消费电子领域的芯片,最快将于明年配置到 Pixel 智能手机以及 Chromebook 中,从而可以更好地适配 Google 在消费电子中的机器学习算法。

目前已知的信息是,Google 芯片产品的代码为「Whitechapel」,采取 5 纳米工艺,与三星共同合作设计。Google 官方拒绝回应这条消息。

云计算公司现在都提供丰富的数据库产品,GCP(Google Cloud Platform)也不例外,面对丰富或者说复杂的数据库产品,如何根据自己的业务需求做选择呢?数据科学家 Yaron Hollander 分享了他的见解,如下图所示,这张选自他新书的信息图,可以帮助各位快速定位到更适合自己的数据库产品。

img

英特尔。上周,英特尔与在线教育平台 Udacity 推出一项面向边缘 AI 开发的 Naodegree 课程计划。这个计划将通过英特尔发布的 OpenVino 工具包,对开发者提供计算机视觉与深度学习相关的培训。完成课程后,开发者将获得 Udacity 发布的结业证书,关于这门课程的详细计划,可参见这里

本月早些时候,英特尔与佐治亚理工学院成为美国国防部旗下的 DARPA AI 防御项目的供应商。这个项目的核心是研究抵御类似「对抗性网络攻击」的技术,确保军方的图像识别系统足够安全可靠,整个项目将为期四年。


自动驾驶

Uber 新论文。Uber 上周发表了一篇关于自动驾驶的论文,提出利用 GANs 思路,将驾驶场景里的各种信息与数据整合,预测车辆驾驶过程里的轨迹图,你可以通过这里详细了解这篇论文。

百度自动驾驶出租车项目开始在长沙运行。此次百度在长沙投入了 45 辆无人驾驶出租车,目前用户可免费试乘,主驾驶位置也配置了安全员,百度方面并未透露项目的商业化时间点。

咨询机构称,自动驾驶有可能成为疫情的「预算牺牲品」。咨询公司 IHS Markit 日前发布调查报告称,绝大多数汽车制造商和零部件供应商都希望减少今年的研发支出,而电动化和自动驾驶是最有可能因疫情而削减预算的项目。

工信部发布《2020年智能网联汽车标准化工作要点》,简言之,2020 年要完成智能网联汽车的相关标准,其中也强调了加快自动驾驶功能场地测试方法、自动驾驶仿真和实际道路测试方法、自动驾驶人机交互系统等标准制定。此前,这些自动驾驶相关的标准还是不同企业根据研发需求自行设置。


创业公司

梳理近期几笔重要的融资项目。

Forerock 融资 9350 万美元。这是一家来自旧金山的创业公司,利用机器学习算法,帮助企业检测、发现员工潜在的安全风险,通过更多安全认证,保护企业的数字基础设施与数字资产的安全。

Edited 融资 2900 万美元Edited 是一家利用人工智能优化商品定价的零售科技公司。根据其官方的介绍,Edited 每天从全球 90 万个零售商和网站上获得 700 万条信息,然后利用计算机视觉技术与自然语言技术,完成商品图文信息分离,并将名称、价格等信息提取出来。

Onfido 融资 1 亿美元。这是一家基于云端的身份安全工具公司,成立于 2012 年,其产品面向企业市场,提供包括背景调查、金融客户安全认证等服务。

中国 AI 公司西井科技 westwell 完成 1 亿元的融资。这家位于上海的创业公司主要提供 AI 芯片方案的开发,目前的三款芯片应用到了港口、医疗等领域。参与一轮融资的机构包括安信证券、浪潮集团等。

Atlas 完成 700 万美元的 A 轮融资。这家提供地理智能数据的创业公司,创立于 2018 年,其产品广泛应用在农业、基建以及市场分析中,客户有世界银行、麦肯锡等。包括空中客车旗下的投资机构以及半导体巨头美光参与了这一轮投资。

Guru。这是一家主打企业信息管理的创业公司,刚刚获得 3000 万美元的 C 轮融资。根据 CrunchBase 的报道,该公司的产品通过浏览器插件的形式提供给客户,可以将客户所需要的信息快速整合在一起,帮助企业客户形成更好的信息管理体系,你可以通过其官网进一步了解这家公司。

Unlearn.ai。一家面向医疗临床研究的创业公司,这家创建于 2017 年的公司,主要产品是提出了「数字双胞胎」的方法,将数字化模型引入到临床试验中,你可以通过这里详细了解这家公司。


AI 教育资源

人工智能并不是一项专门的技术,甚至不是一个技术名词,它更像是一组概念的集合,这个概念里既有技术,也包含了对于社会、经济以及人类同理心的认知,所以很多时候,我都建议大家通过系统的图书或课程来了解人工智能领域,本期我会推荐一组 AI 相关的免费课程。

赫尔辛基大学推出的 AI 教育课程。这门课程从最基本的 AI 是什么谈起,系统地展现了当下语境里 AI 的真实一面,既「AI 可以做什么,不能做什么」,整个课程设计非常不错,你可以通过这里了解更多。

Google AI 系列课程。严格意义说,这并不是一门独立的课程,而是可以根据你的职业(学生、商业决策者、数据科学家)来选择不同的内容,包括视频、在线课程等资料,从而帮助用户快速建立起 AI 领域的基本认知框架,你可以通过这里快速定制你的 AI 课程。

吴恩达的「AI for Everyone」课程。这是我在过去几年经常推荐的课程,就像这个名字所言,吴恩达从最基础的概念谈起,逐步探索 AI 项目、AI 公司以及 AI 与社会之间的关系,这是一个非常系统的 AI 通识课程。目前该课程完全免费,甚至你也不需要 Couresa 账号,直接可以通过网页观看课程视频,还提供视频脚本。

MIT 面向 K-12 年龄段的免费 AI 教育网站。这个网站由 MIT 媒体实验室开发,提供了一系列该实验室研发的 AI 项目,譬如 Zhorai,这是一个向孩子介绍对话机器人的项目,孩子们可以了解到这些机器人背后的感知、推理以及可能存在的伦理问题。每个项目都提供了详细的课程说明,但需要家长做好(备课)准备,才能实现比较好的效果,你可以通过这里了解更多。


其他

MIT TR(即《麻省理工科技评论》)5 月新刊免费阅读这期杂志以科学的视角关注疫情发展,其中几篇文章谈到了疫情期间的数字监控与隐私保护,推荐其中的两篇文章,其一是新加坡国立大学公共政策副教授 James Crabree 分析了东亚国家对于疫情防控的政策,其二是英特尔高级研究员 Genevie Bell 对于公共卫生和隐私对立的反思。

斯洛文尼亚的 AI 发展情况。斯洛文尼亚是前南国家,上世纪 90 年代后似乎被人忘记,但是这个国家在 AI 领域的一系列成绩却不容忽视。Forbes 的这篇专栏文章以该国和联合国教科文组织共同推动的 IRCAI(International Research Center on Artificial Intelligence)为例,展现了这个小国家的 AI 思考,值得一读。

人工智能的「A-Z」。这是一个非常有趣的项目,由哈佛大学与 Google 联合开发,通过 26 个字母所代表的 AI 技术以及关键词,展现了这个领域最值得关注的议题,强烈推荐收藏。

利用一个数据集,可以从无人机到车辆监控工具。这是一个来自中国天津大学开放的无人机图像数据集 DroneVehicle。该数据集拥有 15 万张 RGB 图像、44 万+ 个图像物体注视,利用这个数据集可以实现物体检测和物体计数的任务,你可以在这里详细了解这个数据集。

4 万篇人类编写的新闻数据集。这是一个面向 NLP 研究者的数据集,由风险监测公司 Curation 发布,包括 4 万篇专业新闻摘要,都是人类所撰写的新闻,你可以在 Github 上获取这个开源数据集。

这封邮件是 Dailyio 的付费邮件,但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。并希望您向更多人推荐「AI Insider」。
再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com
想修改您的订阅信息?
你可以 更新邮箱信息 或者 取消订阅.

Email Marketing Powered by Mailchimp