产业·其他
先看合成数据,一个显而易见的事实是,数据是整个 AI 领域发展的根本动力,但在各国加大数据监管的情况下,数据极其昂贵同时使用场景也越发受限,此时,利用计算机生成的数据,也就是合成数据成为行业关注的焦点。
咨询公司 Gartner 在 2021 年给出过一个预测,预计到 2024 年,AI 项目中的 60% 数据将使用合成数据。
过去的一年,Meta(Facebook)、微软已经展示了各自在合成数据领域的布局,而创业公司 Gretel AI、Mostly AI 也相继完成数千万美元的融资。
上周,计算机视觉合成数据创业公司 Datagen 获得 5000 万美元的融资,该公司向客户提供合成图像数据,比如面部数据,帮助客户快速提升模型能力。财富 100 强的众多公司都是 Datagen 的客户,该公司表示, VR/AR 以及元宇宙是近期增长最快的应用领域。
《财富》杂志曾报道了包括美国运通、JP 摩根在内的金融行业如何使用合成数据。
不过,合成数据的价值并没有得到一致的认可。原因在于,合成数据公司还处于早期阶段,其提供的合成数据产品到底如何提升机器学习模型还无法得出确切的答案。
韩国大选中的数字人技术。不久前的韩国大选期间,候选人尹锡悦团队采用了数字人技术。一支技术团队开发了一套算法,通过学习 20 小时的音频和视频,构建起了一个数字人:AI Yoon。
 AI Yoon 不仅是一个静态展示的数字人,而且具有一定的互动能力,自今年 1月开始,数以万计的韩国网民向这个数字人提出了各种问题。
法新社称这是一场「深度伪造的民主行为(Deepfake democracy)」,能够实现这场行动也是因为韩国法律允许 AI 候选人参与竞选。现在留给世界的一个命题是:当各国政治家千方百计宣扬自己「更真实」的时候,一个虚假的数字人会如何改变政治的游戏规则?
沿着 Deepfake 的话题,上周一则乌克兰总统泽连斯基宣布「投降俄罗斯」的 Deepfake 视频被广泛传播,很难确定这个视频的创作者是谁,但这一类视频显然具有极强的传播力,虽然包括 Meta、Youtube、Twitter 在内的网站已经删除该视频,但依然可以在一些平台上看到。
加州大学伯克利分校的教授 Hany Farid 谈到分辨类似视频的几个关键点,其一是视频声音的清晰度,特别是伪造某些领导人讲话的场景里,一般会通过声音清晰度差来掩饰视频的虚假;其二,关注视频里的人物动作,尤其是讲话的人有没有肢体动作;其三,关注视频里的画面动作连贯性,Deepfake 视频都是一帧一帧地制作,因此很出现画面过渡不自然的情况。
视频之外,由于利用 GANs 生成照片的成本越来越低,社交媒体上的假照片——特别是假头像——也越来越多,一款由 AI 创业公司 V7 Labs 发布的照片检测工具上架 Chrome 商店,其检测准确率高达 99.28%。这个工具的原理针对 GANs 进行的逆向工程,因此其局限性也存在,那就是无法应对非 GANs 生成的照片。
来看两份调查报告,Gartner 在对一组美国消费者的调查后发现,有 70% 的美国消费者希望可以在工作中使用 AI 技术,受访者在 9 类工作中的态度如下:
 而在另一份由 Future Today 基金会发布的报告里,AI 对于不同职业的影响可能与我们想象的不一样,诸如软件开发者、律师助理等职业都会受到冲击,这与之前我们一直以为的蓝领工人——卡车司机、搬运工——会被 AI 取代的想法不相符,「因为这些职业的变动很大」,该基金会负责人 Amy Webb 如是说道。
 根据这份报告,随着大量无代码/低代码平台以及 RPA 技术的成熟,未来十年知识工作的形态也会发生根本变化,感兴趣的朋友可以在这里获取该报告。
还是低代码,NYT 上周梳理了一组 AI 领域的低代码工具,尽管当下这些工具还有诸多不足,但计算机发展的历史,某种程度上也是不断「让代码变少或隐藏」的历史,这是我看好的未来。
|