我曾经多次谈到合成数据在 AI 技术落地中的重要价值,除了最常见的图像领域,合成数据还在文本/语言领域拥有众多应用场景,比如保险公司 Anthem,通过与 Google Cloud 合作,生成了大量的合成文本数据,以训练和改进该公司自动化保险系统;基因公司 Illumina,也尝试在基因编辑领域引入合成数据,在保护隐私的同时提高其产品的准确性。
图片网站 Getty 宣布禁止售卖通过 AI 生成器(比如 DALL-E)创造的图片,根据该公司 CEO Craig Peters 的说法,禁令是出于对 AI 生成内容合法性的担忧,包括图像、图像元数据的版权都可能会引发后续的版权问题。
目前尚无明确的法律条文涉及 AI 生成图片的合法性,但正如 Verge 所言,Getty 公司如何鉴别这些照片也会面临一系列技术挑战。