今天是 2023 年 5 月 15 日,欢迎阅读第 166 期 AI Insider。
本期聚焦于大模型相关领域的发展,包括:
在接下来的内容中,我们将一同复盘近期围绕大模型的产品动态与行业格局。
2023 年 Google I/O 大会的关键词——或者说唯一关键词——是 AI,从基础大模型到落地应用,Google 此次全面展示了自己的积累:
更进一步,Google 还为办公套件 Workspace 里的一系列由 AI 衍生的产品创新统一命名为「Duet AI」,直接对标微软 Copilot。
相比于之前匆忙上线的 Bard,此番 Google 的产品策略显得沉稳许多,一系列布局背后有诸多值得探讨的方向:
而在产业层面,大语言模型的研究与应用处于相对早期的阶段,此时去判断谁会赢得胜利还为时尚早,我个人更关注以下几点:
Anthropic 公司宣布新版本 Claude 模型支持 10 万 Token 的上下文响应能力,这意味着该模型可完成 75000 个英文单词(约合 15 万中文汉字)文本内容交互,就像 Anthropic 官方博客所言,你可以直接将一本《了不起的盖茨比》交给 Claude 模型处理,然后询问任何一个与小说相关的问题。
Anthropic 的新模型也让大模型上下文处理能力的军备竞赛进入一个新阶段,此前 OpenAI 的 GPT-4 最高可以支持 32000 个 Token(或者 32k),随着 Claude 100K Token 的发布,我们有理由相信接下来 OpenAI 也会跟进。
更多的上下文 Token 能力能够一定程度延伸大模型的应用场景,比如法律文件或者公司 IPO 招股说明书等,普通人需要花费几个甚至十几个小时才能处理完毕,但借助大语言模型,可以将处理时间降低到以分钟甚至秒来记,由此带来的是巨大的效率提升。
不过,外界对 Anthropic 新模型还有诸多疑问,一方面是如何接入,目前普通用户或企业还无法直接接入该模型(你可以在这里申请该公司的 API);另一方面是价格不透明,但一定会非常昂贵。
如果你想体验 Claude 100K Token,可以订阅 Poe 高级套餐,每月 19.99 美元或者 199 美元/年获取这项服务。
一组大模型产品层面的更新:
即便一季度美国风险投资下降超过 5 成,但 AI 领域的资本流动还是非常活跃,WSJ 整理了最近一组投资:
更疯狂的一个项目是一家名叫「Essential AI」的公司,该公司两位创始人是曾在 Google 工作的研究人员 Niki Parmar 和 Ashish Vaswani,在没有客户甚至商业计划的情况下,已经完成一笔 5000 万美元的融资。
与此同时,「文本生成图像」创业公司 Runway 完成 1 亿美元融资,估值达到 15 亿美元。值得注意的是,此次投资 Runway 公司的是一家「云计算公司」,这与市场其他公司的融资来源很不相同,但也从一个侧面展示了云计算相关的资源——算力、服务——对于生成式 AI 创业公司的吸引力。毕竟,一块英伟达 A100 芯片不仅价格昂贵,而且还很难能买到,而背靠一家云计算公司,能够在计算层面得以充分的供应。
刚刚发布财报的软银,也在关注 AI 领域的投资,根据软银首席财务官后藤芳光的说法,软银不会错过投资 ChatGPT 等新兴技术的机会:
我们正准备在即将到来的人工智能革命中发起攻势。
资本不仅涌入创业公司,还在影响二级市场,最新一篇 NBER 的论文指出,结合美国上市公司的数据来看,在 ChatGPT发布后,那些高暴露于生成式 AI 的公司相较低暴露公司,每日股票的超额回报高出 0.4%,这相当于 100% 的年化回报率。
比如 Palantir 公司,这家因参与抓捕本·拉登而声名鹊起的公司,显然进入到一个高速车道,该公司一季度营收同比增长 18% 至 5.25 亿美元,预计 2023 年每个季度都会盈利,消息发布后,股价再度上涨 20%。
关注一组大模型在各个行业的应用:
大模型带来的数据安全问题被愈发重视,三星已经明确规定,禁止员工在工作设备上访问 ChatGPT、Bard 等服务,「你不应该把公司相关的信息发给 ChatGPT 之类的服务,就像你不能把公司秘密告诉 Alexa 一样」,这会成为一种共识。
此次由大模型驱动的 AI 浪潮,将对办公室白领人员产生重大冲击,下图展示了一个潜在的场景:
或许是这种恐惧感,下面两则新闻有了很多讨论空间:
欧洲议会上周投票通过围绕 AI 立法的一系列修正案,对于所谓基础模型(也就是 ChatGPT 等语言模型的底层模型)的透明性与数据隐私安全做出了一些规定,包括:
这些规定属于欧盟一项已经为期两年的 AI 监管法律草案的新内容,上周投票还增加了对于面部识别、预测性执法等技术的条款,接下来,欧洲议会将和各成员国进一步探讨更详细的的内容。
对于包括 OpenAI 在内的大模型公司来说,至少需要回答各国监管机构两个核心问题:
这两个问题也是不久前意大利政府禁止本国公民使用 ChatGPT 的理由,除此之外,限制用户使用生成式 AI 产品的年龄也是各国政府——比如意大利——的诉求之一,OpenAI 需要在今年 9 月 30 日前推出一个年龄限制,确保 13 岁以下的未成年人不能使用该服务,否则仍将面临意大利当局的禁令。
最后分享一份对部分无良媒体报道 AI 的批评,比如:
上述现象无所谓国界,也无所谓语言,在流量和点击的诱惑下,越来越多的媒体——或者是自动化的媒体机器人——正在批量制造上述类型的消息,或许,读者也需要一个检测标题党与垃圾新闻的 AI 机器人。
这封邮件是 Dailyio Pro 及 Premium 的专属内容,但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。