大模型重塑云和芯片行业、OpenAI 新方向与开源选择、大模型的金融应用

☕️ Editor’s Note

今天是 2023 年 4 月 20 日，您看到的是第 164 期 AI Insider。

本期围绕三个角度，关注大模型领域的关键事件与产业动态：

大模型与产业链：云计算和芯片公司如何应对大模型的挑战；
大模型与市场：OpenAI 的新方向、马斯克加入战局以及开源大模型的发展；
大模型的争议：金融领域应用大模型的不确定性、各国应对大模型政策及 OpenAI 神秘的「红队」等；

大模型·产业

大模型正在深刻影响到科技产业链。先看云计算，AWS 上周公布了其一系列大模型的产品布局，包括：

云上大模型调用平台 Bedrock，该平台集成了诸如以色列公司 AI21 实验室、OpenAI 直接竞争对手 Anthroic 以及 Stability AI 等公司的模型；
推出 AWS 自研的大模型 Titan 基础模型服务，目前可以通过 Bedrock 获取；
发布 CodeWhisperer，这是一个类似于 Github Copilot 的编程助手，现阶段免费；

近几个月，在微软、Google 相继发布对话机器人并争相通过大模型相关功能改造产品的背景下，AWS 也一直在「默默」努力，几个值得注意的事件：

2022 年 11 月，AWS 成为明星创业公司 Stability AI 的首选云计算合作伙伴；
2023 年 3 月，AWS 与 Hugging Face 合作，将后者的文本模型引入到云平台；
2023 年 4 月，AWS 成立一个面向生成式 AI 创业公司的加速营，提供诸如计算资源、创业辅导等一系列创业服务；

此番通过 Bedrock 等产品，AWS 初步构建起了云计算公司应对大模型机遇和挑战的框架。

截至目前，主要云计算公司们对于大模型的产品布局和发展策略包括两大类：

以微软、阿里云、百度为代表，通过自己（或投资公司）的单一大模型改造现有产品，并集成到各自云服务里，为行业客户提供相应产品；
以 AWS 为代表，没有过多强调自己的大模型能力，而是希望构建起一个基础服务的平台，变成「大模型领域的中立服务商」；

无论是哪一类布局或策略，通过大模型——包括但不限于文本、图像——完成原有应用或服务的改造，会成为接下来大模型落地的重要看点，推荐一份来自咨询公司 Accenture 的分析报告，展示企业如何从「消费大模型」到「定制大模型」的转变，这其中有巨大的产业增长机遇。

其次，大模型催生巨大的计算需求，这对深陷行业周期的芯片公司而言是巨大利好，也难怪有媒体直言，阿里百度一定程度都是英伟达的「打工人」——毕竟，高性能的 AI 芯片独此一家。巨大的算力需求，也让 AI 芯片再一次供不应求，这不仅影响到大量创业公司，也让一些云计算公司的 AI 服务变得极其紧张。

由此也不难理解 Google 与微软之前释放的消息：

Google 通过论文展示新一代 TPU 的进展，作为第四代自研芯片产品，Google 将 4000 颗 TPU 串联组成了一台超级计算机，其性能与能耗相较于英伟达 A100 芯片驱动的超级计算机都有大幅提升。
微软介绍了自家超级计算机如何驱动 ChatGPT 大模型训练，这和 Google 此番强调 PaLM 模型在 4000 颗 TPU 驱动的超级计算机上训练 50 天的说辞几乎一致。

以及，数据中心网络芯片巨头博通也在本周发布一款 AI 芯片，这款名为「Jericho3-AI」的新芯片，可将多达 32000 个 GPU 连接在一起，从而构成强大的算力基础设施，由此，博通为那些不愿意使用英伟达 Mellanox 方案的公司提供了新的选择。

最新的消息是，微软自 2019 年就在秘密推进一款代号为「Athena」的 AI 芯片研发，目前有 300 人参与这项工作，该芯片面向大模型训练的场景，独家的消息源称，目前还不确定未来这款芯片是否通过 Azure 云服务向其他客户提供。

通过面向特定场景推出自研 AI 芯片，一方面能够降低大模型的训练、推理成本，未来也会帮助巨头们开启「大模型的 API 价格战」，从而获取更大市场份额；另一方面，自研芯片也会减少对英伟达高性能芯片的依赖，更好应对新一轮「缺芯」周期。

大模型·市场

新玩家。伊隆·马斯克的新 AI 公司「X.AI」已经成立，根据文件，马斯克是该公司唯一在册的董事，马斯克家族办公室主任 Jared Birchall 是该公司的秘书。FT 援引消息人士的话称，马斯克一直从包括 Alphabet 在内的众多公司挖人，并暗中购买了大量来自英伟达的 GPU ，用于接下来的大模型训练。

与此同时，马斯克还通过福克斯电视台宣称，自己要打造一个「TruthGPT」，这是一类「试图理解宇宙与真相的人工智能」。

新方向，OpenAI 创始人 Sam Altman 公开表示，依靠堆积模型参数提升模型能力的时代基本结束，未来需要更好的策略或方法，这个表态背后至少有两层考量：

大模型的训练成本持续上涨，Altman 称算力上涨存在物理限制；
参数规模带来的恐慌，可能会给行业发展带来监管压力；

无论是哪一种可能，大模型接下来的发展速度可能不会像之前那么快，但基于现有模型与更好的方法的结合，或许能进一步释放大模型在众多行业的价值。

另外需要注意的是，Sam Altman 确认，OpenAI 并未开始研发 GPT-5，同时该公司计划扩大日本的业务。

新市场。福布斯上周发布了 AI 领域最具潜质的 50 家创业公司「AI50」榜单。今年的榜单里，差不多三分之一的公司拥有生成式 AI 相关的业务，这其中，既有握有大量微软投资的 OpenAI，也有还未获得公开投资的 Midjourney、Surge AI 公司——当然，这两家公司接下来一定会获得巨额融资。

除此之外，包括 Anthropic、Inflection、Runway 等明星公司都入围榜单。另外还有一些「老牌」的创业公司，比如数据标注公司 Scale AI、数据平台公司 Databricks 也受益于生成式 AI 的良好发展态势，这类「淘金热里卖工具」的公司，永远有市场。

继续谈新市场，与 GPT-4 等闭源模型相互应的还有一系列开源模型，截至 4 月 20 日，以下五个开源大模型值得关注：

Meta 的 LLaMA；
基于 LLaMA，斯坦福大学推出了 Alpaca；
同样也是基于 LLaMA，包括加州大学伯克利分校在内的研究者发布的 Vicuna；
Databricks 公司推出的 Dolly；
LAION 机构开源的 Open Assistant，这个项目的详细介绍可参见这里；

另一个与大模型息息相关的市场信息是，Reddit 将对使用该社区数据进行大模型训练的公司收费了，Reddit 公司创始人兼 CEO Steve Huffman 表示，Reddit 的数据库真的很有价值，「但我们不需要把所有这些价值都免费提供给一些全球最大的公司」。

此举或将对大模型的发展产生深远影响，此前在一系列大语言模型的训练数据里，一些主要社区（比如 Reddit）、Wiki 站点（比如维基百科）的数据质量相对较好，但包括 OpenAI 这样的公司，都在免费使用这些数据，然后将大模型变成付费产品（API），从这个角度去看，Reddit 向 OpenAI 等大模型服务商收费，也是情理之中的事情。

大模型·争议

大模型在众多行业的应用存在巨大不确定性，比如金融领域，尽管华尔街对于投资算法、预测模型的追逐由来已久，但大语言模型之于金融，特别是投资场景的局限性很大：

数据量有限：不同于常规大模型能够使用海量的数据进行训练，金融市场的数据量并不大；
数据噪音太多：金融市场的数据总量虽然不大，但大量数据相互关联，而且实时动态变化中，很多数据信号转瞬就变成了数据噪音；
模型决策的风险大：利用大模型投资带来的风险，可能不会比完全相信自动驾驶汽车的风险更小，依然需要非常多的人力干预。

当然，我们不能静态地看待问题，大模型的发展还处于初期阶段，假以时日，新的算法或许能解决上述难题，全面改变金融行业的游戏规则。

至少在现在，大模型已经成为投资银行客户经理定制专业信息的新方式，通过自动化、定制化的金融信息，获取更多客户的青睐，金融行业的变化其实已经开始。

两篇论文探讨大模型带给社会经济与环境的影响：

以美国劳动力市场为例，大语言模型会深刻改变经济发展结构，特别是通过大模型提升效率方面的数据非常惊人，这个数据仅限于美国，各位可酌情参考；
研究者预估，微软美国数据中心训练 GPT-3 的过程会消耗大约 70 万升的水，这些水用于冷却数据中心，相当于生产 320 辆特斯拉电动车或 370 辆宝马汽车的用水量；

国家层面对于大模型的监管也在持续加码中：

中国：网信办发布《生成式人工智能服务管理办法（征求意见稿）》公开征求意见的通知，其中第六条：「利用生成式人工智能产品向公众提供服务前，应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续」；
加拿大：政府隐私专员办公室已开始对 OpenAI 展开调查，原因是 OpenAI 在未经用户同意的情况下利用和使用他们的个人信息。该办公室成是在接到投诉之后开展的这项调查；
美国：FTC 多位官员在国会听证会上表示，ChatGPT 等工具可能产生各种欺诈消费者的行为，部分企业以算法黑盒子为由是在逃避责任；
欧盟：负责起草欧盟《人工智能法案》的立法者称，计划增加新法律条款，以更好应对近期基础大模型快速发展带来的各种挑战，该法案预计将在 5 月进行投票；

公司层面，Google Bard 一直在更新，Bloomberg 的独家信息称，在 Bard 上线前，Google 内部员工测试之后给出的评价很低，而负责评估 Google AI 产品是否符合道德伦理规范的团队也已经失去权力，该团队被告知不能阻碍正在开发阶段的任何一个生成式 AI 产品。

就在本周，资本市场因三星手机或将使用 Bing 搜索替代 Google 作为默认搜索引擎的信息引发震动，Google 母公司 Alphabet 股价一度下跌 3.5%，由此也能看出市场对于 Google 未来发展的担忧。

最后看看 OpenAI 内部用来评估大模型风险的「红队」，FT 采访了十几位加入 GPT-4 模型「红队」的成员，他们主要在美国或欧洲，职业包括学者、教师、律师、安全研究员等。

在 GPT-4 上线前，这些成员通过各类极限性或充满伦理道德甚至法律风险的问题「攻击」GPT-4，并将结果反馈给 OpenAI，以进一步提升大模型的安全性。其中一个案例：一位名叫 Andrew White 的大学教授利用 GPT-4 寻找一种神经毒剂，该模型推荐一种可以充当化学武器的化合物，并使用「插件」为提供了新的信息来源，包括科学论文和化学制造商目录，然后还帮助他找到了制造这种化合物的地方。

而 GPT-4 上线后，这种情况已经不会再出现了。

以上就是本期「AI Insider」的全部内容，再次感谢您的支持，有任何问题或建议，欢迎写邮件给我：zhaosaipo@gmail.com

这封邮件是 Dailyio Pro 及 Premium 的专属内容，但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。

更新您的邮箱信息
查看网页版
点击这里退订