GPT-4 的三个新变化、开源如何改变游戏规则、投资 AI 公司的方式

☕️ Editor’s Note

今天是 2023 年 3 月 15 日，您看到的是第 159 期 AI Insider。

本期 AI Insider 是大语言模型特辑，从刚刚发布的 GPT-4 的三个变化谈起，探讨大模型领域闭源与开源的关系，以及开源大模型正在产生的影响，最后关注大模型的企业应用与疯狂的 AI 创投市场。

接下来，欢迎和我一起复盘围绕计算与智能的产业动态。

尽管此前已经有多个爆料，但 GPT-4 正式发布的消息还是引发诸多讨论，结合 OpenAI 给出的新闻稿来看，此次更新不再过度强调参数规模，而是重点展示其能力，既包括对图像输入的支持（暂未开放 API），也包括应对众多人类社会的能力测试，比如接近满分的 GRE、700 分的 SAT 成绩单等。

更进一步，GPT-4 的逻辑推理能力继续增长，在律师模拟考试里，GPT-4 能够进入到前 10%，而基于 GPT-3.5 的 ChatGPT 大概只能排在倒数 10% 的名次。

这份成绩单也让英伟达 AI 科学家 Jim Fan 感叹：GPT-4 完全可以向斯坦福大学提交入学申请。

不过，这种基准测试到底意味着什么还存在一定争议，NYT 计算机教授 Gary Marcus 指出，「benchmarks ≠ robust intelligence」，原因在于，GPT-4 的做题方式和人类测试的方式完全不同，由此宣传很容易给公众产生误导。

其次，GPT-4 谈论了很多大模型落地的案例与方法。比如鼓励开发者或企业快速调取 GPT-4 的 API，虽然目前还有额度限制，但已经展示出不俗的进步。

再比如，GPT-4 的新闻稿网页集中介绍了多家公司或政府的实践案例，包括语言学习应用 Duolingo、金融服务 Stripe、金融巨额摩根斯坦利以及爱尔兰政府等，这进一步凸显出大语言模型的巨大应用前景，也是 OpenAI 商业化运营的阶段性成果。

特别提醒的是，微软新 Bing 已经更新到 GPT-4。

第三，GPT-4 也在提升对「越狱」的屏蔽能力，官方给出的数字是：根据内部测试，对不合规内容的响应请求减少了 82％，响应准确度增加了 40％。这个数字更多还是为了市场宣传，实际应用中能有多少变化，还需要在后续测试中继续观察。

对于 OpenAI 来说，保持 GPT 系列大模型闭源是其商业模式，但有闭源就一定有开源。上月，Meta 向研究者开放了多个大语言模型 LLaMA（参数规模从 70 亿到 650 亿），这个模型很快就被泄漏，换句话说，它成了一个「被开放」的大语言模型，由此也掀起了一系列优化大模型的潮流：

一位名叫 Georgi Gerganov 的软件开发者写了「llama.cpp」工具，使得该模型可以运行到 M1 芯片的 Macbook 上，另一些开发者把该工具迁移到 Windows 平台；
通过 Pixel 6a 运行大模型的 Demo 也在 Twitter 上被热议；
还有开发者尝试将大模型放在树莓派上运行，速度虽然慢点，但也能输出一些结果；
斯坦福大学基于 Meta 泄漏的模型推出 Alpaca 7B，这是一个可媲美 OpenAI「text-davinci-003」能力的模型，其硬件要求大幅下降；

我们有理由相信，基于开源社区的机制，这一系列面向大模型优化的趋势不会停止，我们也有理由相信，运行大模型的硬件条件会越来越低，从只能使用英伟达昂贵的 A100 GPU 到仅需 CPU，如此快速的变化会让大模型领域的未来更具戏剧性：

以 OpenAI、Anthropic 为代表的公司，基于英伟达强大的 GPU 能力，继续研发闭源模型，并通过和巨头（微软、Google、亚马逊）的合作，向企业级客户提供 API 等产品；
以 Meta 为代表的公司（也包括部分高校）通过开源、开放的形式将大模型交付给研究者或开发者，在开源机制的帮助下不断迭代，进一步降低硬件需求，并推动新的创新机会；

而随着大模型硬件需求的持续下降，对处在高端芯片限售危机中的中国公司来说是一大利好。

关注大语言模型在企业市场的两个应用场景：

值得一提的是，微软将在美西时间本周四举行一场关于 AI 与未来办公的主题活动，微软 Office 套件如何与 OpenAI 相结合会成为一大看点。

ChatGPT 持续推动 AI 创投市场的火热，一家仅有四个前 Google 工程师的 Mobius 公司，在没有任何产品甚至规划的情况下，一周内得到 a16z、Index 的投资，估值超过 1 亿美元，还被其他风险投资公司「围追堵截」。

NYT 梳理了近期获得融资的公司：

上述这些公司几乎没有产品，更谈不上商业模式，风险投资所看重的，既包括创业者的资历和经历（来自 Google、OpenAI 的工程师最受欢迎），也包括对所谓「赛道」的判断，特别是在元宇宙、加密货币等「赛道」衰退的行业背景下，资本需要新的流向，从而创造新的增长点。

不过对于资本以及一众创业公司而言，至少还需要克服两大难题：

这或许也可以解释某些风险投资公司的立场：与其投资 AI 创业公司，不如去购买那些押注 AI 的科技巨头们的股票。

以上就是本期「AI Insider」的全部内容，再次感谢您的支持，有任何问题或建议，欢迎写邮件给我：zhaosaipo@gmail.com

这封邮件是 Dailyio Pro 及 Premium 的专属内容，但我欢迎您将这封邮件转发给您身边关注或从事 AI 与云计算的朋友。

更新您的邮箱信息
查看网页版
点击这里退订