☕️ Editor’s Note

今天是 2023 年 4 月 24 日,您看到的是第 159 期 iPad Power User。

本期「流程」专栏分享如何与大语言模型「共同思考」,结合我的实践:

  • 为什么使用 Poe 访问大语言模型?
  • 结合三个场景展示大语言模型如何帮助内容生产者思考?
  • 大模型使用的经验和教训;

本期 iPad Power User 还将关注:

  • 发现:iOS 开源输入法「仓」输入法;
  • 更新:Bear 新价格、Proton 密码管理工具、一组 AI 驱动的应用更新;
  • 系统:iOS 17「侧载」传言、开箱一台 4 万美金的第一代 iPhone 等;

接下来,欢迎和我一起探索关于数字工具的所有可能。

流程·洞察


与大语言模型「共同思考」的工具、场景与教训

作为以文字谋生的内容生产者,面对 ChatGPT 等大语言模型可谓五味杂陈:我知道这一类工具将极大降低内容——从文本到图像到视频——的生产门槛,甚至可能重塑内容产业的全流程;当然我也知道,在接受 ChatGPT 等大语言模型的优缺点之后,通过与这类工具的「协同」,不仅能够有效提升内容生产的效率,还会创造出一层全新的人机关系。

此前的一期会员通讯里,我谈到「如何让 ChatGPT 帮我阅读文章」。而在这个「人类时间一天,AI 进化速度一年」的时代变革背景下,之前的这个流程已经过时,而且存在一些无法解决的问题,特别是在经历了几次错误总结文章大意之后,我也意识到一点,仅仅依靠大模型去处理文章——包括阅读、总结——非常不靠谱,如果再加上人类校对、核实的时间,整个工作流程并没有带来效率的提升,反而增加了大量无谓的时间消耗。

也因此,我开始重新思考大语言模型在我工作中的定位,并逐步细化了一些流程,本期的「流程」专栏,我会向大家汇报近期的一些探索,供各位参考。

1.工具选择

访问大语言模型的方法有很多,举几个例子:

  • 通过官网,注册账户后直接访问网页版,这是 ChatGPT、文心一言、通义千问的一般访问方式;
  • 利用自己或第三方 API 搭建的网页访问大模型,一定程度可以避免网络问题;
  • 将自己或第三方的 API 集成到某个特定场景工具,比如浏览器的翻译插件里;
  • 使用开发者完全封装的服务,比如 Slack 里的 Claude 模型或者 Poe 里的一大堆模型;

我更倾向于「使用开发者完全封装的服务」,这里重点谈谈 Quora 出品的 Poe,它目前聚合了 OpenAI、Anthropic 两家公司的多个模型,还包括搜索引擎公司 Neeva 的搜索模型:

  • OpenAI 的模型:Sage、ChatGPT、Dragonfly、GPT-4(有限访问,需付费);
  • Anthropic 的模型:Claude+(有限访问,需付费)、Claude-instant;
  • Neeva AI:类似于新 Bing 的搜索模型;

其次,用户无需再去额外注册或申请 API,可直接免费通过 Poe 与众多大模型进行互动,特别是 Anthropic 公司的大模型 Claude+,目前几乎没有几家公司提供这个模型服务。

第三,Poe 最近发布了「自定义对话机器人」功能,可通过提前设置的提示词,设置一个个面对特定场景的机器人,比如设置一个中文翻译机器人,提示词就是「翻译成中文:」,目前可调用的模型是「Claude-instant」和「ChatGPT」:

img

鉴于 Poe 里丰富的模型选择、合适的价格(20 美元/月)以及便捷的访问方式(利用网页实现真正意义的跨平台),我现在已经完全转向了 Poe,如果没有使用 API 的必要,我非常建议各位通过 Poe 访问当下最流行的大语言模型。

2.与大语言模型共同「思考」

大语言模型某种意义是一类统计模型,我们不应该将其作为问答、搜索事实的工具。在 GPT-4 发布之后,「推理」成为大模型应用的重要场景,简单来说,就是用户通过输入一定的信息,让大语言模型「思考」之后输出相应结果,用户结合结果进一步优化输入,以此形成「共同思考」的流程。

比如在「翻译」的场景里,我会将一段英文或法语内容复制粘贴到 Poe 的「翻译机器人」里进行翻译,接着使用「翻译的太生硬了,再修改和润色一遍」之类的提示词,让「翻译机器人」提供第二版翻译,如果觉得还是不好,可以继续使用类似的提示词优化翻译:

img

另一个场景,我经常遇到众多新闻线索堆在一起的时候,此前我需要利用思维导图或 Workflowy 之类的大纲工具进行整理和思考,寻找这些线索之间的潜在关系,以确定是否值得继续挖掘,现在我的工作流程是:

  • 手动将新闻线索整理成简洁表达的文本;
  • 将这些文本交给 ChatGPT 之类的大模型;
  • 使用「分析这些线索之间的关系」之类的提示词;
  • 结合输出的结果,再输入一些背景资料,进一步优化这些关系;

img

这个过程并不轻松,我的工作包括:

  • 发现新闻线索
  • 找到这条线索的关键
  • 总结新闻线索和背景资料

而 ChatGPT 会结合这些线索、背景资料,梳理出一些潜在的逻辑关系或选题方向供我选择。至少对于我这样的内容生产者来说,这样的互动过程并不比一场选题沟通会的效果差,我所面对的是一个无所不知但又经常胡说八道的「奇怪同事」,我需要通过合适的词汇引导他到合适的方向,并且沿着我的思路「帮」我想出更好的选题

第三个场景里,我会尝试让 ChatGPT 等大模型生成草稿,我个人很喜欢《金融时报》的 Lex 评论专栏,所以试图让 ChatGPT 帮我模仿 Lex 专栏的风格,评论一些产业事件。

这个过程涉及到很多前期的准备工作,比如需要让大模型了解 Lex 专栏风格是什么,再比如要整理一些评论的素材,我们不能用类似「使用 Lex 专栏风格评价 ARM 即将发布自己的芯片」这类提示词,而是要结合具体事件或新闻,将一份详细而简洁的文本交给大模型:

img

坦率来说,第一版的草稿并不适合直接发布,但我可以通过补充背景资料、调整语气表达等方式,不断优化这个草稿,最终有可能(请注意是有可能)变成一篇兼具权威性与可读性的商业评论。

3.教训与经验

请注意我在这篇专栏里多次使用「可能」,原因在于这类大语言模型的输出存在巨大不确定性。即便是输入同样的提示词和同样的背景资料,每一次生成的结果都存在差异,很多时候得到的结果截然不同,这也让我一度陷入越使用这类模型越恐惧的状态,因为我不知道我每次输入之后得到的结果是惊喜、惊吓还是失望,这个问题短期内无解。

其次,互联网上海量的「提示词」技巧也在制造一种误读,认为只要通过所谓「咒语」就能「唤醒」大语言模型的能力,目前最流行、也是最傻的一类提示词是在 ChatGPT 里使用「请假装你是 GPT-4」,然后进入互相欺骗的对话里。

但结合我的实践来看,我们更应该把大模型放在特定信息处理的场景里——通过输入优质信息,换取大模型输出的优质信息。这意味着,除了提示词,我们——人类——依然需要花费时间和精力整理一些「喂」给大模型的信息,结合大模型输出的信息进行调整、优化信息,并在一次次互动的过程中获得适合当时与当地的洞察——千万不要幻想大语言模型会给出适用一切场景的万能方案。

最后一点教训是,如果能力或场景允许,请使用英文提示词和背景资料进行输入,你得到的当然是英文回答,但却是更高质量的答案。

应用·发现


仓输入法

重新回到 macOS 之后,我又捡起来了基于 Rime 输入引擎的「鼠须管输入法」,我在之前的会员通讯里谈到:

这款输入法完全基于本地,支持丰富的自定义功能,而其缺点就是所有功能都需要自己配置,包括常用的词库,推荐一个实用的教程,可以以最快的速度部署、使用「鼠须管输入法」,至于词库嘛,慢慢养吧。

而在 iOS/iPadOS 平台,最近发布的「仓输入法」带来很多惊喜。

一方面,这款输入法基于「中州韻輸入法引擎/Rime Input Method Engine」,能够适配其他平台上——比如 macOS 鼠须管输入法——的输入法,由此带来的是,我可以把 macOS 的输入法配置一键、无缝迁移到 iPhone 上面,开发者也提供了相应的导入功能:

img

其次,这款应用还提供了「配置文件修改」功能,修改相应文件后,能够快速部署应用。

img

第三,开发者完全开源了这个产品,整个源代码托管在 Github,开发者和一众有技术的用户不断打磨产品,最近一周的更新频率明显加快,在修复众多 Bug 的同时,也在增加一系列新功能,比如中英文切换、输入法切换等实用功能。

未来,我也希望仓输入法可以提供备份、同步机制,这样就能更方便实现各个平台的输入法——不仅是词库,还包括输入习惯——的同步,最重要的是,所有这些都不是以隐私为交换。

你可以在 App Store 免费下载这款输入法。

应用·更新

Proton 公司推出密码管理工具 Proton Pass ,提供用户名/邮箱、密码和安全笔记的端到端加密机制,甚至连密码相关的诸如网址也涵盖在端到端加密的范围内。另外用户也可以借助这款工具快速生成随机邮箱,以代替自己的真实的邮箱,避免邮箱地址泄露。

关于这款密码管理工具的安全机制,可参见 Proton 的官方博客

目前这款应用仅限 Proton 终身会员和 Visionary 会员使用,但根据该公司的说法,未来开放给所有用户。

笔记工具 Bear(熊掌记) 宣布新价格体系,在 2.0 版本即将发布的时候,Bear 团队调整了这款笔记产品的订阅价格,由原来 1.99 美元/月上涨到 2.99 美元/月,年度订阅也从 19.99 美元涨到 29.99 美元。

对于此前的订阅用户,Bear 给出了相应的说明:

  • 此前已经订阅 1.0 版本的用户,保持价格不变;
  • 如果用户近期订阅 Bear 高级版本,也延续此前价格;

Bear 高级版本提供了诸如 iCloud 同步、更多主题以及导出格式等功能。

结合我在最近使用 Bear 2.0 测试版的体验来看,新版本的 Bear 的定位没有发生太大变化,它在诸多领域,比如应用颜值、交互逻辑等方面依然优秀,并且优化笔记编辑的场景,提供了目录、标题折叠等一系列实用功能,足以应对一般化的笔记场景;但在另一些领域,比如没有跨平台功能,无法在非苹果生态的设备上使用,也缺乏类似 Obsidian 等新一代笔记产品强大的扩展能力。

对于不满 Bear 更新策略的用户,如果你不想为 iCloud 同步或主题订阅付费,而是仅仅需要可以同步的笔记工具,不妨试试 Bear 的平替 FSnotes,这是一款开源笔记应用,面向 macOS 和 iPadOS/iOS 两大平台,价格方面:

  • macOS 平台:3.99 美元买断制;
  • iPadOS/iOS 平台:2.99 美元买断制;

我推荐 FSNotes 替代 Bear 的最大原因是其支持 Textbundle 导入,这使得我可以把 Bear 里的文本、图片整体迁移过来。除此之外,FSNotes 还完整支持 Bear 的标签体系,并且也适配了流行的 Wiki 链接等。

相比于 Bear 等笔记应用采用 CloudKit 的数据同步方式,FSNotes 使用 iCloud Drive 同步所有的笔记,这使得所有的笔记数据都可以公开访问,不过两种机制并没有好与坏之分,更多还是取决于用户的使用习惯。

你可以在 App Store 购买 FSNotes。

近期一大批应用都推出基于大模型的 AI 功能:

  • 办公软件 WPS 宣布即将推出 WPS AI,官方的演示来看,这项功能具有生成文档、进行多轮对话、对已有内容进行加工再处理、总结现有文档内容等;
  • 印象笔记桌面版本正式发布「印象 AI」功能,其基本功能与 Notion AI 无异,有趣的地方在于,印象笔记强调该功能是自研,「基于印象笔记自研的轻量化大语言模型大象GPT和国内外大语言模型相结合的混合模型方案」;
  • 任务管理工具 Todoist 推出三项 AI 驱动的新功能,包括任务建议、任务完成后的提示以及任务表述的优化(使其更具可操作性)等,目前仅限于桌面端或网页版;

系统·硬件

开箱第一代 iPhone,知名科技视频博主 Marques Brownlee 分享了购买、开箱这台售价 4 万美元的第一代 iPhone 全过程,他说,「我几乎一点也不后悔」。

HomePod 更新。根据苹果的说法,现在的 HomePod 全系产品可以识别烟雾或一氧化碳报警器的声音,并在听到警报后向用户的设备——比如 iPhone、iPad、Apple Watch 等发通知,该功能还能与其它 HomeKit 设备联动,帮助用户收听报警音或查看室内情况等。

iOS 17 会支持「侧载」吗?Bloomberg 记者 Mark Gurman 的消息称,为了应对欧盟的《数字市场方案》,苹果或将在 iOS 17 里提供应用「侧载」机制,这意味着,App Store 不再是 iPhone/iPad 应用下载的唯一来源,用户可以像 Android 用户那样从其他平台下载应用,然后将其安装到自己的设备上;对开发者来说,「侧载」可以避免向苹果缴纳所谓「苹果税」,自己应用内的收入无需再给苹果分成。

苹果公司此前反复强调「侧载」的危险,去年库克表示,政策制定者正在以竞争的名义采取措施,迫使苹果公司允许 iPhone 上的应用通过「侧载」的方式绕过 App Store,「这意味着,那些对数据贪婪的公司将能够规避我们的隐私规则,并再次违背用户意愿追踪我们的用户」,库克说道。

不过最新的消息显示,即便苹果推出了类似「侧载」的功能,也仅仅面向欧盟用户提供,暂不清楚苹果如何区分不同地区的用户(Apple ID 的地区?),而且苹果也可能会向那些计划在 App Store 之外提供应用下载的开发商收取额外的费用。

以上就是本期「iPad Power User」的全部内容,再次感谢您的支持,有任何问题或建议,欢迎写邮件给我:zhaosaipo@gmail.com 

这封邮件是 Dailyio 的付费邮件,但我欢迎您将这封邮件转发
给您身边关注数字工具生产力的朋友。并希望您向更多人推荐 Dailyio。
更新您的邮箱信息
查看网页版本
点击这里退订