我让 ChatGPT 帮我买张去东京的机票,结果它把我送到了巴塞罗那……

产品

2023-05-18 15:59

在前天的文章中,我们介绍了 ChatGPT 开放的全新模式 Web Browsing(网页浏览),启用后 ChatGPT 就可以开始上网,收集最新的互联网资料进行作答。

今天我们再来讲讲 ChatGPT 另一个重要更新:插件集(Plugin)。

ChatGPT 可以利用插件调用最新的或特定的信息,执行一些特殊的操作。例如 OpenAI 曾经演示过让 ChatGPT 调用 Dall E 插件,实现文生图功能。

和 Web Browsing 一样,插件集也是仅面向 ChatGPT Plus 用户开放的 Beta 测试功能,需要在用户界面的左下角点击设置,然后按照以上步骤启用。

接着,在聊天界面上就会出现「Plugin Store」的选项,你可以在这里下载需要使用的插件,然后在聊天时即可调用该插件。

ChatGPT 列出了 8 个最热门的插件,分别是 AI 外语导师 Speak、分发神器 Zapier、订票租车 KAYAK、订餐工具 OpenTable、法规助手 FiscalNote、旅程制定 Expedia、食谱购物 Instacart 以及知识回答 Wolfram。

这 8 个风格工具可以说基本涵盖了 Plugin Store 的所有类型:教育类、工具类、生活类和检索类 。

目前在 Plugin Store 共上架了 86 个插件,这些插件怎么样呢?

先说结论:功能强大,但不算好用。ChatGPT 插件目前的交互方式并不符合大部分用户的使用习惯。

Plugin Store 并不像 App Store 那样,有详细的描述、演示以及用户评价,你能看到的就只是一个名字、图标以及简单的一句话描述。

以比较热门的 WebPilot 插件为例,从字面描述上看它是只是一个可以让 ChatGPT 读取链接的插件,但实际上这个插件相当于给 ChatGPT 装了一个浏览器,让它可以上网冲浪。

你可以问它一些实时的信息,或者用指定网站的信息来解答,例如「苹果股价是多少?」「用 Wiki 上的信息介绍任天堂」,它就能调用 WebPilot 找到答案。

更重要的是,ChatGPT 可以在一次回答中最多调用 3 个不同的插件,将不同的插件组合在一起就能创造出不一样的工作流。

例如博主 Derek Cheung 分享了一个工作流,他将 WebPilot 和 DiagramIT 组合在了一起,实现了把网页总结成知识导图的功能。

还有用户组合使用 WebPilot 和 Expedia,制定了一趟详细的旅程安排。

用上插件集后,ChatGPT 的能力确实拓展了不少,但这里有个前提:

你在使用插件时,要非常明确自己的需求,以及知道哪些插件能够帮你实现目的。

这就需要你花时间去探索各个插件的用途。对普通用户来说,这就是学习成本。

有个简单的小技巧可以帮你快速上手:你可以直接问它这个插件应该怎么用。

以国际象棋游戏 Chess 插件为例,在我提问后,ChatGPT 耐心了讲解了操作规则,以及一些小技巧(例如我可以让它帮我下棋)。

按照 ChatGPT 给出的规则,你可以用你的自然语言实现很多操作,这是其他应用给不了你的体验。

但问题又来了,ChatGPT + 插件的体验,会比我们熟悉的 app 更好吗?

目前 ChatGPT 有一大部分插件都是买票、订餐、租房等生活类插件,体验一圈后我发现,ChatGPT 远不能取代携程、美团等生活类应用。

ChatGPT 插件集主要有以下几个问题:

1. 使用 GPT-4 模型,反应速度很慢,并且还很容易出错宕机
2. 用上插件后依然会有「幻觉」问题,有一定几率产生错误答案

举个例子,我让 ChatGPT 使用最热门的订票插件 KAYAK 购买飞往东京的机票,ChatGPT 却说它找不到飞往东京的航班,并给我罗列了一些像巴塞罗那等与问题毫不相关的地点。

如果我把买票的工作全权交给 AI 的话,那后果不堪想象。

相比之下,在购票软件上直接买票要就有安全感地多——买到即是想要。

当我要求 ChatGPT 使用多个插件去统计双色球中奖的概率,它却表示自己搜索不到数据,即便我把相关的网站链接给到它,它也会出错。

这是 ChatGPT 独特的工作方式注定的结果:你可以用很轻松的方式问它问题,但它不一定能给你准确的结果。反映到插件集上,那就是:能用,但不一定管用。目前 Plugin Store 上的大部分插件体验基本都是这样。

有哪些插件是值得推荐呢?以下 5 个插件值得一试。

1. Wolfram

学术百科,可以帮你解答各种问题,绘图能力也很强大

2. WebPilot

ChatGPT 的浏览器

3. AskYourPDF

用 ChatGPT 处理 PDF 文件

4. ScholarAI

搜索最新学术论文

5. Show Me

根据数据制作图表

那么 ChatGPT 插件集的开发环境怎么样呢?

开发者 Astrian 跟我们演示了他正在开发的一个小插件:

通过调取游戏《明日方舟》的数据接口,ChatGPT 为你统计游戏里的抽卡结果。

如果把这个插件和可以画图表的 Show Me 插件结合起来使用,还能用它画出抽卡概率的饼状图。

Astrain 认为,目前开发 ChatGPT 的插件并不算特别方便,但是能够顺手解决一些简单的任务还是挺有意思的。

他用了一个形象例子来解释 ChatGPT 插件的工作原理:

开发者先写一份插件的 API 文档,让 ChatGPT 理解,然后它就会调用这个 API 来完成相应的任务。

开发者可以为开发的插件生成一个临时链接,分享给 15 个人(同样需要开发者账户)测试使用。按照官方的标准(如使用 OAuth 等)通过审核后,就能把插件上架到 Plugin Store。

在 Astrain 看来,要满足官方的这些标准的话,对于个人开发者来说还是有一定门槛。

总的来说,ChatGPT 插件集并没有像人们预期那样,创造出一个新的「App Store」,用 AI 的力量重塑我们生活的一切。

它更像是一次 OpenAI 大胆的尝试,给了开发者和用户更大的自由度去调试这个目前最强大的大语言模型,探索其能力边界。

ChatGPT 就是你的专属秘书,现在它有了很多的工具,当你给它一个明确的任务安排,并且有一定的结果预期,它可以帮你解决很多问题——尽管它现在还不够完美。

这让我想起前些日子微软研究院在 3 月发布的《通用人工智能的火花:GPT-4 早期实验》论文。

研究人员在对未加限制的 GPT-4 模型做了一系列实验后发现,GPT-4 的能力已经具有一定的普遍性,它的许多能力跨越了广泛的领域,而且它在广泛的任务中的表现达到或超过了人类水平,综合来看,他们认为 GPT-4 可以说是迈向 AGI(通用型人工智能)的重要一步。

如今,开放了插件集能力后的 ChatGPT 可以说也拥有了一定程度的普遍性问题解决能力,这或许是大众能接触到的最接近「婴儿版 AGI」的人工智能模型。

在科幻电影《2001 太空漫游》里面,库布里克用猩猩拿起骨棒作为人类学会使用工具、创造文明的起点。对应到 AGI 的话,开放插件集的 ChatGPT 可能就是第一个拿起骨棒的「猩猩」。

登录,参与讨论前请先登录

评论在审核通过后将对所有人可见

正在加载中