时间过得很快,距离上一次写《我在用ChatGPT做什么?》已经过去2个月。这段时间里,技术日新日异,有很多大模型出来,有很多技术 paper 发表。
但目前为止能用的还只有 ChatGPT(模型是GPT3.5和4,我一直没用上克劳德,所以这里可能绝对了)。我并没有说好用,在我要解决的一些问题里,能用对我来说就够了。
大家一致的认为 ChatGPT 的推理能力是最强的,但似乎大家也不太能说得清楚,到底什么是推理能力。我用得最多的不知道是不是推理能力,我一般称之为上下文学习的能力。
所以,GPT4 出来的时候,我并没有付费使用 GPT4,因为我的需求已经可以满足了。直到 ChatGPT 的插件功能出来之后,我才开始升级了 plus,因为一些插件,确实有一些帮助,但是插件整体上,我的感觉是这种形式不好。
原因很简单,很多场景,并不需要先进入 Chat 的场景。有一些别扭。

最近一次 openai 更新,加强了 API 的能力,比如 embedding 降价,新的模型、更大的上下文等,这些对基于 API 做应用的小伙伴来说都非常好。是否是插件,并不一定。这里看,我觉得 openai 自己也意识到从前到后都自己做了,和市场不大匹配。这个利好更多的开发者。
比如更大的上下文,对于我们是否能在向量数据库中找得很准的依赖就没那么强了。当然,我们要花更多的钱。
有一个问题一直笼罩在国内的的开发者头上:如果我们做基于 ChatGPT的应用,大厂那么多资源,我们怎么竞争。这两个月下来,我的感受是,大厂可能比以前讲究了,不会直接套壳 ChatGPT,别的模型有没有 ChatGPT 的能力,反而是开发者的机会。 

下面开始逐个说一些体验,想到哪里就说到哪里。
对我来讲,首要的不是训练大模型,更多的还是在找场景和产品设计,到底哪些场景的应用会比较合适。这种思考和从技术上深入去训练大模型是不同纬度的,会让我更加冷静的看待日新日异的技术变化。
首先,我更加确定了自己产品的know-how是最重要的,然后 ChatGPT 是一个有效的实现手段——比如 ChatGPT 懂人话、说人话的特点。
这里没有 ChatGPT,有 XXXGPT 也是可以的,只要具备了某些能力。但如果我们没有自己的 know-how,ChatGPT 就可以回答,那我们自己做产品的意义是什么呢?
大模型很厉害,但也不应该过度使用。我看过一个人力资源行业的例子。用 国内某个开源大模型微调做候选人简历和职位的匹配。这个大模型是可以做的,得益于大模型对语义的理解,我们调用一次 API 就可以完成,如下图:
这是我随意做的一个例子,条件没有那么复杂,但已经可以充分的展示出效果了——看起来效果不错,但这件事,用传统的机器学习的技术也可以做得很好,而且成本更低。从企业的角度来说,选择哪一个呢?
根据前面一点来说,我们对招聘流程进行效率提升、效果提升,关键know-how大概率并不在这里通过大语言模型进行人和岗的匹配。
下面说点让人激动的。ChatGPT 懂了人话之后,知识库的组织方式就灵活了,不再想以前本题库、知识图谱那么死板。我还记得陆奇博士的的演讲:“just don’t do that。Just pretty bad。It does not work at all。You should use Transformer。”
如果已经有了知识图谱,和 ChatGPT 并不矛盾。如果没有,还想从头构建知识图谱,那么请放弃。我们可以用 ChatGPT 来做我们的助手,以更加高效的方式组织我们的知识。
我们的知识表现为文本,我们构建知识图谱的时候,已经有损耗了,怎么可能在使用的环节,发挥原有的力量呢?ChatGPT 可以——这是一种有效的压缩。
这里有一个问题,就是如果用 ChatGPT,知识是不是就相当于给别人了——是的。不想失去自己对知识的所有权,只能等开源模型及格之后,在自己的本地训练大模型。
技术趋势是这样,等一等,但是不是能超越GPT4?不大可能,今天我在twitter上看到一个说法:开源的大模型只能从表面的现象上学习闭源大模型的技巧,但是闭源大模型可以学习到开源大模型的所有的技巧,所以差距是在拉大,不是缩小。
我帮几个团队做了这个事情——构建了自己的知识库——他们不在意自己的资料泄露,因为这并不是关键的know-how。局部提升用户体验,也有价值,但感觉不高。
我觉得现在最有价值的是,没有 ChatGPT 做不到,但 ChatGPT 自己也做不到的领域。我举个例子,陪伴这个大的方向,国外有 character.ai,国内有 Glow,产品我体验过,Glow 用得更多一些。
我没有被陪伴到,倒像是我在陪着他们,他们非常的自我,按照特地的模式,一句一句的输出,根本不能以懂我的方式回应我。倒是需要我懂它。
更可气的是,一些朋友和我说,你的 prompt 写的不好,Prompt 写好了就可以了。真的需要转换一下思维,陪伴不是一个劲的需要我懂它,是我需要陪伴,不是它需要陪伴。
Prompt 能给上下文,但是不能带来新的能力,大模型本身不具备心理层面的懂的能力,费劲心思改的 Prompt 也只是局部像那么回事,泛化并不好。
再聊点 ChatGPT 的插件,我最近用得很多。最大的帮助是对我看论文和文生视频。
看论文,扔一个 pdf 上去,连翻译、带摘要,细节的步骤,统统搞定,我看论文的效率高了很多,能更快的知道我要去论文里看哪些,也能更快的确定,我是不是需要深入这篇论文。这里我用的是 askyourpdf。
文生视频,我用的是 hexgen。给一段话,设定一些要求,就可以升成一段视频,对于做一些产品的介绍,确实还挺有帮助的。我用得不多,但真的还挺方便。
下面这个例子,我苏总《正路》中有关成功定义的说明。大家感受下。
这块儿最近的工作很多,真的非常方便。不过现在升成的效率比较低。有的工具还可以根据照片生成我们需要的人像,比如复原我们故去的亲人的影像。
借助于文生图、文生视频,甚至可以一个人完成一个创业项目。AI 为个人赋予了更强的能力,在焦虑是否被 AI 淘汰之前,我们还可以选择更好的利用 AI,让自己强大起来。

在应用的过程中,当我拿着大模型的锤子,敲敲这里,敲敲那里,总觉得不够出彩。但有的时候深入场景里,就会发现竟然还可以这么用。
非常期待和更多的朋友交流。谢谢。
继续阅读
阅读原文