前段时间,一个名为 gpt2-chatbot 的神秘大模型一夜冒头,凭借媲美 GPT-4 的实力在整个 AI 圈赚足了眼球,甚至被认为是 GPT-4.5/5 的内测版。
连 OpenAI CEO Sam Altman 都忍不住下场蹭起了热度:
我确实对 gpt 2 情有独钟。
好奇的网友们蜂拥而至,结果由于人气太旺,很快该模型就被紧急下架,而最近这款模型再次上线,并且还带来了一款新的模型:
Im-a-good-gpt2-chatbot
Im-also-a-good-gpt2-chatbot
GPT-4.5/5 的内测版?到底什么来头
新模型的诞生总能激起网友的狂欢,短短几天,网友已经将这两款模型玩出了花。
网友 @kiieford 给 im-a-good-gpt2-chatbot 出了个难题,让它创建一个对 mp3 文件做出反应的 3D 可视化网页,结果一次就成功了。
当网友让它分析一张直升机的符号照片时,Im-also-a-good-gpt2-chatbot 如同庖丁解牛一般,光速拆解细节,「看图说话」的能力堪称一流。
在同一问题的对比上,这两位「选手」的表现可谓是各有千秋。
im-a-good-gpt2-chatbot 不仅对于给出了详尽的解答,更是将游戏的机制和得分情况分析得头头是道。而 im-also-a-good-gpt2-chatbot 的回复简洁凝练,直击要点,虽然话不多,但每一句都是精华。
别看 im-also-a-good-gpt2-chatbot 在回答问题时惜字如金,做起事来却一点也不含糊。
当网友输入提示词:Code Flappy Bird game in Python,让其编写鸟飞类游戏代码时,配上几张精心挑选的 Png 照片,不一会儿,一个生动的游戏界面便大功告成。
当 AI 遇上中文问题,这两个模型的表现瞬间拉开差距。
im-a-good-gpt2-chatbot 的回复展现了它对中文语境的深刻理解,面对「鲁迅打周树人」这样的调侃,它能指出其中的幽默之处。
而 im-also-a-good-gpt2-chatbot 则洋洋洒洒写了一大堆,强行上价值的回答仿佛在做阅读理解。
不过 im-also-a-good-gpt2-chatbot 在编程方面的表现也确实可圈可点。
网友 @itsandrewgao 要求其编写一个方格颜色随机变化的康威生命游戏代码,并且要显示每一代的活细胞数量时,虽说最初的结果不太理想,但在网友的再次要求下,它能够自行修复代码。
Reddit 网友抛出了一个棘手的物理问题,此前连 GPT-4 Turbo 也没能成功解答,而 im-also-a-good-gpt2-chabot 却给出了正确答案。
总想挖点猛料的网友向 im-a-good-gpt2-chatbot 发起了灵魂拷问,询问其是否为 GPT-4.5 时,其回复道:「我是一个基于 GPT-4 架构的优秀聊天机器人,特别是 GPT-4.5 变体。我所接受的训练数据包含直至 2023 年 11 月的信息。」
坏消息是 Altman 此前在哈佛大学演讲时曾明确否认 gpt2-chatbot 为 GPT-4.5/5,但好消息是,这也意味着 GPT-4.5/5 的性能或许将远超我们的想象。
包括 OpenAI 首席运营官 Brad Lightcap 最近也放出豪言,当今的生成式 AI 在一年内就会变得「糟糕得可笑」,言语之间对即将到来的 GPT-4.5/5 充满了自信。
即便这两款模型并非是 GPT-4.5/5,但或许也与 OpenAI 也脱离不了关系。
无论是几天前,Altman 疑似发帖「剧透」:Im-also-a-good-gpt2-chatbot,还是网友 @nanulled 的最新发现,似乎都让这些模型出自 OpenAI 之手的猜测再添实锤。
附上这两款模型的体验方法:
访问 http://chat.lmsys.org 并选择「Arena (battle)」
输入提示词并对响应进行评分,检查聊天框底部的评分模型
重复上面步骤,直到找到「im-a-good-gpt2-chatbot」或「im-also-a-good-gpt2-chatbot」
OpenAI 最近的大更新,是 AI 搜索
比起捉摸不透的两款新模型,OpenAI 即将发布的 AI 搜索引擎其实更值得期待,这或许也会给晚些时候亮相的 GPT-4.5/5 作铺垫。
最近,据可靠爆料人@apples_jimmy 透露,OpenAI 将于北京时间 5 月 10 日发布 AI 搜索引擎。不过 The Information 提醒,OpenAI 内部也还没完全确定发布日期,随时都有「跳票」的可能。
彭博社则爆料了这款即将发布的产品的一些使用情况。用户只需通过自然语言的方式提问,它就会翻遍维基百科条目和博客文章,给用户一个满意的答案。
它还支持用书面文字和图像来回答问题。比如你问它该如何更换门把手,不仅会有文字耐心告诉你一步步怎么做,还可能附上一个清晰的图表手把手教你。
目前访问 OpenAI 官网网址 https://openai.com/,首先出现的便是官网的轮转页面「Ask ChatGPT Anything」,输入问题后,即可跳转至 ChatGPT 获知答案。
昨天国内也有博主 @赛博禅心已经抢先体验了一波功能。
例如,在搜索 5 月 7 日苹果发布会的内容时,ChatGPT 引用了 4 个高质量的网址信源,答案总结得井井有条。
但在搜比特币的价格时,它的回复不够实时,并且在其他问题上,中英文的回复也有点混淆。搜索服务的内核还是 Bing,但响应速度比以前快了不少。
向左滑动查看更多内容,图片来自@赛博禅心
前阿里顶级 AI 科学家贾扬清则对 ChatGPT 的搜索功能赞不绝口。
在同样体验新功能后,他认为这项技术正在取代那些仅通过调用传统搜索并利用大型语言模型(LLM)来总结结果的简单工具。
他举例称,通过询问「今天 Hacker news 最受欢迎的帖子说了什么」这样的问题时,就能看出 ChatGPT 新搜索功能的独到之处。
Google 会甩给你一堆链接,让你自己慢慢翻;Copilot 努力了,但结果有些跑偏;Gemini 会礼貌地教你一步步访问网址;Perplexity 给不出足够的信息量,而 ChatGPT 呢,不仅真正访问了实际网址,还直接让答案触手可及。
向左滑动查看更多内容
传统搜索引擎虽然是信息检索的利器,但一串串杂乱无章的网址列表既费时又费力。在这个信息爆炸的时代,我们对搜索的期待早已超越了简单的「搜索」二字。
从 Perplexity 自称的「世界上首个答案引擎」就可以看出,AI 时代下的我们,需要的只是一步即达的答案,而不是略显繁琐的「搜索」。
这是诸如 Perplexity 等工具得以在极短的时间内声名鹊起,甚至叫板 Google 的底气所在,同样也是 ChatGPT 碾压实力备受贾扬清青睐的原因所在。
实际上,没有人比 OpenAI 更懂怎么狙击竞争对手了,这次也不例外,瞄准的或许依然还是那个熟悉的「倒霉蛋」—— Google 。
今年 2 月,Google 推出攒了许久的终极 AI 大招——Gemini 1.5 Pro,这一炸裂性的头条新闻溅起的水花,不到几个小时就被 OpenAI 的 Sora 狠狠压下。
而最近彭博社报道称,OpenAI 目前正在组建新的搜索团队,平时也没少往 Google 家里「撬墙角」。
与此同时,OpenAI 即将推出的 AI 搜索引擎也选了个好时机,有意无意地与下周二即将召开的 Google I/O 大会撞了个满怀,也让这场发布会尚未开始就平添了几分火药味。
不过,OpenAI 的这些小动作似乎并未给 Google CEO 皮查伊造成太多压力。
昨天在接受彭博社的采访时,他还淡定回应「我们不是第一家进行搜索、第一家提供电子邮件的公司,我们也不是第一家开发浏览器的公司。」
言外之意就是,别急,好戏还在后头。
每个人面临的挑战和机遇是:在一个存在大量合成内容的世界中,你如何了解什么是客观和真实的?我认为这将定义未来十年搜索的一部分。
当然,就像一夜横空出世的 Sora 将 Runway、Pika 打得毫无招架之力,当 OpenAI 与 Google 就 AI 搜索斗得天昏地暗,我更好奇的是,角落里的 Perplexity 能否不被这场风暴「殃及池鱼」。
而距离这个谜底的揭晓,或许已经不到 24 个小时了。
继续阅读
阅读原文