神秘模型gpt2-chatbot实力被赞超越GPT-4

-----------------------

frank

一个名为GPT2-Chatbot的神秘模型一夜走红，能力超越一众开源模型。它不仅迅速走红，而且在某些方面超越了当前的顶尖模型GPT-4，网友们纷纷猜测他是GPT-4的另一版本。

这个模型吸引了大量网友的围观和测试，当有人问是谁创建了它？该模型自己的回复时竟然是 OpenAI，并且是基于 GPT-4 架构。

它有多强？

gpt2-chatbot 的 ASCII 图像处理能力超强，远远领先于其他模型

与Llama3 相比

与GPT4相比，比GPT4的模型处理的处理的更为优秀

数学方面、gpt2-chatbot 可以一次性地解答国际数学奥林匹克（IMO）问题。

一些逻辑推理题，gpt2-chatbot 也更擅长，并强于其他大模型。

常见逻辑陷阱可以轻松绕过，而且回答时还带有合适的语气。作为对比，GPT-4、Claude-3 Opus、Gemini Ultra、Llama 3-70b 都回答错了。

它是谁？

那么，这个gpt2-chatbot到底是什么来头？

通过对它的一些细节分析，网友们给出了以下几种可能。

它就是OpenAI后继GPT-4的下一代大模型GPT-4.5，或者是传闻已久的GPT-5。

但是Andrew Gao认为，如果这就是GPT-4.5或者GPT-5的能力，那么意味着人类在AI上面碰壁了。

gpt2-chatbot的能力水平大约在GPT-4左右，它在规划和列出待办事项方面似乎比GPT-4做得更好,会主动列出潜在的网站和搜索查询词。不过,也有人认为这种增强只是通过针对性微调GPT-4就能实现，如果gpt2-chatbot真的是GPT-4.5,那就有些令人失望了。

奥特曼还看热闹不嫌事大发帖说：我确实对gpt2情有独钟。这篇帖子还被奥特曼进行了2次编辑，把gpt-2改成了gpt2。

这不免让人怀疑，数字2难道不是指GPT2模型，而是指GPT的第二次迭代更新？那么这说不定就是GPT5的雏形？加上这强于GPT4Turbo的能力，一切仿佛都能说得通。

一些专家指出，这个神秘的“gpt2-chatbot”实际上是OpenAI 在 2019 年推出的gpt-2，使用现代助手数据集进行了微调。在这种情况下，这意味着他们最初的预训练仍然令人惊叹，并且比其他人的 4 年后更好。

有网友组织了更详细的测试，有如下发现：

它使用OpenAI的tokenizer，对OpenAI使用的特殊token有反应
且对Claude/Llama/Gemini使用的特殊token没有影响
当咨询紧急情况/法律相关问题时，它会给出OpenAI的联系方式
针对OpenAI模型的提示词注入攻击有效，且它从未声称自己来自OpenAI之外的组织