震惊！！！谷歌发布最强多模态大模型Gemini

本文首发微信公众号：飞总聊IT

谷歌CEO劈柴今天官宣了谷歌的最新多模态大模型Gemini 1.0版本正式上线。

Gemini是谷歌最牛逼的大模型，它有三种量级：Gemini Ultra， Gemini Pro以及Gemini Nano。顾名思义，最后一个应该是可以在手机端本地运行的模型。

Gemini多强呢？下面这段谷歌公布的演示视频展示了谷歌公布的Gemini到底有多强：

视频里，演示者以浓郁的印度口音给大家展示了这个多模态大模型可以识别视频的能力，叹为观止。

谷歌的Bard聊天机器人，也已经升级到了Gemini，按理来说，应该也表现出了类似的能力。我测试了一下，但是我个人的感觉变化并不是很明显。

也许还需要时间rollout，才能够让大家都看到Bard的变化。

Gemini这个模型的推出，今年5月份在Google I/O上就可以开始放风了，但是谷歌实际推出的时间一拖再拖。具体原因是什么，众说纷纭。

为了和OpenAI与微软合体展开竞争，谷歌今年果断的决定从自己的PaLM 2切换到Gemini上。为了让Gemini成功，谷歌还把两大人工智能研究机构Google Brain和DeepMind合并在了一起。

这个Gemini就是集合了谷歌两大顶尖人工智能研究机构的产物。从发布的情况来看，Gemini在各种各样的Benchmark中都拿到了最优秀的成绩。

而Gemini到底能干什么事情不能干什么事情，谷歌的产品副总裁Eli Collins表示，谷歌依然在努力研究，毕竟大模型就像黑盒子，人类要懂得大模型能做什么不能做什么还是很困难的。

但是不管怎么样，单纯从参数量来看，Gemini显然已经大大超越了目前的GPT 4,而从谷歌披露的演示视频来看，这个演示视频显然也让人很吃惊。

至少我看演示视频的时候，我觉得非常的夸张。即使ChatGPT已经一次又一次的吓着我了，Gemini的表现还是再一次吓到我了。

一个AI怎么可能有如此牛逼的辨别能力和信息处理能力呢？如果那个确实是AI的话，那么通用人工智能离我的距离，可能比我们想象的还要近很多。

但是话说回来了，谷歌做Demo，也可能就是Demo，毕竟，我们也都知道，如果谷歌只是为了让Demo好看的话，也不是很困难的事情。而且谷歌在Demo上的黑历史也不仅仅是一次了。

因此，到底Gemini是有多牛逼，是真牛逼，还是假牛逼，我们还需要再耐心等待一段时间，毕竟，是骡子是马，最后总是能够在遛遛的过程中现出原形的。

市场期盼另外一个大模型已经很久了，不是说开源的大模型不行，也不是说其他公司没有大模型，但是没有一个抗打的。如果OpenAI的GPT 4是大学生水平的话，其他几个撑死了小学生水平，差距实在太大了。

我本人也对谷歌期望满满，我买了不少谷歌股票，就指望着谷歌在人工智能方面大展宏图，顺便带动我小小的赚一点。

我建了个星球，聚焦讨论职场发展和裁员应对的问题，有兴趣的朋友可以加入，向我提问，和我一起讨论这方面的问题。

继续阅读