本文首发微信公众号:飞总聊IT
谷歌刚刚官宣了Gemini 1.0,并给我们展示了下面这段巨牛逼的Demo视频:
网上就有人质疑谷歌的视频造假了。
对此,谷歌DeepMind的研究与深度学习主管副总裁Oriol Vinyals表示,视频中所有的输入和输出是真实的,只不过为了简洁起见,我们对视频进行了缩短剪辑。

具体的情况是这样的,谷歌发表的一篇文章里面详细对这段视频的实现进行了描述。
实际上,这是对使用静态图片和多段提示词拼凑起来的。因此Gemini并没有演示过程中那么牛逼的能力。但是视频的编辑,让Gemini展现出了炸翻天的能力。
所以,问题来了,为什么谷歌会编辑视频呢?

听着谷歌Demo里面那一股浓浓的咖喱味英语,我想,大家丝毫都不用怀疑,可能这是某个印度主管或者PM的想法了。
毕竟,比起做PPT来,印度人的水平还是很高的,至于剪辑一段视频,那水平就更高了。
谷歌的说法不但网友没有买账,股市也没有。

今天开盘以后谷歌的股价就开始跌了,一天都在跌。
大家也不是觉得Gemini不好,毕竟有了一个竞争的产品,对大模型也好,对用户也好都是多了一个选择。
但是大家对谷歌的Gemini到底有多牛逼,能干什么事情,也多多少少产生了怀疑。一个可以剪辑视频出Demo的谷歌,离当年那个技术为先的谷歌,到底距离多远?今天的谷歌还是当年那个谷歌吗?
毕竟,历史上有先例,曾经很牛逼的IBM,现在已经成了无足轻重的公司了。
当然,谷歌Gemini也并不是一点点的肌肉都没有展示。
根据谷歌的测试结果,从自然图像,音频和视频理解到数学推理,在大语言模型研发领域32种常见的学术基准测试中,Gemini Ultra创下了30种最新纪录。
这个意思是,在一系列的测试中,Gemini Ultra都表现出了比GPT-4更好的成绩。所以,无论从什么角度来看,这也是目前为止,第一个在各方面都展现出了和GPT 4有强烈竞争力的大语言模型。
这一点来说,谷歌还是很厉害的,起码比某度说自己觉得自己的大模型已经和GPT 4差不多了,给出了更多的测试结果作为支撑。
但是话说回来,Gemini既然这么厉害,又何必去造假视频做Demo呢?可能Gemini还不够精湛,不够吓人,所以干脆再夸张一点比较好。
无论如何,股价的表现反映了投资人对谷歌的表现并不买账,所以我们才看到谷歌在暴涨以后继续跌的现象。

我对谷歌造假这个事情也挺失望的,但是不管怎么样吧,我还是很希望谷歌的Gemini能打一点,给OpenAI一点真正的压力。不然的话,大语言模型OpenAI一家独大的现象,对我们可不是什么好事情。

我建了个星球,聚焦讨论职场发展和裁员应对的问题,有兴趣的朋友可以加入,向我提问,和我一起讨论这方面的问题。
继续阅读
阅读原文