夕小瑶科技说 原创

 作者 | Zicy

在5月15号凌晨的一年一度的“谷歌科技春晚”,即Google I/O开发者大会上,110分钟的发布会中,“AI”这个词被提及了121次。
目前,大模型竞争已经进入白热化阶段,本次开发者大会自然也围绕AI这一关键词展开。期间,Google宣布了一系列新的重大举措,其中最受关注的是实时语音助手Project Astra,对标OpenAI的GPT-4o。
但这次的Project Astra却再一次遭遇了OpenAI的“贴脸输出”。在本月的月初,一直有消息称5月9号OpenAI会举办一场发布会,但是最后又被推迟。时间好巧不巧,恰好推迟到Google I/O 开发者大会的前24小时,5月14号的凌晨。于是提前Project Astra 24小时,OpenAI率先发布了自己的实时语音助手GPT-4o,先抢占了一波热度。
但类似的事情不是第一次发生,早在今年2月,Google发布了Gemini 1.5 Pro,可以支持1M上下文的token,相比之下GPT-4 Turbo也仅支持128K上下文,但是OpenAI随后发布了文生视频模型Sora,直接吸走了一大波热度。
这下“AI届汪峰”的名号坐实了,任谁看了不得不说一句,高端的商战往往采取朴素的方式。
话虽这么说,但是Project Astra和GPT-4o的实际性能对比如何呢?

Project Astra vs GPT-4o

目前没有关于两个模型对比的明确指标,但是我们可以先从官方的demo中看个大概,Project Astra不但能和人类流畅交流,甚至能直接通过摄像头帮忙读代码。
Google的CBO Philipp Schindler也在推特上放出了一段在他的办公室录制的视频。
更牛的是,Astra能记住他所看到的东西。
对比之前GPT-4o在发布会上的表现
编者表达一下自己的看法,两者各有各的优点,似乎Project Astra具有更长的上下文能力,而且Google具有自己的硬件优势,在第一个demo结尾展示了将增强现实和人工智能的完美结合(边撸狗边和AI对话)。
但GPT-4o在情感上更加丰富,而且GPT-4o的交互更加流畅,延迟更低。GPT-4o的流畅可能是因为其模型结构更加精简,这意味着需要更少的算力,这可能就更加方便市场化的应用。
这两个突如其来的大动作,网友也是纷纷表示震惊
Project Astra这次是强势反击还是又被抢了风头?目前,关于Project Astra的性能指标,比如生成质量,数学能力和推理能力还尚未公开,但从demo演示上,似乎是与GPT-4o不相上下。未来随着更多性能指标的公开和用户反馈的积累,或许我们可以更全面地了解这两款AI模型的真正实力。

参考资料

[1]https://deepmind.google/technologies/gemini/project-astra/

[2]https://twitter.com/GoogleDeepMind
继续阅读
阅读原文