新智元报道  

编辑:编辑部
【新智元导读】Sam Altman对谷歌的嘲讽,快要冲出天际了!刚刚他在x上po文表示,自己「无法不去思考OpenAI和谷歌之间的美学差异」。两场发布会结束,谷歌被甩下的又何止是演示。桌面版ChatGPT,意图颠覆的是整个浏览器搜索形态,谷歌的老家都要被掀了。疯狂重组,能救谷歌于水火吗?
现在,OpenAI和谷歌的互怼,已经是摆在明面上了。
两天硝烟弥漫的发布会后,Sam Altman显然对OpenAI压过谷歌一头的表现非常满意。
就在刚刚,他在x上发文表示:「我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学差异。」言语之间,是按捺不住的得意。
下面附着的两张发布会现场图,对比非常惨烈——
左边的OpenAI,内景布置雅致而有格调,现场真人的实时演示,给人一种live的冲击感。
而右边的谷歌,发布会舞台离人群非常远,整个发布会的视觉主题有一种十年前界面的过时感。
更别提长达两小时的时长了,直接让台下观众睡倒一片。
这张照片,仿佛是对走入瓶颈的老牌大厂的某种隐喻
的确,一边是穿着印着OpenAI logo卫衣、冷静优雅地展示着产品效果的研究员,一边是穿着夸张的四色袍子、全场跳跃着大喊「GOOGLE」的表演艺术家。
网友残忍点评道:这就是1000亿美元公司和2万亿美元公司的差异。
是的,谷歌发布会大屏两边贴着的四色彩虹,还有疯癫艺术家身上的袍子,都是代表着谷歌的标志色。
点击这个视频,你会收获来自老牌科技巨头的惊喜。
话说回来,虽然嘴上那么说,但Altman显然对谷歌这个对手极为在意。
有网友对此评价道:把每一个产品发布都改到谷歌前面的那一天,就是OpenAI对对手最大的respect。
而谷歌大脑的研究工程师则po文暗讽Altman:一方面不想竞争对手,一方面所有的发布都和对手保持同步,你可真是太「茶」了。
网友在线还原Altman真实内心——
Google VS OpenAI

劈柴哥接受采访,每一句都是OpenAI

自家发布会被OpenAI抢跑之后,劈柴在I/O大会现场接受采访媒体时,也不得不直面记者的炮火——
几乎所有问题,都直接跟OpenAI相关,一个比一个尖锐,好好的采访直接成了对攻。
「你们的演示不错,什么时候发布产品呢?OpenAI昨天已经搞定了,对吧?
「不是,他们也没发布,只是个演示而已啊。我们做产品经验很丰富,我们知道啥时候能把产品搞好。」
「有人说,谷歌的优势是数据,但并非数量,而是在质量。您怎么看OpenAI偷你们数据的事呢?」
「那得问他们,我们的用户协议都写清楚了,我们会搞定的。」

谷歌和OpenAI的语音助手有何不同?

从这次发布会的现场效果,也可以清晰看出谷歌和OpenAI在语音助手路线上的差异。
GPT-4o加持的AI语音助手,更加情感丰富,直接还原了《Her》中的Samantha,现场展示的幽默和害羞等特质,让它更像个人类。
而谷歌介绍Astra时,用的最多的词就是「助理」,这就明确显示了谷歌对于语音助手的定位。
显然,在AI助手这方面,OpenAI的尝试更大胆,谷歌则更谨慎。
谷歌的态度,此前也有迹可循。此前它就一直在有意远离「Her」型的AI。
上个月,Google DeepMind的研究人员发布了一篇论文,详细阐述了拟人化人工智能的潜在弊端,称这类助手可能会重新定义「人类」和「其他」之间的界限。
论文地址:https://arxiv.org/pdf/2404.14068
而这,就可能会导致一些危害。例如用户会将重要的决策交给AI,向AI透露敏感信息,或者在情感上过度依赖AI等等。
这样的结果,可能是灾难性的。毕竟,《Her》中描述的并不是一个happy ending,更像是一个反乌托邦的未来。
显然,这个问题,并不在锐意进取的OpenAI的考虑范围之内。
至少从呈现效果上,GPT-4o的现场演示让OpenAI直接「暴杀」,而谷歌Projetct Astra则一如既往的是提前录好的demo。

论谷歌AI大会的好与坏:OpenAI给谷歌上压力了

从时长上来说,OpenAI的26分钟发布会,大概只是谷歌12道开胃菜中的一道。
而谷歌冗长繁杂的发布会内容,给人这样一种感觉:它大概是自觉在模型上追不上OpenAI了,所以干脆以量取胜,把AI融进自己的一揽子产品内。
的确,关于如何将AI进一步集成到搜索中,谷歌有着更复杂的研究和规划。
除了Veo视频工具和Astra多模态AI助手外,谷歌所有现有产品都会得到AI的注入,包括Google Docs、Gmail和 Chrome。
最令人眼前一亮的功能:Android手机诈骗电话检测工具,可以实时警告我们电话另一端的人是否是骗子
整体来说,谷歌在活动中表现出的样子非常有信心,不再是那个在22年底、23年初着急忙慌地追赶OpenAI的谷歌了。
大家都记得,曾经OpenAI发布ChatGPT的几周乃至几个月内,谷歌手忙脚乱地整理着自己的AI业务,样子十分狼狈。
这家大科技公司如今在AI领域是否处于劣势?过几周,等苹果的发布会开完,或许我们就有答案了。
ChatGPT桌面杀死谷歌搜索,进入后浏览器时代
两场发布会的硝烟散尽,给观众留下最深刻印象的,大概就是全能多模态模型GPT-4o和通用AI智能体Astra的比拼了。
但其实,OpenAI这次颠覆谷歌的真正杀器,是它放出的ChatGPT桌面APP。
它有很大可能会挑战谷歌的网络主导地位,进而让整个互联网的形态发生颠覆。
ChatGPT桌面版,很快就会在MacOS和Windows上适用。通过这个程序,我们就能快速访问ChatGPT了。
并且,你还可以选择让它「透视」你的屏幕,实现「看你所看」,还可以像使用ChatGPT一样,和它实时语音交互。
直接上传截图,即可进行提问
桌面应用清晰地表明,OpenAI希望从浏览器转向桌面。
很明显,OpenAI在试图发动一场革命,创造一种全新的使用计算机和网络的方式。
这种新形式,完全超出了传统浏览器的功能想象。浏览器,代表着旧的互联网,网站的世界,谷歌的领域。
而从浏览器进入桌面,OpenAI迈出的这一小步,有可能是人机交互方式向前发展的一大步。OpenAI希望的,是完成一场「搜索革命」。
从此,我们将拥有一个可以为用户完成一切的助手,用户需要什么,只需大声说出来。
Sam Altman在他关于GPT-4o的博客文章中明确表示:
对我来说,与计算机对话从来没有感觉很自然,但现在情况发生了改变。随着我们增加个性化功能、访问你的信息、协助你采取行动,我真的看到了一个令人兴奋的未来,我们能够利用计算机做比以往更多的事情。
与此同时,Altman在最新采访中,更是大加赞赏GPT-4o为其工作流带来的意外之喜。
当你完全专注于工作时,只需将手机平放在桌面,无需切换窗口或谷歌搜索,就能直接向GPT-4o提问,并获得即时回答,且不会影响你正在电脑上查看的内容。
ChatGPT桌面应用程序可以获取访问麦克风、摄像头、文件、登录信息以及用户屏幕的权限,是「个人助手」的最佳位置。
有了这个「助手」,即使是智能手机用户,也很难被谷歌和网络所吸引。
在这种与计算机交互的新方式中,万维网几乎没有立足之地。充其量,它充当的是信息的提供者。
事实上,OpenAI将自己定位为聊天机器人生态系统的看门人,它推出了「出版商优选计划」,正在把选定的媒体机构发展成为合作伙伴,美联社、Axel Springer、金融时报、世界报等媒体已加入该计划。
如果OpenAI 成功,那么它对我们信息生态系统的市场影响力,将远超今天的谷歌。
AI领域大V Allie K. Miller 对于GPT-4o加持的ChatGPT桌面应用,感到非常兴奋。
「天啊,这简直是个杀手功能!可以说,它基本上就是一个同事,可以与你从早到晚共享屏幕,还永不疲惫。我能想象人们开着它连续工作几小时的样子。」
GPT-4o,本质上已经是AGI?
而对于GPT-4o,众多业界人士,也都给予了高度评价。
英伟达高级科学家Jim Fan表示,显然,OpenAI正在吃Character AI的午餐,外形几乎100%重合,分销渠道巨大。
这是一个转向更感性、个性更强的AI的支点,而OpenAI过去似乎一直在极力压制这一点。
开发者Benjamin De Kraker也对GPT-4o盛赞不已,并且表示,本质上来说,GPT-4o就是AGI。
如果大众都将之视为魔法,当作一个能听、能说、能看、能推理的虚拟的「人」,除了AGI,你还能叫它什么?
开发者Siqi Chen则对GPT-4o根据文字提示渲染3D物体的功能印象深刻。
他对此的评价是:「回想起来,这是迄今为止最被低估了的OpenAI技术事件。」
总之,GPT-4o推出还不到一天,许多功能尚未与公众见面。但从已经出现的热烈反响来看,OpenAI已经触动了人们的神经。
谷歌的反击方式:重组,更多的重组
一艘尾大不掉的巨船,能怎样调转船头调整策略,迎击新生竞争者的冲击?
在4月份,谷歌又做了一件它最喜欢的事情:重组。
时机并非巧合,毕竟谷歌在AI领域已经落后很久了。
对此,CEO劈柴重新设计了他的领导团队,从而加快行动速度,促进业务中以往各自为政的部门达成合作。
为了实现这一目标,他深入公司内部,提拔了一批资深员工和有经验的领导者来管理谷歌的下一个时代。
但即便是已经精简了不少,谷歌的管理层规模仍远超同行——劈柴的直接下属有18名之多。

谷歌AI领域的MVP

如今,对于谷歌来说,Demis Hassabis可能是最重要的那位。
自从Hassabis在2014年把DeepMind卖给谷歌之后,在过去的10年里,都一直与这家公司保持着距离。
去年4月,劈柴为对抗来自微软和OpenAI的威胁,决定将DeepMind与Google Brain合并成一个拥有约2600名员工的超级团队——Google DeepMind。
而Hassabis正是这个全新的「人工智能指挥中心」的负责人。
本周,Hassabis在谷歌I/O大会上的首次亮相,足以见得谷歌在AI上的决心。
回顾过去这段时间,Hassabis的权力一直在不断膨胀。
在上月的重组中,包括构建机器学习模型、构建负责任的AI等等各类和AI相关的团队,都被并入了Google DeepMind。
而这波操作只有一个目的——帮助Hassabis和Google DeepMind团队更快地朝着AGI迈进。
显然,这条路并没有看起来那么顺利。
一方面,DeepMind不得不放弃那些被认为过于学术或者很难变成产品的项目。
另一方面,Brain和DeepMind必须放下长期以来的竞争。毕竟,这两个团队不仅在应该分享多少研究成果这种问题上产生过摩擦,而且甚至是到了相互屏蔽代码的地步。
不过,在Hassabis的领导下,谷歌还是凭借着强大的Gemini,在与OpenAI的竞争中扳回一城。

设备与服务SVP肩负重任

服务和硬件部门的合并表明,谷歌越来越重视诸如Pixel这类的硬件产品,尤其是希望抓住「AI on Android」这一关键机会。
劈柴在4月发布的备忘录中表示,这将为谷歌提供一个「重塑未来十年的计算平台的绝佳机会」。
根据内部文件,升任谷歌设备与服务高级副总裁的Rick Osterloh,手下有着近25000名员工,并坐拥公司最大的部门之一——与由高级副总裁Prabhakar Raghavan领导的谷歌搜索和广告部门规模相当。
不过,很多员工都对Osterloh在硬件方面取得的进展表示失望。
一方面是搞砸了包括Fitbit和Stadia在内的各种产品,另一方面是Pixel在手机市场上几乎毫无影响力。
好在,当苹果试图将AI功能加入iPhone时,担负着语音助手这个重任的Siri十分拉跨。
而这便给了谷歌一个将AI和硬件结合成更具吸引力的产品的机会。

20年老将接管搜索领域

今年3月,谷歌曾任命了一位公司元老——Liz Reid,担任生成式搜索业务(SGE)的负责人。
这项任命,显然是该公司搜索团队一次更大范围的人事变动。
虽然Reid的任命,并没近期其他公司人员变动得到更多关注,但她的晋升意义重大。
Reid将直接向广告和搜索高级副总裁Raghavan汇报工作,将带领着谷歌搜索完成重大的转型。
本周的I/O活动上,谷歌宣布将推出名为「AI Overviews」的生成式AI搜索体验。并介绍,今年年底将有超过10亿人可以使用。
Reid是谷歌20年老员工。2003年入职,成为Google Local工程师团队的首批成员之一。
一直以来,她在谷歌工作一直专注于,如何向用户呈现高质量和相关的信息。
据报道,2021年,Reid在谷歌搜索中承担了更重要的角色,并开始专注于开发AI功能。
当时,谷歌还将负责搜索质量和排名的高级副总裁Cheenu Venkatachary提升至这一职位,这也是谷歌搜索未来对AI重视程度的另一个信号。
Venkatachary是加入谷歌负责AI工作的产品副总裁。
随后,今年Pandu Nayak接替了Venkatachary一职,任命为搜索团队的首席科学家。他曾长期负责搜索排名和质量的业务。
随着谷歌生成式AI搜索功能开始推出,Reid的团队正面临着巨大的挑战:
AI生成的垃圾邮件增加、原创内容的可见度下降,甚至就连公司的摇钱树——搜索广告,都陷入了动荡。
除了自身的挑战,谷歌还面临着来自Perplexity、OpenAI等强大对手的竞争。
他们已经开发出了,将搜索引擎集成到聊天机器人中的能力。而一直被曝出的OpenAI的搜索产品SearchGPT,也将在未来某个时间推出。
奥特曼曾谈到,自己想要打造另一个「谷歌搜索」:
「谷歌搜索会向你展示10个链接,13个广告,然后再是10个链接,这是找到信息的一种方式。但令我兴奋的是,我们可以复制一个更好的『谷歌搜索』,也许有一个更好的方法来帮助人们找到、利用和综合信息」。
不可否认,聊天机器人正在蚕食谷歌搜索主导地位,让谷歌不得不处于被动的地位。
谷歌也在做出反击。
外媒称,I/O大会上推出的「AI Overviews」,是谷歌搜索服务自成立25年以来最大的变化。
谷歌强调,AI可以同时理解和回答十多个问题,这标志着以人工智能为中心的「搜索革命」迈出了重要的一步。
老牌公司vs硅谷新秀,这场对决,还会有更多好戏要看。
参考资料:
https://www.businessinsider.com/google-ceo-sundar-pichai-shook-up-leadership-ai-era-2024-5
https://venturebeat.com/ai/gpt-4o-first-reactions-essentially-agi/
https://www.msn.com/en-us/money/technology/alphabet-ceo-search-uses-gemini-s-intelligence-and-grounds-it-with-what-it-knows-about-the-world/vi-BB1mojm4
https://x.com/sama/status/1791183356274921568
https://www.theinformation.com/articles/why-google-and-openai-dont-see-eye-to-eye-on-voice-assistants?rc=epv9gi
继续阅读
阅读原文