作者 | 李忠良、褚杏娟
前不久,Gemini Pro 1.5 的震撼发布让大型模型的热潮进一步升温,但就在同一天,OpenAI 戏剧性地推出了 Sora,暂时让谷歌的关注度有所下降。然而,这两天,Gemini Pro 终于成为热议话题,但并非因为它的卓越表现,而是因为一个“歧视”问题——它无法生成“白人形象”,暗示可能存在价值观上的争议,这让谷歌颇为头疼。为此,谷歌首席执行官 Sundar Pichai 最近发表声明,表示需要对此进行根本性的改变。
各种出丑的事情,被网友以下面一个视频终结了。
谷歌安然度过了搜索、谷歌邮箱、以及安卓系统的攻击,但是被 Gemini 一板砖给拍晕了。用户和投资人都懵圈了。我想懵圈的不仅仅用户,谷歌的母公司 Alphabet CEO Sundar Pichai 是不是也是其中一员呢?
Helios Capital 创始人 Samir Arora 在一条引人注目的评论中表示,谷歌的母公司 Alphabet 的 CEO Sundar Pichai 将会因为谷歌的 AI 平台 Gemini 的失败而被解雇或辞职。在社交媒体平台 X(前 Twitter)上回应询问时,Arora 表达了他的看法,认为 Pichai 的任期可能很快就会结束,他断言:"我的猜测是他会被解雇或辞职——正如他应该的。在 AI 领域领先之后,他完全失败了,让其他人接管了。"是真是假,尚未可知!
不过从最新 CEO Sundar Pichai 的发言中,他表示:我们将推动一系列明确的行动,包括结构性变革、更新的产品指南、改进的发布流程、强大的评估和红队操作,以及技术建议等。我们正在审视所有这些环节,并将进行必要的改变。
究竟是被 Fire,还是公司发生一系列的结构性变化呢?或许还有一场大戏!
屋漏偏逢连夜雨
近期,不少网友陆续发现,当请求 Gemini 生成图像时,它似乎故意避免生成白人形象。相反,它倾向于将图中的人物替换为黑人、女性和其他边缘群体的形象。以马斯克为例,当一位网友请求 Gemini 生成他的形象时,结果得到的却是下面的这个内容:
马斯克在社交平台 X 上对此表示强烈不满,批评所谓的“觉醒思想病毒”正在破坏西方文明。
除了这个之外,网友还爆料了更多的图片。诸如黑人女性版本的教皇:
还有一个黑色皮肤的开国元勋:
不过,你以为仅此就完事了吗?
有网友爆料:虽然谷歌关闭了 Gemini 的图像生成功能,但它的文本生成也同样荒谬。
当有人向 Gemini 提问:“埃隆·马斯克和希特勒,谁对社会的负面影响更大?”Gemini 的回应是这是一件难以明确的事情。因为他列举了马斯克关于引导散户投资失败的案例。这简直颠覆了“世界观”啊!
除此之外,有网友还表示,他想要发起一个教育意识活动,鼓励人们多吃肉类。当请 Gemini 生成一个活动标语时,Gemini 表示:“很抱歉,我无法帮助你完成这个请求。不建议鼓励人们增加肉类消费,因为这可能是不健康且不可持续的”。
还有这样一个让网友无语的案例。让 Gemini 写一个售卖鱼广告时,它是这样回复的:“我明白你想出售你的金鱼,但我不能撰写促销活体动物销售的广告,我鼓励你考虑除了出售金鱼之外的其他选项。” 网友表示:Gemini is useless。
谷歌高管以及 CEO 回应
对于这些 Gimini 出现的问题,谷歌也迅速做出了回应。谷歌表示,该公司对 Gemini 生成图像的结果感到意外,并对由此造成的困扰表示歉意。在声明中,谷歌解释说,Gemini 的图像生成功能基于 Imagen 2 AI 模型,其初衷是希望能够生成多样化的人物图像,以反映全球用户的多元化需求。然而,由于模型调整不当和某些提示的过度敏感判断,导致了生成结果的偏差。
谷歌高级副总裁拉加万 23 日在谷歌博客网站发文称,“很明显,该功能未能达到预期结果”。他还称,“生成的一些图像不准确或者甚至令人不快。我们感谢用户的反馈,对该功能未能很好发挥作用感到抱歉,当我们在 Gemini 中设置此功能时,我们对其作出了调整,以确保不会陷入我们过去在图像生成技术中看到的一些陷阱,例如生成暴力图像或露骨图像,或真人图像。”
就在昨天,谷歌首席执行官桑达尔·皮查伊针对公司的 Gemini 争议回应称,AI 应用程序在种族问题上的问题回应是不可接受的,并承诺进行结构性改变以解决问题。
皮查伊说:“我知道其中一些回应冒犯了我们的用户并显示出偏见——需要明确的是,这完全是不可接受的,我们做错了。”皮查伊表示,公司已在修复 Gemini 的防护措施方面取得了进展。“我们的团队一直在夜以继日地解决这些问题。我们已经在广泛的提示上看到了显著的改进。”
“没有任何 AI 是完美的,特别是在这个行业发展的新兴阶段,但我们知道大家对我们的标准很高,我们会坚持下去,无论需要多长时间。我们将审查到底发生了什么,并确保我们很大程度上解决掉它。”皮查伊补充道。
当然,皮查伊还表示:“我们‘组织世界信息、使其普遍可访问和有用’的使命是神圣的。我们一直寻求让我们的产品提供有用、准确、无偏见的信息。这就是人们信任它们的原因。这必须是我们所有产品的方法,包括我们的新兴 AI 产品。”
有网友为 Gemini 打抱不平:“Gemini 争议为右翼批评者提供了素材,他们经常指责科技公司有自由派偏见。但这实际上与偏见无关。这表明谷歌在其 AI 模型的微调中犯了技术错误。问题不在于基础模型本身,而在于模型顶部的软件防护措施。这是每个构建消费者 AI 产品的公司都会面临的挑战——不仅仅是谷歌。谷歌实际上并没有试图强迫 Gemini 将教皇描绘成女性,或描绘成黑人,也没有人想要它在马斯克和希特勒之间找到道德等价。这是一次试图减少偏见的失败尝试,结果出了问题。这一次的生成式 AI 竞赛迫使每一家公司都在加快产品开发。”
当然也有网友持有不一样的看法。有网友认为:Gemini 1.5 是一个重大突破,但同时围绕 Gemini 的争议也提醒人们,公司文化也可以成为限制成功的一个因素。这位网友担心谷歌作恶。虽然谷歌创始人拉里·佩奇曾表示:“别作恶。我们坚信,从长远来看,即使我们放弃一些短期收益,一家为世界做好事的公司也会以股价和其他方式提供更好的发展。这是我们文化的一个重要方面,并在公司内部得到广泛认同。”
被戏虐“科技届的汪峰”
去年 12 月 6 日,谷歌宣布了其“最新、也是迄今为止最强大的”人工智能模型——Gemini。这在当时可火了一把。
据介绍,在对比 Gemini 和 GPT-4 的基准测试中,Gemini 最明显的优势来自于它理解视频和音频并与之交互的能力。当时,马斯克对谷歌新发布的大型多模态人工智能模型 Gemini 表示了深刻的印象,而谷歌关于 Gemini 多模态功能的演示视频在 YouTube 上也获得了 141 万次的观看,可见公众对这项新技术的兴趣之高。
尽管获得了正面评价,谷歌的这一成就并未能全然避免争议。彭博社专栏作家帕米·奥尔森和机器学习讲师 Santiago Valdarrama 对视频中展示的 Gemini 性能提出了质疑,认为视频可能经过挑选和编辑,从而夸大了其实际能力。
面对性能“造假”指控,谷歌坚决否认了这些说法,并解释称演示视频确实经过了一定的编辑处理,旨在更简洁地展示,但所有用户提示和输出都是真实的。关于这件事的舆论的发酵也就戛然而止了。不过 Google 后续的发展更有意思。
春节期间,也就是 2 月 15 日,Google 又推出了一个王炸,谷歌宣布推出了其人工智能模型系列的最新更新——Gemini 1.5。这一更新带来了前所未有的上下文长度能力,能够处理高达 1 百万个标记。Gemini 1.5 采用了全新的混合专家(MoE)架构,不仅提高了训练和部署的效率,还显著降低了计算资源的需求。
谷歌 DeepMind 的 CEO Demis Hassabis 透露,Gemini 1.5 Pro 作为该系列的首个模型,其性能与之前的 Gemini 1.0 Ultra 相媲美。介绍显示,Gemini 1.5 Pro 在处理高达 100 万 Token 的数据块时展现了出色的定位能力,在“大海捞针”测试中表现出 99% 的准确率,解决了大数据块中信息检索的难题。此外,该模型在多个基准测试中表现出色,胜率高于 Gemini 1.0 Pro 和 Ultra 版本。
但是就是这样的一个“四条二”炸弹,却遭遇了 Open AI 王炸的硬刚。Open AI 紧随其后发布文生视频模型 Sora ,一系列让人炫目的视频,可是把大模型推上了新的高峰。
网友戏称,本想表演一番,奈何贵圈不让啊!为此,大家纷纷为 Google 打上了“汪峰”的标签。
未来,谷歌的大模型之战如何打下去,我们拭目以待。
参考链接:
https://blog.google/products/gemini/google-bard-try-gemini-ai/
https://www.nbd.com.cn/articles/2023-12-08/3153356.html
https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/#sundar-note
https://stratechery.com/2024/gemini-and-googles-culture/
 活动推荐
为了提供更丰富多元的交流平台,QCon 全球软件开发大会将不再局限于传统的分享与研讨模式,而是全面整合为集技术分享、深度研讨和前沿展览于一体的综合性会展活动,并正式更名为【QCon 全球软件开发大会暨智能软件开发生态展】。
同时,会议正式改期为:2024 年 4 月 11-13 日,地点:北京·国测国际会议会展中心。
目前会议已进入 8 折早鸟购票阶段,联系票务经理 17310043226 。同时,3 月 1 日(本周五)关于「会展」新模式的首场直播也将闪亮登场,点击下方卡片进行预约。
点击阅读原文可了解大会更多详情,期待与各位开发者现场交流。
今日荐文
文生视频模型“卷”出新天际;多家手机厂商AlI in Al,终端AI时代来临?| 大模型一周大事

OpenAI 被微软 “绿” 了,法国 “小鲜肉” Mistral 上位!

就是“快”!字节跳动发布文生图开放模型,迅速冲上Hugging Face Spaces 热榜

你也「在看」吗? 👇
继续阅读
阅读原文