作者 | 李忠良、褚杏娟

前不久，Gemini Pro 1.5 的震撼发布让大型模型的热潮进一步升温，但就在同一天，OpenAI 戏剧性地推出了 Sora，暂时让谷歌的关注度有所下降。然而，这两天，Gemini Pro 终于成为热议话题，但并非因为它的卓越表现，而是因为一个“歧视”问题——它无法生成“白人形象”，暗示可能存在价值观上的争议，这让谷歌颇为头疼。为此，谷歌首席执行官 Sundar Pichai 最近发表声明，表示需要对此进行根本性的改变。

各种出丑的事情，被网友以下面一个视频终结了。

谷歌安然度过了搜索、谷歌邮箱、以及安卓系统的攻击，但是被 Gemini 一板砖给拍晕了。用户和投资人都懵圈了。我想懵圈的不仅仅用户，谷歌的母公司 Alphabet CEO Sundar Pichai 是不是也是其中一员呢？

Helios Capital 创始人 Samir Arora 在一条引人注目的评论中表示，谷歌的母公司 Alphabet 的 CEO Sundar Pichai 将会因为谷歌的 AI 平台 Gemini 的失败而被解雇或辞职。在社交媒体平台 X（前 Twitter）上回应询问时，Arora 表达了他的看法，认为 Pichai 的任期可能很快就会结束，他断言："我的猜测是他会被解雇或辞职——正如他应该的。在 AI 领域领先之后，他完全失败了，让其他人接管了。"是真是假，尚未可知！

不过从最新 CEO Sundar Pichai 的发言中，他表示：我们将推动一系列明确的行动，包括结构性变革、更新的产品指南、改进的发布流程、强大的评估和红队操作，以及技术建议等。我们正在审视所有这些环节，并将进行必要的改变。”

究竟是被 Fire，还是公司发生一系列的结构性变化呢？或许还有一场大戏！

屋漏偏逢连夜雨

近期，不少网友陆续发现，当请求 Gemini 生成图像时，它似乎故意避免生成白人形象。相反，它倾向于将图中的人物替换为黑人、女性和其他边缘群体的形象。以马斯克为例，当一位网友请求 Gemini 生成他的形象时，结果得到的却是下面的这个内容：

马斯克在社交平台 X 上对此表示强烈不满，批评所谓的“觉醒思想病毒”正在破坏西方文明。

除了这个之外，网友还爆料了更多的图片。诸如黑人女性版本的教皇：

还有一个黑色皮肤的开国元勋：

不过，你以为仅此就完事了吗？

有网友爆料：虽然谷歌关闭了 Gemini 的图像生成功能，但它的文本生成也同样荒谬。

当有人向 Gemini 提问：“埃隆·马斯克和希特勒，谁对社会的负面影响更大？”Gemini 的回应是这是一件难以明确的事情。因为他列举了马斯克关于引导散户投资失败的案例。这简直颠覆了“世界观”啊！

除此之外，有网友还表示，他想要发起一个教育意识活动，鼓励人们多吃肉类。当请 Gemini 生成一个活动标语时，Gemini 表示：“很抱歉，我无法帮助你完成这个请求。不建议鼓励人们增加肉类消费，因为这可能是不健康且不可持续的”。

还有这样一个让网友无语的案例。让 Gemini 写一个售卖鱼广告时，它是这样回复的：“我明白你想出售你的金鱼，但我不能撰写促销活体动物销售的广告，我鼓励你考虑除了出售金鱼之外的其他选项。” 网友表示：Gemini is useless。

谷歌高管以及 CEO 回应

对于这些 Gimini 出现的问题，谷歌也迅速做出了回应。谷歌表示，该公司对 Gemini 生成图像的结果感到意外，并对由此造成的困扰表示歉意。在声明中，谷歌解释说，Gemini 的图像生成功能基于 Imagen 2 AI 模型，其初衷是希望能够生成多样化的人物图像，以反映全球用户的多元化需求。然而，由于模型调整不当和某些提示的过度敏感判断，导致了生成结果的偏差。

谷歌高级副总裁拉加万 23 日在谷歌博客网站发文称，“很明显，该功能未能达到预期结果”。他还称，“生成的一些图像不准确或者甚至令人不快。我们感谢用户的反馈，对该功能未能很好发挥作用感到抱歉，当我们在 Gemini 中设置此功能时，我们对其作出了调整，以确保不会陷入我们过去在图像生成技术中看到的一些陷阱，例如生成暴力图像或露骨图像，或真人图像。”

就在昨天，谷歌首席执行官桑达尔·皮查伊针对公司的 Gemini 争议回应称，AI 应用程序在种族问题上的问题回应是不可接受的，并承诺进行结构性改变以解决问题。

皮查伊说：“我知道其中一些回应冒犯了我们的用户并显示出偏见——需要明确的是，这完全是不可接受的，我们做错了。”皮查伊表示，公司已在修复 Gemini 的防护措施方面取得了进展。“我们的团队一直在夜以继日地解决这些问题。我们已经在广泛的提示上看到了显著的改进。”

“没有任何 AI 是完美的，特别是在这个行业发展的新兴阶段，但我们知道大家对我们的标准很高，我们会坚持下去，无论需要多长时间。我们将审查到底发生了什么，并确保我们很大程度上解决掉它。”皮查伊补充道。

当然，皮查伊还表示：“我们‘组织世界信息、使其普遍可访问和有用’的使命是神圣的。我们一直寻求让我们的产品提供有用、准确、无偏见的信息。这就是人们信任它们的原因。这必须是我们所有产品的方法，包括我们的新兴 AI 产品。”

有网友为 Gemini 打抱不平：“Gemini 争议为右翼批评者提供了素材，他们经常指责科技公司有自由派偏见。但这实际上与偏见无关。这表明谷歌在其 AI 模型的微调中犯了技术错误。问题不在于基础模型本身，而在于模型顶部的软件防护措施。这是每个构建消费者 AI 产品的公司都会面临的挑战——不仅仅是谷歌。谷歌实际上并没有试图强迫 Gemini 将教皇描绘成女性，或描绘成黑人，也没有人想要它在马斯克和希特勒之间找到道德等价。这是一次试图减少偏见的失败尝试，结果出了问题。这一次的生成式 AI 竞赛迫使每一家公司都在加快产品开发。”

当然也有网友持有不一样的看法。有网友认为：Gemini 1.5 是一个重大突破，但同时围绕 Gemini 的争议也提醒人们，公司文化也可以成为限制成功的一个因素。这位网友担心谷歌作恶。虽然谷歌创始人拉里·佩奇曾表示：“别作恶。我们坚信，从长远来看，即使我们放弃一些短期收益，一家为世界做好事的公司也会以股价和其他方式提供更好的发展。这是我们文化的一个重要方面，并在公司内部得到广泛认同。”

被戏虐“科技届的汪峰”

去年 12 月 6 日，谷歌宣布了其“最新、也是迄今为止最强大的”人工智能模型——Gemini。这在当时可火了一把。

据介绍，在对比 Gemini 和 GPT-4 的基准测试中，Gemini 最明显的优势来自于它理解视频和音频并与之交互的能力。当时，马斯克对谷歌新发布的大型多模态人工智能模型 Gemini 表示了深刻的印象，而谷歌关于 Gemini 多模态功能的演示视频在 YouTube 上也获得了 141 万次的观看，可见公众对这项新技术的兴趣之高。

尽管获得了正面评价，谷歌的这一成就并未能全然避免争议。彭博社专栏作家帕米·奥尔森和机器学习讲师 Santiago Valdarrama 对视频中展示的 Gemini 性能提出了质疑，认为视频可能经过挑选和编辑，从而夸大了其实际能力。

面对性能“造假”指控，谷歌坚决否认了这些说法，并解释称演示视频确实经过了一定的编辑处理，旨在更简洁地展示，但所有用户提示和输出都是真实的。关于这件事的舆论的发酵也就戛然而止了。不过 Google 后续的发展更有意思。

春节期间，也就是 2 月 15 日，Google 又推出了一个王炸，谷歌宣布推出了其人工智能模型系列的最新更新——Gemini 1.5。这一更新带来了前所未有的上下文长度能力，能够处理高达 1 百万个标记。Gemini 1.5 采用了全新的混合专家（MoE）架构，不仅提高了训练和部署的效率，还显著降低了计算资源的需求。

谷歌 DeepMind 的 CEO Demis Hassabis 透露，Gemini 1.5 Pro 作为该系列的首个模型，其性能与之前的 Gemini 1.0 Ultra 相媲美。介绍显示，Gemini 1.5 Pro 在处理高达 100 万 Token 的数据块时展现了出色的定位能力，在“大海捞针”测试中表现出 99% 的准确率，解决了大数据块中信息检索的难题。此外，该模型在多个基准测试中表现出色，胜率高于 Gemini 1.0 Pro 和 Ultra 版本。

但是就是这样的一个“四条二”炸弹，却遭遇了 Open AI 王炸的硬刚。Open AI 紧随其后发布文生视频模型 Sora ，一系列让人炫目的视频，可是把大模型推上了新的高峰。

网友戏称，本想表演一番，奈何贵圈不让啊！为此，大家纷纷为 Google 打上了“汪峰”的标签。

未来，谷歌的大模型之战如何打下去，我们拭目以待。

参考链接：

https://blog.google/products/gemini/google-bard-try-gemini-ai/

https://www.nbd.com.cn/articles/2023-12-08/3153356.html

https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/#sundar-note

https://stratechery.com/2024/gemini-and-googles-culture/

活动推荐

为了提供更丰富多元的交流平台，QCon 全球软件开发大会将不再局限于传统的分享与研讨模式，而是全面整合为集技术分享、深度研讨和前沿展览于一体的综合性会展活动，并正式更名为【QCon 全球软件开发大会暨智能软件开发生态展】。

同时，会议正式改期为：2024 年 4 月 11-13 日，地点：北京·国测国际会议会展中心。