GPT-4携手微软炸场，百度“文心一言”面世，差距在哪里？

你是否想过，给AI发一张搞笑的照片，它能get到笑点，并且与你幽默地交流。你甚至可以把它作为一个虚拟对象进行交流倾诉。

你是否想过，给AI发一张食材的照片，它能够正确识别图片里的东西并且推断这些原料能够制作的菜，甚至为你提供相关菜谱。

甚至有一天，它能解放打工人的双手，帮助打工人生成文档、电子邮件和幻灯片。

这些，AI现在都能做到。

当地时间2023年3月14日， OpenAI宣布大型语言模型的最新版本GPT-4问世。GPT-4是一个大型多模态模型，可以接受图像和文本输入并产生文本输出，相较于GPT-3.5，它能够识别和分析图像。

OpenAI表示，他们创建了GPT-4，这是OpenAI在努力扩展深度学习方面的最新里程碑。

GPT-4强大在哪里？

GPT-4经过迭代更新后，拓展学习了广泛的知识，具备了更好的问题解决能力，能够更精确地处理复杂问题。

#GPT-4更可靠、更具创造性

GPT-4比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑、迭代创造性的、技术性的写作任务，例如创作歌曲、编写剧本或是学习用户的写作风格。

用一个句子描绘灰姑娘故事的情节，并且使用的单词开头必须按照A-Z的顺序，并且不重复任何字母。GPT-4表现出了超高的创造性。

#GPT-4的视觉输入

GPT-4可以接受文本和图像的提示符，并能与纯文本设置并行，允许用户指定任何视觉或语言任务。

GPT-4会接受图像作为输入，识别图像并生成说明、分类、分析。

比如这个图片

GPT-4不仅能够识别鸡蛋、面粉等原料，还能根据图片内容推荐制作相应的食物。

它甚至能看懂梗图

问GPT-4：这张图有什么好笑的？

GPT-4：用过时的大型VGA充现代智能手机iphone

能进行图表分析

GPT-4可以算格鲁吉亚和西亚人的人均每日肉类消费。

能做物理题

能理解照片中不对劲的地方

能看懂漫画

#GPT-4更可靠，在推理和语言能力方面比ChatGPT更先进

在比较简单的问题上，GPT-3.5与GPT-4的差别不是很大。但当任务足够复杂时，GPT-4会比GPT-3.5更可靠，能够处理更细微的指令。

让两个模型进行不同内容的考试和复杂的推问题，GPT-4这位“同学”能够在考试中表现得更好。

除此之外，GPT-4在除了英语的其他语言上的能力也十分强大。研究团队让GPT-4将涵盖了57个主题的14000个多项选择题翻译成多种语言，在测试的26种语言中，GPT-4在24种语言翻译中优于GPT-3.5。

#可操纵性

开发人员以及相关用户可以在“系统”消息中规定人工智能的风格和任务，而不是固定的冗长、平静经典的风格特征，系统消息允许用户在一定范围内自定义用户体验。

#处理更长的内容

GPT-4能够处理超过25000个单词的文本，能够进行长篇内容创作、更延展的对话以及查找分析资料。

各方态度

#微软

当地时间3月16日，微软举办了一场AI发布会，宣布推出名为Microsoft 365 Copilot的人工智能服务，将嵌入Word、PowerPoint、Excel等Office办公软件中，帮助用户生成文档、电子邮件以及幻灯片等。

微软董事长兼首席执行官萨蒂亚·纳德拉（Satya Nadella）称，“这是我们在计算交互方面迈出的重要一步，这将从根本上改变我们的工作方式，并开启新的生产力增长浪潮。”

除此之外，在正式发布前，GPT-4就已经为微软公司的新必应（New Bing）提供支持。

#谷歌

就在GPT-4发布的前几个小时，谷歌发布博文，宣布推出AIGC功能应用到办公软件中。但不同于OpenAI发布即可用，谷歌先提供给值得信赖的开发人员，其他功能则在晚些时候向公众开放。

#百度

在GPT-4发布的一天之后，百度全新一代知识增强大语言模型“文心一言”正式发布。该模型具备文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五种能力。它与GPT-4有着类似的监督精调、RLHF和提示构建技术，在知识、检索和对话增强技术方面则突出百度特色。

此外，苹果、Meta和亚马逊等公司也在计划重新评估人工智能的开发策略。

相关应用

#为视觉障碍人士提供技术帮助

丹麦初创公司Be My Eyes从2012年开始就一直在为超过2.5亿盲人或低视力人群提供技术支持。

现如今有GPT-4的支持，它可以像志愿者一样需要视觉辅助人士，与他们聊天，分析并回答用户提供的图像和提出的问题，提供即时的视觉帮助。例如，GPT-4可以帮助需要视觉辅助的人访问比较混乱的购物和商务网站，帮助他们进行阅读搜索，提供比较正确的购买决定。

Be My Eyes首席执行官Michael Buckley表示：“在我们访问的短时间内，我们看到了任何图像到文本的对象识别工具都具有无与伦比的性能。这对全球无障碍环境的影响是深远的。在不远的将来，盲人和低视力群体将利用这些工具不仅满足大量视觉解读需求，而且在生活中拥有更大程度的独立性。”

#为语言学习人士提供练习帮助

GPT-4能为语言学习人士提供练习和纠错的帮助。3月14日，语言学习软件多邻国宣布，他们将利用OpenAI的GPT-4，在一个名为DuolingoMax的新订阅中推出两个新功能，扮演人工智能对话伙伴和“解释我的答案”。

角色扮演功能可以让用户身临其境地进行交流对话。得益于GPT-4，多领过能够指导用户完成不同场景的对话。例如点餐、第一次见面或购买机票等经典场景。

人工智能一直是我们战略的重要组成部分，”首席产品经理Edwin Bodge说道。“我们一直在使用它来个性化课程和进行Duolingo英语测试。但在学习者的旅程中，我们想填补一些空白：对话练习和对错误的上下文反馈。”

“解释我的答案”功能则能让用户能深层次了解分析自己的答案。有了GPT-4对错误内容的反馈的支持，用户可以了解正确答案或是明确错误产生的原因。

多邻国团队看到了GPT-4提供比以往任何时候都更有效、更具吸引力的学习体验的潜力，这将在一定程度上改善学习者的学习成果。

#更好的总结审查服务

Stripe是一个流行的支付网关平台，帮助企业和个人处理国际支付事务。该公司已经开始使用GPT-4。

Stripe表示，GPT-4可以更好地了解用户业务，并比人工审查人员更好地扫描网站以获得工作摘要。该公司的开发人员说，更新后的模型可以很容易地理解用户的问题，突出重要的部分，总结解决方案，甚至阅读十分详细的文档。

该公司还使用GPT-4分析社交媒体Discord上帖子的语法，以标记可疑账户，扫描入站通信并识别协同攻击。

除此之外，GPT-4具备能组织庞大的知识库，为学生定制个性化的课程，保护某个地区、国家的语言、文化和历史等功能。

局限性

尽管经过迭代更新，GPT-4的功能已经非常强大，但它仍然存在与早期GPT模型类似的风险，即仍然不完全可靠。它存在社会偏见，产生幻觉（模型编造了不存在的或错误的事实），生成错误答案，出现推理错误等。

GPT-4在输出中可能存在各种偏差。OpenAI的目标是让人工系统具有合理的默认行为，反映广泛的用户价值观，允许系统进行私人定制和确定界限，但GPT-4暂时还不能达到这样的水平。

其次，GPT-4缺乏对绝大多数数据中断后发生的事件的了解，并且不能吸取经验教训。有时它会犯一些简单的推理错误，或是在过于轻信用户明显的虚假陈述。除此之外，它可能难以处理棘手的问题，例如在它生成的安全代码中引入安全漏洞。

除此之外，GPT-4在预测方面也会出现差错，出错在于没有仔细检查工作。

存在的风险

GPT-4仍然存在与以前模型类似的风险，例如生成有害的建议、产生错误的代码或是不准确的信息。

OpenAI与50多位专家合作，根据更多用户的反馈，进一步对GPT-4的行为、安全性和监测系统进行改善。总的来说，通过干预，GPT-4增加了引发不良行为和反馈的难度。但仍然存在一些“越狱”的行为，违反了使用指南的内容。随着人工智能系统升级和风险的增加，这些干预措施和实现极高可靠性变得至关重要。

GPT-4和后续模型有可能以有益和有害的方式对社会产生重大影响。OpenAI正在与外部研究人员合作，以改进对潜在影响的理解和评估方式，并对未来系统中可能出现的危险能力进行评估。

06 国内相关产品的差距在哪里？

自2022年12月ChatGPT发布之后，无论是一级市场，还是国内外的大厂，都在发力大模型，研发类ChatGPT产品。百度也跟紧步伐，于2023年3月16日推出“文心一言”产品。

但事实上，国内的相关产品与GPT-4之间有着比较大的差距。“文心一言”在问答问题的准确性、灵活性、多样性上仍有提升空间，相较于GPT-4还稍显生硬和模式化。

而差距拉大的背后，是人才、资金投入和技术积累的差距。过去十几年里百度一直在AI方面投入，包括2019年推出文心大语言模型。2022年百度核心研发费用达到214.16亿元，占百度核心收入比例达22.4%。

但是，百度和OpenAI还有不小差距。李彦宏也表示，无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。因为深度学习、自然语言处理，需要多年的坚持和积累，没法速成。

王晟曾指出，中国的ChatGPT们即便奋起直追，静态来讲两三年能追上就已经是乐观情况。但如果对方一直进化，且进展速度远比追得速度要快，那么可能永远都追不上。直到对方遇到瓶颈不得不停下来，或者国内选手找到新的技术路径，才有可能打平。

虽然百度的“文心一言”仍有很多发展的空间，但相信随着人才、技术、资金的投入，我国的AI会发展得越来越好。

参考链接：

[1]https://openai.com/product/gpt-4

[2]https://openai.com/research/gpt-4

[3]https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/

来源：OpenAI官网、澎湃新闻，图片源于OpenAI官网，如侵删

监制：李璨

编辑：张佳玲（实习）

审核：刘煜

责任编辑：田江含

外国人来华政策，明起调整

享受挪威的免学费留学

硅谷银行破产事件愈演愈烈，将带来哪些影响？

3月13日：十四届全国人大一次会议闭幕

英国暑校申请进行时，让你的夏天与众不同

一起来听今年两会上代表委员有关教育、科技、人才的好声音

【《留学》“三缺一”】致力于实现每一个学生的名校梦

【独家】为全球学生解决教育费用问题 ——专访MPOWER Financing CEO Emmanuel Smadja

从新西兰到上海对优质教育的探索永无止境——专访哈罗上海校长Alex Reed

《留学》杂志总第209期 |寒假将至，如何合理安排假期？

扫描二维码

关注

【留学事务所】

微信公众平台

点击下方图片，了解留学杂志↓↓↓

联系我们

读者热线：400-803-1977

商务合作微信：13716319877

关注留学行业最新消息

客观深入报道行业事件

提供有价值的优质服务

想你所想为你而来

入驻光明网、网易、腾讯、今日头条、一点资讯等各大平台

继续阅读

阅读原文

关键词

GPT-4

模型

用户

微软

文本