《Her》中的剧情真的进入了现实。
-----------------------
文|frank
5月14日凌晨,美国人工智能研究公司OpenAI在线上举办了“春季更新”活动。
活动主要阐述三件事情:
免费优先:在未来,OpenAI 的产品策略将聚焦于免费提供服务,目的是让尽可能多的用户能够享受到先进的人工智能技术。
用户体验革新:发布了全新的桌面应用程序和更新后的用户界面。这些改进使得产品的使用变得更为直观和自然,极大提升了用户体验。
推出全新的大模型 GPT-4o:继 GPT-4 之后,OpenAI 推出了名为 GPT-4o 的新一代大模型。
01

GPT-4o登场

OpenAI在活动中发布了新旗舰模型“GPT-4o”,GPT-4o的“o”代表“omni”。该词意为“全能”,源自拉丁语“omnis”。在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。
据介绍,新模型使ChatGPT能够处理50种不同的语言,同时提高了速度和质量。它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,“与现有模型相比,GPT-4o在图像和音频理解方面尤其出色。”
在发布会现场,OpenAI 工程师通过一个 iPhone 展示了 GPT-4o 的几项主要功能。最引人注目的是其实时语音对话能力。
在一个轻松的示例中,他对着GPT-4o说:“我站在台上有点紧张,该怎么办?”
GPT-4o回答:“你太棒了,深呼吸一下吧,记得你可是个专家。”
Mark Chen随之大声喘气,问GPT-4o接下来还能给些什么建议。
对方回答:“放松点Mark,呼吸得慢一点,你又不是吸尘器。”
视频:YouTube@OpenAI; 字幕:@Translia
GPT-4o充分展示了其对人类情感的敏感和响应速度。机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸,还可以根据用户要求变换语调。
在 GPT-4o驱动下的ChatGPT,已不再是一个单纯追求性能的AI工具,而是开始主动给予“情绪价值”。整个过程,仿佛它是个坐在你对面的人类,完全没有AI的机械感和僵硬感!
在GPT-4o之前,用户使用语音模式与ChatGPT对话时,GPT-3.5的平均延迟为2.8秒GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,让GPT-4无法直接观察音调、说话的人和背景噪音,也无法输出笑声、歌唱声和表达情感。
与之相比,GPT-4o可以在232毫秒内对音频输入做出反应,与人类在对话中的反应时间相近。
GPT-4o 目前看来具有以下先进特性:
实时交互:用户可以随时打断 AI,无需等待其完成发言,即可继续对话。
快速响应:模型的反应速度极快,甚至超过人类的反应时间。
情感交互:GPT-4o 能够理解并表现出人类的情感,使交互更加自然和富有同理心。
视觉和推理方面,研发负责人Barret在纸上现写的方程,让 ChatGPT 不是直接给答案,而是让它解释要一步步怎么做。Barret在纸上写下这样一个方程:3x+1=4。然后问ChatGPT自己写的是什么方程,ChatGPT语调自然地回答出来了。随后,在Barret的要求下,它一步一步说出了解题步骤。
视频:YouTube@OpenAI; 字幕:@Translia
ChatGPT 说,每当你为数学焦头烂额的时候,我就在你身边。随着Barret在镜头中解题,ChatGPT还能够实时地就给出鼓励以及引导。
接下来,ChatGPT被要求讲一个睡前故事,主题是「恋爱中的机器人」。
ChatGPT没讲几秒,就被人类粗暴地打断了:「多点情绪,故事里来点戏剧性行不?」
ChatGPT表示ok,用更起伏的声调、更夸张的语气开始讲起了故事。
结果没几秒,它又被再次打断:「不行不行,再多点情感,给我最大程度的表达可以吗?」
接下来,我们听到一个仿佛在舞台上表演莎剧的ChatGPT,语气夸张到仿佛是个戏剧演员。随后,它又多次被打断,并且耐心地按照人类的要求,依次变成了机器人声和唱歌模式。
ChatGPT听到要求自己唱歌时,甚至叹了口气,然后开始亮起了优美的歌喉。
GPT-4o 加持的 ChatGPT 正在变得越来越“情绪化”。它已不再是工具,更像是你在生活中的好朋友。
在直播活动尾声时,OpenAI首席技术官Mira Murati说道,“感谢杰出的OpenAI团队,也感谢Jensen(黄仁勋)和英伟达团队为我们带来了最先进的GPU,使今天的演示成为可能。”
发布会结束后,奥特曼也在自己的账号上,发表了一个单词——“Her”。
《Her》中的剧情真的进入了现实。
02

免费使用

为了让每个人无论身在何处,都能随时用上ChatGPT,OpenAI发布了ChatGPT的桌面版本,OpenAI 的目标就是让人们可以随时随地的无感使用它。
它拥有桌面应用程序,和全新的用户界面,可以很轻易地和我们的工作流融为一体。
只需一个简单的快捷键——Option+空格键,就可以立即召唤桌面版ChatGPT。
ChatGPT 用户将免费获得更多高级功能
每周都有超过一亿人使用 ChatGPT,OpenAI 表示 GPT-4o 的文本和图像功能今天开始免费在 ChatGPT 中推出,并向 Plus 用户提供高达 5 倍的消息上限。
“我们的使命包括向尽可能多的人提供先进的AI工具。每周超过1亿人使用ChatGPT。我们开始向ChatGPT推出更多智能和先进的工具未来几周的免费用户。”
现在打开 ChatGPT,我们发现 GPT-4o 已经可以使用了。
使用 GPT-4o 时,ChatGPT 免费用户现在可以访问以下功能:体验 GPT-4 级别智能;用户可以从模型和网络获取响应。
此外,免费用户还可以有以下选择 
分析数据并创建图表:
和拍摄的照片对话:
上传文件以获取总结、写作或分析方面的帮助:
OpenAI CEO 山姆·奥特曼关于「全民免费计算」的愿景
在最近的一个采访中,OpenAI的CEO山姆·奥特曼分享了一个颇具前瞻性的概念——「全民免费计算」(universal basic compute)。这一构想基于以下观点:随着AI技术的日益先进和普及,每个人都能免费获取到像GPT这样的计算资源,这些资源将成为未来社会中比金钱还要宝贵的资产。
奥特曼解释说:"这个想法是,随着AI变得更加先进,并嵌入到我们生活的方方面面,拥有像GPT-7这样的大语言模型单元可能比金钱更有价值。你拥有了部分生产力。"
GPT-4o的发布标志着OpenAI朝着实现这一愿景迈出初步的脚步。
新的模型会带来怎样的变化,让我们拭目以待!
「往期推荐」
END
欢迎全国各地以及境外科技、消费、地产、医疗、农业、能源、环保、教育、文化、投行、基金、券商、信托、银行、保险、租赁、投资等产业及金融精英,寻找优质项目、资金及获得全球顶级金融圈层请联系Cathy,或者在菜单中点击【合作】——>【青投服务】,留下您的需求我们将竭诚为您服务。
青投创新,新型科创产业服务平台,以科技、人才、资本为核心,通过内容出版、数据支持、产业咨询、科技转化等业务,为科技人才创业项目提供孵化及加速赋能服务,助力国家科技兴国计划。
继续阅读
阅读原文