在 OpenAI 举办春季发布会中,全新的旗舰AI模型 GPT-4o 免费公布,再次刷新我们对AI的认知。只多一个 o,却多了很多新功能。
来自于@OpenAI,版权属于原作者
便携的真人助手
在GPT-4o之前,GPT-4无法直接观察音调、说话的人和背景噪音;也无法输出笑声、歌唱声和表达情感;
但这次的 GPT-4o可以在232毫秒内,对音频输入做出反应。
用一句通俗易懂的话来说就是,更像真人了。
比如:
GPT-4o能够从用户急促的喘气声中,理解“紧张”的含义。并指导用户进行深呼吸。
来自于@OpenAI,版权属于原作者
此外,它还能按要求改变说话语气,从冰冷机械到幽默娇羞都信手拈来,而且能随时高歌一曲,听起来与真人无异。 
文本+音频+图像 三位一体
首先,GPT-4o可以接受文本、音频和图像,三者组合作为输入,并生成文本、音频和图像的任意组合输出。
在直播中,OpenAI高管启动摄像头,要求实时完成一个一元方程题,GPT-4o轻松完成了任务。
如果你展示一段代码,它会进行理解并告诉你代码有什么问题。 
此外,还能够对代码和气温图表进行实时解读。
图片来自于@OpenAI,版权属于原作者
免费开放,API定价下降
GPT-4o向所有人免费开放,可实时跨文本、音频、视觉(图像与视频)进行推理。
API定价只有GPT-4 Turbo的一半,速度达到GPT-4 Turbo的2倍。
付费的ChatGPT Plus用户将获得5倍调用额度。
推出桌面版
近期,ChatGPT 不用注册也可以使用了;
今天,ChatGPT又增加了桌面程序,付费用户能提前访问其全新macOS桌面App和下一代语音及视频功能。 
看来ChatGPT真的要做到在不知不觉中将AI融入大家的工作流中。
《Her》照进现实
图片来自于@Sam Altman,版权属于原作者
在发布会前后,CEO Altman 在社交平台上神秘地留下一句“her”,似乎在暗示 ChatGPT 实现了经典电影《她》(Her)中像人类一样“有血有肉”的AI。 
一个小插曲:
当负责人Barret Zoph在现场对ChatGPT说到“你有多不可思议”时,
ChatGPT仿佛有自己的情绪,语气夸张地说道:“快别说了!你让我感到害羞。”
《Her》中的世界,真的离我们不远了。
THE END
编辑:大力
推荐阅读
人机恋要成真了?!👇🏻
继续阅读
阅读原文