新智元报道  

编辑:桃子 好困
【新智元导读】GPT-4o之后,ChatGPT又迎来更新。这次,数据分析能力再上一个新台阶,将支持谷歌、微软在线文档上传,并实时交互,自定义图表。更重要的是,网友已经灰度测试到背后的新模型了。
ChatGPT更强了...

刚刚,OpenAI再次放出大招——ChatGPT可以直接打开线上数据文件,完成实时数据分析。
全新的增强功能,具体包括:
- 直接从Google Drive和Microsoft OneDrive上传最新版本的文件
- 在新的可扩展视图中与表格和图表进行交互
- 自定义并下载图表,用于演示文稿和文档
现在,ChatGPT可以支持单个/多个文档上传,通过写Python代码,即可分析数据。
不管是多么复杂的数据任务,它都可以轻松搞定,比如合并处理数据集,并创建图表,提供数据洞察。
「世界上某处的咨询分析师,刚刚流下了一滴幸福的泪水」。
还有网友表示,「OpenAI这一招又将扼杀许多初创公司了」。
ChatGPT这一强大能力,据称是在新模型加持下完成的。
同在今天,网友纷纷晒出自己灰度测试到的新模型ADA V2(GPT-4),而且它的编码能力非常强大。
GPT-4o发布会才过去三天,OpenAI不间断给每个人惊喜和震撼,而更强大「GPT-5」或许就等着我们呢。
一些免费用户已经灰度测试到GPT-4o
爆料人Flowers称,「GPT-5将会增加一种全新的模型,到目前为止还没人考虑过」。
微软谷歌「办公全家桶」,文件上传一键分析
ChatGPT数据分析能力,表现如何?
从Google Drive和Microsoft OneDrive添加文件
以往,若想让ChatGPT分析数据,唯一的入口是,上传电脑本地的文档。
这时,就需要,将文件下载到本地,然后再上传到ChatGPT。
单个文件还好,如果有数百个文件,就很麻烦了。
而现在,人们可以将Google Drive和Microsoft OneDrive关联ChatGPT,登录成功后,可以选择在线的文件了。
包括微软的Excel、Word、PPT,还有谷歌的Sheets、Docs、Slide,都可以一键上传。
如下图演示中,关联了谷歌账号。
然后,选择自己在线文件中的一个表格文件,然后就可以问ChatGPT任何信息了。
实时处理表格
此外,当你上传数据集后,ChatGPT便会创建一个交互式表格。
然后,可以选取表格中任何一部分,与ChatGPT进行互动。
比如,选取如下表格中的「类别」一列,让后让ChatGPT找出表中哪个类别花费最高。
然后,ChatGPT立刻分析得出了结果,还可以做出可视化的表格。
另外,你还可以从ChatGPT的建议提示中选择数据,进行更深入的数据分析。
自定义可供演示的图表
第三个新能力,便是自定义可供演示的图表。
也就是说,你可以让ChatGPT去生成条形图、折线图、饼图和散点图等形式,并可以与其交互。
比如,要求ChatGPT「按组群绘制保留率图表,并撰写几个简短的要点」。
随后,ChatGPT就给出了所示的图表。
你还可以在右上角的设置中,选择曲线标注的任意颜色,并下载图表,以便在演示文档中使用。
最后所有人担心的数据隐私问题,OpenAI称,他们不会用ChatGPT团队和企业客户的数据进行训练,ChatGPT Plus用户可以通过「数据控件」选择关闭数据用于训练的选项。
新模型ADA V2灰度测试中
GPT-4o刚刚上手没几天,ADA V2(GPT-4)又出现了,全网都在寻找这个新模型的蛛丝马迹。
有网友表示,ADA就是代表着Advanced Data Analysis V2,就是让ChatGPT分析数据变强大的主要原因。
还有人分析代码后得出,gpt-4-ada-v2模型有128k上下文,被标记为「机密」,看起来是内部开发的原型。
这似乎是一次意外的发布。
或许gpt-4-ada-v2还是一个嵌入模型。

用Reddit数据训LLM

OpenAI的数据版图,又扩大了一块。
几天前,OpenAI刚刚公布了与Stack Overflow的合作,却遭到了社区人员的反对。
有人甚至要把自己所有的回答,一一删除。
而今天一早,OpenAI再次宣布与另一个著名的AI社区Reddit合作,预计将Reddit内容用来训练ChatGPT。
OpenAI官博还为自己使用数据,找了一个非常高大上的理由:
Reddit是一个庞大而活跃的社区,长期以来一直是互联网上重要的对话空间。
保持互联网开放至关重要,开放的一部分意味着需要让Reddit的内容对那些致力于人类学习和研究如何在线构建社区、归属感和赋权的人士开放。
不仅如此,使用LLM、ML和AI技术可以帮助Reddit改善用户体验。
这项合作,将为用户群体带来诸多好处:
- OpenAI将把改进后的Reddit内容带到ChatGPT和新产品中,帮助用户发现并参与Reddit社区。
为此,OpenAI将访问Reddit的数据API,该API提供来自Reddit的实时、结构化和独特的内容。这将使OpenAI的人工智能工具更好地理解和展示Reddit内容,尤其是关于最新话题的内容。
「简之,我要用你们的数据,清洗过滤后,以训练自家的模型」。
- 这项合作还将使Reddit能够为Redditors和版主带来新的基于AI的功能。Reddit将基于OpenAI的人工智能平台,实现其强大的愿景。
「我用自己的AI能力和你的数据交换,这样,能够赋能Reddit全新的AIn能力」。
- 最后,OpenAI将成为Reddit的广告合作伙伴。
OpenAI首席运营官Brad Lightcap表示,「我们非常高兴能与Reddit合作,利用独特的及时且相关的信息来增强ChatGPT,并探索利用AI驱动的功能丰富Reddit体验的可能性」。
与此同时,Reddit联合创始人CEO对这项合作,也发表了自己的看法:
Reddit已经成为互联网上最大的开放档案库之一,汇集了关于任何事物的真实、相关的人类对话。将其纳入ChatGPT符合我们对互联互通的信念,帮助人们更容易找到他们想要的信息,并帮助新用户在Reddit找到社区。
有网友表示,现在谷歌对Reddit的访问量增加了5亿。
谷歌现在充斥着越来越多的Reddit搜索结果,排在前3名。这在某种程度上是让更多用户使用Reddit的交易的一部分,因此谷歌获得了更多的数据。
而现在,这一切数据,都要交给OpenAI了。
不知,这次AI社区研究人员对此的反应如何?
参考资料:
https://openai.com/index/improvements-to-data-analysis-in-chatgpt/
https://x.com/OpenAI/status/1791227287569932368
https://x.com/OpenAI/status/1791205420142670250
https://x.com/nanulled/status/1791232438334566783
继续阅读
阅读原文