“OpenAI叛军”突起,GPT-4一夜之间被拉下神坛!
昨天,Anthropic发布最新Claude 3系列模型,让全球用户再次沸腾!
据了解,Claude 3在多模态和语言能力指标上,已全面碾压GPT-4。
甚至在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准。
网友直呼,大模型又变天了!
Anthropic是谁?
据说,Anthropic就是原OpenAI员工组建的公司,因为一些发展理念不合才直接“反叛”,并成为了OpenAI的最强劲敌。
本次Anthropic共发布三个模型,性能依次从低到高分别是:Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus,并发布了一份长达42页的技术报告。
其中,Claude 3 Opus在本系列中性能最强大。该模型已在多项AI系统常用评估标准中领先业界LLM,如本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K)等。
值得一提的是,Claude 3 Opus在处理复杂任务时,其理解和表达能力几乎接近于人类。这意味,人类朝AGI又近了一步。
如果讲得更具体一些,Claude 3系列模型的超强性能主要体现在五个方面:
一是3秒即可读完10k token论文。
Haiku可在3秒内,阅读一个包含图表和图形的信息和数据密集型的研究论文(大约10k token)。
二是超强多模态视觉能力。
该系列模型可处理各类视觉格式,如照片、图表、图形和技术绘图等,甚至在部分视觉能力上,性能刷新SOTA。
三是完善因理解不到位,而拒绝回答的问题。
尤其是可能触及系统安全边界的提问时,大幅度减少了拒绝回应的情况。
四是跟此前版本相比,Claude 3模型准确度大幅提升。
且,未来可能还会增加“引用功能”,即直接指向参考材料中的具体句子,从而验证答案。
五是支持200K超长上下文。
Claude 3系列模型,都将支持至少20万token的上下文窗口和超100万token的输入。且,官方或将向特定用户开放处理更大上下文窗口的功能。
报告数据显示,Claude 3 Opus在200Ktoken的“大海捞针”(NIAH)测试中,准确率高达99%+。
目前,Claude 3 Sonnet、Claude 3 Opus,可在claude.ai及其覆盖159个国家的Claude API上使用。目前开通Claude Pro的用户,则可直接使用性能最强大的Claude 3 Opus。
体验地址:https://claude.ai/chats
获取Anthropic发布的42页技术报告,可在公众号后台回复「0305」
近期原创 关注阅读
扫描下方二维码,立即报名参选
↓↓↓
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。