撰文 | 新皮层小组
编辑 | 吴洋洋
年底将近,距离不少中国公司承诺的「GPT-3.5时刻」开始倒数——之前,几乎每家自研大语言模型(Large Language Models, LLMs)的中国公司都或多或少对外承诺过,要在今年年底使其模型性能赶上GPT-3.5。
检验时刻很快就要到了,不少公司都在赶工。本周,百川智能和阿里云都更新了其大模型。其中,百川把上下文窗口开得更大了,意味着用户可以一次性输入更多内容让模型解读(比如30万个汉字),模型也能记住更多,不容易聊着聊着就忘记前面说过的东西。阿里云则把模型参数变得更高了,从百亿级增长至千亿级,根据大模型的「规模定律」,当模型变得更大,其学习能力和智能水平就会更好。
作为第一家发布类ChatGPT产品的国内科技公司,百度也在持续巩固其(在国内的)领先优势。上周发布号称对标GPT-4的最新模型「文心4.0」后,本周,百度就将其加载到了收费版的文心一言中,定价59.9元/月。这个价格差不多只是微软、Google类似功能(30美元)的1/4,不过就国内市场而言仍是一个不算低的价格。除了在热门影视上映时为爱奇艺、腾讯视频等娱乐平台付费,中国用户还没怎么为生产力工具付过费,包括微软的Office套装。
本周,海外生成式AI的关键词也是成本。微软终于将其承诺许久的办公套件中的AI功能上线,不过它能获得多少付费用户目前是个未知数。加上AI功能的30美元后,微软办公套装的总成本将最高可至每人每月87美元。这个数字无论个人付费还是企业付费都不算低。而微软还未曾给出足够的证据,证明这些支出对于企业是值得的。
微软的定价嘴上说是来自于对用户付费意愿的调查,本质上还是成本。上个月,微软旗下同样加载了AI功能的代码工具GitHub Copilot,被爆在每位用户身上亏损20美元至80美元不等,用户用得越多,算力就消耗越多,亏损也越大。生成式AI的成本问题如今已是行业性挑战,Meta的大语言模型Llama2刚发布并开源时,被认为将颠覆闭源模型市场,但这个月,一个叫Cypher的初创公司就吐槽称,使用Llama2的算力成本是使用GPT-3.5 Turbo算力成本的上百倍。若算力问题不解决,开源就会梦碎。不过,这不意味闭源模型就是无忧的。
OpenAI即将于11月6日(北京时间为11月7日凌晨2点)召开发布会,主题之一也是如何降低模型成本。新皮层将追踪报道,请随时关注。
以下内容由新皮层团队制作:
Key Points
融资与商业篇
Anthropic获得Google 20亿美元投资;
百度上线文心一言收费版,每月59.9元;
微软办公套件上线AI功能,每月最高87美元;
钉钉公测生成式AI功能;
Meta开源大语言模型Llama2也有成本,还不便宜。
模型篇
百川智能新模型支持192k上下文窗口;
阿里云发布第二代通义大模型。
融资与商业篇
Anthropic获得Google 20亿美元投资
10月28日,Google表示已同意向人工智能初创公司Anthropic投资高达20亿美元。本轮融资后,Anthropic的估值或高达300亿美元,股价将高于OpenAI。
一个月前,Anthropic才从亚马逊那里融资40亿美元
今年9月,亚马逊与Anthropic达成投资协议,表示将投资近40亿美元,并以其中的12.5亿美元作为初期投资购买少数股权。为此,Anthropic将使用亚马逊云科技(AWS)作为主要云提供商。
Anthropic于2021年1月成立,是聊天机器人Claude 2的开发商,其创始人Dario Amodei曾任OpenAI的研究和安全副总裁。目前,Anthropic是大语言模型赛道估值排名第二的公司,仅次于OpenAI。
Anthropic为何需要那么多资金?
加上Google的20亿美元,Anthropic自9月以来已融资60亿美元,这些资金将被用来与OpenAI竞争。
Anthropic今年4月的一封内部文件显示,该公司计划筹集不低于50亿美元资金以直接对抗OpenAI,其中包括:在2024年年底之前花费10亿美元,以构建他们的下一代模型 「Claude-Next」,据介绍,该模型的功能要比当今最强大的模型还要强10倍。今年7月,Anthropic表示其已投入至少两个月的时间来开发最新的聊天机器人,有30至35人直接参与了AI模型的开发,总共有150人为其提供支持。
Google此前已投资过Anthropic
其实早在半年前,Google就已经向Anthropic投资3亿美元,获得了该公司10%的股权。当时,Anthropic也与OpenAI、Google、微软等一同受邀,参加了在白宫举行的关于「负责任的AI」发展讨论会。
除Google外,今年8月,SK Telecom Co. Ltd.也曾向Anthropic投资1亿美元;今年5月的4.5亿美元融资中,Google、Salesforce Ventures和Zoom Ventures都参与其中。
参考链接:
https://techcrunch.com/2023/10/27/ais-proxy-war-heats-up-as-google-reportedly-backs-anthropic-with-2b/
百度上线文心一言收费版,每月59.9元
11月1日,百度大模型文心一言正式上线专业版(基于文心4.0),定价59.9元/月,连续包月优惠价49.9元/月。这一价格约为ChatGPT的一半,目前,ChatGPT会员版的收费价格为19.9美元/月(约合140元/月)。除了付费版本,文心一言基础版(基于文心3.5)依然可免费使用。
相较于基础版,文心一言专业版基于百度10月17日发布的第4代大模型「文心4.0」。百度称,该模型对标GPT-4,而文心一言专业版将具有「更强的模型能力和图片生成能力,支持各种插件,适合需要使用文心一言编程、撰写文案、绘画设计等专业工作需求的用户」。
文心一言今年8月31日上线,官方称其当前用户规模约为4500万。
微软办公套件上线AI功能,最高87美元/月
11月1日,微软宣布生成式AI助手Copilot正式在其办公套件Microsoft 365(包括Word、Excel、Powerpoint、OneNote、Teams、OneDrive等)中上线,面向企业用户,每人每月30美元。
对企业规模有要求,且功能没有全部上线
微软在今年3月发布了最新版本的办公套件Microsoft 365 Copilot,增加了生成式AI助手Copilot,能够提供文档汇总、生成电子邮件、根据笔记创建计划、改进Excel分析等功能。
此次上线的Microsoft 365 Copilot对市场有些不够友好:首先,它要求企业客户至少拥有300个用户;而与此同时,不少产品中的生成式AI功能尚没有开放,例如Excel产品中Copilot功能仍处于预览阶段,OneNote产品中的Copilot功能仅限Windows平台使用,SharePoint、OneDrive产品中的Copilot功能则连预览版也没有。
加上基础订阅费,使用Microsoft 365 Copilot成本高达87美元/月
今年7月,微软就披露了Microsoft 365 Copilot订阅费用是每人每月30美元。这意味着,微软企业客户订阅Microsoft 365 Copilot,软件订阅费用最高将达到87美元/月——其中包括原先使用Microsoft 365办公套件就要支付的订阅费(有36美元和57美元两个版本),如今还要加上Copilot的生成式AI功能费30美元。
微软首次透露30美元的定价逻辑
效仿微软,Google对于办公套件中使用的生成式AI(Duet AI)的定价也是30美元。
对于这一定价策略,负责Microsoft 365的微软公司副总裁Jared Spataro称,每月30美元是在研究了客户愿意为人工智能提供的帮助支付多少费用后确定的。同时,微软也研究了「人均成本的数学题」,即每月30美元到底相当于雇佣一名知识工作者成本的多少,以及AI究竟需要创造多大收益,才能合理化为其花费的额外成本。
Spataro称,微软已经收集了足够数据,表明Copilot可以大幅提高工作效率。它计划在11月14日举行的年度Ignite会议上披露调查结果
此前有分析师称,微软Microsoft 365 Copilot可能覆盖大约1.5亿名企业员工,但华尔街似乎预期不高。投资银行TD Cowen分析师Derrick Wood认为,微软客户可能不愿意在整个企业范围内使用该产品。根据他的测算,即使成功推广,微软2025财年营收也可能只增长1%,大约20亿至25亿美元。
参考链接:
https://techcommunity.microsoft.com/t5/microsoft-365-copilot/microsoft-365-copilot-is-generally-available/ba-p/3969331
https://www.ft.com/content/81db7c36-f9ae-496b-9dd4-971aefe6f9a9
钉钉公测生成式AI功能
11月3日,在超过50万家企业内测后,钉钉的生成式AI功能——AI魔法棒启动公测。所有用户可直接在钉钉首页的「魔法棒」入口,以对话方式使用聊天AI、文档AI、宜搭AI等功能,或在文档、知识库、脑图、闪记、Teambition等17个产品的各自界面中,点击魔法棒按钮来提供适合的技能。
Meta开源大语言模型Llama2也有成本,还不便宜
The Information报道称,创建虚拟聊天角色的产品Cypher的创始团队发现,他们在产品中采用Meta公司开源大语言模型Llama 2所需要的云计算算力更多。
今年8月,使用Llama 2的Cypher当月耗费了价值1200美元的Google Cloud云计算算力,而切换成GPT-3.5 Turbo后,每月所需云计算成本下降到了每月5美元
Llama 2是Facebook母公司Meta今年2月发布的第二代大语言模型,向所有开发者开源。当时,Meta声称该模型相比其他模型需要的算力大幅减少。
导致使用开源模型算力成本更高的原因可能与模型本身的「粗糙性」有关,因为免费,所以它并没有像闭源的GPT-3.5那样已经极大程度上降低了使用者调用模型的复杂度,更没有为适配不同场景提供多种能力相当但规格更小的模型。
开源模型可能的确更耗算力,不过,请注意这里的成本计算的只是算力,并没有算上调研模型本身需要支付的模型使用费用
参考链接:
https://www.theinformation.com/articles/metas-free-ai-isnt-cheap-to-use-companies-say
https://www.theinformation.com/articles/what-it-takes-to-make-open-source-ai-cheaper-than-openai-microsoft-goes-multimodal
模型篇
百川智能发布模型支持192k上下文窗口

10月30日,百川智能发布Baichuan2-192K大模型,其上下文窗口长度最高可支持192k个token(注:相当于14.4万个单词,不过百川智能称该模型能够处理约35万个汉字),为目前全球最长的上下文窗口。
该模型的上下文窗口长度是GPT-4的6倍
上下文窗口长度是大型语言模型的核心指标之一,窗口长度越长,意味着模型理解文本的能力越强,从而可以更准确、流畅地生成内容。如果窗口长度不够长,就会限制律师、分析师、咨询师等需要分析和处理较长文本的工作者使用模型
不过,超长的上下文处理也需要更高的算力以及更大的显存,一般用户很难支持这样的模型成本。百川智能称,新模型将以API调用和私有化部署的方式提供给企业用户。
•OpenAI的GPT-4:支持32k上下文窗口,可处理2.5万个单词;
•Anthropic的Claude 2:上下文窗口为100k,能够处理约7.5万个单词; 
Moonshot AI的Kimi Chat:上下文窗口20万字(注:如果Baichuan2-192K上下文长度确实达到35万字,就会超过Kimi Chat的纪录)。 
百川智能
该模型目标是传媒、金融、法律等场景
Baichuan2-192K模型是百川智能发布的第7款模型,也是首个以上下文窗口长度命名、而非模型参数量命名的模型。从命名方式上可以看出,它基于百川智能的第二代大模型Baichuan2开发。
百川智能称,Baichuan2-192K现已正式开启内测,并已与财经类媒体及律师事务所等机构达成合作,用于传媒、金融、法律等场景中。
百川智能是搜狗创始人王小川在今年4月创立的大模型公司,公司成立以来累计融资3.5亿美元。目前,百川估值超过10亿美元,为国内晋升生成式AI独角兽用时最短的初创公司。百川智能目前团队规模170余人,已发布两代大模型,其中参数规模在70亿和130亿的模型(Baichuan-7B/13B、Baichuan2-7B/13B)都已开源,两个参数规模为530亿的模型(Baichuan-53B、Baichuan2-53B)为闭源模型,也是该公司目前规模最大的模型。
参考链接:
https://mp.weixin.qq.com/s/lAJh6qGG27u_qCl0kI-0lA
阿里云发布第二代通义大模型
10月31日,阿里云在2023年云栖大会上发布通义千问2.0模型,参数量达到千亿。
相较于1.0,2.0 有哪些提升?
今年4月11日的阿里云峰会上,阿里云推出第一代大语言模型「通义千问」。阿里云当时并未公布该模型的参数大小,但据公开报道,该模型参数约为200亿至300亿。相较于通义千问1.0,通义千问2.0在参数规模上有大幅跃升,与腾讯的混元大模型相当,不过仍然不是业界参数量最大的模型:
参数大小构成模型能力的天花板。一般来说,参数越大,模型潜力越大,能够学习的东西越多。阿里云称,相较于1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。英语任务方面,2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,模型理解和表达能力都有所加强。
除了对话功能,通义大模型官网还上线了多模态和插件功能,支持图片理解和pdf文档解析。阿里云称,目前通义千问的综合性能已经超过GPT-3.5,正在加速追赶GPT-4。
除了基础模型,阿里云还发布了8个行业大模型:
•编码助手「通义灵码」
•阅读助手「通义智文」
•投研助手「通义点金」
•智能客服「通义晓蜜」
•个人健康助手「通义仁心」
•法律助手「通义法睿」
•个性化角色创作平台「通义星尘」
•音频转写助手「通义听悟」(6月发布)
阿里云表示,8大垂类模型使用了垂直领域数据专门训练。未来,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的AI应用中。
此外,阿里云计划近期开源通义千问的72B(B即billion,72B即720亿参数)版本。8月和9月。公司已分别开源7B(70亿参数)和14B(140亿参数)版本的模型,累计下载量超过100万。
阿里云CTO周靖人称,目前中国已有一半大模型公司跑在阿里云上,包括百川智能、智谱AI等公司的大模型;而阿里云并不是想做一款To C的终端应用,更希望开放模型能力,服务好开发者。
-END-
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。
在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的智能,不只是 AI。
若想了解更多本周资讯,请点击阅读往期智能周报:
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
本文版权归第一财经所有,
未经许可不得转载或翻译。
识别下图二维码,
即可购买《第一财经》杂志2023年11月刊
继续阅读
阅读原文