撰文 | 新皮层小组
编辑 | 吴洋洋
中国大模型初创公司获得了越来越多的融资。
百川智能和智谱AI都在本周宣布了今年以来获得的资金额度:加上天使轮,百川智能一共融资3.5亿美元(约合人民币25.6亿元);同样位于北京的智谱AI获得的资金总额也超过25亿元。资本对于这押注说明了这两家公司的模型能力,也让原本混沌的「百模大战」格局开始清晰,为两家公司接下来训练更先进的模型提供了弹药。不过,市场留给它们的喘息时间不会太久。
一方面,粮草充足的巨头们并没有放慢脚步。Meta在本周发布了一个新模型,可以实时根据MEG(Magnetoencephalography,脑磁图)数据解读大脑视觉皮层信号。相较于之前业界使用fMRI(Functional magnetic resonance imaging,功能性磁共振成像)数据训练模型和解码静态图像数据,Meta实现了对动态视觉数据的实时解码。Google则在本周推出了类似多邻国的英语学习功能,为部分地区的Android用户提供互动式的英语口语练习。在国内,中国科技大公司百度也效仿微软,把生成式AI加载到了其现有的一系列应用中,从面向C端的办公工具,到帮助B端用户完成商业分析、营销方案的商业软件,以及一个向「数字人」开放的直播平台。
这些大公司手上都有现成的大流量应用和云计算团队,可以将其训练出的大模型更快交付到C端用户以及需要微调模型的B端用户手中。无论在硅谷还是中国,初创的人工智能公司都缺乏这样的资源。百川智能、智谱AI们看起来获得了不菲投资,但只要考虑到它们需要投入的领域:技术路线探索、寻找商业模式、设计出足够吸引人的应用,还有构建模型生态,就会很快发现它们可以使用的资源多么有限。
对照下它们的硅谷同行们就知道了。已经融资了100多亿美元的OpenAI仍然在积极寻求通过出售股票来融资,Claude的母公司Anthropic在获得亚马逊承诺投资40亿美元后也没有止步,又开始与Google谈判,希望再融10亿美元,因为它估计要开发下一代更强大的模型需要50亿美元。
资金的有限性只是中国初创大模型公司们面对的挑战之一。另一方面,它们所处的时代对它们构建全球竞争力也不太有利。本周,美国在「芯片出口管制」规定出台一周年之际更新了该规定,进一步收紧了对于中国的芯片出口禁令。包括英伟达旗下的A800和H800芯片、英特尔的Gaudi 2芯片、AMD的MI250芯片都不再能销售给中国的数据中心,这些都是训练大模型的必备芯片。国内能够提供差不多性能GPU的壁仞科技、摩尔科技也遭到制裁。
不过,关于芯片过去一周也不全是坏消息。佳能本周发布了一款用「纳米压印」技术制造芯片的设备,该设备已经能够制造相当于5nm工艺的芯片,而且不采用ASML那样的光刻技术,有助于绕过美国如今对于光刻机设备的管制。
以下内容由新皮层团队制作,欢迎关注和评论。
Key Points
芯片篇
佳能发布用「纳米压印」制造5nm工艺的设备;
美国更新「芯片禁令」, A800和H800都被涉及。
软件篇
百川智能获阿里、腾讯、小米等3亿美元投资;
智谱AI今年总计完成超25亿元融资;
Meta在实验室实现对大脑视觉皮层的实时解码;
Google搜索上线英语辅导功能,对标多邻国。
芯片篇
佳能发布用「纳米压印」制造5nm工艺的设备续跌
10月13日,佳能推出最新的纳米压印(Nano-Imprint Lithography, NIL)半导体制造设备FPA-1200NZ2C。佳能称,该设备能够制造相当于5nm工艺的半导体,未来可能升级成相当于2nm的工艺。东芝已经开始使用该设备。
佳能「纳米压印」技术原理与印章相似
传统的光刻设备通过将电路图案投影到涂有抗蚀剂的晶圆上来转移电路图案,而佳能的新设备采用NIL「纳米压印」技术,将印有电路图案的「掩模」压印在晶圆上的抗蚀剂上,如同「印章」般实现「电路转移」过程。
佳能纳米压印(上)与传统光学光刻(下)
佳能称,NIL纳米压印技术可实现最小线宽14 nm的图案化,相当于生产目前最先进的逻辑半导体所需的5nm节点。后续掩模技术改进后,纳米压印有望实现最小线宽为10nm的电路图案,相当于2nm节点。
纳米压印原理与活字印刷术类似。用「印章」(即掩膜)来解释的话,就是将栅极长度只有几纳米的电路先雕刻在「印章」上,再将「印章」盖在覆有印胶的晶圆上,得到与「印章」相反的图案,而后通过脱模就能够得到芯片。
佳能没有给出制造「印章」(掩膜)的细节,公开资料显示,雕刻这种掩膜的技术与用传统光刻机刻蚀芯片的过程相似。
「纳米压印」有何竞争优势?
目前,芯片制造的主流设备仍然是光刻机,它使用不同尺度的光源作为「雕刻」工具。荷兰的ASML目前占据光刻机市场82%的份额,该公司旗下的极紫外(EUV)光刻机用于制造10nm以下的先进制程,日本的佳能、尼康分别在光刻机市场占有约10%、8%的份额。中国的上海微电子占据其中更少的份额。
相较于「光刻」,「纳米压印」技术相当于先用刻芯片的技术刻掩膜,然后再用掩膜去印芯片。芯片生产流程因此可以从直接光刻所有芯片,变成刻掩膜和印芯片两个分离的环节。
•成本:通过纳米压印,制造芯片不再需要曝光设备中使用的光源或大直径透镜,意味着芯片生产设备本身可以更简单且更便宜。相较于光刻机,每台纳米压印光刻设备都更小,可以在有限空间内设置多台纳米压印设备,从而提高生产率。
•良率:刻掩膜和印芯片的分离有利于提升先进制程芯片的良率。因为只需要成功刻出掩膜——不需要很多张,就可以大批量印制芯片。而现行的光刻技术在量产芯片时,需要对每张芯片当场曝光。苹果的3nm芯片发热已经被爆料存在良率不高的可能性。
•安全性:纳米压印技术跳过了光刻技术,现有贸易限制不太可能明确禁止。目前,佳能发言人拒绝就新设备是否受到日本出口限制发表评论。
佳能在纳米压印技术上投入已近20年
佳能自2004年开始研究纳米压印技术,随后于2014年通过收购美国德州的Molecular Imprints加大对于该技术的投资。
2022年12月的第三季度财务会议上,佳能董事长兼CEO御手洗富士夫(Fujio Mitarai)表示,佳能正处于在大规模生产中应用纳米压印技术的最后调整阶段。按照计划,佳能东京北部栃木县的新工厂将于2025年投入使用,该工厂主要用于生产相对低端的光刻机KrF、i-line,以及增产纳米压印设备。
参考链接:
https://global.canon/en/news/2023/20231013.html
美国更新「芯片禁令」, A800和H800都被涉及
10月17日,美国政府更新「芯片禁令」,由英伟达等公司设计的AI芯片(比如A800和H800)将被禁止进口到中国。新规将于30天内生效,并且可能「至少每年更新一次」。
先进AI芯片被禁止向中国出口
修改后的出口管制将禁止向中国出售运行速度为「300万亿次浮点运算/秒」及以上的数据中心芯片,以及性能密度为「370亿次浮点运算/每平方毫米」及以上的数据中心芯片。
根据新规,英伟达旗下的A800和H800芯片、英特尔的Gaudi 2芯片、AMD的MI250和即将推出的MI300芯片都将在禁止范围内。
受影响的公司将是阿里巴巴、腾讯、百度、字节跳动、华为等运营数据中心(即云计算业务)的中国公司,并进一步影响有大模型训练需求的下游公司。英伟达数据中心芯片收入中有多达25%来自中国。
美国商务部部长称,用于笔记本电脑、智能手机和游戏等消费领域的芯片可以豁免。
壁仞科技、摩尔科技被制裁
在新的芯片规定中,美国商务部将13家中国企业列入「实体清单」,其中包括两家GPU设计公司壁仞科技、摩尔科技及其子公司。
这两家芯片设计公司都由英伟达前员工创立。其中,壁仞科技成立于2019年,于2022年8月发布通用GPU芯片「BR100」;摩尔科技成立于2020,于2022年3月发布GPU芯片「苏堤」和三款桌面级显卡MTT S60、MTT S70和MTT S80。
对于壁仞科技和摩尔线程来说,被制裁意味着无法进口美国技术或产品,同时也无法使用基于美国技术或设备的晶圆厂为其代工芯片。
2019年以来诞生的芯片管制
2019年5月,美国商务部将华为及70家关联企业列入「实体清单」。如果没有美国政府批准,华为将无法向美国企业购买元器件。
2020年1月,美国成功说服荷兰政府,禁止光刻机设备供应商阿斯麦尔(ASML)向中国出口极紫外光刻机(extreme ultraviolet, EUV)。
2022年8月,美国总统拜登签署《芯片和科学法案》(the Chips and Science Act),为美国半导体生产、研究和劳动力发展提供527亿美元,以将半导体制造业引回美国。
2022年10月,美国发布第一版「芯片出口管制」,针对半导体制造和先进芯片生产的对华出口,并将科大讯飞、大华技术和旷视科技等中国公司列入「实体清单」。
2022年11月,英伟达推出A100(7nm)和H100(4nm)的较低带宽版本——A800和H800,专供中国市场。
2023年6月,荷兰出台《先进半导体制造设备法规》,要求半导体厂商在出口先进的DUV设备时需申请出口许可。
2023年8月,拜登政府拟限制美国公司投资中国敏感技术(半导体、人工智能和量子计算)领域。
2023年10月,芯片出口管制更新,限制英伟达、英特尔、AMD芯片向中国出口人工智能芯片。
参考链接:
https://www.reuters.com/technology/nvidia-may-be-forced-shift-out-some-countries-after-new-us-export-curbs-2023-10-17/
软件篇
百川智能获阿里、腾讯、小米等3亿美元投资
10月17日,百川智能宣布已完成A1轮战略融资,融资金额3亿美元,投资方包括阿里巴巴、腾讯、小米等。
目前,百川估值超过10亿美元,为国内晋升生成式AI独角兽用时最短的初创公司。
百川智能团队规模170余人
百川智能成立于今年4月10日,由搜狗创始人王小川创立。其核心团队由来自搜狗、Google、腾讯、百度、华为、微软、字节等科技公司的AI人才组成,目前团队规模170余人,其中研发人员占比超80%。
已发布两代大模型
6月15日,百川智能发布第一代大模型Baichuan-7B,拥有70亿参数,该模型在大约1.2万亿tokens上训练,支持中英双语,上下文窗口长度为4096;7月11日,拥有130亿参数的模型Baichuan-13B(即130亿参数)发布。
9月6日,百川智能发布第二代大模型Baichuan2(同样有7B和13B两个版本),该模型使用2.6 万亿tokens训练。
以上这些模型(70亿参数和130亿参数)目前均已开源。
另外,百川智能还拥有两个参数规模更大的闭源模型Baichuan-53B和Baichuan2-53B,两个模型都拥有530亿参数,为该公司目前规模最大的模型。
智谱AI今年总计完成超25亿元融资
10月20日,智谱AI官方发布公告表示,公司今年已完成超25亿元融资。中关村自主创新基金、红杉、高瓴、美团、阿里、腾讯、小米、蚂蚁等众多机构均有参与。
公司背景
智谱AI是国内少数几个成功开发出大模型的初创公司,于2019年成立,由清华大学计算机系唐杰教授创建,为该系知识工程实验室的技术成果转化而来。
目前,智谱AI旗下已拥有大语言模型ChatGLM、可联网搜索的模型WebGLM、代码生成模型CodeGeeX2、超拟人大模型CharacterGLM、多模态模型VisualGLM-6B和CogVLM-17B等多款模型。
同时,智谱AI拥有一款面向C端的应用「智谱清言」
今年之前,智谱AI曾获得三轮融资,融资金额超2亿元。智谱AI告诉「新皮层」,目前智谱AI估值超过百亿元。
智谱和百川智能成为国内融资最多的大模型公司
· 百川智能:搜狗创始人王小川于4月创立,其「百川大模型」已获网信办备案审批,迄今融资3亿美元,与智谱相当;
· Moonshot AI:清华系背景的大模型公司,今年3月创立,旨在研发跨模态大模型。今年累计融资6000万美元,另有1.7亿美元尚未交割。
· Minimax:成立于2021年12月,其适用于文本处理任务的大模型「ABAB大模型」已获网信办备案审批,今年融资金额超2.5亿美元。
参考链接:
https://mp.weixin.qq.com/s/ZlvlEIASDWHhu4CmYEx60Q
Meta在实验室实现对大脑视觉皮层的实时解码

10月18日,Meta AI发布与巴黎文理大学、巴黎高师合作的模型,该模型可将大脑脑磁图(MEG)信号解码,并实时可视化。
Meta如何解码MEG数据?
MEG(Magnetoencephalography,脑磁图)是一项功能性神经成像技术,能够以每秒数千次的频率扫描大脑,记录其中自然产生的电流所形成的磁场。
具体来说,Meta开发了一个由图像编码器、大脑编码器和图像解码器组成的系统。其中,大脑编码器用来学习将MEG信号与对应的视觉图像做配对训练,最终,图像解码器就可以反过来根据MEG信号猜测受试者看到的图像。
Meta在一个公开的MEG数据集上训练出了该系统。
与此前通过fMRI信号解码视觉有何不同?
新皮层曾报道,一个叫Mind's Eye的生成式AI模型,可以通过解码fMRI数据,识别脑活动中的视觉、感知等信息,进而用这些信息输出与之对应的图像。部分生成图片的结果与被测试者当时浏览的照片高度相似。
Mind's Eye用fMRI数据的解码效果。
Mind's Eye使用的fMRI(Functional magnetic resonance imaging,功能性磁共振成像)是另一种神经影像学技术,其检测对象是大脑中的血液流动和代谢变化。

fMRI具有更高的空间分辨率,可以精确定位大脑活动的区域。不过,它通常以秒为单位收集数据,难以捕捉大脑的快速波动,更适合于静态或缓慢变化的大脑活动。相比之下,MEG数据具有更高的时序分辨率,能够以毫秒级的精度捕捉大脑活动变化。
Meta用MEG数据的解码效果。
Meta认为,虽然fMRI可以更好地解码图像,但MEG解码器可以实时生成结果,连续解码大脑活动。

不过MEG解码器仍有弊端,那就是空间分辨率不够,难以清楚知道到底是大脑的哪个区域在产生信号。这是MEG解码器从实验室走向真实社会的挑战。
参考链接:
https://ai.meta.com/blog/brain-ai-image-decoding-meg-magnetoencephalography/
Google搜索上线英语辅导功能,对标多邻国
10月19日,Google搜索上线了一项口语练习功能,为部分地区的Android用户提供英语互动口语练习,并计划未来将该功能扩展到更多国家和语言。
该功能强调个性化学习
新功能将为语言学习者提供交互式口语练习,学习者可以参加3至5分钟的练习课程,并获得个性化的反馈,从而能够按照自己的节奏练习英语练习。
·个性化实时反馈
:该功能可以分析学习者的回答,提供有用的实时建议和更正。不仅如此,该功能还会提示学习者可以改进的语法问题,并提供了一组不同语言复杂程度的示例答案。

·语境翻译:孤立的单个单词通常具有多种替代含义,多个单词则可以形成需要一致翻译的含义集群。该功能能够实现在上下文中翻译单个单词和短语的能力。
·语法反馈:针对有口音的用户,Google采用了文本语法校正模型来处理语音转录。此外,该团队开发了一种基于编辑的输出表示,它利用输入和输出之间的高度重叠,来适配学习过程中常见的短句。
·语义分析:语言初学者的口语常有语法问题,Google的语义分析功能可以向学习者传达他们的反应是否与上下文相关,并且判断是否可以被聆听者所理解。
该语言学习功能对标多邻国
早在2019年,Google就曾涉足语言学习和教育工具,推出了一个模块,让搜索用户练习正确的单词表达方式,并在页面上立即提供反馈。本次结合AI功能的语言学习模块的推出,则是直接对标了多邻国。
多邻国是一家以语言学习服务为主的教育技术公司,在今年4月与OpenAI合作,成为首批向客户提供基于GPT-4服务的企业之一。它为学习者提供了基于AI的虚拟语言导师,并在学习过程中创建交互式学习体验。此外,AI也被广泛使用到该公司的英语测试系统,包括大学、学院和政府组织在内的4000多个机构都使用该公司的测试系统来评估非母语者的能力。
Google的语言学习功能将在未来几天向阿根廷、哥伦比亚、印度(印地语)、印度尼西亚、墨西哥和委内瑞拉的 Android用户开放。
参考链接:
https://blog.research.google/2023/10/google-search-can-now-help-with-english-speaking-practice.html
-END-
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。
在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与“智能”相关的议题。请注意,我们说的智能,不只是 AI。
若想了解更多本周资讯,请点击阅读往期智能周报:
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
本文版权归第一财经所有,
未经许可不得转载或翻译。
识别下图二维码,
即可购买《第一财经》杂志2023年10月刊
继续阅读
阅读原文