月之暗面攻势猛烈,跻身中国大模型独角兽。
作者丨郭   思
编辑丨陈彩娴
AI 科技评论独家获悉,月之暗面近日正在进行 2 亿美元融资,本轮投资由蚂蚁和阿里集团共同投资,投前估值预计 15 亿美元。
据了解,月之暗面团队成员人数在100人至200人之间。
团队创始人杨植麟是一个90后,本科毕业于清华大学计算机科学与技术系,博士就读于全美自然语言处理排名第一的卡内基梅隆大学语言技术研究所(LTI),师从苹果AI研究负责人Ruslan Salakhutdinov、谷歌首席科学家William Cohen。
在博士期间,杨植麟用4年时间完成了一般6年才能完成的博士课程,并连续作为第一作者发表了两项关键研究成果——Transformer-XL和XLNet。Transformer-XL 成为首个全面超越 RNN 的注意力语言模型,相关论文是 NeurIPS 2019 与 ACL 2019 的最高引论文之一;XLNet 则在 20 项任务上超越谷歌 BERT 模型。截至目前,杨植麟本人学术引用量自2019年起已超2万余次。
杨植麟个人谷歌学术界面
此外,团队的联合创始人周昕宇与吴育昕,均为清华大学校友,具备深厚的技术底蕴。团队现已汇聚了来自 CMU LTI、Google、Meta(原Facebook)、Amazon等全球顶级学术机构及科技公司的诸多海外高层次人才,共同致力于前沿AI技术的研发与创新。
AI 科技评论获知,月之暗面在人工智能领域持有明确立场,特别是在大语言模型的应用与融合方面,杨植麟的理解独到,坚定走 To C 道路,路线也一直是产品驱动。
技术优势上,月之暗面最为称道的则是 Kimi Chat 的长文本基础技术能力。
11月,Kimi Chat宣布全面对外开放,不再限制内测资格,能高效处理约20万汉字的上下文。杨植麟曾在演讲中表示,规模化是通向AGI的核心,而随着模型不断迭代,长文本会逐渐取代微调,成为定制模型的关键技术。但通过滑动窗口、降采样、小模型等技术捷径实现上下文窗口延长,都是“技术捷径”。目前符合大模型技术原理的做法是通过对数据的无损压缩,以真正提升模型能力。
近期频繁霸榜热门游戏应用“哄哄模拟器”受益于月之暗面的技术支撑。该模拟器设计了各类情侣互动情境,由AI角色模拟真实对话,通过系统计算的“原谅值”动态反馈用户的沟通技巧。
哄哄模拟器在短时间内迅速走红,在线用户人数突破一万,快速消耗了过亿 tokens。创始人王登科透露,为应对庞大的 token 消耗需求,哄哄模拟器团队已与月之暗面展开深度合作,全面采用其API接口,实际效果优于此前使用的GPT系列技术,尤其在遵循指定文本格式及刺激用户互动方面表现出色。
这个成功案例凸显了月之暗面在中文语境理解和C端用户体验上的显著优势。
知情人士透露,月之暗面预计下月或将低调推出媲美 GPT-4 级别的新模型,直接整合至 Kimi Chat并同步发布两款相关应用,但不会过多张扬,而是以实际行动展现其技术领先性。
2024年已过去一个月,月之暗面蓄势待发,大模型领域的竞争已然掀起狂澜,群雄并起。其余大模型企业融资及发展情况如何?欢迎添加作者微信(lionceau2046)交流,互通有无。
更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

继续阅读
阅读原文