HICOOL 2021全球创业者峰会暨创业大赛已于9月在北京圆满落下帷幕,大赛共吸引4018个优质创业项目及5077位全球创业人才,共评选出获奖项目140个,其中,海外组100个、本土组40个,获奖项目中成长期59个、创客期81个,新一代信息技术和文化创意赛道获奖项目都达到了29个。
2021年是全国“十四五”规划的开局之年,同时也是北京国际科技创新中心建设的提速之年,全市产业需求得到进一步释放,创新创业成为拉动区域经济增长和推动地区产业转型升级的重要抓手。在此背景下,HICOOL 2021全球创业者峰会暨创业大赛在首届活动成功举办的经验基础上,不断延伸拓展覆盖面,持续加大全球引才力度,不仅打通并建立了海外人才和本土人才来京创新创业的双流通道,同时更依托“六位一体”创业生态平台的日趋完善,全面启动对创业者在创业全生命周期内的叠加服务,服务效能几何式成倍增长,覆盖群体裂变式扩散蔓延,连续两届峰会的成果逐步展现,为北京国际科技创新中心建设带来了可见的强大助力。
11月25日,HICOOL组委会携科技日报/科普时报、环球网、和讯网等媒体走访了HICOOL 2021全球创业大赛人工智能/金融科技赛道的一等奖获奖项目:北京澜舟科技有限公司,通过与创始人周明博士的现场交流,深入解析孟子新一代认知服务引擎项目。
澜舟科技创始人周明博士
以下为媒体报道实录(摘选):
科技日报、科普时报 记者 陈杰
孟子轻量化训练模型助AI快速向认知智能迈进
数字经济时代,人工智能已经成为重要基础设施,已具备同各行各业结合的能力,越来越多的行业和领域都在进行不同层次的智能化升级。当然,人工智能本身也在不断迭代升级。基于多层人工神经网络的深度学习是目前人工智能最有效的学习算法,深度学习在识别(感知智能)上已有突破,但在理解(认知智能)上还有局限性。
目前来看,人工智能的发展方向从感知智能向认知智能快速推进中,自然语言识别技术及预训练模型便成为AI领域中的热门赛道。一时间,超大规模的预训练模型成为全球人工智能技术研发的热点和竞争的焦点。
不过,一直由腾讯、搜狗、华为、阿里达摩院等巨头轮番霸榜的权威中文语言识别评测基准(CLUE)榜单,最近却被一家创业公司的轻量化预训练模型刷榜。
日前,澜舟科技的孟子轻量化预训练模型以十亿参数完成了此前百亿、千亿参数模型刷新的纪录,首战登顶中CLUE榜单。此外,在HICOOL2021 全球创业大赛中,孟子新一代认知服务引擎项目也从全球48个国家和地区的4018个项目中脱颖而出,获得人工智能和金融赛道第一名。
澜舟科技创始人兼CEO周明表示,过去的两三年里,预训练模型在自然语言领域得到非常广泛的重视,各大公司学校都开展了预训练模型的研究,趋势就是预训练模型越大越好。“但也存在一个问题,就是模型越大训练的成本就越高,在提供服务的时候也要求客户的机器设备能力也要非常大,从而导致很多硬件能力低的中小企业用不起这些重量级预训练模型。”
基于这一痛点,澜舟科技一直在考虑能不能把模型做得小一点,提高训练速度的同时也降低使用成本,名为孟子的轻量化预训练模型应运而生。
周明表示,孟子轻量化的预训练模型是利用大规模的语料库,以无监督的方式的训练一个大规模的语言模型,这个语言模型输入一个句子或一个片段,基本上可以定义出每一个词和每个句子的语义,可以应用在机器翻译、问答搜索等场景。“在预训练基础上,澜舟科技开发了新一代的机器翻译、文本生成和行业搜索引擎等技术,并通过产业合作实现了技术落地。”
当前,企业的数字化转型和智能化转型,也已经随着人工智能的发展从感知智能推进到认知智能,企业需要从大数据中获取信息,然后在知识图谱和和产业规则的基础上进行推理,最后形成的业务报表并对流程作出趋势判断等等。这种强烈的需求加上预训练模型的技术发展,认知智能赛道必然会迎来一个新的飞跃。
不过周明坦言,虽然预训练模型充分利用大数据来建立语言模型,但是在做多轮对话或者需要对趋势作出判定,或者依赖知识图谱进行推理方面,认知智能目前还差强人意。“人脑在处理熟悉的事情时往往依赖数据和直觉,速度快但缺乏解释性,这类似与训练模型或深度学习;而在处理不熟悉事情时往往依赖规则、逻辑和推理,速度较慢,但是具备可解释性,更像是符号计算。当下的深度学习可以思考,如何通过一个模型将二者的优势结合,也就是数据和知识融合起来寻找解决思路。”
孟子轻量型中文训练模型
环球网科技 记者 林梦雪
澜舟科技周明:人工智能技术正在从 “感知智能”大步迈向“认知智能”
近年来,语音、人脸识别等“感知智能”技术已相对成熟。但感知智能在处理需要知识、逻辑推理、思考等复杂任务时,表现并不理想。随着大数据、云计算等技术深入发展,如何赋能机器像人类一样具备“思考能力”,实现“认知智能”成为新的研究方向。
对于感知智能和认知智能的定义,创新工场首席科学家,北京澜舟科技创始人兼CEO周明是这样阐述的:“感知智能是眼睛看得到、耳朵听得到、手触摸得到的一些感知信号,而认知智能是AI技术对人类语言理解后进行推理,实际上是人类的思维和大脑的行为的体现。”
周明认为,“认知智能技术的一个瓶颈是语言的理解的问题,比如说由于上下文不一样,词的意思就不一样,一个句子虽然用同样的词,语气变化意思也完全不一样等。”
那么,人工智能如何能对自然语言进行很好的理解呢?
“近几年,由于预训练模型的推出,使得自然语言理解的能力大幅度增强,体现在问答、搜索、翻译的水平大幅度的提升。由于有了这样的能力,人们就期待着认知智能可以上一个更大的台阶。”周明说道。
2021年7月,基于轻量级、高效训练的研究路线的孟子预训练模型正式推出,据悉,孟子是基于澜舟科技自研技术开发的大规模预训练语言模型。支持多语言、多模态数据。同时支持多种文本理解和文本生成任务,能快速满足不同领域、不同应用场景的需求。
在落地方面,孟子预训练模型致力于构建十亿级别的小模型,充分发挥已有参数下的模型潜力,有利于快速、低成本地落地现实业务场景。性能方面,孟子预训练模型可以比肩甚至超越千亿大模型,在包含文本分类、阅读理解等各类任务上表现惊艳。
需求和技术推动着人工智能市场逐渐壮大,行业分析机构IDC发布的全球人工智能报告显示,2021年全球人工智能市场(包括软件、硬件和服务在内)收入将达到3418亿美元(约合人民币2.2万亿元),增长15.2%。
随着人工智能技术深入发展,各行各业对认知智能的需求也逐渐加大,以金融业为例,当前金融行业面临运营成本高、客户服务压力大、产品服务单一、交易欺诈风险高等问题,这些都无法通过感知智能技术解决,而知识图谱驱动的认知智能在这方面有很好的表现。
周明介绍称,2021年9月,澜舟科技在金融和营销行业完成高性能轻量化行业预训练模型,目前,澜舟科技正在建立金融行业的行业搜索引擎。
他表示,“随着企业的数字化、智能化转型,企业对人工智能的需求也逐渐从“感知智能”过渡到了“认知智能”,认知智能可以帮助企业从大数据中获得信息、在知识图谱和产业规则的基础上进行推理,然后形成洞见,对业务报表流程作出趋势判断等。人工智能技术正在从 “感知智能”大步迈向“认知智能”。”
“现在有了预训练模型的技术,再加上市场的需求,可以期待认知智能有一个新的飞跃。澜舟科技应运而生,希望能够通过技术解决实际需求中的难题,同上下游伙伴一起将认知智能的发展推到新的高度。”周明说道。
公开资料显示,澜舟科技今年1月入驻由李开复创办的创新工场开始孵化,8月完成天使轮融资,投资方也是创新工场;9月获HICOOL 2021全球创业大赛人工智能/金融科技赛道一等奖,HICOOL全球创业大赛是以海内外人才创业大赛为主体的综合性国际人才活动,通过两年来的成功运作与积累,已累计吸引全球84个国家和地区创新项目6044个,汇聚顶尖创业人才8162名。据官方透露,HICOOL 2022年新一季赛事招募将于近期全面启动。
澜舟科技创始人周明携团队成员及办公环境
和讯网 记者 娄在霞
澜舟科技创始人周明:预训练模型的落地会推动人工智能迈上新台阶
人工智能分为计算智能、感知智能、认知智能三个发展阶段。感知智能指的是“感知”的能力,包括听觉、触觉和视觉,认知智能则包括语言理解能力、知识运用能力以及在语言和知识基础上的推理能力。
创新工场首席科学家、北京澜舟科技创始人兼CEO周明称,自然语言处理是认知智能最大的一个瓶颈,而预训练模型会使自然语言处理进入到可以大规模、可复制的大工业施展阶段,如果能落地应用,会推动认知智能实现飞跃。
据了解,预训练模型是利用大规模语料库、通过无监督方式训练出的一个大规模的语言模型,根据上下文定义每个词的语义表达,并基于模型做下游的任务,比如说机器翻译问答搜索等。
周明表示,过去几年,预训练模型在自然语言领域得到非常广泛的重视,各大公司学校都开展了预训练模型的研究,出现了模型越大越好的趋势。可是模型越大,训练成本越高,要求机器设备的能力也就越大,这就产生了环保和节能的问题。中小企业可能还会因为硬件制约无法使用。
基于以上考虑,澜舟科技研发出了大规模预训练模型《孟子》,实现了用更小的模型规模比肩超大模型的性能,并且具备灵活的领域和场景适应能力,有利于快速、低成本地落地现实业务场景。
“以力服人者,非心服也,力不赡也;以德服人者,中心悦而诚服也,如七十子之服孔子也。”周明在谈及为何会给模型起名为《孟子》时引用了这样一句话。
周明解释称,很多大公司依赖自身强大的运算能力和大数据能力,不停地推出大模型,澜舟作为初创公司,比算力是比不过的,那我们就应该去比智慧、比算法、比知识。
事实证明了周明的思路是正确的。今年7月,《孟子》预训练模型在CLUE中文NLP权威排行榜战胜百亿、千亿参数规模级模型取得冠军,刷新三项榜单世界纪录。

此外,澜舟科技基于《孟子》预训练模型,推出了澜舟文本生成引擎、澜舟行业搜索引擎、澜舟翻译引擎三大产品。目前翻译引擎和文本生成引擎已经通过合作伙伴实现落地应用,搜索引擎则和头部公司达成合作,正在不断完善迭代中。
周明介绍,澜舟科技下一步的业务重心是开发建立SaaS模型、独立行业搜索引擎、开源社区,并进行本地定制。
公开资料显示,澜舟科技今年1月入驻由李开复创办的创新工场开始孵化,8月完成天使轮融资,投资方也是创新工场;9月获 HICOOL 2021全球创业大赛人工智能/金融科技赛道一等奖,HICOOL全球创业大赛是以海内外人才创业大赛为主体的综合性国际人才活动,两年已累计吸引全球84个国家和地区创新项目6044个,汇聚创业人才8162名。据官方透露,HICOOL 2022年新一季赛事招募将于近期全面启动。
欲了解HICOOL更多信息,请点击👇
喜欢我们的内容?
欢迎点赞+关注
孟子预训练模型开源项目
澜舟科技已将孟子中文预训练系列模型开源!全面覆盖文本理解、文本生成、金融、多模态等不同技术应用领域。希望与开源社区一起让新一代文本智能技术落地各行各业,推动下一波认知智能生产力进化的浪潮。
扫码加入孟子开源社区微信群

直接访问开源项目地址

https://github.com/Langboat/Mengzi
访问澜舟科技官方网站
https://langboat.com

继续阅读
阅读原文