作者|蓝莲花
2021年,虚拟人大跃进之后,目前面临哪些问题?已经有投资人开始反思这个问题。
“目前虚拟人品牌的价值大于流量价值,这是不可持续的,下一步一定要有人尝试用AI技术,让这些虚拟人可以动起来说话,和大家交互,提供服务,创造价值。虚拟人可能是健身教练,可能是服务员,可能是心理咨询师……2022年,虚拟人的应用会更加深入,而不仅仅是现在的虚拟偶像。”顺为资本副总裁冯铮在自己的视频号里分享了这样的观点。
事实上,行业内已经有企业在尝试赋予虚拟人更大的价值,而不仅仅拥有一张好看的脸。小冰公司就是其中之一。
今年年初,万科集团董事会主席郁亮在朋友圈祝贺崔筱盼获得集团优秀员工。在此之前,可能很少有人知道,崔筱盼其实是小冰公司开发的虚拟人。
最早小冰公司旗下的“小冰”只是微软研发的一款人工智能语音助手,但现在,小冰的框架已经推进到第9代,并且拥有了诗人、歌手、主持人、画家和设计师等多重身份。
2021年7月12日,人工智能平台“小冰公司”完成A轮融资,由高瓴领投,五源、Neumann、IDG、GGV纪源资本等跟投,投后估值超过10亿美金。
而小冰公司旗下的虚拟人,也从最初的小冰发展到了N小黑、崔筱盼等一个虚拟人大家族。
自从数字人爆火之后,市面上影视特效、互联网大厂、广告公司、语音转写公司,集体参与到这场狂欢中来。小冰公司的虚拟人技术究竟与其他公司有何不同?虚拟人的制作难点究竟在哪里?他们如何进行机器学习?我们跟小冰公司的COO徐元春聊了聊。
崔筱盼,为什么这么好看?
崔筱盼是2021年2月1日“入职”万科财务部。她在万科内部有工号,有编制,还可以通过邮件以及内部系统与各部门同事和客户联系。整个2021年,崔筱盼催办的预付应收逾期单据核销率高达91.44%。
不过,在郁亮朋友圈公布之前,可能万科内部也没几个员工知道她的“真实身份”。
这不是小冰公司跟万科的第一次合作。早在2019年,小冰还未从微软拆分的时候,就跟万科在智能家居、养老体系等方面有些合作。
2020年初,刚好赶上疫情,很多工作转为线上。当时万科就与小冰公司交流,能不能做一个虚拟数字员工。给这样一个大集团做一名虚拟员工需要解决两个核心问题,一是虚拟人在专业领域的工作能力,二是以何种人设和面貌呈现?
在这点上,小冰公司坚持“相由心生”。
从左到右依次是,N小黑、小冰、崔筱盼
意思是说,虚拟人空有一张脸意义不大,他需要承担具体工作,产生实际价值。可以理解为,更多是职业性质决定了虚拟人有一张什么样的脸,而不是由于她长了一张什么样的脸去安排对应的工作。
万科给崔筱盼定的是财务岗位,万科内部会不停地教她学习一些财务知识,她的主要任务就是看到财务数据的同时,在恰当的时间去提醒应收账户,实现社会资金的高效周转和现金管理。
“大企业的催收体量是极其庞大的,跟平时说的信用卡还款还不是一个概念。企业巨头内部的现金流非常重要,如果催收的效率提高一点点,催回来的财务收益就比较高,对整个集团财务都是一种优化。”徐元春表示。
在确定了工作领域之后,小冰给崔筱盼赋予了一个更具人格意义的人设。比如,她是4月11日出生的白羊座女孩子,性格执着,充满热情。大家收到她消息的时候,并不是冷冰冰的系统对话,而更像一个真实外地同事,她可以交流,让人感到人性上的温暖。
这其中,有一个点令人津津乐道:崔筱盼是个美女。
事实上,崔筱盼的长相并不是万科提的需求,而是小冰公司与文化传媒公司合作,以“上镜”为标准,制作了一批“高级人脸”。万科在几轮挑选中,最终选中了崔筱盼的脸,她更接近大公司白领的样子。
当然,崔筱盼的脸并不是一张数字孪生脸,而是通过采集大量五官立体、外形干练的人脸数据,加上机器自我学习得到的。
“学习之后,机器会理解人类的面部构图逻辑或者规律,比如,眉毛、眼睛该长成什么样子。在机器的后期学习中,专业审美人员的判断很重要,他们会告诉机器,那些好看,哪些需要舍弃,这样模型在不停地优化中变得越来越好。”徐元春表示。
徐元春
例如,从模特公司的角度来说,它们需要的并不是虚拟人的脸有多好看,而是首先需要她上镜。徐元春举例说,普通人也有长得很好看的,但从专业的角度看,她的五官可能并不立体,拍照不会特别好看。
“对这些标准的判断,就会对机器有所惩罚,下一版测试,它会自动调整。在这个强化的过程中会越来越趋近于专业审美人士的审美标准,进而生产处大家看起来都很美的虚拟人。”
N小黑是怎么学会读财报的?
在崔筱盼之前,小冰还与《每日经济新闻》合作,创作了一个财经新闻主播N小黑。这两个虚拟人都是在不同的专业领域做出成绩。一个在财务领域,另一个在财经新闻领域。
有不少人好奇,作为虚拟人,他们是如何学习专业知识的?
在徐元春看来,不管是编写邮件,还是读财报,甚至包括之前小冰的诗歌创作,这些都是虚拟人的基础通用能力,真要他们发挥作用,需要将虚拟人的场景和企业的具体情况结合在一起。
“这也是我们跟万科合作的重要一点,不然只做一个有通用技能的虚拟人,并不能解决万科的问题。在进入万科工作的过程中,虚拟人是需要投入精力培训的,而且,需要不短的时间。”
由于涉及万科财务培训,小冰公司没办法披露具体培训信息,但从N小黑的培训过程中,可以窥见一二。
在《每日经济新闻》的报道中,经常遇到上市公司公告,一般都是几十页PDF文件。最开始,机器需要用结构化数据学习财经摘要写作,在这个过程中,每日经济新闻的编辑团队会检查机器的作业,并且会标记哪里写的不对,哪里写的精彩,如何正确使用专有名词等。
徐元春表示,通过不停地学习,机器能够清晰地判断,在一份财报中,哪些是核心数据。
“做一个AI快讯的学习,也需要经过几个月的时间,编辑团队不停地教机器学习,就像一个老师在教一个小学生写作文,虽然一开始有很多地方写的不对和不好,但机器比人更勤奋和刻苦,完成一段时间的学习之后,机器比人类的效率和准确率更高,达到了使用要求。”
目前,N小黑能做到24小时不间断直播。看起来普通的行为,N小黑却学习了将近两年。
由虚拟人24小时播报的财经资讯:http://www.nbd.com.cn/corp/AiTv/index.html
小冰公司于2019年就与每日经济新闻合作金融公告摘要,进一步合作金融快讯。换句话说,小冰跟《每日经济新闻》的合作也不是一蹴而就,而是来自多年不同类型技术的沉淀,最终形成了一个完整的,用户体验还不错的,端到端的AI财经电视。
N小黑诞生后,《每日经济新闻》的内容生产能力获得了极大提升,而且让过去每日经济新闻在传统纸媒领域的金融信息优势在视频端得到了放大。相当于,每经获得了更多的能力输出和更多专业内容的生产空间。
除了教会虚拟人自我学习以外,在N小黑的数字孪生方面,小冰也突破了不少技术难题。
举个例子,数字孪生需要真人面对镜头采集信息,如果采集信息的人表情、眼神不自然,机器采集到的信息就变得不准确。
“有些人在镜头面前就会紧张或者不自然。这不像拍影视剧,前几条拍不好,多拍几条演员就找到状态了。对于机器学习来说,最后的学习质量跟采集的数据数量之间没有必然联系,并不是说采集的数据越多得出的结果就越精准。这就是数字孪生在采集数据方面的难题。”徐元春表示。
做好N小黑的人脸之后,面临第二个问题就是如何实现用文字驱动N小黑的动作。
首先要做几个不同的模型,一个模型来理解人的语言、嘴型和表情关联数据;另一个模型用来训练主播本人和他的嘴型驱动;第三个模型,是文本驱动,文本转语音,然后进入渲染的过程。
整个训练过程中,前两个模型用来监督和纠正,这是第二步,前两个模型生成的模型会纠正第三个渲染模型。通过不停地重复这个过程,让模型达到比较高的质量。到了第三阶段,输入文本和语音,就能直接驱动生成人的视频。
“这其中要解决几个问题,一是解决语音和嘴型的关系,前几代技术就是人做在那里一动不动,全身只有嘴动,这肯定不行。说话的时候,脸部肌肉协调关系要解决,甚至还要加入人在说话的时候和眼镜的配合关系,以及一些手部的动作。今天是要把所有的动作一起训练和学习,才能达到真实的状态。”徐元春表示。
小冰不是一家IP公司
如今,市面上的技术公司生成一张虚拟人脸的算法不会有太大差异,不同的是,各家公司在数字上的选择。“对于小冰来说,数字人具备一定的专业能力,逼近真人,是一种正常现象,如果做不到这点,才说明虚拟人不正常。”
以崔筱盼为例,她并不是一张普通人脸。“从轮廓,骨架上来说,都很上镜。就是因为我们掌握了模特公司的数据,而不是采集普通人的数据。”
此外,小冰一直在绘画艺术方面做各种算法研究。因此,小冰在虚拟人审美、构图、颜色搭配等方面,积累了很多自己的理解,并且沉淀技术。
小冰公司旗下虚拟人夏语冰
“大家看到的可能是一张脸,但每一张脸背后的技术含量是不同的。做出一个虚拟人脸并不难,关键在于能否生成大家都觉得好看的脸。这是一个关键技术指标。小冰目前可以生成大众审美的脸,也可以生成小众审美的脸。从某种程度上说,我们做了艺术类的各种内容生产,再去做人脸的时候,对审美就有更深的理解。”
不仅仅在审美上,单就技术层面来看,小冰的技术在N小黑身上实现了可用性和完整性的统一。
“N小黑是24小时实时播放新闻,目前除了小冰公司没有第二家能做到。第二在技术落地方面,无论是文本生成还是语音驱动,或者深度神经网络渲染,都已经有了完备的技术;第三,在现实落地过程中,我们也解决了各种问题,比如,直播推流、插播,以及端到端的工程问题。在于企业的合作中,积累了大量实操经验。”
当下各类公司通过不同的技术手段都能创作出虚拟人,比如,影视特效公司、语音转化公司、AI公司等,但小冰的深度神经网络渲染技术则进一步降低了时间和金钱上的成本。
如果用3D建模技术做一个虚拟人,成本投入至少四五百万,而且,每生成一段时间都需要找人做动作捕捉。目前有很多超写实广告就用了这样的技术,15秒成本100多万。
3D建模图形
“用这种技术无法实现短期内生产大量内容。你不可能说,做一段新闻播报,光拍摄就拍一个月,再做两个月的模型。三个月就过去了。”
有了这样的技术能力,从商业角度来说,很自然就会想到如何通过虚拟人变现的问题。
尽管小冰旗下已经有了夏语冰、N小黑、崔筱盼等一系列虚拟人,但小冰对这些IP的运营和商业化并不着急。
“我们的主要工作其实是在为其他客户赋予虚拟人以能力,虽然我们自己也做了一些IP,但我们的目的并不是运营他们,而是要通过这种方式积累一些对产品、技术、经验,以及让用户看到,有了能力之后的虚拟人会变成什么样子。”
自从小冰做出几款虚拟人IP之后,不少客户找过来求合作,他们的要求明确是做一个像每经那样的,或者做一个像万科那样的,然后再加一点什么独特的能力。还有人找过来,他们不要做主播的数字孪生,而是要做CEO的数字孪生,因为CEO需要跟很多人讲企业文化,介绍产品等。
还有人把基金经理做数字孪生,因为这样能更好的介绍我们的产品。“所以你会发现,这个行业的商业场景,大致从一个切入点,就像火花一样爆发开来,然后激发了大家更多的对自己这种场景结合的这种应用型的需求,但他的技术本身是一个技术,它只不过是不同的应用场景而已。”
因此,小冰并没有把《每日经济新闻》的N小黑叫做虚拟主播技术,它是一个数字孪生的技术。因为它不仅仅可以用在媒体领域。
在不久的将来,小冰在会上线更多虚拟人。但徐元春郑重表示,小冰不是一家IP运营公司,而是一家算法技术公司。
话题互动
你看好虚拟人的发展前景吗?
*我们将在留言区中抽出一位读者送出神秘礼品
,欢迎大家留言讨论!
剁主建群啦!扫码添加客服号,回复入群及所在的公司和职务,便可入群获取一手资讯,还有剁主准备的专属小福利哦!
继续阅读
阅读原文