作者|朱秋雨
来源|南风窗
ID|SouthReviews

“大家好,我是高以翔Godfrey。虽然我已经离开了这个世界,但我的心永远与你们在一起。你们的留言我都有看到,你们是我最宝贵的财富,我永远爱你们。”
3月,一个西装革履、手戴腕表与梳着大背头的“高以翔”,用台湾腔出现在社交媒体上。与他一起在人们视野前表达对粉丝思念的,还有已故明星李玟、乔任梁、科比、张国荣……
唯一的不同是,制作者在一旁特别标注:“视频和声音均由AI生成。” 
AI创作的乔任梁
少数人在视频底下表达他们感受到的怪异。李玟粉丝指出,AI李玟在声色上与原版很像,但在口音、停顿、说话情感上仍有很大的差异。“这根本不是coco也不是类coco,她只是一个套了壳子、内核是不知名人士的虚拟形象,甚至还可能被发展成商品。”
AI复活技术的确已经变成了产业链。在各类短视频平台,许多博主打着科技向善的名号,售卖AI复活技术。多位博主给记者报价:
让逝者照片动起来并说话,298元;
克隆逝者声音与视频,1498元……
而经南风窗记者实测,当下流行的AI语音克隆和数字人技术,门槛并不高,市面上有众多非常成熟的开源项目。服务者可以用低廉的成本,每日轻松“复活”多人。
更深的矛盾由明星父母戳破。3月16日,乔任梁父亲对媒体表示,他已经看到网上传播的“儿子被复活”影像,“不能接受,感到不舒适”。“他们未征求我们同意,是我侄女刷到视频发给我的,这是在揭伤疤。”
关于技术与人文的纠葛被摆在了面前。这究竟是一个改善人们面对死亡创伤的技术,还是在扭曲我们的现实感?
复活明星
AI复活的力量,许多人是从一位明星父亲——音乐人包小柏处得知的。
3月,他在接受媒体时,展现了AI复活女儿的“模样”。
面对多家媒体记者,他首先对着手机说:“包小容,我现在正在接受采访,你跟媒体的朋友打声招呼吧。”
手机程序里的“包容”在等待了一段时间后,开口说道:“媒体朋友好,很高兴认识你。”
据包小柏表示,这个AI“包容”是他与好友刘岩的公益项目,通过女儿生前17秒影像,再加上他与太太对女儿生前20年的回忆,训练出来的虚拟人物。经过8个月的努力,“包容”终于由此回到了包小柏身边,可以与人对话、唱歌、实时互动。
包小柏和女儿 /图源:包小柏社交媒体
女儿成功“复活”的经历让包小柏感触万千。他成立了一家名为“爱语包容”的公司,对外表示:“长久以来,AI对大众来说都是负面的,不是诈骗就是取代人类工作。但AI也可以有好的用途。” 
他认为,AI复活技术能成为一种陪伴,“即使都知道这是假的,也还是会欣然接受。”
类似的“心灵抚慰”,在巨星李玟逝世多月后,在互联网流传开。3月13日,一个身着蓝色牛仔上衣,编着侧边辫的李玟,活泼地出现在人们的面前。她对着镜头说着上述“高以翔”的话,勾起了一众AI博主的创作欲。
3月,一位自称“太太是李玟粉丝”的博主,在B站记录了自己复活李玟的过程。他首先在互联网上筛选了李玟的原声,进行处理后,将干净的声音放入AI模型。他以为,经过一晚上的运算和训练后,李玟的声音已经被复原了95%以上。
AI创作出来的李玟
视频发出后,他收到很多粉丝的提醒,只考虑到了李玟的声线和声色,“但实际上,我并没有考虑到太多她用到的语气和口头禅”。
这位博主接着进行了第二次的创作。这次,他在克隆李玟时,着重把口头禅标记出来以后,“建立出CoCo口头禅模型”。经过接近4天,每次1000轮的训练,他最终克隆出李玟的语音模型。他由此创作了AI李玟给粉丝的4分钟语音。
“我是CoCo李玟,好久不见,我知道你们想念我。”
“中国呢,有一句俗语,叫‘天下没有不散的宴席’,也许我们每个人都是彼此生命当中的过客,but我更喜欢英文中的一句话,‘everything happend is good’。所有发生的事情都有好的一面,那对于我来说,最好的事情就是停止在有你们爱着的那一刻,我真的感觉很幸福。”
听完这些话,许多人表示泪目,称赞他用AI造梦。
但底下点赞最热的评论,代表了部分粉丝对此做法的不满。“我支持对已逝艺人的作品进行创作,但我反对就其人格进行模仿,这太冒犯了。”
“AI CoCo口口声声感恩粉丝她很欣慰,但真正的她在迷离之际难道不会是痛苦或绝望的吗?谁能真的去复制另一个人的人格呢?”
近乎零成本
争议本身并非来源于技术。但“AI复活”可以囊括的技术手段、实现主体都非常多样,这让人面对技术的进步,产生了复杂又混乱的情绪。
包小柏的情况是更特殊的。花费这位明星父亲大量精力复活女儿时,他们追求的是建造出一个与包容相似的数字人物。这需要亲属对逝者的人生节点、性格、生前影像的重建与记录,依赖极大的数据。
包小柏用AI“复活”女儿
但外人复活明星的话,难度就小很多了。市面上许多的AI复活套餐,也是如此兜售的——将亲人生前影像、声音或照片交给AI,让AI训练出一个语音模型或数字人。接着,消费者可以提供一段希望AI亲人想说的话,让AI说出来。
90后的张琳就是这样,在今年春节找到了AI复活网红博主,想复活挚爱的外婆。她对外婆的逝世已经释怀,行动的目的来源于全家人的共识——外公高龄九十,对伴侣的逝世很可能无法接受。
为此,全家人瞒着这位老人数月,一直欺骗他:外婆仍因为腿脚不好,躺在医院住院。
张琳告诉南风窗,全家人都打算继续这个善意的谎言,于是想用AI复活外婆的语音,与外公对话。
朴素的愿望最终以1000元实现了——她把外婆生前3分钟的粤语对话交给上述团队,对方在1天后表示,模型训练出来了。接着,他让张琳模仿外婆的语气、语音习惯说一段话,他再将这段话放给训练好的“外婆”,很快就得到了张琳想要的效果。
“音频出来的第一下,大部分亲人觉得震惊吓了一跳,”她回忆,“音色是很像很像的,(相似度)能有95%吧。”
这是市面上多数AI复活博主主打的业务。阿亮,一位AI复活博主曾告诉南风窗,当下的业务主要有三类,第一是AI的数字分身服务。第二类是说话服务,本质上是把一张照片变成一个视频,“他们其实想让亲人说一段祝福的话就可以了”。第三类是一项纯文字的、与亲人对话沟通服务。
UP主展示了用AI技术“复活”已故的奶奶,并且与“奶奶”进行视频通话的部分记录图源:视频截图
根据南风窗的调查,在业内,上述收费从几百元至万元不等。
但南风窗记者发现,这类生意主打的是信息差。第一项数字分身服务,在国际上,Character AI、HeyGen AI等公开软件,已经推出了成熟的服务。
以HeyGen为例,该项目由华人创业团队打造,在2023年发布Instant Avatar定制数字人服务。用户只要上传自己两分钟以上吐字清晰、光照合适的正面视频,就可以拥有属于自己声音、外貌的数字人。
而这项定制数字人服务以会员制收费,支持25种语言(包括中文)。只需一个月付费49美元(约合352元),用户即可享受高级定制服务。今后,输出相关文字,即可让有你外表的数字人,用你的声音说话。
B站AI语音博主Kevin向南风窗介绍,在AI语音合成领域,市面上存在很多开源的项目。例如,2024年新推出的开源项目GPT-SoVITS,可以简单便捷地实现AI语音克隆。
因为大量开源项目的存在,Kevin认为,完成AI复活对博主而言几乎是零成本,“顶多需要几台搭载GPU的计算机设备”。再加上AI云服务的兴起,业界流行租赁GPU云服务,以达到运行AI模型所需的算力。
“花个几块钱租1小时(AI云服务),熟练的话1小时可以训练出来五六个模型。基本上训练一个模型没有什么成本。”Kevin说。
一切没有想象中的复杂。
Kevin告诉南风窗,AI克隆语音技术,早在ChatGPT之前便已经在业界存在,一般是基于名叫TTS(Text to Speech)的技术。在国内,最早做TTS的商业公司是当今AI龙头公司,科大讯飞。
科大讯飞
而2022年末大模型的爆发,激起了技术界和商业公司对AI语音克隆的兴趣。入局者将这项技术越推越快。
“现在,只需1分钟的语音素材,等待大概10分种训练结束后,就可以生成与原声90%相似度的克隆模型。” Kevin介绍。
这些进步得益于算法的创新。他表示,英文软件和模型相比中文的用时更短,效果更惊艳。“有的开源英文模型,已经实现用户上传10秒语音,就能克隆得比较像了。”
技术的边界
只是,当AI复活的人们在2024年充斥互联网时,许多人开始感到不适。
这个不适也许是对技术本身的批判,另一方面,“和真人比,AI的还是不像”,很多人说道。
一个微博李玟粉丝大V告诉南风窗,在AI李玟的视频充斥互联网时,她想点击进去看偶像,但“打开听了几句就关了,感觉好假”。
这也是当下许多AI克隆语音技术的局限性。如果想要复活熟悉的人,并让他在日常生活中实现陪伴,你会发现,技术的门槛仍可能把很多人绊住。
Kevin告诉南风窗,AI虽然对音色的模仿度很高,但对于说话者的口癖、停顿仍较难模仿。“比如,有的人说话会倒吸一口气,这是AI开源项目很难做出来的(效果)。”另外,模仿人类的情绪,生气、失望,都对当下的AI克隆技术是挑战。
2024年3月,国内AI头部公司商汤科技在年会上,复活了去年底因病逝世的创始人汤晓鸥。
“数字人”汤晓鸥在年会上的演讲  图源 / 视频截图
在预先剪辑的视频里,AI汤晓鸥会喝水,会开玩笑,对员工抑扬顿挫地说:“去年大家都觉得挺不容易的,但我认为,难的事情总会过去。最终,我们会像《漫长的季节》里的结尾,在苞米地里坐着小火车,突突地往前开。”
商汤团队在接受采访时披露,为了还原汤晓鸥,这个9分钟的视频运用商汤“如影”技术,由几位专业同事合作完成。它摘录了大量汤晓鸥生前的语录,前后用时2个月,调整了五六版,才得出了如今的AI汤晓鸥。
也就是说,理想的AI复活,它不仅需要生者大量的高质量语音素材,还是细节、时间与技术三者的结合。
更难的是像包小柏一样,使生者与AI复活的数字人实时对话。这其中运用了三种技术:大语言模型,用于实时生成对话;AI语音合成技术(TTS),用于将文字转化成语音;AI数字人,用于让AI形象在手机上展现。
包小柏修复女儿声纹的界面 /图源:中国新闻网
当南风窗记者以消费者名义咨询一位名叫“AI朱厂长”的复活博主时,他表示, AI实时对话需要耗费大量算力。“光硬件成本就得四五十万,还不包括程序开发和维护。”因此,“厂长”说:市面上的博主基本无法做到实时对话。
他还补充道:“做你说的这种,需要六七个高手,干半年。”
技术的门槛依然存在,AI复活的明星离真人仍差距甚远。但AI复活的视频已经在算法和流量的助推下,越传越广。
3月16日,在乔任梁父母、高以翔亲属方都表达了对AI复活的不适后,许多博主终于发现,这一举动涉嫌侵犯肖像权。据我国《民法典》第13条,逝者的姓名、肖像、名誉、荣誉、隐私、遗体等受到侵害的,其配偶、子女、父母等有权依法请求行为人承担民事责任。
乔任梁父亲对AI复活表达不适登上微博热搜
也就是说,被AI复活的明星亲属,有权向视频创作方追责。
不少复活博主在此后下架了AI乔任梁、AI李玟……但无法阻挡地,AI乔任梁仍在互联网上被多次转发、流转。人们从明星父母的反对声中再次得知了这一飞速发展的技术。
“确实挺吓人的。它基本上没有成本,如果是不法分子用了这个技术,可以同时训练、模仿很多人。”研究AI的Kevin感叹。
央视新闻报道AI“复活”技术
人类再次站在了选择的岔路口。技术迅速地跑在了所有人的面前。现在如20世纪技术哲学奠基者弗里德里奇·德绍尔形容:“现代技术改变世界,也见证了其超出经验的道德价值。人类创造了技术,但它的力量就像一座山、一条河、一个冰川纪或者行星。它超过了世界上本来的各种力量。”
当下,只有欧盟出台了相关约束方案。
2024年3月,欧盟通过了全球第一个《人工智能法案》。高度谨慎的欧盟将深度伪造技术归类为“有限风险”AI系统。
这意味着,对深度合成技术的管理,以预防为主,仍未触及惩罚措施。欧盟要求开发人员实施技术保障措施,防止技术的滥用。例如,对AI输出内容,要留下水印。
继续阅读
阅读原文