点击蓝字关注我们
近日,在2023光合创作者大会上,快手首次公开全模态、大模型AIGC解决方案,并重点介绍了AIGC数字人产品“快手智播”。快手AI&用户增长业务负责人王仲远表示,“快手智播”最低仅需3分钟的视频音频素材和千元成本,目前可在本地消费、本地生活、电商直播等多种场景落地,部分场景效果接近真人实拍。
3分钟素材、3天工期、千元成本 
“大家好,我是程一笑分笑,一笑平时最喜欢刷快手,你看,有了我,他连自我介绍都不需要亲自来了,这样他刷快手的时间又多了。”在光合大会的圆桌对谈环节,大屏幕上快手四位高管进行了一段特殊的自我介绍,不过说话的并不是本人而是他们的数字人分身。
据技术人员透露,这套真假难辨的数字人分身,正是基于快手AIGC数字人解决方案“快手智播”制作。该方案可让用户以极低成本定制自己的孪生数字人,只需提供3-5分钟真人视频和音频素材,就能实现真⼈形象建模,制作出相应的数字孪生形象,3天时间即可完成交付,成本在千元左右,而此前传统数字人制作费用一般需10万元以上。
同时,该方案也支持用户选用库中现有素材快速生成和使用数字人。以常见的⼝播类视频为例,创作者只需要输⼊关键词,在“快手智播”帮助下,就可以生成口播文本、标题以及tag标签,然后从模特库和音色库选择合适的数字人形象和音色,自定义视频背景、BGM、前景等视频要素,随后即可快速批量化⽣成数字⼈⼝播视频。
总体上,“快手智播”具有低成本、高效率、低门槛、高品质等特点,让创作者像做PPT一样制作视频和直播。可以预见的是,“快手智播”在内容产能方面将会发挥出显著的作用,大大提高创作者的创作效率、降低创作门槛以及丰富创作方式。
高品质、低门槛的
数字人方案如何炼成?
快手智播的一大优势,就是解决了看着假、动作迟缓等痛点,其口播类视频效果可以媲美真人实拍,唇形、表情、动作自然。快手技术团队通过在数万小时的模特数据上进行训练,以保证其具备优秀的泛化性;又针对每个具体模特进行模型微调,使其兼具高精度的特点,如为了让数字人栩栩如生,专门针对牙齿、眼睛等进行了高精度建模,让每个牙缝都能高度还原。
而为了解决数字人动作迟缓,不够流畅的问题,快手通过自研的推理引擎、部署框架,以及在多个业务中得以迭代的流式的数字人生成框架,能够以秒级的低延迟实现数字人直播。
此外,快手智播还将操作的门槛降到了极低的水平,以视频制作为例,使用快手智播平台输入口播文案,两分半钟就可以生成视频;在直播的时候,使用快手智播平台输入直播稿,提供商品QA库,点击开播,自动推流到快手APP,大大降低了操作难度,为产品走向主流市场铺平了道路。
在这些细节背后,快手AIGC技术层的部署已经相当成熟。根据王仲远透露,快手“全模态、大模型AIGC解决方案”基于自研的基座大模型,提供文本生成、图像生成、3D生成、音乐生成、视频生成等技术能力,覆盖从灵感启发到创意生成、从多元素材提供到智能化制作的内容创作全流程,通过人机协同,让创意更新奇、素材更多元、制作更轻松。
多场景落地验证
最重要的是,“快手智播”根植于快手整个生态,有庞大的生态和数据作为支撑。目前,在快手生态中,电商、本地消费、本地生活等大场景日渐成熟,同时汽车、房产、快聘、家装等垂类场景快速扩张,为方案落地提供了坚实的土壤。“快手智播”的效果已经在多场景中得到了充分验证。
尤其在直播场景,“快手智播”不仅可以提升各类直播场景直播时长,降低开播门槛,还可⽀持上千个直播间同时开播,⽀持虚拟主播与⽤户进⾏实时互动。同时,通过快手提供的整套的SaaS服务工具,无需另外采购任何硬件设备,数字人主播就能一键开播。
官方数据显示,“快手智播”的整体增效超过2倍。在快⼿内部测试中,数字⼈直播转化能⼒也超过⾏业内平均主播⽔平。比如花西子官方旗舰店的快手账号,在真人主播下播后,其定制数字人完美“接班”,辅助品牌低成本满足“夜猫子”用户的直播购物需求。
数据显示,在数字人夜班直播期间,花西子官方旗舰店的观看时长基本与日间时段持平,GMV达到日间真人主播的6成左右。花西子内部人士评价称:“数字人效果太逼真,用户没分辨出来,还是会问很多问题,我们也能迅速回复。”
据了解,目前“快手智播”与直播系统已完成打通,支持直播间⾃动推流,无需⼈⼯操作。此外,“快手智播”还打通了挂车系统、商品知识库和⾃研GPT,⽀持⾃动挂⻋,⾃动切换讲解卡⽚以及智能⽂字和语⾳回复。
快手一直致力于用AIGC能力去帮助创作者解决创作过程中存在的各种痛点,提升创造力和生产力。可以预见的是,“快手智播”将会成为快手内容创作不可取代的基础设施之一。王仲远表示,身处这场 AI 技术变革之中,快手坚信AIGC将赋予普通用户更多的创作权力和自由,也坚信AIGC正在成为短视频内容生产的基础设施。
扫码关注我们
EZCOVER易盖生活美学
微信号 : EZCOVERBEST
继续阅读
阅读原文