AIGC的突破进展意味着,内容生产已经从专业生成内容(PGC)、用户生成内容(UGC)时代,进入人工智能生成内容时代。AIGC被认为是web3.0的重要基础设施,并有望成为数字内容创新发展新引擎,为数字经济发展注入新能量。
相比全球领先企业的进展,中国AIGC仍处萌芽期”,技术能力与产品形态的成熟、核心场景的确定及产业的接纳态度,为行业发展的三大关键点。
如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新一轮产业变革的重大意义,纷纷抢滩布局相关创新生态,各细分赛道在持续创新下变革在即,其中,AIGC这一新兴赛道值得重点关注。
AIGC全称为AI-Generated Content(人工智能生成内容),指基于生成对抗网络(GAN)、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。
概念上,AIGC既可以指从内容生产者视角进行分类的一类内容,又可以指一种内容生产方式,还可以指用于内容自动化生成的一类技术集合。
本质上,AIGC是一种AI赋能技术,能够通过其高通量、低门槛、高自由度的生成能力,广泛服务于各类内容的相关场景及生产者。
应用价值上,AIGC有望成为数字内容创新发展的新引擎,为数字经济发展注入新能量。因此,其被认为是Web3.0的重要基础设施。
AIGC的突破进展意味着,内容生产已经从专业生成内容(PGC)、用户生成内容(UGC)时代,进入人工智能生成内容时代。
01
AIGC展:“需求+技术迭代”促发展,从降本增效走向额外价值创造
AIGC的兴起,源自深度学习技术的快速突破和日益增长的数字内容供给需求,当前,其市场潜力逐渐显现。
结合人工智能的发展历程,AIGC赛道的发展大致可分为三个阶段:第一是早期萌芽阶段,即20世纪50年代至90年代中期;第二是沉淀积累阶段,即20世纪90年代中期至21世纪10年代中期;第三是快速发展阶段,即21世纪10年代中期至今。
早期萌芽阶段,受限于科技水平,AIGC仅限于小范围实验。
1950年,艾伦·图灵发表《机器能思考吗》,提出著名的“图灵测试”,给出判定机器是否具有“智能”的试验方法。1957年,Lejaren Hiller和Leonard Isaacson将计算机程序中的控制变量转换成音符,第一支由计算机创作的弦乐四重奏《依利亚克组曲》完成。1966 年,世界第一款可人机对话的机器人“Eliza”在麻省理工学院问世,其根据人工设计的脚本与人类交流,没有语义理解,而是通过模式匹配和智能短语搜索合适的回复。上世纪80年代中期,IBM 基于隐形马尔科夫链模型(Hidden Markov Model,HMM)创造了语音控制打字机Tangora。此后,由于高昂的系统研发成本无法带来相应的商业变现,各国政府纷纷减少了在人工智能领域的投入。
中期是沉淀积累阶段,算力设备性能提升及海量数据基础下,AIGC从实验性向实用性转变,但受限于算法瓶颈,无法直接进行内容生成。
2006年,深度学习算法取得重大突破,同时期,图形处理器及张量处理器等算力硬性设备的性能不断提升,得益于互联网发展,数据规模快速膨胀并为人工智能提供了高质海量训练数据,推动人工智能发展。2007 年,世界第一部完全由人工智能创作的小说《1 The Road》问世。2012年,微软展示全自动同声传译系统,可将英文演讲者的内容自动翻译成中文语音。
2010年至今,AIGC步入快速发展阶段。
2014年,lan J. Goodfellow 提出生成式对抗网络,推动以其为代表的深度学习算法的迭代更新,AIGC 百花齐放,产出效果逐渐逼真至接近人类作品。2017年,微软“小冰”推出世界首部 100%由人工智能创作的诗集《阳光失了玻璃窗》。2018年,英伟达发布StyleGAN 模型,可以自动生成高质量图片。同年,人工智能生成的画作在佳士得拍卖行以43.25万美元成交,成为首个出售的人工智能艺术品。2019年,DeepMind发布 DVD-GAN 模型,用以生成连续视频。2021年,OpenAI 推出了DALL-E,主要应用于文本与图像交互生成内容。2022年OpenAI上线了智能对话系统(聊天机器人)ChatGPT,它能够理解自然的人类语言,并生成类似人类作答的书面文本,引发全球热潮。
相比全球领先企业的进展,中国AIGC仍处“萌芽期”,技术能力与产品形态的成熟、核心场景的确定及产业的接纳态度,为行业发展的三大关键点。
据量子位预测,AIGC在中国的发展可分为三个阶段。
助手阶段(摸索磨合期,2021-2026 年):AIGC辅助人类进行生产,优先变现的关键在于编辑优化功能,行业创新关键能力为素材模块分拆与个性化推荐。
协作阶段(推广应用期,2026-2028 年):人机共创,主要价值为降本增效及提供创意,预计互联网大厂将普遍布局,竞争热度提升。
原创阶段(价值增长期,2028年之后):AIGC将独立完成内容创作,产生附加价值。中国AIGC 企业目前均在初创阶段,机会也许藏在垂直应用领域中,对赛道的选择十分关键。
02
AIGC要素:数据、算法及算力为核,“深度学习模型+开源模式”加速普及
数据、算法、算力三大核心要素,决定AIGC产出质量。
数据是算法的“饲料”,海量优质的应用场景数据是训练算法精确性关键基础,算法需要通过海量数据训练不断完善。
算法是AIGC的“推手”,神经网络、深度学习等算法是挖掘数据智能的有效方法。与传统的深度机器学习算法不同,神经网络在学习范式和网络结构上的迭代,提升了AI算法的学习能力,未来多模态大模型或为核心趋势,赋能产业空间及实践潜力。
算力是“基础设施”,计算机、芯片等载体为AIGC提供基本的计算能力。
早期的传统机器学习,主要是依据事先指定的模板或规则,进行简单的内容制作及产出,其中常见的算法包括回归、分类及聚类等。该类算法具备学习能力,依赖于预先定义的统计模型或专家系统,执行特定的任务,可以完成简单的线条、文本和旋律的生成。但由于缺乏对客观世界的深入感知与对人类知识的认知能力,该阶段AIGC产出普遍面临刻板空洞等问题。另外,该类算法同时面临维度诅咒问题,高纬度数据的参数设置需求随着变量的增加呈指数性增长,对算力提出了较大的挑战,近乎无法完成。
不同于传统算法,深度学习中的损失函数和梯度下降算法可以快速地调整深度神经网络中的参数,从而实现数据学习的功能。深度神经网络在学习范式及网络结构上的迭代,提升了AI算法的学习能力,推动了AIGC发展。卷神经网络(AlexNet)在2012年的ImageNet 大规模视觉识别挑战赛中中一鸣惊人,开启了深度学习时代。2013年,深度变分自编码器及2014年对抗式网络的提出,让AIGC底层技术有了较大进步。除此之外,递归神经网络、强化学习、流模型、扩散模型、深度残差网络及Transformer等技术均取得了进展。超级深度学习近年来的快速发展,带来了深度神经网络技术在大模型和多模型两个方向上的不断突破,并为AIGC技术能力的提升提供了强力的支撑和全新的可能性。除AIGC技术进展,“开源模式”也是AIGC发展不可忽视的催化剂。例如,开源模式加速 CLIP模型的广泛应用,使之成为当前最为先进的图像分类人工智能,并让更多机器学习从业人员将CLIP模型嫁接到其他AI应用。未来,随着模型进一步稳定,开源将成为AIGC成熟的催化剂,有望让相关模型成为海量应用、网络和服务的基础,应用层面的创造力有望迎来拐点。
03
AIGC场景:关注“个性+自动+交互”,“数字化程度高+内容需求丰富”的行业变革
技术场景中,跨模态生成、个性化交互性要求高的内容生成领域为未来发展重点。
基于不同内容模态,我们将AIGC主要分为文本生成、音频生成、图像生成、视频生成及跨模态生成等细分场景(图1)。其中,底层基础基本明确的商业场景预计在未来1-2年实现规模化应用,为具有快速增长潜力的细分赛道。
图1:AIGC细分场景
结合细分赛道,可将AIGC划分为内容领域及延展领域。其中,内容领域目前虽然能够,但并未有效实现商业化,其中存量价值来自于批量处理同质内容的降本增效,而增量价值则来源于跨模态内容生成以及AI本身带来的科技感。在该领域,由于发行商、内容最终消费渠道具有较强的产业链话语权,我们建议关注企业对内容渠道的把控力。延展领域则对AIGC的自由度和稳定性有更高的技术要求,本质为依托人工智能进行定制化及个性化数字内容的自动化创作。
我们认为,以下四类场景有明显增长潜力:个性化内容营销、合成数据生成、虚拟陪伴及交互性内容(适用于游戏等实时变化较大、要求内容多样性的领域)。该领域下,建议重点关注企业数据、算法及商业变现能力。
应用场景中,我们认为,在数字化程度高且内容需求丰富的行业中,AIGC将带来颠覆性变革,包括传媒、电商、影视及娱乐行业等。
传媒领域,AIGC通过人机协同生产,推动媒体融合,例如在采编环节,实现采访录音语音转写,提升传媒工作者的工作体验。电商领域,AIGC可推进虚实交融,营造沉浸体验,例如生成商品3D模型,用于商品展示和虚拟试用;打造虚拟主播等,提升线上购物体验。影视领域,AIGC 可拓展创作空间,提升作品质量,例如赋能影视剪辑,为剧本创作提供思路等。娱乐领域,AIGC 可扩展辐射边界,获得发展动能,例如在视频社交平台实现趣味性图像或音视频生成,盘活用户活跃度。另外,在教育领域、金融领域、医疗领域及工业领域等,AIGC可推进数实融合,加快产业升级。
04
典型应用:ChatGPT引爆聊天机器人应用,大数据、大模型及大算法下的类人交互获得新突破
AIGC文字生成领域的技术场景中,聊天机器人(Chatbot)是核心的应用方向,技术的不断突破正催化对话式AI产品落地。
1970年诞生的Elizzs,是人类建造的第一个对话机器人。2000年前后,新开发的Alice系统开始使用人工智能标记语言,允许用户定制聊天内容,对话机器人能按照预先设定好的脚本来回答问题。2011年,由IBM开发的基于Deep QA技术的Watson,利用深度自然语言处理技术产生候选答案,并根据交叉验证评估。2014年,微软推出微软小冰,此时,对话机器人产品已可以较为熟练地使用深度学习技术。目前,用于客服、外呼、营销等环节的对话机器人产品相继推出,国内已有多家AI技术相关客服公司成立或实现较大规模产品方案落地。
据市场研究机构Acumen Research and Consulting统计,2021年全球Chatbot市场规模约为5.21亿美元,预计未来9年将以23.7%的CAGR增长至2030年34.11亿美元,截至2022年8月,仅仅是Facebook Messenger上就已有超过30万聊天机器人。中国市场,据艾瑞咨询数据,2021年对话式AI核心产品规模约为45亿元,其中软件产值及服务产值分别为32亿元及13亿元;预计2026年中国对话式AI核心产品规模约为108亿元。
2022年11月,美国人工智能公司OpenAI上线了智能对话系统即聊天机器人ChatGPT,引爆全球。它能够理解自然的人类语言,并生成类似人类作答的书面文本,不仅可以帮助开发者解决编码问题,也能充当诗人。目前,ChatGPT仍处在测试阶段,任何拥有OpenAI账户的人都可以免费使用,截至2022年12月7日,ChatGPT已拥有超过100万用户,这帮助其通过人类对话获取大量数据,从而学习人类复杂的语言模式与结构,获得解释用户请求的预期结果的能力。
ChatGPT作为AIGC发展的里程碑,离不开超级基础设施(大算力)下的大模型及大数据支撑。
GPT-3是OpenAI 开发的一个大型语言预测和生成模型,能够生成长序列的原始文本。在GPT-2 的150亿参数基础上,GPT-3将参数量扩大至1750亿。在学界,模型规模和模型效果呈正相关关系为基本共识,但模型规模扩大后,对于CPU的内存、计算能力亦有更高要求。2020年,微软宣布与 OpenAI 合作,在Azure云中运行微软“AI 超级计算机”。这个新型超级计算机包括超过285,000个CPU内核,10,000个GPU和每个GPU服务器每秒400gb的网络连接。在后续研究中,OpenAI发现,训练175B的SFT模型需要算力为4.9pflops/s-days,训练175B的PPO-ptx模型需要60pflops/s-days,训练GPT-3算力消耗约3,640pflops/s-days。虽然GPT-3算力成本高昂,但在语言模型中RLHF非常有效,比模型大小增加100倍更加有效。
因此,ChatGPT基于庞大数据量进行训练的同时,引入了“手动标注数据+强化学习”(RLHF,从人的反馈进行强化学习)来不断调整预训练语言模型。该技术路径大幅提升了ChatGPT 对人类意图的理解,从而提升回答信息的准确性。
ChatGPT具体的训练过程可分为三个阶段:①收集演示数据并训练;②通过人工标注训练数据来训练回报模型;③使用PPO强化学习法优化回报模型,根据回报模型评分结果更新预训练模型的参数。
虽然ChatGPT“类人化交流”引发热议,但由于训练数据的缺乏及偏差,ChatGPT仍有缺点与不足,包括有时会写出看似合理但错误或荒谬的回答及无法完全拒绝不合理及不道德的请求等,但这些不足均有改进空间。
05
AIGC产业:中国企业底层技术发展不足,变现聚焦产出内容及软件服务
由于我国AIGC产业仍处“萌芽期”,所以,独立运行公司较少。量子位智库的研究表明,由于技术发展不足以及投资环境的影响,AIGC在中国大多被作为公司的部分业务乃至相对边缘化的功能进行研发,独立运行的初创公司数量明显少于国外,大部分细分赛道的初创玩家在5 家以下。语音合成(TTS)等较为成熟的AIGC能力大多被综合性的AI公司打包提供,在应用场景上缺乏明确的指向性。另外,底层技术及产业应用侧的差距,导致中国企业仍停留在内容领域开发,如AI写作和语音合成领域,虚拟人赛道则刚刚兴起。
相比之下,国外企业则在延展领域进行了更为充分的挖掘,例如个性化文本生成、合成数据等赛道均是重点布局领域。
中外企业在应用进展上的差异,技术之外更大的原因在于此类业务拓展的综合性要求较高,需要需求方有较高的数字化程度以及对应行业的充分了解,预计国内外在这两个赛道上存在的差距短期难以大幅缩小。
从产业链看,我国AIGC产业还缺失众多环节,比如,上游的数据供给、分拆及标注环节。产业链中游,我国相关企业仍处初创期,垂直赛道值得关注,优秀代表企业包括文字生成领域的聆心智能、澜舟科技、彩云科技、秘塔科技及香侬科技等,图像、音频及视频领域的感知阶跃、影谱科技、帝视科技及标贝科技等,游戏及虚拟人的知觉之门、倒映有声等,综合领域的红棉小冰等。产业链下游主要为各类内容创作及分发平台、第三方分发渠道及消费品厂商等(图2)。
图2:AIGC产业链图谱
整体看,国内AIGC行业尚未建立明确的变现方式。以写作机器人、自动配音等场景为例,大部分产品仍处在“流量吸引+平台改良”的免费试用阶段,变现空间相对较小。此外,据量子位智库的研究,由于服务B端客户时话语权较弱,部分企业会考虑向“2B+2C”领域,乃至直接向2C领域延展。但作为工具,能否在互联网流量相对稳定的前提下有效接触C端用户,并设计好产品转化路径,依旧是一项挑战。
参考海外企业的商业化路径,我们发现AIGC相关企业的变现方式主要集中在模型训练收费、作为底层平台收费、产出内容收费、提供软件服务收费等方面。根据艾瑞咨询披露的中国对话式AI业务占比,软件产值中的私有化部署,包括license(许可号)授权,以及公有云产品(按调用量/流量收费及按订阅制收费),均可成为AIGC企业核心变现路径。
总结来看,中国AIGC产业发展的核心困境来自三个层面:其一,关键技术不够完全成熟,大规模推广落地尚存痛点、难点;其二,企业核心能力参差不齐,威胁网络内容生态健康安全发展;其三,相关规范指引尚需完善,发展与治理之间存在匹配问题。
未来,要把握这一新兴赛道的机遇,可以重点关注其技术及产品迭代成熟度、核心场景的确定、产业接纳态度(开源模式)等三个关键点。
风险提示:政策监管风险;行业市场增长的不确定性;竞争环境不确定性;AIGC企业商业化路径不确定性;技术创新不及预期等。
免责声明:本报告的风险等级定级为R3,仅供符合国海证券股份有限公司(简称“本公司”)投资者适当性管理要求的的客户(简称“客户”)使用。本公司不会因接收人收到本报告而视其为客户。客户及/或投资者应当认识到有关本报告的短信提示、电话推荐等只是研究观点的简要沟通,需以本公司的完整报告为准,本公司接受客户的后续问询。
本公司具有中国证监会许可的证券投资咨询业务资格。本报告中的信息均来源于公开资料及合法获得的相关内部外部报告资料,本公司对这些信息的准确性及完整性不作任何保证,不保证其中的信息已做最新变更,也不保证相关的建议不会发生任何变更。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。报告中的内容和意见仅供参考,在任何情况下,本报告中所表达的意见并不构成对所述证券买卖的出价和征价。本公司及其本公司员工对使用本报告及其内容所引发的任何直接或间接损失概不负责。本公司或关联机构可能会持有报告中所提到的公司所发行的证券头寸并进行交易,还可能为这些公司提供或争取提供投资银行、财务顾问或者金融产品等服务。本公司在知晓范围内依法合规地履行披露义务。
证券研究报告:《AIGC:内容生产力的革命—Web3.0系列专题研究之一》
对外发布时间:2022年12月22日
发布机构:国海证券股份有限公司
本报告分析师:杨仁文
SAC编号:S0350521120001
来源:新财富(ID:newfortune)
作者:杨仁文(国海证券研究所所长)
版权声明:部分文章在推送时未能与原作者取得联系。若涉及版权问题,敬请原作者联系我们。联系方式:[email protected]
继续阅读
阅读原文