从辅助的工具到创作的主体,AI在内容创作领域正得到越来越多的关注。当人工智能与想象力结合,会带来新的文艺复兴还是内容消费方式的彻底改变?AI可以取代艺术家的天才创作吗?这个领域的创业者在探索什么、思考什么、困惑什么?
人工智能+想象力,将如何颠覆数字内容创作与消费市场?
第二期5Y 3Sigma小圆桌,11位这个领域的创业者——Sea AI Lab音频组负责人任意,前小米情感对话负责人李嫣然,斯坦福计算机在读博士李怿铠,AVAR创始人胡雅婷,深言科技创始人岂凡超,北大前沿计算机在读研究生敖腾隆,彩云小梦创始人袁行远,特看科技产品负责人滚石,Artflow.ai创始人张宇轩,图形起源创始人史海天,捏咔创始人大猫在小圆桌中分享了他们的经验和观点。
我们节选了部分精彩内容,希望对你有所启发。另外,新一期5Y 3Sigma 小圆桌将在10月2日举行,欢迎报名加入分享和讨论:)
为什么要关注AIGC
五源董事总经理 陈哲
过去十年,移动互联网的高速发展,互联网内容的供给持续增加,与此同时,用户对于高质量内容的诉求也在增加。随着AIGC技术的诞生,AI在内容生成方面的角色跟作用在逐渐的放大。
AI生成内容将会经历两个阶段,第一个阶段是AI-assisted GC,更多是AI对现有内容创作环节的优化。受限于今天的技术边界,目前还没有到下一步真正的AIGC,即从整个内容创意的产生、制作过程到反馈和迭代机制,AI都起到主导的作用。
另外我们认为AI不仅是在内容生产上有所突破,也会颠覆我们的交互方式。AI与用户可以有一种非常开放的交互方式,这种形态的产品具有广泛的想象力。AIGC对内容和交互的影响,会从传统的web2时代中心化的内容生产和分发方式,逐渐朝去中心化方式转变,比如web3带来的这种更去中心化的确权和分发机制;同时,现有的内容平台更多还是围绕真实世界,随着AIGC的发展,内容也在往虚拟化和3D化演进。
AIGC也会带来很多问题,比如高质量数据和算力可能集中在头部公司,如何形成更好的版权保护,以及未来可能会面临的伦理问题,这是未来几年AIGC在逐渐落地的过程中需要解决的问题。
五源在AIGC领域支持了非常多的公司,我们也希望未来在新一代技术诞生之后,能找到下一批带来颠覆式变革的创业者,这也是我们持续做3Sigma小圆桌的原因我们希望成为顶级科技创业者最早、最长期以及最有影响力的合作伙伴。
圆桌讨论:
AIGC的技术、产品与情感
参与者:
李嫣然 前小米情感对话负责人
李怿铠 斯坦福计算机在读博士
贺开颜 五源投资人
贺开颜:AIGC技术迭代的方向特别多,请大家分享一下觉得最意想不到的一个技术变化?
李嫣然:  对我来说还是Prompt的那个技术,最开始做生成的时候,我们常常觉得生成的不够好是因为给的信息不够多,输入不够导致输出不好。但近两年通过技术我们发现,其实输入不够多的时候,它也能去想象和捕捉到你想让它生成的东西,这种交互方式是非常自然的。所以我觉得这个技术突破本身带来的颠覆程度是足够惊艳的,其次技术可能给产品形态带来一些变化,也让我们能进一步有更多探索。
李怿铠 : 我最大的感触还是在做研究期间突然看到OpenAI推出了DALL-E 2,试用之后发现就是真的是暴力出奇迹,生成的速度和质量都比他们之前的版本有几倍的提升。
贺开颜: 关于产品层面也想问问大家,你们印象最深的产品是什么,以及可以分享下原因的产品?
李嫣然 : 可能我的答案比较枯燥,还是Replika。Replika的功能最开始就结合了一些策略,让你觉得它在多轮的聊天能细腻、有逻辑地体察你的情感,所以人们愿意长期使用。同时它给了用户一个显性的界面,告诉用户我理解了什么。
而且Replika集中在情感心理这个方向,而且采取了书写这种方式。书写本身也是情感疗愈中的一个很重要的形式,很多人会通过书写自己的感受来使得自己的情绪得到缓解。所以我认为它有一种非常好的双向的创新,Replika给了用户一个很好的范本,用户是很愿意在它的基础上再去写自己的感受,这样就会产生一种深层的连接。
李怿铠 : 我更喜欢可能还是一个叫disco diffusion的开源社区,我是看着它从最开始的版本,基于Open AI开源的CLIP模型,之后有一大帮人去做改进,比如说速度上、模型大小上以及后面从简单的2D生成到视频生成,以及到2.5D的这样的伪3D生成,我觉得大家对它的不断改进让我觉得更impressive。
贺开颜:  大家都在这个领域里深耕多年,关于AI理解情感,如果也有L1到L4发展路径的话,今天在什么阶段?
李嫣然: 刚好之前清华的黄民烈老师他们推出了AI对话系统的分级定义,里面也讨论了情感理解的方向,我们也一起完善了一下。我们把情感理解能力氛围L1到L5,L1即一般的对话系统,可以不理解情感;L2是希望它至少能分出三种倾向,积极的、消极的还是没有情绪;L3是至少能分清楚3种以上的情感,具备了一种分类的能力;L4我们认为是可以结合很多多模态信息,甚至一些环境信息来理解情感。
最后,人的情感是复杂的、有很多维度,有先天的生理基础,也有很多个性化的情感加工,所以理解用户情感需要考虑多种的因素,这个是L5的线,可能刚刚起步,还在探索中。我们现在可能处于L2到L3之间。
贺开颜:怿铠可能更多是在研究图像视觉这一块,如果从这个视角来理解的话,你会有不一样的感受吗?
李怿铠: 我感觉是很相似的,本质是要建模人类看图像的感受。这种建模从易到难分为几个阶段,最简单的就是你直接两个图标告诉他喜欢还是不喜欢。下一个阶段是告诉他你喜欢的程度,再难一点,就是你给他6种、8种或者24种情绪,让它去挑选做一些分类人物,更难一些的话就是自然语言的多模态分析。
发展阶段的话,我能感觉到这一块从2014年机器学习兴起时开始,很明显的是open AI train了一个大模型之后,把多模态的分类任务显著提升到了更高的水平。相当于有一个断层式的新技术出来后,所有的效果都增强。现在大家相当于在基于这个多模态的任务去进行视觉和文本描述的情感之间的分析,不断地有新的论文在出来。
摘自嘉宾李怿铠的分享PPT
贺开颜: 果说AI产品的重要发展方向是往更像真人演进,或者说要达到L4阶段这种多模态的情感理解水平,从今天看的话,最重要的技术突破是什么?
李嫣然: 我觉得最重要的技术突破还是偏自身智能的方向,需要机器可以自主去探索,它可以主动发出一个关于它的感受的交流,这个是我觉得一个很重要的突破方向。
李怿铠:可能我关注的case比较简单,关于图像给人的情感,目前AI其实能够有一定的感受力,但我们明显意识到遇到的技术难点是,人的审美太多样了,只有一个人的数据量是完全不足以去学习出他的审美的。必须要收集到大量的数据,用一个平台的偏好数据,把审美相似的人的数据聚集起来进行统一的分析,学习所有人的审美,才能把理解情感的模型训练出来,只用一个人或者几个人的数据是远远不够的。
摘自嘉宾李嫣然的分享PPT
圆桌讨论:
多模态内容生成与C端交互
参与者:
敖腾隆 北大前沿计算机在读研究生
袁行远 彩云小梦创始人
石允丰 五源投资人
石允丰: 其实关于AIGC大家一起探索了很久,为什么之前始终没有出现to C标准上大规模普及的产品,是还太早还是就是我们没有等到信号?
袁行远: 我觉得可能还是技术没到,就像手机之前做了很多年,但是iPhone2007年发布时使用的多点触控,以及搭载iOS移动操作系统,才让这个变成了更可用的东西。对于现在的我们来说,可能我们的能力已经能够让一小部分人觉得AI像真人,大概20%-30%,但是如果有一天可能超过一半人甚至80%-90%难以分辨AI和人类,你愿意和AI一直聊天聊下去,拥有这样的能力可能是一个临界点。
敖腾隆: 我也很赞同,我们做的方向其实也是技术的问题。另外,3D动画现在很难做到低门槛,还有一个原因也是我们还没有真正去验证过,用户是否真的需要这个,是否真的可以激发大家的创作活力。我们还没有得到真实需求的验证,目前还没有看到真正特别work的东西落地,可以尝试一下。
石允丰:刚刚大家也提到恋与制作人,它是没有AI智能的游戏,但营收可能比目前很多的AI智能产品都高。你们怎么看,在to C的交互场景里,AI的灵魂或者说智力水平比较重要,还是其他比如外形更重要?
袁行远: 我觉得还是再给些时间吧,开始可能汽车跑不赢马车,将来肯定不是这样的,人工做的东西,在多样性和效率上肯定不如AI,我觉得这是一个时间问题。
石允丰:好比今天我们在等变革真正到来。两位觉得哪些技术突破或者说技术变量,可以让这个变革再往前走一大步?
袁行远:  我们现在面临的挑战是,让AI可以到不同地方的memory能够更久,用户可以在虚拟世界里跟AI一起玩耍,在仙侠世界里一起游历、远洋,你不会感觉到它是AI。
从语言到action,很多游戏公司也在做各种有意义的尝试。我们需要把强化学习的这套智能和自然语言的这套统计意义上的智能,某种形式上做一种结合,这也是《思考快与慢》那本书里讲到的系统一系统二的问题。把它们结合之后再往前进,可能需要一个算法的改动。这个算法的改动可能会由科学界来完成,当然如果我们这些产业界的人比较努力,也有可能由产业界的人完成,也许就一两年时间,能够把整个智能度往前再推进。假设彩云小梦现在的智能度是一分,那我们的目标是把它做到十分,应该还有十倍的可能性。
敖腾隆:  不知道大家没有种观点,每一个分支已经做得非常好了,比如gesture、locomotion,但还没有人把它们结合起来,做一个让大家眼前一亮的东西,也是因为各个部分的接口或者开源做得不太好,这也是我们想推进的事情。如果预测的话,我觉得两年内如果这种结合做得比较不错,是能出现一个在短视频平台上,让人难以区分是人做出来的还是AI做出来的动画。
石允丰: 这种情况可能需要一个天才产品经理,把这些需求剪裁一遍结合起来。
摘自嘉宾敖腾隆的分享PPT
敖腾隆: 我也有个问题请教一下大家,你们觉得AIGC这个行业的产品经理会,与传统互联网的产品经理有什么区别,在技能上会需要什么要求?
石允丰:这个问题我最近也在思考,不成熟的假设是平台型互联网公司的产品经理可能更像系统维护或者宏观经济调控师的角色,要去平衡内容创作者与消费者之间的关系,调控创作者之间、不同内容品类之间的系数。而AIGC行业现阶段更需要有创造力、创意的人,这是两种不同的角色。
可能有一类比较成规模的公司里还是系统性保持了创造力,就是游戏公司。对于游戏公司来说,可能做挂了两个大制作,公司面临的是存亡问题,所以相当于用命悬一线的处境让公司延续下创造力,这和其他互联网平台公司的处境是很不同的。所以AIGC这个阶段所需要的创意和passion人才,在游戏公司里系统性出现的可能性更高。

新一期5Y 3Sigma小圆桌将在本周日10月2日9:30-12:30举办,主题为:通用机器人,前往通用智能之路?
欢迎【扫码海报中的二维码】或者点击【阅读原文】报名,加入分享和讨论。
互动送礼
欢迎在评论区分享你对AIGC的观点与看法,我们会选取2位精选留言,送出五源纪念T恤+五源咖啡杯一份。(留言截止到10月7日,请在收到信息的24h内回复收件信息。)

五源寻找、支持、激励孤独的创业者,为其提供从精神到所有经营运作的支持。我们相信,如果别人眼中疯狂的你,开始被相信,世界将会别开生面。
BEIJING·SHANGHAI·SHENZHEN·HONGKONG
WWW.5YCAP.COM
继续阅读
阅读原文