近日,真格基金举办了「真格精酿 · AIGC 新浪潮主题沙龙」闭门交流活动,与创业者一同交流 AIGC 领域的发展趋势与思考。
AIGC(AI-generated content,人工智能生产内容)作为今年的热点 ,不论是语音、文字还是视频领域,都出现了很多领域内的创新应用,也有了一些非常有趣的落地场景。今天我们邀请到了几位行业内重磅嘉宾,还有四位真格投资人:袁梦、孙宇光、蔡妮娜、陈芳洲和大家一起畅谈 AIGC 的各种可能性。
——真格基金合伙人 尹乐
AI绘画艺术创作技术探索与心得
分享人:大谷 人工智能修复专家、知名 UP 主
AI 绘画领域的进步快的超乎想象
2020 年 StyleGAN(基于样式的生成性对抗网络)流行时,我会做一些二次元的 AI 绘画生成,包括后来的 AI 人脸生成人物,也都是用的这个技术。2021 年,当 DALL·E 和清华团队的 CogView 出现的时候,我看到文字转图像生成技术的可能,但当时都还很粗糙。2021年底出现的 VQGAN+CLIP(Vector Quantised General Adversarial Network + Contrastive Language - Image Pre-training)技术串联,就可以生成抽象绘画作品了。
去年,我还将 AI 故事创作与图片生成作为一个未来的展望。没想到短短一年时间,AI 技术会进步这么大,对 AI 艺术创作者也产生了巨大的影响。
2022 年初,Disco Diffusion 的横空出世给行业带来很大的冲击,其在生成速度、效果,还有词条内容等方面都丰富了许多。但我们仍然可以发现作品局部细节中的不合逻辑处,想把生成图完善成写实的概念设计图很有难度。
2022 年中,DALL·E 2 和 Google 的 Imagen 可以通过文字来要求 AI 画出特别具体的内容,而且效果已经接近于中等画师的水平。但是因为当时需要申请才能使用,并没有得到广泛使用。与此同时,架设在社交平台 Discord 上的 Midjourney,因其使用便捷与相对较好的效果,在社会层面得到了很大的关注。
到了今年 8 月, 就有了 Stable Diffusion 的开源模型,生成的面部和肢体相较于 Disco Diffusion 也自然了许多。
以上图片均为 AI 生成,我用 Textual Inversion+ 自制数据集训练提取了 6、7 种不同的真人的相貌作为脸部基因。在输入给 AI 的文字中,可通过调整训练好的几个相貌 tag 的比例权重,融合出现实里不存在的,保持一致的虚拟相貌。未来设计新的游戏角色可以从这种方法来入手,还可以应用在分镜设计、演员定妆等场景。
在 AI 艺术创造道路上,乐此不疲
做 AI 上色修复是最开始我对 AI 技术产生兴趣的契机之一,也做过一系列有意思的尝试,比如 AI 修复百年老北京影像、AI 还原宋朝皇帝相貌照片等等。
今年我尝试了用 Stable diffusion 做了一些歌曲的 MV 动画,输入歌词就能用模型生成画面内容,并用文字完成人工智能配乐。还跟人民日报联合制作了一个中秋视频,为古诗配画。
最近做的新尝试是想探究 AI 是如何理解人类的历史的。具体来讲,就是让 AI 生成现实中不存在的历史某一时刻的照片,就像我发送了一个无人机到了古代进行现场拍摄。比如法国滑铁卢战役的现场纪实照、第二次世界大战诺尼登陆时士兵的自拍等等。把 2000 年人类历史让 AI 来总结,虽然图像和服装并不是完全准确,但很有趣。
右滑查看更多
从皮囊到灵魂,未来 AI 虚拟人世界
分享人:黄民烈 聆心智能创始人、清华大学计算机科学与技术系长聘副教授
通过交流展现 AI 的“灵魂”
如果说一个虚拟人有思想、有见识、有态度、有情感、能共情、有同理心,那么我们认为它具备了灵魂的能力,而不仅仅是有一个漂亮的外表。它一定要在跟人的交流互动里体现思想,体现见识,体现态度和观点。聆心智能近期推出了一个 AI 乌托邦小程序可以召唤任意想要的角色,并与之实现无障碍的对话。这个角色可以是名人、明星,甚至可以复刻你青少年时期的好朋友,或者初恋情人。另外程序中还会提供我们培育的心理疗愈师 Emohaa,它是用超过百亿的高质量心理领域的训练数据生成的模型,在医学实验中被证明具有治疗效果。
聆心智能的产品「AI 乌托邦」,与乔布斯对话
对 AI 人格化的担忧,可以让子弹先飞一会儿
所有的 AIGC 领域的应用都会遇到一些社会问题的挑战。从技术发展的角度来看,我的观点是:可以让子弹先飞一会儿,随着技术发展的过程,相关技术的应用会更加规范。只要秉承的初心是科技向善,就像 1940 年,有担心科学技术的进步可能引发一些人类不希望出现的问题,为了保护人类,阿西莫夫提出的“机器人三原则”,只要让机器人能够为人类服务的大宗旨不变,就应该是技术被鼓励和发展的方向。
AI 与人类共同进步是发展趋势
在不同的应用场景下会出现两种趋势,一种是 AI 给人打工,另一种是人给 AI 打工。辅助创作、各类智能客服就是 AI 给人打工。但在某些场景下,当这个 AI 还不太厉害但是有学习和成长能力时,就可以让人类帮助去培养 AI 。通过交互与反馈,AI 会变得越来越聪明,就像养小孩一样,这是 AIGC 未来非常重要的方向。
从工具到外脑,探索 AI 认知的可能性
分享人:李京梅 澜舟科技 合伙人/首席产品官
赋能 B 端的关键说到底还是降本增效
澜舟科技去年与容徽合作打造了一款自动化写作产品 content-note.com,主要面对社交媒体场景服务营销人员。只需要三步:选择模板-输入关键词-生成结果,就能生成一篇营销文案。对于职场新人,它能够有效降低工作门槛,快速成为一个文案高手;对于批量实时化要求很高的生成任务,它可以快速提效。而且成本上也大大降低了,人工需要几十块到一百块钱一篇的内容,机器写作的成本只要两三块。
今年我们又推出了文学辅助写作工具,有一款跟中文在线合作的产品,主要是赋能网络文学的作者,帮助他们提升效率,专注创作。同时还推出了一款面向公众 AI 辅助小说接龙写作的小程序“熊猫小说家”,主要是娱乐功能,也帮助大众了解 AIGC 的黑科技。
用澜舟文学辅助写作生成文本
技术有了,现在拼的是场景
文字生成图像方面,Stable Diffusion 能帮助大家很好地做出来。我们现在看到了一些有意思的落地,比如在儿童写作文和画画方面的辅导场景中,可以给小朋友带来更多的灵感来源,目前也在和中文在线合作在文学创作中基于情节生成图片。
用AI,今天就能像做 PPT 一样做视频
分享人:徐卓 诗云科技  联合创始人/CEO
底层生产力发生变化时,生产关系也会变化
在众多的平台里面,内容创作者比例其实只有1%左右,绝大多数人是内容消费者,整个创作过程也是相对复杂的。在得到一个视频内容后我们会发现一个局限性:你能创作的内容只能是镜头捕捉到的地方。如果 AI 可以去生成内容,那我们就可以突破这个边界。
首先,视频创作不会被摄像头的拍摄范围所局限,创意可以得到更灵活的发挥;同时,从一个线性的生产方式到创作范式发生了变化,它不是以前那种需要先拍摄再去剪辑的过程了。本质上,因为底层生产力发生变化的时候,生产关系也会发生变化。我们今天看到的是 1%的创作者,99%的消费者,不一定非得是这样,也不一定是一个长期维持的状态。
用诗云科技的产品Movio人工智能生成视频
全民 AIGC 的情况下我们选择一条更难的路
文字生成和图片生成领域已经有相对比较好的商业落地和应用了,但是视频上还没有,但我们每天消费的互联网视觉内容大多数是视频。当然视频的生成具备各方面技术上的难度,场景落地也更复杂,但是我们从一开始就相信这个事情会发生,过去两年,的确也看到了一些进展。我们现在花很多精力去研发的,是角色创作。
浪潮来临,拼的是信念
新技术会带来一种螺旋上升的形态。2014 年深度学习已经爆发,目前来看,没有一家公司是因为做深度学习而获得极大商业成功,更多的是产品公司,和 AIGC 的现状是一模一样的。技术的发展在一开始掌握在少数人手中,只要 1-2 年时间,每个人都会拥有,并不是一个很稀缺的东西,现在的 Stable Diffusion 也是同样的道理。
从创业的角度看,一种是愿景驱动,一种是机会驱动。后者也有很多公司做得很好。但如果你选择了前者,认定了三年之后 3D 生成会被突破,最重要的还是找到 PMF(Product-market fit,产品-市场匹配)。服务客户的时候只有一个判断标准,你是否给客户带来了价值?本质上还是要看,你要解决什么问题,AIGC 只是一种工具,不是目的。
碰撞的声音:AIGC 如何赋能内容生产行业
“AIGC 是一个非常有经济价值的行业。图灵测试时长决定了 AIGC 能在什么场景应用。例如通过三分钟图灵测试的 AI 能在直播带货和客服场景产生巨大的价值。未来的发展,会是出现无限长时间图灵测试的 AI,即永远看不出是 AI 的 AI。
把摩尔定律引申到这个行业,基础算法设计每18个月会有一次大变革。以前需要一个设计师花费半天到一天的时间才能做出比较好看的直播背景图,但用今年的算法 10 分钟就可以生成 20 个背景图,再让客户从中挑选出两到三个满意的,这是直播行业刚需。”
——跳悦智能创始人兼 CEO  包英泽
“我认为设计两个字,‘设’是人的创意和创想,‘技’是精准地去测量和标注。目前 AIGC 更多的功能还是‘技’这块,‘设’还需要人的介入。对于设计来讲,AIGC 现在更多是得力助手的角色。通过 AIGC 可以将设计师的想法很快地以不同形式去表现,给到客户看。这也牵扯出来一些知识产权和版权方面的问题,AIGC 的出现会加速法律法规出台,规范行业。
——独立插画师 曲艺 
“在音乐行业,目前 AI 创作出来的音乐作品还无法取代人工创造的音乐,其原因有二:最大的一个问题就是市场上不缺新音乐;第二,对于音乐来讲,品牌很重要。目前 AIGC 在行业里所占份额很小,可能连万分之一都不到。AIGC 的价值还只是为创作者提供灵感来源,我认为未来可能的发展方向是 AIGC 其他类型内容的产出与音乐相结合。”
——某大厂音乐内容领域负责人 Yang
在游戏行业,AIGC 最明确的需求就是更快地创造交互场景,这是个非常重要的刚需,因为时间成本和制作成本都很高。相信未来 AIGC 也会减轻整个电影和游戏行业的制作成本。”
——某大厂游戏行业商业化负责人 Orange
在 3D 内容行业的各个环节上,运用 AIGC 会有很大效率上的提升。比如,在设计上不再需要原画师改稿,AI 的 img2img 可以批量出设计图快速测款;在材质生成方面,一方面不再需要模型师手绘贴图;另一方面用户可以参与生成数字服装,获得独一无二的款式;最终渲染时,可以把 CG(计算机图形学)渲染结果再给到 AIGC,这样就可以基于物理正确的结果再生成丰富的艺术风格。
——AVAR CEO 胡雅婷 
更多被投新闻
格灵深瞳 | 曦智科技 | 来也科技 | 星亢原
东方空间 | 循环智能 | 诗云科技 | 赛舵智能
推荐阅读
继续阅读
阅读原文