进步超乎想象,与AI走进未来|真格精酿 · AIGC新浪潮沙龙回顾

AI绘画艺术创作技术探索与心得
分享人:大谷 人工智能修复专家、知名 UP 主
AI 绘画领域的进步快的超乎想象
2020 年 StyleGAN(基于样式的生成性对抗网络)流行时,我会做一些二次元的 AI 绘画生成,包括后来的 AI 人脸生成人物,也都是用的这个技术。2021 年,当 DALL·E 和清华团队的 CogView 出现的时候,我看到文字转图像生成技术的可能,但当时都还很粗糙。2021年底出现的 VQGAN+CLIP(Vector Quantised General Adversarial Network + Contrastive Language - Image Pre-training)技术串联,就可以生成抽象绘画作品了。
去年,我还将 AI 故事创作与图片生成作为一个未来的展望。没想到短短一年时间,AI 技术会进步这么大,对 AI 艺术创作者也产生了巨大的影响。
2022 年初,Disco Diffusion 的横空出世给行业带来很大的冲击,其在生成速度、效果,还有词条内容等方面都丰富了许多。但我们仍然可以发现作品局部细节中的不合逻辑处,想把生成图完善成写实的概念设计图很有难度。
2022 年中,DALL·E 2 和 Google 的 Imagen 可以通过文字来要求 AI 画出特别具体的内容,而且效果已经接近于中等画师的水平。但是因为当时需要申请才能使用,并没有得到广泛使用。与此同时,架设在社交平台 Discord 上的 Midjourney,因其使用便捷与相对较好的效果,在社会层面得到了很大的关注。
到了今年 8 月, 就有了 Stable Diffusion 的开源模型,生成的面部和肢体相较于 Disco Diffusion 也自然了许多。
以上图片均为 AI 生成,我用 Textual Inversion+ 自制数据集训练提取了 6、7 种不同的真人的相貌作为脸部基因。在输入给 AI 的文字中,可通过调整训练好的几个相貌 tag 的比例权重,融合出现实里不存在的,保持一致的虚拟相貌。未来设计新的游戏角色可以从这种方法来入手,还可以应用在分镜设计、演员定妆等场景。
在 AI 艺术创造道路上,乐此不疲
做 AI 上色修复是最开始我对 AI 技术产生兴趣的契机之一,也做过一系列有意思的尝试,比如 AI 修复百年老北京影像、AI 还原宋朝皇帝相貌照片等等。
今年我尝试了用 Stable diffusion 做了一些歌曲的 MV 动画,输入歌词就能用模型生成画面内容,并用文字完成人工智能配乐。还跟人民日报联合制作了一个中秋视频,为古诗配画。
最近做的新尝试是想探究 AI 是如何理解人类的历史的。具体来讲,就是让 AI 生成现实中不存在的历史某一时刻的照片,就像我发送了一个无人机到了古代进行现场拍摄。比如法国滑铁卢战役的现场纪实照、第二次世界大战诺尼登陆时士兵的自拍等等。把 2000 年人类历史让 AI 来总结,虽然图像和服装并不是完全准确,但很有趣。
右滑查看更多
分享人:黄民烈 聆心智能创始人、清华大学计算机科学与技术系长聘副教授
通过交流展现 AI 的“灵魂”
如果说一个虚拟人有思想、有见识、有态度、有情感、能共情、有同理心,那么我们认为它具备了灵魂的能力,而不仅仅是有一个漂亮的外表。它一定要在跟人的交流互动里体现思想,体现见识,体现态度和观点。聆心智能近期推出了一个 AI 乌托邦小程序,可以召唤任意想要的角色,并与之实现无障碍的对话。这个角色可以是名人、明星,甚至可以复刻你青少年时期的好朋友,或者初恋情人。另外程序中还会提供我们培育的心理疗愈师 Emohaa,它是用超过百亿的高质量心理领域的训练数据生成的模型,在医学实验中被证明具有治疗效果。
聆心智能的产品「AI 乌托邦」,与乔布斯对话
分享人:李京梅 澜舟科技 合伙人/首席产品官
赋能 B 端的关键说到底还是降本增效
今年我们又推出了文学辅助写作工具,有一款跟中文在线合作的产品,主要是赋能网络文学的作者,帮助他们提升效率,专注创作。同时还推出了一款面向公众 AI 辅助小说接龙写作的小程序“熊猫小说家”,主要是娱乐功能,也帮助大众了解 AIGC 的黑科技。
用澜舟文学辅助写作生成文本
分享人:徐卓 诗云科技 联合创始人/CEO
底层生产力发生变化时,生产关系也会变化
首先,视频创作不会被摄像头的拍摄范围所局限,创意可以得到更灵活的发挥;同时,从一个线性的生产方式到创作范式发生了变化,它不是以前那种需要先拍摄再去剪辑的过程了。本质上,因为底层生产力发生变化的时候,生产关系也会发生变化。我们今天看到的是 1%的创作者,99%的消费者,不一定非得是这样,也不一定是一个长期维持的状态。
全民 AIGC 的情况下我们选择一条更难的路
从创业的角度看,一种是愿景驱动,一种是机会驱动。后者也有很多公司做得很好。但如果你选择了前者,认定了三年之后 3D 生成会被突破,最重要的还是找到 PMF(Product-market fit,产品-市场匹配)。服务客户的时候只有一个判断标准,你是否给客户带来了价值?本质上还是要看,你要解决什么问题,AIGC 只是一种工具,不是目的。
“我认为设计两个字,‘设’是人的创意和创想,‘技’是精准地去测量和标注。目前 AIGC 更多的功能还是‘技’这块,‘设’还需要人的介入。对于设计来讲,AIGC 现在更多是‘得力助手’的角色。通过 AIGC 可以将设计师的想法很快地以不同形式去表现,给到客户看。这也牵扯出来一些知识产权和版权方面的问题,AIGC 的出现会加速法律法规出台,规范行业。”
“在音乐行业,目前 AI 创作出来的音乐作品还无法取代人工创造的音乐,其原因有二:最大的一个问题就是市场上不缺新音乐;第二,对于音乐来讲,品牌很重要。目前 AIGC 在行业里所占份额很小,可能连万分之一都不到。AIGC 的价值还只是为创作者提供灵感来源,我认为未来可能的发展方向是 AIGC 其他类型内容的产出与音乐相结合。”
——某大厂游戏行业商业化负责人 Orange
“在 3D 内容行业的各个环节上,运用 AIGC 会有很大效率上的提升。比如,在设计上不再需要原画师改稿,AI 的 img2img 可以批量出设计图快速测款;在材质生成方面,一方面不再需要模型师手绘贴图;另一方面用户可以参与生成数字服装,获得独一无二的款式;最终渲染时,可以把 CG(计算机图形学)渲染结果再给到 AIGC,这样就可以基于物理正确的结果再生成丰富的艺术风格。”
——AVAR CEO 胡雅婷
关键词
内容
场景
行业
智能
DALL·E
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。