作者:诗云科技创始人 徐卓
科幻小说《诗云》里面描述了这样一个故事:
拥有至高科技的神级文明降临地球,认为在落后的人类面前他们的技术无所不能。在人类被逼到绝境之时,神发现人类文明中存在“李白的诗”,认为技术能超越艺术的极限,并尝试通过超级算力去穷举完所有的诗词以创造出超越诗仙巅峰的作品,然而最终挑战失败在人类本质的创造力面前,无比强大的神级科技也低下了头。
科技和艺术的关系是什么样的?
在 Surreal 诗云科技创始团队看来,艺术的本质是人类的创造力,无法被机器替代。但创作的过程和效率却可以被机器极大优化,让人类更专注创意本身。
相机与降低成本
在 1819 年摄影术被尼埃普斯发明前,人们的视觉故事表达(visual storytelling)仅能通过绘画来实现。
从 1839 年达盖尔摄影法被无偿贡献给全人类,到轻便的胶卷替代了湿版,再到数码相机的诞生,最后到今天我们利用轻便的手机摄像头捕捉生活,人类对于视觉内容的创作方式一直由科技推动而变得更加普世化。
今天大部分的视觉内容创作,无论是图片还是视频,都是通过相机(Camera)来捕捉。
图片来源:Vin Ganapathy. © The Spruce, 2018
200 年多来,相机的定位和职能看似不断地被延伸甚至颠覆,但是它的定位不外乎是两点:
●  Capture Experience(记录
  Storytelling(故事表达)
我们认为,“记录” 这个定位本身,会长期存在,而且会继续朝着更方便轻巧的方向发展。
而 Storytelling 并非一定要通过相机实现,因为我们今天可以通过 AI 来生成逼真的高质量的视觉内容,甚至将现实中不可能存在的场景变成可能
我们相信,这看似魔法般的方式,未来会成为视觉内容创作的主流,成为如同相机发明般的视觉内容创作史转折点。
我在 Snapchat 工作了六年多的时间,公司在 17 年 IPO 的时候对自己的定义并非是基于社交网络的公司,我们招股书的第一句话是:Snap is a camera company。
从成立到现在,我们都希望打造最一流的相机体验,降低用户表达分享的成本,从而更自由地创作内容。背后的社交网络其实是构建在这个基础之上的。
虽然我们看到很多新的内容形式与相机特效的出现,但是拍摄本身就是一个成本极高的行为,我们希望通过 AI 内容生成来代替拍摄。

新的内容基础设施
诗云正在做的事情,从本质上来说,是在构建一个新的内容基础设施。
我们可以看到近些年在各大社交平台上,人们在网络上的表达更多由纯文字变为更直观丰富的视觉内容表达。
今天大部分的视觉内容创作,其实要经过繁琐的拍摄设备与场景的搭建、演员的演绎、很多角色和摄影上的配合,以及后期的剪辑与加工。但是在我们构建的这个新的生态系统里面,以AI生成技术取代复杂且高成本的拍摄过程,使用户输入的精妙创意可以极高效地被生动地表达出来。
未来一个趋势将逐渐清晰——未来网络上视觉内容的数量增长将疾如雷电,且大部分内容由AI进行生成。
这种基于 AI 生成的技术会极大地提升内容创作的生产力,甚至会改变未来的内容生产关系——从现在的创作者和内容消费者呈现一种割裂的状态,转变成每个人都不仅是视觉内容的消费者,同时也可以是视觉内容的创作者
因为我们会让创作内容的创作以及内容二次创作都会变得极其的简单。信息的传递也不会像现在单向线性地传播,而是触达每个个体时会有二次发散的潜能,创造力会在个体间不断碰撞融合,激发出更高能量。
图片来源:Surreal 诗云科技
AI 内容创作捷径
我们将内容基础设施的建设大致分为三个阶段 -基于人脸的生成基于人体的生成、以及基于环境的生成,每一个阶段都将围绕「内容生成」与「内容再生产」两个纬度展开。
其背后的思路是:从生成一个具有表达力的形象开始,到拓展这个角色的全貌,再将其放置于一个合适的上下文中以丰满内容表达层次,最终形成一个全面的内容基础设施。
图片来源:Surreal 诗云科技
三个阶段对于故事的表达能力依次递增,每一个阶段不同的技术和丰富的应用场景都能创造巨大价值。

我们已经把第一阶段的角色形象生成相关技术发展成熟且产品化落地,现在可以按需高效生成不同人种模特图,帮助品牌建立自己的模特 IP,并且快捷将批量图片视频视觉内容进行国际化文化适配,降低成本的同时显著提高业务数据。
图片来源:Surreal 诗云科技
我们第一阶段的诗云马良产品,不仅可以使用语音或者文字去驱动已生成的虚拟角色进行精准嘴形适配的视频表达,同时也可以控制虚拟角色的表情。
在内容生产端,我们也可以给很多品牌方提供 AI 换脸的技术,通过把我们创作的虚拟角色替换到他们现有的视觉内容角色上,以更低成本去拥有海量不同模特展示的素材去表现他们的商品,增强品牌的表现力。
“我们活在最好的时代。” 内容生成时代的来临让我们十分激动,诗云科技是世界上为数不多的投身到内容生成领域的创业公司。
我们内部有一个公式是:visual storytelling = creativity + making。我们要做的是把 「making 」的成本降低到趋近于零,构建一套内容生成系统,让每个用户尽情去释放自己的创造力——人类独有的智慧结晶。这也是《诗云》给我们的启示。
  -  推荐阅读  -  
继续阅读
阅读原文