AI绘画版权归属的一种可能

自从我使用AI绘画以来，大约平均每周都会有一条网友留言询问：那么，这个版权怎么算？

几天前，还有网友专门跑来告诉我，在最新的判例中美国版权局称 AI 作图不受版权保护，理由是画作是由机器生成，所谓的画家在其中没有扮演什么创作角色，因此对最终画作不拥有版权。最后，他问我对此有什么感受。

长期以来，我对类似的问题的态度都是听之任之，不做讨论。想法很简单：1、我不是立法者，我的个人看法对于AI 绘画版权归属没有任何实质性意义；2、整个AI 绘画的图景，类似美国的西部拓荒运动，此时此刻重要的是拓荒和建立居民点，相关的法律法规可以后续再讨论；3、在新疆域内的法律问题，正常情况下应该由一系列的司法诉讼和权利主张人之间的激烈碰撞最终产生，这不是谁说了对，谁说了算的问题。

今天，我很高兴地向大家报告，在AI 绘画版权领域内，已经有人做了尝试，探索AI 绘画版权归属的新可能。一位居住在纽约的AI 教育家和咨询顾问科瑞斯·卡什塔诺娃（Kris Kashtanova），委托她的律师向版权局提交了一份版权申请，要求确认她对一张自己使用AI 绘制的图片拥有版权：

她的版权申请基于以下几点理由：

1、她使用了笔和纸，绘制了底图，再在底图的基础上由AI 生成图片。

2、科瑞斯·卡什塔诺娃使用Prompt指定Stable Diffusion 1.5为她生成特定的内容：

a young cyborg woman (((roses))) flowers coming out of her head, photorealism, cinematic lighting, hyper realism, 8 k, hyper detailed.

一个年轻的半机械化女性，(((玫瑰)))花长出她的头部，视觉效果接近现实，具有电影般的照明效果，超写实，画面分辨率为8K，细节表现超乎寻常。

律师进一步展开理由，

（1）科瑞斯·卡什塔诺娃给到Stable Diffusion的指令并非是随机的，她想要得到的是一个半机械人（Cyborg）。

（2）而且，并非是普通的半机械人，科瑞斯·卡什塔诺娃明确地要求Stable diffusion生成一个年轻的、女性形象的半机械人（young cyborg woman）。

（3）科瑞斯·卡什塔诺娃明确地要求这一女性半机械人的形象上，要有“一朵玫瑰花从头上长出来”（roses flowers coming out of her head）。

（4）科瑞斯·卡什塔诺娃明确指定Stable Diffusion绘制一朵玫瑰花，而不是别的品种，为此，她专门输入了字符(((Rose)))，每一个（）符号会增强最终图像中的扩散效果1.1倍，这里的三重括号强调Rose，总体上让最终图像中玫瑰花的扩散效果达到1.331倍。

3、她利用选择CFG比例尺数字，对Stable Diffusion的制作内容进行控制。CFG比例尺的数值，决定了Stable Diffusion在绘制图像时和Prompt文字输入控制以及底图的吻合程度，以及能够有多大的自由度。在这个案例里，根据科瑞斯的指令，CFG比例尺被明确定义为数字7。

4、她使用ControlNet Depth模型，控制Stable Diffusion 所产生的最终结果中的特定视角。这种控制，类似摄影师调节照相机镜头以获得成片不同的景深。通过这种方式，科瑞斯·卡什塔诺娃控制Stable Diffusion 按照特定视角表现她想要的结果。

综上，律师认为科瑞斯·卡什塔诺娃应该对最终的AI 绘制作品拥有版权。目前，这封申请已经递交版权局，还不知道会有什么下文。但是通过上面关于法律文书的介绍，大家可以感受一下律师们和科瑞斯·卡什塔诺娃证明版权归属问题的思路。

完整的法律文书文本，请访问：

https://drive.google.com/drive/u/0/folders/1MOZe5wLRJF3hR6I-x77GXeuTG-QAUv37

在我看来，这封申请书也是一份科普。它向负责法律事务的相关人员展示了AI 绘画的流程和原理，试图证明AI 绘画使用者在绘制过程中的贡献，试图证明作品的独特性，试图证明作品依照创作者的意图而生成，因此体现了创作者的艺术表达。

当然我猜想大部分来我这里询问AI 绘画版权的人，对于这样的法律文书没有多大兴趣。因为从惯常情况来说，国人对于复杂的法律过程没有任何兴趣，只想知道简单的黑与白，是与否。但是在任何新疆域内的法律条文，都需要通过这样的过程产生。

在这一次的案例中，科瑞斯·卡什塔诺娃提交的申请是针对有手绘底图，有Stable Diffusion参数控制，有ControlNet Depth模型视角和姿态控制下的AI 绘画，要求主张版权。未来，类似的申请会一单接一单，也许下一个案例里就没有手绘，没有底图，律师试图证明独特的Prompt已经体现了创作的意图和意志，具备足够的独特性。下下一个案例里，也许律师们会在特定模型上取得突破，证明特定模型就是画笔的另外一种变体。

类似这样申请，以及未来可能的诉讼，最终将推动立法，为各方力量寻找到一个符合法理，同时各方都可以接受并且愿意执行的方案，这就是新法的诞生。

与此同时，我看见传统画师们还在愤愤然指责AI 绘画。比如我很喜欢的一位女画家倪传婧(victo ngai)，几天前在微博上颇为振奋地介绍一款芝加哥大学推出的的软件Glaze，说是Glaze可以给数字绘画师的作品加上看不见的“水印”，其实就是算法加噪，据说可以防止这样的作品被AI用于学习。

但是我去了解一下，倪传婧和画师们所热议的Glaze加噪，对一张画执行完加噪需要20分钟至1小时不等。而她们并不知道，网上有一个叫做ESRGAN Anime6b的小玩意儿，给这样一张图片去噪只需要2秒，而且还是免费的。

在GPT-4上线那天，有读者又来问我AI 绘画的版权怎么算？当时我对着电脑屏幕喃喃低语道：很快，这个问题会因为太过微小而不值得讨论了。二次世界大战时，当坦克集群在战场上纵深穿插，轰炸机越过前线直接攻击后方的时候，整个战争的图景都已经发生了根本性的变化，谁还会在意几个骑兵军团的废存？步兵方阵在交火之前双方的礼仪？当许多行当都要从地表上抹去，人们忙于学习新的技能找寻新的岗位时，AI 绘画版权？顾得上么？

标题：《芭蕾舞女演员》

创作者：和菜头的小肉手

图片AI算法提供：Midjourney V5

Prompt说明：为了达成这样的效果，我使用了关键词multiple exposure photography，意思是让Midjourney采用多重曝光的方式绘制图像。实践下来，它要比Long exposure photography 或者 Stroboscopic photography的效果更好。

槽边往事和菜头出品

【微信号】Bitsea

个人转载内容至朋友圈和群聊天，无需特别申请版权许可。

请你相信我，

我所说的每一句话，

都是错的

禅定时刻

《李有根：老外的平底锅不好用》

和菜头的小肉手

Midjourney V5

一定程度上来说，AI 绘画这几周的进展，已经转向更为清晰，更为细腻，更有表现力的摄影作品。在摄影这个领域内，有太多免费资源，有太多公开资源，大概也也就没那么多版权问题。而且相对而言，公众也更喜欢这种更为写实的作品。

继续阅读

阅读原文