“你已经是个成熟的AI，可以自己画画了”

星彡P丨文

这段时间，有个叫“DALL・E 2.0”的AI画画工具刷屏了我的推特主页，在外网非常火。

简单来说就是一种AI绘图程序，只要输入一些语言描述（最好是英文的），不管任何天马行空的句子都能变成真实图像。

（关键词：骑着马的宇航员）

这个最强的图像生成器来自马斯克参与创建的公司OpenAI。

Dota2玩家应该不会陌生，这些家伙们在三年前创造出了能和OG掰手腕的人工智能bot战队，一时间传为佳话。

这回他们又把目标放到了艺术领域，大致原理是——先拿网络上带描述的几亿张图像，训练CLIP模型，把图片的特征和对应的自然语言特征进行分析配对，学会语言和图像的相关性。基于扩散模型的概念，逆向推导生成结果图。（官网上的术语把我看晕了，因为我不是专业人员，这里就简单概括下）

而且这个

“DALL・E 2.0”

不只看文字画画那么简单，它还可以根据原图画风，在没有违和感的情况下，按要求往画面里添加额外的元素。

比如上面这张图，左上角是原图，在保持画风一致的情况下，分别往其他三张图里面加了只狗。对于如此逼真的图像造假手段，大家显然还没做好应对的准备，于是引起了轰动。

当然，也有不少人把“DALL・E 2.0”往搞笑的方向使用，试图了解AI如何理解都市传说里的虚构生物的，最后的出图效果也相当惊人。

（关键词：飞天意面神教，真实图片）

不过遗憾的是，“DALL・E 2.0”还没有开放API，不是人人都能使用的，需要向OpenAI申请内测资格。按他们的说法，在开放之前还要研究一下“安全措施”，防止被人用来生产色情、暴力或者政治相关的图像。

“你已经是个成熟的AI，可以自己画色图了”——这种想法直接被官方给毙掉了。

但没关系，不能画色图还有其他乐子。去年OpenAI已经开源了“DALL・E”，也就是一年前的版本，相当于是青春版（也有人叫它阴间版），网上现在就可以找到。尽管效果没有2.0的版本那么好，但好歹能简单体验下效果。

下面是DALL-E mini的地址：
https://huggingface.co/spaces/dalle-mini/dalle-mini

只需要输入文字，等待1~2分钟时间，就能得到一些啼笑皆非的风格图片，这里分享几个BB姬和网友用程序生成的结果：

（关键词：G胖与肯德基）

（

关键词：

来自LOL的亚索坐在轮椅里）

(

关键词：

蝙蝠侠骑着平衡车)

(关键词：P5与憨豆先生)

两个版本生成的图放在一起也很有意思。可以看到，DALL-E的画风还比较抽象，但仅仅过去一年时间，2.0版本就已经相当惊艳了。

↓

↓↓

左边是初版，右边是现在的2.0。

（关键词：一副以莫奈风格创作的画，主题是狐狸坐在太阳下的田野）

说实话，AI画画是个很有趣的东西。

人人都有表达欲，通过画画表达也是一种方式。LSP如我，也曾幻想过能到达自己“产粮”，让别人对着自己画的色图冲的境界。但绘画技巧要做到随心所欲展现思想的程度，那门槛可不是一般的高，很容易就把我这样的懒人阻拦在了门外。

我曾经试过学习画画，为此还花费“重金”在某宝上买了绘图板——工欲善其事，必先利其器嘛，这道理老祖宗教的。结果画画没学下去，倒是顺利地入了OSU的坑。（OSU是一个PC音游，玩法类似戳泡泡，对光标移动准确度需求很高，很多人选择用绘图板进行游戏）

（关键词：马克思在KFC LOGO里)

（关键词：飞天意面神的洞穴壁画）

有了AI绘画之后，好像一切都不一样了。或许未来会有那么一天，哪怕对绘画一窍不通的人，也可以创作出自己的作品。

我也试着了解过一些其他的主流AI作画工具，比如Midjournry、Disco Diffusion、谷歌的Imagen之类，网上有不少教程，需要注册各种云端账号，甚至是基础的编程知识。

如果你有幸搞到本地运行的版本，还有更多的麻烦接踵而至，本地运行所有这类AI创作工具都需要消耗惊人的GPU（显卡）资源，对电脑的性能要求极高。

（网上用

Disco Diffusion创作的AI绘画

）

就拿Disco Diffusion来说，假如你希望在本地部署，电脑起码要有10G以上的显存，而且是1080ti这个级别以上的Nvidia显卡，才可以以极慢的速度生成一副最大1024*1024 尺寸的作品。

显卡性能的提升能大大地缩短出图的时间。但如果是AMD显卡、或者好几年前的笔记本电脑的话，想都不用想，根本跑不起来。这么一想，高级的AI绘画所耗费的成本，说不定比报个班学画画还要高，普及之路还很长很长。

到最后，大多数网友可能也只是玩玩“阴间版”“青春版”的AI作图，体验一下效果而已。

-END-

往期推荐

继续阅读

阅读原文