星彡P丨文
这段时间,有个叫“DALL・E 2.0”的AI画画工具刷屏了我的推特主页,在外网非常火。
简单来说就是一种AI绘图程序,只要输入一些语言描述(最好是英文的),不管任何天马行空的句子都能变成真实图像。
(关键词:骑着马的宇航员)
这个最强的图像生成器来自马斯克参与创建的公司OpenAI。
Dota2玩家应该不会陌生,这些家伙们在三年前创造出了能和OG掰手腕的人工智能bot战队,一时间传为佳话。
这回他们又把目标放到了艺术领域,大致原理是——先拿网络上带描述的几亿张图像,训练CLIP模型,把图片的特征和对应的自然语言特征进行分析配对,学会语言和图像的相关性。基于扩散模型的概念,逆向推导生成结果图。(官网上的术语把我看晕了,因为我不是专业人员,这里就简单概括下)
而且这个
“DALL・E 2.0”
不只看文字画画那么简单,它还可以根据原图画风,在没有违和感的情况下,按要求往画面里添加额外的元素。

比如上面这张图,左上角是原图,在保持画风一致的情况下,分别往其他三张图里面加了只狗。对于如此逼真的图像造假手段,大家显然还没做好应对的准备,于是引起了轰动。
当然,也有不少人把“DALL・E 2.0”往搞笑的方向使用,试图了解AI如何理解都市传说里的虚构生物的,最后的出图效果也相当惊人。
(关键词:飞天意面神教,真实图片)
不过遗憾的是,“DALL・E 2.0”还没有开放API,不是人人都能使用的,需要向OpenAI申请内测资格。按他们的说法,在开放之前还要研究一下“安全措施”,防止被人用来生产色情、暴力或者政治相关的图像。
“你已经是个成熟的AI,可以自己画色图了”——这种想法直接被官方给毙掉了。
但没关系,不能画色图还有其他乐子。去年OpenAI已经开源了“DALL・E”,也就是一年前的版本,相当于是青春版(也有人叫它阴间版),网上现在就可以找到。尽管效果没有2.0的版本那么好,但好歹能简单体验下效果。
下面是DALL-E mini的地址:
https://huggingface.co/spaces/dalle-mini/dalle-mini
只需要输入文字,等待1~2分钟时间,就能得到一些啼笑皆非的风格图片,这里分享几个BB姬和网友用程序生成的结果:

关键词:G胖与肯德基)
关键词:
来自LOL的亚索坐在轮椅里)

(
关键词:
蝙蝠侠骑着平衡车)

(关键词:P5与憨豆先生)
两个版本生成的图放在一起也很有意思。可以看到,DALL-E的画风还比较抽象,但仅仅过去一年时间,2.0版本就已经相当惊艳了。
左边是初版,右边是现在的2.0。

关键词:一副以莫奈风格创作的画,主题是狐狸坐在太阳下的田野
说实话,AI画画是个很有趣的东西。
人人都有表达欲,通过画画表达也是一种方式。LSP如我,也曾幻想过能到达自己“产粮”,让别人对着自己画的色图冲的境界。但绘画技巧要做到随心所欲展现思想的程度,那门槛可不是一般的高,很容易就把我这样的懒人阻拦在了门外。
我曾经试过学习画画,为此还花费“重金”在某宝上买了绘图板——工欲善其事,必先利其器嘛,这道理老祖宗教的。结果画画没学下去,倒是顺利地入了OSU的坑。(OSU是一个PC音游,玩法类似戳泡泡,对光标移动准确度需求很高,很多人选择用绘图板进行游戏)
关键词:马克思在KFC LOGO里)
关键词:飞天意面神的洞穴壁画)
有了AI绘画之后,好像一切都不一样了。或许未来会有那么一天,哪怕对绘画一窍不通的人,也可以创作出自己的作品。
我也试着了解过一些其他的主流AI作画工具,比如Midjournry、Disco Diffusion、谷歌的Imagen之类,网上有不少教程,需要注册各种云端账号,甚至是基础的编程知识。
如果你有幸搞到本地运行的版本,还有更多的麻烦接踵而至,本地运行所有这类AI创作工具都需要消耗惊人的GPU(显卡)资源,对电脑的性能要求极高。
(网上用
Disco Diffusion创作的AI绘画

就拿Disco Diffusion来说,假如你希望在本地部署,电脑起码要有10G以上的显存,而且是1080ti这个级别以上的Nvidia显卡,才可以以极慢的速度生成一副最大1024*1024 尺寸的作品。
显卡性能的提升能大大地缩短出图的时间。但如果是AMD显卡、或者好几年前的笔记本电脑的话,想都不用想,根本跑不起来。这么一想,高级的AI绘画所耗费的成本,说不定比报个班学画画还要高,普及之路还很长很长。
到最后,大多数网友可能也只是玩玩“阴间版”“青春版”的AI作图,体验一下效果而已。
-END-
往期推荐
继续阅读
阅读原文