卷友们好,我是rumor。
前两天刚聊过NLP预训练模型的变现,CV的同学就给我上了一课。
周末看到群里小伙伴发的消息,一位叫做 @Simon的白日梦 的博士同学,一直致力于AI与艺术的结合,并创作了AI+元宇宙主题的作品,在淘宝拍卖出了1001的高价,四张画作合计拍出了2304元人民币
看到这个新闻,我和小伙伴们的第一反应都是:这都可以???
本着我行我也上的精神,充满了商业嗅觉的我立刻去考古了simon的B站,没想到得来全不费工夫,他已经把技术方案晒出来了。核心就在于VQGAN_CLIP这个开源项目:
源码+colab:https://github.com/nerdyrodent/VQGAN-CLIP

demo试玩:https://huggingface.co/spaces/akhaliq/VQGAN_CLIP

VQGAN的主要作用是生成高清图片,CLIP则负责控制生成结果与输入文本相关。
在VQGAN_CLIP的demo试玩里,可以零门槛生成图片,只需要输入一段描述文本即可:
其中step size和max iteration主要控制图像的生成质量,取值越高图像质量越好。而且文本prompt还可以控制风格,用竖线|进行分割。
同时也可以给一张初始图片,更好地控制生成结果。
如果不满足于demo的参数范围,还可以使用colab进阶版,或者自己部署:
有了画作之后,第二步就是变现了。但我悲伤地发现,首先,要想上架到淘宝拍卖,需要有专门的送拍公司来对接。其次,即使卖到了这个价格,也是拍卖中介拿大头。具体拿多少我就不清楚了,从好几个渠道都没查到,盲猜可能跟mcn机构差不多,占比高的话有6成甚至7成。
看来天下还是没有免费的午餐啊。。。另外我又悲伤地发现,生成simon拍卖的那种高质量画作也不是件容易的事儿,需要找到自己的一套超参数和初始图像prompt。不过一旦找到自己的风格后就可以产出一系列作品,边际调参成本近乎0。
其实之前我也留意过一些AI+艺术的应用,比如有个国外妹子用CV生成一些很有科技感的视频,当作T台的背景,还有人用NLP辅助生成rap歌词等。这些方向虽然看起来「钱景」有限,但却很有意思,能帮助艺术创作者启发创意,甚至直接打破人类的脑洞。
AI真是一个又深又宽的坑,不仅能提升生产效率,还能做创造性的工作,不知道等我七老八十的时候,能不能拥有一个AI管家、一个AI厨师、再加十个AI小鲜肉

大家好我是rumor
一个热爱技术,有一点点幽默的妹子

欢迎关注我
带你学习带你肝
一起在人工智能时代旋转跳跃眨巴眼
「想当NLP调参艺术家」
继续阅读
阅读原文