点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
詹士 发自 凹非寺

转载自:量子位(QbitAI)
AI绘画,你没事吧?
狗主人直接变身狗爸爸,被顶上APP首页:
纯欲风女孩变成了纯欲风猴子……
下方网友评价「当真是二次猿模型」:
甚至,还有结婚照男主角变成墙上大头贴,配着粉色花瓣,画风十分阴间……
这些例子来自各平台用户们的分享,这两天,又掀起一波「AI绘画离谱作品」的讨论。
抖音热榜上,该话题流量超660万,阿根廷足球队也甘拜下风。
连无穷小亮也在网上吐槽「AI智障绘画」,引来大批围观:
离谱的AI绘画背后,是时下AIGC门槛一再降低,近期迎来一阵集中爆发。
抖音、腾讯、美图等厂牌纷纷推出自家小程序,中文界面,在线可玩,点点选选即可生成。
大批量参与下,五光十色姹紫嫣红的离谱作品,它就来了。

没有最离谱,只有更离谱

前面几个案例仅是冰山一角,各种离大谱AI绘画已成为互联网段子源泉。
这其中,最离谱的莫过「大变活人」型魔改,直接把当事人给整没了
有少女化身抽象风建筑穹顶:
有情侣合体,变成一只五彩斑斓的老虎:
还有帽衫小哥幻化小区木质走廊,也不知要不要算入公摊:
伤害性更强的是,AI能错到人畜互换的地步。
「我与女友」,在AI眼里是「我与猎狗」:
萌妹与小狗,变成了小狗与萌妹…….
除却「魔改活人」,AI还不管三七二十一,将所有图片都二次元化
比如,爱情变兄弟情,200斤哥哥招呼160斤弟弟品品自己的肚腩:
比如,将万物娘化,白T小哥也被变身二次元小姐姐,多出来一条腿不知如何安放…….
身材性感化也是倾向之一,明明是少女与金毛,变成——秀霸腿的肌肉壮汉。
由于画风实在离谱,已有网友开搞「绝对猜不到原图」活动。
AI认为你在巴黎郊外凡尔赛:
现实中,不过是站在雍和宫门外:
AI以为是怪叔叔在偷海报?
现实里,明明是酷酷女孩随手一个Pose的街拍照:
本以为是二次元森林公主:
其实是阿姨手里的婴儿。(人家真的还是宝宝啊,这样好么???
种种离谱图画或荒诞、或魔幻,对当事人,无疑是一场生活意外。
初次上手AI的萌新们满怀期待,本以为搭上了前沿技术快船,只是没想到技术直接越过人类常识,给刚见面的网友们一通电子毒打。

AI绘画是怎么变离谱的?

为什么AI绘画会产生如此离谱的案例?这要从AI生成步骤展开一二。
图片生成模型一般由两部分组成,一部分用于文本到图像理解,将文本与图像做关联,另一部分为图像生成。
以近年最火的Stable Diffusion为例,该模型就包括CLIP文本-图像的多模态部分、生成图像的Diffusion部分。
 图源:Paul Mooney
AI生成图片离谱,一方面,问题出在文本-图像部分
即:训练过程中,模型内将一些本来无关的特征做了不当地、单一化地关联。
有网友反映意间的AI画red bodysuit,AI只会一个劲画EVA中的明日香,就可能是将「red bodysuit」关键词与明日香进行了直接关联。
另一种可能性是训练后的模型也可能忽略一些关键特征,导致对人像识别有误。很多人像最终变成动物甚至建筑物,可能与此有关。
但上面解释还不是全部,问题也可能与生成部分有关。
由于动漫风格绘图模型的训练集本身有倾向性,也可能导致生成过程中,最终结果带着「男男向腐文化」、「身材性感化肌肉化」、「人像萌化娘化物化」、「物体拟人化」等等特征。
上述问题一直存在。
前段时间大火的NovelAI,就因生成的二次元妹子常有三条腿而遭吐槽,甚至有网友靠此种细节来分辨是否AI生成的作品。
与之类似,动漫风AI长时间都处理不好「吃面条」问题,生成图中,筷子、头发、面条、手指常被混淆:

这还不算最离谱的 图源:@ShiShizUta
此类问题,即便头部AI模型也无法完全解决。
就在今年10月,科技博主Andy Baio就在社交媒体上po出一系列Stable Diffusion生成的奇葩图片。
这当中,有手指乱套的:
动物特征不符合常理的:
更多图片,这里就不放了,着实过于鬼畜,甚至有点吓人
不过技术从业者一直在着手解决种种离谱情况。
最近新发布的一个动漫图片生成AI,Niji·journey,主打宣传点之一,就是「能让二次元妹子正常吃面」

One More Thing

最后,介绍一下最近带火AI绘画的各家工具
前文案例大部分来自抖音AI绘画特效以及一个名为意间AI绘画的微信小程序,这俩也是此番引发海量关注的爆破手。
意间AI绘画通过微信小程序即可进入,免费注册可用。
使用方法上,支持上传图片,输入关键字,配合引导力度及几个简单设置即可生成作品。
据其官方宣称,上线刚2个月,用户增长达100万。但如上面所见,对其吐槽声音也不少,也有网友在线分享关键词技巧。
相比前者,抖音的工具更为简单
通过抖音APP搜索「AI绘画」可进入特效,再选中照片,不必设置提示词等参数,直接就能自动生成动漫风、油画风等作品。
当然,最终结果也更不可控,冷不丁就是一个意外:

 来源:小柔SeeU
除前面两个工具,美图秀秀和QQ也在上周末前后脚推出旗下AI绘画工具。
美图秀秀通过首页菜单进入AI绘画,同样无需关键词,导入照片即可生成。
至于生成效果,所得图片同本人面部特征关联不算高,相比其他动漫风格滤镜差异不大
 图源:美图秀秀 官方微博
相比前者,QQ的AI绘画进入更复杂
需要先进入其社交产品「小世界」,再在创作素材库中,通过「异次元的我」栏目进入。
同抖音、美图一样,QQ所提供的AI也无需输入关键词和任何参数,上传照片即可生成一段「变身」短视频。其最终效果也跟美图差不多。
总的来说,此番几个AI工具中,意间的AI绘画可玩性更高,产生的离谱结果也更五花八门,其他几家大厂平台,抖音更为出圈,生成结果同样更多样。
可以预见的是,伴随AIGC大火,AI绘图飞入寻常百姓家,当中离谱段子笑料涌现还会更多。
最后问问:
你认为AI生成离谱图片这件事,有哪些办法能避免?
点击进入—>CV微信技术交流群
CVPR/ECCV 2022论文和代码下载
后台回复:CVPR2022,即可下载CVPR 2022论文和代码开源的论文合集
后台回复:ECCV2022,即可下载ECCV 2022论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF
目标检测和Transformer交流群成立
扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer222,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!
扫码进群
▲点击上方卡片,关注CVer公众号
整理不易,请点赞和在看
继续阅读
阅读原文