大家好,我是 Jack。
今天继续聊几个有趣的 AI 项目,最后再闲聊几句封号的乌龙事件~
先说正事。

1ml-stable-diffusion

之前出过的一期视频,评论区问题最多的无外乎两个:A 卡可以玩吗?Mac 可以玩吗?
A 卡只要根据项目的 README 安装 rocm 就行。
至于 Mac,这个项目确实运行不了。
不过,现在有 ml-stable-diffusion 了,也算是“曲线救国”了。
在 Mac、iPad 上,都能玩。
不过速度运行慢一些,一张图半分钟左右。
安装环境也简单,直接 pip 安装即可。
conda create -n coreml_stable_diffusion python=3.8 -y

conda activate coreml_stable_diffusion

cd
 /path/to/cloned/ml-stable-diffusion/repository

pip install -e .

想在 Mac、iPad 上玩 AI 画图算法的小伙伴,可以试一试。
项目地址:
https://github.com/apple/ml-stable-diffusion

2ddnm

图像修复的算法更新,一直没有断过。
最近又开源了一个新的算法 DDNM。
可以做超分辨率重建,轻松干掉马赛克。
可以做 inpainting 图像修复,修复遮挡区域。
可以做黑白照片上色,为百年前的老照片上色。
可以做图像修复,去掉褶皱。
集众多修复功能于一身的 AI 图像修复算法 DDNM,感兴趣的小伙伴可以看下。
项目地址:
https://github.com/wyhuai/ddnm

3FiftyOne

想要训练好 AI 模型,最重要的是什么?
没错,高质量的数据集。
FiftyOne 是用于构建高质量数据集和计算机视觉模型的开源工具,由 Python 实现。
数据导入,操作数据集,都很方便。
可以快速导入各种统用格式的数据集,并浏览了解数据分布,以及对标注问题进行修改。
想要构建高质量数据集的小伙伴,可以试一试这个~
项目地址:
https://github.com/voxel51/fiftyone

4Umi-OCR

一直有小伙伴问我,有没有什么好用的 OCR 识别软件啊。
OCR 识别很成熟了,更新并不多,所以之前我也就没怎么推荐过。
OCR 识别确实很常用,截个图识别个文字的需求,还是挺多的。
今天就介绍一款免费开源的中文 OCR 识别软件吧,Umi-OCR:
底层算法是基于 PaddleOCR 实现的,上层做了应用封装。
可批量导入处理图片,结果保存到本地 txt / md / json 多种格式文件。也可以即时截屏识别。
有 OCR 识别需求的小伙伴,或者学习上层应用封装的小伙伴,不要错过~
项目地址:
https://github.com/hiroi-sora/Umi-OCR

5絮叨

最后再聊聊,抖音喜提永久封号大礼包的乌龙事件。
我发视频、文章,向来谨慎,AI 预测世界杯的开源项目分享,特意问过 B 站平台的运营,是否可以发。
得到没问题的回复,我才会大胆地去做。
因为之前吃过类似的亏,辛苦做了几周的视频,结果因为种种原因被限流。
我目前是主更新 B 站,同步更新其他平台,同步到抖音后,视频火了,100万+ 播放量,然后第三天,喜提永久封号。
客户端申诉失败、网页申诉失败。
最后打客服热线电话才知道,因为我没有进行认证,没有认证的账户,不能发布 AI 预测世界杯的视频。
然后我又联系客服解释,我今日头条、西瓜视频都有认证。
只有抖音没有认证,然后就中招了。
我又联系了,头条的官方运营,但因为不在同一个业务线,也是爱莫能助。
不过好在,最后的最后,经过我的超多次沟通,跟各种不同的客服沟通,终于给我解决了。
帐号恢复正常,封印解除。
每个平台有每个平台的规则。
总之,写文章、做视频,除了做好内容外,还是有不少糟心事的~
好了,今天就聊这么多吧,我是 Jack,我们下期见~
·················END·················

推荐阅读

继续阅读
阅读原文