大家好,我是 Jack。
今天继续聊聊科技圈发生的那些事。

一、MoneyPrinter

相信小伙伴们在看到这个项目名字的时候也和我一样疑惑。
MoneyPrinter,印钞机?
事实上,MoneyPrinter 是一个视频生成的项目。只需要提供一个视频主题,就可以在本地自动生成一个 Youtube 短片。甚至它可以自动帮你把这个内容上传到 Youtube。
这样一个帮你打工做视频的机器人就有了,堪称视频赛道的 MoneyPrinter。
项目已经开源,斩获了 8k+ star。
项目地址:
https://github.com/FujiwaraChoki/MoneyPrinter
MoneyPrinter 的原理很简单:
  • 首先提供一个主题,这个主题发送给大语言模型 LLM,由大模型生成一个视频脚本;
  • 从脚本中提取关键词,在 Pexels 上下载对应的图片素材;
  • 通过开源的 TTS(Text to speech)将脚本转换成音频,可以用 TikTok 或 Edge 免费的 TTS,也可以自己搭建,比如用我之前发过的 GPT-VITS 等算法;
视频的脚本、画面、声音都有了,再简单配上字幕和BGM,一期视频就做好了。整体流程大概是这样:
可以使用 Python 3.11 构建开发环境,感兴趣的小伙伴可以试一试。
MoneyPrinter 不像 Sora 是通过生成方法做画面,而是通过类似于多模态检索的方法,根据关键词从图库里匹配应景的画面。
Sora 还没有开放,倒不如提前感受下 MoneyPrinter 的魅力。

二、OOTDiffusion

OOTD,一种网络流行语,最初出现于 ins 上,是英文“Outfit of the Day”的缩写,意思为今天的穿搭。
相信在国内外各大社交平台或是短视频软件上,大家都经常看到穿搭博主或是生活博主分享自己的 OOTD。
那你有没有想过:
我不用买这些穿搭博主的衣服,也想看看我的上身效果,能做到吗?
OOTDiffusion 就是这样一个算法,一款开源的服装试穿工具。
想象一下,拍一张自己的照片,然后就可以在网上试穿各式各样的衣服了,是不是还挺有趣的?
OOTDiffusion 底层的技术还是基于现在图像生成领域最流行的扩散模型,结合 CLIP 的多模态能力,让虚拟试装成为可能。
这种方法,可以保证即使是不同的性别、体型,OOTDiffusion 都可以将试穿的衣物非常自然地贴合到模特身上。
除了自己试装,使用虚拟人带货,是不是也是个不错的选择?
在线体验地址:
https://huggingface.co/spaces/levihsu/OOTDiffusion
项目地址:
https://github.com/levihsu/ootdiffusion

三、马斯克星舰成了?

马斯克的星舰,又双叒发射了。
这是星舰第三次发射后,马斯克在自己的社交平台上的口嗨。
马斯克激动地表示:“星舰要开启大航星时代了”。
这次历史性的试飞,星舰完成了:进入既定轨道、荷载舱门开关测试、推进剂内部转移测试等;
不过这次,星舰最终还是失联了,虽然没有完全成功,但仍然挑战了极限、创造了历史。
相比上两次,这次无疑算是一次“成功”的试飞。

四、TikTok 剥离法案

不过比较讽刺的是,相对于马斯克这边的热火朝天,字节跳动却迎来了当头一棒。
3 月 11 日,美国国会众议院通过了要求字节跳动剥离对 TikTok 控制权的法案。
简单来说就是,要求中国科技公司字节跳动在 165 天之内剥离旗下短视频应用程序 TikTok,否则TikTok 将在各大应用商店被禁止上架。
这就是抢啊,抢夺 TikTok 的控制权。
字节的选择有两个:出售 TikTok 给美国(服软)、退出美国市场(硬刚)。
中国好不容易产生一个在世界上拥有广泛影响力的社交媒体,就这样遭遇到了“美国铁腕”。

五、华为 OD 要求

这两天刷到了一个陈年老帖,一位华为 OD 主管发送了主动招聘邀请,然后双方都破防了。
内容是这样的:
翻译一下:
  • “你知道我是哪里毕业的么”,意思是你一个外包岗位还想招我清华的人?
  • “你本科也就211的而已呀”,意思是你本科 211 嚣张啥,单看本科都不满足我们的要求。
这个邀请,大概率是群发,没想到还引来了双方的认真回怼。
一个萝卜一个坑,找到最适合自己的那个坑,互相看不对眼的,那就不强求了。
好了,今天的内容就是这么多,提前祝大家周末愉快!
·················END·················
继续阅读
阅读原文