大家好,我是 Jack。
今天继续聊聊 AI 开源项目,以及互联网上发生的那些事儿。

一、开源项目

1、StreamDiffusion

基于扩散模型的图像生成技术,虽然在近年来取得了显著的进展,但仍面临着一些挑战,比如:
1、计算成本高:扩散模型通常需要大量的计算资源来生成高质量的图像。
2、生成速度慢:基于扩散的方法在生成高分辨率图像时往往需要更长的时间。
所以,想要保持高质量图像输出的同时实现快速响应,一直都是个难题。
目前最常见的做法就是:大力出奇迹
最近,有个基于扩散模型的实时交互流水线方案火了。
它就是 StreamDiffusion,实时性效果非常不错:
在 GPU 为 RTX 4090、CPU 为 Core i9-13900K 的单开机器上,SD-turbo 能跑 100 fps。
使用这个框架还能进行实时绘画:
在线修改 prompt 也能实时渲染:
StreamDiffusion 目前已经开源,对于实时交互图像生成技术感兴趣的小伙伴,可以看一看。
项目地址:
https://github.com/cumulo-autumn/StreamDiffusion

2、ml-ferret

Apple 公司开源了一个端到端的多模态大语言模型,能够理解图像中任何形状或粒度的空间引用,并准确地定位开放词汇描述。
在交互的 webUI 里画一个 1 和 2,问着两个物体是什么。
多模态大语言模型能够准确回答。
为了在 LLM 范式中统一引用和定位,Ferret 采用了一种新颖而强大的混合区域表示方法,将离散坐标和连续特征结合起来共同表示图像中的一个区域。为了提取多样区域的连续特征,Ferret 提出了一个空间感知的视觉采样器,擅长处理不同形状间的不同稀疏程度。因此,Ferret 能够接受多种区域输入,如点、边界框和自由形状。
ml-ferret 目前已经开源,对于多模态大语言模型感兴趣的小伙伴,记得查收。
项目地址:
https://github.com/apple/ml-ferret

二、互联网那些事

聊完 AI 项目,进入“八卦”环节。
年底了,互联网热议的话题,又要来到了一年一度的年终奖环节。
鹅厂员工先人一步晒出了年终奖,111354元。
在互联网公司,年终奖春节前发放的不多,简单盘点下各大厂的年终奖发放节奏。
腾讯:春节前发放,一般可以拿到 3-6 个月薪资的年终奖。个别业绩突出的部门可以拿到 10 个以上。
阿里:春节后发放,一般在 4-5 月,因为阿里每年 3 月 30 日财年结算,绩效评定。这些工作都做完,才会定年终奖。30% 的员工能拿到 6-8 个月薪资的年终奖,60% 的员工能拿到 3-5 个月薪资的年终奖,剩下的 10% 可能就没有年终奖了。
字节跳动:3-4 月发放。一般能够拿到 3-6 个月左右,大多数人在 3-4 个月左右。如果年中绩效超出预期,则可以多拿 2 个月工资。
百度:3 月份发放,21 年之前一般是春节前发年终奖,但随着降本增效的力度的加大,21 年 11 月宣布将年终奖发布时间推迟到次年 3 月 31 日。百度的年终奖是和绩效挂钩的,E、M+、M、M-、L,五个等级,员工绩效评定为 M -或 L 的不享有年终奖。一般来说,年终奖能拿 2 个月以上。
华为:5 月发放,一般能拿到 2-4 个月年终奖,也是跟绩效有关。
拼多多:4 月发放完。年前年后,会各发一部分,加班费、绩效奖金、年终奖加一起,比一般大厂要多不少。
京东:年终奖春节前发放,3-4 个月年终奖。
小米:春节前发放年终,年终奖一般是 1-3 个月的工资。
大厂业务线众多,不同业务和部门会有些差异,仅供参考啦。
好了,今天就聊这么多吧。
我是 Jack,我们下期见!
·················END·················

推荐阅读

继续阅读
阅读原文