现在很多小伙伴都玩抖音,抖音也会根据大家的喜好推荐不同类型的视频,短小精悍、随时可刷,抖音可以说真正成为了上班摸鱼的利器国民视频APP。
(塞班到底找到了没)
今天未明君带大家爬取一个和抖音相关的网站,上面有抖音各分类达人榜,来看看里面有没有你心仪的抖音up主!

爬取数据
爬取的目标网站:
https://www.daihuo.com/dy-rank/user?type=2&bangTime=2019-12&page=1
我们要按照以下类别,分别抓取不同类别下的UP主,来看看哪种类型的UP主更受欢迎。
所要爬取的信息如下图所示,UP主名称,抖音号,所卖商品数量,粉丝数,点赞数,视频总数,新增粉丝数,新增点赞数。
(备注:单位e为亿,单位w为万)
编写代码
首先我们要导入相关的库
利用xpath规则,获取下面各个视频类型的链接
有了这些链接,我们就可以分版块爬取视频主的信息了,依次爬取各个类别信息,并且使用xpath规则将对应的信息提取出来。
最后呢,把这些信息存储为dataframe,保存成为excel下载到本地。
学习爬虫技能自由获得你想要的数据
可见即可爬!
数据分析
来看下所爬取到的数据
(数据来源仅限于悟空带货网站,并非抖音所有数据)
排名第一是我们的带货王,李佳琦,虽然不常驻抖音,我们也可以看到他的粉丝量达到了3670万,远超其他人,带货一哥果然名不虚传啊。
对比各个视频类型的大V,看到粉丝数排名前几的分别为网红帅哥,明星,网红美女几大类,果真颜值即正义!其次搞笑,体育,宠物紧跟其后,大部分人应该和未明君一样,起初看抖音,是因为抖音视频很搞笑、很魔性。抖音也是造梗王的天下,评论远比视频有意思,只能感叹一声,评论区的大佬都是人才啊。
明星类别的视频把其他类别的远远的甩在了身后,回头看看数据,发现明星类有一个高产王——猫眼大明星,视频数居然多达4000多个,感受一下“狗仔队”的力量?其他各类别的视频相对来说比较平均。
最后再来看一眼各个类别的大V所卖的商品数量,有了流量当然会选择套现啦,大多数人除了接广告,最多的应该就是卖自己家的商品了。我们看到商品数最多的几个就是时尚,穿搭,种草,家居,从这个名称就能看出来,这些大V拍抖音的初衷应该就是为了出售商品,而网红明星类所售商品数就比较少,推测他们的收入来源应该主要靠直播以及接广告。
今天的分享到这就结束了,如果有人还想进一步挖掘更多信息,可以利用Python网络爬虫技术去进一步采集更多的数据。有了数据之后,同样也能使用Python去进行一些数据分析,数据挖掘,得到一些更加有价值的东西。掌握了爬虫+数据分析,可以更快更精准的帮你把握市场的动向,以及帮助你进行更为精准的决策。
- END -
往期精选
社会复工1个月:那些年前辞职、降薪待业、准备跳槽的人怎么样了?
课程精选
有你心仪的UP主吗
继续阅读
阅读原文