这里是未明学院的技能分享贴~
我们会定期分享:     
    好用到“难以自拔”的Python工具   
    好玩到“停不下来”的Python体验   
    好酷到“不忍错过”的Python技巧
最近新冠病毒疫情肺炎形式依然严峻
有些人还想趁乱刷一下存在感
于是近期出现了很多跟疫情有关的谣言
还有这种↓
未明君看到这些谣言的时候
只感觉自己的智商被造谣者按在地上摩擦......
既然能被称之为谣言,说明还是有不少人当真
未明君劝大家遇到这种谣言,要多鉴别一下
谨记"不传谣,不信谣,戴口罩"的九字真言!(我编的)
为了帮大家提高一下抗谣言能力
今天的技能帖就给大家玩个实用的!
爬取新冠病毒肺炎实时辟谣网站
收录的谣言,并进行相关分析
爬取内容
目标网站:https://vp.fact.qq.com/home(点击文末阅读原文可直达网站),搜集疫情期间所传的谣言进行分析。
代码如下
首先导入所需要用到的库
访问目标网站,并且解析数据
存储数据到excel
效果展示
结果展示
学习爬虫技能自由获得你想要的数据
可见即可爬!
数据分析
从1月21日起,谣言的数量就随着“人传人”的新闻开始增长,并在124日突然爆发。124日和125日是谣言的高峰期,可以查看这两天的数据。
各种各样的谣言纷至沓来,在123日武汉封城后,传出湖北以外其他城市跟进封城的谣言,钟南山被传染病毒的谣言也出现于此时。更有甚者造谣称 “浙BL0535”的车牌号正在前往某地,这个车牌号车主已确诊新冠肺炎、主要目标为在全国流窜,最远可至边陲西藏。但是经公安机关核查,该车牌号下无车辆注册信息。
经过统计,我们可以知道82.81%造谣新闻都被实锤,仅有7.22%的新闻确有其事,而还有9.96%是暂时无法确定的新闻。由此可见,平时我们要理性的看待一些谣言,不能盲目的去相信。只有相信科学,理性看待,才是我们在疫情期间应该做的。
关于口罩的谣言数量一直居高不下,多数谣言是关于口罩使用的N种方式,占据了民间抗疫谣言的大半。在图片中,你还可以看到 “大蒜”“生姜”“白酒”等词语,以及“气溶胶”“粪口传播”等一些关于病毒传染的信息。自武汉封城之后,各种封城谣言,隔离谣言以及高速公路谣言也冒了出来。
还是那句话,不传谣,不信谣,好好在家呆着,非必要不出门,就是不给国家添乱,也是为自己的健康着想。希望奋战在抗疫一线的勇士们都能平安归来,也希望暖春尽快到来~
- END -
学习更多数据分析相关知识
点击下图了解
未明学院数据分析技能课!
没有被谣言骗到的点个赞!
继续阅读
阅读原文