昨晚有200位左右的小伙伴参加了未明学院王老师的情感分析公开课,群内反响非常热烈~
本次直播没有回放,可能有的小伙伴没有时间看直播,今天未明君特意请王老师帮大家做了公开课简略版文字回顾,并且附上了PPT截图,没有看到直播或者还有疑问的同学一定不要错过!
01
情感分析是什么
情感分析属于人工智能之下的一个子领域,确切的说,人工智能之下有很多领域,其中包括自然语言处理、图像识别、语言识别等,而自然语言处理又包括情感分析、机器翻译、文本生成等。
情感分析主要就是从文本中识别提取出特征,最主要的就是极性,也就是情感是属于正面的还是负面的,程度如何,当然还包括文本中的观点以及观点的持有者等等。
02
情感分析的原理
情感分析的实现原理可以分为两类:基于情感词典的和基于机器学习的。
基于情感词典的情感分析是根据已构建的情感词典,对待分析文本抽取情感词,计算情感倾向,该方法是最早期最好理解也是最好实现的,当然其准确度上相对偏低。下面的图片中的例子可以方便我们直观的理解基于情感词典的情感分析。
基于机器学习的情感分析将情感分析作为一个有监督的分类问题,对训练文本进行人工标注,然后进行有监督的机器学习,从而得出模型来进行预测。该方法更加复杂更加准确,使用也更加普遍。其关键过程如下图所示,而对于小白而言或者说对于大多数人而言,只要直接使用训练好的模型就可以了。
03
情感分析有什么用?
情感分析在市场营销,金融,政治学,通讯,医疗科学,甚至是历史等诸多领域都有着重要的应用。准确地了解客户对商品/服务的满意度,从而制定更好的营销策略;了解观众对节目的喜怒哀乐,进而制定好的剧情和上线时间;政府部门通过了解公民对热门事件的情感倾向,从而更及时有效地进行舆情监控;通过关注有心理问题人的twitter内容变化,了解其情绪变化,从而减少自杀或破坏性行为的可能性,此外还有通过文本内容,判断两个人之间的关系,对奥斯卡得奖者做预测,对股市行情做判断等等,这些都可以通过文本语义分析中的情感分析来完成。
如果想学习更多情感分析相关知识
可以了解一下未明学院数据分析技能课~
04
情感分析实例
本次公开课所使用的是snownlp包,对新手而言特别友好,是情感分析入门级的学习不二选择。我们可以通过两三行代码就能得出一句话的情感得分,判断这句话偏向正面还是负面,偏向的程度如何(得分越接近1越正面,越接近0越负面)。
值得注意的是本次公开课中所用的snownlp只适合于简体中文,不能对繁体字或英文做分析。这是因为初始模型是使用简体中文进行的训练,所以不能识别出繁体字。如果要对英文做情感分析可以了解下textblob包文件。
本次公开课的实例是对手机的评论做情感分析,我们可以通过下面的代码快速的识别出差评,掌握用户的痛点以及产品或服务的不足之处,从而针对性的做出改善。
评论从哪里获得?
学习爬虫技能自由获得你想要的数据,可见即可爬!
我们也可以筛选出用户的好评,从而提炼产品的特色,宣传产品的卖点
我们还可以对某款手机的整体用户满意度做评估,与同类商品进行比较,其结果如下图所示:
上图中的可视化图形是通过Pyecharts绘制的,未明学院的数据分析技能课将会详细教授如何熟练使用Pyecharts绘制高大上的图形效果。可以识别二维码咨询课程内容哟!
嗨~我是Cathy
长按识别二维码
●添加我为好友
最后我们需要说明的是,受限于课时,我们的分析还有继续优化的空间,比如模型可以通过训练提高精准度;评论如果更多,需要的时间更长,可以通过代码随机抽样等等,这部分内容的实现在完成我们的数据分析技能课后就可以掌握。
PS:转发本文至朋友圈
即可找小助手领取
课程源码数据
继续阅读
阅读原文