大数据浪潮下,数据分析能力无论是企业管理人员还是一线的从业人员都应该具备的。它可以帮助你快速的定位问题,理清思路。找出原因,提供方法,能让你在竞争激烈的市场脱颖而出。
掌握数据分析的三大核心思维:1.结构化思维。2.公式化思维。3.业务化思维
1
结构化思维
结构化思维指在做数据分析之前要有一个清晰明确的逻辑,聚焦问题所在,有方向性和目的性。结构化思维类似于麦肯锡的金字塔思维。核心点在于:层层递进,拆减分析。
①核心论点(可以是假设,问题,预测,原因)指你要分析的问题。
②结构拆解(将核心露点层层拆解成分论点上下之间呈因果或者依赖的关系)
③MECE(分析的论点相互独立,尽可能的详细,论点要具有唯一性避免重复)
④验证(所有的论点最终都要通过数据去验证,所有的论点都要具有:可量化,可验证的特点)
结构化思维需要找出核心的论点(分析问题的核心点),根据问题结合业务场景充分考虑各种影响核心论点的可能性。再逐一拆解二级论点最终形成不可分割论点(客观事实存在的)。
2
公式化思维
公式化思维核心点:一切论点皆可量化。
通过 “+,-,*,/”四则运算。对数据进行计算,提供相应的结果支撑数据的论点。
之前通过结构化思维得出的论点是没有数据支撑的,只能算是原因并不能最终形成结论。所以需要通过公式化思维提供对应的数据结果做论点的支撑,将文字论点逐渐替代成为数据论点。这样的结论才会更有说服力。

3
业务化思维
逻辑化思维+公式化思维可以解决大部分的数据分析问题。但是不能保证最终的数据分析结论是100%正确的,也就是说只能从宏观角度分析的客观结果。这里还缺少业务场景!很多技术人员单纯为了分析而分析。这样最终的分析结果是不能够使用的,必须要结合业务场景实时分析。而且数据分析的结果要具备两个要素:①可被监控 ②可跟进
落实业务思维三大条件:
1.多与业务一线人员沟通
2.多做角色互换
3.参与业务工作,训练业务思维
◆◆9种常用的数据分析方法◆◆
1. 分类
分类分析的目标是:给一批人(或者物)分成几个类别,或者预测他们属于每个类别的概率大小。
分类分析(根据历史信息)会产出一个模型,来预测一个新的人(或物)会属于哪个类别,或者属于某个类别的概率。结果会有两种形式:
形式1:京东的所有用户中分为两类,要么会买,要么不会买。
形式2:每个用户有一个“会买”,或者“不会买”的概率(显然这两个是等效的)。“会买”的概率越大,我们认为这个用户越有可能下单。
如果为形式2画一道线, 比如0.5,大于0.5是买,小于0.5是不买,形式2就转变成形式1了。
2.回归
回归任务的目标是:给每个人(或物)根据一些属性变量来产出一个数字(来衡量他的好坏)。
注意回归和分类的区别在:分类产出的结果是固定的几个选项之一,而回归的结果是连续的数字,可能的取值是无限多的。
3.聚类
聚类任务的目标是:给定一批人(或物),在不指定目标的前提下,看看哪些人(或物)之间更接近。
注意聚类和上面的分类和回归的本质区别:分类和回归都会有一个给定的目标(是否下单,贷款是否违约,房屋价格等等),聚类是没有给定目标的。
4.相似匹配
相似匹配任务的目标是:根据已知数据,判断哪些人(或物)跟特定的一个(一批)人(或物)更相似。
5. 频繁集发现
频繁集发现的目标是:找出经常共同出现的人(或物)。这就是大名鼎鼎的“啤酒和尿布”的例子了。这个例子太容易扩展,就不再举栗子啦。
6.统计(属性、行为、状态)描述
统计描述任务的目标是最好理解的:具有哪些属性的人(或物)在什么状态下做什么什么事情。
7.连接预测
连接预测的目标是:预测本应该有联系(暂时还没有)的人(或物)。
8.数据压缩
数据压缩的目的是:减少数据集规模,增加信息密度。
大数据,也不是数据越多越好,数据多带来的信息多,但是噪声也会变多
9.因果分析
顾名思义,因果分析的目标是:找出事物间相互影响的关系。最常见的手段就是A/B test。
数据分析是非常强大的,不过当然还是要在具体的情景下,严格的选择假设,采用科学的分析方法才能产出有价值的结果。
- END -
未明精选
继续阅读
阅读原文