PRIMERS
引    子
大数据人工智能技术在日新月异的发展,各个行业领域的数据量都在迅猛增长。有研究发现,近年来,数字数据的数量每3年多就会翻一番。金融行业在发展中积攒了大量客户信息和数据信息,借助这些数据能更好地挖掘有价值的信息资源。
在说数据质量之前,我们先来看一个小故事。
降落伞的真实故事
在第二次世界大战中期,
在当时,美国空军降落伞的安全度不够完美,
经过厂商努力的改善,良品率已经达到了99.9%,
应该说这个良品率
即使当今社会许多企业也很难达到,
但美国空军却要求降落伞公司的良品率必须达到
100%
于是,降落伞制造商的负责人便与之商讨此事,
看能否降低这个标准?
厂商认为当前这个程度已接近完美了,
没有必要再改了,
美国空军一口回绝“品质没有折扣”
后来,军方改变了检验降落伞品质的方法;
是从厂商交付的降落伞中,
随机挑出一个,
让厂商负责人装备上身后亲自从飞行中的机身跳下。
这个方法实施后,不良率立刻变成零。
数据质量是什么
数据质量是指数据满足准确性、完整性、时效性、一致性、唯一性、关联性、适当性、有效性及可获取性的程度。具体含义如下:
(一)  准确性:数据是否能够准确、真实反映实际信息,以及数据格式是否符合数据标准的要求;
(二)  完整性:业务操作所需要的数据是否完备;
(三)  时效性:数据是否能够及时被获取,以及是否能够反应当前业务情况;
(四)  一致性:反映同一业务实体的数据及其属性是否具有一致的定义和含义;
(五)  唯一性:数据在数据集中不存在重复值;
(六)  关联性:数据是否具有明确的关联关系,数据关联关系是否被准确定义,数据是否符合数据间的关联关系;
(每个人的机票和飞机座位,都有明确的关联关系。
(七)  适当性:数据是否在可控、安全的范围内发布和使用

(八)  有效性:数据符合已定义的格式规范和业务规则;
(九)  可获取性:数据易于理解,且数据格式满足用户需要。
本文来源山西农信
点击文末阅读原文,获取更多干货好文

觉得本文有用,欢迎转发分享,谢谢
<END>
大家都在看:
继续阅读
阅读原文