大数据对统计学带来的机遇
来源:互联网  日期:2015-10-13
  • 分享到QQ空间

统计学分析是以数据为基础作分析决策的,对于我国数据量的存储的历史来说,只有很短的一段时间,而且数据存在很多的缺失或是错误的。所以在以往给我们统计分析者做数据分析是很头疼的事。


如今,很多人都意识到大数据时代的来临,这无疑给我们提供了大量的分析数据,这对我们来说是一个全新的机会,但是我们如何利用好这么丰富的数据资源,或者说我们怎样合理使用这些数据成了我们现在所关注的焦点。




关于如何运用大数据,我们想做好以下几个方面的内容:


首先,我们要对研究的问题进行深入的探查,明确我们要做的分析的目的是什么,是否真正需要大量的数据来进行研究,例如,一个典型的事例就是我们把全中国人民的收入家和在一起在比上人口总数,得出的数字就是人均收入,试想这样做出的结果分析符合我国人均的收入水平吗,很显然是不正确的,虽然我们用大数据样本做分析,但是我们得到的实验的结果和我们预期的结果是大相径庭的,所以,不是大样本得到的大数据对于我们研究越好。




再者,是对数据质量的把关。即是数据质量如何得到保障,曾听说这样一件事。某企业的总经理每个月都会收到有交易往来的IT供应商的宣传(PR)杂志,但收件人的头衔不是“总经理”,而是他曾经兼任公司CIO时的头衔“常务董事”。虽然将头衔搞错,但还是都能收到,因此并没有太在意。但当这家IT供应商的总经理到公司进行礼节性拜访时,就提出了希望改一下头衔的想法。


而这家IT供应商的新的卖点是大数据,公司的总经理当场表示回去马上会进行修改。起初以为这点事情对于运营大数据业务的IT供应商而言不过是举手之劳,一定会进行纠正。但是,等到下一个月他收到的的PR杂志时,发现收件人的头衔仍然是“常务董事”。这位总经理通过两本PR杂志感到仿佛看到了大数据的现状,因此他非常失望地说:“归根到底IT供应商并没有维护顾客数据库”。




上述例子虽然是顾客数据,而不仅仅是顾客数据,说到大数据必然还需要处理很多各种各样的企业外部的数据。但是,这些数据是否是最新数据,其数据的精确度又如何等数据的“质量”就会非常重要。分析出处不明的数据将毫无意义。如果顾客数据不能随时进行维护,也就不会产生任何价值。不应当将当初以为是宝山的大数据,变成一座堆满垃圾的山。


所以,我们在用大数据做分析的时候,不仅要清楚认识要处理的问题的属性,选择合适的样本取得数据进行研究,而且还要对所得到的数据进行很好的筛选和识别,这样才能够充分利用大数据带来的机遇。

    • 分享到QQ空间
综合指数
  指数名称 数值 幅度 详细