有些大数据其实没有那么重要
来源:互联网  日期:2015-10-13
  • 分享到QQ空间

事实上,绝大多数大数据都是无关紧要的,这听起来必要是很残酷的,但这并不是我们对大数据的预期。正如我们已经讨论过的,一个大数据流体在容量、速度、多样性和复杂程度等多个方面。大数据流的很多内容对于某些特定目标来说是没有价值的,而有些内容则没有任何用户。驾驭大数据并不意味着一定要将所有的水牢牢地圈在游泳池中。事实更像是通过一个吸水管;你只需要把你所需要的部分洗出来就可以了,剩余的部分就随它去吧。





在一个大数据流中,有些信息具有长期的战略价值,有些信息只具有临时的战术价值,而另一些信息则毫无价值。驾驭大数据的关键部分是弄清楚不同信息所属的类别。有个例子能够很好说明这点:今天很多产品在运输时都会在运货箱上打上标签,对于一些昂贵的货物,甚至每一个货物上都会打上标签,将来,为每件货物打上标签最终会成为一个标准的做法。但是在今天的很多情况下,这么做的代价仍然过于昂贵,因此通常只在每个运货箱上打上一个标签,这些标签使得运货箱当前的位置、装载和卸载的时间、存放的地点都很容易别追踪到。




想象一个存放了数以万计的运货箱的仓库。每个货运箱都打上一个RFID标签。RFID识别器每隔十秒钟都要向仓库询问一次,而每一个货运箱都要做出相应的回应。一旦一个货运箱离开了仓库,它将不会再做出任何回答。一旦确认这个货运箱是按照预期的方式离开的,那之前所有的相关记录将不再有用。随着时间的推移,真正有用的是这些货运箱达到和离开的日期和时间。


所以对于大数据的使用一定先要做甄别出那些重要的信息。让大数据放任自流显得很奇怪,但是对于大数据来说却是意料之中的事情。也许你需要时间来适应丢弃一些低价值的数据。


    • 分享到QQ空间
综合指数
  指数名称 数值 幅度 详细