数据的价值密度是怎么定义的?


数据价值密度的高低与数据总量的大小成反比,数据价值密度越高数据总量越小,数据价值密度越低数据总量越大。任何有价值的信息的提取依托的就是海量的基础数据。


虽然数据量大,数据价值密度低是大数据的2个重要特征,但数据量越大,数据的价值密度不一定就越低,两者之间并没有必然的关系。

1)传统数据基本都是结构化数据,每个栏位都是有用的,价值密度非常高。大数据时代,越来越多数据都是半结构化和非结构化数据,比如网站访问日志,里面大量内容都是没价值的,真正有价值的比较少,虽然数据量比以前大了N倍,但价值密度确实低了很多。

2)如果有海量的结构化数据,需要大数据技术才能处理得了,当然也可以称之为大数据,但价值密度并不低。举个例子,银联、VISA等清算组织有海量的交易数据,不仅数据量大,而且很有价值。

所以「数据量越大,数据价值密度越低」是常见情况,但不是必然情况。

PS:数据的价值密度 可以认为是 单位数据所产生的有价值的信息量。


推荐阅读:
查看原文 >>
相关文章