数据信息
区别
那么,数据是否就是指可以存储和传输的信息呢?未必!数据和信息是有区别的。从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。 数据是数据采集时提供的,信息是从采集的数据中获取的有用信息。 由此可见,信息可以简单地理解为数据中包含的有用的内容。不严格的说“不知道的东西,你知道了,就获得了一个信息”。 也可以说数据在未被接收对象获取前可以称为数据,一旦被对象获取,即可称为信息。
定量分析
上面定性分析了数据和信息之间的区别和联系,下面对数据和信息进行定量分析。数据量和信息量之间会有什么联系呢?是不是数据量越大,其中包含的信息量就越多呢?不一定。比如,有人说“人的嘴巴上方有鼻子,鼻子上方有眼睛”,因为这是预料中的事,所以你从这个消息中得到的信息量很少。但如果有人说“人的鼻子上方有嘴巴,嘴巴上方有眼睛”,就会让人很震惊,因为这是预料之外的,这样的信息量就很大。这说明了:一个消息越不可预测,它所含的信息量就越大。 事实上,信息的基本作用就是消除人们对事物了解的不确定性。信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。从这个定义看,信息量跟概率是密切相关的。在概率论中,用P(x)表示在N个相等的可能事件出现某一个事件的概率,即P(x)=1/N。信息量I(x)定义为: I(x)=log2N = -log2(1/N )= -log2P(x) 结合概率论知识,推而广之,可以用下面的公式——称之为熵H(x)公式来表示一大堆数据带来的平均信息量。