41,228
次編輯
變更
数据流
,added Category:470 製造總論 using HotCat
这是指数据属性(维)的取值范围非常大,可能取的值非常多,如地域、手机号码、人、网络节点等。这才是导致数据流无法在内存或硬盘中存储的主要原因。如果维度小,即使到来的数据量很大,也可以在较小的存储器中保存这些数据。例如,对于无线通信网来说,同样的100万条通话记录,如果只有1000个用户,那么使用1000个存储单位就可以保存足够多和足够精确的数据来回答“某一用户的累计通话时间有多长”的问题;而如果共有100000个用户,要保存这些信息,就需要100000个存储单位。数据流数据的属性大多与地理信息、IP地址、手机号码等有关,而且往往与时间联系在一起。这时,数据的维度远远超过了内存和[[硬盘容量]],这意味着系统无法完整保存这些信息,通常只能在数据到达的时候存取数据一次。<ref>[https://baijiahao.baidu.com/s?id=1705411802975851384&wfr=spider&for=pc 数据流]百度</ref>
=='''参考文献'''==
[[Category:470 製造總論]]