數據冗餘
數據庫系統中發生的數據集合中重複的數據
數據冗餘發生在數據庫系統中,指的是一個字段在多個表里重複出現。舉個例子,如果每條客戶購買商品的信息里都連帶記錄了客戶自身的信息,這樣的數據冗餘可能造成不一致,因為客戶自身的信息可能不一樣。 數據冗餘會導致數據異常和損壞,一般來說設計上應該被避免。 數據庫規範化防止了冗餘而且不浪費存儲容量。 適當的使用外鍵可以使得數據冗餘和異常降到最低。但是,如果考慮效率和便利,有時候也會設計冗餘數據,而不考慮數據被破壞的風險。
目錄
簡介
數據冗餘發生在數據庫系統中,指的是一個字段在多個表里重複出現。舉個例子,如果每條客戶購買商品的信息里都連帶記錄了客戶自身的信息,這樣的數據冗餘可能造成不一致,因為客戶自身的信息可能不一樣。數據冗餘會導致數據異常和損壞,一般來說設計上應該被避免。數據庫規範化防止了冗餘而且不浪費存儲容量。適當的使用外鍵可以使得數據冗餘和異常降到最低。但是,如果考慮效率和便利,有時候也會設計冗餘數據,而不考慮數據被破壞的風險。
1,時間冗餘
時間冗餘是序列圖像(電視圖像、動畫)和語音數據中所經常包含的冗餘。 圖像序列中的兩幅相鄰的圖像,後一幅圖像與前一幅圖像之間有較大的相關性,這反映為時間冗餘。同理,在語言中,由於人在說話時發音的音頻是一連續的漸變過程,而不是一個完全的在時間上獨立的過程,因而存在時間冗餘。
2,空間冗餘
空間冗餘是圖像數據中經常存在的一種冗餘。 在同一幅圖像中,規則物體和規則背景(所謂規則是指表面顏色分布是有序的而不是雜亂無章的)的表面物理特性具有相關性,這些相關性的光成像結構在數字化圖像中就表現為數據冗餘。,
3,知識冗餘
有許多圖像的理解與某些基礎知識有相當大的相關性。
例如:人臉的圖像有固定的結構。比如,嘴的上方有鼻子。鼻子的上方有眼睛,鼻子位於正臉圖像的中線上等等。這類規律性的結構可由先驗知識相背景知識得到,我們稱此類冗餘為知識冗餘。
4,結構冗餘
有些圖像從大域上看存在着非常強的紋理結構,例如布紋圖像和草蓆圖像,我們說它們在結構上存在冗餘。
5,視覺冗餘
人類視覺系統對於圖像場的任何變化,並不是都能感知的。例如,對於圖像的編碼和解碼處理時,由於壓縮或量比截斷引入了噪聲而使圖像發生了一些變化,如果這些變化不能為視覺所感知,則仍認為圖像足夠好。事實上人類視覺系統一般的分辨能力約為26灰度等級,而一般圖像量化採用28灰度等級,這類冗餘我們稱為視覺冗餘。
通常情況下,人類視覺系統對亮度變化敏感,而對色度的變化相對不敏感;在高亮度區,人眼對亮度變化敏感度下降。
對物體邊緣敏感,內部區域相對不敏感;對整體結構敏感,而對內部細節相對不敏感。
6,信息熵冗餘
信息熵是指一組數據所攜帶的信息量。它一般定義為:H = -∑pi×log2pi。其中N為碼元個數,pi為碼元yi發生的概率。由定義,為使單位數據量d接近於或等於H,應設d=∑pi×b(yi),其中b(yi)是分配給碼元yi的比特數,理論上應取-log2pi。實際上在應用中很難估計出{Po,P1,…,PN—1}。因此一般取b(yo)=b(y1)=…=b(yN—1),例如,英文字母編碼碼元長為7比特,即b(yo)=b(y1)=…=b(yN—1)=7,這樣所得的d必然大於H,由此帶來的冗餘稱為信息墒冗餘或編碼冗餘。
數據庫
數據庫規範化
數據庫規範化,又稱數據庫或資料庫的正規化、標準化,是數據庫設計中的一系列原理和技術,以減少數據庫中數據冗餘,增進數據的一致性。關係模型的發明者埃德加·科德最早提出這一概念,並於1970年代初定義了第一範式、第二範式和第三範式的概念,還與Raymond F. Boyce於1974年共同定義了第三範式的改進範式——BC範式。
除外還包括針對多值依賴的第四範式,連接依賴的第五範式,DK範式和第六範式。
現在數據庫設計最多滿足3NF,普遍認為範式過高,雖然具有對數據關係更好的約束性,但也導致數據關係表增加而令數據庫IO更易繁忙,原來交由數據庫處理的關係約束現更多在數據庫使用程序中完成。[1]
視頻
什麼是冗餘