開啟主選單

求真百科

變更

数据冗余

增加 6,253 位元組, 7 個月前
创建页面,内容为“{| class="https://cn.bing.com/images/search?view=detailV2&ccid=yW2tWbIv&id=E886BBC10C0FF268F19052553B22E5BF179B2EF6&thid=OIP.yW2tWbIvjX3TmEuPsw3WOgHaEQ&mediaurl=http…”
{| class="https://cn.bing.com/images/search?view=detailV2&ccid=yW2tWbIv&id=E886BBC10C0FF268F19052553B22E5BF179B2EF6&thid=OIP.yW2tWbIvjX3TmEuPsw3WOgHaEQ&mediaurl=https%3a%2f%2fimg.sogoucdn.com%2fv2%2fthumb%2f%3fappid%3d200698%26url%3dhttps%3a%252F%252Fpic.wenwen.soso.com%252Fpqpic%252Fwenwenpic%252F0%252F20220528040114-571315726_png_568_326_164208%252F0&exph=326&expw=568&q=%e6%95%b0%e6%8d%ae%e5%86%97%e4%bd%99&simid=608036854395580604&FORM=IRPRST&ck=C4E442EAEF08EFB5C9DC7F926F2C0D23&selectedIndex=13&itb=0&ajaxhist=0&ajaxserp=0" style="float:right; margin: -10px 0px 10px 20px; text-align:left"
|<center>'''数据冗余'''<br><img
src=" https://tse3-mm.cn.bing.net/th/id/OIP-C.yW2tWbIvjX3TmEuPsw3WOgHaEQ?rs=1&pid=ImgDetMain" width="280"></center><small> 圖片來自优酷</small>
|}
'''数据库系统中发生的数据集合中重复的数据'''

数据冗余发生在数据库系统中,指的是一个字段在多个表里重复出现。举个例子,如果每条客户购买商品的信息里都连带记录了客户自身的信息,这样的数据冗余可能造成不一致,因为客户自身的信息可能不一样。 数据冗余会导致数据异常和损坏,一般来说设计上应该被避免。 数据库规范化防止了冗余而且不浪费存储容量。 适当的使用外键可以使得数据冗余和异常降到最低。但是,如果考虑效率和便利,有时候也会设计冗余数据,而不考虑数据被破坏的风险。

==简介==
数据冗余发生在[[数据库系统]]中,指的是一个字段在多个表里重复出现。举个例子,如果每条客户购买商品的信息里都连带记录了客户自身的信息,这样的数据冗余可能造成不一致,因为客户自身的信息可能不一样。数据冗余会导致数据异常和损坏,一般来说设计上应该被避免。数据库规范化防止了冗余而且不浪费存储容量。适当的使用外键可以使得数据冗余和异常降到最低。但是,如果考虑效率和便利,有时候也会设计冗余数据,而不考虑数据被破坏的风险。

1,时间冗余

时间冗余是序列图像(电视图像、动画)和语音数据中所经常包含的冗余。
图像序列中的两幅相邻的图像,后一幅图像与前一幅图像之间有较大的相关性,这反映为时间冗余。同理,在语言中,由于人在说话时发音的音频是一连续的渐变过程,而不是一个完全的在时间上独立的过程,因而存在时间冗余。

2,空间冗余

空间冗余是图像数据中经常存在的一种冗余。
在同一幅图像中,规则物体和规则背景(所谓规则是指表面颜色分布是有序的而不是杂乱无章的)的表面物理特性具有相关性,这些相关性的光成像结构在数字化图像中就表现为数据冗余。,

3,知识冗余

有许多图像的理解与某些基础知识有相当大的相关性。

例如:人脸的图像有固定的结构。比如,嘴的上方有鼻子。鼻子的上方有眼睛,鼻子位于正脸图像的中线上等等。这类规律性的结构可由先验知识相背景知识得到,我们称此类冗余为知识冗余。

4,结构冗余

有些图像从大域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。

5,视觉冗余

人类视觉系统对于图像场的任何变化,并不是都能感知的。例如,对于图像的编码和解码处理时,由于压缩或量比截断引入了噪声而使图像发生了一些变化,如果这些变化不能为视觉所感知,则仍认为图像足够好。事实上人类视觉系统一般的分辨能力约为26灰度等级,而一般图像量化采用28灰度等级,这类冗余我们称为视觉冗余。

通常情况下,人类视觉系统对亮度变化敏感,而对色度的变化相对不敏感;在高亮度区,人眼对亮度变化敏感度下降。

对物体边缘敏感,内部区域相对不敏感;对整体结构敏感,而对内部细节相对不敏感。

6,信息熵冗余

信息熵是指一组数据所携带的信息量。它一般定义为:H =
-∑pi×log2pi。其中N为码元个数,pi为码元yi发生的概率。由定义,为使单位数据量d接近于或等于H,应设d=∑pi×b(yi),其中b(yi)是分配给码元yi的比特数,理论上应取-log2pi。实际上在应用中很难估计出{Po,P1,…,PN—1}。因此一般取b(yo)=b(y1)=…=b(yN—1),例如,英文字母编码码元长为7比特,即b(yo)=b(y1)=…=b(yN—1)=7,这样所得的d必然大于H,由此带来的冗余称为信息墒冗余或编码冗余。

==数据库==
数据库,简而言之可视为[[电子化]]的[[文件柜]]——存储电子[[文件]]的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。

所谓“数据库”系以一定方式储存在一起、能予多个用户[[共享]]、具有尽可能小的[[冗余度]]、与应用程序彼此独立的数据[[集合]]。


==数据库规范化==
数据库规范化,又称数据库或资料库的正规化、标准化,是[[数据库设计]]中的一系列原理和技术,以减少数据库中数据冗余,增进数据的一致性。[[关系模型]]的发明者[[埃德加·科德]]最早提出这一概念,并于1970年代初定义了[[第一范式]]、[[第二范式]]和[[第三范式]]的概念,还与Raymond F. Boyce于1974年共同定义了第三范式的改进范式——BC范式。

除外还包括针对[[多值依赖]]的[[第四范式]],[[连接依赖]]的[[第五范式]],DK范式和第六范式。

现在数据库设计最多满足3NF,普遍认为范式过高,虽然具有对数据关系更好的约束性,但也导致数据关系表增加而令数据库IO更易繁忙,原来交由数据库处理的关系约束现更多在数据库使用程序中完成。<ref>[[ Jorge H. Doorn; Laura C. Rivero. Database integrity: challenges and solutions. Idea Group Inc (IGI). 2002: 4–5 [23 January 2011]. ISBN 978-1-930708-38-9.]]</ref>

'''视频'''

'''什么是冗余'''

[https://www.bilibili.com/video/BV1W44y1e7c5/哔哩哔哩]

==参考文献==
{{Reflist}}
13,339
次編輯