求真百科欢迎当事人提供第一手真实资料,洗刷冤屈,终结网路霸凌。

正态分布查看源代码讨论查看历史

事实揭露 揭密真相
跳转至: 导航搜索
正态分布

正态分布,又名高斯分布(Gaussian distribution),是一个在数学物理工程领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量服从一个位置参数、尺度参数的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于尺度参数,决定了分布的幅度[1]

正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是位置参数为0, 尺度参数为1的正态分布(见右图中绿色曲线)。

基本概念

正态分布(Normal distribution)是一种概率分布。正态分布是具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ^2 )。遵从正态分布的随机变量的概率规律为取 μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。

2-1P921104014Q5.jpg

正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x 轴上方的钟形曲线。当μ=0,σ^2 =1时,称为标准正态分布,记为N(0,1)。[2]

μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

主要特点

⒈ 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

⒉ 制定参考值范围

⑴正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

⑵百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。

正态分布2.png

⒊ 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

⒋ 正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

频数分布

例1.10 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。

本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。该地18岁男大学生身高在168cm以下者,约占总数12.10%。其它计算结果见表3。

表3 100名18岁男大学生身高的实际分布与理论分布  

T01659b32682ee06484.png

分布 x+-s 身高范围(cm) 实际分布 人数 实际分布 百分数(%) 理论分布(%) X+-1s 168.69~176.71 67 67.00 68.27 X +-1.96s 164.84~180.56 95 95.00 95.00 X+-2.58s 162.35~183.05 99 99.00 99.00

医学参考值

某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:

⑴正态分布法:适用于正态或近似正态分布的资料。

双侧界值:X+-u(u)^S单侧上界:X+u(u)^S,或单侧下界:X-u(u)^S

正态分布4.jpg

⑵对数正态分布法:适用于对数正态分布资料。

双侧界值:lg-1[X(lgx)+-u(u)S(lgx)];单侧上界:lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。

常用u值可根据要求由表4查出。

⑶百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。

双侧界值:P2.5和P97.5;单侧上界:P95,或单侧下界:P5。

表4常用u值表 

参考值范围(%) 单侧 双侧 80 0.842 1.282 90 1.282 1.645 95 1.645 1.960 99 2.326 2.576

正态分布5.jpg

理论基础

如t分布、F分布、分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。

概率论中最重要的分布

正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

主要内涵

在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行抽象与提升,抓住其中的主要哲学内涵,归纳正态分布论(正态哲学)的主要内涵如下:

整体论

正态分布启示我们,要用整体的观点来看事物。“系统的整体观念或总体观念是系统概念的精髓。” 正态分布曲线及面积分布图由基区、负区、正区三个区组成,各区比重不一样。用整体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,也不能以偏概全。此外整体大于部分之和,在分析各部分、各层次的基础上,还要从整体看事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在基区,放眼负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是偏态或者是变态的事物,不是真实的事物本身。

正态分布6.png

重点论

正态分布曲线及面积分布图非常清晰的展示了重点,那就是基区占68.27%,是主体,要重点抓,此外95%,99%则展示了正态的全面性。认识世界和改造世界一定要住住重点,因为重点就是事物的主要矛盾,它对事物的发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,在千头万绪中不抓住主要矛盾,就会陷入无限琐碎之中。由于我们时间和精力的相对有限性,出于效率的追求,我们更应该抓住重点。在正态分布中,基区占了主体和重点。如果我们结合20/80法则,我们更可以大胆的把正区也可以看做是重点。

发展论

联系和发展是事物发展变化的基本规律。任何事物都有其产生、发展和灭亡的历史,如果我们把正态分布看做是任何一个系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这这样一个过程。准确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、事件的特征和性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和特征也不同,分析和解决问题的办法要与此相适应,这就是具体问题具体分析,也是解放思想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,事物发展大都是渐进的和累积的,走渐进发展的道路是事物发展的常态。例如,遗传是常态,变异是非常态。

总之,正态分布论是科学的世界观,也是科学的方法论,是我们认识和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。

教育统计学统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。

正态分布7.png

生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇。现在许多教育专家(如上海顾泠沅 、美国布鲁姆等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心。这是很大的误会。

通常正态曲线有一条对称轴。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点。该分数值在横轴上的对应点与顶点连接的线段就是该正态曲线的对称轴。考生人数最多的值是峰值。我们注意到,成绩曲线或直方图实际上很少对称的,称之为峰线更合适。

弗朗西斯 弗朗西斯·高尔顿 [Francis Galton 1822.02.16-1911.01.17],英国探险家、优生学家、心理学家,差异心理学之父,也是心理测量学上生理计量法的创始人。

高尔顿对心理学的贡献,大概可以归纳未差异心理学、心理测量的量化和实验心理学三方面:

⒈他率先研究个体差异。他在伦敦南肯辛顿博物馆他的人类测量实验室内,利用仪器作人类学测量及心理测量。测量项目有身高、体重、肺活量、拉力和握力、扣击的速率、听力、视力、色觉等,以研究能力的个体差异。又用问答法研究意象的个体差异。要求被试先确定一件事,如早餐的情境,然后被试回忆心目中出现餐桌上实物的意象,即食物的鲜明度、确定度等。对答案整理后,他发现被试的意象有很大的个体差异:有的人以肌肉运动觉意象为主,有的人以听觉意象为主,有的人以视觉意象为主。  

他强调遗传是形成个体差异的原因。他通过谱系调查,论证遗传因素与个体差异的关系。他是第一个明确提出普通能力和特殊能力主张的人。他在调查 1768-1868 年这 100年间英国的首相、将军、文学家和科学家共 977 名获得智力成熟的人的家谱后发现,其中有 89 个父亲、129 个儿子、114 个兄弟,共 332 名杰出人士。而在一般老百姓中 4000 人才产生一名杰出人士。因此断言“普通能力”是遗传的。在调查 30 家有艺术能力的家庭中,他发现这些家庭中的子女也有艺术能力的占 64%;而 150家无艺术能力的家庭,其子女中只有 21% 有艺术能力,因此断言艺术能力 - “特殊能力”也是遗传的。他发现,遗传亲属关系程度的降低,杰出亲属的比例也显著地下降。他还用 80 对双生子的资料,以双生子比其他亲兄弟、亲姐妹在心理特点上更为相像的事例,证明人的心理完全是遗传的。由此也使他第一个注意到同卵双生和异卵双生在估计遗传和环境因素在人的变异方面的相对作用的方法论的重要性。高尔顿根据遗传与个体差异的关系倡导善择配偶,改良人种,并再 1883 年《人类才能及其发展的研究》一书中首创“优生学”这一术语。  

正态分布8.jpg

⒉心理学研究之量化,始自高尔顿。他发明了许多感官和运动的测试,并以数量代表所测得的心理特质之差异。他认为人的所有特质,不管是物质的还是精神的,最终都可以定量叙述,这是实现人类科学的必要条件,故最先应用统计法处理心理学研究资料,重视数据的平均数与高中差数。他收集了大量资料证明人的心理特质在人口中的分布如同身高、体重那样符合正态分布曲线。他在论及遗传对个体差异的影响时,为相关系数的概念作了初步提示。如他研究了“居间亲”和其成年子女的身高关系,发现居间亲和其子女的身高有正相关,即父母的身材较高,其子女的身材也有较高的趋势。反之,父母的身材较低,其子女也有较矮的趋势。同时发现子女的身高常与其父母略有差别,而呈现“回中”趋势,即离开其父母的身高数,而回到一般人身高的平均数。  

⒊1883 年,高尔顿出版了《人类才能及其发展的研究》,书中概括地表述了两项在实验心理学中极为重要的研究方法和成果。第一个是关于自由联想的实验:他事先在 75 张纸条上各写一个单词,每次只让受试者看一张纸条,再用一个精密的计时器测出由此引出的两个即兴到来的联想所需的时间,然后对这些联想在受试者的经验中的可能起源加以分析,他发现最经常的联想往往来自遥远的童年。在这项实验中,他还证实人类具有一种看到或听到某一数字就能联想到某一特定形状的能力,他称这种现象为“数目形”。第二个是关于心理意象的广泛调查:他要求受试者先想一件确定的东西,然后尽量注意自己的“心视”画面,并回答如明亮度,清晰度、色彩等一系列问题,并按其强度记分。值得一提的是,在这些研究中,他首先在心理学中引进了调查表和评分办法。他对实验心理学的贡献还包括一系列他所发明的心理测验仪器和测验方法。有些仪器后来就以他的名字来命名,例如测量听觉阈的高尔顿笛和测量视觉范围的高尔顿棒,这些仪器直到 20 世纪 30 年代都是心理实验室的标准仪器。他还用盛有不同物质的瓶子来测验嗅觉,这一方法被后人沿用至今。除此之外,他又设计了测量肌肉感觉、反应力、触觉的仪器和方法。 

注:美国心理学家特尔曼(L. M. Terman)曾根据有关文献的记载,用他自己设计的斯坦福 - 比纳标准对幼年的高尔顿的智力进行了估算,他认为高尔顿 3-8 岁间的智力年龄几乎等于实际年龄的 2 倍,其智商约为 200。

智力、能力 

正态分布9.png

理查德·赫恩斯坦 [(Richard J. Herrnstein 1930.05.20-1994.09.13),美国比较心理学家]和默瑞(Charles Murray)合著《正态曲线》一书而闻名,在该书中他们指出人们的智力呈正态分布。智力主要是遗传的并因种族的不同而不同,犹太人、东亚人的智商最高,其次为白人,表现最差的是黑人、西班牙裔人。他们检讨了数十年来心理计量学与政策学的研究成果,发现美国社会轻忽了智商的影响愈变愈大的趋势。他们力图证明,美国现行的偏向于以非洲裔和南美裔为主的低收入阶层的社会政策,如职业培训、大学教育等,完全是在浪费资源。他们利用应募入伍者的测试结果证明,黑人青年的智力低于白人和黄种人;而且,这些人的智力已经定型,对他们进行培训收效甚微。因此,政府应该放弃对这部分人的教育,把钱用于包括所有种族在内的启蒙教育,因为孩子的智力尚未定型,开发潜力大。由于此书涉及黑人的智力问题,一经出版便受到来自四面八方的围攻。

基本术语

正态分布应用最广泛的连续概率分布,其特征是“钟”形曲线。

附:这种分布的概率密度函数为:

⒈正态分布:若已知的密度函数(频率曲线)为正态函数(曲线)则称已知曲线服从正态分布,记号 ~。其中μ、σ^2 是两个不确定常数,是正态分布的参数,不同的μ、不同的σ^2对应不同的正态分布。  

正态曲线呈钟型,两头低,中间高,左右对称,曲线与横轴间的面积总等于1。

2.正态分布的特征:服从正态分布的变量的频数分布由μ、σ完全决定。

正态分布0.jpg

集中性:正态曲线的高峰位于正中央,即均数所在的位置。对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ²):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。

u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。 

σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

标准正态曲线

标准正态曲线N(0,1)是一种特殊的正态分布曲线,以及标准正态总体在任一区间(a,b)内取值概率。

“小概率事件”和假设检验的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。

面积分布

正态分布-.jpg

1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同 范围内正态曲线下的面积可用公式计算。

⒉几个重要的面积比例 轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.27%,横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.00%,横轴区间(μ-2σ,μ+2σ)内的面积为95.44%,横轴区间[0,μ+2σ)内的面积为97.72%,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.00%,横轴区间(μ-3σ,μ+3σ)内的面积为99.73%。

标准正态曲线

1.标准正态分布是一种特殊的正态分布,标准正态分布的μ和σ^2为0和1,通常用ξ(或Z)表示服从标准正态分布的变量,记为 Z~N(0,1)。

2.标准化变换:此变换有特性:若原分布服从正态分布 ,则Z=(x-μ)/σ ~ N(0,1) 就服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换。 

⒊ 标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例。

两种正态分布

一般正态分布与标准正态分布的转化

正态分布--.jpg

由于一般的正态总体 其图像不一定关于y轴对称,对于任一正态总体 ,其取值小于x的概率。只要会用它求正态总体 在某个特定区间的概率即可。“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。

一般正态分布与标准正态分布的区别与联系

正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都可以通过Z分数公式转换成标准正态分布。  

两者特点比较:

⑴正态分布的形式是对称的,对称轴是经过平均数点的垂线。

⑵中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。

⑶正态曲线下的面积为1。正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。

⑷正态分布曲线下标准差与概率面积有固定数量关系。所有正态分布都可以通过Z分数公式转换成标准正态分布。  

主要特征

正态分布00.jpg

1.集中性:正态曲线的高峰位于正中央,即均数所在的位置。

2.对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

3.均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

4.正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ²):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。

5.u变换:为了便于描述和应用,常将正态变量作数据转换。  

3σ原则

正态分布曲线性质:

1、当x<μ时,曲线单调上升;当x>μ时,曲线单调下降,当曲线向左右两边无限延伸时,以x轴为渐近线;

2、正态曲线关于直线x=μ对称;

3、σ越大,曲线最大值越小,正态曲线越扁平;σ越小,曲线最大值越大,正态曲线越尖陡;

T017108621462e1e93b.jpg

4、在正态曲线下方和x轴上方范围内区域面积为1(概率分布函数性质);

5、当x=μ时,曲线取最大值1/√﹙2π﹚σ。

3σ原则:P(μ-σ<X≤μ+σ)=68.26%;P(μ-2σ<X≤μ+2σ)=95.44%;P(μ-3σ<X≤μ+3σ)=99.74%。

其他资料

历史发展

正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。

其实,他提出的形式有相当大的局限性:海根把误差设想成个数很多的、独立同分布的“元误差” 之和,每只取两值,其概率都是1/2,由此出发,按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性) 为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义。

正态分布10.jpg

概念及特征

一、

正态分布的概念

由一般分布的频数表资料所绘制的直方图,图⑴可以看出,高峰位于中部,左右两侧大致对称。我们

设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图⑶。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。

为了应用方便,常对正态分布变量X作变量变换。


该变换使原来的正态分布转化为标准正态分布 (standard normal distribution),亦称u分布。u被称为标准正态变量或标准正态离差(standard normal deviate)。

实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。

T01321289d855d9e6b9.png

查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式u=(X-μ)/σ求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数X1和标准差S分别代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴

上的总面积为100%或1。

图2 正态曲线与标准正态曲线的面积分布

正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。


考试成绩及学生综合素质研究

教育统计学 统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。

从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇。现在许多教育专家(如上海顾泠沅 、美国布鲁姆等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心。这是很大的误会。通常正态曲线有一条对称轴。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点。该分数值在横轴上的对应点与顶点连接的线段就是该正态曲线的对称轴。考生人数最多的值是峰值。我们注意到,成绩曲线或直方图实际上很少对称的,称之为峰线更合适。

Sunxia9032009629381817586.jpg

群体、数量遗传学

群体 理想群体 无限群体 有限群体 孟德尔式群体 异质群体 同质群体 平衡群体 有效群体大小 交配系统 随机交配 同型交配 选型交配 异型交配 矫正交配 基因库 基因多样性 基因流 基因一致性 遗传平衡 瓶颈效应 建立者效应 遗传漂变 突变压 基因型频率 基因频率 哈迪-温伯格平衡 赖特平衡 连锁平衡 连锁不平衡 遗传冲刷 遗传距离 遗传死亡 遗传负荷 突变负荷 分离负荷 迁移负荷 置换负荷 致死当量 性状趋异 性状趋同 适应性 共适应 孟德尔抽样 适合度 杂合度 纯合度 有效等位基因数 多态基因座 多态信息含量 迁入 迁移 平衡多态性 工业黑化现象 过渡性多态性 二态性 多样性中心 伦施法则 多基因 主基因 主-多基因混合遗传 多基因系统 超亲遗传 超显性 质量性状 数量性状 阈[值]性状 度量性状 连续性状 目标性状 辅助性状 信息性状 连续变异 不连续变异 相关变异 偶然变异 表型值 表型分布 高尔顿定律 霍尔丹法则 世代交替 世代间隔 阈值 阈[值]模型 加性效应 非加性效应 显性效应 基因型值 加性基因 环境效应 暂时性环境效应 永久性环境效应 共同环境效应 环境相关 育种值 估计育种值 综合育种值 表型方差 环境方差 遗传方差 加性遗传方差 非加性遗传方差 显性方差 上位方差 表型相关 表型选择差 遗传协方差 环境协方差 显性度 重复率

T01bd2346515fc47f8f.jpg

组内相关系数 遗传率 广义遗传率 狭义遗传率 实现遗传率 实现遗传相关 互补交配 同胞 半同胞 全同胞 同胞群 品系 品种 纯种 变种 单源种 同型种 同胞种 原种 亚种 纯系繁育 杂交不育性 近交 近交系 近亲交配 半同胞交配 全同胞交配 异族通婚 远交 渐渗杂交 级进杂交 远缘杂交 轮回亲本 非轮回亲本 双列杂交 不完全双列杂交 双因子杂种率 三列杂交 远缘杂种 配合力 一般配合力 特殊配合力 同胞分析 同胞配对法 同胞选择 同胞对分析 遗传评估 遗传相关 遗传获得量 遗传传递力 通径系数 近亲 近交系数 近亲系数 亲缘系数 选择 选择系数 选择指标 选择指数 综合选择指数 选择压[力] 选择差 选择反应 相关选择反应 选择极限 选择强度 单性状选择 多性状选择 顺序选择法 约束选择 最宜选择 家系内选择 家系选择 合并选择 间接选择 人工选择 个体选择 集团选择 混合选择 截断选择 标记辅助选择 标记辅助导入 独立淘汰法 对数优势比 候选基因 候选基因分析 混合家系 混合模型 混合模型方程组 最佳线性无偏估计量 最佳线性无偏预测 近交衰退 同源相同基因 经济加权值 孟德尔抽样离差 配子模型 频率分布 数量性状基因座 适应性辐射 杂交育种 突变育种 杂种优势 杂交弱势 基因型与环境互作 总体 样本 总体参数 统计量 准确性 精确性 [数学]期望 无偏估计量 方差 标准差 标准误[差] 抽样方差 变异系数 协方差 随机变量 连续性随机变量 离散性随机变量 相关 相关系数 相关分析 回归分析

正态分布11.jpg

回归系数 一元回归 多元回归 回归方程 方差分析 最大似然法 置信区间 正态分布 抽样分布 数学生态学术语 随机分布 均匀分布 泊松分布 核心分布 聚集分布 奈曼分布 泰勒幂法则 χ2分布 正态分布 χ2检验 聚类分析 列联表 相关系数 多元分析 随机化区组 秩和检验 t检验 方差分析 变异系数 典范相关 序贯抽样 随机抽样 分层随机抽样 双重抽样 系统抽样 黑箱模型 白箱模型 还原性模型 整体性模型 自治模型 非自治模型 猎物-捕食者模型 空间明晰的种群模型 自由体模型 霍林圆盘方程 概率单位变换 分对数变换 脚踏石模型 无限[等位]基因突变模型 逐步突变模型 更新概率模型 静态模型 动态模型 确定性模型 莱斯利矩阵 岛屿模型 大陆-岛屿模型 距离隔离模型 功能反应 数值反应 周限增长率 几何增长率 指数增长 逻辑斯谛增长 S型生长曲线 平均拥挤度 拥挤效应 世代离散 世代重叠 种群指数 分布参数系统 集中参数系统 线性系统 非线性系统 确定性系统 随机系统 常系数系统 变系数系统 分室系统方法 实验组成成分法 反馈 灵敏度 生态缓冲能力 状态变量 模拟 校准 检验 验证 约束方程 稳定性

75279f9d26d444dcbd9a7fab046d4c4c.jpg

变异性 突变论 博弈论 生态位转移 熵 无序 霍普夫分岔 辛普森多样性指数 香农-维纳多样性指数 李雅普诺夫指数 相空间 吸引子 奇异吸引子 1\/f噪声 自相似 分形 分数维 混沌 谐波分析 数学名词 八边形 八面体 百分比 百分点 百分位数 半径 半球 半圆 被乘数 被除数 被加数 被减数 比 比例 边 变量 标准差 表面积 并集 补集 不等边三角形 不等式 不定积分 差 长 常量 乘 乘方 乘数 除 除数 垂心 次方 次方根 大于 大于等于 代数 单调性 单项式 导数 等边三角形 等式方程式 等腰三角形 等腰梯形 等于 底 底面 点 定积分 定理 定义域 对数 钝角 钝角三角形 多边形 多面体 二次方程 多项式 二次方根平方根 二次方平方 二进制 二十面体 反余割 反余切 反余弦 反正割 反正切 反正弦 方差 非正态分布 分布 分母 分数 分子 负 复数

T01148f2f933312ec7f.png

高 公理 公式 勾股定理 轨迹 函数 和 横坐标 弧 弧度 环 积 积分 极限 集合 几何 计算 加 加权平均数 加数 假设 减 减数 交集 角 角度 阶乘 截尾 进位 九边形 九面体 矩形 矩阵 开方 空集 空间 宽 棱台 棱柱 棱锥 立方体 菱形 零 六边形 六面体 面 面积 命题 内切圆 内心 排列 旁心 抛物线 平角 平均数 平行 平行六面体 平行四边形 七边形 七面体 奇偶性 球 曲线统计图 全等 权 锐角 锐角三角形 三次方程 三次方根立方根 三次方立方 三角 三角形 扇形 扇形统计图 商 上舍入 射线 十边形 十二边形 十二面体 十进制 十六进制 十面体 十一边形 十一面体 实数 数 数列级数 数字 双曲线 四边形 四次方 四次方程 四次方根 四面体 四舍五入 算术 梯形 体 体积 条形统计图 统计 图表 图象 椭圆 外切圆 外心

T01054d9f9dd2f2e788.jpg

微分 微积分 未知数 无理数 无穷大 无穷小 无效数字 五边形 五面体 系数 下舍入 线 线段 相交 相似 相位 小数 小数点 小于 小于等于 斜边 行列式 虚数 旋转 一次方程 映射 有理数 有效数字 余割 余切 余弦 元素 原点 圆 圆台 圆心 圆周 圆周率 圆柱 圆锥 运算 运算符 折线统计图 振幅 整数 正 正多边形 正方形 正割 正切 正态分布 正弦 证明 直角 直角边 直角三角形 直角梯形 直径 值域 指数幂 重心 周长 周角 周期 周期性 轴 柱形统计图 子集 自然数 纵坐标 组合 坐标系 坐标轴 化学名词 阿累尼乌斯方程 氨 螯合剂 螯合物 螯合物 半反应 半微量分析 苯 比色分析 变异系数 标定 标准电极电势 标准曲线 标准溶液 标准自由能变 表征 查依采夫规则 产物 常规分析 常量分析 沉淀反应 陈化 臭氧 船型构象 醇 磁性 次序规则 催化 催化反应 催化剂 单分子亲核取代反应 单分子消除反应 单色器 氮族元素 滴定 滴定度 滴定分析 滴定误差 滴定终点 狄尔斯阿尔得反应 碘量法 电池电动势 电负性 电荷数 电化学分析 电极电势 电解 电解质 电离 电离能

T01582606d8aed393f1.jpg

电子 电子的波动性 电子构型 电子自旋 定量分析 定性分析 对映体 多电子原子 多相离子平衡 多原子分子 二氧化碳 反应的活化能  反应方向 反应机理 反应级数 反应历程 反应热 反应速率 反应速率 范德华方程 芳香性 芳香族化合物 放射性 非金属 非晶体 非均相催化剂 菲舍尔投影式 费林试剂 分光光度法  分析化学 分子轨道 分子轨道理论 分子间力 分子间作用力 分子空间构型 酚酞 伏特电池 副反应系数 傅列德尔克拉夫茨反应 盖斯定律 高锰酸钾 高锰酸钾  格利雅试剂 汞 共沉淀 共轭二烯烃 共轭双键 共轭酸碱对 共轭酸碱对 共轭体系 共轭效应 共价键 共价键 共性 构象异构体 构象 构型 孤对电子 官能团 光源 硅的存在和制备 硅酸 硅酸盐 轨道 轨道能量 轨道重叠 过程 过渡金属 过滤 过失误差 过氧化氢 过氧化物和超氧化物 过氧化物效应 耗氧量 合金 核磁共振 核化学 核聚变 核裂变 红外光谱 红移 互变异构现象 化合物 化学反应 化学反应的通式 化学方程式配平 化学分析 化学计量点 化学位移 化学平衡 化学需氧量  化学因数 还原 缓冲容量 缓冲溶液 缓冲溶液 活化能 活性中间体 霍夫曼规则 基准物质 极性分子 继沉淀 加成反应 甲基橙

T018a1b0ae20ac7147a.jpg

价层电子对互斥理论 价键理论 价键理论 检测系统   碱金属 碱土金属 键长 键级 键角 键矩 键能 结构异构 解蔽 解离常数 金属 金属键 金属晶体 金属离子的水解 金属指示剂 晶体结构 精密度 聚合物 均相催化剂 开链族化合物 凯库勒结构式 坎尼扎罗反应 克莱门森还原 克莱森酯缩合反应 克莱森重排 镧系元素 累积稳定常数 离去基团 离子的沉淀与分离 离子的选择沉淀 离子方程式配平 离子晶体 离子偶极力 理想气体状态方程分压 立体化学 立体异构 立体异构体 量子数 列·沙特列原理 磷酸 磷酸盐 零水准 硫化物 卢卡斯试剂 卤代烃 卤仿反应 卤化磷 卤化物 卤素 路易斯酸碱 氯化物 麦克尔反应 酶 醚 摩尔吸光系数  能斯特方程 纽曼投影式 浓度 偶极矩 偶然误差 泡林不相容原理 配离子的形成 配位化合物 配位数 配位数 配位体 配位原子 硼氢化反应 硼烷 偏差 硼族元素 平衡常数 亲电加成 亲电试剂 亲电性 亲核加成 亲核取代反应 亲核试剂 氢化物 氢键 氢氧化物 氢原子的波尔模型 倾泻法  球密堆积 区元素 醛 热力学第二定律 热力学第一定律 热与功 溶度积常数 溶解度 溶解氧

T019cd5512cc812c40e.png

色谱分析 色散 熵 熵变 生成焓 石墨 试剂 铈量法 手性分子 双分子亲核取代反应 双分子消除反应 双原子分子 水的离子积 水合氢离子 水合质子 水离解 顺反异构 速率常数 酸和碱 酸碱 酸碱的相对强度 酸碱滴定法 酸碱指示剂 酸碱质子理论 酸效应系数 羧酸 羧酸衍生物 碳负离子 碳化物 碳水化合物 碳酸 碳酸盐 碳正离子 碳族元素 铁 同分异构体 同分异构现象 同离子效应 同位素 铜 酮 透光率 瓦尔登反转 微量分析 位置异构体

正态分布12.jpg

物质的量 吸电子基 吸光率 吸热与发热过程 吸收池 烯丙基正离子 烯烃 稀有气体 稀有气体化合物 系统命名法 系统误差 系统与环境 显著性检验 线光谱 相 相对标准偏差 相转移催化作用 消除反应 硝酸 校正曲线  锌 兴斯堡试验 行 形态分析 休克尔规则 旋光性 盐 掩蔽 氧化 氧化还原电对 氧化还原反应 氧化还原指示 氧化剂和还原剂 氧化数 氧化物 氧族元素 一氧化碳 仪器分析 乙醇 乙二胺四乙酸 乙醚 乙醛 乙炔 乙酸 乙烯 乙酰化剂 异构现象 银镜反应 银量法 有机化学 有效核电荷 有效数字 右旋 诱导效应 元素的周期律 原电池 原子半径 原子轨道 原子晶体 原子数 杂化 杂化轨道 杂化轨道 杂环化合物 在线分析 真实气体 正态分布 脂肪族化合物 值 质量数 质子平衡 质子转移反应 置信区间 置信水平 中心离子 仲裁分析 重铬酸钾 重铬酸钾 重键 重量分析法 周期表 状态与状态函数 准确度 灼烧 紫移 自发过程 总稳定常数 族 左旋

参考来源