非参数统计查看源代码讨论查看历史
非参数统计 |
非参数统计(nonparametric statistics),数理统计学重要内容。研究非参数问题,探究非参数方法。非参数问题是指统计总体分布形式未知或虽已知却不能用有限个参数刻画的统计问题。在多数场合下,与参数问题界线清楚,只在少数情况下会因为各人出发点不同而有不同看法。非参数方法有拟合优度检验、次序统计量、U统计量、秩统计量与秩方法、置换检验、非参数回归与判别等等。非参数方法并非绝对只能解决非参数问题,有些也可用于典型的参数统计问题。非参数统计方法无法依赖总体的具体分布形式,构造的统计量常与具体分布无关,故又称非参数方法为自由分布方法。这样,非参数方法的性能对分布的实际形式如何并不敏感,即非参数方法常具较好的稳健性。非参数方法需要考虑在约束条件十分宽松的情况下使用,有可能导致效率的下降。非参数统计难以建立小样本理论,基本属于大样本理论的内容。非参数统计形成于20世纪40年代,已成为一个体系庞大、理论精深且富有实用价值的统计分支。
简介
非参数统计是统计学的一个重要分支,它在实践中有着广泛的应用。所谓统计推断,就是由样本观察值去了解总体,它是统计学的基本任务之一。若根据经验或某种理论我们能在推断之前就对总体作一些假设,则这些假设无疑有助于提高统计推断的效率。这种情况下的统计方法称为“参数统计”。如果我们所知很少,以致于在推断之前不能对总体作任何假设,或仅能作一些非常一般性(例如连续分布、对称分布等)的假设,这时如果仍然使用参数统计方法,其统计推断的结果显然是不可信的,甚至有可能是错的。在对总体的分布不作假设或仅作非常一般性假设条件下的统计方法称为“非参数统计”。由于非参数统计方法与总体究竟是什么分布几乎没有什么关系,所以它的应用范围很广,它在社会学、医学、生物学、心理学、教育学等领域都有着广泛的应用。由于有关于总体的假设,所以参数统计的推断方法是针对这个假设的。相对而言,非参数统计的推断方法是很一般的,它仅应用样本观察值中一些非常直观(例如次序)的信息。所以非参数统计分析含有丰富的统计思想。
评价
重要的非参数统计方法秩方法是基于秩统计量(见统计量)的一类重要的非参数统计方法。设有样本X1,X2,…,Xn,把它们由小到大排列,若Xi在这个次序中占第Ri个位置(最小的占第1个位置),则称Xi的秩为Ri(i=1,2,…,n)。1945年F.威尔科克森提出的"两样本秩和检验"是一个有代表性的例子。设X1,X2,…,Xm和Y1,Y2,…,Yn分别是从分布为 F(x)和 F(x-θ)的总体中抽出的样本,F连续但未知,θ也未知,检验假设 H:θ=0,备择假设为θ>0(见假设检验)。记Yi在混合样本(X1,X2,…,Xm,Y1,Y2,…,Yn)中的秩为Ri,且为诸秩的和,当W >C时,否定假设H,这里C决定于检验的水平。这是一个性能良好的检验。秩方法的一个早期结果是C.斯皮尔曼于1904年提出的秩相关系数。设(X1,Y1),(X2,Y2),…,(Xn,Yn)是从二维总体(X,Y)中抽出的样本,Ri为Xi在(X1,X2,…,Xn)中的秩,Qi为Yi在(Y1,Y2,…,Yn)中的秩,定义秩相关系数为(Ri,Qi)(i=1,2,…n)的通常的相关系数(见相关分析)。它可以作为X、Y之间相关程度的度量,也可用于检验关于X、Y独立性的假设。[1]