導覽
近期變更
隨機頁面
新手上路
新頁面
優質條目評選
繁體
不转换
简体
繁體
3.144.23.143
登入
工具
閱讀
檢視原始碼
特殊頁面
頁面資訊
求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。
檢視 常態分布 的原始碼
←
常態分布
前往:
導覽
、
搜尋
由於下列原因,您沒有權限進行 編輯此頁面 的動作:
您請求的操作只有這個群組的使用者能使用:
用戶
您可以檢視並複製此頁面的原始碼。
{| class="wikitable" style="float:right; margin: -10px 0px 10px 20px; text-align:left" |<center>'''機率密度函數'''<br><img src="http://140.121.160.124/fd/ex123/ch3.ht3.jpg" width="250"></center><small>[http://140.121.160.124/fd/ex123/ch3.htm 圖片來自http://140.121.160.124/fd/ex123/ch3.htm]</small> |} '''常態分布'''(normal distribution)又名'''高斯分布'''('''Gaussian distribution'''),是一個非常常見的[[概率分布|連續機率分布]]<ref>[https://wiki.mbalib.com/zh-tw/%E6%A6%82%E7%8E%87%E5%88%86%E5%B8%83 概率分布],MBA智庫百科</ref> 。常態分布在[[统计学]]上十分重要,經常用在[[自然科学|自然]]和[[社会科学]]來代表一個不明的隨機變量。 若[[隨機變量]]<math>X</math>服從一個位置參數為mu、尺度參數為sigma的常態分布,記為: :X \sim N(\mu,\sigma^2) 則其[[機率密度函數]]為 f(x) = \frac1{\sigma\sqrt{2\pi}}\; e^{-\frac{\left(x-\mu\right)^2}{2\sigma^2} } 常態分布的[[數學期望]]值或[[期望值]]<math>\mu</math>等於位置參數,決定了分布的位置;其[[方差]]<math>\sigma^2</math>的開平方或[[標準差]]<math>\sigma</math>等於尺度參數,決定了分布的幅度。 常態分布的機率密度函數曲線呈鐘形,因此人們又經常稱之為'''鐘形曲線'''(类似于寺庙里的大钟,因此得名)。我們通常所說的'''標準常態分布'''是位置參數mu = 0,尺度參數sigma^2 = 1的常態分布。 == 概要 == 常態分布是[[自然科學]]與[[行為科學]]中的定量現象的一個方便模型。各種各樣的[[心理學]]測試分數和[[物理]]現象比如[[光子]]計數都被發現近似地服從常態分布。儘管這些現象的根本原因經常是未知的,理論上可以證明如果把許多小作用加起來看做一個變量,那麼這個變量服從常態分布(在R.N.Bracewell的Fourier transform and its application中可以找到一種簡單的證明)。常態分布出現在許多區域[[統計]]:例如,[[採樣分佈|採樣分布]][[均值]]是近似地常態的,即使被採樣的樣本的原始群體分布並不服從常態分布。另外,常態分布[[信息熵]]在所有的已知均值及方差的分布中最大,這使得它作為一種[[均值]]以及[[方差]]已知的分布的自然選擇。常態分布是在統計以及許多統計測試中最廣泛應用的一類分布。在[[概率論]],常態分布是幾種連續以及離散分布的[[極限分佈|極限分布]]。 === 歷史 === 常態分布最早是[[亞伯拉罕·棣莫弗|棣莫弗]]在1718年著作的書籍的(Doctrine of Change),及1734年發表的一篇關於[[二項分佈|二項分布]]文章中提出的,當二項隨機變數的位置參數n很大及形狀參數p為1/2時,則所推導出二項分布的近似分布函數就是常態分布。[[拉普拉斯]]在1812年发表的《分析概率论》(Theorie Analytique des Probabilites)中對棣莫佛的結論作了擴展到二項分布的位置參數為n及形狀參數為1>p>0時。現在这一结论通常被稱為[[中央極限定理#棣莫佛-拉普拉斯定理|棣莫佛-拉普拉斯定理]]。 拉普拉斯在[[誤差分析]]試驗中使用了常態分布。[[勒讓德]]於1805年引入[[最小二乘法]]這一重要方法''';而'''[[高斯]]則宣稱他早在1794年就使用了該方法,並通過假設誤差服從常態分布給出了嚴格的證明。 「鐘形曲線」這個名字可以追溯到[[Jouffret]]他在1872年首次提出這個術語「鐘形曲面」,用來指代[[多元常態分佈|二元常態分布]]([[multivariate normal distribution|bivariate normal]])。正态分布這個名字還被[[Charles S. Peirce]]、[[Francis Galton]]、[[Wilhelm Lexis]]在1875分别獨立地使用。這個術語是不幸的,因為它反映和鼓勵了一種謬誤,即很多概率分布都是常態的。(請參考下面的「實例」) 這個分布被稱為「常態」或者「高斯」正好是[[Stigler名字由來法則]]的一個例子,這個法則說「沒有科學發現是以它最初的發現者命名的」。 == 正态分布的定義 == 有幾種不同的方法用來說明一個隨機變量。最直觀的方法是[[概率密度函數]],這種方法能夠表示隨機變量每個取值有多大的可能性。[[累積分佈函數|累積分布函數]]是一種概率上更加清楚的方法,請看下邊的例子。還有一些其他的等價方法,例如cumulant、[[特徵函數]]、[[動差生成函數]]以及cumulant-[[生成函數]]。這些方法中有一些對於理論工作非常有用,但是不夠直觀。請參考關於[[概率分佈|概率分布]]的討論。 === 概率密度函數 === '''常態分布'''的[[概率密度函數]]均值為mu [[方差]]為sigma^2 (或[[標準差]]sigma)是[[高斯函數]]的一個實例: :f(x;\mu,\sigma) frac{1}{\sigma\sqrt{2\pi}} \, \exp \left( -\frac{(x- \mu)^2}{2\sigma^2} \right)。 如果一個[[隨機變量]]X服從這個分布,我們寫作 X ~ N(\mu, \sigma^2). 如果mu = 0並且sigma = 1,這個分布被稱為'''標準正态分布''',這個分布能夠簡化為 :f(x) = \frac{1}{\sqrt{2\pi}} \, \exp\left(-\frac{x^2}{2} \right)。 正态分布中一些值得注意的量: * 密度函數關於平均值對稱 * 平均值與它的[[眾數 (數學)|眾數]](statistical mode)以及[[中位數]](median)同一數值。 * 函數曲線下68.268949%的面積在平均數左右的一個[[標準差]]範圍內。 * 95.449974%的面積在平均數左右兩個標準差2 \sigma的範圍內。 * 99.730020%的面積在平均數左右三個標準差3 \sigma的範圍內。 * 99.993666%的面積在平均數左右四個標準差4 \sigma的範圍內。 * 函數曲線的[[拐點]](inflection point)為離平均數一個標準差距離的位置。 == 性質 == 常態分布的一些性質: # 如果X \sim N(\mu, \sigma^2) 且a與b是[[實數]],那麼a X + b \sim N(a \mu + b, (a \sigma)^2). # 如果X \sim N(\mu_X, \sigma^2_X)與Y \sim N(\mu_Y, \sigma^2_Y)是[[統計獨立]]的常態[[隨機變量]],那麼: #* 它們的和也滿足常態分布U = X + Y \sim N(\mu_X + \mu_Y, \sigma^2_X + \sigma^2_Y) (正态分布随机变量总和|sum of normally distributed random variables|proof). #* 它們的差也滿足常態分布V = X - Y \sim N(\mu_X - \mu_Y, \sigma^2_X + \sigma^2_Y). #* U與V兩者是相互獨立的。(要求X与Y的方差相等) # 如果X \sim N(0, \sigma^2_X)和Y \sim N(0, \sigma^2_Y)是獨立常態隨機變量,那麼: #* 它們的積X Y服從機率密度函數為p的分布 #*:p(z) = \frac{1}{\pi\,\sigma_X\,\sigma_Y} \; K_0\left(\frac{|z|}{\sigma_X\,\sigma_Y}\right),其中K_0是修正貝塞爾函數(modified Bessel function) #* 它們的比符合[[柯西分佈|柯西分布]],滿足X/Y \sim \mathrm{Cauchy}(0, \sigma_X/\sigma_Y). # 如果X_1, \cdots, X_n為獨立標準常態隨機變量,那麼X_1^2 + \cdots + X_n^2服從自由度為''n''的[[卡方分佈|卡方分布]]。 === 中心極限定理 === 常態分布有一個非常重要的性質:在特定條件下,大量'''[[統計獨立]]的隨機變量的平均值的分布趨於正态分布,這就是[[中心極限定理]]'''。中心極限定理的重要意義在於,根據這一定理的結論,其他概率分布可以用正态分布作為近似。 * '''參數為n和p的[[二項分佈|二項分布]],在n相當大而且p接近0.5時近似於正态分布'''。 近似正态分布平均數為mu = n p且方差為sigma^2 = n p (1 - p). * '''一[[泊松分佈|泊松分布]]帶有參數lambda當取樣樣本數很大時將近似正态分布lambda'''. 近似正态分布平均數為mu = \lambda且方差為sigma^2 = \lambda. 這些近似值是否完全充分正確取決於使用者的使用需求。 === 無限可分性 === 正态分布是[[無限可分]]的概率分布。 === 穩定性 === 正态分布是嚴格[[穩定]]的概率分布。 === 標準偏差 === 在實際應用上,常考慮一組數據具有近似於[[常態分佈|常態分布]]的機率分布。若其假設正確,則約'''68.3%'''數值分布在距離平均值有1個標準差之內的範圍,約'''95.4%'''數值分布在距離平均值有2個標準差之內的範圍,以及約'''99.7%'''數值分布在距離平均值有3個標準差之內的範圍。稱為「'''[[68–95–99.7原則|68-95-99.7法則]]'''」或「'''經驗法則'''」。 == 參考文獻 == {{reflist}} [[Category:310 數學總論]]
此頁面使用了以下模板:
Template:Main other
(
檢視原始碼
)
Template:Reflist
(
檢視原始碼
)
模块:Check for unknown parameters
(
檢視原始碼
)
返回「
常態分布
」頁面