開啟主選單

求真百科

來自 孔夫子舊書網 的圖片

相關係數是中國的一個科技名詞。

為什麼漢字是方塊字,這個問題雖然沒有明確的考證,但從古人觀察世界的方式中便可窺見一斑。《淮南子·覽冥訓[1]》說:「往古之時,四極廢,九州裂。天不兼覆,地不周載,火炎炎而不滅,水浩洋而不息,猛獸……於是女媧煉五色石以補蒼天,斷鰲足以立四極。」在古人心目中,「天圓地方[2]」,地是方形的,而且在這四方形地的盡頭,還有撐着的柱子。

目錄

名詞解釋

相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變量之間線性相關程度的量,一般用字母 r 表示。由於研究對象的不同,相關係數有多種定義方式,較為常用的是皮爾遜相關係數。

相關表和相關圖可反映兩個變量之間的相互關係及其相關方向,但無法確切地表明兩個變量之間相關的程度。相關係數是用以反映變量之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變量與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變量之間相關程度;着重研究線性的單相關係數。

需要說明的是,皮爾遜相關係數並不是唯一的相關係數,但是最常見的相關係數,以下解釋都是針對皮爾遜相關係數。

依據相關現象之間的不同特徵,其統計指標的名稱有所不同。如將反映兩變量間線性相關關係的統計指標稱為相關係數(相關係數的平方稱為判定係數);將反映兩變量間曲線相關關係的統計指標稱為非線性相關係數、非線性判定係數;將反映多元線性相關關係的統計指標稱為復相關係數、復判定係數等。

應用

概率論

【例】若將一枚硬幣拋n次,X表示n次試驗中出現正面的次數,Y表示n次試驗中出現反面的次數。計算ρXY。

解:由於X+Y=n,則Y=-X+n,根據相關係數的性質推論,得ρXY = − 1。

企業物流

【例】一種新產品上市。在上市之前,公司的物流部需把新產品合理分配到全國的10個倉庫,新品上市一個月後,要評估實際分配方案與之前考慮的其他分配方案中,是實際分配方案好還是其中尚未使用的分配方案更好,通過這樣的評估,可以在下一次的新產品上市使用更準確的產品分配方案,以避免由於分配而產生的積壓和斷貨。表1是根據實際數據所列的數表。

通過計算,很容易得出這3個分配方案中,B的相關係數是最大的,這樣就評估到B的分配方案比實際分配方案A更好,在下一次的新產品上市分配計劃中,就可以考慮用B這種分配方法來計算實際分配方案。

聚類分析

【例】如果有若干個樣品,每個樣品有n個特徵,則相關係數可以表示兩個樣品間的相似程度。藉此,可以對樣品的親疏遠近進行距離聚類。例如9個小麥品種(分別用A1,A2,...,A9表示)的6個性狀資料見表2,作相關係數計算並檢驗。

由相關係數計算公式可計算出6個性狀間的相關係數,分析及檢驗結果見表3。由表3可以看出,冬季分櫱與每穗粒數之間呈現負相關(ρ = − 0.8982),即麥冬季分櫱越多,那麼每穗的小麥粒數越少,其他性狀之間的關係不顯著。

缺點

需要指出的是,相關係數有一個明顯的缺點,即它接近於1的程度與數據組數n相關,這容易給人一種假象。因為,當n較小時,相關係數的波動較大,對有些樣本相關係數的絕對值易接近於1;當n較大時,相關係數的絕對值容易偏小。特別是當n=2時,相關係數的絕對值總為1。因此在樣本容量n較小時,我們僅憑相關係數較大就判定變量x與y之間有密切的線性關係是不妥當的。

參考文獻