共線性檢視原始碼討論檢視歷史
共線性是全國科學技術名詞審定委員會審定、公布的科技類名詞。
關於中國文字的起源[1]主要有兩種觀點:起源於刻畫符號和「圖畫文字」起源說[2]。我們現在已知的最早的文字是安陽殷墟出土的甲骨文。
名詞解釋
共線性,即同線性或同線型。統計學中,共線性即多重共線性。
多重共線性(Multicollinearity)是指線性回歸模型中的解釋變量之間由於存在精確相關關係或高度相關關係而使模型估計失真或難以估計準確。
一般來說,由於經濟數據的限制使得模型設計不當,導致設計矩陣中解釋變量間存在普遍的相關關係。完全共線性的情況並不多見,一般出現的是在一定程度上的共線性,即近似共線性。
產生原因
主要有3個方面:
(1)經濟變量相關的共同趨勢。
(2)滯後變量的引入。
(3)樣本資料的限制。
影響
(1)完全共線性下參數估計量不存在。
(2)近似共線性下OLS估計量非有效。
多重共線性使參數估計值的方差增大,1/(1-r2)為方差膨脹因子(Variance Inflation Factor, VIF)如果方差膨脹因子值越大,說明共線性越強。相反 因為,容許度是方差膨脹因子的倒數,所以,容許度越小,共線性越強。可以這樣記憶:容許度代表容許,也就是許可,如果,值越小,代表在數值上越不容許,就是越小,越不要。而共線性是一個負面指標,在分析中都是不希望它出現,將共線性和容許度聯繫在一起,容許度越小,越不要,實際情況越不好,共線性這個「壞蛋」越強。進一步,方差膨脹因子因為是容許度倒數,所以反過來。總之就是找容易記憶的方法。
(3)參數估計量經濟含義不合理。
(4)變量的顯著性檢驗失去意義,可能將重要的解釋變量排除在模型之外。
(5)模型的預測功能失效。變大的方差容易使區間預測的「區間」變大,使預測失去意義。
需要注意:即使出現較高程度的多重共線性,OLS估計量仍具有線性性等良好的統計性質。但是OLS法在統計推斷上無法給出真正有用的信息。
參考文獻
- ↑ 中國漢字是怎樣起源的?源始於殷商?文字有600年的歷史?,搜狐,2022-09-15
- ↑ 揭秘中國最古老的文字是來源圖畫還是記號?,搜狐,2017-06-05