回歸方程檢視原始碼討論檢視歷史
回歸方程 |
回歸方程是根據樣本資料通過回歸分析所得到的反映一個變量(因變量)對另一個或一組變量(自變量)的回歸關係的數學表達式。回歸直線方程用得比較多,可以用最小二乘法求回歸直線方程中的a,b,從而得到回歸直線方程。
簡介
regression equation
對變量之間統計關係進行定量描述的一種數學表達式。
指具有相關的隨機變量和固定變量之間關係的方程。
回歸直線方程
評價
若:在一組具有相關關係的變量的數據(x與Y)間,通過散點圖我們可觀察出所有數據點都分布在一條直線附近,這樣的直線可以畫出許多條,而我們希望其中的一條最好地反映x與Y之間的關係,即我們要找出一條直線,使這條直線"最貼近"已知的數據點。
因為模型中有殘差,並且殘差無法消除,所以就不能用二點確定一條直線的方法來得到方程,要保證幾乎所有的實測值聚集在一條回歸直線上,就需要它們的縱向距離的平方和到那個最好的擬合直線距離最小。
記此直線方程為(如右所示,記為①式)
這裡在y的上方加記號"^",是為了區分Y的實際值y,表示當x取值xi=1,2,……,6)時,Y相應的觀察值為yi,而直線上對應於xi的縱坐標是
①式叫做Y對x的
回歸直線方程,相應的直線叫做回歸直線,b叫做回歸係數。要確定回歸直線方程①,只要確定a與回歸係數b。
回歸方程的有關量:e.隨機變量 ^b.斜率 ^a.截距 -x.x的數學期望 -y.y的數學期望 R.回歸方程的精確度
回歸直線的求法
最小二乘法:
總離差不能用n個離差之和
來表示,通常是用離差的平方和,即
作為總離差,並使之達到最小,這樣回歸直線就是所有直線中Q取最小值的那一條,這種使"離差平方和最小"的方法,叫做最小二乘法:
由於絕對值使得計算不變,在實際應用中人們更喜歡用:Q=(y1-bx1-a)²+(y2-bx2-a)²+。。。+(yn-bxn-a)²
這樣,問題就歸結於:當a,b取什麼值時Q最小,即到點直線y=bx+a的"整體距離"最小。
用最小二乘法求回歸直線方程中的a,b有下面的公式:
回歸方程的寫法:spss數據表中有非標準係數一欄,這其實就是回歸方程的係數。對應的變量就是和係數相乘。如果有常數項,就不用和變量值相乘。[1]