杏花開醫(yī)學統(tǒng)計 醫(yī)學統(tǒng)計教程,統(tǒng)計分析服務 SPSS多元線性回歸 分析的操作及結(jié)果解讀 關鍵詞:SPSS 多元線性回歸 上兩期,我們對所有類型的回歸分析了歸納總結(jié),并且詳細講解了SPSS二元Logistic回歸分析的操作及結(jié)果解讀,具體見下方文章及視頻: 回歸分析是統(tǒng)計學的一個重要分支,它基于各個變量的觀測數(shù)據(jù),建立變量之間的因果關系?;貧w分析家族非常龐大,常見的回歸分析有線性回歸、logistic回歸、生存回歸等。 本期我們著重講解回歸家族中多元線性回歸的SPSS操作,同時給出結(jié)果的詳細解讀,并將多元線性回歸的運算結(jié)果繪制成圖形,從而使得結(jié)果更加清晰易懂。大家學會后完全可以運用于自己的數(shù)據(jù)及論文中。 請觀看下方視頻教程 全屏播放請關閉手機中“方向鎖定”,然后將手機橫向放置 (若無法播放,請聯(lián)系客服微信3301888200) 1 案例背景 本期案例的研究目的為:探尋年齡、BMI是否會影響心率。我們搜集了165名正常人的年齡、BMI、心率數(shù)據(jù),數(shù)據(jù)情況如下: 2 SPSS多元線性回歸操作步驟 多元線性回歸小貼士:只要因變量是連續(xù)數(shù)值型變量,無論自變量是連續(xù)型(例如:BMI),還是分類型(例如:家族史、糖尿病),必須選擇多元線性回歸。本次的案例中,自變量年齡和BMI全部是連續(xù)型的,因此直接在SPSS中進行線性回歸即可;如果自變量中有分類型(例如:性別,分為男和女),則需要先對自變量進行虛擬化處理。處理之后才可以進行多元線性回歸,也就是我們常說的虛擬線性回歸(下一期會詳細講解)。 SPSS多元線性回歸操作步驟: 第一步:點擊“分析”→“回歸”→“線性” 第二步:選擇對應的自變量和因變量: 第三步:點擊“統(tǒng)計”→“共線性診斷”→“德賓-沃森”,然后點擊“繼續(xù)” 第四步:點擊“圖”→“ZRESID”選進Y→“ZPRED”選進X 然后點擊“繼續(xù)”,最后點擊確定,SPSS軟件就會輸出多元線性回歸的運算結(jié)果。 2 結(jié)果解讀 “模型摘要表”顯示:R方=0.114,意味著自變量“年齡”和“BMI”可以解釋因變量“心率”變化的11.4%,一般而言,R方在30%以上意味著擬合狀況良好,而實際數(shù)據(jù)分析,10%也是可以接受的。 “系數(shù)”表顯示:年齡顯著負向影響心率,影響系數(shù)為-0.184<0,且顯著性P=0.000<0.05,意味著年齡越大,心率越小;BMI顯著正向影響心率,影響系數(shù)為0.744>0,且顯著性P=0.005<0.05,意味著BMI越大,心率越大; 基于“系數(shù)表”的結(jié)果,得出回歸方程: 心率=65.788-0.184*年齡+0.744*BMI 線性回歸模型的診斷: 線性回歸模型運算結(jié)果的分析非常簡單,但是線性回歸模型的診斷則是非常復雜的過程。線性回歸模型的運算有幾個前提條件: 1、樣本獨立:即165個樣本之間不會相互干擾; 2、殘差正態(tài):模型的殘差服從正態(tài)分布; 3、自變量不存在多重共線性:自變量之間不存在極強的相關關系; 只有滿足了以上三個條件,那么之前得出的線性回歸結(jié)果才是準確可靠的。 ①樣本獨立性的判別: DW值在2附近,意味著樣本獨立,本案例的DW<2,但是偏差也不是很大,存在輕微的非獨立性,但是影響不大,不會太影響回歸結(jié)果的準確性。 ②殘差正態(tài)的判別: 上圖中,黑色曲線為正態(tài)曲線,而黃色柱子的輪廓遠遠高于正態(tài)曲線,意味著本次模型的殘差不服從正態(tài)分布。 出現(xiàn)這種情況的主要原因是模型擬合度R方不高。自變量只能解釋因變量變異的11.4%,解決這個辦法的問題是還要再多加入幾個自變量,提升模型的擬合度,那么殘差就會接近正態(tài)分布。至于再加什么樣的自變量,還需要大家根據(jù)自己的專業(yè)知識考察,加入一些極有可能會影響“心率”變化的自變量。 ③自變量不存在多重共線性的判別: VIF值小于5,意味著變量之間不存在多重共線性,不會影響回歸結(jié)果的準確性。 對于經(jīng)濟類數(shù)據(jù),關聯(lián)性本來就很強,這是這個行業(yè)決定的,因此有些經(jīng)濟類數(shù)據(jù),VIF的臨界點可以放寬到30多,都認為不存在多重共線性。 綜合以上的線性回歸模型的診斷可以得出:回歸模型的結(jié)果基本準確??梢曰谶@個結(jié)論給出相關的對策建議。 最后,以上回歸模型的結(jié)果可以Graphpad prism繪圖進行可視化處理: 上圖是通過Graphpad Prism軟件繪制的,詳細教程: 上圖可以清晰看到,年齡對心率是負向影響,而BMI對心率是正向影響。其中,年齡散點有點散亂,有可能是導致R方不高的原因。 本期課程就到這里,我們將每周推出更多、更實用的醫(yī)學統(tǒng)計教程,提供醫(yī)學統(tǒng)計相關服務。涵蓋醫(yī)學科研設計、數(shù)據(jù)統(tǒng)計分析、SPSS、Meta、GraphPad、SAS、R、Eexel等,歡迎大家關注!感謝大家的觀看,下期再見! |
|
來自: 勇敢向前探索 > 《統(tǒng)計學》