回覆列表
  • 1 # 雨過天晴

    Logistic迴歸主要分為三類,一種是因變數為二分類得logistic迴歸,這種迴歸叫做二項logistic迴歸,一種是因變數為無序多分類得logistic迴歸,比如傾向於選擇哪種產品,這種迴歸叫做多項logistic迴歸。還有一種是因變數為有序多分類的logistic迴歸,比如病重的程度是高,中,低呀等等,這種迴歸也叫累積logistic迴歸,或者序次logistic迴歸。

      二值logistic迴歸:

      選擇分析——迴歸——二元logistic,開啟主面板,因變數勾選你的二分類變數,這個沒有什麼疑問,然後看下邊寫著一個協變數。有沒有很奇怪什麼叫做協變數?在二元logistic迴歸裡邊可以認為協變數類似於自變數,或者就是自變數。把你的自變數選到協變數的框框裡邊。

      細心的朋友會發現,在指向協變數的那個箭頭下邊,還有一個小小的按鈕,標著a*b,這個按鈕的作用是用來選擇互動項的。我們知道,有時候兩個變數合在一起會產生新的效應,比如年齡和結婚次數綜合在一起,會對健康程度有一個新的影響,這時候,我們就認為兩者有互動效應。那麼我們為了模型的準確,就把這個互動效應也選到模型裡去。我們在右邊的那個框框裡選擇變數a,按住ctrl,在選擇變數b,那麼我們就同時選住這兩個變量了,然後點那個a*b的按鈕,這樣,一個新的名字很長的變數就出現在協變數的框框裡了,就是我們的互動作用的變數。

      然後在下邊有一個方法的下拉選單。預設的是進入,就是強迫所有選擇的變數都進入到模型裡邊。除去進入法以外,還有三種向前法,三種向後法。一般預設進入就可以了,如果做出來的模型有變數的p值不合格,就用其他方法在做。再下邊的選擇變數則是用來選擇你的個案的。一般也不用管它。

      選好主面板以後,單擊分類(右上角),開啟分類對話方塊。在這個對話方塊裡邊,左邊的協變數的框框裡邊有你選好的自變數,右邊寫著分類協變數的框框則是空白的。你要把協變數裡邊的字元型變數和分類變數選到分類協變數裡邊去(系統會自動生成啞變數來方便分析,什麼事啞變數具體參照前文)。這裡的字元型變數指的是用值標籤標註過得變數,不然光文字,系統也沒法給你分析啊。選好以後,分類協變數下邊還有一個更改對比的框框,我們知道,對於分類變數,spss需要有一個參照,每個分類都透過和這個參照進行比較來得到結果,更改對比這個框框就是用來選擇參照的。預設的對比是指示符,也就是每個分類都和總體進行比較,除了指示符以外還有簡單,差值等。這個框框不是很重要,預設就可以了。

      點選繼續。然後開啟儲存對話方塊,勾選機率,組成員,包含協方差矩陣。點選繼續,開啟選項對話方塊,勾選分類圖,估計值的相關性,迭代歷史,exp(B)的CI,在模型中包含常數,輸出——在每個步驟中。如果你的協變數有連續型的,或者小樣本,那還要勾選Hosmer-Lemeshow擬合度,這個擬合度表現的會較好一些。

      繼續,確定。

      然後,就會輸出結果了。主要會輸出六個表。

      第一個表是模型係數綜合檢驗表,要看他模型的p值是不是小於0.05,判斷我們這個logistic迴歸方程有沒有意義。

      第二個表示模型彙總表。這個表裡有兩個R^2,叫做廣義決定係數,也叫偽R^2,作用類似於線性迴歸裡的決定係數,也是表示這個方程能夠解釋模型的百分之多少。由於計算方法不同,這兩個廣義決定係數的值往往不一樣,但是出入並不會很大。

      在下邊的分類表則表述了模型的穩定性。這個表最後一行百分比校正下邊的三個資料列出來在實際值為0或者1時,模型預測正確的百分比,以及模型總的預測正確率。一般認為預測正確機率達到百分之五十就是良好(標準真夠低的),當然正確率越高越好。

      在然後就是最重要的表了,方程中的變量表。第一行那個B下邊是每個變數的係數。第五行的p值會告訴你每個變數是否適合留在方程裡。如果有某個變數不適合,那就要從新去掉這個變數做迴歸。根據這個表就可以寫出logistic方程了:P=Exp(常量+a1*變數1+a2*變數2.。。。)/(1+Exp(常量+a1*變數1+a2*變數2.。。。))。如果大家學過一點統計,那就應該對這個形式的方程不陌生。提供變數,它最後算出來會是一個介於0和1的數,也就是你的模型裡設定的值比較大的情況發生的機率,比如你想推算會不會治癒,你設0治癒,1為沒有治癒。那你的模型算出來就是沒有治癒的機率。如果你想直接計算治癒的機率,那就需要更改一下設定,用1去代表治癒。

      此外倒數後兩列有一個EXP(B),也就是OR值,哦,這個可不是或者的意思,OR值是優勢比。線上性迴歸裡邊我們用標準化係數來對比兩個自變數對於因變數的影響力的強弱,在logistic迴歸裡邊我們用優勢比來比較不同的情況對於因變數的影響。舉個例子。比如我想看性別對於某種病是否好轉的影響,假設0代表女,1代表男,0代表不好轉,1代表好轉。發現這個變數的OR值為2.9,那麼也就是說男人的好轉的可能是女人好轉的2.9倍。注意,這裡都是以數值較大的那個情況為基準的。而且OR值可以直接給出這個倍數。如果是0,1,2各代表一類情況的時候,那就是2是1的2.9倍,1是0的2.9倍,以此類推。OR值對於方程沒什麼貢獻,但是有助於直觀的理解模型。在使用OR值得時候一定要結合它95%的置信區間來進行判斷。

  • 中秋節和大豐收的關聯?
  • 坐牢的人每天都在監獄裡怎麼充實自己?