回覆列表
-
1 # spssau
-
2 # 一起學統計工具
ROC曲線的縱座標為敏感度,橫座標為1-特異度,只有當上述兩個指標均為0時,ROC曲線才會經過原點,所列舉的例子是1-特異度為0時,所對應的靈敏度為0.2以上,因此,曲線不經過原點。可訪問如下連結(http://www.navan.name/roc/)檢視不同靈敏度和特異度下ROC曲線變化的動畫。
-
3 # 一起學統計工具
ROC曲線的縱座標為敏感度,橫座標為1-特異度,只有當上述兩個指標均為0時,ROC曲線才會經過原點,所列舉的例子是1-特異度為0時,所對應的靈敏度為0.2以上,因此,曲線不經過原點。可訪問如下連結(http://www.navan.name/roc/)檢視不同靈敏度和特異度下ROC曲線變化的動畫。
ROC曲線圖是反映敏感性與特異性之間關係的曲線。橫座標X軸為 1 – 特異性,也稱為假陽性率(誤報率),X軸越接近零準確率越高;縱座標Y軸稱為敏感度,也稱為真陽性率(敏感度),Y軸越大代表準確率越好。
根據曲線位置,把整個圖劃分成了兩部分,曲線下方部分的面積被稱為AUC(Area Under Curve),用來表示預測準確性,AUC值越高,也就是曲線下方面積越大,說明預測準確率越高。曲線越接近左上角(X越小,Y越大),預測準確率越高。
案例分析
(1)背景
當前進行一項影響“低出生體重兒”的研究,希望研究產婦年齡,產婦體重對於“低出生體重兒”的預測準確率。將低出生體重兒賦值為1,正常出生體重兒賦值為0。
(2)操作步驟
使用路徑:SPSSAU→視覺化→ROC曲線
拖拽分析項到分析框中,放置位置如下圖所示:
右側的數值(分割點)代表變數Y的判斷標準,大於或等於這個標準的數值判斷為“陽性”,小於這個標準的數值判斷為“陰性”。預設判斷數值為1,如果預設數值與判斷標準不符,可手動修改。
*設定不同的數值,會得到不一樣的結果,如果沒有公認的金標準,也可以嘗試設定不同的數值,對比分析找到更佳的預測曲線。
本例中數字1代表低出生體重兒,數字0代表正常兒,所以將分割點設為1。
(3)結果分析
①頻數分析
表1 頻數分析
表1為頻數分析表格,主要來簡單描述Y值的分佈情況。根據上表顯示,低出生體重兒共有130人,正常兒為59人,陽性比例為68.78%,陰性比例為31.22%。
②ROC結果彙總表
表2 ROC曲線結果彙總
表2展示的是根據產婦年齡、產婦體重分別構建的ROC曲線。
AUC代表ROC曲線下的面積,表示預測準確率。AUC值取值在0-1之間,數值越大,代表正確率越高。
根據上表可知,產婦年齡對應的AUC值為0.549,說明產婦年齡對於低出生體重兒的診斷價值比較低。產婦體重對應的AUC值為0.601大於0.05但小於0.7,P=0.025 <0.05,說明雖然產婦體重對低出生體重兒的診斷價值顯著的高於0.5,但診斷價值依舊比較低。
綜合來看,產婦年齡、產婦體重兩個因素對判斷低出生體重兒的診斷價值都比較低。
ROC曲線
從ROC曲線上也可以直觀的看出:曲線沒有靠近左上角,說明診斷的準確性並不高,也就沒有很高的診斷價值。
最佳界值
如果表2的某個因素的AUC值大於0.7說明有較高的診斷價值,此時可透過此表找到最佳界值。最佳界值點也就是ROC曲線最靠近左上角的點。
從上表可以看出:產婦年齡,其最佳界值出現在敏感度為0.277,特異度為0.881時,即在該點時,最靠近左上角,整體最優。針對產婦體重,其最佳界值出現在敏感度為0.785,特異度為0.407時,整體最優。
最佳界值