2011年6月14日 星期二

《醫生你到底在想啥?》之中華民國曲線(ROC曲線)

●中華民國曲線(ROC curve)



我們可以回頭看剛剛的紅豆綠豆篩檢圖。現在你可以自由移動垂直的那條篩檢線。篩檢線越往左移動代表篩子的網目越小,你可以清楚的看到遺漏的紅豆越來越少(偽陰性率越來越低),被篩選出來的紅豆越來越多(敏感性越來越高)。但是,被誤篩出的綠豆則是越來越多,過濾掉的綠豆越來越少(特異性越來越低)。



相對的,當你篩選線慢慢往右移,也就是使用越來越大網目的篩子時,敏感性越來越低,但特異性卻越來越高(偽陽性率越來越低)。

{###_elleryhuang/7/1024047217.jpg_###}



如果我們分別記錄不同網目大小篩子的敏感性及特異性,就可以得到下面這張敏感性與特異性成負相關的圖(出處:Thomas B. Newman. Evidence-Based Diagnosis。經作者修改過):

{###_elleryhuang/7/1024047221.jpg_###}



從這張圖就可以很容易看出,敏感性越高,特異度也就越低,反之亦然。也就是說,敏感性與特異性,難以兩全。



不過,流行病學家跟統計學家還有我覺得這張圖看起來不太舒服,可能是他們有在玩股票吧!把橫軸座標特異性改成「1-特異性」。「1-特異性」其實就是「偽陽性率」,不過一般不喜歡正式使用這個名詞,因為容易引起混淆。



將橫座標從特異性改成「1-特異性」之後,整個製圖的過程就像下圖一樣(出處:Thomas B. Newman. Evidence-Based Diagnosis, p71。經作者修改過):

{###_elleryhuang/7/1024047220.jpg_###}



最後我們就會得到像下面這樣的圖:

{###_elleryhuang/7/1024047219.jpg_###}



這種圖,統計學上稱之為「接收者操作特徵曲線」(receiver operating characteristic curve)簡稱「ROC曲線」,非官方暱稱為「中華民國曲線」。



其實橫座標不用特異性而用「1-特異性」,也是有其意義的。



1-特異性,也就是偽陽性率。所謂偽陽性,其實就是「雜訊」。前面舉過相機底片的例子,相機底片越敏感(感光度越高),雜訊也就越多。這點從ROC曲線就可以很明顯的看出來。你想要篩出的紅豆,一定也會篩出更多綠豆。



假設今天紅豆及綠豆的大小分佈如下圖(出處:Thomas B. Newman. Evidence-Based Diagnosis。經作者修改過):

{###_elleryhuang/7/1024047224.jpg_###}





也就是說,所有的紅豆都比最大顆綠豆還要大;所有的綠豆都比最小顆的紅豆還要小。這樣我們就可以選擇一個恰當網目大小的篩子,完美的篩選出所有的紅豆而無所遺漏,同時也完美的篩掉所有的綠豆而沒有誤篩到紅豆湯中。這時,敏感性以及特異性都是100%。



在這種情況下,用篩子來從紅豆綠豆中篩檢出紅豆的ROC curve就如同下圖最左上方那條「完美的檢測」曲線一樣(出處:Thomas B. Newman. Evidence-Based Diagnosis。經作者修改過):

{###_elleryhuang/7/1024047222.jpg_###}





相對的,如果紅豆綠豆的大小分佈如下圖(出處:Thomas B. Newman. Evidence-Based Diagnosis。經作者修改過):

{###_elleryhuang/7/1024047223.jpg_###}



也就是綠豆跟紅豆大小分佈型態是完全一樣的,那麼想當然爾,不管你的篩子大小可以篩出所有紅豆之中多少比例的紅豆,你都同時會篩出所有綠豆中同樣比例的綠豆。也就是說,不管你用網目多大的篩子來篩豆子,結果都跟你用手直接隨機抓一把豆子一樣。這時,用大小來篩檢紅豆就是完全無效的。我們可以得到如上圖「根本沒用的檢測」一樣的ROC曲線。



如果像一開始所舉的例子一樣,紅豆大小的平均趨勢要比綠豆還大,但有些最小的紅豆比最大一些綠豆還要小。這時,我們就可以利用大小來篩檢紅豆,以使得篩檢過後的紅豆湯裡面,紅豆跟綠豆的比例較篩檢之前還高;但卻無法完全分離紅豆與綠豆。這時,ROC曲線就會介於完美的檢測與完全沒用的檢測之間。



其中越接近完美檢測的「Γ」型ROC曲線,代表篩檢的效能越高,篩檢後標的物(紅豆)相對於非標的物(綠豆)的比例也會提高較多(紅豆湯比較純)。



而越接近完全沒有用的檢測的「╱」型ROC曲線,代表篩檢的效能越低,篩檢後標的物相對於非標的物的比例只能提高一點點(紅豆湯比較不純)。

2 則留言:

  1. 學長你好

    有關ROC曲線的部份,敏感性對特異性的圖形

    形狀是否應該為凸向上?

    因為如果對照兩個不同區線可發現X值相加並

    不等於1,ROC curve的轉換依照敘述應該

    是沿著Y軸翻轉而非X軸翻轉

    想了很久還是覺得怪怪的,想要問問看

    回覆刪除
  2. 感謝永楨您細心的閱讀與指正



    的確像您說的一樣,我圖畫錯了



    敏感性對特異性的圖形



    形狀應該為凸向上才對



    在這邊也為了這個錯誤跟各位讀者說聲抱歉

    回覆刪除