2011年7月7日 星期四

《醫生你到底在想啥?》之概似比(likelihood ratio)

●概似比(likelihood ratio)



為什麼經過是當網目大小的篩子篩選過後,篩子裡的紅豆比例會提高呢?



為什麼我們知道乳房攝影的結果是陽性之後,就會提高病人有乳癌的可能性呢?



為什麼我們知道一個人有喉結之後,就會提高他是男性的可能性呢?



為什麼我們知道一個人穿裙子之後,就會提高她是女性的可能性呢?



為什麼我們聽到放羊的孩子(在還沒有發現他愛說謊之前)大喊狼來了之後,就會覺得狼來了呢?



因為平均來說紅豆比綠豆大,也就是說,在所有紅豆裡面大過篩子網目的紅豆的比率(真陽性率,即敏感性),比所有綠豆裡面大過篩子網目的綠豆的比率(偽陽性率,即1-特異性,即雜訊)還高。



因為有乳癌的乳房比沒有乳癌的乳房還要有可能乳房攝影看起來像乳癌。也就是說,在所有乳癌的病人裡面,乳房攝影陽性的比率(敏感性),比所有非乳癌者裡面乳房攝影陽性的比率(1-特異性)還高。



因為男性相對於女性有比較高的比率有喉結,因為女性相對於男性有比較高的比率穿裙子。



因為狼來了的時候牧童比較可能喊狼來了(真資訊),狼沒來的時候牧童比較不可能喊狼來了(假情報)。



複習一下之前學過的ROC曲線。我們知道一個有用的檢測資訊,其ROC曲線一定要比「完全沒用的檢測資訊的『╱』型ROC曲線」還要左邊。



這是因為「╱」型ROC曲線代表這個檢測的敏感性(真陽性率)等於「1-特異性」(偽陽性率),也就是有用的資訊跟雜訊一樣多,因此這個檢測資訊一點用也沒有。



我們篩紅豆的時候,我們當然希望比篩子大的紅豆佔所有紅豆比率(敏感性)越高越好,同時也希望比篩子大的綠豆佔所有綠豆比率(1-特異性)越低越好。



乳癌的病人乳房攝影陽性的比率越高越好,沒乳癌的人乳房攝影最好不要陽性。



狼來了的時候牧童最好用力喊狼來了,狼沒來的時候牧童最好不要亂喊。



也就是說,我們希望真資訊越多越好,假情報越少越好。



因此,我們就可以使用「敏感性」(真陽性率,即真資訊)比上「1-特異性」(偽陽性率,即假情報)的比例,來評估一項檢測資訊的有用程度。這個比例,我們就稱之為「概似比」(likelihood ratio)(概似比事實上就是ROC曲線上任一點的斜率),如下圖:

{###_elleryhuang/7/1024047248.jpg_###}



likelihood ratio翻譯成「概似比」也是很怪,原因同樣是因為如果翻成「可能性」的話,會跟之前提過的「機率」還有「勝算比」搞混。這是因為中文的「可能性」一詞包含了英文probability、odds以及likelihood三個概念。



我們回到原本的貝氏公式:

{###_elleryhuang/7/1024047249.jpg_###}



前面大費周章的介紹了直覺上比較容易理解的「勝算比」以及「概似比」的概念,當然就是希望能將這個公式改為利用到勝算比及概似比的公式,以便於理解。



我們想要用事前勝算比來代替事前機率;用事後勝算比來代替事後機率。



我們可以用2×2表格來作小抄,不過為了要讓你練習一下剛剛所教的概念,所以這裡我將表格化繁為簡:

{###_elleryhuang/7/1024047250.jpg_###}



這裡要利用到在2×2表格裡一直出現,卻一直沒有用到的四個小a、b、c、d,這樣才比較容易解釋。



利用小abcd來表達:

{###_elleryhuang/7/1024047251.jpg_###}



{###_elleryhuang/7/1024047252.jpg_###}



{###_elleryhuang/7/1024047253.jpg_###}



{###_elleryhuang/7/1024047254.jpg_###}



我們發現,事後勝算比,居然就剛好等於「事前勝算比」乘以「概似比」:



事後勝算比 = 事前勝算比 × 概似比





這個公式就非常符合我們的直覺了。



事後勝算比,也就是我們在得知一個新訊息、新證據、新檢測結果的情況下所認為某件事發生的可能性(odds),會等於我們原本認為這件事發生的可能性(事前勝算比)乘以這個新資訊的「強度」(概似比)。



而一個資訊的真陽性率越高(真資訊越多),偽陽性率越小(雜訊越少),其佐證的強度也越強。



放羊的孩子說實話的機率越高,說謊話的機率越小,他的話也就越可信。



我們在日常生活中,不正是這麼評估資訊可信度的嗎?





再用放羊的孩子來舉例,假設在平常的日子裡,一天有狼來,大概會有三天沒有狼來,所以,狼來了的事前勝算比就是( 1 )/( 3 )。(事前機率是( 1 )/( 1+3 )=25%)



每次狼來的時候,牧羊童有90%的機率覺得需要村民幫忙,會喊狼來了(敏感性=90%);在狼沒來的時候,牧羊童有15%的機率,想要耍一耍村民,會喊狼來了(偽陽性率,1-特異性=15%)。所以用「聽到喊狼來了」來判斷「狼真的來了」的概似比,就是( 90% )/( 15% )=6



所以,事後勝算比 = 事前勝算比 × 概似比

= ( 1 )/( 3 ) × 6

= 2



事後勝算比等於2,也就是說,在聽到牧羊童喊狼來了的條件下,狼真的來了的機率大概是狼沒有來的機率的2倍。



換算成事後機率,就是 ( 2 )/( 2+1 )=66.7%。



用事前機率與概似比來計算事後勝算比的公式,相較於計算事後機率的公式,除了直覺上容易理解之外,計算上也非常方便──因為根本用不著計算。



雖然事後勝算比的公式直覺上比較容易理解,但在實際上,我們還是比較習慣使用「事前機率」(疾病盛行率)的概念,來計算「事後機率」(陽性檢測值)。



但這種計算需要用到敏感性及特異性兩個數據,還要使用

{###_elleryhuang/7/1024047255.jpg_###}這樣一個複雜又難記的公式。



還好,偉大的統計學家,綜合了計算機率的公式以及計算勝算筆的公式,發明了一個計算用的圖表,可以讓我們快速的利用「事前機率」以及「概似比」,得出「事後機率」的數值。



這個圖表就叫做「概似比計算圖表」(Likelihood Ratio Nomogram):

{###_elleryhuang/7/1024047225.jpg_###}



圖表左邊是從0.1%到99%的事前機率(prior以及posterior probability是數學上的名詞,在醫學上則特稱為pre-test及post-test porbability,因為醫學主要是利用各種檢測(test)來作為新資訊)。



中間則是各種大小的概似比。



只要在某一事前機率上,畫一條穿過某一概似比的直線,就能對照出事後機率。



用我們剛剛牧羊童的數據作例子,事前機率是25%,概似比是6,我們就畫一條通過兩者的線:

{###_elleryhuang/7/1024047226.jpg_###}



就可以在右邊的事後機率尺之中,得出接近66.7%的事後機率了。



你可能會覺得奇怪,概似比怎麼可能會比1還小呢?



其實剛剛所介紹的概似比,應該稱為「陽性概似比」(positive likelihood ratio)。也就是在新資訊為「陽性」的情況下,改變事前勝算比的程度。



我們之前都只有討論聽到喊狼來了、有喉結、有穿裙子、乳房攝影為陽性的情況,事前機率如何轉變為事後機率。



但卻沒有討論到沒聽到喊狼來、沒有喉結、沒穿裙子、乳房攝影為陰性的情況,要如何計算事後機率。



在新資訊為陰性的條件下,我們只要把貝氏公式裡面的「B」都改為「非B」就可以了:

{###_elleryhuang/7/1024047259.jpg_###}



在醫學上,若檢測結果為陰性,當然會降低檢測前所認為的罹病機率;而知道檢測結果為陰性之後罹病的機率,就稱為「陰性檢測率」(negative predictive value)。



陰性檢測率實際的公式,就交給各位讀者利用2×2表格來推導了。



我們這裡把重點擺在「概似比」上面。



這是因為,檢測結果為陰性的情況下,計算事後勝算比的公式,就跟檢測結果為陽性一模一樣,都是:



事後勝算比 = 事前勝算比 × 概似比



只不過,正如剛剛所說,若檢測結果為陽性,我們稱概似比為「陽性概似比」;陽性概似比一定大於1,因為一個有用的資訊一定會提高事前勝算比。



若檢測結果為陰性,則稱概似比為「陰性概似比」(negative predictive value);陰性概似比一定小於1,因為在一個有用的資訊為陰性的條件下,事後勝算比一定會比事前還低。



沒有喉結的人,是男性的機率一定比較低;沒穿裙子的人,是女性的機率一定比較低;乳房攝影結果陰性的人,得乳癌的機率一定比較低;沒聽到喊狼來了,狼來了的機率一定比較低。



至於陰性概似比的公式,也交給各位讀者利用2×2表格來練習了。





我們只需要知道,在概似比計算圖表中間,小於1的概似比,就是陰性概似比,是用來計算在新資訊或檢測結果為陰性的情況下,事後機率為多少。





最後,陽性概似比以及陰性概似比最重要的貢獻,就是讓醫生知道一個檢測結果可以用來「確認」(rule in)一個疾病,還是「排除」(rule out)一個疾病。



實際臨床上,醫生的腦袋不可能記得每一個疾病的盛行率,也不可能記得每一項檢測的陽性及陰性概似比。



醫生只能憑經驗及知識,將一個人是某個疾病的事前機率大略歸為「很有可能」、「中等可能」、「不太可能」。



在這種情況下,學會應用概似比的大原則就很重要了。



大原則是這樣的:若陽性概似比超過10,則陽性的結果可以用來「確認」一個事前機率「很有可能」或「中等可能」的疾病,使其事後機率達到一般的治療閾值,以確立診斷。



但如果事前機率就是「不太可能」,則就算一項檢測的陽性概似比超過10,其陽性結果也無法用以確認診斷。最好的例子就是乳房攝影篩檢了!



至於陰性概似比,若小於0.1,則陰性的結果可以用來「排除」一個事前機率「中等可能」或「不太可能」的疾病,使其事後機率小於檢測閾值,以排除該診斷。



但如果事前機率就已經「很有可能」了,則就算一項檢測的陰性概似比小於0.1,其陰性結果也無法用以排除診斷。





無論是計算事後機率的公式,還是計算事後勝算比的公式,都屬於貝氏機率理論。



無論是Google自動駕駛車、博客來網路書店、臉書,還是各種人工智慧產品,主要都是利用了貝氏機率理論,來計算各種機率。





學會了貝氏機率理論,及其在醫學上的應用,以及學會敏感性、特異性、陽性檢測率、概似比等概念之後,我們就可以繼續來看看,臨床醫師是怎麼藉由詢問病史、做理學檢查、安排實驗室及影像學檢測,以獲得各種不同陽性或陰性概似比的資訊,以調整事前機率為事後機率,最終達到超過治療閾值以確診,或低於檢測閾值以排除的過程。

2 則留言:

  1. 黃醫師您好
    閱讀您的文章受益良多!
    想請問文中的示意圖沒有辦法顯示(顯示為{###_elleryhuang/7/1024047259.jpg_###}),能不能請您提供相簿的連結或者有其他另外顯示的方式,非常謝謝!

    回覆刪除