2011年6月9日 星期四

《醫生你到底在想啥?》之千金難買早知道……嗎?

你寧願得到一千美元,或是一次免費的全身電腦斷層掃瞄?在某個隨機訪問五百位美國人的電話調查中,百分之七十三的受訪者表示他們會選擇電腦斷層掃瞄……我寧願選擇付一千美元,避免接受這種篩檢——並安心地好好活著。

——捷爾德‧蓋格瑞澤(Gerd Gigerenzer,德國柏林普朗克人類發展研究院適應行為與認知中心主任)





這是一則發生在美國的真實故事。丹尼爾醫師眼前的這位老先生,徬徨地盯著他,希望丹尼爾醫師能夠告訴他,究竟該不該做PSA檢測?所謂PSA檢測,是測量男性血液中的攝護腺特異抗原(Prostate Specific Antigen),希望能早期發現攝護腺癌。因為攝護腺癌「通常」會製造出PSA,使得血中的PSA濃度升高。



沒想到,丹尼爾醫師卻堅定地告訴老先生:「根據我的專業知識,PSA檢測給你帶來的好處並不會大於壞處,因此我不建議你做這項檢測。」



後來,這位老先生被查出罹患攝護腺癌,而丹尼爾醫師,則因為他的「醫療疏失」而吃上官司,最後,丹尼爾醫師所任職的教學醫院必須賠償一百萬美元。(Gerd Gigerenzer 2009.半秒直覺)



丹尼爾醫師真的錯了嗎?



什麼是醫學篩檢?



故事中的PSA檢測,是一種醫學篩檢。什麼是醫學篩檢呢?我們可以用篩紅豆的例子來理解。



今天我要煮一鍋紅豆湯,但在拿紅豆的時候,不小心把紅豆和綠豆混在一起了,面對著眼前這鍋混雜在一起的紅豆與綠豆,我要怎麼樣揀選出我要的紅豆,順利煮出一鍋紅豆湯呢?



當然,我可以憑著愚公移山的精神,一顆一顆用眼睛分辨是紅豆還是綠豆,用手工揀選出紅豆來。這麼做,就可以一顆紅豆也不遺漏地煮出一鍋純粹只有紅豆的紅豆湯──但是這麼做太浪費時間了!有沒有其他方法,可以快速地篩選出紅豆呢?



用篩子!



一搬來說,紅豆比綠豆大,因此,我們可以選用適當大小的篩子,將紅豆給篩出。而這個過程,就叫做「篩檢」(screening)。



{###_elleryhuang/7/1024047217.jpg_###}







以上圖的例子來看,紅豆綠豆各有37顆,而平均來講,紅豆比綠豆還大顆。但是,我們可以看到,並不是所有的紅豆都一樣大,也不是所有的綠豆都一樣小。紅豆及綠豆的大小分別呈現常態分佈。因此,若我們以圖中垂直線所劃分出來的大小來篩檢紅豆,就會有兩顆比篩子孔還小的紅豆被我們遺漏了(不該被篩掉而被篩掉,即偽陰性);同時,也會有八顆比篩子孔還大的綠豆被我們誤篩出來(不該被篩出而被篩出,即偽陽性)。經由這次篩檢,我浪費了兩個紅豆,且煮出來的紅豆湯中,混雜了八顆綠豆。我們要怎麼樣表示這次篩檢的成果呢?



我的目的是要盡量篩檢出紅豆來,在這次篩檢中,總共37顆紅豆,篩檢出了35顆(真陽性),我們可以說,這次篩檢對於紅豆的「敏感度」(sensitivity)為35除以37,也就是94.6%。敏感度越高,代表可以篩出越高比例的紅豆來;相對來說,低的敏感度,代表篩出篩檢對象的成效不彰。



除了盡量篩檢出紅豆來以外,同時也得盡量將我所不想要的綠豆給篩掉,在37顆綠豆當中,有29顆正確地被我篩掉了(真陰性),我們可以說,這次篩檢對於綠豆的「特異度」(specificity)為29除以37,也就是78.4%。特異度越高,代表能越正確地將欲篩除的目標過濾掉。



好,現在我們來到實際的臨床決策情形。今天有一位健健康康、沒任何乳房症狀的50歲女性,為了提早篩檢出自己是否有乳癌,而做了「乳房攝影」。針對40歲以上女性使用乳房攝影來篩檢乳癌,其敏感度約75.6%,特異度約94.9%。(Kavanagh AM 2000. The sensitivity, specificity, and positive predictive value of screening mammography and symptomatic status. Journal of Medical Screening)這位女性的檢查結果為陽性,即乳房攝影看起來像是乳癌,那麼,這位女性真正有乳癌的機率是多少?75.6%嗎?錯!94.9%嗎?也錯!答案是,不知道!



回到我們簡單的豆子圖,上面雖然介紹了敏感度以及特異度的概念,但這兩個概念都是經由事後計算篩選結果,統計分析而得到的。在實際篩選紅豆的過程中,我們最需要知道的資訊是:所篩出來的豆子中,有多少是紅豆?以圖中的例子來看,總共篩出了43顆豆子,其中有35顆是我想要的紅豆,也就是說,在我最後所煮的紅豆湯中,紅豆所佔的比例是81.4%,這個概念,就叫做「陽性檢測率」(Positive predictive value)。陽性檢測率的大小,會隨著篩檢對象的相對族群比例而改變。例如,若我們將圖中的每一顆紅豆都當成是十顆紅豆,那麼所篩出的紅豆就會變成350顆,而誤篩出的綠豆還是八顆,所以,所有篩選出的豆子中,真正是紅豆的比率,也就是陽性檢測率,就提高到97.8%(350/358)。



在乳癌的例子中,乳癌盛行率(prevalence,具有某疾病者在整個族群中所佔有的比率)大約是千分之6.8,計算後可得陽性檢測率為9.2%,因此,這位女性有乳癌的機率,從原本的千分之6.8,因為乳房攝影結果為陽性,而上升到9.2%。



同樣的檢測工具,敏感度以及特異度通常是固定的,因此,醫學上評估某種篩檢工具的成效如何,看的就是這個篩檢工具的敏感度以及特異度。但是,在臨床實際的篩檢過程中,更重要的卻是結合敏感度、特異度,以及篩檢對象的疾病盛行率去評估陽性檢測率,這樣我們才能得到一個真正有用的訊息──若是篩檢結果為陽性,那麼真正得病的機率是多少?



但是,真正的臨床篩檢,並沒有這麼單純。



回到開頭的故事,丹尼爾醫師為何冒著吃上官司的風險,建議病人不要做PSA攝護腺癌篩檢?



理由一:假陽性



如同前面對醫學篩檢的介紹,我們知道,篩檢一定會有假陽性的存在。那為什麼我們要「篩檢」癌症,而不直接「診斷」癌症?因為癌症的診斷通常需要組織學的病理診斷──簡單的說,就是用一根粗粗的針,挖你身上的一塊組織,再放到顯微鏡下看看這些組織細胞是不是長得惡形惡狀的癌症。而因為我們都不想變得千瘡百孔──讓醫師在我們身上所有可能長癌症的地方挖一塊組織下來檢查,所以只得使用各種「非侵入性」的癌症篩檢工具,來提早發現癌症,例如上述篩檢攝護腺癌的PSA抽血檢測、篩檢乳癌的乳房X光攝影,或是篩檢子宮頸癌的子宮頸抹片檢查。



只要是篩檢,就無可避免會有假陽性產生。在大部份的癌症篩檢中,所有篩檢為陽性的病人,接著就是進行組織學的確診──在你身上挖一塊肉。在上述乳房攝影的例子當中,陽性檢測率只有百分之9.2,也就是說,每篩檢出一個乳癌的病人,就有九個健健康康的人要無緣無故地被挖上一塊乳房組織!



理由二:過度診斷(overdiagnosis)及過度治療(overtreatment)



醫學篩檢,還有個比篩紅豆還複雜的問題。所謂假陽性,就是事實上沒有癌症,卻被懷疑有癌症而必須做進一步侵入性檢查的病人。而真陽性呢?那些被篩檢出為癌症,並且在後續的組織學病理檢查中確診為癌症的病人,就真的是癌症嗎?沒錯,組織學確診為癌症的病人,當然就是癌症,只是,這個癌症的概念,可能與原本的概念不同了。



在癌症篩檢出現以前,醫生們只能等到癌症在病人身體造成症狀,甚至是造成死亡,再對其進行組織學的檢查或大體解剖,以確診為癌症。接著,醫生們再研究這些癌症的各種特性,例如造成的症狀、五年存活率、治療方法、治癒率等等,最後形成各種癌症的概念及描述。



但是,在癌症篩檢出現之後,醫生們藉由癌症篩檢,發現了許多沒有造成症狀的癌症,那麼,我們能保證這些經由篩檢發現的無症狀癌症,跟原本研究的癌症特性是一樣的嗎?答案是,不行。



最知名的例子,就屬攝護腺癌了。根據美國的研究報告指出,男人一生得攝護腺癌的機率高達60~70%!而其中只有1/30的患者會死於攝護腺癌,另外,大部份的攝護腺癌是不會造成任何症狀的(Brawley OW 2009. “Screening for Prostate Cancer” CA: A Cancer Journal for Clinicians)!可惜的是,我們並沒有辦法分辨出哪些攝護腺癌會造成症狀甚至死亡,哪些是無害的。但是,我們發現,經由篩檢而後診斷出來的攝護腺癌,有較高比例的病人,具有無害的病灶,並不會造成症狀以及死亡。



利用下圖來解釋。圖中紅線條為成長速度快的腫瘤,藍線為成長速度慢的腫瘤。如圖所示,三個成長速度快的腫瘤之中,有兩個在篩檢前就已經造成症狀並且診斷出來,只有一個能被提早篩檢出來。而在三個成長速度慢的腫瘤之中,有兩個被篩檢出來。這是因為成長速度慢的腫瘤,其從發病到出現症狀的「無症狀帶病期」比成長速度快的腫瘤還要長,而所謂「無症狀帶病期」,就是我們篩檢的目標。因此,在一個隨機的時間點進行篩檢,便會有較高的機率篩檢出成長速度較慢、對病人較無害的腫瘤。這在流行病學上稱為「長度-時間偏差」(Length-time bias)。



{###_elleryhuang/7/1024047218.jpg_###}







這種將許多無害的病灶診斷為傳統惡性病灶疾病概念的行為,就叫做「過度診斷」。而對於這些過度診斷的病人進行治療,則是「過度治療」。2009年,《英國醫學雜誌》所發表的一篇統計英國等七個地區乳房攝影篩檢的結果指出,大約每三個經由乳房攝影篩檢而後診斷出來的乳癌病人,就有一個是過度診斷,而後進行過度治療(Jørgensen KJ 2009. Overdiagnosis in publicly organised mammography screening programmes: systematic review of incidence trends. BMJ)。



治療有什麼不好呢?以攝護腺癌為例,不論是化療還是手術切除,都有很高的比例會造成病人產生性無能、尿失禁等副作用,而對75歲以上的老人進行攝護腺切除手術,甚至還有1%的機率會導致死亡(Brawley OW 2009. “Screening for Prostate Cancer” CA: A Cancer Journal for Clinicians)。



理由三:篩檢所造成的傷害



醫學篩檢屬於醫療介入,因此也和任何醫療介入一樣,都有可能對病人產生傷害。例如乳房攝影會使病人暴露於X光之下,可能造成細胞傷害。另外,對於肺癌篩檢的研究也指出,頻繁地以胸部X光篩檢肺癌的對象,比起以較低頻率篩檢的對照組來說,死於肺癌的比例竟然比較高(Manser R. Screening for lung cancer. Cochrane Database of Systematic Reviews 2004)!雖然造成此一現象的原因尚未明朗,但至少這個研究直接有力地證明了,某些癌症篩檢可能帶給人們壞處大於好處!



To screen, or not to screen. That is a question.



所以,癌症篩檢給我們的壞處大於好處,我們應該對所有的癌症篩檢敬而遠之嗎?切記,在倒髒洗澡水的時候,不要連嬰兒也給一起倒掉了!



誠如以上所說,癌症篩檢有許多潛在的壞處,但其帶給我們的好處顯而易見──早期發現,早期治療。癌症篩檢沒有絕對的好或不好,一切只看我們怎麼去運用。並且,癌症這個概念事實上是由子宮頸癌、肝癌等各式各樣的癌症所集合而成的一個概念。事實上,每一種癌症各自有著不同的特性;甚至,各個癌症底下還可以依照許多不同的分期、病理學型態,以及患病者的種族、危險因子等等,來分成不同的族群對象。而針對不同的族群對象,使用癌症篩檢所產生的利弊得失都是不同的,必須依靠良好的研究證據來選擇是否該篩檢。這就是近十幾年來風行全球醫界的「實證醫學」觀念。例如,對於攝護腺癌的PSA篩檢以及對於乳癌的乳房攝影篩檢是否好處大於壞處,還存在爭議,但像是子宮頸癌的子宮頸抹片篩檢,雖然還沒有最高等級的隨機臨床對照試驗證據,但許多間接證據使得目前醫學界認為子宮頸抹片篩檢是對婦女有益的。



回頭來看我們的丹尼爾醫師。丹尼爾醫師秉持著實證醫學的精神,以病人的利益為優先考慮,根據現有的證據,做出了不建議進行PSA攝護腺癌篩檢的建議,沒想到最後的結果,卻是吃上官司,甚至敗訴。類似的事情一再發生,導致醫生們被迫行使「防衛性醫療」──為了防止身陷醫療糾紛的訴訟,而採取消極卻非對病人最有益的醫療行為。



想像一下今天有人給你一個幾個不同網目大小的篩子,要你在混雜的紅豆綠豆之中,篩出紅豆來煮紅豆湯。但是,只要你遺漏了一顆紅豆,這顆紅豆就會爆炸把你給炸死!



所以你為了避免自己死掉,就選擇網目很小很小的篩子來篩豆子,以免漏篩紅豆把自己給炸死。



雖然你避免了自己因為漏篩紅豆而炸死,但廚房卻傳來爆炸的聲音,原來如果有綠豆被混到紅豆湯裡面煮,也會爆炸!



你心裡只想,關我屁事,反正我不要漏篩紅豆被炸死就好了,反正喝紅豆湯的也不是我!難道我真的有那麼偉大可以為了拯救別人被綠豆炸死而選擇讓自己被紅豆炸死?



同樣的,如果社會以及司法只會結果論的給沒有提早篩檢出疾病的醫生坐牢或者傾家蕩產的懲罰,那醫生為了自保也只得盡其所能的避免遺漏診斷,只得無奈的犧牲病人的利益了。



其實你算幸運的了,雖然大家都很聰明的使用網目很小的篩子,以避免漏篩紅豆而把自己炸死,但總是有少部分的人運氣不好,因為沒有篩到生下來就是那麼小顆的紅豆而被炸死。



到最後,你想還會有人要做篩紅豆的工作嗎?



這也就是當今台灣醫學系的錄取分數一反常態的被牙醫系給超越的主要原因。也是台灣淪落到快找不到婦產科醫師接生,中部某醫學中心小兒科沒有住院醫師只有實習醫師值班的原因。





●敏感性、特異性,難以兩全其美



像上面怕遺漏紅豆炸死自己的人一樣,選擇較小網目的篩子來篩豆子,就可以把所有紅豆之中,較大比例的紅豆給篩選出來,也就是敏感性會比較高。這樣也就可以達成你的目的,讓遺留下來的紅豆佔所有紅豆的比例比較少,也就是(1-敏感度)或偽陰性率會比較低。



但是,用較小網目的篩子來篩豆子,代價就是在所有的綠豆之中,成功被篩掉的比例降低了,也就是特異性被犧牲而比較低。也可以說是有比較高比例的綠豆會被誤篩出來,也就是(1-特異性)或偽陽性率會比較高。



就好像相機底片一樣,有不同的「感光度」。感光度的英文叫sensitivity,也就是敏感性了。在室內比較暗的時候,選擇比較高的感光度,例如ISO400,可以讓相機對光比較敏感,就可以用比較短時間的快門,相片也比較不會糊掉。但是,高感光度卻也讓雜訊增多,讓照片看起來比較粗糙。

沒有留言:

張貼留言