2011年6月30日 星期四
《醫生你到底在想啥?》之除了刷牙、賣羊奶以外,另一位偉大的貝氏
我們用「P( )」來代表括弧內事情的機率,A帶表是女性,B代表有留長髮。
所以,P(A)就是「事前機率」(總體女生人口比率),P(B)為「新資訊為陽性的機率」(整體留長髮的機率),P(A∣B)則是知道B資訊(留長髮)後,A(是女生)的機率,也就是「事後機率」。P(B∣A) 是所有女性(A)當中,留長髮(B)的機率,也就是「敏感性」。
例如,我們已經知道如何利用「留長髮」的資訊,來計算一個台灣人「是女人」的機率:
{###_elleryhuang/7/1024047238.jpg_###}
就可以簡化成:
{###_elleryhuang/7/1024047239.jpg_###}
(最後一步只是調整公式成一般習慣的寫法而已)
這裡上面介紹到這裡的一系列討論,都是在說明如何在獲得新資訊(乳房攝影結果、留長髮、穿裙子、有喉結)的條件之下,將我們原本對某一事件(乳癌、是男人、是女人)發生的機率,也就是「事前機率」,調整為一個新的發生機率大小,也就是「事後機率」。
這整套方法,都起源自十八世紀一位神父數學家,貝氏(Reverend Thomas Bayes, 1702-61)。
而{###_elleryhuang/7/1024047258.jpg_###}
這個公式,就是貝氏理論最重要的一條。
這個公式看起來很好記,不過如果真的硬背的話,卻是怎麼背怎麼忘。
其實,只要會使用行病學統計學最重要的那張2×2表格,這個公式就非常簡單了。
前面介紹乳癌篩檢的陽性檢測率,其實就是「事後機率」在醫學應用上的特殊名稱。所以我們就來看看剛剛計算陽性檢測率的2×2表格。
{###_elleryhuang/7/1024047240.jpg_###}
接著,我們把它改造成「將A事發生的機率(即事前機率P(A))在獲得新資訊B的條件下,改變為事後機率(P(A∣B))」的一般形式:
{###_elleryhuang/7/1024047241.jpg_###}
再複習一次,P(B∣A)也就是所有A事件中,其資訊B為陽性的機率,我還是喜歡用「敏感性」這個名字。因為要我們非數學專業的華語使用者去理解數學代號,總是沒那麼直覺,因此不利於思考。
由此表格可明顯看出,在獲得「B為陽性」這個新資訊之後,A發生的機率,即事後機率就等於:
{###_elleryhuang/7/1024047242.jpg_###}
消去分子分母的「總數」,並化為代號,就得到{###_elleryhuang/7/1024047258.jpg_###}
這個重要的公式了。
由這個公式,我們可以看出,事後機率分別與分子的「敏感性」及「A的機率」(事前機率)各成正比;又與分母的「B的機率」成反比。
用實際上的狀況來舉例,就非常好理解了。
大家都聽過「牧羊的孩子」這個故事吧!
故事中,牧羊的孩子出於好玩,就亂喊「狼來了!」。看到村民誤以為真的有狼,而全體出動,幫忙保護羊群,牧羊的孩子心裡覺得真好玩。但隨著牧羊的孩子越完越多次,村民就再也不相信「狼來了!」的情報是真的代表狼來了!
在這個故事中,主要講的就是「利用『喊狼來了』這個新資訊,來推測狼是不是真的來了。」
其中「平常時候狼出沒」的頻率,就是「事前機率」P(A)。
「喊狼來了」的頻率,就是B的機率P(B)。
而「在狼真的來了的情況之下,喊狼來了」的頻率,就是P(B∣A),也就是「喊狼來了」對於推估「狼真的來了」的敏感性。
今天假設你是村民,你聽到山上放羊的孩子大喊「狼來了!」,你會有多相信狼真的來了呢?
第一,如果平常狼出沒的頻率越高,那你應該越會覺得這次狼來的機率也很高。所以我們從直覺推理出事後機率與「事前機率」成正比。
第二,如果你以前也當過牧羊童,你知道身為牧羊童,如果真的看到狼來了,幾乎都會喊「狼來了」,這種經驗也會加深你覺得這次狼來了是真的的感覺。也就是說,事後機率還與「敏感性」P(B∣A)成正比。
第三,如果別人跟你說這個牧羊的小孩三天兩頭就在喊狼來了,那就會讓你降低狼真的來了的可能性。也就是說,事後機率與「新資訊發生的頻率」P(B)成反比。
敏感的你可能會感覺到,雖然我已經盡力用直覺的方法去解釋這個事後機率的公式了,但好像還是很難用直覺去理解它。
所以,這個公式其實還有一個更容易理解,也更實用的變體。
在介紹這個實用又容易理解的變體公式之前,讓我們再利用2×2表格來介紹幾個新的概念。這次我們就用放羊的孩子來舉例了。
2011年6月27日 星期一
《醫生你到底在想啥?》之Google自動駕駛車「腦中」最重要的一條公式
如果今天是一個男的去做乳房攝影(當然他要很胖,胸部要很大才做得了),結果為陽性,他有乳癌的機率也是9.2%嗎?男生不是幾乎不可能得乳癌嗎?
又如果今天是一個已經確定有乳癌的人去做乳房攝影,結果是陽性,難道你要說這個已經確定有乳癌的人真正有乳癌的機率是9.2%?又或者他乳房攝影的結果居然是陰性呢?
我們用生活上的例子來看,假設台灣女性有70%留長髮,台灣男性則只有25%留長髮。很明顯女性留長髮的比例比男性高,因此我們可以用留長髮與否來推測一個人是女性的機率有多少,而70%就是真陽性率,也就是敏感性;25%則是假陽性率,也就是「1-特異性」(我們是不是常常看到「1-特異性」而非特異性呢?你現在可以理解為什麼ROC曲線要用「1-特異性」做橫軸了吧!)。
所以,如果我們只知道一個人他是留長髮的,那麼她是女性的機率有多少呢?
如果你夠精明的話,應該可以看出我的詭計──我根本還沒告訴你台灣女性的「盛行率」,也就是台灣女性佔總人口的比率是多少呢!所以根本沒辦法算!
現在假設台灣女性人口比率是48%,我們就可以算出隨便一個留長髮的人是女性的機率:
{###_elleryhuang/7/1024047236.jpg_###}
所以,如果我只知道一個人是台灣人,那他是女性的機率48%(女性佔總人口的比率);如果我在告訴你他留長髮,那他是女生的機率就從原本的48%,變成58%。
假設台灣男人很幸福,因為台灣女性佔總人口比率是80%,那如果你只知道一個人是台灣人,他是女性的機率就是80%;如果你又知道他有留長髮,則他是女性的機率就提高到92%了。
由此可見,同樣是知道一個人有留長髮,但他是女性的機率,還會受到「知道他有沒有留長髮之前的機率」影響,例如在這個例子裡是受到台灣女性人口比率影響。
例如,假設我還先偷偷告訴你,這個人穿裙子喔!那麼她是女性的機率就從原本的女性人口比率大大提高許多(假設穿裙子的人是女性的機率是86%)。現在我再告訴你他有留長髮,那又會提高她是女性的機率了。(其實就等於經過兩次篩檢。)
又假設你已經知道這個人有喉結,那她是女性的機率絕對很小(假設是1%),就算我之後告訴你他有留長髮,他是女性的機率也不會很高。
所以,如果我們已經先知道了別的資訊,就不能利用女性人口比率來計算知道他有沒有留長髮之後是女性的機率了!而是應該用知道留長髮資訊之前,她是女性的機率,來計算知道留長髮資訊之後的機率。
知道留長髮資訊之前,她是女性的機率,我們稱作「事前機率」(prior probability)。
知道留長髮資訊後,她是女性的機率,我們稱作「事後機率」(posterior probability)
應用在醫學檢測上,就是利用疾病盛行率來當作事前機率;至於事後機率,則是從醫學檢測的角度,特稱為陽性檢測率。
用事前機率這個名稱來代替疾病盛行率,將有助於我們思考前面的問題。
一個男人去作乳房攝影,結果為陽性,我們不能用一般的乳癌盛行率來計算這個男人有乳癌的機率。因為,一般的乳癌盛行率,指的是所有無乳房症狀的女性,得乳癌的機率。所以,我們應該用所有(乳房大到足以作乳房攝影)的男性得乳癌的機率,來當作事前機率。
同樣的,在計算已經有乳癌的女性作乳房攝影之後真的有乳癌的機率,也應該用她的事前機率,也就是100%來計算,所以算出來還是100%!
所以,我們就可以把剛剛陽性檢測率的公式,改成下面事後機率的公式:
{###_elleryhuang/7/1024047237.jpg_###}
大家應該都有用過Google地圖,裡面的街景功能讓人簡直是身歷其境,非常有趣。
在美國,有些地方的街景,居然是由Google研發的自動駕駛車所蒐集的!車裡面完全沒人!
從上路到現在,自動駕駛車總共只出過一次車禍,而且還是停紅燈被後面的車給追撞的。
這讓我們不得不佩服人工智慧的厲害。
不過,人工智慧厲害歸厲害,畢竟也是人腦設計的。而且你現在已經學會Google自動駕駛車的人工智慧裡面,最重要的一條公式了!
沒錯,這條公式就是:
{###_elleryhuang/7/1024047237.jpg_###}
不過,這個型式的公式主要應用在醫學界,因為敏感性以及特異性是醫學的基礎知識,很容易就可以套用到公式中來計算。
我們可以把這條公式的分母往回推兩步,因為我們知道,事後機率其實就是所有陽性裡面,真陽性的比率,所以:
{###_elleryhuang/7/1024047257.jpg_###}
我們再稍微替換一下專有名詞。不過這可能需要喚醒高中數學課所上的條件機率。
2011年6月24日 星期五
《醫生你到底在想啥?》之疾病盛行率與陽性檢測率
如下圖所示,疾病盛行率即為(a+c)/(a+b+c+d)。
{###_elleryhuang/7/1024047231.jpg_###}
知道疾病盛行率之後,我們就有辦法算出我們最想要知道的東西,也就是檢查為陽性的病人究竟罹病的機率是多少?乳房攝影陽性的病人究竟有乳癌的機率是多少?D-dimer陽性的病人究竟有肺栓塞的機率是多少?D-dimer陰性的病人肺栓塞的機率又有多低?
在這之前,還得先瞭解兩個概念。
●陽性檢測率
如下圖所示,在所有乳房攝影結果為陽性的病人之中,真正有乳癌的比率,也就是陽性檢測率,為a/(a+b)。
{###_elleryhuang/7/1024047232.jpg_###}
那麼陽性檢測率要怎麼算呢?也就是說,病人的乳房攝影結果是陽性的話,他真正有乳癌的機率要怎麼算呢?
必須先說明,在2×2表格裡很明顯就可以看出陽性檢測率等於a/(a+b),而a和b也就是真陽性跟偽陽性又都是已知的,所以你直接就可以算出陽性檢測率了。不過,在現實世界中,你完全不知道有幾個人是真陽性,有幾個人是真陽性。
在現實世界中,你所能直接知道的數據,就只有敏感性、特異性,以及疾病盛行率。所以,我們必須要知道如何從這三個數據去算出陽性檢測率。
陽性檢測率也就是所有檢測結果為陽性的人裡面,真正有患病(真陽性)的機率,也就是:
{###_elleryhuang/7/1024047233.jpg_###}
所以我們必須算出真陽性及偽陽性:
真陽性=乳癌患者數×敏感性 (還記得敏感性又叫做真陽性率嗎?)
偽陽性=無乳癌人數×(1-特異性) (還記得「1-特異性」又叫做偽陽性率嗎?)
所以我們只要算出乳癌患者數,以及無乳癌人數就可以了:
乳癌患者數=總人數×乳癌盛行率
無乳癌人數=總人數×(1-乳癌盛行率)
那麼總人數是多少?我們不知道,所以就先擺著。
所以,陽性檢測率就等於:
{###_elleryhuang/7/1024047256.jpg_###}
太好了!我們發現總人數可以被消掉,所以最後,陽性檢測率就等於:
{###_elleryhuang/7/1024047234.jpg_###}
前面提過乳癌的盛行率是0.68%,乳房攝影的敏感性是75.6%,特異性94.9%。將之代入公式,就可以算出乳房攝影陽性的人真正有乳癌的機率了:
{###_elleryhuang/7/1024047235.jpg_###}
所以,今天如果一個人他去做乳房攝影,結果為陽性,你就可以說他真正有乳癌的機率是9.2%了......
真的是這樣嗎?
2011年6月21日 星期二
《醫生你到底在想啥?》之敏感性與特異性
前面介紹過的敏感性,也就是所有乳癌患者之中,正確被篩檢出來為陽性的比率,也就是a/(a+c)。敏感性又可稱作「真陽性率」,但一般不喜歡用這個名詞,因為很容易跟前面提到的「陽性檢測率」相混淆。(如果你心裡忽然大驚這兩個詞指的原來是不一樣的東西,那你就是已經混淆了這兩個概念。不要緊,心理學家發現連醫生、統計學家,及其他專業人士,還有幾乎所有人類,都容易混淆這兩個概念。這個「心理學家」還藉由這個發現得到了2002年的諾貝爾經濟學獎!)
{###_elleryhuang/7/1024047229.jpg_###}
敏感性
a/(a+c)
另外,c/(a+c)則被非正式的稱為偽陰性率,也就等於1-敏感性。
如果乳癌的病人有越高的比例可以被乳房攝影檢查出來,也就是敏感性很高,也就是a/(a+c)越接近100%,則「1-敏感性」(偽陰性率)也就越低。也就是乳癌的病人用乳房攝影檢查不出來而被誤判為陰性的機率很低,所以如果病人的檢查結果是陰性,我們應該可以「排除」(rule out)他真的有乳癌的可能。
因此,我們得到一個重要的結論:敏感性越高的檢查,越有能力「排除」疾病。
用生活上的例子來說,在所有男生裡面,有很高比例的男生都穿褲子(即用穿褲子與否來篩檢是否為男性的敏感度高),所以如果一個人不穿褲子而穿裙子,你大概可以排除他是男生。但是,如果有一個人穿褲子,你卻不能「確認」(rule in)他是男生。因為女生也有很高比例穿褲子。
相對來說,雖然女生穿裙子的比例比男生高,但在所有女生裡面,穿裙子的比例也沒有很高(即用穿裙子與否來篩檢是否為女性的敏感度低),所以如果一個人沒穿裙子,你也不能排除他是女生。
●特異性
至於特異性,則是所有無乳癌者之中,正確被篩檢為陰性的比率,也就是d/(b+d)。特異度同樣可稱作「真陰性率」,大家也同樣不喜歡這個容易混淆的名稱。
{###_elleryhuang/7/1024047230.jpg_###}
另外,如同前面在介紹ROC曲線所說的,b/(b+d)被非正式的稱為偽陽性率,也就等於1-特異性。
如果沒有乳癌的人有越高的比例可以被乳房攝影正確的判定為陰性,也就是特異性很高,也就是d/(b+d)越接近100%,則「1-特異性」(偽陽性率)也就越低。也就是沒有乳癌的人被乳房攝影誤認為陽性的機率很低,所以如果病人的檢查結果是陽性,我們應該可以「確認」(rule in)他真的有乳癌。
因此,我們得到第二個重要的結論:特異性越高的檢查,越有能力「確認」疾病。
用生活上的例子來說,男生留鬍子的比例比女生高,所以我們可以用留鬍子與否來篩檢一個人是否為男性。而在所有不是男生的人(即所有女生)裡面,沒留鬍子的比例很高(即用留鬍子與否來篩檢使否為男性的特異性很高),所以如果一個人有留鬍子,你大概可以確認他是男性。但是,如果有一個人沒有留鬍子,你卻不能「排除」他是男性,因為男生也有很高比例沒有留鬍子(現在你應該會用專業的術語來說明原因了:因為用留鬍子來篩檢男性的「敏感度」不高!所以無法用來「排除」!)
相對來說,台灣人黑頭髮的比例比非台灣人還高(不考慮染髮),因此我們可以用黑頭髮與否來篩檢是否為台灣人。而雖然此項篩檢的敏感性很高(幾乎所有台灣人都是黑頭髮),但特異性卻不高(非台灣人也有很多黑頭髮)。因此,就算一個人是黑頭髮,我們還是無法確認他是台灣人。接下來你應該可以舉一反三了,因為此項篩檢的敏感性高,所以可以用來「排除」。因此當一個人不是黑頭髮,我們大概可以排除他是台灣人。
用醫學上的例子來說,D-dimer是體內血栓分解的產物。而肺栓塞也就是肺部的血管被血栓塞住了,因此肺栓塞的病人D-dimer幾乎都會高起來。也就是說,如果要用D-dimer來篩檢肺栓塞的話,敏感度很高。
但是,除了肺栓塞以外,如果病人有像是腦梗塞、心肌梗塞、深層靜脈栓塞等等疾病,也都是有血栓,因此D-dimer也有很高的比率會高起來。除此之外,像是癌症、手術、外傷,也都會讓D-dimer高。以上情形都會在沒有肺栓塞的情況下產生偽陽性。所以用D-dimer來篩檢肺栓塞的特異性很低。
敏感性很高,可以用來「排除」(rule out);特異性很低,不能用來「確認」(rule in)。
因此,在臨床上,醫生檢查病人的D-dimer,通常是用來排除病人有肺栓塞,而無法確認肺栓塞的診斷。
因為假設病人的D-dimer很低,有肺栓塞的機率就很低……等一等,這句話「嚴格來講」是錯的!!
就像前面乳房攝影的例子一樣,如果我們只知道一個人的乳房攝影結果,就算我告訴你乳房攝影篩檢乳癌的敏感性還有特異性,你還是不可能知道這個病人有乳癌的機率是多少!
用極端卻直觀的例子來說明。假設這個世界上根本就沒有人會得到肺栓塞,則不管D-dimer的結果是高還是低,病人是肺栓塞的機率就是0%!如果世界上每一個人都有肺栓塞,則不管D-dimer的結果是高還是低,病人肺栓塞的機率就是100%!
由此可見,除了D-dimer的結果以外,我們還需要知道世界上所有人裡面有多少人有肺栓塞,也就是必須要知道肺栓塞的「盛行率」(prevalence)。
2011年6月20日 星期一
《醫生你到底在想啥?》之流行病學及統計學理論最重要的一張圖表
接下來要介紹的是我個人認為在流行病學及統計學理論都是最重要的一張圖表,也就是「2乘2表格」(2×2 table)。
2乘2表格其實跟我前面所畫的紅豆綠豆圖一樣,只是將具體的圖案或數字,化為簡單明瞭的代數。如果你有認真閱讀前面的部份,這個部分就很簡單了。
下面用乳房攝影篩檢乳癌作為例子,這樣你就可以知道前面我說每篩檢出一個乳癌的患者,就有九個健康女性要白白切一塊乳房來做病理檢查是怎麼算出來的。
我們利用乳癌患者及無乳癌者、乳房攝影陽性及陰性的兩種分類方式,可以得到以下四個族群:乳房攝影結果正確為陽性的乳癌患者(真陽性,a)、結果誤為陽性卻不是患者(偽陽性,b)、結果誤為陰性卻是患者(偽陰性,c)、結果為陰性也真的不是患者(真陰性,d)。
{###_elleryhuang/7/1024047227.jpg_###}
所有乳癌患者數為a+c,所有無乳癌者數為b+d。所有乳房攝影結果為陽性的人數是a+b,陰性人數是c+d。
{###_elleryhuang/7/1024047228.jpg_###}
2011年6月14日 星期二
《醫生你到底在想啥?》之中華民國曲線(ROC曲線)
我們可以回頭看剛剛的紅豆綠豆篩檢圖。現在你可以自由移動垂直的那條篩檢線。篩檢線越往左移動代表篩子的網目越小,你可以清楚的看到遺漏的紅豆越來越少(偽陰性率越來越低),被篩選出來的紅豆越來越多(敏感性越來越高)。但是,被誤篩出的綠豆則是越來越多,過濾掉的綠豆越來越少(特異性越來越低)。
相對的,當你篩選線慢慢往右移,也就是使用越來越大網目的篩子時,敏感性越來越低,但特異性卻越來越高(偽陽性率越來越低)。
{###_elleryhuang/7/1024047217.jpg_###}
如果我們分別記錄不同網目大小篩子的敏感性及特異性,就可以得到下面這張敏感性與特異性成負相關的圖(出處:Thomas B. Newman. Evidence-Based Diagnosis。經作者修改過):
{###_elleryhuang/7/1024047221.jpg_###}
從這張圖就可以很容易看出,敏感性越高,特異度也就越低,反之亦然。也就是說,敏感性與特異性,難以兩全。
不過,流行病學家跟統計學家還有我覺得這張圖看起來不太舒服,可能是他們有在玩股票吧!把橫軸座標特異性改成「1-特異性」。「1-特異性」其實就是「偽陽性率」,不過一般不喜歡正式使用這個名詞,因為容易引起混淆。
將橫座標從特異性改成「1-特異性」之後,整個製圖的過程就像下圖一樣(出處:Thomas B. Newman. Evidence-Based Diagnosis, p71。經作者修改過):
{###_elleryhuang/7/1024047220.jpg_###}
最後我們就會得到像下面這樣的圖:
{###_elleryhuang/7/1024047219.jpg_###}
這種圖,統計學上稱之為「接收者操作特徵曲線」(receiver operating characteristic curve)簡稱「ROC曲線」,非官方暱稱為「中華民國曲線」。
其實橫座標不用特異性而用「1-特異性」,也是有其意義的。
1-特異性,也就是偽陽性率。所謂偽陽性,其實就是「雜訊」。前面舉過相機底片的例子,相機底片越敏感(感光度越高),雜訊也就越多。這點從ROC曲線就可以很明顯的看出來。你想要篩出的紅豆,一定也會篩出更多綠豆。
假設今天紅豆及綠豆的大小分佈如下圖(出處:Thomas B. Newman. Evidence-Based Diagnosis。經作者修改過):
{###_elleryhuang/7/1024047224.jpg_###}
也就是說,所有的紅豆都比最大顆綠豆還要大;所有的綠豆都比最小顆的紅豆還要小。這樣我們就可以選擇一個恰當網目大小的篩子,完美的篩選出所有的紅豆而無所遺漏,同時也完美的篩掉所有的綠豆而沒有誤篩到紅豆湯中。這時,敏感性以及特異性都是100%。
在這種情況下,用篩子來從紅豆綠豆中篩檢出紅豆的ROC curve就如同下圖最左上方那條「完美的檢測」曲線一樣(出處:Thomas B. Newman. Evidence-Based Diagnosis。經作者修改過):
{###_elleryhuang/7/1024047222.jpg_###}
相對的,如果紅豆綠豆的大小分佈如下圖(出處:Thomas B. Newman. Evidence-Based Diagnosis。經作者修改過):
{###_elleryhuang/7/1024047223.jpg_###}
也就是綠豆跟紅豆大小分佈型態是完全一樣的,那麼想當然爾,不管你的篩子大小可以篩出所有紅豆之中多少比例的紅豆,你都同時會篩出所有綠豆中同樣比例的綠豆。也就是說,不管你用網目多大的篩子來篩豆子,結果都跟你用手直接隨機抓一把豆子一樣。這時,用大小來篩檢紅豆就是完全無效的。我們可以得到如上圖「根本沒用的檢測」一樣的ROC曲線。
如果像一開始所舉的例子一樣,紅豆大小的平均趨勢要比綠豆還大,但有些最小的紅豆比最大一些綠豆還要小。這時,我們就可以利用大小來篩檢紅豆,以使得篩檢過後的紅豆湯裡面,紅豆跟綠豆的比例較篩檢之前還高;但卻無法完全分離紅豆與綠豆。這時,ROC曲線就會介於完美的檢測與完全沒用的檢測之間。
其中越接近完美檢測的「Γ」型ROC曲線,代表篩檢的效能越高,篩檢後標的物(紅豆)相對於非標的物(綠豆)的比例也會提高較多(紅豆湯比較純)。
而越接近完全沒有用的檢測的「╱」型ROC曲線,代表篩檢的效能越低,篩檢後標的物相對於非標的物的比例只能提高一點點(紅豆湯比較不純)。
2011年6月9日 星期四
《醫生你到底在想啥?》之千金難買早知道……嗎?
——捷爾德‧蓋格瑞澤(Gerd Gigerenzer,德國柏林普朗克人類發展研究院適應行為與認知中心主任)
這是一則發生在美國的真實故事。丹尼爾醫師眼前的這位老先生,徬徨地盯著他,希望丹尼爾醫師能夠告訴他,究竟該不該做PSA檢測?所謂PSA檢測,是測量男性血液中的攝護腺特異抗原(Prostate Specific Antigen),希望能早期發現攝護腺癌。因為攝護腺癌「通常」會製造出PSA,使得血中的PSA濃度升高。
沒想到,丹尼爾醫師卻堅定地告訴老先生:「根據我的專業知識,PSA檢測給你帶來的好處並不會大於壞處,因此我不建議你做這項檢測。」
後來,這位老先生被查出罹患攝護腺癌,而丹尼爾醫師,則因為他的「醫療疏失」而吃上官司,最後,丹尼爾醫師所任職的教學醫院必須賠償一百萬美元。(Gerd Gigerenzer 2009.半秒直覺)
丹尼爾醫師真的錯了嗎?
什麼是醫學篩檢?
故事中的PSA檢測,是一種醫學篩檢。什麼是醫學篩檢呢?我們可以用篩紅豆的例子來理解。
今天我要煮一鍋紅豆湯,但在拿紅豆的時候,不小心把紅豆和綠豆混在一起了,面對著眼前這鍋混雜在一起的紅豆與綠豆,我要怎麼樣揀選出我要的紅豆,順利煮出一鍋紅豆湯呢?
當然,我可以憑著愚公移山的精神,一顆一顆用眼睛分辨是紅豆還是綠豆,用手工揀選出紅豆來。這麼做,就可以一顆紅豆也不遺漏地煮出一鍋純粹只有紅豆的紅豆湯──但是這麼做太浪費時間了!有沒有其他方法,可以快速地篩選出紅豆呢?
用篩子!
一搬來說,紅豆比綠豆大,因此,我們可以選用適當大小的篩子,將紅豆給篩出。而這個過程,就叫做「篩檢」(screening)。
{###_elleryhuang/7/1024047217.jpg_###}
以上圖的例子來看,紅豆綠豆各有37顆,而平均來講,紅豆比綠豆還大顆。但是,我們可以看到,並不是所有的紅豆都一樣大,也不是所有的綠豆都一樣小。紅豆及綠豆的大小分別呈現常態分佈。因此,若我們以圖中垂直線所劃分出來的大小來篩檢紅豆,就會有兩顆比篩子孔還小的紅豆被我們遺漏了(不該被篩掉而被篩掉,即偽陰性);同時,也會有八顆比篩子孔還大的綠豆被我們誤篩出來(不該被篩出而被篩出,即偽陽性)。經由這次篩檢,我浪費了兩個紅豆,且煮出來的紅豆湯中,混雜了八顆綠豆。我們要怎麼樣表示這次篩檢的成果呢?
我的目的是要盡量篩檢出紅豆來,在這次篩檢中,總共37顆紅豆,篩檢出了35顆(真陽性),我們可以說,這次篩檢對於紅豆的「敏感度」(sensitivity)為35除以37,也就是94.6%。敏感度越高,代表可以篩出越高比例的紅豆來;相對來說,低的敏感度,代表篩出篩檢對象的成效不彰。
除了盡量篩檢出紅豆來以外,同時也得盡量將我所不想要的綠豆給篩掉,在37顆綠豆當中,有29顆正確地被我篩掉了(真陰性),我們可以說,這次篩檢對於綠豆的「特異度」(specificity)為29除以37,也就是78.4%。特異度越高,代表能越正確地將欲篩除的目標過濾掉。
好,現在我們來到實際的臨床決策情形。今天有一位健健康康、沒任何乳房症狀的50歲女性,為了提早篩檢出自己是否有乳癌,而做了「乳房攝影」。針對40歲以上女性使用乳房攝影來篩檢乳癌,其敏感度約75.6%,特異度約94.9%。(Kavanagh AM 2000. The sensitivity, specificity, and positive predictive value of screening mammography and symptomatic status. Journal of Medical Screening)這位女性的檢查結果為陽性,即乳房攝影看起來像是乳癌,那麼,這位女性真正有乳癌的機率是多少?75.6%嗎?錯!94.9%嗎?也錯!答案是,不知道!
回到我們簡單的豆子圖,上面雖然介紹了敏感度以及特異度的概念,但這兩個概念都是經由事後計算篩選結果,統計分析而得到的。在實際篩選紅豆的過程中,我們最需要知道的資訊是:所篩出來的豆子中,有多少是紅豆?以圖中的例子來看,總共篩出了43顆豆子,其中有35顆是我想要的紅豆,也就是說,在我最後所煮的紅豆湯中,紅豆所佔的比例是81.4%,這個概念,就叫做「陽性檢測率」(Positive predictive value)。陽性檢測率的大小,會隨著篩檢對象的相對族群比例而改變。例如,若我們將圖中的每一顆紅豆都當成是十顆紅豆,那麼所篩出的紅豆就會變成350顆,而誤篩出的綠豆還是八顆,所以,所有篩選出的豆子中,真正是紅豆的比率,也就是陽性檢測率,就提高到97.8%(350/358)。
在乳癌的例子中,乳癌盛行率(prevalence,具有某疾病者在整個族群中所佔有的比率)大約是千分之6.8,計算後可得陽性檢測率為9.2%,因此,這位女性有乳癌的機率,從原本的千分之6.8,因為乳房攝影結果為陽性,而上升到9.2%。
同樣的檢測工具,敏感度以及特異度通常是固定的,因此,醫學上評估某種篩檢工具的成效如何,看的就是這個篩檢工具的敏感度以及特異度。但是,在臨床實際的篩檢過程中,更重要的卻是結合敏感度、特異度,以及篩檢對象的疾病盛行率去評估陽性檢測率,這樣我們才能得到一個真正有用的訊息──若是篩檢結果為陽性,那麼真正得病的機率是多少?
但是,真正的臨床篩檢,並沒有這麼單純。
回到開頭的故事,丹尼爾醫師為何冒著吃上官司的風險,建議病人不要做PSA攝護腺癌篩檢?
理由一:假陽性
如同前面對醫學篩檢的介紹,我們知道,篩檢一定會有假陽性的存在。那為什麼我們要「篩檢」癌症,而不直接「診斷」癌症?因為癌症的診斷通常需要組織學的病理診斷──簡單的說,就是用一根粗粗的針,挖你身上的一塊組織,再放到顯微鏡下看看這些組織細胞是不是長得惡形惡狀的癌症。而因為我們都不想變得千瘡百孔──讓醫師在我們身上所有可能長癌症的地方挖一塊組織下來檢查,所以只得使用各種「非侵入性」的癌症篩檢工具,來提早發現癌症,例如上述篩檢攝護腺癌的PSA抽血檢測、篩檢乳癌的乳房X光攝影,或是篩檢子宮頸癌的子宮頸抹片檢查。
只要是篩檢,就無可避免會有假陽性產生。在大部份的癌症篩檢中,所有篩檢為陽性的病人,接著就是進行組織學的確診──在你身上挖一塊肉。在上述乳房攝影的例子當中,陽性檢測率只有百分之9.2,也就是說,每篩檢出一個乳癌的病人,就有九個健健康康的人要無緣無故地被挖上一塊乳房組織!
理由二:過度診斷(overdiagnosis)及過度治療(overtreatment)
醫學篩檢,還有個比篩紅豆還複雜的問題。所謂假陽性,就是事實上沒有癌症,卻被懷疑有癌症而必須做進一步侵入性檢查的病人。而真陽性呢?那些被篩檢出為癌症,並且在後續的組織學病理檢查中確診為癌症的病人,就真的是癌症嗎?沒錯,組織學確診為癌症的病人,當然就是癌症,只是,這個癌症的概念,可能與原本的概念不同了。
在癌症篩檢出現以前,醫生們只能等到癌症在病人身體造成症狀,甚至是造成死亡,再對其進行組織學的檢查或大體解剖,以確診為癌症。接著,醫生們再研究這些癌症的各種特性,例如造成的症狀、五年存活率、治療方法、治癒率等等,最後形成各種癌症的概念及描述。
但是,在癌症篩檢出現之後,醫生們藉由癌症篩檢,發現了許多沒有造成症狀的癌症,那麼,我們能保證這些經由篩檢發現的無症狀癌症,跟原本研究的癌症特性是一樣的嗎?答案是,不行。
最知名的例子,就屬攝護腺癌了。根據美國的研究報告指出,男人一生得攝護腺癌的機率高達60~70%!而其中只有1/30的患者會死於攝護腺癌,另外,大部份的攝護腺癌是不會造成任何症狀的(Brawley OW 2009. “Screening for Prostate Cancer” CA: A Cancer Journal for Clinicians)!可惜的是,我們並沒有辦法分辨出哪些攝護腺癌會造成症狀甚至死亡,哪些是無害的。但是,我們發現,經由篩檢而後診斷出來的攝護腺癌,有較高比例的病人,具有無害的病灶,並不會造成症狀以及死亡。
利用下圖來解釋。圖中紅線條為成長速度快的腫瘤,藍線為成長速度慢的腫瘤。如圖所示,三個成長速度快的腫瘤之中,有兩個在篩檢前就已經造成症狀並且診斷出來,只有一個能被提早篩檢出來。而在三個成長速度慢的腫瘤之中,有兩個被篩檢出來。這是因為成長速度慢的腫瘤,其從發病到出現症狀的「無症狀帶病期」比成長速度快的腫瘤還要長,而所謂「無症狀帶病期」,就是我們篩檢的目標。因此,在一個隨機的時間點進行篩檢,便會有較高的機率篩檢出成長速度較慢、對病人較無害的腫瘤。這在流行病學上稱為「長度-時間偏差」(Length-time bias)。
{###_elleryhuang/7/1024047218.jpg_###}
這種將許多無害的病灶診斷為傳統惡性病灶疾病概念的行為,就叫做「過度診斷」。而對於這些過度診斷的病人進行治療,則是「過度治療」。2009年,《英國醫學雜誌》所發表的一篇統計英國等七個地區乳房攝影篩檢的結果指出,大約每三個經由乳房攝影篩檢而後診斷出來的乳癌病人,就有一個是過度診斷,而後進行過度治療(Jørgensen KJ 2009. Overdiagnosis in publicly organised mammography screening programmes: systematic review of incidence trends. BMJ)。
治療有什麼不好呢?以攝護腺癌為例,不論是化療還是手術切除,都有很高的比例會造成病人產生性無能、尿失禁等副作用,而對75歲以上的老人進行攝護腺切除手術,甚至還有1%的機率會導致死亡(Brawley OW 2009. “Screening for Prostate Cancer” CA: A Cancer Journal for Clinicians)。
理由三:篩檢所造成的傷害
醫學篩檢屬於醫療介入,因此也和任何醫療介入一樣,都有可能對病人產生傷害。例如乳房攝影會使病人暴露於X光之下,可能造成細胞傷害。另外,對於肺癌篩檢的研究也指出,頻繁地以胸部X光篩檢肺癌的對象,比起以較低頻率篩檢的對照組來說,死於肺癌的比例竟然比較高(Manser R. Screening for lung cancer. Cochrane Database of Systematic Reviews 2004)!雖然造成此一現象的原因尚未明朗,但至少這個研究直接有力地證明了,某些癌症篩檢可能帶給人們壞處大於好處!
To screen, or not to screen. That is a question.
所以,癌症篩檢給我們的壞處大於好處,我們應該對所有的癌症篩檢敬而遠之嗎?切記,在倒髒洗澡水的時候,不要連嬰兒也給一起倒掉了!
誠如以上所說,癌症篩檢有許多潛在的壞處,但其帶給我們的好處顯而易見──早期發現,早期治療。癌症篩檢沒有絕對的好或不好,一切只看我們怎麼去運用。並且,癌症這個概念事實上是由子宮頸癌、肝癌等各式各樣的癌症所集合而成的一個概念。事實上,每一種癌症各自有著不同的特性;甚至,各個癌症底下還可以依照許多不同的分期、病理學型態,以及患病者的種族、危險因子等等,來分成不同的族群對象。而針對不同的族群對象,使用癌症篩檢所產生的利弊得失都是不同的,必須依靠良好的研究證據來選擇是否該篩檢。這就是近十幾年來風行全球醫界的「實證醫學」觀念。例如,對於攝護腺癌的PSA篩檢以及對於乳癌的乳房攝影篩檢是否好處大於壞處,還存在爭議,但像是子宮頸癌的子宮頸抹片篩檢,雖然還沒有最高等級的隨機臨床對照試驗證據,但許多間接證據使得目前醫學界認為子宮頸抹片篩檢是對婦女有益的。
回頭來看我們的丹尼爾醫師。丹尼爾醫師秉持著實證醫學的精神,以病人的利益為優先考慮,根據現有的證據,做出了不建議進行PSA攝護腺癌篩檢的建議,沒想到最後的結果,卻是吃上官司,甚至敗訴。類似的事情一再發生,導致醫生們被迫行使「防衛性醫療」──為了防止身陷醫療糾紛的訴訟,而採取消極卻非對病人最有益的醫療行為。
想像一下今天有人給你一個幾個不同網目大小的篩子,要你在混雜的紅豆綠豆之中,篩出紅豆來煮紅豆湯。但是,只要你遺漏了一顆紅豆,這顆紅豆就會爆炸把你給炸死!
所以你為了避免自己死掉,就選擇網目很小很小的篩子來篩豆子,以免漏篩紅豆把自己給炸死。
雖然你避免了自己因為漏篩紅豆而炸死,但廚房卻傳來爆炸的聲音,原來如果有綠豆被混到紅豆湯裡面煮,也會爆炸!
你心裡只想,關我屁事,反正我不要漏篩紅豆被炸死就好了,反正喝紅豆湯的也不是我!難道我真的有那麼偉大可以為了拯救別人被綠豆炸死而選擇讓自己被紅豆炸死?
同樣的,如果社會以及司法只會結果論的給沒有提早篩檢出疾病的醫生坐牢或者傾家蕩產的懲罰,那醫生為了自保也只得盡其所能的避免遺漏診斷,只得無奈的犧牲病人的利益了。
其實你算幸運的了,雖然大家都很聰明的使用網目很小的篩子,以避免漏篩紅豆而把自己炸死,但總是有少部分的人運氣不好,因為沒有篩到生下來就是那麼小顆的紅豆而被炸死。
到最後,你想還會有人要做篩紅豆的工作嗎?
這也就是當今台灣醫學系的錄取分數一反常態的被牙醫系給超越的主要原因。也是台灣淪落到快找不到婦產科醫師接生,中部某醫學中心小兒科沒有住院醫師只有實習醫師值班的原因。
●敏感性、特異性,難以兩全其美
像上面怕遺漏紅豆炸死自己的人一樣,選擇較小網目的篩子來篩豆子,就可以把所有紅豆之中,較大比例的紅豆給篩選出來,也就是敏感性會比較高。這樣也就可以達成你的目的,讓遺留下來的紅豆佔所有紅豆的比例比較少,也就是(1-敏感度)或偽陰性率會比較低。
但是,用較小網目的篩子來篩豆子,代價就是在所有的綠豆之中,成功被篩掉的比例降低了,也就是特異性被犧牲而比較低。也可以說是有比較高比例的綠豆會被誤篩出來,也就是(1-特異性)或偽陽性率會比較高。
就好像相機底片一樣,有不同的「感光度」。感光度的英文叫sensitivity,也就是敏感性了。在室內比較暗的時候,選擇比較高的感光度,例如ISO400,可以讓相機對光比較敏感,就可以用比較短時間的快門,相片也比較不會糊掉。但是,高感光度卻也讓雜訊增多,讓照片看起來比較粗糙。
2011年6月5日 星期日
中醫飲食宜忌與生活品質、辯證論治與死亡率
學了西醫的實證醫學之後,我不再只是在乎藥物的效果以及副作用,還會在乎醫生所做的每一個檢查、醫生所說的每一句指示等等所有醫療介入(intervention),給病人帶來的好處是什麼,壞處又是什麼。
西醫評估醫療介入的終極指標(outcome)有兩項,一是病人的死亡率,二是病人的生活品質。
對於醫療介入的研究如果沒辦法評估死亡率及生活品質,而使用其他各種指標來代替,一定要被證明或不證自明與死亡率以及生活品質有關,才有意義。
例如像是很多降血壓藥的研究,結果只是證明服用藥物的病人血壓會降得比安慰劑還低,並沒有直接證明病人吃了藥能活得比較久,或生活品質比較高。
但是,這是因為已經有很多研究,證明了血壓降低可以減少中風、心肌梗塞、腎臟病的機率,預防病人生活品質惡化,以及降低死亡率。
所以為了方便、省錢等理由,降血壓藥物的研究可以只以病人的血壓作為指標,而不看死亡率及生活品質。
當然,能夠評估死亡率及生活品質的研究,一定是更優秀、更可信、更有臨床應用價值的。
以降血壓藥的例子來說,我們難保所研究的新藥有什麼未知的副作用,會增加病人的死亡率,或降低病人的生活品質。
因此,其實大部分有錢、有實力的大型研究,都會盡量去評估死亡率及生活品質等兩大終極指標。
在「物理教授」王唯工的著作《氣的樂章》的封面,有著這麼一句話:「西醫是治你不死的學問,中醫是讓人活得快樂的學問」。
我不知道這句話是出自王教授本人,還是出版社的人加上去的。
但總之,這句話絕對是無的放矢,信口雌黃。
姑且不論後半句對於中醫的宣稱,前半句所謂「西醫是治你不死的學問」就絕對是句不實的聳動標語。
不論是藥物、檢查、醫療體制、公衛政策、還是醫生的衛教,現代實證醫學都強力要求必須要有證據證明其總體而言,能改善死亡率或生活品質。
自從西醫的勢力壓迫中醫開始,中醫就一貫的使用如下的說詞來捍衛自己的勢力:「西醫只能延長生命,讓病人痛苦的活著;中醫卻注重病人的生活品質,讓病人快樂的活著。」
姑且不論對於西醫的污衊是否正確(我都用「污衊」這個詞了還說是「姑且不論」,真不要臉),單論中醫對自己注重病人生活品質的宣稱,就有值得商議之處。
當然,中醫實證醫學的概念還不流行,因此我在這裡也不強求中醫要什麼臨床隨機對照試驗。
但是,單從臨床的觀察,以及過去身為中醫病人的經驗來看,就中醫的飲食宜忌而言,大部分的中醫在衛教病人飲食禁忌的時候,壓根兒沒有考慮到他們所說的話,會對病人的生活品質直接造成不良的影響。
我在這裡也不強求中醫飲食宜忌要什麼隨機對照試驗,姑且假設違反中醫針對不同體質的病人所規定的飲食宜忌,真的會造成身體不好的影響,並且假設會降低病人的生活品質。
然而,回到一開頭我的跟診經驗,主治醫師幾乎每個病人都隨口交代不要吃涼性的水果、生冷的蔬菜、燥熱的例如烤炸辣等食物。
說這些話很容易,但要是真的嘗試過遵守,就能體會遵守這樣飲食宜忌的生活品質,是非常痛苦的。
當然,假設違反這樣的飲食宜忌所造成的身體影響是真的,那麼犧牲遵守飲食宜忌所降低的生活品質,「有可能」是值得的。
但是,問題就在於,飲食宜忌完全沒有隨機對照試驗去證實他的真假,而只奠基在傳統中醫的臨床經驗之上,固有一定的可能是錯的,當然也有可能是真的。
只是,病人遵守飲食宜忌所犧牲的生活品質,卻是明顯的多。
事實上,要說中醫的飲食宜忌,真的完全奠基在臨床經驗之上,也不那麼盡然。
在中醫圈混久了,思想稍微敏銳的人,一定會發現,中醫的飲食宜忌的制訂,充滿了許多人為的、隨機的、想當然爾的因素在內。
也因此,十個中醫裡面,大概有九個中醫所說的飲食宜忌會不一樣。
大家可能也有這樣的經驗,同樣一個食物,甲中醫說不能吃,乙中醫說隨便吃,丙中醫說盡量吃。
文末,再透露給大家一個中醫小撇步。
就中醫而言,不論是飲食宜忌還是藥物功效,只要是說得出一番道理的,通常都是假的。
反之,那些沒什麼道理可言的東西,很可能才是真正寶貴的臨床經驗,才是老祖宗智慧的結晶。
例如木瓜長得像又大又下垂的乳房,乳房屬肝,肝色為青,因此青木瓜能豐胸。
這種東西,沒效的機會比較高。
當然,這個小撇步使用起來也不是那麼容易。
因為中醫已經發展出一套寄生理論,可以寄生在任何隨機指定的因果關係上面。
所以幾乎所有的中醫療效,都有一番大道理。
但隨著你在中醫圈混的時數越久,只要能抱持清晰的思考,就自然會培養出一股直覺,能夠大略分辨哪些是唬爛得來的假臨床經驗,哪些才是後來才經過唬爛包裝的真正的臨床經驗。
2011年5月31日 星期二
《醫生你到底在想啥?》之中風的診斷流程
但我們當然不可能對活人這麼做。
那我們有沒有辦法從病人外表的症狀就知道他有沒有腦中風呢?
醫學研究者整理了中風最常見又特別的三個症狀,整理成一句口訣:「微笑殭屍會說話」。
第一叫病人露出牙齒(叫病人微笑會被打),看嘴唇有沒有歪。
第二叫病人手掌向上平舉十秒,看有沒有單側無力。
第三叫病人說話,看有沒有口齒不清、答非所問或無法表達。
如果病人新發生上述三種症狀之一,就有72%的可能是腦中風。
但是就算同時新發生三個症狀,也只有85%的可能是腦中風。也就是說有15%產生上述腦中風症狀的病人並沒有腦中風,而是其他疾病造成的。
當然,如果再加上病史的詢問以及抽血檢查,是有可能進一步提高診斷腦中風的確定性。但是就算達到100%診斷腦中風的確定性也沒有用,為什麼?
因為腦中風有分血管塞住的梗塞型中風,以及血管爆掉的出血型中風,而兩者的治療完全不同。
如果是梗塞型中風,治療是視情況使用血栓溶解劑來打通血管;如果是出血型中風,治療則是視情況開刀取出血塊。
因此,就算我們能憑病史、身體檢查及抽血檢查診斷一個病人非常有可能是腦中風,也沒有辦法進一步治療,。
但是,光憑病史、身體檢查及抽血檢查,也沒有辦法準確分辨病人究竟是腦梗塞還是腦出血。那該怎麼辦呢?
還好,近代發明了號稱醫生的第三隻眼睛的電腦斷層掃瞄,可以讓我們在病人還活著的時候,看一看腦子裡到底怎麼了。
所謂電腦斷層掃瞄,可以說是立體的X光機,利用人體正常及異常組織X光穿透度的差異,一層接著一層間隔很小的去獲得體內構造的影像,來讓醫生可以不必透過切開人體,就能夠在病人活著的時候,看看體內有什麼結構上的異常。
所以,如果臨床上懷疑病人是腦中風,醫生就會給病人作電腦斷層,去看看病人腦子究竟有沒有梗塞或出血的情形。
但是,電腦斷層掃瞄畢竟不是直接看到病人的腦組織,因此,肯定會有判斷錯誤的情形發生。
你可以想像如果有人問你這個十塊錢硬幣是民國幾年發行的,你很容易就可以回答,只要看一看上面的發行年份就知道了。但如果只給你這個硬幣的X光照片,要你回答同樣的問題,那沒有人能夠回答。因為X光照片沒辦法看到硬幣上面的數字,沒辦法就是沒辦法。
電腦斷層也是同樣的道理。
臨床上偶而會發生這樣的情形,病人做過電腦斷層診斷是腦中風了,最後卻是別的疾病。這就是所謂的誤診。
這時,家屬都無法接受誤診的情形,想說怎麼連電腦斷層都做過了,居然還會誤診?
道理就跟從X光照片想要看到硬幣上面的年份一樣,沒辦法就是沒辦法。
任何的醫學檢查,只要不是「黃金診斷標準」,就永遠不可能達到百分之百的診斷正確率──因為如果能夠的話,那這樣的檢查就會變成黃金診斷標準了!
例如假設現在判斷一個人是不是男人的標準還是看他的外生殖器,那你要用一個人有沒有長鬍子來判斷他是不是男人,就絕對有一定的機率會出錯。你絕對找得到沒有鬍子的男人,也絕對找得到長鬍子的女人。如果所有的男人都一定長鬍子,所有的女人都一定不長鬍子,那長鬍子就會成為判斷是否為男人的黃金診斷標準了。
又假設判斷男人的標準是測DNA,那你要用外生殖器來判斷是不是男人也絕對有機會出錯,這世界上絕對有DNA是男性但卻沒有外生殖器的男人存在。
同樣的,絕對有些從病理切片下面看有缺氧壞死的腦組織,電腦斷層看起來跟正常的腦組織是一樣的,一樣就是一樣,沒辦法分辨就是沒辦法分辨。
我們來看看電腦斷層診斷腦中風的實際表現。
如果是出血型的腦中風,電腦斷層的表現還不錯,有項研究顯示27個臨床最終診斷為出血性腦中風的病人,有25個(93%)電腦斷層可以看得出來。
但如果是梗塞型的腦中風,電腦斷層的表現就很差了,同樣的研究顯示,在190個梗塞型腦中風的病人裡面,只有35個(18%)電腦斷層可以看得出來。(Lancet. 2007 January 27; 369(9558): 293–298.)
為什麼看不出來?答案還是看不出來就是看不出來,這就是科技的極限,醫學的侷限。
但是,沒有一個人會質疑電腦斷層在診斷腦中風上的應用價值。
畢竟,如果有辦法對每一個懷疑腦中風的活人都進行病理切片檢查,同時又不造成傷害,那我想沒有人會想用電腦斷層來診斷中風。
畢竟,如果有辦法確認每個懷疑是男性的人類的外生殖器,同時又不會被打被警察抓去關,那我想沒有人會冒著犯錯的風險只憑著外表就判斷一個人是男的還是女的(應該沒有人從來沒有認錯別人的性別過吧!)。
因此,再次強調的是,臨床醫師安排各種檢查以進行診斷的目的,並不見得是要達到百分之百確診,而是要使病人懷疑罹患某種疾病的可能性超過治療閾值,以進行治療。
我們就來看看腦中風的治療。
梗塞型腦中風的治療是使用血栓溶解劑來溶解塞住腦血管的血栓,以使腦組織恢復血流,拯救快要缺氧死亡的細胞。
但是,血栓溶解劑的最大副作用就是出血。就算真的是診斷為梗塞型腦中風的病人,在使用血栓溶解劑之後,一百個裡面都會有六個病人產生腦出血。
要是用在出血型腦中風的病人身上,那後果就不堪設想了。
因此,給懷疑腦中風的病人做電腦斷層,最主要就是要「排除」(rule out)出血性腦中風的情形。前面說過,超過九成腦出血的病人電腦斷層可以看得出來,因此目前認為電腦斷層顯示沒有腦出血的話,就可以使病人出血型腦中風的可能性低到小於「檢查閾值」,因此臨床上可以初步排除出血型腦中風的診斷。
排除了出血型腦中風,再加上病人符合其他使用血栓溶解劑的條件之後,就可以進行治療了。
值得一提的是,使用血栓溶解劑治療之後的結果,並不能降低病人的死亡率(還好也不會提高死亡率)。那幹嘛還要治療呢?
因為中風的後果除了死亡以外,最令人痛苦的就是喪失運動、感覺、語言、或視覺等等功能了。而血栓溶解劑可以降低病人功能喪失的程度或機率。(N Eng J Med(1995) 333, 1581-87.)這就是使用血栓溶解劑治療梗塞型中風的最主要好處跟目的。
因此,如果你聽到有人攻擊西醫,說什麼「西醫是治你不死的學問,中醫是讓人活得快樂的學問」(氣的樂章,副標),至少在這一點上,他是無的放矢,信口雌黃。
介紹完了腦中風的診斷流程及腦梗塞的治療,還有一個問題存在。
既然我們因為無法對活人進行病理切片,而獲得百分之百腦中風診斷的確定性,而只能使用電腦斷層一類的檢查來診斷腦中風。
那麼,這樣的診斷確定性有多高呢?
要回答這個問題,就必須瞭解敏感性以及特異性的概念。
2011年5月18日 星期三
《醫生你到底在想啥?》之中風的中醫概念演化過程
前文提到過,「風」的特性就是「善行而數變」──喜歡跑來跑去、吹來吹去、流來流去,又會在短時間內忽然起風,忽然沒風,變化無常。因此,古人將「會在身體不同部位發作」的疾病,以及「急性發作」的疾病,都認為是風邪導致。流傳到當今民間的用語例如「風濕痛」、「傷風感冒」以及「中風」。
其實,關於中風,有一點常常被人搞錯,必須要在這裡說清楚。
在古人的眼裡,風濕痛、傷風感冒以及中風這些疾病,都是因為風邪入侵人體所導致的。但是在漢朝的時候,特別是在《傷寒卒病論》「中風」一詞指的其實是傷風感冒的一種,並不是現代所謂的腦中風。
而在大約與《傷寒卒病論》同時期的古代醫經《靈樞》、《素問》,則更是將許多忽然發作的莫名疾病都稱之為風,而有「心風」、「肝風」、「肺風」等五臟風之說法(後來也稱為心中風、肝中風等等)。
到了隋朝的《諸病源候論》,作者可能發現中醫「風」的病名實在太亂了,因此將傷風感冒的那種中風特稱為「傷寒中風」,將現代醫學腦中風的疾病表現,稱為「風癔」(忽然失去意識,喉嚨發出噫噫叫的聲音,舌頭僵硬不能說話)、「風口歪」(忽然嘴吧歪,不能說話,眼睛直視前方)、「風偏枯」(忽然半身不遂)……等等。
當然,古代中醫同樣也沒有發展出解剖病理學,因此不可能有現代腦中風的疾病概念,而只能使用症狀學的方法來形成疾病概念。因此,《諸病源候論》還有「風角弓反張」(破傷風感染的症狀)、「風狂病」(忽然發狂,到處走個不停,自以為是高貴的賢人或神明聖者。類似現代精神醫學的躁症)……等等。
總之,古代中醫跟古代西醫一樣沒有解剖病理學,因此使用症狀學以及六淫的中醫病因概念來形成疾病概念,將所有急性發作的疾病都認為是「中風」。
在後來的文獻中,中醫習慣用「傷寒」來指稱所有傷風感冒;而「中風」一詞,則如同元朝的王履在其《醫經溯洄集》的《中風辨》所說的一樣,指的是「卒暴僵仆,或偏枯,或四肢不舉,或不知人,或死,或不死」,大概等於現代醫學「腦中風的症狀」的概念了(或者說大概等於apoplexy的原始概念,但不等於現代醫學腦中風的概念,因為其包括病理學的腦梗塞、腦出血概念)。
這種代表腦中風症狀意義的「中風」又特稱為「卒中風」,簡稱「卒中」。到了近代,卒中及中風才分別成為apoplexy以及stroke的中文翻譯詞。
還有個兩個搞到人快中風的中醫名詞,「真中風」以及「類中風」,則是這麼來的:金元時期四大名中醫其中三個,因為發現卒中風的病人大多沒有常常吹風(從這裡也看得出來古人是真的認為風邪就是真正在吹的那個風),再加上要宣傳自己的學說,因此特立獨行的認為卒中風不是風邪而是別的原因導致的。後來,王履又特立獨行的堅持說卒中風絕對是真的受到風邪所產生的,但又得遵循中國文人的傳統,老祖宗說的永遠都是對的,因此王履只好說金元四大家所謂非風邪而致的卒中風是「類中風而非中風」,而除去這些「類中風」之後的卒中風,才是「真中風」。
而自從中風被拿來翻譯stroke之後,不但代表腦梗塞及腦出血所導致的中風,也透過轉喻的過程,進而被半正式的用來代表「梗塞」。
所謂梗塞,其實英文有兩個詞彙,「infarct」以及「infarction」。Infract指的是因為血管阻塞而缺氧壞死的細胞組織區域;而infarction指的則是組織細胞因為血管阻塞而缺氧壞死,也就是產生infarct的過程。Infarct是病理學詞彙,infarction則是病理生理學詞彙。
因此,不是只有腦子會梗塞,全身上下只要有血管的地方就有可能會梗塞。
而中文「中風」一詞,本來指的是腦梗塞或腦出血導致的疾病名稱,卻轉喻而代表梗塞(代表infarction),因此常常會聽到「肺中風」、「脾中風」或是「腸中風」這樣的名詞,其實代表的是「肺梗塞(缺血性壞死)」、「脾梗塞」、「腸梗塞」。這跟古代中醫典籍的五臟中風可說是風馬牛不相及!
有了上述對於apoplexy、stroke、卒中、中風……等等概念的中西醫學思想史介紹,我們接著就可以來看腦中風的診斷過程。
2011年5月15日 星期日
《醫生你到底在想啥?》之中風的西方醫學概念演化過程
但是,腦中風的病人會有明顯且特別的臨床症狀,因此,古人還是有辦法藉由觀察腦中風病人的臨床表現,歸納而形成一個「症狀學的疾病概念」。
根據十九世紀知名的法國病理學家夏科(J. M. Charcot)所述,「古代症狀醫學」(ancient symptomatic Medicine)使用「apoplexy」這個詞彙,來指稱像是腦中風之類的病人所產生的「臨床症候群」。如同西元二世紀的名醫蓋倫所指出的,apoplexy代表「忽然失去全身的感覺、動作,但依然有呼吸」。(Charcot, 1881, clinical lectures on senile and chronic disease, p262)
夏科在這裡使用了一個非常棒的詞彙:「古代症狀醫學」。這個詞彙提醒我們一件很重要的事:西方醫學思想史至少可粗分為兩個時期,第一是以臨床可見的症狀來分類疾病的「古代症狀醫學」;第二是以解剖人體所見的「病灶」(lesion)來產生疾病概念的「病理解剖醫學」。
要學好現代醫學,不能不瞭解這兩個現代醫學建構疾病概念的方法:「疾病分類學」(nosology)與「病理學」(pathology)。
所謂疾病分類學,就是夏科所說的古代症狀醫學,其意義剛剛已經講過,大家也很容易理解。
至於「病理學」,則以十八世紀的義大利解剖學教授莫幹尼(G. B. Morgagni)為開路先鋒。莫幹尼以前人對於正常人的解剖研究為基礎,對人體器官的異常病灶進行觀察與描述,並且與病人生前的表現作對照。後來隨著顯微鏡的發展,德國的魏爾嘯(virchow)進一步觀察細胞的病裡表現,因此被稱為細胞病理學之父。
現代醫學有非常多的疾病概念,都是透過對人體病灶的肉眼或顯微鏡觀察而產生的。若是不瞭解這點,就沒辦法學好現代醫學。
最明顯的例子就是各種癌症概念。所有的癌症概念都是透過觀察腫瘤或癌細胞的肉眼或顯微鏡特徵而分類得來的。所以,醫學生在學校上病理學課程的時候,幾乎一半以上都在學癌症。我當初就是沒學好病理學因此進了醫院之後非常難瞭解各種癌症的概念。後來是多讀了一些書,知道了西方醫學的這兩種建構疾病概念的方法,才終於能夠瞭解各個癌症的概念。
回到中風的概念來。Apoplexia一詞直到現在還偶而會被使用,中文一般翻作「卒中」。Apoplexia來源於希臘字「apoplessein」,其字首「apo-」是「off,離開」的意思。「plessein」則是「hit,忽然被打一下」的意思。之所以會這樣命名可能是因為中風的表現像是腦袋忽然被打暈而魂不附體,魂離體去的人一樣。我們可以看看與apoplexia同義的拉丁字「morbus attonitus」(全身僵硬病)及「sideratio」(閃電嚇到的樣子),同樣是描述中風的病人無法動彈的臨床症狀。
無論如何,apoplexia所指的就只是那些忽然倒下及無力的症狀,以現代醫學的知識背景來看,這些症狀雖然最常見於腦中風,但其他疾病造成的也有可能,例如腦子長腫瘤壓迫到旁邊的腦細胞,雖然大部分症狀會隨著腫瘤變大而慢慢出現,但也有少部分的病人其症狀會像中風一樣來得那麼快。再來就是癲癇的病人在發作之後可能會有肢體偏癱的情形發生,隨然大多會回復正常,但如果沒有目擊到發作的話,在癲癇發作後的肢體偏癱回復正常之前很難從外表跟中風區別。更何況從古人的角度來看,因為沒有辦法從外表知道病人有沒有現代病理意義的腦中風,癲癇發作後肢體偏癱就算回復正常,也會被當成是中風的病人復原了。
後來隨著病理解剖學的發展,慢慢發現了中風的病灶原來在腦部。古代的病理學家一開始是先發現及大量描述了腦血管爆掉所造成的出血性腦中風,也因此,根據夏科書中的描述,apoplexy從一個症狀學(semeiology)的概念,於十九世紀初慢慢轉變成一個病理學概念──腦部的出血性病灶。甚至到後來還擴大其義涵,可以用來指包括肝、脾、肺等器官或組織的出血性病灶!(Charcot, 1881, clinical lectures on senile and chronic disease, p264)
這在認知語言學上,就叫做「轉喻」(metonymy),意思是採用某一事物易理解或易領悟的方面,來表示該事物的整體或該事物的其他部分或方面。(女人、火與危險事物,109)
但是,病理學家在出血性中風之後,又發現了相當於「梗塞性中風」的病灶(即血管阻塞導致的腦細胞缺氧壞死,當時稱之為「腦軟化」(cerebral softening))。再加上夏科對醫學史的瞭解,因此在其書中糾正當時將apoplexy用來描述一個病灶的行為,強調apoplexy指的應該是像中風的症狀這樣的臨床症候群。
最後,根據病理學家、臨床醫師以及流行病學家的研究,確立了因為腦血管塞住而導致的「腦梗塞」(cerebral infarct),以及因為腦血管爆掉而導致的「腦內出血」(intracerebral hemorrhage)這兩種病理概念。又因為這兩種病理狀態的臨床症狀難以分辨,而apoplexy這個詞又已經被錯誤的濫用了,因而使用「中風」(stroke)來指稱因為腦梗塞或腦內出血而導致的神經學症狀,又稱為「腦血管意外」(cerebral vascular accident)。
以上是從西方醫學史的角度來介紹中風的概念形成過程。那麼,apoplexy及stroke的中文翻譯「卒中」及「中風」又是怎麼來的呢?中風為什麼會跟風有關係呢?
2011年5月10日 星期二
《醫生你到底在想啥?》之臨床醫師的第二個第一目標:排除鑑別診斷以低於檢查閾值
根據病人的症狀,臨床醫師列出幾項鑑別診斷之後,一邊針對那些很有可能但又不到治療閾值那樣高的可能性的那些疾病,安排進一步的檢查,以「確診」(rule in)該診斷;另一方面,同時針對那些有可能,但可能性不高,卻又沒低到可以放心說不是的疾病,安排進一步的檢查,直到檢查結果使得這個病人是這個診斷的機率小到一個我們可以接受的程度,我們就可以排除(rule out)這個診斷,而不需要在做進一步的檢查。這個得以排除此診斷的機率,就稱為「檢查閾值」(test threshold)。
前面已經介紹過治療閾值的概念。當我們很懷疑病人是某個診斷,但可能性又還不到可以治療的程度的時候,就會作進一步的檢查,以提高此診斷的可能性,直到超過治療閾值,最後確診。那麼,為什麼我們不一個一個針對所有的鑑別診斷作檢查以提高其可能性,直到確診某一個診斷為止呢?為什麼我們還需要同時去排除某些鑑別診斷呢?
因為這樣是最便捷、最省時、最省資源的診斷思路。
就好比柯南在確定犯人的時候,總是會先列出可能的幾個嫌疑犯(鑑別診斷)。之後,柯南的第一步可能並不是急著去找每一個犯人犯罪的證據,因為找犯罪證據非常麻煩、非常費時、非常消耗經費(想想《CSI犯罪現場》裡面那些高科技儀器)。最聰明的方法,是先想辦法透過簡單的方式,排除掉不可能犯案的嫌犯。最方便也最常被柯南使用的方法,就是調查嫌犯有沒有「不在場證明」,如果有的話,則幾乎不可能犯案,因此可以初步排除。
當然,犯人可以說謊,不在場證明也可以作假。因此,就算犯人有不在場證明,我們依然不能驟下結論說這個犯人犯案的機率是0%(可能是0.1%)。但是,如果柯南因為這個犯人0.1%的犯案可能性,就繼續在他身上蒐集證據,那柯南就不是柯南,而是笨偵探毛利小五郎了。
找犯人的偵察過程是個動態而整體的行動,柯南一開始調查不在場證明的目的並不是要找出犯案機率是0%的人,而是縮小調查範圍,以集中火力,避免浪費時間與經費。
直到最後找到真正的嫌犯,當初因為擁有不在場證明而被排除涉嫌的人的犯案機率究竟是0%、0.1%,還是0.2%,一點也不重要了。如果在沒有排除的嫌犯當中,一直找不到真兇,那還是得回過頭來重新調查一開始被排除的嫌犯,哪怕這些嫌犯當初因為擁有不在場證明而被認為涉案的機率是0.2%、0.1%、0%而被初步排除。
(關於我們究竟能不能確認某件事情發生的機率為0%或100%,其實也是個哲學上有關認識論的大哉問,甚至有許多哲學專書厚厚一整本都在討論這個問題,有興趣可以自行涉獵。因此這個問題不在本書討論的範圍之內。歷史上最有名的例子就是笛卡爾了。笛卡爾認為,就算你親眼目睹陳進興殺了人,你也不能100%確定人一定是陳進興殺的,當然也不能確定其他人殺了這個人的機率都是0%。因為可能有「惡魔」干擾你的神經傳導過程,使你產生幻覺,這就是有名的「笛卡爾的惡魔」。笛卡爾可不是在胡言亂語,現代認知科學在各方面都證實了人類所看到的東西不一定是事實。一個簡單的體驗方法就是上網搜尋「錯覺圖」來看看。)
其實這個確診與排除雙管齊下的思路一點也不稀奇。我們日常生活的思考流程當中隨時都會用到這樣的策略。例如你在書店看到一本《醫生你到底再想啥?》,瀏覽了一下覺得很好看,想說回家再用博客來訂購可以打79折。沒想到等你一回到家,卻不記得完整的書名了。但是你依稀記得書名有「醫生」兩個字,於是你在博客來網站的搜尋引擎輸入了「醫生」,想也知道搜尋結果一定非常多,總共有7767個。你當然不可能一個一個去看內容介紹。但你知道你想要找的是一本書,於是那些不是書的影音、雜誌、門票、百貨,都被你初步排除了。沒想到結果還是有6100本書,於是你接著排除繁體以外的書,得到3897本,最後你透過排除那些部可能的圖書分類,又排除非華人作者的書,將確認範圍限定在23本。你總算可以一本一本的看看書籍封面與內容簡介,最後總算是確認你想要的書就是《醫生你到底再想啥?》了。
除了我們可以意識到的思考流程以外,其實人腦潛意識的認知過程也同樣使用了以上「列出鑑別診斷」、「確診與排除」的策略。
例如這個著名的例子:
{###_elleryhuang/7/1024047213.jpg_###}
假如我告訴你這是一個英文字母,那麼究竟是哪一個英文字母呢?
你大腦看到這個形狀,覺得A跟H都有可能,於是將A及H列入考慮名單之中,這就是列出鑑別診斷。接著你發現這個字的左右都被紙給蓋住了,於是你把紙給撕掉,發現原來是這樣:
{###_elleryhuang/7/1024047214.jpg_###}
因為在你的認知中,並沒有TAE這個單字(好啦其實有一個泰國藝人就叫做TAE),而THE又是一個非常常見的單字,因此你初步排除這個英文字母是A的可能性,而認為中間這個英文字母是H。
如果你撕開左右的紙之後,看到的不是上圖,而是下圖:
{###_elleryhuang/7/1024047212.jpg_###}
你就會排除H的可能性,而認為中間這個字母是A了。
想不到搞怪的我接著給你看下圖:
{###_elleryhuang/7/1024047215.jpg_###}
這個句子乍看之下,你的腦袋自動用可能性最高的THERE IS A CAT來解釋。不過仔細一看,卻發現出現了矛盾,A這個單字的字母長得很正常,並不像C跟T中間的那個字母一樣;C跟T中間的字母反而長得像THERE裡面的H。於是你的大腦迫切需要更多的證據來解釋眼前所見。
你又撕掉句子右邊的紙,發現完整的句子如下:
{###_elleryhuang/7/1024047216.jpg_###}
你查了一下字典,發現有個單字就叫做CHTHONOPHAGIC,意思是「食土癖的」。你總算可以解釋眼前的一切,而確認一開始看到的那個奇怪的字母是H了。
當然你還是不能100%確定這件事,因為有可能這些單字根本就故意拼錯,也有可能這個句子根本就不是英文,或者根本是無意義的圖畫。但如果你不是哲學家的話,根本不需要考慮這種可能!就如同哲學家休謨所言:只有在書桌前,我才是個懷疑論者。
臨床醫生不是哲學家,面對的也不是書桌,而是病人。臨床醫生是一個必須解決病人問題的實踐家。因此醫生從來不、也無法去追求100%確定一個診斷,而只追求診斷的確定性超過治療閾值;因此醫生從來不、也無法去追求100%排除一個診斷,而只追求診斷的可能性小於檢查閾值。
醫生之所以要給病人下診斷,第一是為了預測病人之後會產生什麼症狀、減少多少壽命。第二是為了改變這些不好的後果而進行治療。
醫生之所以要排除某些診斷,第一是因為某些疾病可能會對病人造成嚴重的後果,甚至急速的奪走生命,因此及早排除才能使人安心,若是排除不了就要想辦法證實並介入治療。第二是為了縮小鑑別診斷的範圍,以利於下最終的診斷。
舉個實際的醫學例子:腦中風。
●腦中風的臨床診斷思路
說到腦中風,大家都知道一個人本來好好的,忽然臉歪一邊,半邊手腳無力,就是中風了。但其實事情沒那麼單純。
所謂腦中風,就是人的大腦、小腦,或腦幹,因為裡面的血管忽然塞住或爆掉,腦細胞缺乏血液帶來氧氣,或者受到血塊壓迫,而導致附近的腦細胞受傷死亡。
大腦控制我們的感覺、運動、語言等功能,小腦主要控制平衡感協調感,腦幹主要控制呼吸、吞嚥等維持生命的基本功能,因此又稱作生命中樞。上述這各個功能區域一旦因為任何原因而受傷,就會使相對應的功能減弱或喪失。
整個腦袋都需要血管,而有血管就有可能會塞住或爆掉,所以腦袋的任何地方都有可能會中風。因此,中風不一定只會臉歪一邊,半邊手腳無力。中風的病人有可能忽然看不見東西;有可能忽然聽不懂別人在說什麼,或忽然不會說話;有可能只是右手的手指覺得不靈活而已,也有可能整個身體都癱掉只剩下左眼可以動;有可能吞嚥困難,有可能感覺異常;如果小腦中風的話,也有可能像日劇《一公升的眼淚》裡面患有脊髓小腦退化症的女主角一樣喪失平衡感,甚至講話模糊。當然,臉歪一邊,半邊無力,的確是最常見的中風表現。
再者,腦細胞受傷死亡也不一定是血管塞住或爆掉導致的,就好比上面所說的脊髓小腦退化症。最後,臉歪一邊或者肢體某部分無力並不一定就是腦子出問題導致的,脊髓或者周邊神經出問題都有可能。
所以,腦中風病無法單純透過病人的症狀表現來確定診斷。那麼腦中風要怎麼診斷呢?
2011年4月25日 星期一
《醫生你到底在想啥?》之提高診斷確定性的診斷工具如何影響治療閾值
前面提到目前針對肺炎的診斷與治療,是以臨床症狀懷疑加上胸部X光的支持,使診斷肺炎的確定性達不算高的治療閾值。而我們之所以接受不接近100%的治療閾值,除了及早治療可以救更多病人的命之外,也需要瞭解,臨床醫生在診斷疾病的過程中,隨著診斷確定性的提高,病人必須付出越來越高的代價。
就像上面所舉的黑箱子裡的斑馬一樣;如果你用X光照,只能猜裡面是一匹任何一種具有長的像馬的骨架的動物,是馬的機率當然最高,但也有可能是斑馬,也有可能是驢子(假設全世界的人都跟我一樣不具有分辨馬、斑馬、驢子骨架的能力)。如果你想要確定裡面到底是馬、斑馬,還是驢子,你該怎麼辦呢?
第一個閃過腦中的想法當然是直接把黑箱子打開;但如果這個黑箱子根本沒有蓋子呢?你就只能鋸開這個黑箱子了。
在臨床醫學上,外科醫師直接動手術察看病人體內的病灶,甚至將病灶切下來交給病理科在顯微鏡之下診斷,就是類似鋸開黑箱子的方法。
聽起來很恐怖,沒有病人喜歡開刀。那麼有沒有不那麼可怕的方法呢?
聰明的你可能想到了,何不把黑箱子鑽一個洞,透過這個小洞不就可以知道裡面究竟是馬、斑馬,還是驢子了嗎?
類似的方法,在臨床醫學上就是各類的「鏡檢」及「切片」。例如想要知道胃有沒有發炎或潰瘍,就從嘴巴(天然的洞)伸一條光纖攝影鏡頭進去到胃裡面檢查,甚至可以切一小塊胃組織出來化驗,這就是胃鏡;想要知道肚子裡的腫瘤究竟是什麼,就在麻醉下給肚子打幾個洞,把肚子用氣體像氣球一樣灌得飽飽的,就可以插一根攝影鏡頭進去檢查腫瘤,甚至切一小塊出來給病理科醫師用顯微鏡診斷,這就是腹腔鏡;想要知道腎臟發炎的原因,就只有將腎臟組織放在顯微鏡下才能診斷得出來,所以就用一根粗針,在超音波的輔助下,從後腰刺進腎臟,取出一小塊腎臟組織來檢查,這就是「切片檢查」。
上述內視鏡、腹腔鏡、切片檢查等方法,已經是在對病人正常部位造成最小傷害的情況下,所能得到最高資訊的診斷工具了。
診斷所需的檢查工具給人體造成的不適與傷害越大,我們就會說這個檢查越具有「侵入性」(invasive)。
直接開刀探查或將病灶取出,當然是最具侵入性的檢查工具,病人不但必須忍受傷口的疼痛與疤痕,還要承受麻醉及開刀的風險。因此,醫生與病人當然希望能選擇侵入性沒那麼大的檢查工具。這時,內視鏡、腹腔鏡與切片檢查就是侵入性較小的替代方案。
雖然侵入性的檢查是如此不討喜,醫生的職責與目標就是必須綜合考慮病人的鑑別診斷、疾病嚴重度,以及治療的好處壞處,來決定病人是否進行一個侵入性的檢查,得到的好處會大於壞處。
再以肺炎為例。上面說過,一般肺炎的核心概念就是肺部組織的感染發炎,因此,要獲得趨近於100%的診斷確定性的話,就必須切一塊肺組織,拿到顯微鏡下診斷。
但這個切片的過程絕對不像我在這邊紙上談兵這麼簡單。我們胸壁的肌肉厚實,神經又豐富敏感,因此肺部切片的過程非常的痛,還有導致氣胸的風險。而且假設在切片的過程將細菌從肺裡面帶到肋膜腔,也就是肺臟跟胸壁中間的空腔,還有可能會導致肋膜腔感染。
再者,我們就是因為不確定倒底有沒有肺炎,才要進行肺部的切片,而現今的肺炎大部分都只感染到肺的一小部分。因此如果像我前面提到的十九世紀末的醫生一樣,憑著在胸部外面旁敲側擊,去猜肺的哪個部分可能有問題,就非常容易沒切到真正感染的肺部,而誤以為病人沒有肺炎。最後的結果,切片診斷的準確率一定沒有胸部X光還高。
因此,就算真的要切片,也會像懷疑肺癌而進行的切片一樣,利用電腦斷層掃瞄,先掃出有問題的是肺的那個部位再切。
但這麼做就顯得脫褲子放屁了。因為前面提到一個統計胸部X光對於肺炎的診斷準確度的研究,就是利用電腦斷層來當作肺炎的黃金診斷準則。這是因為目前認為電腦斷層診斷肺炎的準確度相當高,高到可以拿來作為病人還活著的時候診斷肺炎的黃金診斷標準了(至於準確度究竟有多高,可想而知我查不到相關文獻,因為真的要知道的話只有兩個辦法:要不給剛死於肺炎的人做電腦斷層,再驗屍看看電腦斷層究竟準不準;要不就給懷疑肺炎的人做電腦斷層,然後給他們的肺做切片來做為確定性的肺炎黃金診斷標準。可想而知這兩個方法都知易行難)。
綜合以上所述,肺臟的切片檢查侵入性很高,而且如果在不做電腦斷層的情況下做切片,準確度可能比胸部X光還低;而如果要做電腦斷層,則不用再加上切片,準確度就已經達到公認活人的肺炎黃金診斷標準了。所以,現代幾乎不會使用肺臟切片的檢查方法來診斷肺炎(但有可能懷疑是癌症而進行切片檢查,最後診斷不是癌症而是肺炎,這種情況比較常見是肺結核)。
那為什麼我們不常用電腦斷層來診斷肺炎呢?因為電腦斷層雖然相對不具侵入性,但卻具有輻射線,必須將此納入考量。再來就是掃一次電腦斷層非常貴。醫生為什麼要考慮檢查做起來貴不貴呢?如果病人願意自費的話,醫生當然不用考慮檢查的價錢,但台灣是健保制度的國家,電腦斷層這麼貴的花費,浪費的不是病人、也不是醫生的錢,是納稅人的錢。再者,錢的問題事小,電腦斷層大醫院才有,而且每間醫院也才幾台,如果每個懷疑肺炎的人都做電腦斷層,那將會有更多真正需要電腦斷層的人沒辦法做到電腦斷層,而枉送性命。
再來,前面也提到,針對肺炎,我們最在乎的是有沒有其實是肺炎的病人我們漏掉了沒有診斷出來(我們在乎診斷的「敏感性」),因為肺炎若及早使用抗生素治療的話可以大幅降低死亡率(治療帶給病人的好處如何影響治療閾值)。相對而言,我們比較不在乎其實不是肺炎的人被我們診斷為肺炎(我們較不在乎「特異性」),因為就算如此,抗生素治療的副作用也還可以接受(治療的副作用如何影響治療閾值)。這樣聽起來好像醫生不太在乎誤診為肺炎的正常人──事實上,我們不是不在乎那些無謂承受抗生素副作用的人,我們只是更在乎那些一旦誤診就會失去本可挽救的性命的人。本書後面會解釋,這兩者(敏感性與特異性)是難以兩全的。
我們來看肺臟切片或電腦斷層,就算真的要應用在診斷肺炎上面,考慮到檢查帶給病人的侵入性以及輻射線,不可能每個病人咳嗽咳嗽就給他切個片或照電腦斷層,就算醫生要,病人也不會想要。因此,只有在醫生很懷疑病人是肺炎,但又不是很確定的狀況下才會使用。而在這種狀況下使用切片或電腦斷層,只能抓出那些事實上沒有肺炎,但被懷疑為肺炎的人(提高診斷特異性),避免他們接受無謂的抗生素療法。而針對我們最在乎的那些「事實上有肺炎,但症狀表現輕微,因此醫生沒有高度懷疑為肺炎的病人」,因為根本不會被抓去做切片或斷層,所以根本沒辦法抓出原本就沒辦法診斷出來的肺炎病人(無法提高診斷敏感性)。你說為什麼不把症狀表現輕微的病人都抓去做切片或斷層?這就回到本段落一開頭的句子「考慮到檢查帶給病人的侵入性以及輻射線,不可能每個病人咳嗽咳嗽就給他切個片或照電腦斷層,就算醫生要,病人也不會想要」。
你可以將上個段落從頭念到尾再從頭念到尾,重複到理解為止,才能體會我的精心設計,你可能也有辦法自己悟出我後面才要講的敏感性與特異性無法兩全的道理。
剖析到最後,我們總算可以理解,要評估肺臟切片或電腦斷層究竟適不適用於提高懷疑是肺炎的病人的診斷準確度,需要知道的只有兩件事:第一,切片或斷層抓到的那些原本誤以為是肺炎的人有多少?他們被抓出來之後又可以避免掉什麼?(接受無謂的抗生素),這是此項檢查所帶來的好處;第二,切片或斷層的代價是什麼?(侵入性、輻射線、花費)這些代價是每個接受檢查的人都必須承受的,這是此項檢查所帶來的壞處。
最後,我們再權衡此項檢查所帶來的好處與壞處,最後就能決定此項檢查究竟值不值得應用。因此,肺臟切片或電腦斷層並不值得作為提高肺炎診斷準確度的常規檢查。
因此,我們也只得接受肺炎那80%左右的治療閾值。因為若要進一步提高治療閾值,就需要電腦斷層或肺臟切片,而剛剛分析過這對病人的壞處大於好處。
我們再用癌症做練習。為什麼幾乎所有的癌症都要求切片檢查才能(在手術前)確診呢?因為切片檢查可以抓出那些事實上不是癌症,卻被懷疑是癌症的病人,避免他們接受副作用極為強大的化學、放射或手術治療。而這個好處遠遠大於切片檢查的壞處:具有侵入性。
因此,幾乎所有的癌症在治療前都要求切片檢查以達到接近100%的治療閾值。至於我們必須懷疑病人有癌症的可能性到什麼樣的程度才進行切片檢查,則需要個別癌症討論,並且以大規模的統計研究為實證來評估。
除了治療方法的價錢以副作用外,檢查工具的花費在決定疾病的治療閾值也佔有一定的角色,就如同上面電腦斷層的例子一樣。臨床醫師要提高疾病診斷的可能性,靠的就是一些檢查,例如診斷貧血靠的就是抽血檢查血中的血紅素濃度低不低。貧血的病人臨床上可能會有站起來的時候頭暈,心跳快,感覺喘,眼檢白等等症狀,但是靠著這些臨床症狀與身體檢查所得到的資訊還不能讓醫生很確定貧血的診斷。而抽血檢查之後得到的結果幾乎可以確定病人有沒有貧血。因為抽血是一個很便宜的檢查,所以目前貧血必須要抽血才能診斷;假設抽一個血要花三百萬台幣,那麼貧血的治療閾值肯定會下降許多──醫生不需要抽血就能診斷病人有貧血了,這有可能正是貧苦未開發國家的現況。
從以上肺炎、癌症,以及貧血的例子我們就可以瞭解,治療閾值是如何受到檢查的代價(侵入性、輻射線與花費)所影響的。
我們可以用下圖來總結治療閾值的影響因子:
我們可以看到,隨著治療的副作用或花費越來越大,治療閾值也不斷提高,也就是我們必須很確定病人是這個診斷才進行治療,以使誤診而接受不必要治療的人數越少越好;反之隨著治療的好處越來越大,治療閾值也不斷降低,讓更多診斷還沒那麼確定的人可以接受治療;另外隨著檢查侵入性或花費越來越高,治療閾值也越來越低,以避免太多人承受檢查的代價(因為提高診斷準確性的手段就是進行檢查,因此降低治療閾值也就是免除了進一步的檢查)。
{###_elleryhuang/7/1024047211.jpg_###}
除了第一目標「診斷疾病以達到治療閾值」之外,臨床醫師蒐集臨床資訊還有「第二個第一目標」。
2011年4月19日 星期二
《醫生你到底在想啥?》之臨床實際的診斷過程之列出鑑別診斷
根據剛剛詢問以及檢查病人所得到的資訊,有哪些疾病可能造成病人的症狀呢?
列出所有的鑑別診斷,並不代表這所有的診斷可能性都是一樣的。例如一個關節痛的病人,經由觀察及詢問,你得到的資訊是:他是男性、四十五歲、愛喝酒、昨天中午左腳膝蓋開始劇痛,並且很快在當天晚上就痛到最高點。身體檢查之後,你得到的資訊是他左腳膝關節整個又紅又腫又熱又痛,其餘關節都正常。綜合以上資訊,你認為他最有可能是痛風發作,不過還不能確認,也有可能是細菌感染所導致的細菌性關節炎,至於撞到膝蓋所導致的發炎反應,雖然可能性不大,卻還不能排除。
有些診斷你覺得很有可能,但還不到能夠確定就是這個診斷的程度;有些診斷你覺得不太可能,卻又不到能讓你放心排除的地步;當然也有些診斷的可能性是介於兩者之間的。
{###_elleryhuang/7/1024047210.jpg_###}
在我剛開始學醫的時候,對於醫生診斷病人的臨床過程,有著這樣一個既簡單又錯誤的印象:醫生給病人抽抽血、照照電腦斷層,確定這個病人到底罹患什麼疾病,接著針對這個確診的疾病進行治療。
我在實習的時候,神經內科醫師蔡宗璋對我說過一段很發人省思的話:「神經內科很多疾病都是解剖許多屍體之後發現的;等病人死了之後解剖屍體才診斷出疾病還不簡單?但一個臨床醫師的最大意義就在於提早診斷(至少也得在病人死掉之前),以進行治療」。
臨床醫師最大的職責在於治療病人,將疾病帶給病人的痛苦或生命喪失減少到最小的程度。百分之百確定一個診斷,絕對不是臨床醫師的第一目標。
臨床醫師的第一目標是:藉由各種檢查蒐集臨床資訊,以進一步提高最可能的診斷的可能性,直到這個診斷的可能性高到我們所可以接受的程度,這個可接受的程度稱之為「治療閾值」,治療閾值越大,醫生就必須很確定你是這個疾病才會下這個診斷;治療閾值越小,醫生不需要太確定就可以下這個診斷了。
治療閾值的概念是這麼來的:醫生根據所有現代醫學的研究結果,認為只要病人有這個病的可能性大於某一閾質,我們對他進行治療所得到的好處就會大於壞處;相對來說,如果某人患有這個病的可能性小於這個閾質,醫生還是給他診斷這個疾病並進行治療,帶給他的壞處就會大於好處。當然,根據疾病相對應治療方法的好處壞處與花費、檢查的花費與侵入性,每個疾病的「治療閾值」都是不一樣的。
因為一個疾病的治療閾值越大,代表醫生必須非常確定病人就是這個疾病才下給他這個診斷,這樣做的結果就是只有少數並沒有這個疾病的病人會被誤診為這個疾病;而當治療閾值達到100%,代表完全沒有人會被誤診為這個疾病。
當一個疾病的治療閾值越小,代表醫生不需要非常確定病人是這個疾病就可以下這個診斷了,結果就是會有相對較多的病人被誤診為這個疾病。
什麼?我們怎麼能夠容許誤診的存在?為什麼不將每一個疾病的治療閾值都設定在百分之百?
●治療的副作用或花費如何影響治療閾值
如果一個疾病的治療方法便宜又沒什麼副作用,則這個疾病的治療閾值就不用太高,也就是說我們只要覺得這個病人有滿大的可能是這個疾病就可以下這個診斷了,不需要到十分確定的程度。因為就算有些人是誤診也沒關係,治療沒什麼副作用又不會花很多錢。例如一般感冒的治療只是症狀治療,並沒有很大的副作用,感冒藥也很便宜,所以連一般民眾自己覺得自己是一般感冒,就算沒有很確定,也自己診斷是一般感冒,自己跑到藥局買藥吃了。(這裡是在單純考慮一般感冒的情況下所做的假設舉例,並不代表實際上醫生什麼都不用做就將一個看起來像是感冒的人診斷為感冒是正確的;臨床實際上針對看起來像感冒的病人,醫生最重要的是「排除」其他看起來像感冒的嚴重疾病,下文詳述。)
相對於感冒藥的副作用小,癌症的治療方法,不論是開刀、化學治療還是放射線治療,副作用都非常大。因此,幾乎所有癌症的治療閾值都必須接近百分之百,也就是得把懷疑是癌症的組織切下來用顯微鏡來診斷是不是癌症(這個檢查的正式名稱叫做病理切片),確診之後才進行正式的治療。
●治療所帶給病人的好處如何影響治療閾值
又相對於一般感冒這種輕微的病毒感染,被細菌感染到肺部而產生的肺炎,若不治療的話死亡率非常高,尤其是老年人。肺炎的診斷概念就是肺臟組織的感染(成年人大多為細菌感染),因此要百分之百確定診斷,必須要切一塊異常的肺部組織來檢驗,看有沒有發炎以及細菌感染的情形。這種行為在現代看起來實在是匪夷所思,但在病理學與微生物學正蓬勃發展的十九世紀末,醫生對於懷疑肺炎但不確定的病人,真的會從體表插入一根針,去抽取肺部組織來確定是不是肺炎!(ref.: The fundamental data of modern pathology, 1900, p181)。
出於明顯的原因,現代的醫生當然不會再這麼做了。
現代的醫生要診斷肺炎,主要依靠病人的症狀以及身體檢查,加上胸部X光檢查。一個典型的肺炎病人,因為是細菌感染,所以會有發燒及心跳過快的情形;因為感染到肺部,所以會咳嗽,甚至有痰;因為肺部感染之後產生的「痰」卡在肺泡,所以用聽診器可以聽到「拈頭髮的聲音」以及呼吸音的異常(變小);就像腳扭到發炎會腫起來以樣,肺部感染發炎肺泡也會腫起來,或者嚴重一點肺泡裡面都是「痰」,胸部X光就可以看到肺部有一塊「白白的地方」。
可惜的是,光是靠症狀、身體檢查與胸部X光,並沒有辦法達到或接近100%的診斷確定性。例如就算一個病人同時具備發燒、心跳過快、呼吸音便小、聽診聽到拈髮音,而且他又不是氣喘,那麼他是或不是肺炎的機率也只有一半一半,而且這還是以胸部X光為診斷肺炎的黃金診斷標準所統計出來的結論(ref.: Heckerling PS et al, clinical prediction rule for pulmonary infiltrates, 1990)。
那麼胸部X光本身用來診斷肺炎又有多準呢?若以更準確的電腦斷層掃瞄作為診斷肺炎的黃金診斷標準,針對臨床症狀與身體檢查使醫生中度或高度懷疑是肺炎的長期臥床老人所做的研究,發現十個胸部X光診斷為肺炎的老人,就有接近兩個老人並不是肺炎!(Esayag Y, Diagnostic value of chest radiographs in bedridden patients suspected of having pneumonia, 2010)。
這個道理就跟一個黑箱子裡面裝著一隻動物一樣,若你想要在不打開黑箱子的情況下得知裡面的動物是什麼,可以用X光去照。結果X光照出來看起來是一匹馬的骨架,你以為黑箱子裡就是一匹馬了,沒想到卻是一隻斑馬!
現代臨床醫師診斷肺炎的實際臨床過程,就是先蒐集臨床症狀與身體檢查的資訊,若懷疑是肺炎,就安排胸部X光;若胸部X光看起來像肺炎,則診斷為肺炎,使用抗生素治療。
根據上面的研究,若以長期臥床的老人為例,臨床實際診斷為肺炎的病人,十個裡面就有兩個事實上不是肺炎!也就是說,這兩個不是肺炎的老人也會接受抗生素治療。臨床上之所以能接受這樣不是很高的治療閾值,是因為老人肺炎若不治療的話死亡率實在太高了!而使用抗生素治療可以大大降低死亡率,而且是越早用越好!若我們很龜毛而不能接受這樣低的治療閾值,堅持就算胸部X光診斷是肺炎也還要進一步作更確定的檢查,例如電腦斷層,或用內視鏡經過氣管直接伸到肺裡面看並沖洗痰液進行培養,甚至是切一塊肺下來檢查,這麼做只會延誤治療的時機,使得許多原本可以因為提早使用抗生素治療而存活下來的老人死亡。
事實上,如果是平常健健康康的年輕人得到輕微的肺炎,死亡率其實不高,因此抗生素治療的好處相對也就不大,如果病人越健康、越年輕、肺炎越輕微,診斷肺炎的治療閾值也應該提高,也就是說必須很確定一個年輕人得的是肺炎才進行治療。
相對來說,如果是一個有心臟病、肝硬化、在洗腎的九十歲老杯杯,得到肺炎的死亡率非常之高,所以臨床醫師只要稍微懷疑這類的病人是肺炎,就直接當成是肺炎在治療了。
在我剛進醫院實習的時候,幾乎有一半以上因為肺炎而住院的病人都是這些高危險的老杯杯老阿罵。這些病人我越看越多,發現他們都非常不像肺炎的病人,也讓我對肺炎這個診斷越來越難以理解。直到我看多書懂得本篇所提到的臨床診斷思路之後,才知道這些很不像是肺炎的病人裡面真的有很多事實上不是肺炎,只是因為他們得到肺炎的死亡率高,因此當作肺炎使用抗生素治療所得到的好處也大,才會有一點懷疑是肺炎就當成肺炎來治療。
其實不只是肺炎,大部分的感染疾病原則都是一樣:疾病越嚴重,死亡率越高的病人,治療閾值必須越小,也就是必須在診斷尚不明確的情形下及早治療。剛接觸臨床醫學的醫生們必須學會不被這些病人的模糊表現所迷惑。
以上就是以肺炎為例,說明治療所帶給病人的好處很大,使得治療閾值不高。這種現象,就好比俗諺「看到黑影就開槍」。
今天你是我軍負責看守營區的步兵,在一個月黑風高的夜晚,你發現有個黑影鬼鬼祟祟地接近營區,而且那個黑影手上似乎還拿著一把槍,你當然可以大叫「別動」,並且用手電筒照照看究竟是不是敵人。但在這麼做的同時,如果他真的是敵人,可能一槍就把你擊斃了。所以你選擇在還不是很確定黑影是敵人的狀況下,「看到黑影就開槍」,以避免自己被擊斃。
應用到臨床上,就是在還不是非常確定診斷的時候,就先進行治療。但是「看到黑影就開槍」的缺點就是有可能誤殺無辜,所以在臨床上應用上除了考慮治療帶給病人的好處以外,還必須像前文一樣,考慮治療的副作用。
像是本段所舉的肺炎例子,抗生素的副作用並不會很大,因此可以接受80%左右的治療閾值;如果今天治療肺炎用的是治療癌症的化學療法的話,醫生絕對不會接受80%的治療閾值了。
相對於肺炎因為抗生素治療帶給病人的好處極大而治療閾值不高,也有些疾病的治療閾值接近100%,因為根本沒有有效的治療方式。
神經內科的醫師有一句自嘲的名言:「什麼都知道,也什麼都不能做」(Know everything but do nothing)。因為神經內科的疾病又多又難,神經內科醫生要念非常多的書。但是神經內科醫師也真的非常厲害,用一張嘴吧跟雙手在病人身上檢查檢查,就可以推測病人是哪根神經或腦子的那個部位出了問題,核磁共振掃瞄一出來,果然是在那個部位。
但是神經內科醫師也很無奈,就算能夠很神奇地知道病人是哪根神經那個腦子部位出了問題,但很多神經內科的疾病都沒什麼有效的治療方法,例如鼎鼎大名的天文物理學家史蒂芬˙霍金所患有的俗稱「漸凍人」,或其他先天性的疾病等等。
蔡宗璋醫師也說:「一旦你給病人診斷是先天的疾病,就等於給病人判死刑」。因為這些先天的疾病是不會好的,也沒有有效的治療方式,因此,神經內科在下診斷的時候總是最後一個考慮這些先天疾病,並且先想辦法檢查看看病人是不是其他雖然機率不一定比較高但卻可以治療的疾病。
當其他診斷都已經被排除了,才會對這些先天疾病進行確定性的檢查,希望這個診斷是幾乎100%確診的,因為假使誤診其他可治療的疾病的病人為這些無法治療的診斷,等於是害這些病人失去治療的機會;另外,因為就算是正確診斷出來這些先天疾病,也沒有有效的治療方法,因此檢查並不急迫,不求快而求詳實準確。
以上就是以神經內科無法治療的疾病為例,說明因為治療沒辦法帶給病人好處,,使得治療閾值必須接近100%。
2011年4月17日 星期日
《醫生你到底在想啥?》之臨床實際的診斷過程
在十九世紀痛風的概念剛成熟的時候,加洛一定是先研究那些最典型的痛風病人,他們的表現就像上面說的一樣「急性發作,會在6到12個小時之內痛到最高點;會在兩個禮拜內緩解;只發生在一個關節,最多是在腳大姆趾;有外表可見的痛風石;病人尿酸偏高;病人之前可能會有很多次類似的發作……」,如果你每天觀察這些典型的病人,你腦中自然會形成痛風的概念了。
當然隨著醫學研究的進步,現代的醫生有辦法將一些表現完全不典型的病人診斷為痛風,但如果你將這些不典型的病人從時光機帶回19世紀,當時的醫生是絕對沒有能力診斷出痛風的!
●黃金診斷標準
第二個盲點是,對於「一個表現完全不典型的病人,最後我們診斷為痛風」這個過程,並不如想像中那麼單純。
醫生絕對不是看到這個表現完全不像痛風的病人,然後說:「啊!你就是痛風了。」
醫生是抽了這個病人關節裡面的水,發現裡面有尿酸結晶,才診斷這個表現完全不像痛風的病人為痛風的。
關節液裡面發現尿酸結晶,就是現代醫學對於痛風的「黃金診斷標準」(gold standard)。
Gold standard這個詞原本的意思是「金本位」的意思。金本位是一種金融制度,就是國家會把許多黃金存在金庫裡面,金庫裡面有多少黃金,就印多少鈔票。也就是說一個國家的鈔票有多少,取決於國家的黃金有多少。
黃金才是一個國家真正的財富,而鈔票只是反映黃金數量的一個方便使用的替代品罷了。
雖然金本位已經是一種被淘汰的金融制度,但它以一種隱喻的方式,存活在現代醫學的診斷思路當中。
●男人的診斷過程
假設「男人」是一種疾病的話,我們該如何來診斷一個人是不是男人呢?
首先,這個世界上的人不是男人就是女人,而且男人女人在聲音、長相、皮膚、肌肉、力氣、行為、第二性徵、第一性徵等等各方面都大不相同。
所以古代的人,或者你小的時候很容易就形成男人、女人的概念了。
古代的(還沒發明衣服的)人,或者你小的時候,光是直接看到一個人,或與之互動,你就知道他是男的還是女的,因此在這個階段,男人的黃金診斷標準就是「你說是就是了」!
可是慢慢地,隨著見到的人越來越多,古人跟你開始遇到一些「man man的女人」(花木蘭),或「娘娘的男人」。有些女人man的程度甚至你只看外表甚至跟他戶動之後,會誤以為是男人;同樣也有些男人娘到你很容易誤以為她是女的。或者常常你遇到一些小嬰兒,從外觀上根本就分不出來是男的還是女的。這時,我們就不能只憑外表以及與之互動後,就「診斷」一個人是男人。在必要情況下我們需要「驗明正身」,檢查一個人的第一性徵。在人類遇到這些情形之後,男人的黃金診斷標準就變成「第一性徵具有睪丸及陰莖」。
你問說為什麼我們是選擇「第一性徵具有睪丸及陰莖」,而不是「喜歡女人的人」或者「有喉結的人」作為男人的黃金診斷標準?
理由當然有很多而且輕易就可以想得到,若要認真討論的話可以再寫一本書了。
但其實以「第一性徵具有睪丸及陰莖」作為男人的黃金診斷標準這件事情,也是「大家認為是就是了」!
雖然如此,但黃金診斷標準的選擇並不完全是人類的主觀態度,而就像認知心理學所描述的那樣,是奠基於客觀世界男人的所有特性,在人類心中形成一個男人的原型概念之後,我們認為「第一性徵具有睪丸及陰莖」最能抓住男人這個概念的核心精神。
難道你覺得用「喜歡女人的人」來作為男人的黃金診斷標準比較恰當嗎?
接著,除了那些外觀行為分不出是男是女的人之外,古人甚至又發現一些人的第一性徵長得模稜兩可,或者發現一些人的第一性徵與內生殖器不相符合,例如外面看起來有陰莖睪丸,卻無法射精,死後解剖才發現體內只有卵巢而沒有睪丸。這些人我們稱之為「假性陰陽人」,之所以是「假性」,是因為這些人只有睪丸或卵巢其中之一,我們還是可以由睪丸或卵巢的存在來決定這些人真正的性別。
在人類遇到這些人之後,男人的黃金診斷標準就變成「內生殖器是睪丸」了。
除此之外,當然還有「真性陰陽人」,同時具有睪丸及卵巢,而外表則可能看起來像男人或女人。這些人就根本沒辦法符合傳統男人女人的概念。
●痛風的診斷過程
不論男人的黃金診斷標準是陰莖、睪丸(陰囊)等「第一性徵」,還是內生殖器睪丸,男人都不會把他的「黃金診斷標準」露在外面大落落的給你看。
同樣的,大部分痛風的病人並沒有外觀可見的痛風石,也不會自己抽好關節液跟你說:「唉!醫生,這裡面有尿酸結晶喔!」。
痛風的病人跟其他看起來很像痛風的關節炎的病人,只會跟你說:「醫生阿,我關節痛!」
接下來的四階段診斷過程,靠的就是醫生的功力了。
●第一階段:病史詢問(history taking)及理學檢查(physical examination)
如同上面所提到的,痛風常常是急性發作,會在6到12個小時之內痛到最高點;若是不治療的話幾乎會在兩個禮拜內緩解;大多只發生在一個關節,最多是在腳大姆趾;嚴重會有外表可見的痛風石。
因此,醫生當然首先要問你「是哪裡在痛呢?」
不要以為病人所說的「關節」就一定你以為的「關節」。每個人的知識水平不同,對於關節的概念也不一定一樣。臨床上有時就會遇到有病人跟你說他「關節」在痛,事實上卻是關節旁邊的骨頭或肌肉在痛;相反的也常常有人手指的關節在痛,卻只跟你說他「手在痛」的。
痛風是一種關節炎,一個只有關節旁邊的骨頭在痛的病人,當然不太可能是痛風;而一個發作在手指關節的痛風病人,卻可能因為只跟醫生說他「手在痛」,讓醫生忽略痛風的可能。
另外,醫生懷疑你痛風的話,就會繼續詢問你有沒有上述所說的痛風發作的病程特點。
靠著一張嘴巴問完你病史之後,醫生接著得拿出他的雙手(或冰冰的聽診器、大家最討厭的壓舌板、刺眼的筆燈),在你身上檢查檢查,發現有沒有什麼異常的徵象,可以提供醫生你究竟是得到什麼疾病的訊息。例如嚴重貧血的人眼瞼會蒼白、肺炎的人用聽診器可以聽到拈頭髮的聲音、肝硬化的病人會有腹水,而醫生可以透過一些技巧來檢查肚子有沒有腹水…。這個步驟,專有名詞就叫做「理學檢查」。理學檢查的原文是physical examination,就是「身體檢查」的意思,簡單明瞭,當初不知道是誰翻成了個文謅謅又詞不達意的「理學檢查」的。
如果醫生懷疑你的關節痛是痛風造成的,就會動手檢查你疼痛的關節,看看外表有沒有紅、腫、熱、痛等發炎現象。甚至看看關節或耳朵上有沒有看起來像痛風石沈積的東西。
當然,痛風會造成關節痛,不代表關節痛一定是痛風造成的。
除了痛風以外,醫生在心裡面還會列出一些可能造成關節痛的疾病,例如風濕性關節炎、關節受傷、細菌感染關節等等,然後根據每個疾病的特性以及疾病之間的差異點,詢問關鍵的問題,進行關鍵的身體檢查,以提供資訊來讓醫生鑑別這個病人的關節痛到底是什麼疾病造成的。
這些醫生根據病人主要抱怨的症狀(主訴)__關節痛,所列出來的疾病名稱,我們稱之為「鑑別診斷」(differential diagnosis)。
簡單來說,所謂鑑別診斷,就是所有可能造成患者症狀的疾病。
就好比柯南辦案,第一步總是得列出所有可能的嫌疑犯,再一個一個排除或確認;車行師傅修車,第一步也得懷疑幾個可能造成故障的機關,再一個一個排除或確認。
沒錯,這個「列出鑑別診斷」以及「再一個一個排除或確認」,就分別是醫生診斷疾病的第二、第三階段。
2011年3月16日 星期三
《醫生你到底在想啥?》之疾病概念的形成過程與臨床實際的診斷過程
__希波克拉底
你是一位風濕免疫科的醫生,有個十四歲的年輕人來到你的門診,他對你說:「醫生啊,我有痛風耶!趕快幫我治療吧!」
連兩千多年前的希波克拉底都發現年輕人很少得到痛風(包含現代的所有關節炎)了,為什麼上面那位十四歲的年輕人,居然跟醫生說他有痛風呢?
因為他不是醫生,他想要說自己有什麼病都可以__但不一定是真的。
所有醫學生必經的一段過程就是,當他們在學校寒窗苦讀,學到了許多關於各種疾病的知識,等到初次進入醫院,實際面對病人,才發現,原來病人的臉上不會寫著「我有膽囊炎喔!」,原來病人不會自己告訴你「醫生我有痛風耶!」。
就算偶爾遇到病人跟你說「醫生我胃潰瘍了,胃好痛喔!」你很高興地開給他胃藥,後來才發現他的胃好得很!原來是心肌梗塞!
這時,菜鳥醫生們才漸漸發現,原來現代醫學最重要的一環,是「診斷」。
那麼,醫生是怎樣診斷疾病的呢?
先問一個比較簡單的問題:你是怎麼樣診斷斑馬的呢?
●你是怎麼樣診斷斑馬的呢?
蛤?啥叫做診斷斑馬?
「診斷」這個詞,當然最常被運用在醫學上面,代表醫生從病人的疾病過程、症狀、檢查等等各方面所得到的資料,來推斷出病人所患的疾病的過程。
「診斷」這個詞是從「Diagnosis」翻譯過來的,「Diagnosis」又是衍伸自古希臘文「διάγνωσις」,意思是「discernment」,也就是「洞察」或「識別」的意思,並不侷限于醫生診斷疾病的過程。
所以,「你是怎麼樣診斷斑馬的呢?」的意思,其實就是在問「你是怎樣知道一隻斑馬就是一隻斑馬的呢?」
蛤?這是什麼蠢問題?我說是斑馬他就是斑馬啊!
這樣說一點也沒錯,但我們可以從前面提到的認知科學的角度,來剖析我們知道一隻斑馬就是一隻斑馬而不是草泥馬或馬英九的過程。
首先,我們至少要先形成「斑馬」這個概念,才能說一隻斑馬是斑馬。
「斑馬」這個概念的形成,首先需要這個世界上「確實存在許多斑馬」;而這些斑馬具有一些常常共有特性,例如「四肢細細長長的腿」、「長長毛毛的尾巴」、「黑白相間的斑紋」等等,這些特性產生視覺或觸覺訊息;或者這些斑馬幾乎都會發出「斑馬那獨特的叫聲」(不要問我斑馬的叫聲是怎樣的,因為我也不知道)或是斑馬走路產生的「達達」聲,這些特性產生聽覺訊息;或者斑馬斑馬擁有獨特的味道,產生嗅覺訊息。許多斑馬的這些視覺、觸覺、聽覺、嗅覺等訊息傳到人類腦中,再加上人類觀察到的斑馬的生活習性,或者斑馬與人類互動的一些特定模式,綜合在一起,就在人類的腦中形成了一個「斑馬的概念原型」。
同樣的過程一再上演,人類的腦中當然不會只有斑馬的原型,還會有「馬」、「草泥馬」、「馬英九」、「黃種人」等等你想得到的任何概念原型。
此時此刻,當你不斷地接收從視網膜傳來的事實上是雜亂無章的三色訊號、從耳膜傳來的事實上是糊成一團的聲波……等等,這些訊號會觸動到你腦中無數的概念原型,你的大腦會自動的挑出最適當的概念原型,來將你周圍的東西分類,你才會知道你眼前是一台電腦、一本書,或一隻班馬。
以上「知道一隻斑馬是一隻斑馬」、「知道一個東西是某樣東西」的「診斷」過程,可以總結為1)世界上客觀存在許多斑馬,且彼此大多具有某些特性;2)這些斑馬將自己的特性透過你的感官傳遞訊息到你的腦中;3)大腦將這些訊息統計歸納而產生「斑馬的概念原型」;4)有一隻斑馬跑到你的眼前;5)你腦中的「斑馬的概念原型」最能解釋眼前這隻斑馬所傳入你腦中的訊息;6)太好了!這是一隻斑馬!
這個「診斷」過程,可以再簡化為兩個步驟:以上的1到3點,也就是步驟一,概念的形成;4到6點,也就是步驟二,將已形成的概念套入面前的事物。
為什麼要將「知道一隻斑馬是一隻斑馬」這麼簡單的診斷過程,愚蠢地分為兩個步驟呢?
因為一旦瞭解這診斷的兩步驟,你才能理解更難理解的「疾病的診斷過程」。
這本《醫生你到底在想啥?》的最大特色,就是在介紹各個疾病時,會講清楚說明白這個疾病的概念產生的歷史脈絡。
剛進入臨床的菜鳥實習醫生,面對最大的困惑,就是以前在課本上都會讀到「肺炎的病人會咳嗽,但也有可能沒有咳嗽;會發燒,但也有可能不發燒;拿聽診器去聽胸部會聽到捻頭髮的聲音,但也有可能沒有;病人的白血球數目、發炎指數會升高,但也可能不升高;胸部X光可以看到一塊白白的,但也可能看不到……」。
在讀書的時候都會自動忽略每一句後面的「有可能不會」、「有可能沒有」,而認為肺炎的病人就是「會咳嗽、會發燒、聽診有捻髮音、白血球跟發炎指數升高、胸部X光一塊白白的」的病人。
等到進入臨床,才發現幾乎沒有一個病人是這樣的!
想像你從來沒有看過斑馬,你只看過書上說斑馬有「四肢細細長長的腿」、「長長毛毛的尾巴」、「黑白相間的斑紋」、「擁有斑馬那獨特的叫聲」、「走路時會達達作響」。
你真的很想要看看斑馬到底長什麼樣子,於是買了票去動物園。一走進去,迎面而來的是兩顆斑馬的牙齒,地上到處都是斑馬的腳印,耳邊都是斑馬的叫聲,路旁架著斑馬的骨頭標本。走進紀念品店,都在販賣斑馬胚胎的福馬林標本……,但是,就是沒有一隻真正的斑馬。
解說員不斷地跟你說,這是斑馬的什麼,這又是斑馬的什麼。你點頭表示瞭解,卻總是沒辦法在解說員開口之前認出這是斑馬的什麼什麼。
走出動物園後,你只想大聲問一句:「斑馬到底是啥!?」
你根本沒辦法建立正確的斑馬的概念,因為你沒有看到建立斑馬概念的那些人所看到的東西__活生生的斑馬。
醫學也是一樣。
●臨床醫學是啥?
現代醫學大部分疾病的概念,都產生於一個關鍵的時期,後文會詳細介紹這個關鍵時期有多關鍵。
在疾病個概念產生之後,緊接著是對於這個疾病的龐大研究,以及研究所得來的知識。
剛踏入臨床的初學者最納悶的一件事就是,為什麼每個病人的表現都跟課本寫的不一樣?為什麼大部分我看到的疾病的表現都不那麼典型?為什麼病人的診斷常常是模稜兩可?
「是不是那些疾病概念都是假的?都只是人類主觀意識下的社會建構產物?」
事實上,臨床醫師每天在做的事,並不是「看到一隻斑馬,然後大叫:這是一隻斑馬!」、「看到一隻猴子,然後大叫:這是一隻猴子!」。
臨床醫師每天在做的,是看到「斑馬的牙齒」、「斑馬的胚胎」、「斑馬的腳印」……,然後大叫:「這就是斑馬的XX!」。
而這個過程,就叫做「診斷」(diagnosis)。
還記得診斷的兩個步驟嗎?
步驟一,概念的形成。
現代醫學痛風的概念原型,主要成型於十九世紀。英國的醫生加洛,結合前人所觀察到的有關痛風的各種面象:大魚大肉的有錢人容易得、最常發生在大腳指、常產生外觀可見之痛風石、痛風石可以分離出尿酸等等。加上自己的研究發現,痛風病人血中的尿酸比較高。且首先使用「偏光顯微鏡」來鑑別尿酸結石。
再加上後來的流行病學家對痛風表現的統計研究,就形成了痛風的概念原型。
我在剛進入醫院實習的時候,遇到的最大疑惑,就是為什麼那些在各方面都不典型的病人,居然可以診斷為某某疾病?
例如:課本上告訴我們,痛風常常是急性發作,會在6到12個小時之內痛到最高點;若是不治療的話幾乎會在兩個禮拜內緩解;大多只發生在一個關節,最多是在腳大姆趾;嚴重會有外表可見的痛風石;病人尿酸常會偏高;病人之前可能會有很多次類似的發作……。
上面每一個痛風的典型表現,不是「常常」,就是「大多」,有的課本會列出一張表格,告訴你痛風的病人出現上述表現的比例是多少,從10%、60%、90%到99%……,就是不會有一個典型表現是所有的痛風病人都會有的。
這代表什麼呢?
這代表儘管比例非常少,還是有可能有一個病人完全沒有任何上述痛風的典型表現,我們居然還診斷他是痛風!
後來才知道,我這樣的想法有兩個盲點。
2011年3月13日 星期日
《醫生你到底在想啥?》之高尿酸血症
尿酸偏高的病人須攝取低普林食物,以免痛風發作,一項針對菇類、豆類、蔬菜所做的普林含量調查發現,近年被視為養生聖品的各種菇類,特別是珊瑚菇、秀珍菇,普林含量比動物內臟還高,尿酸偏高的人應減量攝取。尤其是痛風發作時,應避免吃養生菇的高湯,以免雪上加霜。
__2011年3月10號,中國時報,記者張翠芬
●高尿酸血症=痛風?
在現代醫學的疾病之中,痛風算是相對簡單的概念:尿酸沈積在關節腔所導致的關節發炎。
就像前面所說的,現代痛風概念的創始者加洛,早在十九世紀就已經發現痛風的病人血中的尿酸濃度比比一般人或是其他關節炎的病人還高。
血中的尿酸濃度過高,醫學上叫做「高尿酸血症」(hyperuricemia)。
高尿酸血症是一種疾病嗎?
高尿酸血症等於痛風嗎?
我們來看看痛風的人以及沒有痛風的人在血中尿酸的濃度上有什麼差別。
{###_elleryhuang/7/1024047209.jpg_###}
圖中橫軸是尿酸的濃度,越往右邊越濃;縱軸是相對應尿酸值的人數,越高人數越多。斜線的長條代表正常人,黑色的長條代表有痛風的人。
很明顯的,黑色長條也就是痛風的病人大概分佈在圖形的右邊,也就是尿酸濃度比沒有痛風的人還要高。
可是我們可以發現,大概在尿酸濃度6、7左右,兩者之間是有重疊的。
事實上,根據世界各地的科學家長久追蹤成千上萬的人發現,在高尿酸血症的人當中,有超過三分之二,一輩子都不會得到痛風!
由此可見,高尿酸血症絕對不是就等於痛風。
等等,我還沒介紹究竟血中的尿酸濃度要大於多少才算是高尿酸血症。
●高尿酸血症是啥?
從最傳統的生物統計學的角度來看,不管是尿酸值、身高、體重、血壓,還是血脂,在人群中的分佈都接近「常態分佈」,也就是比較常聽到的「鐘型曲線」。
{###_elleryhuang/7/1024047208.jpg_###}
一組常態分佈的數據,我們可以得到「平均值」,也就是那隻鐘最高、最中間的那點的值。
再來就是「標準差」,代表數據偏離或集中平均值的程度。
在距離平均值左右兩個標準差之內的數值,總共佔了所有數值的95%。
根據阿公阿嬤的觀點,醫學上的正常值,就是平均值左右兩個標準差以內;比平均值還要大兩個標準差以上,就是偏高的「不正常」。而這些「不正常」的人類,會佔所有人類的百分之2.5。
有人就會針對這種阿公阿嬷的醫學觀進行批評:現代醫學根據統計的資料武斷地訂出一個標準值,然後說超過這個標準值的人就是異常、就是有病、就要吃藥,實在是「很不科學」,這一切都是藥商為了牟利而使用的把戲!
這種針對阿公阿嬤的醫學觀所進行的批評是對的嗎?
我們從高尿酸血症的定義來看。
若用這種阿公阿嬤的統計學角度來定義高尿酸血症,會有兩個問題存在。
第一,事實上,尿酸值在人群中的分佈,並不呈現鐘型的常態分佈。(ref.: Asymptomatic hyperuricemia, Michael A Becker, MD, Uptodate)
第二,如上所述,高於平均值兩個標準差以上的尿酸值的人,也有三分之二以上的人活繃亂跳的,完全不會有痛風。
還有一個角度可以定義高尿酸血症。
因為我們關心的根本不是尿酸的值,而是病人會不會有痛風;而痛風是尿酸沈積在關節所產生的疾病。從生理化學的角度來看,尿酸在人體中飽和的濃度是6mg/dl,因此,我們可以據此定義高尿酸血症為血中尿酸濃度超過6mg/dl(EULAR evidence bases recommendations for gout, Ann Rheum Dis, 2006)。
但是這個高尿酸血症的定義也是有差不多的問題,因為雖然從理論上來說,尿酸在人體中飽和的濃度是6mg/dl,但從實際上來說,也有差不多超過三分之二以上血中尿酸濃度超過這個飽和濃度的人,居然不會在關節內產生尿酸堆積,也就是根本不會產生痛風!
那麼高尿酸血症到底是不是一種疾病呢?
一句話:關我啥事?
你可以說,痛風是尿酸在關節腔中沈積所導致的發炎反應,而且高尿酸血症的人比較容易得到痛風,所以高尿酸血症是一種疾病。
或者你也可以從另外一個角度來想,高尿酸血症的人三分之二以上一輩子都不會得到痛風,而且痛風的基本機制是尿酸的沈積,而不是單純的高尿酸濃度,因此高尿酸血症只能說是痛風的一個必要的前置因子,而不是一種疾病。
你可以發現,不管從那個角度去看待高尿酸血症,我們所根據的科學事實都是一樣的__重要的是科學研究所得到的那些醫學事實,至於高尿酸血症到底是不是一種疾病,只是我們腦中主觀的看法,是一個哲學問題,而且還是一個無聊的哲學問題。
所以我們可以瞭解了,關於現代醫學的阿公阿嬷觀點根本就不是事實__現代醫學所檢測的各種數值,若孤立來看待,根本就沒有意義。
現代醫學在臨床上測量各種數值,主要是為了兩個目的:第一,為我們診斷病人是什麼疾病來提供訊息;第二,讓我們預測病人之後會發生什麼事情。
為了達到這些目的,背後的基礎是許多醫學前輩們統計幾千幾萬人所得到的科學證據。
回到血中尿酸濃度的例子,科學證據給我們提供的訊息就是,大於三分之二以上的高尿酸血症的人一輩子都不會有痛風,而且痛風是很容易可以診斷,很容易可以治療,甚至可以完全復原,也有方法可以預防再發的。
因此,目前醫學界並不贊同對於無症狀的高尿酸血症的病人使用降尿酸的藥物,因為一來降尿酸的藥物有可能產生副作用,二來降尿酸的藥物並不是從天上掉下來免費的!
至於那不到三分之一的會得到痛風的高尿酸血症的病人,就等他們得到痛風再來治療吧!
可是,我們怎麼知道一個人是不是有痛風呢?
2011年3月10日 星期四
《醫生你到底在想啥?》之醫生我可以吃香菇嗎?__痛風
__《魔鬼辭典》(The Devil's Dictionary)安布羅斯˙比爾斯(Ambrose Bierce),1911
■在開始介紹痛風之前,先考考你對痛風的小常識吧!
以下對於痛風的敘述,是對還是錯呢?
請拿出一隻筆,在你認為是對的敘述前打○,錯的打〤
1.高尿酸血症→尿酸結晶在關節→痛風
2.嘌呤(purine)的代謝產物為尿酸,所以痛風的病人要少吃嘌呤含量高的食物,例如肉類、海鮮、乳製品、豆類、香菇、海帶等等
3.所以如果有高尿酸血症就要吃藥降尿酸
好了嗎?
就讓我們從魏娃娃的故事開始吧!
魏娃娃是個吃素的人,但卻患有痛風。
醫生跟他說,痛風的成因是尿酸在關節沈積,而尿酸是嘌呤的代謝產物,
所以痛風的病人絕對要少吃嘌呤含量高的食物,例如肉類、海鮮、乳製品、豆類、香菇、海帶等等。
魏娃娃心想:「我都已經吃素了,叫我連豆類、香菇都不能吃,那我還有食物嗎?」
這位醫生給魏娃娃的建議是適當的嗎?
究竟痛風是什麼樣的一個疾病呢?
●世界上最古老的疾病之一
從四千年前的埃及木乃伊身上,古病理學家就發現在關節有尿酸沈積。
痛風最常發作的地方在腳的大拇指的腳掌姆趾關節處,急性發作時呈現紅腫熱痛的發炎現象,
時間久了,會慢慢在關節腔內形成「痛風石」(tophus,副數形為tophi),
痛風石越來越大,就可以從外觀上看到關節處突出硬塊。
大約西元前四百多年,西方醫學之父希波克拉底(Hippocrates)時代的人,可能就是觀察到了腳指的痛風石,
而首先使用「podagra」這個詞彙。
Podagra這個詞彙來源於兩個希臘字根:
「pod-」是「腳」的意思,「agra」則是「發作」(seizure,原意為發作,現代醫學專指癲癇發作)的意思。(醫學英語詞彙學189,195)
Podagra的中文通常翻作「足痛風」,雖然從字源學上來看,
Podagra指的應該是「腳趾發作(的關節炎)」(最常見的就是痛風),
但從古人實際的用法來看,podagra藉由「轉喻」的修辭法,而擴大意義,
不但代表全身各關節所發作的痛風,甚至代表「任何的關節炎」!
(所謂轉喻,就是「以部分代整體」,或相對地「以整體特指其某部分」,來擴張或縮小概念的範疇,
例如「台灣」指的可以只是台灣島,但在實際使用上卻常常包括澎湖金門馬祖)
但為什麼Podagra所指的不只是痛風,還包括任何的關節炎呢?
痛風,現代醫學稱為「Gout」,這個名詞第一次出現在文獻上是在十三世紀:
「gutta guam podagram vel artiticam vocant -
'the gout that is called podagra or arthritis'」
(Gout,一般稱之為podagra或arthritis。)(ref.: a concise history of gout and hyperuricemia and their treatment)
gout來源於此拉丁字「gutta」,意思是「drop」(滴下來)的意思。
蛤?痛風跟「滴下來」有啥關係?
根據當時的醫學理論__四液學說,古人認為關節疼痛是因為體內的四種體液之一不平衡,
而「滴下來」(drop)或「流動」到關節而造成疼痛及發炎現象的原因,
因此從字源學上來看,gout指的是任何部位與型態的關節炎,並不專指痛風。
至於拉丁文「artiticam」則以其希臘文的形式「arthritis」流傳至現代,意義從古到今變化不大,
指的就是「關節炎」的意思,並不特指現代醫學的痛風,更不專指痛風足。
這段話首次使用了Gout這個詞,並且說gout就等於以前的podagra或arthritis,
很明顯地提示了我們,至少在十三世紀以前,podagra就等於arthritis就等於gout,三者都是關節炎的意思!
若我們用現代醫學的框架,便不能理解這種現象。
但我們已經擁有「蝴蝶隱喻」的基礎,便能從歷史的角度,來理解這種現象。
就像古代的奕迅人將蝴蘭蝶、台灣蝶、國民蝶以及民進蝶都稱作蝴蝶一樣,
道理很簡單,就只是因為「古人根本還沒發現彼此的區別」罷了!
因此也只能形成「蝴蝶」的概念,直到發明了顯微鏡、紫外線照相機之後,才能產生蝴蘭蝶、民進蝶等概念。
同樣的,古人根本沒辦法測量血中的尿酸濃度,也沒有偏光顯微鏡可以發現關節腔中的尿酸結晶。
就算蓋倫(Galen)在西元二世紀的時候描述了痛風病人患病關節中的「痛風石」(tophi),
但古人沒辦法知道除了(現代科學意義的)痛風以外的關節炎的病人的患病關節裡面「並沒有」痛風石,
而(現代科學意義的)痛風與其他關節炎在「臨床症狀上的區別也沒有大到足以讓古人認知到,而產生不同的概念」。
因此,以古人的認知條件,古西方醫學只能對於所有的關節炎,產生出一個概念,
這個關節炎的概念是以(現代科學意義的)痛風為典型(prototype),但外延(extesion)實際上包含現代科學意義上所有形式的關節炎。
●rheumatism是啥?
除了gout以外,古人也使用「rheumatism」這個字來指稱關節炎。
在西元二世紀,第一個使用rheumatism(os)這個字的人,就是第一個描述痛風石的蓋倫。
rheumatismos是希臘字,是從「rheuma」演變而來的,rheuma的意思是「流動」(名詞,flow),而rheuma又是從其動詞形式「rheo」(to flow)來的。(ref.: nosology versus pathology, two approached to rheumatic diseases illustrated by Alfred Baring Garrod and Jean-Martin Charcot)
rheuma或是rheo還留在許多現代各個語言的詞彙當中,例如「流鼻涕」的法文叫做「rhume」,英式英文則叫做「rhinorrhoea」(rhino是鼻子的意思)。
現代醫學中,以「rrhoea」(美式拼法則去掉o)作結尾的詞彙,都代表人體「流」出來的液體。例如還有「diarrhoea」(拉肚子,稀稀的大便流出來了)、「menorrhoea」(月經)、「leucorrhoea」「白帶」。
和gout一樣,rheumatism也體現了古醫學理論「四液學說」在建立疾病概念上的角色__過盛的體液流動到身體各處而產生疼痛。
Rheumatism的中文翻譯是「風濕」,是誰第一個這樣翻譯的,我也查不到文獻,希望有興趣的讀者可以幫忙查查。
●風濕是啥?
在古漢語中,代表關節炎最適當的詞彙應當是「痹」。
根據中醫古病名研究家__張綱醫師的考證,「痹」當為「丿乁」兩字連讀的合音。
「丿」古音與「拂」同,古無輕唇音,故讀起來類似「弼」(ㄅㄧˋ)。
「乁」古音與「戾」(ㄌㄧˋ)同,故「丿乁」兩字連讀即為「痹」。
「丿乁」是形容一個人走路的時候左彎右曲的樣子,正是肢體疼痛或關節或腫或痛的病人的表現。
大約成書於春秋戰國時期的中醫經典《素問》中,有這麼一段經典的描述:「黃帝問說:為啥會有「痹」呢?岐伯回答:風、寒、濕,三種邪氣一起入侵人體,就形成「痹」了。如果風氣比較重,就是「行痹」;寒氣比較重,就是「痛痹」;濕氣比較重,就是「著痹」。(黃帝問曰:痹之安生。岐伯對曰:風寒濕三氣雜至,合而為痹也。其風氣勝者為行痹,寒氣勝者為痛痹,濕氣勝者為著痹也。)
這裡古人利用當時的醫學理論來解釋痹(關節病)的原因。
相對於西方的四液學說,中國古代常用「六淫學說」來解釋病因。所謂六淫,就是「風、寒、暑、濕、燥、火」等六種外在的氣候,古人認為他們會入侵人體,造成各種疾病。所以,古人就利用各種疾病在病人身上表現出的症狀特性,來推測可能的病因(六淫)。例如「風」的特性就是「善行而數變」__喜歡跑來跑去、吹來吹去、流來流去,又會在短時間內忽然起風,忽然沒風,變化無常。因此,古人將「會在身體不同部位發作」的疾病,以及「急性發作」的疾病,都認為是風邪導致。流傳到當今民間的用語例如「風濕痛」(關節炎,以多處關節發病之關節炎為概念原型)、「傷風感冒」以及「中風」(急性發作)。
「寒」的特性則有「收引」(偏義復詞,意思就是「收縮」)以及「疼痛」__自然界東西遇到寒冷都會收縮,人也會縮成一團,還會「冷到發痛」。因此,在古文獻中,「寒」幾乎成為了「痛」的代名詞。流傳到當今民間的用語有例如「受風寒」__「忽然」感冒頭「痛」了。
至於「濕」,古人則取濕氣久留難以消散的特性,將一些反覆發作的疾病冠以「濕」之名,例如「濕疹」。
要注意的是,我們需從兩個角度來看待古人的六淫學說,才能正確理解古代中醫文獻。
先來說說兩種看待六淫學說的錯誤態度:
第一,認為六淫指的是「真實的」風寒暑濕燥火,且認為六淫學說到今日還是真理。抱著這種態度的人,便會以為痛風、中風、傷風感冒、風濕等等疾病,真的是因為吹到風的關係;濕疹、風濕真的是因為環境太潮濕的關係__這些當然都是不正確的。
第二,認為古人只是取六淫的特性來為疾病「命名」,而並不是以為風寒暑濕燥火真的入侵到人體。抱著這種態度的人,會很難理解古代中醫文獻。
事實上,真正面對六淫學說的態度應該要具有歷史的觀點,同時從以上兩個角度來切入。
從古代中醫文獻的描述便可以發現,古人是將風寒暑濕燥火等邪氣,視為真實存在,且確實入侵人體的。但是,古人的這種認知,當然大多出於主觀的想像,所以當然與現代醫學所發現的事實不符。因此,在閱讀古代中醫文獻時,我們必須「以古人之心為心」,將這些邪氣當作真實入侵人體的具體物;但同時又必須具有現代科學及現代科學的知識,體認到六淫學說大多出於古人的主觀想像,才能在正確理解六淫學說的同時,又不致對疾病產生錯誤的認知。
回到《素問》關於痹的那段話:「黃帝問曰:痹之安生。歧伯對曰:風寒濕三氣雜至,合而為痹也。其風氣勝者為行,寒氣勝者為痛痹,濕氣勝者為著痹也。」
有了上述對於「痹」的語源學以及六淫學說的認識,我們就能瞭解,所謂「痹」的概念原型,就是以「多處」關節「反覆發作」的「疼痛」為主的疾病。不過隨著歷史的演進,「痹」的涵義擴大而代表「不專指關節處的痛症」,所以喉嚨痛古稱「喉痹」。
因此,也就不意外在古文獻上對於關節炎,有「風寒濕痹」、「風濕痹」、「寒濕痹」等等稱呼,而又以風濕痹最為流行,等到近代利用風濕來翻譯西方醫學的rheumatism一詞,就使得「風濕」成為以關節疾病為典型,並且包含關節以外的肢體疼痛、甚至是其他免疫疾病的概念。
●帝王病__痛風!
如前所述,蓋倫在西元二世紀創造了rheumatism這個字來代表關節病。
之後到了十三世紀,又有人開始使用gout這個字來代表關節病。
Rheumatism跟gout這兩個字究竟有什麼區別呢?
答案是:根本沒有多大的區別,就算真的有人作出區別,大部分的醫生也搞不太懂!__直到十九世紀一個偉大人物的出現。
最常被描述的區別,大概就是Gout大多發生在常吃大魚大肉的達觀顯貴身上了。
但與其說痛風常發生在達觀顯貴身上,不如說古代的醫生很多只是將有錢人所發生的關節病稱作Gout,窮人所發生的關節病稱作rheumatism罷了!
安布羅斯˙比爾斯在1911年出版了一本用嘲諷語氣定義詞彙的《魔鬼辭典》,當中就是這麼定義Gout的:「醫生針對有錢人的關節病所取的名字。(a physician's name for the rheumatism of a rich patient)」
●現代痛風意義的開端
十八世紀初,尿酸被分離出來,並且在半個世紀後被人從痛風石裡面抽出來。
十九世紀,英國的醫生加洛(Alfred Garrod),首次對現代醫學意義的痛風(gout)提出了詳細的研究與描述。
加洛發現,痛風(就是那些大魚大肉的有錢人得到的關節炎)的病人血中的尿酸,比起其他關節炎的病人,要高出許多。並且使用現代依舊還在臨床上運用的「偏光顯微鏡」來鑑別尿酸結石。
●「類」風濕性關節炎是啥?
加洛一開始使用「rheumatic gout」(關節炎性關節炎?風濕性痛風?風濕性關節炎?關節炎性痛風?怎麼翻都不恰當,不翻比較好)來代表痛風以外的關節炎,後來加洛又覺得這樣的名稱容易跟gout或是rheumatism混淆,因此大約在1858年,發明了「rheumatoid arthritis」這個詞,也就是「類風濕性關節炎」,以與痛風以及「風濕性關節炎(rheumatism)」作區別。(ref.: nosology vs pathology in rheumatology)(風濕性關節炎也就是後來的風濕熱,鏈球菌感染觸發人體免疫反應而造成發燒、關節炎、心內膜炎等症狀,其名稱陸續有rheumatism、febrile rhematism、acute rheumatism、rheumatic fever、acute rheumatic polyarthritis等等)。(ref.: the history of bacteriologic concept of rheumatic fever and rheumatoid arthritis)
類風濕性關節炎這個名詞,對於醫學的入門者來講很容易搞混,常常就漏掉了「類」(-oid)這個字,而被醫學前輩們責罵,在瞭解了這個詞彙誕生的歷史脈絡以後,相信就不容易搞混了。
總之,在加洛之後,人們漸漸瞭解痛風這個疾病,是因為尿酸沈積在關節腔所造成的。又隨著生物化學、分子生物學的發展,瞭解尿酸是嘌呤的代謝產物,因而從理論上,建議痛風的病人少吃嘌呤含量高的食物,例如肉類、海鮮、香菇、牛奶、海帶、豆類。
這樣的飲食建議,不知道害了多少人……。
用最近在神經內科遇到的一個病人來回應DL 與DannyHung的討論
阿妃(化名),七十六歲,家庭主婦,有一天早上起來之後,忽然感到四肢無力,整個人癱倒在地上,於是阿妃被家人送到某醫院的急診。
急診醫師當然是先懷疑阿妃中風了,不過頭部電腦斷層掃瞄的結果卻是正常,之後做了核磁共振掃瞄頸椎,結果也沒有什麼異常的發現,所以阿妃並不是中風。
之後做了腰椎穿刺抽取脊髓液檢查,不像是細菌感染,因此神經內科的醫師就將阿妃當作是病毒感染到脊髓來治療,使用大劑量的類固醇以及抗病毒藥物。
打完藥之後,阿妃被送上病房住院,住院醫師來看阿妃時,阿妃口中還是不斷的說:「唉押中風了啦,唉壓不能動了啦,讓我死啦!讓我死啦」
隔天早上查房時,阿妃身輕氣爽地坐在床邊,剛從廁所走回來。
住院醫師檢查時發現,阿妃的力氣比他還要大!
從這個真實案例表面上看起來,好像抗病毒藥物跟類固醇神奇地治好了阿妃病毒感染脊髓所導致的四肢癱瘓(假設阿妃真的是病毒感染)。
但事實上,雖然從理論上來說,抗病毒藥物可以對抗病毒,類固醇可以消除脊髓的發炎反應,因此拿這兩者來治療病毒性脊髓炎應該是有幫助的,不過這種療法卻還沒有堅實的隨機對照試驗來證明其療效,因為這類的病人太少,早期診斷又不容易;再者,就算不治療,這種病人也有可能會自行好轉,所以我們不能從單一個案就說某個療法有效。不過這些都不是我舉出這個案例所要討論的重點。
重點是,假設阿妃四肢癱瘓之後,去找中醫,接受了針灸療法,過幾天後,可能就會有個中醫,大肆宣傳他用針灸治好了中風四肢癱瘓的病人。
2011年2月23日 星期三
《醫生你到底在想啥?》之疾病的蝴蝶隱喻
__美國哲學家阿佛列得‧科日布斯基(Alfred Korzybski)(《心智與自然》,Gregory Bateson,商周出版,75頁)
很久很久以前,在遙遠的納美星球,住著一群奇怪的生物。
這群奇怪的生物,與我們一樣有著雙手、雙腳、嘴巴、眼睛、耳朵、喉嚨......當然還有那比例異常大的大腦,我們就稱這些奇怪的生物為......「奕迅」好了。
在奕迅所生長的納美星球上,有著五花八門的奇特生物。
其中一種生物,長長的一條,軟軟的,全身上下都是毛,奕迅人就叫它們「Γαぃ¥ㄤ」,翻成中文就是......「毛毛蟲」(以下將直接翻成中文而不先寫出奕迅文字)。
還有一種生物,擁有一對薄如蟬翼的「3」字形翅膀,上面有著青天白日滿地紅的斑紋,奕迅人則稱它們為......「蝴蝶」。
有一天,有個奕迅人,發現一隻毛毛蟲的嘴巴居然吐出絲來,將自己纏成一塊,奕迅人就把這「塊」毛毛蟲給帶回家研究。
過了七七四十九天,奕迅人驚訝地發現,那個毛毛蟲絲塊,居然慢慢地從裡面被開了一個洞!
奕迅人本來以為從洞裡鑽出來的會是原本那隻毛毛蟲,沒想到卻是隻蝴蝶!
於是,這個奕迅人就抓了一大堆毛毛蟲回家研究,結果發現它們果然都會變成蝴蝶。
他將這個驚人的發現展示給所有的奕迅人看,從此,奕迅人便知道,原來毛毛蟲與蝴蝶是同一種生物,毛毛蟲是蝴蝶的小時候;蝴蝶是毛毛蟲的大時候。
而那位發現毛毛蟲與蝴蝶是同一種生物的奕迅人,被後世的族人冠以奕迅語中最高的頭銜__「陳」。
從此,奕迅人便尊稱他為「陳奕迅」。
與地球人不同的是,在陳奕迅的偉大發現之後,奕迅人就慢慢地不使用「毛毛蟲」這個詞彙,而使用「小蝴蝶」來取代之。
一千年後,奕迅人蕭敬騰發明了顯微鏡。
蕭敬騰很喜歡蝴蝶,甚至還寫了一首歌叫做《阿飛的小蝴蝶》。
有一天,蕭敬騰正欣賞著路上撿來的許多蝴蝶翅膀,忽然靈機一動,將蝴蝶翅膀放到顯微鏡下,看看能不能發現什麼。
結果他發現,這些蝴蝶的花紋在平常看起來雖然都是青天白日滿地紅,但在顯微鏡底下,卻有兩種不同的型態,一種是單純的青天白日滿地紅,一種卻可以看到肉眼所見不到的「蘭花」的圖案。
蕭敬騰進一步捕捉各地的蝴蝶來研究,發現原來這兩種圖案的蝴蝶分別喜歡生長在不同的環境,且只有同樣圖案的蝴蝶才能交配產生後代__原來納美星上存在兩種蝴蝶,只是它們從肉眼下來看並沒有分別,只有利用顯微鏡,才能分辨出擁有蘭花圖案的蝴蝶。
於是蕭敬騰將沒有蘭花圖案的蝴蝶改稱為「台灣蝶」,而稱擁有蘭花圖案的蝴蝶為「蝴蘭蝶」。
兩千年以後,奕迅人椎名林檎發明了可以照射紫外光的燈,以及可以顯影紫外線的底片,她將兩者結合,做成一台紫外線相機。
椎名林檎用紫外線相機來給許多台灣蝶照相,結果居然發現台灣蝶的花紋可以形成兩種不同顏色的顯像,分別是__藍色及綠色。
進一步研究發現,原來這在紫外光下顯現不同顏色的兩種台灣蝶,也有各自喜歡生長的環境,也只有同樣顏色的台灣蝶才能交配產生後代。
於是,椎名林檎將可以顯現藍色花紋的台灣蝶稱為「國民蝶」,綠色的為「民進蝶」。
疾病是什麼?
要回答「醫生你到底在想啥?」這個問題,首先要瞭解「疾病是什麼」。
受到西方傳統的哲學觀念影響,近代早期的醫學家認為,像是肺炎、新流感、類風濕性關節炎等等的疾病,是獨立於人類心靈而存在於客觀世界的實體,醫學的目的就是要發現並研究這些客觀的疾病實體。
後來,人們漸漸發現這種觀念並不符合實際。
例如,根據定義,人的血壓若收縮壓大於等於140毫米汞柱,或舒張壓大於等於90毫米汞柱,就是「高血壓」。
許多人對於這種疾病的定義十分地不舒服,收縮壓139就不是高血壓,140就是高血壓,差一毫米汞柱有差這麼多嗎?
紅斑性狼瘡的診斷標準有十一條,只要符合其中任何四條就可以診斷為紅斑性狼瘡。
也就是說,可以有一個紅斑性狼瘡的病人他符合診斷標準的其中某四條,而另外一個人他符合完全不同的另外四條,__這兩個表現完全不同的病人,居然都是患有紅斑性狼瘡!
更奇怪的是,有百分之五的紅斑性狼瘡的病人,居然不符合這個診斷標準!
有百分之五的不是紅斑性狼瘡的病人,卻能符合這個診斷標準!
醫生,你到底在想啥?
另一個極端
因為「疾病是獨立於人類心靈而存在於客觀世界的實體」這種觀念存在種種矛盾,人們可悲地走上了一個極端__認為疾病完全是人類心靈的虛構產物,是一種「社會建構」,是一種主觀的概念,是相對的而沒有絕對的真理知識。
這種思想產生了如下的文字:「分類思想給自己提供了一個基本空間。疾病只是存在於這個空間裡,因為這個空間把它構造成一個自然種類;但是它又總是顯得與那個空間不協調,因為它體現在實在的病人身上,呈現給予先武裝起來的醫生的觀察目光。」(臨床醫學的誕生8)
你不該驚訝為何有人寫得出這段不知所云的文字,而該驚訝居然有許多人認為自己讀得懂這段文字。
人類心靈世界與客觀世界之外的第三世界
西方哲學隨著心理學、語言學的進展,產生了當代最偉大的一門學問。
這門學問不但解決了西方科學哲學上「客觀與主觀」、「絕對與相對」的衝突困惑,也讓我們能夠瞭解,疾病究竟是啥,醫生你到底在想啥?
這門學問,就是「認知語言學」。
認知語言學是廣義的認知科學的一個分支,它的研究起自一個基本前提:「在語言和客觀世界之間,存在一個中間層次__『認知』」(認知語言學與隱喻研究3)
蝴蝶是為什麼是蝴蝶呢?
蝴蝶是為什麼是蝴蝶呢?
這個問題聽起來好像很蠢,但仔細思考,便會發現事情並不如我們所想的那樣單純。
事實上,古往今來、宇宙內外,沒有任何兩隻蝴蝶是一模一樣的!
那麼我們怎麼能將這些東西都稱作是蝴蝶呢?
從亞理斯多德以來,傳統的觀念是這樣的:
這些各不相同的東西,之所以都叫作蝴蝶,是因為它們都具有一些「本質特性」(essence)。
例如有薄薄的翅膀、會飛、會吸花蜜、是從毛毛蟲變成的、會交配產生新的毛毛蟲等等。
具有這些本質特性的,就是蝴蝶;反之,就不是蝴蝶。
蝴蝶與非蝴蝶之間,擁有清晰的界線__要嘛你是蝴蝶,要嘛你不是蝴蝶。
只要是蝴蝶,你就是蝴蝶,世界上每一隻蝴蝶在概念上具有平等的地位。
這種傳統的觀念很容易露出馬腳。
一隻受了傷,沒有翅膀的蝴蝶是不是蝴蝶呢?
當然我們都會說它是蝴蝶,可是它明明沒有翅膀阿!
假設今天發現了一種生物,「外表看起來就像是」蝴蝶,但這種生物卻不吸花蜜,而吸人的血!
這種生物還可以稱作是蝴蝶嗎?
當然我們都會說它是蝴蝶,那麼這種「吸血蝴蝶」跟「吸花蜜蝴蝶」,誰比較像是蝴蝶?
當然我們都會說吸花蜜蝴蝶「比較像蝴蝶」。
可是究竟什麼叫作「比較像蝴蝶」?
蝴蝶不都是蝴蝶嗎?什麼有些蝴蝶比較像蝴蝶,有些蝴蝶比較不像蝴蝶?
認知語言學
認知語言學解決了這些問題。
認知語言學認為,人類的概念當然根基於這個客觀世界所存在的物理條件。
我們之所以會產生「蝴蝶」這個概念,就是因為這個世界上「真的客觀存在有許多我們稱之為蝴蝶的東西」!
但是,這個世界上的蝴蝶每一隻都長得不一樣,而且如上所述,彼此之間也找不到一個毫無例外的「本質特性」。
所幸,「這個世界上的物件並不是以均勻且隨機的方式呈現出每一樣可被觀察到的特徵。存在這個世界上的物件,在特性上通常是呈現出一種一堆堆群聚的分佈狀況。擁有像棉花一般的生物通常也會擁有長耳朵,還喜歡住在樹林理的空地上(我們於是稱之為兔子);身上有鰭的的生物通常在身上也有鱗片,並且居住在水裡。除了再給小朋友閱讀的翻翻書裡可以見到由動手作作看得來的四不像怪獸以外,我們在這個世界上是絕對找不到長著鰭又有棉花尾巴的動物,或是長著兩片下垂耳朵的魚的。存在於我們心理的類別盒子之所以有用,正式因為這世上的是物本來就是以成堆的方式存在著,而這一堆堆的事物又恰好能夠被放進這些類別盒子頭的緣故。」(心智探奇424)
正因為這個世界上客觀存在一堆堆看起來很相似,但卻個別在某方面並不相同,因此沒辦法藉由傳統亞理斯多德式的的範疇觀點來產生「概念」。
正如認知語言學家的創始者__喬治˙雷考夫(George Lakoff)所主張:「所謂定義明確而未經污染的類別觀念其實只是神話而已。認為這種純淨觀念存在的想法,只不過是源自於我們總是想要找到事物定義的壞習慣而以__這習慣是我們由亞里斯多德那兒繼承來的。」(心智探奇429)
這時,人類的認知功能派上用場了!
原型理論以及地圖隱喻
人類的認知功能,透過感覺器官,接收外在客觀世界的實體所產生的訊息,加上這些外在實體與人類互動的模式,歸納而形成了各種概念的「原型」。
例如我一說「蝴蝶」,你腦中就會浮現你的「蝴蝶」原型,越符合這個蝴蝶原型的,就「越是一隻蝴蝶」!
換句話說,人類的主觀大腦接收外在客觀世界的訊息,形成了對應於這個世界的各種「概念」,因此,人類的概念系統既是主觀、又是客觀。
正如同認知科學的啟蒙者__希拉里˙普特南所提出的隱喻:「心靈和世界一起構成心靈和世界」(《理性、真理與歷史》3)。
人類的概念系統就好比地圖,大多數的地圖雖然是根據真實世界所畫的,但卻不等於這個真實世界__真實世界的每間醫院都長得不一樣,而且都不是長得像一個「紅色的十字」。
除了原型理論以及地圖隱喻之外,我們還需要瞭解一個隱喻,就可以進一步探索人類的「疾病地圖」。
疾病的蝴蝶隱喻
事實上,人類產生各種疾病概念的過程,正如同本書開頭所說的納美星奕迅人產生各種蝴蝶概念的過程一樣。
故事中,陳奕迅首先將蝴蝶的概念擴大為包含原本的毛毛蟲概念,正是因為發現了毛毛蟲蛻變為蝴蝶的過程,而糾正了原本認為蝴蝶與毛毛蟲是兩種生物的「認知錯誤」。
接著,蕭敬騰再將蝴蝶的概念細分為「台灣蝶」與「蝴蘭蝶」,則是因為發明了顯微鏡,而「多出了一種接收客觀世界訊息的管道」,發現了新的區別。
同樣地,椎名林檎也是因為發現了新的技術,而擴張了奕迅人接受客觀世界訊息的管道,才產生了「國民蝶」與「民進蝶」的區分。
經由蝴蝶隱喻,我們也可以體認到地圖隱喻所提示的「客觀世界與人類心靈互動的過程」。
在瞭解了原型理論、地圖隱喻,以及蝴蝶隱喻之後,本書接著就要介紹一些經典疾病概念形成的歷史脈絡,以及獲取這些疾病的相關知識的研究方法,最後詳述現代醫學面對這些疾病的診斷思路與治療想法,企圖讓各位讀者知道「醫生你倒底在想啥?」。