吸烟致癌的迷思是如何破除的?
20世紀50年代末60年代初,統計學家和醫生就整個20世紀最引人注目的一個醫學問題產生了意見沖突:吸煙會導致肺癌嗎?在這場辯論過去了半個世紀之后的現在,我們認為答案是理所當然的。但在當時,這個問題完全處于迷霧之中。
駁斥吸煙致癌假說的一個最重要的科學主張是可能存在某些不可測量的因素,同時導致了人對尼古丁的渴求和人患肺癌。這已經不是醫生第一次面對令人費解的因果問題了,醫學史上的很多里程碑式的發展成果都與特定病原體的識別有關。18 世紀中葉,詹姆斯·林德發現柑橘類水果可以預防壞血病。19 世紀中葉,約翰·斯諾發現被糞便污染的水導致了霍亂。(后來的研究發現了二者更具體的病因:缺乏維生素C 會導致壞血病,霍亂桿菌會引起霍亂。)這些杰出的發現都蘊含著一個幸運的巧合——其原因與結果恰巧是一對一的關系。霍亂桿菌是霍亂的唯一原因;或者,用我們今天的話來說,霍亂桿菌是霍亂的充分必要因。如果你沒接觸過霍亂桿菌,你就不會得病。同樣,缺乏維生素C 也是壞血病的必要因,而如果你缺乏維生素C 的時間足夠長,那么它也將是充分因。
吸煙與癌癥之關系的辯論挑戰了這種單一的因果關系概念。許多人吸了一輩子的煙,卻從未患肺癌。相反,有些人從不吸煙卻依然患上了肺癌。他們中的一些人可能是因為家族遺傳而得了肺癌,另一些則是因為接觸到了致癌物,還有一些人兩個方面的原因都有。
統計學家當時已經掌握了一種在更普遍的意義上確立因果關系的絕妙方法:隨機對照試驗。但是在吸煙的案例中,這個研究方法既不可行,也不合乎職業道德。你怎么可能讓隨機挑選出來的一些人吸上數十年煙,冒著很可能損害他們身體健康的風險,只為了看看他們是否會在30 年后患上肺癌呢?
如果我們用圖示表示出肺癌和煙草消費的比例關系(見圖1),二者的關聯就是不言而喻的。但時間序列數據對于因果關系的證明是一種非常糟糕的證據。1900年到1950年,許多其他的事情也發生了變化,它們同樣有可能是罪魁禍首,比如道路鋪設、含鉛汽油尾氣排放以及普遍的空氣污染。英國流行病學家理查德·多爾在1991年說:“汽車的普及就是一個新因素,如果我必須在當時所有那些因素中挑出一個真正的致癌物的話,我肯定會把賭注下在汽車尾氣或者用于鋪設公路的柏油上。”
圖1(美國人均香煙消費量(黑色曲線)和肺癌及支氣管癌死亡率(灰色曲線)的變化趨勢顯示出了驚人的相似:癌癥死亡率曲線比香煙消費量曲線延遲了大約30年,其形狀幾乎是后者的復制。然而,這種證據是間接的,不能證明因果關系。)
1948年,多爾和希爾進行了研究合作,共同探索癌癥流行的原因。希爾作為首席統計學家,在當年的早些時候發表了一項非常成功的隨機對照試驗。
希爾當然知道,在對吸煙是否致癌這一問題的研究上,隨機對照試驗是不適用的,但是他已經認識到了對比處理組和對照組這一方法的優勢所在。因此,他建議將已經被診斷為癌癥的病人與由健康志愿者組成的對照組進行比較,采訪每一組的成員,了解他們過去的行為和病史。為避免偏倚,他沒有告知采訪者其采訪對象是處理組的癌癥患者還是對照組的健康志愿者。
研究結果令人震驚。在649 名接受采訪的肺癌患者中,除兩人外其余均為吸煙者。這一結果在統計學上與隨機水平相去甚遠,是一件極不可能發生之事。多爾和希爾情不自禁地計算出了該結果的精確度:1 500 000∶1。此外,平均而言,肺癌患者的吸煙量也比對照組成員的吸煙量更大,但采訪也顯示,肺癌患者吸入煙霧的比例相對較小(注意,在之后的辯論中, 費舍爾就抓住這一結果中的矛盾進行了激烈的攻擊)。
多爾和希爾將“病例”(患有疾病的人)與對照組進行了比較,因此這種研究類型現在也被稱為“病例—對照研究”(case-control study)。相對于時間序列數據而言,借助這種方法搜集數據顯然是一種進步,因為研究人員可以控制包括年齡、性別和所接觸的環境污染物等混雜因子。然而,病例—對照設計也存在一些明顯的弊端。首先,它是回顧性的,這意味著我們已知研究對象患有癌癥,在此前提下我們要回顧過去找出原因。其次,它的概率邏輯也是反向的,這些數據告訴我們的是癌癥患者是吸煙者的概率,而不是吸煙者患癌癥的概率。對于那些想知道是否應該吸煙的人,吸煙者患癌癥的概率才是他們真正關心的概率。
此外,病例—對照研究承認存在幾種可能的偏倚來源。其中之一被稱為“回憶偏倚”:雖然多爾和希爾確保了采訪者不知道其采訪對象是否患有癌癥,但被采訪者本人肯定知道他們自己是否患有癌癥,而這一事實很可能會影響他們的回憶。另一個來源是選擇偏倚:已入院就醫的癌癥患者絕不是整個人口總體的代表性樣本,甚至不能作為吸煙者總體的代表性樣本。
接下來的幾年里,在不同國家進行的19個病例—對照研究基本上都得出了類似的結論。但正如費舍爾毫不在意地指出的那樣,一項有偏倚的研究重復19次也不能證明任何事情,它仍有偏倚。費舍爾在1957年寫道,這些研究“僅僅是同類證據的重復,因此,我們有必要嘗試檢驗一下這種研究方法是否足以得出任何科學結論”。
多爾和希爾意識到,如果病例—對照研究中的確存在隱藏的偏倚,那么僅僅靠重復研究肯定是無法消除偏倚的。因此,他們于1951年開始了一項前瞻性研究,向6萬名英國醫生發放調查問卷,采集關于其吸煙習慣的信息,并對他們進行追蹤調查。(美國癌癥協會也在同一時間發起了一項類似的、規模更大的研究。)在短短的5年里,一些戲劇性的差異就出現了。
在接受了追蹤調查的醫生中,重度吸煙者患肺癌死亡的概率是不吸煙者的24倍。在美國癌癥協會發表的研究結果中,情況甚至更加嚴峻:一方面,吸煙者死于肺癌的概率是不吸煙者的29倍,而重度吸煙者死于肺癌的概率更是不吸煙者的90倍。另一方面,曾經吸煙,然后戒煙的那些人,其患病風險降低了一半。所有這些結果都表明了一個一致的結論:吸煙越多,患肺癌的風險就越高,而戒煙能降低這種風險。這是一個強有力的因果證據。醫生們稱此類結論為“劑量—響應效應”(dose-response effect):如果物質 A會導致生物反應B,則通常而言(但不是百分之百),更大劑量的A會導致更強的反應 B。
前瞻性研究仍未能將吸煙者與其他各方面都相同的不吸煙者進行比較。事實上,這種比較是否可行值得懷疑。畢竟,吸煙是吸煙者的一種自我選擇。在許多方面,他們都可能與不吸煙者有著基因或“體質”上的不同,比如有更多的冒險行為,更易飲酒過量等。其中一些行為同樣可能會對健康造成不良影響,而這些不良影響可能被錯誤地歸咎于吸煙。對于懷疑論者來說,這是一個特別便利的論據,因為體質假說幾乎不可檢驗。直到2000 年人類基因組測序工程開啟之后,尋找與肺癌相關的基因才成為可能。
對于體質假說,杰爾姆·康菲爾德與亞伯·利連菲爾德于1959 年共同發表了一篇論文,逐一駁斥了費舍爾的論據。康菲爾德把目標直接對準了費舍爾的體質假說,并在費舍爾的領域——數學中闡述了他的駁斥。他認為,假設存在一個混雜因子,比如吸煙基因,它完全地解釋了吸煙者患肺癌的風險。如果吸煙者患肺癌的風險為常人的9 倍,那么在吸煙者中,這種混雜因子存在的概率也需要至少比常人高出9 倍,如此才能解釋這種患病風險的差異。讓我們思考一下這意味著什么:如果有11% 的不吸煙者攜帶“吸煙基因”,那么就至少有99% 的吸煙者一定攜帶吸煙基因。而如果有12% 的不吸煙者碰巧攜帶這種基因,那么從數學的角度看,“吸煙基因”就不可能完全解釋吸煙和癌癥之間的相關。對生物學家來說,這個被稱為“康菲爾德不等式”(Cornfield’s inequality)的論證瓦解了費舍爾的體質假說。因為在現實中,我們很難想象基因方面的某個差異可以如此緊密地與某人選擇吸煙這種復雜的、不可預知的行為和意愿聯系在一起。
康菲爾德不等式實際上是因果論證的雛形:它提供了一種標準,讓我們可以在因果圖2(此種情況下,體質假說無法完全解釋吸煙與肺癌之間的關聯)和因果圖3(此種情況下,吸煙基因的存在能充分解釋我們觀察到的關聯)中做出裁定。
圖2 (反體質假說因果圖)
圖3 (體質假說因果圖)
盡管流行病學家早已對此問題達成了共識,但在此后很長一段時間里,吸煙與癌癥之關系在公眾眼中仍然存在爭議。即使是本該更積極地響應科學號召的醫生們也心存疑慮:美國癌癥協會在1960年進行的一項民意調查顯示,美國只有1/3的醫生認同吸煙是“肺癌的主要原因”,而43%的醫生自己就是吸煙者。
雖然我們現在可以公正地批評費舍爾的頑固和煙草公司的蓄意欺騙,但也必須承認,當時的科學家一直是在一種僵化的思想框架下開展工作的。費舍爾提倡隨機對照試驗,并將其視為評估因果效應的一種高效的方法,這完全沒錯。然而,他和他的追隨者沒有意識到的是,我們從觀察性研究中也可以學到很多東西。這就是因果模型的好處:它能夠調用研究者業已掌握的科學知識來分析新問題。費舍爾的方法實際上是在假設研究者對所要測試的假設沒有預先的知識或看法。他們把無知強加給科學家,而這正是吸煙致癌論懷疑者在這場爭論中樂于利用的優勢。
由于科學家不具備對“導致”這個詞的明確定義,也無法在隨機對照試驗不適用的情況下確定因果效應,因此,對于吸煙是否會導致癌癥的爭論,他們的準備是不充分的。他們被迫摸索著尋找一個定義,這一尋找過程貫穿了整個20 世紀50 年代。
(本文整合自《為什么:關于因果關系的新科學》)
《為什么:關于因果關系的新科學》
作者:朱迪亞·珀爾,達納·麥肯齊
出版社:中信出版社
***粉絲福利***?
?評論區留言,點贊數前三可獲得此書,以48個小時計!
————
編輯?∑Gemini
?泰勒定理的奇聞軼事
?丘成桐:漫談微分幾何
?Leibniz 如何想出微積分?(一)
?線性相關和秩的物理意義
?數學史上你認為最丑陋的公式是什么?
?陶哲軒談什么是好的數學
?田淵棟:數學的用處(下篇)
?你絕對沒想過原來數學家這么流氓,一言不合就進行暴力證明
?世界上最牛的五篇博士論文
?數學中有哪些巧合讓人眼前一亮?
?算法立功!清華畢業教授美國被搶車,警察無能為力自己用“貪心算法”找回
?學術史上的奇文:怎樣用數學抓獅子
?臺大教授的反思:最難的一課 我們卻沒教給學生
?麻省理工學院(MIT)研究生學習指導—— 怎樣做研究生
?分享 數學,常識和運氣 ——投資大師詹姆斯·西蒙斯2010年在MIT的講座
算法數學之美微信公眾號歡迎賜稿
稿件涉及數學、物理、算法、計算機、編程等相關領域,經采用我們將奉上稿酬。
投稿郵箱:math_alg@163.com
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的吸烟致癌的迷思是如何破除的?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 黑洞照片背后的女人:她的算法让数据“拼”
- 下一篇: 我在网上抢火车票:多加了100元的加速包