如何像流行病學家一樣思考

在這個病毒肆虐的時代,保留既有知識與信念可能出錯的空間,是讓我們在面對未知時迅速採取正確對策的重要心法

統計學有一句名言,有時會作為挖苦的批評,有時則是真誠的建議,而對我們這個時代而言,幾乎沒有比這更好的座右銘了:

更新你的先驗!

統計學術語所謂的「先驗」,指得是在看到證據前就具備的知識和信念,而這些知識和信念會存在不可避免的模糊地帶與不確定性。證據的出現會促使我們更新先驗;然後更多的證據會促使我們再進一步更新,依此類推。這種反覆更新的過程提高了確定性,並產生連貫的累積知識。

例如,在疫情爆發初期,人們認為 COVID-19 不太可能透過空氣傳播,但有鑒於愈來愈多科學證據出爐,世衛組織於是在 7 月初承認空氣傳播是其中一個因素,尤其是在室內。世衛組織更新了其先驗信念,進而改變了建議。

這就是「貝氏定理」的核心。這個得名自 18 世紀長老教會牧師兼數學家的湯馬斯‧貝葉斯(Thomas Bayes)的推論方法,處理了機率方面的不確定性;換言之,貝氏定理或規則,是一種根據觀察到的證據,而合理更新先驗信念和不確定因素的法則。

在貝葉斯過世兩年後、1763 年出版的《以機會論解決問題》(An Essay Towards Solving a Problem in the Doctrine of Chances,暫譯)中,貝葉斯闡述了他的想法。此篇論文當中就包含了貝氏定理,並經傳教士兼數學家理查‧普萊斯(Richard Price)編修完善。幾世紀以後,由電腦運算支援的貝氏框架及方法,成為流行病學與其他科學領域中各種模型的核心。

正如哈佛大學傳染流行病學專家馬克‧利普西奇(Marc Lipsitch)在 Twitter 上指出的,貝氏的推理方式非常接近他對「理性」一詞的初步定義。「隨著我們學到更多,我們的信念也應該改變,」利普西奇在接受採訪時說。「一種極端是堅決相信自己原本的想法是對的,不受新資訊的影響;另一種極端則是全盤接受最新獲取到的那個資訊。粗略地說,貝氏推理是將過往思想與近期新知互相整合,並賦予兩者適當權重,進而得出結論的一種原則。」

由於出現了像 COVID-19 這樣充滿各種未知數的新型疾病,人們對於確立出模型參數很感興趣:基本傳染數是多少?新病例出現的速度有多快?有多致命?感染後死亡率(即病毒的致死率:確診者中不治身亡的人數比例)又是多少?

但佛羅里達大學生物統計學助理教授娜塔莉‧迪恩(Natalie Dean)認為,試圖建立一套固定數字的意義不大。

「我們應該減少關注單一『真相』的工作,而更專注於建立合理的範圍,並認知到真實數字可能會因人口結構而異,」迪恩說。「貝氏分析使我們能夠清楚地含括這種變異性,然後透過模型複製傳播這種不確定性。」

貝氏定理的一個典型應用案例,就是針對 COVID-19 進行的血清測試,目的是尋找病毒抗體的存在。所有測試都不完美,抗體測試的準確性取決於許多因素,例如該疾病的罕見或普遍性就是關鍵之一。

美國食品藥物管理局(FDA)在今年 4 月核准了第一個 SARS-CoV-2 抗體檢測,結果出錯和正確的次數看似不相上下。有了貝氏定理,你便得以計算出你真正想知道的事:測試結果正確的機率。正如 Twitter 上一則評論所說:「理解貝氏定理現在成了生死攸關的事。」

不確定性的邏輯

哈佛大學統計學家喬瑟夫‧布利茲斯坦(Joseph Blitzstein)在他的熱門課程「統計學 110:機率」中探討了貝氏分析的實際效用。關於這堂課的入門介紹,他在第一堂課中說:「數學是確定性的邏輯,而統計學則是不確定性的邏輯。每個人都有不確定性。如果你對每件事都有 100 % 的把握,那麼你就有問題了。」

在第四堂課結尾,他教到了貝氏定理——他最愛的一個定理,因為它在數學上很簡單,但在概念上卻很強大。

「從字面上來說,證據就只是一行代數,」布利茲斯坦說。這個定理實質上可以簡化為一個分數;表示在事件 B 發生的情況下,事件 A 發生的機率。

P ( A | B )=P ( B | A ) P ( A ) / P ( B )

貝氏定理:事件 B 為真時發生事件 A 的機率=A 為真且發生 B 的機率 × A 為真的機率 ÷ B 為真的機率。P 表示機率。

「天真的你或許會想:從那東西上能得出些什麼?」布利茲斯坦說。「事實證明,這會產生令人難以置信的深遠影響,並適用於幾乎所有的研究領域」——從金融、遺傳學、政治科學到歷史研究。貝氏方法也用於分析警務執行中的種族差異(評估警員在攔檢時搜查駕駛與否的決定),及搜救行動(增加新資料,逐步縮小搜查範圍)。

認知科學家會問:「大腦是依循貝氏主義運作的嗎?」科學哲學家則假設,整個科學就是一種貝氏過程,常識亦然。

拿醫學篩檢來說。在當前這種情況下,貝氏定理的建立,可能會先設定事件「T」代表篩檢結果為陽性;事件「C」代表有 COVID-19 抗體:

現在,假設這種病的盛行率為 10 %(也是春季紐約市的實際數據),而在一項真陽性率為 87.5 %、真陰性率為 97.5 % 的篩檢中,你被驗出陽性結果。透過貝氏定理計算以上數值,該結果正確而你確實有抗體的機率為 79.5 %。考慮到各種因素下,這數字還算漂亮。如果你想要更有把握,可以去詢問第二位醫生的意見,並繼續謹慎防疫。

P ( C | T )= P ( T | C ) × P ( C ) / P ( T )

檢測結果為陽性時,具有 COVID-19 抗體的機率=具有抗體時檢測結果為陽性的機率(即真陽性率)×具有抗體的機率(即盛行率)÷檢測結果為陽性的機率。

已知染病才會有抗體,有抗體則代表必定感染,故具有抗體的機率 P(C)=盛行率 10%;具有抗體時檢測結果為陽性的機率 P(T|C)=真陽性率 87.5%

再算出檢測結果為陽性的機率 P(T)=10% × 87.5%+(100%-10%)×(100%−97.5%)= 11%

故可得檢測結果為陽性且具有抗體的機率 P(C|T)= 87.5% × 10% ÷ 11% = 79.5%(取小數點後一位)

一群研究人員、醫生和開發者組成的國際團隊建立了另一種貝氏策略,將測試結果與一項問卷調查搭配使用,以便更準確評估測試結果是否可能為假陰性或假陽性。這個贏得兩次駭客松比賽(hackathon)的工具,蒐集了情境式的資訊:你在封城期間有出門上班嗎?你採取了哪些避免感染病毒的措施?你家中有人感染 COVID-19 嗎?

研究團隊一員、甫獲得美國史丹佛大學統計學博士學位的克萊兒‧多納(Claire Donnat)形容這「有點類似擁有兩名『醫學專家』的狀況」,一位專家可以瞭解患者的症狀和背景,另一位則進行篩檢,將這兩種診斷結合起來,可以得出更精確的數字和更可靠的免疫預估值。先驗會透過訊息的匯整進行更新。

「隨著新資訊的加入,我們一直在更新我們的先驗,」史丹佛統計學者蘇珊‧福爾摩斯(Susan Holmes)透過葡萄牙鄉村不穩定的網路說道,她去那探望母親,結果意外因疫情滯留了 105 天。

而這便是她精修與多納共著的預印本論文的基礎,廣義而言,該篇論文提供了貝氏分析的另一個範例。這份於今年三月進行的早期研究,觀察了大流行病的可能演變方式,並發現正統的流行病學模型傾向使用固定的參數或常數作為傳染數,例如將基本傳染數(R0)設定為 2.0。

但事實上,傳染數取決於諸多隨機的不確定因素:病毒量和易感染性、行為和社交網絡、文化和社會經濟階層、天氣、空調和未知因素。

以貝氏角度來看,這種不確定性會被編譯成隨機性符碼。研究人員會先假設傳染數有各種分布類型(先驗)。然後,他們使用一個「會波動的隨機變數」替這種不確定性進行建模,取值範圍小至 0.6,大至 2.2 或 3.5。在互相套和(巢套)的過程中,該隨機變數本身也具有會隨機波動的參數;而且那些參數又同樣具有隨機參數(即超參數)等。福爾摩斯說,這些影響會累積到「貝氏階層」中,「永無止盡地累積下去。」

所有上下隨機波動的影響,都會像複利般成倍增加。結果,該研究發現,在傳染數計算上使用隨機變數,可以更實際地預測那些風險高、發生率低的極端事件,即較罕見但事關重大的超級傳播者事件。

然而,若沒有貝氏模型作為指引,人類對於掌握單一事件風險的能力可謂糟糕透頂,罄竹難書。

「人們,包括很小的孩子,都可以、也確實會不自覺地使用貝氏推理,」加州大學柏克萊分校的心理學家艾莉森‧戈普尼克(Alison Gopnik)說。「前提是,他們要有事件發生頻率的直接證據。」

在疫情下,引導我們行為的許多資訊都關乎機率。例如,有估計指出,若感染了冠狀病毒,那麼你將有 1 % 的機會死亡。但實際上,根據年齡和其他因素,個人死亡率可能相差千倍,甚或更多。戈普尼克說,「對於像疾病這樣的事件,通常大多數證據會是間接的,人們非常不擅長處理條列式的機率資訊。」

建立謙虛的模型

即便有了證據,修改信念也不容易。即便有了證據,顯示無症狀傳播是因素之一,而口罩是有效的預防措施,科學界仍在更新其對 COVID-19 無症狀傳播的先驗知識上舉步維艱。可以說,這導致了全球對於該病毒的遲鈍反應。

「我們不更新時,就會出現問題,」統計學者大衛‧斯皮格哈爾特(David Spiegelhalter)說道,他也是劍橋大學溫頓風險與證據溝通中心(Winton Centre)的主席。「你可以將確認偏誤、和我們種種應對失當的作法,都解讀成是我們的信念修正得太慢了。」

關於貝氏定理的缺點,是有辦法彌補的。斯皮格哈爾特喜歡一種稱為「克倫威爾法則」的方法,他説此法「妙極了。」1650 年,英格蘭聯邦護國公奧利佛‧克倫威爾(Oliver Cromwell)在給蘇格蘭教會的一封信中寫道:「我懇求您,以基督腑臟之名,想一想您出錯的可能。」

在貝氏的世界裡,克倫威爾法則意味著,你永遠都該「稍稍保留一點點可能性,一點點就好——保留『自己可能錯了』的空間,」斯皮格哈爾特說。「那麼,如果出現了與你原先的主要信念完全相悖的新證據時,你就能迅速跳脫之前的想法,轉向新的思維方式。」

「換句話說,要保持開放的心態,」斯皮格哈爾特說。「這是一個力量強大的想法。而且它不一定必須在技術上或形式上做到;它可能只是一個在心底的想法而已。就叫它『建立謙虛的模型』吧,你總有出錯的可能。」

Previous ArticleNext Article