科學家們是如何預測新冠肺炎疫情的感染規(guī)模的?
2020-2-18 來源:廣東省情調(diào)研網(wǎng)
自新型肺炎疫情爆發(fā)以來,國內(nèi)外一些科研機構(gòu)利用模型對新冠病毒的可能感染規(guī)模和傳播風險等進行了預測。科學家們認為,模型可以預測疫情的增長速度并幫助預測各種干預措施的影響。
這篇文章本身不是對疫情的分析,而是回顧科學家們對新型冠狀病毒肺炎疫情的建模和預測方法。
英國帝國理工大學的一個研究團隊是最早使用數(shù)據(jù)模型預測新冠病毒可能的傳播風險的研究團隊之一。他們通過觀察中國境外確診患者的病例來推斷,截至1月12日武漢市已經(jīng)有1723人感染這一病毒。
來自香港大學的Joseph T Wu教授和他的研究團隊在一篇發(fā)表于權(quán)威醫(yī)學期刊《柳葉刀》的論文中利用模型推斷了新冠病毒的基本再生數(shù)和可能的疫情規(guī)模。研究團隊參考了官方航空指南中的月度航班數(shù)據(jù)和騰訊數(shù)據(jù)庫中中國大陸300多個地級市的人員流動信息,基于sars的流行病學研究估計序列間隔,使用易感-暴露-感染-恢復多集群模型估計各個城市多爆發(fā)情況,并使用馬爾科夫鏈蒙特卡洛方法(MCMC)以估計新冠病毒的基本再生數(shù)。
該模型預測,新冠病毒的基本再生數(shù)R0為2.68,即平均1名感染者可感染2-3人。疫情規(guī)模每6.4天會翻一倍。假設(shè)傳播能力在各地相似。其他主要城市疫情爆發(fā)會滯后于武漢1至2周。
柏林洪堡大學(Humboldt University of Berlin)和羅伯特•科赫研究所(Robert Koch Institute)的研究人員同樣根據(jù)航空旅行數(shù)據(jù)建立了一個全球風險評估模型。研究人員認為,新冠病毒在國際范圍內(nèi)的主要傳播途徑為民航運輸。受影響的樞紐機場航班線路越密集,就可能有更多受感染的旅客來往于這些航班上。而一些國際型樞紐機場的聯(lián)程和轉(zhuǎn)飛航班更會將病毒擴散到更多相對偏遠的航點。
該圖顯示了從武漢天河機場到全球航空網(wǎng)絡(luò)中所有其他機場的最可能傳播路線
由于模型更強調(diào)的是航點間的聯(lián)系緊密程度,所以在國際上,大阪國際機場受到的潛在病毒輸入性風險反而高于東京;俄羅斯受到的風險高于印度;而在歐洲,德國受到的風險最高。
科研人員們都希望能在模型中納入更多的數(shù)據(jù)以確保預測結(jié)果的科學性和參考性。例如,鐘南山院士就在最近接受路透社采訪時提到,他帶領(lǐng)研究團隊基于數(shù)學AI模型和近日實時發(fā)展的監(jiān)控,以及中國政府的大力干預進行了預測,推測疫情高峰可能在2月中旬或下旬達到。
但在疫情爆發(fā)的早期階段,由于缺乏數(shù)據(jù)的支持,研究人員需要使用傳統(tǒng)的傳染病動力學模型來分析和預測疫情的發(fā)展。這些模型包括SIR模型、SEIR模型和SEIJR模型。這些模型的核心是R0,即基本再生數(shù)。它指的是如果不受隔離檢疫、口罩等防疫措施的干擾,每個感染者可以感染多少人。
英國蘭卡斯特大學衛(wèi)生資訊、計算及統(tǒng)計中心Jonathan M. Read等人在醫(yī)學類預印本雜志medRxiv上發(fā)表的論文預測新冠病毒的基本再生數(shù)為3.6-4.0之間。他們預測,如果沒有政府有效的防疫措施干預,到2月4日,在最壞的情況下武漢市內(nèi)將有19萬人(預測區(qū)間:132,751-273,649)受到感染,同時,上海、北京、廣州、重慶和成都會是中國大陸疫情最嚴重的城市。泰國、日本、臺灣、香港和韓國將是通過民航運輸受到輸入性感染風險最大的國家或特別行政區(qū)。
模型同時指出,隨著武漢的“封城”,全國各地的輸入性疫情風險將減少24.9%。研究人員構(gòu)建的是確定性SEIR集合人群傳播模型。研究人員截取了1月1日-21日間期武漢和全球其他國家的確診病例,參考OAG交通分析數(shù)據(jù)庫中2017年1月的完整旅客數(shù)據(jù)和SARS的傳播率和康復率,來預測所有中國城市和其他國家在這段時間內(nèi)的的感染人數(shù),并在R語言中使用optim函數(shù)最大化可能性來推算。
西安交大、陜西師范大學和來自加拿大的科研團隊合作利用1月10日-22日的報告疫情數(shù)據(jù),采用動力學模型和統(tǒng)計計算方法,預測出此次武漢新型冠狀病毒肺炎傳播的基本再生數(shù)為6.47(95%置信區(qū)間為 5.71-7.23)。這也意味著平均毎位新型肺炎患者在患病期間,將會感染6個以上的健康人。
韓國國立江原大學助理研究員Thakur Dhakal則試圖利用系統(tǒng)動力學的方法來分析冠狀病毒擴散的狀態(tài)。模擬結(jié)果顯示,從2020年1月20日起,冠狀病毒將會在67天后得到控制。模型同時預測,如果沒有得到有效的控制,疫情將會在1月20日開始的15天內(nèi)導致上萬人死亡。而在1月20日起的三個月內(nèi),將有15萬人受感染。但是,這些模擬結(jié)果的前提是沒有有效防疫措施的干預。
上海財經(jīng)大學數(shù)學學院嚴閱等人在發(fā)表于《中國科學:數(shù)學》的一篇論文中使用了基于時滯動力學系統(tǒng)的傳染病動力學模型,并通過公開歷史數(shù)據(jù)對模型參數(shù)進行反演,來對疫情發(fā)展趨勢進行模擬。
全國在醫(yī)院治療患者總?cè)藬?shù)預測
模擬數(shù)值顯示,在現(xiàn)有防控力度不放松的情況下,疫情能在較短時間內(nèi)得到控制并逐步結(jié)束。
北海道大學醫(yī)學院副教授Hiroshi Nishiura在發(fā)表于期刊Journal of Clinical Medicine的論文中使用空間反計算方法對截至1月24日的輸出病例進行分析,對疫情的傳播風險得出了與英國帝國理工大學研究團隊相似的預測,即在疫情的初期,當?shù)卣赡艿凸懒瞬《镜膫鞑ワL險和規(guī)模。
香港中文大學賽馬會公共衛(wèi)生與基層醫(yī)療學院博士生Shi Zhao等人預測R0的范圍在2.24(置信區(qū)間:1.96-2.55)和3.58(置信區(qū)間:2.89-4.39)之間;在疫情早期,感染人數(shù)的增加基本遵循了指數(shù)增長的趨勢。研究人員參考了SARS和MERS的平均潛伏時間,采用NLS框架進行數(shù)據(jù)擬合和參數(shù)估計得出了相應的預測結(jié)果。
美國加州大學伯克利分校教授Slav W. Hermanowicz發(fā)表在medRxiv上的論文則使用Logistic 回歸分析模型從截至1月28日的確診病例人數(shù)中推測中國大陸確診感染病例的可能數(shù)量。預測結(jié)果顯示,基本再生數(shù)R0為2.4-2.5之間,從1月28日開始,確診人數(shù)的指數(shù)增長趨勢出現(xiàn)向下偏離,這也證實了再生數(shù)量的穩(wěn)步下降,最終確診病例數(shù)量將在2月中旬達到峰值。但作者也提出了這樣的預測前提:沒有考慮任何其他可能的繼發(fā)性感染源。
烏克蘭國家科學院流體力學研究所博士后研究員Igor Nesteruk在投在期刊Innovative Biosystems and Bioengineering的一篇論文中使用了SIR模型,并通過統(tǒng)計方法確定模型參數(shù)的最優(yōu)值,預測了新冠肺炎疫情感染人數(shù)、易感人數(shù)和轉(zhuǎn)移人數(shù)隨時間的變化。預測結(jié)果顯示,(這篇論文的預測結(jié)果我看不懂,只能把作者論文中的圖表貼上,如有看得懂的大神,歡迎討論)
大概就是藍色圈圈代表的每天公布的確診病例數(shù)量大致對上了作者的那條藍色確診病例預測曲線
隨著科研人員對新冠病毒的流行病學信息更為深入的掌握,對確診患者的更多細節(jié)的比對,以及將更多干預措施納入模型推算,模型推算的結(jié)果將變得更為清晰和準確。
但正如牛津大學數(shù)學流行病專家Robin Thompson所說的,在這次新冠肺炎疫情中,很多新聞報道歪曲了對預測模型和基本再生數(shù)R0的作用描述,夸大了疫情傳播的風險。他說,“它在這次疫情中被濫用了”。
所以,科研人員在發(fā)布自己的模型預測結(jié)果時,也要同時清楚地講明預測是在什么樣的條件下獲得的。任何一項基于數(shù)學模型的預測結(jié)果,都不應該脫離條件的制約。也正是基于這些條件,公眾才能理解某些看似“可怕”的預測結(jié)果背后的真正意義,因此,一個詳細而明確的說明,是避免引起公眾恐慌的最好辦法。
·END·
GDSQZX.COM.CN