建模预测新冠肺炎的困难在哪儿
Feb. 7, 2020
新型冠状病毒肺炎简称新冠肺炎,英文简称为NCP( Novel coronavirus pneumonia)。我们有时也称之为2019-nCoV。
目前Github、学术圈、IT技术圈竞相对新冠肺炎进行了可视化等相关的统计和预测。大体分为:
- 政府发布的一些确诊,疑似、治愈、死亡统计数
- 各个门户、媒体网站根据以上数据做的可视化地图还有一些趋势变化图
- IT技术圈也是基于以上数据做的图示,再进一步,基于Logistics模型、LSTM模型等做的一些确诊人数预测等。也有做世界地图的可视化。
- 流行病学专家等做的传播模型预测等。
本文主要讨论最后一类。
新冠肺炎从中国传播到世界的最可能路线是从北京国际机场到世界其他机场。
目前新冠肺炎感染了超过30000人,除了中国外,泰国很有可能是在其机场驻留或中转的感染人数最多的国家。由德国柏林洪堡大学和罗伯特科特研究所的研究组依据航空旅游数据创建的全球风险评估模型的最新预测结果正是这样的。(注:2月9日-目前泰国确诊人数32+恢复10+死亡0,新加坡确诊人数40+恢复2+死亡0 ,还看不出趋势)。
该研究组的风险列表里的下一个国家是日本。有趣的是,大阪的国际机场比东京的机场风险更大。随后是韩国、香港、美国。俄罗斯比印度严重点,德国(主要是法兰克福和慕尼黑机场)是西欧中最危险的,埃塞俄比亚是唯一进入受到病毒威胁国家前30名单中的撒哈拉以南非洲国家。
那么,该模型以及其他数十种对该病的计算机模拟结果应该被认真对待吗? 研究新冠肺炎传播的科学家们正在获取大量数据,以对模型进行调整。 例如,截至昨天,在中国大陆以外确诊的病例最多的是日本(45)、新加坡(28)、泰国(25)、香港(24)和韩国(23)。 对于柏林模型而言,这可以算是部分成功,但也反映出这是一次动态传播,其以令人难以置信的速度颠覆了各种假设。 例如,爆发地中国武汉的机场已于1月23日关闭,这从根本上改变了航空公司对该病毒的输出。如今,在日本沿海的一艘游轮上,已有61例确诊病例。
洪堡的物理学家,建模团队的负责人Dirk Brockmann说:“这个模型并不是进行定量预测的工具。” “公共卫生官员和决策者必须建立自己的直觉,因为这种病毒是未知的。模型仅仅可以帮助您发展直觉。”
现在,网站,预印本网站和经过同行评审的期刊上发表了一系列2019-nCoV爆发模型,并且许多人试图做的事情远不只是关于受感染的航空旅行者将在何处着陆的预测。 如果他们有足够稳健的数据,则模型可以预测爆发的增长速度,并有助于预测各种干预措施的影响。 东北大学传染病建模师亚历山德罗·韦斯皮尼亚尼(Alessandro Vespignani)说:“当您开始在模型中包括疾病动态和人口信息时,将会获取比直觉更多的信息。”
许多爆发/传染病/病原体模型的核心是“基本传染数”或Ro(发音为“ R 0”或“ R naught”)。其定义是在没有进行隔离、口罩或其他因素阻止该病毒的传播的情况下,每个感染者实际上可以感染的人数。建模人员还需要关注病毒潜伏时间,即病毒导致症状所需的时间。还需要序列间隔,这是一个人出现症状到密切接触者生病之间的时间。在这个早期的爆发中,每个模型有好多未知因素存在。美国疾病控制与预防中心指出,目前对2019-nCoV潜伏期的估计很难确定,建议范围在2到14天, Vespignani说:“在这一点上,有很多因素应该仔细权衡,这就是建模有困难的原因。”
1月17日,伦敦帝国理工学院的一个小组在其网站上发布了疫情爆发以来的第一个模型,该模型研究了在中国境外确诊的感染,以推断武汉可能发生的感染数量。在该小组发布该模型时,武汉仅报告了41个病例是由该病毒引起的,该模型估计,到1月12日,感染实际上使该市的1723人患病。这些当时令人吃惊的估计现在似乎很保守:截至2月5日,已确诊的病例为27619例,《柳叶刀》杂志1月31日在线发表的香港大学吴若吴及其同事进行的模型研究估计,截至1月25日,仅武汉一地就有75815例。
在武汉封城后,许多早期计算(包括布罗克曼团队进行的初始机场分析(每天进行更新))都失去了意义。维斯皮尼亚尼说:“那是刚刚过去的两周,现在好像是两年前。”
当前可能不利于建模的最棘手的问题之一是没有症状的2019-nCoV患者是否可以传播病毒。可能有一些感染者从未生病但仍在传播。也有可能有感染的人在出现症状之前先传播。维斯皮尼亚尼说:“这种病毒的流行大多取决于此”
现在,用于确认病例的病毒诊断检测通常仅对因有病而去寻求治疗的人进行。查找无症状或症状前病例的一种方法是检查人们的血液中是否存在对2019-nCoV免疫反应的迹象。 “要了解整个传播范围,您希望从感染者的接触者那里采集血液样本,并在两周后进行同样的操作,以查看他们是否已产出出针对这种病毒的抗体,”伊拉斯姆斯医学研究小组的玛丽恩·库普曼斯说其研究中心正在竞相开发针对2019-nCoV的抗体检验。 “这可以更好地估计无症状的传播。”
由于研究人员对受感染病例的流行病学新信息有了更深入的了解,因此模型也可能变得更加精确,流行病学新信息指有关其位置、健康状况、年龄和性别的详细信息。这些数据可以帮助建模人员对诸如潜伏时间等因素做出更可靠的假设。为此,牛津大学计算流行病学家莫里茨·克雷默(Moritz Kraemer)率先做出了不寻常的努力,通过筛查政府报告、医学文献、可靠的媒体报道和社交媒体,编制了确诊病例的“清单”。 “清单包含非常有用的信息,这些信息在政府报告汇总的病例数中没有体现,” Kraemer说。 “不幸的是,在疫情暴发期间很少能获得这些数据,直到现在,这些信息仅由不公开共享的政府例行收集。”
此清单目前有15000多个病例,记录了有关受感染个人的所有公开信息。他的小组已经在一项研究中使用了这些数据,该研究评估了非洲国家检测和处置病例的能力;该大陆上五个最脆弱的国家中,埃塞俄比亚和尼日利亚中有两个国家拥有应对疫情的能力。另一个小组进行的建模研究使用该数据评估了传播动力学,得出的结论是,一旦一个地点发生了三例病例,则该病毒在人群中被传播的机会就超过50%。
了解Ro
除了需要更好的数据外,模型还受到记者或公众如何解释其预测的影响。牛津大学的数学流行病学家罗宾·汤普森(Robin Thompson)对疫情进行了建模,他认为许多新闻报道对Ro(基本传染数)的描述都乱七八糟,并夸大了传播的风险。汤普森说:“Ro在这次疫情中被滥用了。”
对2019-nCoV的大多数估计都计算出Ro介于2-3之间,即感染者将感染另外两三个人。但这只是一个平均值。某些感染者有可能不会将病毒传播给其他任何人。从人口学的角度来看,真正的问题是,如果Ro达到2.2,则该病毒将持续传播的可能性是多少?汤普森(Thompson)估计,这种新病毒,如果没有任何措施(例如疫苗)阻止传播,那么从一个受感染的人开始就可以持续传播的概率是54.5%。
Ro在爆发期间不会改变:病毒具有一定的固定的传染性因子,例如,与流感相比,麻疹更容易在人与人之间传播。但是,即使没有疫苗,人类的行为和环境本身也会改变传播的概率。医院隔离了受感染的人,或者他们选择留在家里。随着疫情的成熟,传播概率会进一步的减少,因为许多人由于先前的暴露而变得免疫,从而减少了易感宿主的数量。洗手,穿上防护服以及保持社交距离也可以降低传播率。气候变化,例如冬天过渡到春天,可能会影响呼吸道病毒通过空气传播的能力。
在建模人员的术语中,最重要的不是Ro这个不变的“基本”传染数,而是他们在某种程度上无法想象地称为传染数或R的因子。 R不断变化。这里有一个以百分比表示的R的示例:汤普森(Thompson)计算得出,如果有症状感染者的50%被隔离,而无症状的有20%被隔离,则持续传播的风险为24.2%。
这项R分析得出的结论是,除中国以外的其他国家仍然有很大的机会遏制2019-nCoV。汤普森说:“在疫情爆发初期,您可以利用一个事实,就是事情会逐渐消退。” “而且,如果您能很快把少数感染者隔离,那么这种情况消失的可能性就会更高。”
旅行禁令的力量
最后,模型是基于科学的尝试,旨在为公共卫生政策提供信息。采取旅行限制,吴说,他怀疑目前限制从武汉出行会不会对病毒在中国的传播产生任何影响。他指出,一个国际科学家团队的计算结果表明,武汉封城,病毒传播到中国其他城市的时间仅仅延迟了2.91天。吴说:“现在将武汉封城,不会对中国其他城市的流行病学曲线产生影响。” “现在,保持适当的社交隔离才至关重要。”
迄今为止,已有24例确诊病例的香港一直到今天才关闭对中国大陆的关口。吴说:“公众已经要求政府减少来在大陆的人流,而政府有不同的理由不愿这样做。” “公共卫生是当务之急,但经济也是主要问题。如果这能减少人流,那么它也可以切断某些香港的必需产品的供应链。”
因此,要在2019-nCoV的传播过程中保持公共卫生和政治因素之间的平衡,这意味着对Ro和R、潜伏时间、序列间隔和其他变量的精细理解只能使模型的预测能力更强。正如大多数建模论文所警告的那样,“这种建模分析有局限性。”
A small favor
Was anything I wrote confusing, outdated, or incorrect? Please let me know! Just write a few words below and I'll be sure to amend this post with your suggestions.
Follow along
If you want to know about new posts, add your email below. Alternatively, you can subscribe with RSS.