科学家估计武汉新冠状病毒感染人数可能上千

By 小二 at 2020-01-18

https://www.solidot.org/story?sid=63292

冠状病毒, 武汉肺炎


Can you interpret the mathematical model they use?

主席 at 2020-01-18
1

fact:2019年12月31日通知了WHO,到2020年1月16日,发现了41个case(其中武汉两例死亡,泰国两例,日本1例,均出访过武汉)

推断假设:

  • 武汉机场累计有1900万人
  • 从感染到确症平均为10天
  • 过去两月武汉平均每天有3301名旅客前往国外

具体可以看这张图,不同的假设下有不同的估计结果

其实估计非常简单,只是一个简单的二项分布而已,就是已知海外携带病毒的旅行者被检测出来的概率是p,那么现在有N个已知的被检测出来的case,那么潜在病毒携带者X是多少。

最关键的是p的计算,文中用的是武汉机场国际旅客比例 x 平均检测时间,也就是

10 * 3301 / 19000000

小二 at 2020-01-18
2

其实换成大白话就是:武汉机场十天内共有33010名国际旅客,检测出了 3 例;现在十天内武汉机场有1900万旅客,请问潜在的病毒携带者有多少?

小二 at 2020-01-18
3

出国 = 武汉机场每天出国人数是3301人 武汉 = 1900万是武汉总人口

任意武汉人每天出国概率 = 出国/武汉

p= 武汉人10天出国概率 = 10 * 出国 / 武汉?

主席 at 2020-01-18
4

所以他的算式是: p = 10 * 3301 / 19000000 n = 3 total = n / p = 1726

主席 at 2020-01-19
5

表中95%的置信区间是怎么算出来的呢?

主席 at 2020-01-19
6

@主席 #6

可以简单假设观察到海外3例符合poisson 分布, 那么95%CL 大概是 0.62-8.77 (见下面链接)。 计算真实数据的公式 N*19000000/33010. 分别带入3, 0.62, 8.77, 得到1726, 356, 5047. 不过poisson模型还是很接近他们的模型, 不过我也没看文章怎么说

https://faculty.washington.edu/heagerty/Books/Biostatistics/TABLES/Poisson/index.html

electron8964 at 2020-01-19
7

@主席 #6 @electron8964 #7 原文用的是二项分布,就是我们通常理解的扔硬币,只是这个硬币比较特殊,head的概率不是百分之五十,而是上面计算出来的p。

先解释一下极大似然估计,打个比方,我告诉你我仍硬币扔出了3次正面,请问我最有可能扔了多少次?

但这里用的是负二项分布,就是说我想扔出三次正面,没有扔到三次就一直扔,到了三次就停止,请问我要扔多少次?

小二 at 2020-01-19
8

@主席 #5 1726要减去3,表中的数字是已携带病毒但未被检测出来的人数,1726是总人数。

小二 at 2020-01-19
9

@小二 #8

是的,但是二项分布的CL 比较难算,poisson很简单,有现成的表格

electron8964 at 2020-01-19
10

现在如果国外有死亡案列,就真的会制造出大量恐慌。

虽然是小概率。

但目前看,60多个里,有10个重症,比例非常高。

而且这只是一个武汉,武汉是发源地,就已经这么多了。假如它的病原体到了其他地方的菜市场,那就不是一个武汉,而是几十个武汉。

90多个观察者,

sorrysorrysorry at 2020-01-19
11

现在的说法是,其他地方压根没有测试盒子,所以没有认定是ncov。运气不好,就是几百个。

而且只是这十天不到。

sorrysorrysorry at 2020-01-19
12

@sorrysorrysorry #11

是的

内地其他城市为何无武汉肺炎报告病例?专家:或未检测

https://c.m.163.com/news/a/F38CR86U0001899O.html

小二 at 2020-01-19
13

我担心的是,一个菜市场就能制造60多个病毒患者,假如是十个菜市场呢。目前看法是,菜市场离火车站特别的近,所以发生了流动。当地至少有几万个流感案例在发生,武汉人口是1000多万。

所以唯一的办法就是阻止病原体离开武汉,到别的菜市场,根据看到的说法,武汉是候鸟落脚的地方,那么,难道是蒙古的鼠疫和流感,肺炎产生了混合?很难说。因为吃野味最多的地方并不是武汉,而是广东。 那很有可能就是飞鸟传播。但是飞鸟被人给做成了菜,如果武汉有,那么南方别的地方也有可能。 冬天最冷的时候传播是最厉害的。那么,到2月以后威胁就不那么大了。

飞机的封闭空间是最好的传播渠道。

cnov没有特效药,得了就不能完全康复,总有伤害在身体。高烧本身也是很危险的。

sorrysorrysorry at 2020-01-19
14

@小二 #13 以中国老百姓根本不care的心态,只怕是这个病毒已经在武汉好几个地方都有传播渠道

不去菜市场 ,不去火车站机场,最安全

sorrysorrysorry at 2020-01-19
15

如果这个时候有生化恐怖份子,反社会人到武汉去搜集病原体,然后真的找到了,就不得了了。很难说没有这样的疯子,假如她开车逃出武汉了呢? 然后一边发烧,一边在上海的菜市场活动,再做做火车。、、

不要小看生化恐怖自爆分子。要知道,中国那些砍人的,烧公交车的,可都是人。这个国家不缺丧心病狂的人。

sorrysorrysorry at 2020-01-19
16

@electron8964 #7 谢谢!!泊松分布做为二项分布的近似,计算出p,再反算总人数,很接近原文数据。 怎么用负二项分布算我还是不懂。

主席 at 2020-01-19
17

@主席 #17

如果你知道怎么算正态分布的CL,二项分布的也差不多,一个是积分,一个一项项想加,因为二项分布是discrete

electron8964 at 2020-01-19
18

爆了

sorrysorrysorry at 2020-01-19
19
@electron8964 #18 标准正态分布N(0,1),找到它的分位点z(a/2),P{ X>z(a/2) <a/2}。然后置信区间就是以0为中心,以z(a/2)为半径的开区间。

二项分布也是找到累积分布函数CDF = a/2 以及 CDF = 1-a/2的分位点是吗?

主席 at 2020-01-20
20

用R计算是否就是这个帖子里的方法?

https://stackoverflow.com/questions/21719578/confidence-interval-for-binomial-data-in-r

主席 at 2020-01-20
21

@主席 #20

是的。 理论上你可以自己定义CL的计算方法, 不过大多数情况,说到95%CL,就是两边各留2.5%。

electron8964 at 2020-01-20
22

@electron8964 #24

正态分布的样本均值也符合正态分布N(mu, sigma/sqrt(n))

二项分布的样本均值的分布好像就不知道了。书上都是拿正态分布和泊松分布去近似。直接算好像很困难。

主席 at 2020-01-20
23

“多与公众交底交心,把各种可能性都说出来,事情不严重和严重的可能性以及概率都表达出来,那样最好”

“现在是社交媒体时代,什么样的信息都可能大规模扩散,吞吞吐吐是稳不了人心的。”

胡编乱侃 at 2020-01-20
24

@阿篱 #27 明显不是啊,今天钟南山直接出来说了,明确可以人际传染。

http://m.caixin.com/m/2020-01-20/101506465.html

【财新网】(记者 陈宝成 赵今朝)对于新型冠状病毒是否人传人的疑问,答案越来越清晰。“肯定‘人传人’。”2020年1月20日,国家卫健委高级别专家组组长、中国工程院院士、呼吸病学专家钟南山说。

钟南山在接受央视《新闻一加一》采访时做了上述表示。他表示,依据就是目前的资料。他举例称,在广东有两个病例没有去过武汉,但他们的家人去了武汉后染上了新型冠状病毒肺炎。因此“现在可以说,肯定有人传人现象。”

小二 at 2020-01-20
25

@阿篱 #31 SARS貌似是通过果子狸为中介最后传到人身上的,而前段时间爆发的鼠疫也是因为抗不住中国xx太多,吃什么旱獭野味。这次的源头已经确定是动物,而且也是从市场最先发现。我估计八成跟什么野味有关,真的是受不了这种吃野味的陋习了。

小二 at 2020-01-20
26

这不是造谣是啥?按照当地的控制力度(是是是你们不是说咱独裁吗?)不可能放任上千人在医院外头晃悠。真的这样的话范围已经出武汉了武汉周围应该已经有上百,截止到1月21日。

1200073 at 2020-01-20
27

果子狸是伪野味,都是人工养殖。现在美国加拿大才有真野味可吃——合法的持枪打猎季,杀鹿杀熊。

长期笼养,跟动物粪便接触机会增加了几百过千倍才是真正的传染源。

果子狸如是,笼养鸡就有禽流感。所以我预言可感染人的非洲猪瘟变种将在中国诞生,让我们用习主席之名来命名这场即将来临的人类猪瘟。

该干嘛继续干 at 2020-01-20
28

鄂东这边的饮食习俗还是非常接近两广和南洋的,相反和江浙完全不同。所以不吃野味是不可能的。包括野鸡,野兔这类的,本人都吃过。还有湘菜口味蛇,你应该也听过。广东香港那边还有蛇羹。就是这个流行病过去了,未来野味生意也会慢慢死灰复燃。

只看能不能把野味生意管理规范,不要搞成地下产业。放在台面上经营。再把野味市场卫生做好。安全风险会小很多。

mimi0123 at 2020-01-20
29

我猜负二项分布的极大似然估计与标准误差应该是在这里。

https://stats.stackexchange.com/questions/164934/maximum-likelihood-estimator-for-negative-binomial-distribution

主席 at 2020-01-20
30

今天外出感觉气氛很不对,很多人戴着口罩

厠所管理員 at 2020-01-20
31

280应该远远不止。1000多也不一定挡得住。

如果超过1k,那这个数量级就很危险。

sorrysorrysorry at 2020-01-20
32

@阿篱 #32 你这个等于暴露了自己的位置

sorrysorrysorry at 2020-01-20
33

现在控制的就是传播,只要武汉的人不出来,外面的就是安全的。

武汉本地的死亡率太高,危重 ,严重里头已经有4个人倒下。

广东的特别多,现在的悬念就是外地有没有死亡案例,如果有,就证明了感染者的死亡率有一个范围。

暂时没有指数级别爆发,比2003年好点,但不排除2个月后爆发。

sorrysorrysorry at 2020-01-20
34

历史回顾 2003年 截至2月10日下午3时统计,共发现305例,死亡5例。其中医务人员感染发病共105例,没有一例死亡

sorrysorrysorry at 2020-01-20
35

目前 2020 1月20日 4人死亡 220多患 不低于15个医护 重症40到50

sorrysorrysorry at 2020-01-20
36

个人感觉这一次危害和毒性并不低于SARS

sorrysorrysorry at 2020-01-20
37

严重雾霾加剧了传播

sorrysorrysorry at 2020-01-20
38

220里有40严重,这种治好了也造成了巨大伤害。完全无法低估这次ncov。

sorrysorrysorry at 2020-01-21
39

我还是有点执念。用这个计算器算。 求负二项分布2.5%和97.5%的分位点,结果与作者的数字不同。 可以排除是直接用负二项分布的累积分布函数算。

https://keisan.casio.com/exec/system/1180573212

主席 at 2020-01-21
40

@主席 #49

你要真的有执念,可以自己写个程序算一下,这个网页上的公式是对的,但是我带入数据,发现计算超时了。 而且现在也有大概范围,你自己算应该很简单

electron8964 at 2020-01-21
41

@electron8964 我上传我计算得到的数字,您帮我看看。和您说的泊松分布估计出来的区间很接近。但是并非与作者的结果完全相同。

截图

主席 at 2020-01-21
42

@主席 #51

probability of success p 不对吧。

我之前错了, 这个公式就不对。 这个公式不太好表述, 我可以自己写个程序看下

electron8964 at 2020-01-21
43

好奇想看下原文具體modeling,結果發現原文鏈結失效了。

漢娜怎麼說 at 2020-01-21
44

@主席 #51 @electron8964 #50

1723 is the expected mean

3*(1-0.00173736842)/0.00173736842 = 1723

漢娜怎麼說 at 2020-01-21
45

Nvm 說的是CI 我得回家再看

漢娜怎麼說 at 2020-01-21
46

见鬼了, 我自己算的前三种情况是如下:

Wuhan population 19000000 tot international passengers 33010 most probable 1723 low P 0.025 lowN 354 upper P 0.975 upN 3619

Wuhan population 11000000 tot international passengers 33010 most probable 996 low P 0.025 lowN 204 upper P 0.975 upN 2093

Wuhan population 19000000 tot international passengers 26408 most probable 2155 low P 0.025 lowN 443 upper P 0.975 upN 4525

我觉 @主席 算的可能也是对的,所以我不知道为什么网上是这么个结果。 https://www.imperial.ac.uk/mrc-global-infectious-disease-analysis/news–wuhan-coronavirus/

electron8964 at 2020-01-21
47

@electron8964 #50 @主席 #51

回家看了一下原文

The results in Table 1 are maximum likelihood estimates obtained using this negative binomial likelihood function.

没有Mathematica,本人表示不算了,愿意相信数字没问题= =

漢娜怎麼說 at 2020-01-21
48

@漢娜怎麼說 #57

most probable 都很好算,但是CL 结果不一样

electron8964 at 2020-01-21
49

@electron8964 #58

https://en.wikipedia.org/wiki/Negative_binomial_distribution#Maximum_likelihood_estimation

用了maximum likelihood了吗?查了一下wiki,毕业很久的表示公式简直就是天书。

漢娜怎麼說 at 2020-01-21
50

Wuhan population 19000000 tot international passengers 33010 most probable 1723 low P 0.025 lowN 354 upper P 0.975 upN 4153

Wuhan population 11000000 tot international passengers 33010 most probable 996 low P 0.025 lowN 204 upper P 0.975 upN 2402

Wuhan population 19000000 tot international passengers 26408 most probable 2155 low P 0.025 lowN 443 upper P 0.975 upN 5193.

修正一下。 我可能把问题想得太简单了点。 CL 有不同算法(或者说定义), 不同的算法会给出不同的结果。

electron8964 at 2020-01-21
51

可以参考一个帖子“武汉人都去哪儿了”有航班座位统计

sorrysorrysorry at 2020-01-21
52

@electron8964 #56

多谢多谢!!!厉害!!!把这个方法的全部结果一下子就算出来了,擅于编程就是好。

主席 at 2020-01-21
53

@主席 #62

可惜我也不知道原文作者是怎么算CL

electron8964 at 2020-01-21
54

@漢娜怎麼說 #59 https://en.wikipedia.org/wiki/Negative_binomial_distribution#Maximum_likelihood_estimation

貌似这个公式是假定r和k已知,估计p的值。

但是作者的意思好像是p已知,k已知,要估计的是r。

r是染病但未在国外确诊人数,k是在国外确诊人数,p是1个武汉患者在外国被确诊概率。

主席 at 2020-01-21
55

补充wikipedia那段话写着: This equation cannot be solved for r in closed form.

If a numerical solution is desired, an iterative technique such as Newton’s method can be used. Alternatively, the expectation–maximization algorithm can be used.[20]

数值法求解,但是如果p已知,都不用牛顿法。 只要用r=1到10000,把所有似然函数值算出来,取argmax就可以求出r的最大似然估计。

区间估计还是不明白。

主席 at 2020-01-21
56

@主席 #65 我覺得一定有類似干預。

要不你寫封email給文章的幾位作者。

讓他們提供他們的算法。

漢娜怎麼說 at 2020-01-21
57

今天数据更新,估计国内约有4000 感染者:

https://www.imperial.ac.uk/mrc-global-infectious-disease-analysis/news–wuhan-coronavirus/

Imgur

我自己算的: oversea case 8 Wuhan population 19000000 tot international passengers 33010 most probable 4022 low P 0.025 lowN 1615 upper P 0.975 upN 7507

electron8964 at 2020-01-21
58

离开武汉的500多万人都去了哪里?大数据告诉你 https://www.yicai.com/news/100481655.html

根据这里的数据,截止到1.22号为止,大概武汉感染者约为1.1 万,从武汉转移出去的感染者约为4000,

electron8964 at 2020-01-21
59