Can you interpret the mathematical model they use?
fact:2019年12月31日通知了WHO,到2020年1月16日,发现了41个case(其中武汉两例死亡,泰国两例,日本1例,均出访过武汉)
推断假设:
- 武汉机场累计有1900万人
- 从感染到确症平均为10天
- 过去两月武汉平均每天有3301名旅客前往国外
具体可以看这张图,不同的假设下有不同的估计结果
其实估计非常简单,只是一个简单的二项分布而已,就是已知海外携带病毒的旅行者被检测出来的概率是p,那么现在有N个已知的被检测出来的case,那么潜在病毒携带者X是多少。
最关键的是p的计算,文中用的是武汉机场国际旅客比例 x 平均检测时间,也就是
10 * 3301 / 19000000
其实换成大白话就是:武汉机场十天内共有33010名国际旅客,检测出了 3 例;现在十天内武汉机场有1900万旅客,请问潜在的病毒携带者有多少?
出国 = 武汉机场每天出国人数是3301人 武汉 = 1900万是武汉总人口
任意武汉人每天出国概率 = 出国/武汉
p= 武汉人10天出国概率 = 10 * 出国 / 武汉?
所以他的算式是: p = 10 * 3301 / 19000000 n = 3 total = n / p = 1726
表中95%的置信区间是怎么算出来的呢?
@主席 #6
可以简单假设观察到海外3例符合poisson 分布, 那么95%CL 大概是 0.62-8.77 (见下面链接)。 计算真实数据的公式 N*19000000/33010. 分别带入3, 0.62, 8.77, 得到1726, 356, 5047. 不过poisson模型还是很接近他们的模型, 不过我也没看文章怎么说
https://faculty.washington.edu/heagerty/Books/Biostatistics/TABLES/Poisson/index.html
@主席 #6 @electron8964 #7 原文用的是二项分布,就是我们通常理解的扔硬币,只是这个硬币比较特殊,head的概率不是百分之五十,而是上面计算出来的p。
先解释一下极大似然估计,打个比方,我告诉你我仍硬币扔出了3次正面,请问我最有可能扔了多少次?
但这里用的是负二项分布,就是说我想扔出三次正面,没有扔到三次就一直扔,到了三次就停止,请问我要扔多少次?
@小二 #8
是的,但是二项分布的CL 比较难算,poisson很简单,有现成的表格
现在如果国外有死亡案列,就真的会制造出大量恐慌。
虽然是小概率。
但目前看,60多个里,有10个重症,比例非常高。
而且这只是一个武汉,武汉是发源地,就已经这么多了。假如它的病原体到了其他地方的菜市场,那就不是一个武汉,而是几十个武汉。
90多个观察者,
现在的说法是,其他地方压根没有测试盒子,所以没有认定是ncov。运气不好,就是几百个。
而且只是这十天不到。
我担心的是,一个菜市场就能制造60多个病毒患者,假如是十个菜市场呢。目前看法是,菜市场离火车站特别的近,所以发生了流动。当地至少有几万个流感案例在发生,武汉人口是1000多万。
所以唯一的办法就是阻止病原体离开武汉,到别的菜市场,根据看到的说法,武汉是候鸟落脚的地方,那么,难道是蒙古的鼠疫和流感,肺炎产生了混合?很难说。因为吃野味最多的地方并不是武汉,而是广东。 那很有可能就是飞鸟传播。但是飞鸟被人给做成了菜,如果武汉有,那么南方别的地方也有可能。 冬天最冷的时候传播是最厉害的。那么,到2月以后威胁就不那么大了。
飞机的封闭空间是最好的传播渠道。
cnov没有特效药,得了就不能完全康复,总有伤害在身体。高烧本身也是很危险的。
@小二 #13 以中国老百姓根本不care的心态,只怕是这个病毒已经在武汉好几个地方都有传播渠道
不去菜市场 ,不去火车站机场,最安全
如果这个时候有生化恐怖份子,反社会人到武汉去搜集病原体,然后真的找到了,就不得了了。很难说没有这样的疯子,假如她开车逃出武汉了呢? 然后一边发烧,一边在上海的菜市场活动,再做做火车。、、
不要小看生化恐怖自爆分子。要知道,中国那些砍人的,烧公交车的,可都是人。这个国家不缺丧心病狂的人。
@electron8964 #7 谢谢!!泊松分布做为二项分布的近似,计算出p,再反算总人数,很接近原文数据。 怎么用负二项分布算我还是不懂。
@主席 #17
如果你知道怎么算正态分布的CL,二项分布的也差不多,一个是积分,一个一项项想加,因为二项分布是discrete
爆了
@electron8964 #18 标准正态分布N(0,1),找到它的分位点z(a/2),P{ | X>z(a/2) | <a/2}。然后置信区间就是以0为中心,以z(a/2)为半径的开区间。 |
二项分布也是找到累积分布函数CDF = a/2 以及 CDF = 1-a/2的分位点是吗?
用R计算是否就是这个帖子里的方法?
https://stackoverflow.com/questions/21719578/confidence-interval-for-binomial-data-in-r
@主席 #20
是的。 理论上你可以自己定义CL的计算方法, 不过大多数情况,说到95%CL,就是两边各留2.5%。
@electron8964 #24
正态分布的样本均值也符合正态分布N(mu, sigma/sqrt(n))
二项分布的样本均值的分布好像就不知道了。书上都是拿正态分布和泊松分布去近似。直接算好像很困难。
“多与公众交底交心,把各种可能性都说出来,事情不严重和严重的可能性以及概率都表达出来,那样最好”
“现在是社交媒体时代,什么样的信息都可能大规模扩散,吞吞吐吐是稳不了人心的。”
@阿篱 #27 明显不是啊,今天钟南山直接出来说了,明确可以人际传染。
http://m.caixin.com/m/2020-01-20/101506465.html
【财新网】(记者 陈宝成 赵今朝)对于新型冠状病毒是否人传人的疑问,答案越来越清晰。“肯定‘人传人’。”2020年1月20日,国家卫健委高级别专家组组长、中国工程院院士、呼吸病学专家钟南山说。
钟南山在接受央视《新闻一加一》采访时做了上述表示。他表示,依据就是目前的资料。他举例称,在广东有两个病例没有去过武汉,但他们的家人去了武汉后染上了新型冠状病毒肺炎。因此“现在可以说,肯定有人传人现象。”
这不是造谣是啥?按照当地的控制力度(是是是你们不是说咱独裁吗?)不可能放任上千人在医院外头晃悠。真的这样的话范围已经出武汉了武汉周围应该已经有上百,截止到1月21日。
果子狸是伪野味,都是人工养殖。现在美国加拿大才有真野味可吃——合法的持枪打猎季,杀鹿杀熊。
长期笼养,跟动物粪便接触机会增加了几百过千倍才是真正的传染源。
果子狸如是,笼养鸡就有禽流感。所以我预言可感染人的非洲猪瘟变种将在中国诞生,让我们用习主席之名来命名这场即将来临的人类猪瘟。
鄂东这边的饮食习俗还是非常接近两广和南洋的,相反和江浙完全不同。所以不吃野味是不可能的。包括野鸡,野兔这类的,本人都吃过。还有湘菜口味蛇,你应该也听过。广东香港那边还有蛇羹。就是这个流行病过去了,未来野味生意也会慢慢死灰复燃。
只看能不能把野味生意管理规范,不要搞成地下产业。放在台面上经营。再把野味市场卫生做好。安全风险会小很多。
我猜负二项分布的极大似然估计与标准误差应该是在这里。
https://stats.stackexchange.com/questions/164934/maximum-likelihood-estimator-for-negative-binomial-distribution
今天外出感觉气氛很不对,很多人戴着口罩
280应该远远不止。1000多也不一定挡得住。
如果超过1k,那这个数量级就很危险。
@阿篱 #32 你这个等于暴露了自己的位置
现在控制的就是传播,只要武汉的人不出来,外面的就是安全的。
武汉本地的死亡率太高,危重 ,严重里头已经有4个人倒下。
广东的特别多,现在的悬念就是外地有没有死亡案例,如果有,就证明了感染者的死亡率有一个范围。
暂时没有指数级别爆发,比2003年好点,但不排除2个月后爆发。
历史回顾 2003年 截至2月10日下午3时统计,共发现305例,死亡5例。其中医务人员感染发病共105例,没有一例死亡
目前 2020 1月20日 4人死亡 220多患 不低于15个医护 重症40到50
个人感觉这一次危害和毒性并不低于SARS
严重雾霾加剧了传播
220里有40严重,这种治好了也造成了巨大伤害。完全无法低估这次ncov。
我还是有点执念。用这个计算器算。 求负二项分布2.5%和97.5%的分位点,结果与作者的数字不同。 可以排除是直接用负二项分布的累积分布函数算。
https://keisan.casio.com/exec/system/1180573212
@主席 #49
你要真的有执念,可以自己写个程序算一下,这个网页上的公式是对的,但是我带入数据,发现计算超时了。 而且现在也有大概范围,你自己算应该很简单
@electron8964 我上传我计算得到的数字,您帮我看看。和您说的泊松分布估计出来的区间很接近。但是并非与作者的结果完全相同。
好奇想看下原文具體modeling,結果發現原文鏈結失效了。
Nvm 說的是CI 我得回家再看
见鬼了, 我自己算的前三种情况是如下:
Wuhan population 19000000 tot international passengers 33010 most probable 1723 low P 0.025 lowN 354 upper P 0.975 upN 3619
Wuhan population 11000000 tot international passengers 33010 most probable 996 low P 0.025 lowN 204 upper P 0.975 upN 2093
Wuhan population 19000000 tot international passengers 26408 most probable 2155 low P 0.025 lowN 443 upper P 0.975 upN 4525
我觉 @主席 算的可能也是对的,所以我不知道为什么网上是这么个结果。 https://www.imperial.ac.uk/mrc-global-infectious-disease-analysis/news–wuhan-coronavirus/
@electron8964 #50 @主席 #51
回家看了一下原文
The results in Table 1 are maximum likelihood estimates obtained using this negative binomial likelihood function.
没有Mathematica,本人表示不算了,愿意相信数字没问题= =
@漢娜怎麼說 #57
most probable 都很好算,但是CL 结果不一样
@electron8964 #58
https://en.wikipedia.org/wiki/Negative_binomial_distribution#Maximum_likelihood_estimation
用了maximum likelihood了吗?查了一下wiki,毕业很久的表示公式简直就是天书。
Wuhan population 19000000 tot international passengers 33010 most probable 1723 low P 0.025 lowN 354 upper P 0.975 upN 4153
Wuhan population 11000000 tot international passengers 33010 most probable 996 low P 0.025 lowN 204 upper P 0.975 upN 2402
Wuhan population 19000000 tot international passengers 26408 most probable 2155 low P 0.025 lowN 443 upper P 0.975 upN 5193.
修正一下。 我可能把问题想得太简单了点。 CL 有不同算法(或者说定义), 不同的算法会给出不同的结果。
可以参考一个帖子“武汉人都去哪儿了”有航班座位统计
@electron8964 #56
多谢多谢!!!厉害!!!把这个方法的全部结果一下子就算出来了,擅于编程就是好。
@主席 #62
可惜我也不知道原文作者是怎么算CL
@漢娜怎麼說 #59 https://en.wikipedia.org/wiki/Negative_binomial_distribution#Maximum_likelihood_estimation
貌似这个公式是假定r和k已知,估计p的值。
但是作者的意思好像是p已知,k已知,要估计的是r。
r是染病但未在国外确诊人数,k是在国外确诊人数,p是1个武汉患者在外国被确诊概率。
补充wikipedia那段话写着: This equation cannot be solved for r in closed form.
If a numerical solution is desired, an iterative technique such as Newton’s method can be used. Alternatively, the expectation–maximization algorithm can be used.[20]
数值法求解,但是如果p已知,都不用牛顿法。 只要用r=1到10000,把所有似然函数值算出来,取argmax就可以求出r的最大似然估计。
区间估计还是不明白。
今天数据更新,估计国内约有4000 感染者:
https://www.imperial.ac.uk/mrc-global-infectious-disease-analysis/news–wuhan-coronavirus/
我自己算的: oversea case 8 Wuhan population 19000000 tot international passengers 33010 most probable 4022 low P 0.025 lowN 1615 upper P 0.975 upN 7507
离开武汉的500多万人都去了哪里?大数据告诉你 https://www.yicai.com/news/100481655.html
根据这里的数据,截止到1.22号为止,大概武汉感染者约为1.1 万,从武汉转移出去的感染者约为4000,