武汉肺炎疫情人数统计对数坐标下的发现和预测

By chinatimeline at 2020-01-26

疫情人数统计对数坐标

https://chinatimeline.github.io/wuhan-coronavirus/

把最新公布的武汉肺炎疫情统计数据用对数坐标画出来有点意思:

  1. 确诊人数和死亡人数在对数坐标下几乎平行
  2. 疫情目前处于爆炸式增长阶段,爆炸式增长即指数增长,在Y轴对数坐标下则是直线,直线斜率代表传染指数。
  3. 从1月17号到现在公布的统计数据显示的传播指数恒定,说明疫情传播条件没有改变。
  4. 对数坐标下,数据没有按指数增长的部分,只可能是数据被篡改了。
  5. 疫情的传播条件从12月8日开始到现在并没有显著改变,因此传播指数应该保持恒定,那么实际感染人数应该是从12月8日开始按照1月17-1月25日之间的传播指数增长,在此假设下粗略估算目前感染人数应该在 $10^5$ 即位于十万数量级。

对数, 肺炎, 坐标, 疫情, 武汉


跟武汉护士的爆料9万接近

该干嘛继续干 at 2020-01-26
1

英美两国科学家估计的人数是2月4号会达到20万左右。

https://www.medrxiv.org/content/10.1101/2020.01.23.20018549v1

因为这次的肺炎病毒有10天潜伏期,所以目前确诊的人应该都是潜伏期之后,身体感到不舒服才去医院确诊。

按照16日到25日的对数斜率

= 0.1814/天

有两种办法估计实际感染人数的曲线:

1. 实际感染人数的曲线应该是现在确诊人数曲线往前平移10天

每10天感染人数增加65倍。那截止25日的实际感染人数应该是1975*65 = 128,375 接近13万人。

2. 实际感染人数的曲线从12月8日首个病例发现开始算

到1月25日为止,经过了48天,目前的感染人数应该是 $ 10 ^ { 0.1814*48 } $ = 500万人

第二种估算方法不一定很可靠,结果有点吓人,因为病情刚开始人很少,传播的指数规律不一定那么有效,所以如果时间少几天多几天数量差异会很大。

chinatimeline at 2020-01-26
2

在数据公布政策不变的前提下,只有看到这个对数曲线的斜率变小,即曲线变平之后,才说明找到了有效的控制疫情传播的方法。

chinatimeline at 2020-01-26
3

1月25日的10天后,也就是2月4日的确诊人数也应该是1975*65 约13万人,实际感染人数约是8百万。不过考虑到已经采取封城的措施,应该是有效的,到时候实际感染人数应该少于8百万。

chinatimeline at 2020-01-26
4

Forget第二种估算方法,5亿…… 跨城市的传播速度肯定是明显低于市内传播速度的,那个传播指数的假设不成立。我觉得感染人口上了百万之后,传播速度肯定会降下来。指数传播模式应该只在初期成立。

chinatimeline at 2020-01-26
5

另一种可能是过去10天公布的数据受到人为操控

chinatimeline at 2020-01-26
6

@chinatimeline #2 帝国理工的R0估计是2.6左右,比3.8低很多(也就是感染人数20万的那片文章)。

2c58 at 2020-01-26
7

过了两天,数字依然呈爆炸式增长,这是名副其实的病毒式传播。

确诊和死亡人数在对数y坐标下基本平行,说明目前并未有效控制传播的手段,也无有效的治疗手段,基本上就是自然死亡,所以跟确诊率增长指数相同。未来如果这两条线中任意一条斜率减小说明预防或治疗条件得到改善,疫情控制有所改善,反之若斜率增大说明传播力度增强或致死率提高(比如更强的变异病毒出现)。

chinatimeline at 2020-01-27
8

更正一下,上图中27日的数据是完整的,所以有可能27日第一次出现斜率明显降低的情况,如果接下来两天的数据能确认的话,那可能27日有好消息。(假设数据发布方式不变,医院未爆的前提下)

chinatimeline at 2020-01-27
9

28日的最新数据出炉了,此时4388确诊病例,可以肯定27日的数据绝对有问题

chinatimeline at 2020-01-28
10

机器之心发了一篇文章,综合了最近国际上几个研究成果

武汉疑似病例今日翻倍,报告称新型病毒传播速度已超SARS,更难控制

https://www.jiqizhixin.com/articles/2020-01-27

chinatimeline at 2020-01-28
11

27日的累计确诊人数不是2844人,而是4340,维基百科、163、一财都不约而同的没有把当日的确诊数据加进去。只需要在维基百科上的数据累加一下就得出当日新增确诊人数1596人。

chinatimeline at 2020-01-28
12

更正后的数据显示目前传播速度毫无减弱

chinatimeline at 2020-01-28
13

根据16-27号的数据做了个对数坐标下的简单线性回归,预计今天确诊和死亡人数会分别达到6677和152

chinatimeline at 2020-01-28
14

新华网刚刚的通报称28日全国新增确诊和死亡人数分别是1459和26,累计5974和132,明显低于线性回归的预测。新增确诊人数少于27日数据。

两种可能:1. 医院饱和或数据受操纵,2. 疫情扩散速度略有降低。

chinatimeline at 2020-01-29
15

维基百科上的图

主席 at 2020-01-29
16

@chinatimeline #6

确诊人数受到医疗资源的制肘,近几天医疗资源的紧缺和补给都将影响确诊人数的增长率。所以应当以(确诊人数+疑似病例人数*Y)为参考进行预测,Y为疑似病例最终成为确诊病例的转化系数。

我无法获取Y的数值,考虑到赵家会极力压低数字,所以Y的值可能无限趋近于1。

官方消息 at 2020-01-29
17

@chinatimeline #15 如果是传播速度降低,这个其实反应的是几天之前的传播速度降低。因为从感染到发病,从发病到确诊都需要时间。

2c58 at 2020-01-29
18

@2c58 #18 我更倾向于认为这是人为控制导致的数字减少,因为主要减少的就是武汉市内的新增数字。

chinatimeline at 2020-01-29
20

@主席 #16 Wikipedia上这张图出现在我之后

chinatimeline at 2020-01-29
21

@chinatimeline #20 嗯,这个推特估算的发病到确诊平均时间大概在5天左右,再加上平均10天的潜伏期,现在倒推应该是1月13日左右感染的病人。不太能对得上。

2c58 at 2020-01-29
22

@主席 #19 有意思,使用分支过程估算的R_0比简单回归的要小。

2c58 at 2020-01-29
23

@2c58 #23 医学上更准确的估计应该是要筛选每个病例,对所有公布的数据作出准确的调整,再结合各种具体的时间参数,像潜伏期和确诊时间等再估算。简单的回归模型只是利用官方公布的数据,官方公布的数据明显受医疗物资和医院饱和度和宣传控制等诸多因素影响。

chinatimeline at 2020-01-29
24

@2c58 #23 简单回归模型的目的不是为了预测医学参数,而是评估和监督中共的医疗资源、宣传政策等人为因素是否改变。因为2月4日之前的统计数据主要都来自武汉封城前感染者过了潜伏期之后的症状爆发。武汉封城之前基本上就是自由传播的,所以2月4日之前的数据都不应该跟简单回归模型偏离太远。如果偏离太远说明中共在操纵数据。

chinatimeline at 2020-01-29
25

@chinatimeline #25 你可以拿你的模型跟在其他地方发生的流行病数据做下比较,比如美国的甲型流感,看下在政府某些举措后,感染人数的曲线会不会出现变化。

2c58 at 2020-01-29
26

战狼也在行动。

Twitter

The thing no one tells you when you start a career in outbreak response is the sheer number of angry, threatening emails you get for doing your job. I think #nCoV2019 has been worse than #Zika, #MERS, and #Ebola combined for me though. Comments have been more racialized too. 1/2

https://twitter.com/maiamajumder/status/1222406340578021377

知乎

关于传染病的数学模型有哪些? - 知乎用户的回答 - 知乎

于教授您还将这样的微博置顶,甚至惊动了中央政府。不啻为造谣的一种高级姿势啊。

https://www.zhihu.com/question/367466399/answer/983804341

主席 at 2020-01-29
27

新型冠状病毒传播基因组分析。 状况报告2020-01-25

https://nextstrain.org/narratives/ncov/sit-rep/zh/2020-01-25?n=0

主席 at 2020-01-29
28

@主席 #27 把前面“诛心”的部分去掉,关于常微分方程的初值/参数敏感性他说的很有道理。就当前nCoV的传播参数的估计精度,我同意很难在100天这个时间尺度上做出预测。

“研究无禁区,宣传有纪律”。包括我在内的很多人不喜欢这句话。但是研究者在面临真实世界巨大的不确定度时,的确需要谨言慎行,以免自己的言论被误读,特别是在这种大众关心的公共卫生问题上。

2c58 at 2020-01-29
29

截至1月29日24时新型冠状病毒感染的肺炎疫情最新情况

https://archive.md/LujPf

http://archivecaslytosk.onion/LujPf

存档了,大家不要去挤国家卫健委那个破网站了。

chinatimeline at 2020-01-30
30

连续第二天跟16-27日的传播指数偏离,而且28、29日的增长指数差不多。

chinatimeline at 2020-01-30
31

#新冠病毒 研究进展

NEJM刊登了中国疫病预防控制中心的新论文(原推里有链接),详细研究了425位病人。

原推学者总结的要点:

  • 一月报告的病例里可能大部分没去过野味市场
  • 潜伏时间~5.2天
  • 爆发间隔~7.5天(从被感染到感染别人的时间)
  • R0值~2.2天(R0即时反映每个感染者平均传播人数)

原推特

2c58 at 2020-01-30
32

@2c58 #32

这张图有很多信息。

  1. 和海鲜市场有联系的是第3例。

  2. 1月8日以后病例数下降是确诊的延迟。

  3. 从China CDC一级响应到向公众公布有一个时间差。

主席 at 2020-01-30
33

@2c58 #32 这篇文章的最大价值是它是一个案例一个案例去访问,确认他们的发病时间,就诊时间,住院时间。用发病时间计算$R_0$,serial interval, 增长率是最准确的。

主席 at 2020-01-30
34

@chinatimeline #2

这篇论文计算的倍增时间是7.4天。论文给出的增长率是0.10 (应该是以e为底的,chinatimeline统计的好像是以10为底)

主席 at 2020-01-30
35

数据造假都是明摆着的事情。至少几万人感染已经逃不掉了。湖北党政机关那么多人感染,看起来这一次是真的瘫痪了。相信不是某个组织投毒,完全就是懈怠导致的。

习近平的统治模式遇到了巨大挑战。

sorrysorrysorry at 2020-01-30
36

假设人数n(t)是指数级增长。增长率是r。

T是serial interval,也就是假设A传染给B,A的发病时间与B的发病时间间隔就是T。

$R_0$是一个感染者平均传染给几个人。

这3个数的关系是:

泰勒展开近似就是$R_0 \approx 1 + rT$

https://en.wikipedia.org/wiki/Generation_time

主席 at 2020-01-30
37

@2c58 #32

用27-30日的数据作了第二个对数系线性回归。官方公布的数据28日出现第一次拐点,刚好是武汉23日早上封城后的第六天,如果5.2天的潜伏期估算靠谱的话,那有可能是真拐点。

不过断言拐点的前提是中共政府没有人为操纵数据发布,医疗物资没有出现严重短缺的假设下。刚刚世卫组织已经宣布全球紧急状态了。我还是认为认为操纵数据的可能性最高。

chinatimeline at 2020-01-31
38

@chinatimeline #38 PHEIC的宣布跟中国国内的情况无关,只跟中国国外的情况有关。

2c58 at 2020-01-31
39

@2c58 #23 分支过程好像比较准确?
会不会因为初期人数少。
连续模型适合人数特别多的情况?

主席 at 2020-01-31
40

@2c58 #39 世界各国的疫情发展这么迅速,两三天时间确诊人数翻倍,这说明肺炎传播速度跟16-27日国内公布的数据揭示的传播速度相符。这几天数据更新越来越慢,而且越来越受控制,说明中共开始加大操纵数据发布的力度,不过现在有了国际上的对比,谎言很容易被揭穿。

chinatimeline at 2020-01-31
41

@chinatimeline #41 难说,武汉感染者大幅增加,到传到国境之外的延迟不知道有多久。

2c58 at 2020-02-01
42

@主席 #40 哈哈,也是遗憾。我自己也算是概率的半个专业人员了,但是对这方面模型一窍不通,还是得临时学。

2c58 at 2020-02-01
43

根据维基百科的数据,新添加了中国大陆之外的国际确诊病例数的曲线。

两点观察:

  1. 1月28日确诊数据产生第一个拐点,疫情扩散指数相比前一阶段(1月16-27日)有所降低,结合最近几篇论文对潜伏期的估算5.2-6.4天,很可能是23日起的武汉封城起到减缓疫情扩散的效果。
  2. 大陆之外的国际确诊数据的可信度比中共公布的数据可信度高很多,因为是更加透明的多个国家和地区数据的汇总。目前看来中共1月28-31日至公布的数据和1月24-1月31日国际数据相比,增长指数没有明显的冲突,即中共公布数据的增长指数没有低于国际增长指数。
chinatimeline at 2020-02-01
44

两条确诊的线看上去好像的确很parallel

但是从网络各处的消息都是说试纸的极度短缺,官方数字没有瞒报似乎很难有说服力。

漢娜怎麼說 at 2020-02-02
45

@漢娜怎麼說 #45 可以通过各国撤侨的侨民感染率来估计,我根据这个推断出来的数据是百分之一。武汉按照一千二百万人数算,感染人数最低是十万的数量级 。

小二 at 2020-02-02
46

@小二 #46

是根据日本撤侨的数字?

有症状的在在很多国家没有被允许上第一趟的飞机,中共貌似对撤侨的名单也有审视过。

总之,确切到底多少人可能就跟Chernobyl一样,永远没办法知道。

漢娜怎麼說 at 2020-02-02
47

@小二 #46

  1. 无控制的情况下增长率是0.1/天,7.4天翻倍。
  2. Imperial College London预测1月18日4,000 (1,000-9,700)

据此推算: 假设增长率不变,从1月18日到2月2日是15天。增长了$e^{0.1*15}$倍。现在的人数应该是17920 (CL: 4480, 43456)

今天丁香园统计的人数是:确诊14411,疑似:19544。

由此可见,数据基本吻合。10万量级可能性不大。

主席 at 2020-02-02
48

@主席 #48 这是官方收治的数量,离十万并不远,此外,根据财经杂志 统计数字之外的人:他们死于 “普通肺炎”?,很多人压根就因为缺床位和试剂盒,根本无法被收治。

另外,黄冈市的情况你也看到了,官方提前发布通知说明天确诊病例会大幅上升。可见,这个官方数字是多么的不靠谱。

小二 at 2020-02-02
49

@主席 #48 不要小看统计学的力量,统计学家就是会用已知来估计未被观察到的

科学家估计武汉新冠状病毒感染人数可能上千

统计学家最新(1月27日)预测

小二 at 2020-02-02
50

@小二 #50 这次事件让很多人见识到了统计学的威力。

主席 at 2020-02-02
51

@小二 #49 死亡人数就很不靠谱

sorrysorrysorry at 2020-02-02
52

@sorrysorrysorry #52 我觉得可以参考SARS的死亡率,中国区是6.6,香港和台湾分别是17和10,哪怕以最低的中国区计算,也有近千人。

小二 at 2020-02-02
53

关于死亡率的估计

我们现在知道几件事情:

  • 有很多患者囿于医疗能力无法确诊,甚至至死都无法确诊
  • 新冠又有许多轻症感染者,甚至可以自愈

如果我们把所有的新冠感染者,简单地分成轻症和重症,如果做以下的假设

  • 轻症的死亡率更低,自愈率更高
  • 重症患者更容易被确诊

可以得出结论,实际死亡率比官方死亡率(官方新冠肺炎死亡人数 / 官方新冠肺炎确诊人数)低。

2c58 at 2020-02-02
54

目前很多论文估计了R0 和各种时间间隔,其实拿个表格算一下就能得出来。

chinatimeline at 2020-02-04
55

指数模型本来就不太可靠,即使不考虑政策的实施,单纯考虑地理因素,也知道不能用指数模型。

另外,只要你看一下SARS的R0其实也是上蹿下跳,根本不是常数,所以指数模型在实践中也是不科学的。

现在唯一可靠的就是国外感染人数,从撤侨数量中推估出来武汉感染率约1%,这一点可能是目前唯一有价值的数据了,而随着时间的推移,这个数据的价值也会慢慢消失。

rrrr at 2020-02-04
56