Policy Change Index-阅读中国,用机器学习预测政策变化
前段时间大家在分享论文,我也分享一个已经被广泛报道过的研究项目 Policy Change Index 政策变化指数
官方网站 https://policychangeindex.org/
PCI-China
其中PCI-China去年已经被科技媒体广泛报道过了,这个项目是George Mason University的Mercatus Center两名经济学家Julian TszKin Chan和机器学习专家Weifeng Zhong合作的项目,受NVIDA资助。该项目用机器学习阅读中共的官方喉舌[人民日报]自1946年创建以来的所有报纸文字,并且用机器学习技术去检测该报纸在设置政策优先级的方式上的变化,从而生成单一的政策变化指数。目前,该指数以季度为最小单位,每季度更新一次,将来会升级到按月为颗粒度,每月更新一次。具体见发布页面
https://policychangeindex.org/overview-PCI-China.html
我个人认为PCI-China政策变化指数整体上很make sense,且在时间上比我自己阅读新闻获得的感受要早6-12个月,所以应该是很值得长期跟踪。
PCI-Crackdown
相比PCI-China,一个更新但更有意思的是PCI-Crackdown,同样是以人民日报为数据,通过跟8964镇压前后几个月的内容进行对比,用来预测当前香港发生64式镇压的可能性。个人认为其结果高度符合自己对媒体环境的感受。尤其是两个高峰期:8月13日左右外媒拍到深圳体育场军队集结和特朗普喊话不要镇压,10月下旬禁蒙面法之后发生暴力升级等等,以及10月1日前后和12月下旬第一阶段贸易协议临近的缓和期。非常符合直观感受。
https://policychangeindex.org/overview-PCI-Crackdown.html
PS: PCI所用的互动图插件跟我的时间线用的绘图插件都是一样的 Plotly。
Papers在官网上列出
- Chan, Julian TszKin and Weifeng Zhong. 2019. “The ‘Value’ of Propaganda: Machine Predictions of Rare Events Based on Text Data,” Yale Journal of International Affairs (forthcoming).
- Chan, Julian TszKin and Weifeng Zhong. 2019. “Predicting Authoritarian Crackdowns: A Machine Learning Approach,” Mercatus Working Paper (forthcoming).
- Chan, Julian TszKin and Weifeng Zhong. 2019. “Reading China: Predicting Policy Change with Machine Learning.” AEI Economics Working Paper No. 2018-11 (latest version available here).
- Chan, Julian TszKin and Weifeng Zhong. 2018. “Policy Change Index: A Simulated Example.” Quantitative Notes, No. 2018-3.
虽然用机器学习取得的结果跟个人阅读的感受差不多,但是机器相比人类具有以下优势:
第一,能排除个人情绪、日程安排等因素带来的判断起伏,一致性很好。
第二,输出统一参考点的量化数据,而个人在较长时间尺度上的会因为自己的定锚点变化,而判断起伏很大。
第三,机器能始终如一的勤奋,人类要长期保持最佳状态很难。
能解释多一些吗?我看不太懂。按我的理解,这个PCI指示政策变化的可能性,但是并没有说明向哪个方向变化是吗?为什么他们不总结出能预测变化方向的关键字呢?
政策变化来源既有决(独)策(裁)者的思维模式因素也有外在环境的变化因素。而外在环境——社会变化完全没有办法预测。如经济危机爆发点、柏林墙倒塌、苏联崩溃、阿拉伯之春……
@懦夫斯基 #4 不过因为美国的政策透明度很高,政策的制定讨论都是全社会参与,具体找议员或政府部门都可以要到信息,所以这样的分析可能没有什么价值。但是用在中共这种黑箱操作的列宁政党,就很管用了,毕竟老外不懂人民日报那么多潜规则。
@chinatimeline 虽然图上显示的变化比较早,但是它数据更新的时间往往是上一个季度完了之后再过7、8个星期,所以时效性还是打了折扣。不过相比靠人去读人民日报来判断政策变化,机器当然还是稳定可靠得多。
@懦夫斯基 #4 可以了解下钱刚在港大开设的一门课,叫生日报,就是查看你生日那一天的报纸,印象最深的是邹思聪的一篇课堂作业
https://medium.com/birthday-paper/1963-%E6%8A%A5%E4%B8%8A%E5%B7%B2-%E6%97%A0-%E6%AF%9B%E4%B8%BB%E5%B8%AD-%E9%92%B1%E9%92%A2%E8%80%81%E5%B8%88%E8%AF%BE%E4%B8%8A%E7%9A%84%E7%94%9F%E6%97%A5%E6%8A%A5%E3%89%92-7d17b60ab3bf
1963:报上已“无”毛主席 — — 钱钢老师课上的生日报【22】
其实中共的宣传模式也是很僵化的,座次版面位置篇幅占比都能说明非常多的问题,只是整理工作很枯燥,我很看好这方面的研究,既有意思,也容易出成果发paper讲故事。
@小二 #9 @小二 #8 这个生日报的课堂作业不错,是资深新闻工作者教晚辈如何读懂人民日报。这些历史还真的细细的去挖。最近在整理时间线这样粗糙的工作也发现一些规律,很多事件的细节从来没有出现在教科书,另外我们平时在教科书和媒体所看到的历史人物,都是那些已经翻案的,比如刘少奇在历史课本上还能见到,但高岗、陈伯达、康生、再早的博古等人基本上都很罕见,即便后人看得到他们的名字,也对他们在当时的地位和作用完全无知,基本会认为无足轻重的角色。近一点的赵紫阳和胡耀邦就是最好的例子,很多90后根本没听说过这两个人。
@waliesishabi #13 诉诸人身警告一次。
苏莱.曼尼被杀–>北京新禁空令
https://policychangeindex.org/pdf/Reading_China.pdf
预测政策事件,靠机器?安全不靠谱,看到说会镇压香港就笑了,太好笑了,对于香港最大的处罚就是不干预,如果你是台湾人我鼓励你去香港犯罪只要能撤退就合法你们为什么不去呢?这可能是台湾的年轻一代暴富的最后机会了。香港不干预,以后他们会求着我党干预的。