「casual inference」,直译过来便是因果推断,我想绝大部分人在哲学意义上是相信这个世界上有因果的,尽管并没有什么直接证据.毕竟宿命论什么的还是太过可怕了,事物皆有因才更符合我们的intuition,更何况识别因果作用在政治学,生物学,医学,经济学等领域都有着现实的指导意义.从「善有善报,恶由恶报」「马蹄铁毁了一个国家」这种简单的因果,到如今更多更复杂的what if,因果推断大有作为,对机器学习,深度学习模型也有启发性的解释.
所谓因果推断,简单来讲就是提出感兴趣的因果问题,(可选:画出因果图),用因果方法识别并估计处理对结果的因果效应,给出合理的因果解释.(这其中对数据会有诸多假设,最著名的便是rubin提出的SUTVA1)
学习建议:先粗读「CAUSAL INFERENCE:What If」以获得因果直觉,再看「A First Course In Casual Inference」将推导过程严谨化,「Causal Inference in R」可作为休闲读物…了解如何真正应用因果推断.此外可以关注因果研讨会以知学界前沿.
我将更新「A First Course In Casual Inference」这本由丁鹏老师于2023写的的因果推断方面的教材中的公式解释与一些习题答案,其在书页面的页面介绍如下(显然这是本数学推导上十分严谨的书,十分难读):
I developed the lecture notes based on my “Causal Inference” course at the University of California >Berkeley over the past seven years. Since half of the students were undergraduates, my lecture notes only required basic knowledge of probability theory, statistical inference, and linear and logistic regressions.
以及「CAUSAL INFERENCE:What If」作为补充,这本写的就十分好懂了,causal inference 的相关intuition都引入的很好,适合入门.
以上两本教材作者均分享了pdf与代码,到他们的blog上获取即可.
我将分章更新读书笔记与一些习题解答,大致分为:
introduction与一些所需的概率学与数理统计知识
Randomized experiments
Observational studies
Diffculties and challenges of observational studies
Instrumental variables
Causal Mechanisms with Post-Treatment Variables
casual inference in R与一些因果推断相关论文与书籍推荐阅读
最后,说是笔记,我更希望本系列能成为辅助阅读手册,原书内容严谨且全面,是近年来最好的因果推断入门书之一,但还是存在一些问题:有些晦涩难懂,遗漏了一些内容(据说将会出第二版),代码不够tidy且无专门的代码块区分,因此我将解释一些书中的公式并将代码tidy化并加上注释,因此本系列不会附带大量原书内容.
\[ \mu(hello) \]
附上丁鹏老师的blog:
将会用到的R package:
因果推断两道期末考试题与解答:
随机试验:
1.CRT数学定义
2.fisher随机实验,\(underH_0,\hat \tau的均值与方差\)
3.neyman,写出\(var(\hat \tau)\)的式子并证明:
\[ var(\hat \tau)\leq \frac{1}{n} \{\sqrt{\frac{n_0}{n_1}}S(1)+\sqrt{\frac{n_1}{n_0}}S(0)\}^2 \]
二.
\(Z_i二元处理分配变量,D_i三元处理接受变量,有三种水平:\{0,1,2\}\)
1.有多少种主成分?\(\{D_i(1),D_i(0)\}\)
2.单边依从性假设成立:D_i(0)=0,识别三种主成分比例
3.单边依从性假设成立,识别三种主成分因果作用
Footnotes
Stable Unit Treatment Value Assumption, a key concept in causal inference. It has two main components:1.单位间无干扰 2.treatment应该严格定义.↩︎