인과추론 10

Week 3-2 인과추론 관점에서의 데이터구조의 이해

회귀추론을 위한 데이터분석을 하려면 데이터 구조가 중요함 seletion bias를 효과적으로 통제하는 design할 수 있음 Data Structure 1. Cross-sectional data 특정 한 시점에서 여러 unit을 포함함 suvey로 모으면 대표적임! 2. Time-series data 시간에 따라서 변화를 관찰함 주식가격 추이, 국가에서 gdp 추이 3. Panel(longitudinal) data 두 가지를 모두 합친 데이터 여러 유닛에 대해서 시간에 걸쳐서 반복적으로 관찰할 수 잇는 경우 이것이 동일한 유닛에 대해서 시간에 대해서도 모두 관찰할 수 있으면 가능해야 함 추적이 불가능하면 여러 섹션의 크로스섹션을 모아놨다고 해서 panel 은 아 fixed effect를 활용하는 데 제..

인과추론 2024.01.18

Week 3-1 인과추론을 위한 회귀분석의 역할

Regression for Causal Inference 통계적인 성질, 통계학 개론적인 내용은 아님 regression과 matching을 어떻게 재해석 할 수 있을지? 알아보기~~ Causal Hierearchy from the Potential Outcome Perspective 인과추론의 수준이라면? 신뢰도가 있음~ 하지만 문제는 실험이 불가능한 상황이 많음 그럼에도 RCT가 중요한 이유는? 우리는 가상의 RCT를 떠올리고 이를 기준점으로 삼아서 데이터분석을 떠올림 RCT를 모방하고자 하는 전략을 Identification strategy라고 부름 일반적으로 regression 종속변수 a와 독립변수 y 추정된 결과를 인과관계로 분석할 수 있는지는 별개의 문제임 잘 디자인 된 regression은..

인과추론 2024.01.18

Week 2-4 실험/준실험 접근법의 한계

Limitations of RCT : Specifically Defined Treatment 주로 RCT의 장점만 설명함~ 한계점을 얘기하자면! 재택근무가 생산성에 미치는 효과에 대해 조사함 재택근무와 현장근무가 합쳐진 Hybrid working에는 적절한지 알 수 없음 RCT는 구체적으로 어던 것을 알고 싶은지 정하는 것이 중요함 물이 해로운지? 이는 적합하지 않음 양이 얼마인지, 어떤 물인지 등등 정해야 함 즉, 너무 다양한 T가 있을 수 있기 때문에 Outcome이 다양해서 causal effect를 정하기 어려움 구체적이고 potential outcome이 명확하게 있어야 함! 실험을 통해서 인과관계를 밝혀냈고 이를 확장시키는 것은 한계가 있음 Limitations of RCT : External..

인과추론 2024.01.16

Week 2-3 인과추론의 기준점 : 무작위 실험

Gold Standard of Causal Inference Causal Hierarchy from the Potential Outcome Perspective 위로 갈수록 인과추론을 가정을 충족할 수 있고 즉, 신뢰도가 높음 기존의 인과추론 결과를 결합해서 조건이나 상황에 따라서 분석, 즉 종합적인 분석!! Meta-Analysis 여러 연구들을 종합하는 분석이기 때문에 단일 방법론 x Randomized Controlled Trial (RCT) 가장 많이 씀! 실험이 답이구나! 라는 답이 아닌~~ 왜 인과추론에서 이것이 Golden standard이라고 불리는지 아는 것이 중요 현실에서는 실험이 불가능한 상황이 훨씬 많음 실험이 불가능한 상황에서 가능하게 만드는 것을 공부함 아래 방법론들을 공부하기 ..

인과추론 2024.01.16

Week 2-2 잠재적결과 프레임워크의 가정

Stable Unit Treatment Value Assumption (SUTVA) 가장 기본 가정이지만 많이 간과됨 섵바(SUTVA)라는 가정임 - 2가지가 있음 1. Counterfactual consistency t가 있을 때의 potential outcome과 t가 없을 때의 potential outcome의 차이가 Causal effect임 t를 받은 실제 observed outcome과 만약 t를 받지 않았다면 나올 potential outcome(Counterfactual)이 있음 이것의 차이로도 구할 수 있음 BUT Counterfactual를 구할 수 없으니 control group을 통해서 대체해서 인과적인 효과를 추정할 수 있음 이 때의 가정은 t가 있을 때의 potential out..

인과추론 2024.01.15

Week 2-1 잠재적결과 프레임워크

Randomized Controlled Trial 인과추론이 가능한 과정을 도출하기 indentificaiton의 핵심, 인과추론의 하나의 기준점이 될 수 있는 무작위스러움을 살펴보기~! Potential Outcome Framework 무작위실험에 기반한 실험적인 사고방식은 핵심임! 어떻게? 기준점이 되는지? 살펴보기 위해서 pof가 핵심임 비교!가 중요함 ex) 운동 운동을 한 후 효과가 있었는지 생각할 때 근육량 변화, 살이 빠졌는지 생각함 문제는 무엇과 비교를 하느냐? 같은 연령대의 평균과 비교? 인스타그램의 셀럽과 비교? 주변의 친구와 비교? 자신과의 비교? 비교는 어떤 행위의 효과를 측적하는 데 효과적임 BUT 각자의 기준으로 비교하면 각자 생각하는 효과, 비교방법의 옳음, 객관적인 평가도 어..

인과추론 2024.01.14

Week 1-4 인과추론의 목적

When is Causal Inference Necessary? 언제 인과추론을 사용해야 하는지? Primary Goal of Causal Inference 전통적으로 사회과학 분야에서 인과추론을 관심가져온 것은 원인에 대한 처방을 하기 위함임 Causal Effect는 Design될 수 있는 Treatment에 대해서만 객관적으로 정의되고 측정될 수 있음 그래서 No causation withoust manipulation은 인과추론에 있어서 하나의 교리로 받아들여짐 원인변수는 조작가능해야 함 manipulation의 이해를 위한 예시 고용에서의 성차별 분석 Gender가 원인이 되어서 고용률의 차이를 분석함 이 때 성별을 원인변수가 될 수 있는가? 조절할 수 있는 변수가 아님 즉, 인과추론 관점에서 ..

인과추론 2024.01.14

Week 1-3 빅데이터와 AI 시대의 인과추론

Can Big Data and AI be a Remedy for Causal Inference? 과연 빅데이터가 ai가 인과추론에 대한 해결책? The Rise of Data Based Empirical Research 데이터 기반한 실증연구, 양적연구가 분야 막론 증가하고 있음 우리는 데이터가 모든 것을 해결해줄 수 있을 것이라고 생각함 BUT 빅데이터가 진화할수록 인과추론을 어렵게 하고 있음 많은 데이터의 상관관계를 찾아야함 기사의 Bad Bigdata 예시 데이터 과잉시대에서 연구에서 인과관계를 분석하는 것이 어려운 것을 짐작할 수 있음 데이터 그 이상이 필요함 잘 설계된 Research Design 빅데이터는 인과추론에 대한 더 많은 기회를 제공해줌! 사회과학자, 데이터과학자, 데이터분석자의 협업..

인과추론 2024.01.05

Week 1-2 인과추론의 어려움

데이터를 통해서 인과추론의 어려움은 이해의 첫걸음 Correlation does not imply causation. Correlation : Co-movement in a direction 데이터가 함께 변화하는 패턴 Causation : Cause and effect 우리가 관심있는 것 일상적 or 억지스러운 예시를 함 데이터 상에서 보이는 correaton과 causation을 구별하는 것은 어려움 데이터 분석을 통해서 이를 구분하고 인과추론을 하는 것의 어려움에 대한 예시를 들어볼 것! ex) 최저임금 논쟁이 뜨거움 학자간의 의견도 다름 갑론을박 많고 삶에 영향을 크게 미치는 것이 큼 고용에 대해서 의사결정을 하는 것이 중요함 수많은 요인이 얽혀있는 현상에서 표면적으로 드러나는 상관관계가 아닌 인..

인과추론 2024.01.04

Week1-1 인과추론의 역사: 신뢰성 혁명

Credibility Revolution Cause-and-Effect은 무엇인지? 데이터를 통해서 인과관계를 추론하는 것 체계적인 데이터분석의 방법 일상생활에서 인과관계를 분석하는 데에는 어렵지 않음 but 데이터로 하는 것은 어떤 관심을 가져야 하는가?? 최근에 중요성이 커지고 있음 최근 노벨 경제학상 주로 이론적 기여를 인정 but 데이터분석에 대한 실증적인 연구를 더 인정함 2019 개발경제학 현장실험 연 2021 노동경제학의 자연실험, 인과추론의 방법론적 기여를 인정 Credibility Revolution이 주요 키워드 계량경제 관행의 비판이 많음 일반적인 통계 분석 관행의 비판이라고도 할 수 있음 'Let's Take the Con out of Econometrics'가 대표적인 비판하는 논..

인과추론 2024.01.02