인과추론

Week 2-3 인과추론의 기준점 : 무작위 실험

유방울 2024. 1. 16. 17:48

Gold Standard of Causal Inference

Causal Hierarchy from the Potential Outcome Perspective

위로 갈수록 인과추론을 가정을 충족할 수 있고 즉, 신뢰도가 높음

 

기존의 인과추론 결과를 결합해서 조건이나 상황에 따라서 분석, 즉 종합적인 분석!!

Meta-Analysis

여러 연구들을 종합하는 분석이기 때문에 단일 방법론 x

 

Randomized Controlled Trial (RCT)

가장 많이 씀!

실험이 답이구나! 라는 답이 아닌~~

왜 인과추론에서 이것이 Golden standard이라고 불리는지 아는 것이 중요

현실에서는 실험이 불가능한 상황이 훨씬 많음

 

실험이 불가능한 상황에서 가능하게 만드는 것을 공부함

아래 방법론들을 공부하기 위한 첫걸음으로 무엇보다 중요함~~~

 

Treatment가 무작위로 배정됨

인위적인 환경은 lab

현장은 field

 

How Random Assignment Works

동전이 앞면 뒷면이 나올 확률은 반반이지만 던져봤을 때 무조건 반반으로 나오지 않음

하지만, 동전 던지기를 많이 반복하면 결국 반반의 확률이 됨

이는 큰 수의 법칙임!

동전을 던져서

앞면 T

뒷면 : C

모든 사람들이 반반의 확률로 배정이 됨!

이렇게 T를 받고 받지 않았다는 특성 말고는 모두 동일하게 함

한 그룹에만 T를 줬기 때문에 이 그룹에서 어떤 차이가 나온다면 T에 의한 것이라고 인과적인 추론이 가능

ex)

남자 여자 반반

키 작은 큰 사람 반반

 

개개인에 대해서 특성이 다르지만 두 집단을 평균적으로 봤을 때는 굉장히 비슷해짐

큰 수의 법칙이 작동되기 위해서 수가 충분히 많아야 함

 

Ceteris Paribus를 만드는 데 가장 효과적인 방법임

control를 counterfactual를 대체하기 쉬움

Random Assignment to Constitute a Control Group

재택근무에 대한 생산성 인과적 추론 예시

 

실제 데이터 분석 표를 보여주고 있음 

counterfactual과 유사한 Randomized group임

Randomized treatment 그룹과 Randomized control 그룹의 차이가 causal effect

Checklist (1) Quality of Randomization

무작위 실험에서 가장 중요하고 먼저 체크해야할 것

무작위 배정이 잘 되었는지??

 

대학교 교실에서 태블릿의 효과?

미국의 현장실험

 

726명의 학생

ㄱㅏㄱ 클래스를 랜덤하게 3개로 배정함

t1 : 자유롭게 태블릿 허용

t2 : 제한적인 태블릿 허용

t3 : 태블릿 전면 금지

 

메인 t를 교실 내에서의 태블릿 사용임

기말고사 성적의 차이가 매인 outcome

이 t의 인과적인 영향을 찾아봐야 함~~

 

우리가 기대하는 각 학생들의 특성은???

태블릿에 대한 제한과 허용을 제외하고는 나머지 전부가 다 똑같아야 함! 

그래야지만 태블릿 사용에 따른! 인과추론이 가능함

여학생의 비율, 학업성취도

등등 3개의 집단에서 모두 비슷한 것을 위에서 확인할 수 있음

아래는 메인으로 확인해야 할 곳임

우리가 의도한 대로 t가 잘 적용되었다는 것을 확인해볼 수 있음

결과 자체가 중요하다기 보다는~~

학업성취도, 

각 그룹에게 미치는 영향은 비슷할 것임

이 변수 자체는 효과가 있을 수 있음

3개의 그룹마다의 차이가 없어야 함

Checklist (2) Stable Unit Treatment Value Assumption (SUTVA)

재택근무에 대한 현장실험 연구

SUTVA 가정에 대해서 위배될 수도 있는 걸 얘기하자면

제비뽑기로 재택근무자를 선정했는데!

재택근무를 하고 싶어서 지원했는데 제비뽑기에 탈락한 사람들이 상실감  때문에 생산성이 낮아졌다면????

이는 SUTVA에 위배되는 것임

이런 가능성을 배제하기 위해서 간접적인 TEST를 진행해야 함

 

우버에서 현금 결제에 관한 현장실험

우버는 카드 내에서 결제가 되는 시스템

카드가 보편화되지 않은 나라가 많음

무작위로 배정된 기사에게 현금결제인지 아닌지 화면을 미리 떴을 때 기사님에게 어떤 영향을 미치는지?

 

실험 여부와 상관없이 운행패턴은 동일해야 함

BUT 현금 결제의 운행이 떨어짐

세금을 내지 않아도 되는 현금 결제를 더욱 선호해서 카드결제 고객을 거절함 ㅡㅡ

거절당한 고객들은 자연스럽게 선택지가 없는 기사들에게 몰리게 됨

결국 자연스럽게 선택지가 있는 기사는 카드 결제, 없는 기사는 현금 결제가 많아지게 됨

-> 이는 영향을 받기 때문에 SUTVA가 위배됨 ~

 

Checklist (3) Imperfect Compliance

실험참가자가 연구를 제대로 참여하지 않으면?

t를 배정 여부에 다라서만 비교분석하게 된다면

실제 t를 받았을 때의 여부와는 결과가 다를 수도 있음

 

도구변수를 활용해서

assignment 지침에 잘 따르는 집단

 

LATE (Local Average Treatment Effect)

2021년 노벨경제학상을 받은 가장 대표적인 노벨 성과임!!

일단 영상으로 맛보기 좀 해봄 ㅋ