Stable Unit Treatment Value Assumption (SUTVA)
가장 기본 가정이지만 많이 간과됨
섵바(SUTVA)라는 가정임 - 2가지가 있음
1. Counterfactual consistency
t가 있을 때의 potential outcome과 t가 없을 때의 potential outcome의 차이가 Causal effect임
t를 받은 실제 observed outcome과 만약 t를 받지 않았다면 나올 potential outcome(Counterfactual)이 있음 이것의 차이로도 구할 수 있음
BUT Counterfactual를 구할 수 없으니 control group을 통해서 대체해서
인과적인 효과를 추정할 수 있음
이 때의 가정은
t가 있을 때의 potential outcome과 t를 받은 실제 observed outcome이 같아야 함
통계추정에서 샘플의 숫자가 무한대로 더 커질수록 수렴을 할 수 있음
통계적인 부분이랑 다름~!~!~!
그래서 앞에 Counterfactual이 붙음
원인변수에 대한 manipulability가 중요함
ex) 비만
비만이 원인변수
비만이 manipulability라고 생각할 수 있음 이는 살을 뺄 수 있고 찔 수도 있고 즉, 관리가 가능함
어떤 처방을 내려서 비만 상태는 원하는 만큼 딱딱 1과 0으로 조정할 수 없음
비만이라는 상태는 적절한 원인변수라고 보기 없음
어떤 이슈? 문제?
비만이 건강상태에 미치는 인과적인 효과를 추정하기 위해서 어떻게?
비만일 때의 건강상태 비만이 아닐 때 건강상태를 비교해야 함
BUT 사람들이 비만이 된 이유는 사실 다양한 원인이 있음
누군가는 밤에 야식먹는 습관, 지병, 운동부족 등등이 있음
서로 다른 이유로 관찰되는 Observed outcome은 각각 다름
비만이 있을 때의 Potential outcome을 구해야 하는데 비만은 각자 다른 이유로 비만이 된 사람들이 있기 때문에 원인에 따라서 관촬되는 healty outcome은 다름!!!!
-> 즉, Counterfactual consistency에 위배됨
2. No interference
간섭이 없어야 함
이해하기 좀 쉬움ㅎㅋ
각자의 potential outcome이 서로 간섭과 영향을 받지 않아야
즉, t를 받은 사람과 t를 받지 않은 사람과 관련이 없어야 함!, 영향을 받지 않아야 함
ex) 신제품 영향 연구
무작위 추첨으로 신제품 사용을 받은 사람이 있고
사용을 받지 않은 사람이 있음
BUT 옆지비에 추첨이 되어서 신제품을 사용하고 있는 사람이 있음
그래서 부러움을 느껴서 일상생활이 지장을 줌
-> 이는 명백하게 간접적으로 영향을 받음!
이러한 영향이 없어야 한다는 가정임
2가지 가정을 아우루는 것을 섯바라고 함~
ATT, ATU, and ATE
ATE : T를 받지 않은 집단, T를 받은 집단 모두에 대한 평균
ATT : T받은 집단에서만 Potencial outcome을 구함
ATU : T받지 않은 집단에서만 Potencial outcome을 구함
우리가 현실에서 가능한 비교릃 해보면
T를 받은 O과 T를 받지 않은 O의 비교가 실제 우리가 비교 가능한 effect임
이론적으로 우리에게 필요한 것은 Counterfactual임
만약 t를 받지 않았더라면 있었을!!
우리가 필요로하는 causal effect
뒤에는 인과추론을 방해하는 selection bias
-> 즉, causal effect과 selection bias의 합!!
여기서 selection bias를 제거하면 Observed effect of the treatment와 causal effect와 같아짐
t그룹에서 t를 받은 o과 t 그룹에서 t를 받지 않은 o의 차이를 구하고 있음
t그룹에서의 효과만을 이야기하고 있음
causal effect는 ATE가 아닌 ATT임!!!
Control group의 결과를 가지고 counterfactual를 추정함 ~
언제??
우리가 구한 ATT가 ATE와 같아질까?
Treatment그룹과 Control그룹의 샘플
Control Group (1-파이) 비율
Treatment Group 파이 비율
ATE : 가중평균
ATT : ATT + ATE - ATE
실제로 ATE만 남기 위해서는 (Different treatment effet bias + Selection bias 제거하기 )
ATT = ATU가 되어야 함!!!
경우에 따라서 다를 수 있음 그러면 ATE를 구할 수 없음
ATT 그 자체로 의미가 없나?
-> NO
두 그룹을 바꿔도 결과가 동일해야 함 즉 exchangeable 해야 함
회사에서 상황에 따라서 일부 고객들로 자연실험 분석
쿠폰의 효과?
Treatment 쿠폰을 받은 그룹
Control 받지 않은 그룹
무작위 실험을 한다면 ATT와 ATE가 같아질 확률이 높아짐
누가 쿠폰을 받을 확률이 높은지?? 생각해보자~
쿠폰을 원하는 사람들은 여러 채널로 받으려고 함
ATT를 구한다고 하더라도 비슷한 효과가 나타나지 않을 것임
Control은 쿠폰에 반응을 하지 않는 특성임 -> T그룹 만큼의 효과가 나타나지 않음
즉, ATT는 ATU와 같지 않을 확률이 높음!!!
회사는 꼭 ATE가 필요하지 않을 수도 있음
수익성을 극대화하기 위해서느 쿠폰에게 반응성이 높은 사람들에게만 쿠폰 뿌리는 게 마케팅 효과가 높음
즉, 회사의 입장에서는 ATT만 알아도 충분함
우리가 구한 효과가 무엇이고?
그 효과가 어느 집단에 적용될 수 있고?
어떤 효과를 구하고 싶은지?
컨택스트와 데이터의 특성을 고려하는 것이 중요함!!!!
'인과추론' 카테고리의 다른 글
Week 2-4 실험/준실험 접근법의 한계 (1) | 2024.01.16 |
---|---|
Week 2-3 인과추론의 기준점 : 무작위 실험 (0) | 2024.01.16 |
Week 2-1 잠재적결과 프레임워크 (1) | 2024.01.14 |
Week 1-4 인과추론의 목적 (1) | 2024.01.14 |
Week 1-3 빅데이터와 AI 시대의 인과추론 (1) | 2024.01.05 |