[1-1] 인과추론과 예측 방법론의 차이
1. 인과추론과 예측 방법론의 차이
- ‘인과추론 vs 머신러닝에 기반한 예측’을 ‘사회과학 vs 머신러닝, 딥러닝 등의 모델을 통한 computational method’와 같이 단순한 방법론적 차이로 볼 수 없음
- 인과추론 vs 예측은 데이터 분석의 목적 자체가 다름. 목적이 다르기 때문에, 이를 달성하기 위한 방법론이 부차적으로 달라지게 됨
- 즉, 연구(데이터 분석)의 목적과 연구 문제에 따라 방법론을 취하는 것이 적절함
2. 인과추론은 언제 필요한가?
- Input에 대한 intervention 혹은 manipulation을 함으로써 output을 improve하고자 하는 게 주된 목적인 경우 (Input-Oriented Approach)
- 예를 들어, 코로나 19 백신을 접종해야 하는가, 접종하지 말아야 하는가?, 회사에서 마케팅 프로모션을 진행해야 하는가, 진행하지 말아야 하는가?, 정부에서 특정 정책을 도입해야 하는가, 도입하지 말아야 하는지?
3. 예측은 언제 필요한가?
- 원하는 target이 있고, 그 target에 가장 가까운 output을 얻는 게 목적인 경우. 여러 목적에서 활용 가능한 최적의 output을 도출하고 예측하는 경우 (Output-Oriented Approach)
- 예를 들어, 코로나 19의 감염 추세를 정확하게 예측, 사진이 개인지 고양이인지 분류, 잠재적 구매확률을 예측해서 구매확률이 높은 고객들에게 타겟 마케팅을 하는 경우
4. 인과추론과 예측은 상호배타적인가?
- 아니다
- 당연히 인풋과 아웃풋의 관계가 연결되어 있는 만큼, 인과추론을 통해서 알게 된 원인변수에 대한 이해가 있으면, 그 원인 변수를 prediction에 활용하면 보다 안정적으로 predictive accuracy를 향상시키는 데 도움이 될 것이며, 반대로 어떤 인풋변수가 아웃풋 변수를 꾸준히 잘 예측한다면, 인과적 효과가 있을 확률(없을 수도 있음)이 조금 더 높다고 볼 수 있을 것
References
인과추론의 데이터과학. (2022, June 14). [Bootcamp 1-1] 인과추론과 예측 방법론의 차이 [Video]. YouTube. https://www.youtube.com/watch?v=PmoDo_ANg90&list=PLKKkeayRo4PV_6-nbBgmUNOSpG1OO49M3&index=2.