본문 바로가기

Statistics

Causality vs Correlation

기본적인 개념이지만 모델링 후의 해석과정에서 많은 사람들이 실수하는 부분이므로 간략한 정리를 해보고자 한다.


일단 결론적으로 Causality는 인과관계가 드러난 것이고 Correlation은 인과관계가 드러나진 않았지만 서로 연관성이 있다는 말이다.


Causality의 정의는 관련된 다른 모든 요인들(factors)이 상수로 고정되었다는 가정하에서 한 사건이 다른 사건의 결과가 되는 것을 말한다. Correlation은  관련된 다른 모든 요인들(factors)이 상수로 고정되었다는 가정하에서 두개이상의 변수들 사이의 관계의 크기와 방향을 나타내는 통계치를 말한다. 그러나 주의할 것은 변수끼리 Correlation이 있다고 해서 반드시 한 변수의 변화가 다른변수값에 변화를 주는 원인이라고 말할 수 없다. 

'Statistics' 카테고리의 다른 글

데이터 종류  (0) 2018.02.20
표본분포  (0) 2017.01.11
기술통계  (0) 2016.12.25
통계학의 주제  (0) 2016.12.21
What is the difference between Bayesian and frequentist statistics?  (0) 2016.11.18