인과관계
- 원인은 결과보다 시간적으로 앞서야 한다.
- 원인과 결과는 관련이 있어야 한다.
- 결과는 원인이 되는 변수만으로 설명이 되어야 하고 다른 변수에 의한 설명은 제거되어야 한다.
상관관계
- 어떤 변수가 증가할 때 다른 변수가 함께 증가하는지 혹은 감소하는지를 관찰하여 파악해야 한다.
- 어떤 것들 간의 관계가 밀접하다는 것을 나타낼 뿐, 어느 것이 원인이고 어느 것이 결과인지에 대해서는 아무런 증거도 제공하지 않는다.
- 단순한 상관관계를 인과관계로 해석하는 오류를 주의해야 한다.
우연한 상관관계
- 우연히 상관관계를 나타내는 경우가 흔하다는 것으로, 통계학에서는 허위 관련성이라고 한다.
- A가 일어난 다음에 B가 일어났다고 해서 A가 B의 원인이라고 결론짓는 것을 전후인과의 오류(Post hoc fallacy)라고 한다.
인과관계의 방향
- 상관관계가 있다고 할 때 흔히 생각하는 것과 반대방향으로 인과관계가 작용할 수 있다.
- 성급하게 단순화하는 오류를 그대로 받아들이지 않도록 주의해야 한다.
오늘의 한줄 : 우연하게 그 관계가 성립한다고 상관관계가 있는 것이 아니다.
출처 : SK 동반성장 아카데미, 빅데이터가 별건가 알고 보면 쉬운 통계상식, 「상관관계와 인과관계」
'공부 > 통계' 카테고리의 다른 글
[통계상식] 비교와 어림수 (0) | 2019.12.09 |
---|---|
[통계상식] 여론조사 올바로 이해하기 (0) | 2019.12.06 |
[통계상식] 확률의 간단한 개념 (0) | 2019.12.06 |
[통계상식] 시각화의 오용과 남용 (0) | 2019.12.06 |
[통계상식] 평균과 퍼센트의 함정 (0) | 2019.12.06 |