Nothing Is Impossible 심슨의 역설(통계학 오류)
본문 바로가기

경제금융상식|회사정보

심슨의 역설(통계학 오류)

https://bioinformaticsandme.tistory.com/117

 

심슨의 역설 (Simpson's Paradox)

심슨의 역설 (Simpson's Paradox) Start BioinformaticsAndMe 심슨의 역설 (Simpson Paradox) 영국의 통계학자 에드워드 심슨이 정리한 역설 (심슨가족 관련 x) 각각의 변수에 신경 쓰지 않고 전체 통계 결과를..

bioinformaticsandme.tistory.com

 

 

https://namu.wiki/w/%EC%8B%AC%EC%8A%A8%EC%9D%98%20%EC%97%AD%EC%84%A4

 

심슨의 역설 - 나무위키

예를 들어 공학부에서 900명의 학생을, 식품영양학과에서 100명의 학생을 모집하는 어느 대학교에 남학생 1,000명과 여학생 1,000명이 지원했을 때, 지원자 수와 합격자 수가 다음과 같다고 하자. 공

namu.wiki

 
각 부분에 대한 평균이 크다고 해서 전체에 대한 평균까지 크지는 않다는 의미이다. 영국의 통계학자 에드워드 심슨이 정리한 역설로(심프슨의 역설이라고도 한다) 각각의 변수에 신경 쓰지 않고 전체 통계 결과를 유추하다 일어나는 오류이다.
 
쉬운 예를 들자면, 의사 A, B가 중환자 수술과 가벼운 수술을 맡는다고 생각해 보자. 두 수술 모두 A의 실력이 뛰어나지만, 아무리 실력이 좋아도 환자의 생명이 오락가락하는 중환자 수술을 많이 맡으면 전체 성공률은 떨어질 수밖에 없다. 반면 평범한 의사 B가 가벼운 수술을 많이 맡았다면, A보다 전체 평균 성공률은 더 높을 것이다. 이 경우 단순히 전체 평균으로만 계산한다면, 수술의 난이도 차이와 수술 횟수의 차이를 무시하여 결과를 왜곡하는 셈이 된다.