Professional Documents
Culture Documents
1등 - 통계 바로쓰기 공모전 수상작
1등 - 통계 바로쓰기 공모전 수상작
□통계를잘못이해, 잘못해석및잘못활용된사례
교육수준 낮은 여성 ‘대사증후군’많아…남성은 차이 없어
□상기통계의통계적측면의문제점
1. 표본추출에서의 오류
첫번째 대사증후군에 관한 연구결과를 보면, 확연히 학력에 따라 발병률이 낮아지는
것처럼 보인다. 하지만 이 연구결과는 20 대 이상 여성을 대상으로 했고, 따로 나이에 대한
구간을 나눠 조사하지 않았다. 우리나라의 경우여성의사회진출이 과거보다 늘면서 20
대와 30 대여성들의 학력이 상승했다. 하지만 40,50 대가 넘어가면서부터는 교육수준이
점차 떨어지게 마련이다. ‘고학력자’여서 발병률이 낮은 게 아니라, 나이가 어려서 그런
것일수도 있다. 이에 대한 근거로, 남성에 대한 나이별 발병률 분포도[표 1] 여성[표 2]과
비슷한 것을 알 수 있다. 두 성별 다 50~64 세 때 발병률이 증가하다가 다시 감소한다.
하지만 남성의 경우 40~50 대와 20~30 대의 학력 차이가 얼마 나지 않는다. 따라서
남성의 경우는 고학력자여도 체형 관리를 하지 않아서 발병률이 높다는 것은 옳지 않다.
오히려 중년이 되면서 자연스럽게 생긴 나잇살, 운동의 감소, 남녀 구분없이 사회생활이나
가정생활에서 생기는 스트레스가 대사증후군의 원인으로 더 적절할 것으로 본다.
2. 결론해석에서의 오류
고학력자일수록 뇌종양 진단율이 높다는 결과에서, ‘진단율’과 ‘발병률’의 차이를
혼동하기 쉽다. 비슷한 의미로 쓰이나, ‘진단율’은 병원에서 진단을 받은 사람의 비율이며,
발병률은 단순한 병에 걸린 사람의 비율이다. 따라서 진단을 많이 받는 집단에서 뇌종양
진단율은 다소 오를 수 있다. 이는 ‘검출오류’(detection bias)라고도 부르는데, 건강에
관심이 많고 경제적 여유가 많은 사람이 의사를 자주 찾고 그렇기에 진단율이 오르는 것을
말한다. 위 기사에서도 고학력자와 저학력자 간의 생물적 차이는 없지만, 고학력자는
건강에 대한 관심이 많고 경제적으로 여유로워 의사를 자주 찾는 경향이 있어 ‘검출오류’
의 결과인 것으로 보았다.
□상기통계의바른이해, 바른해석및활용방법
1. 올바른 표본추출
학력에 따른 대사증후군의 올바른 발병률을 알아보고자 할 경우, 학력에 대한 구간만
나눠야 할 뿐 아니라 나이에 대한 구간도 세세하게 나눌 필요가 있다. 다른 변수의
경우에는 학력별로 나눈 구간에서 무작위로 추출하면 대부분 결과에 큰 영향을 미치지
않을 수도 있으나, 나이의 경우에는 학력과 밀접한 관련이 있으므로 주의한다. 예를 들어,
학력만으로 구간을 나누어 표본을 뽑을 경우 고학력자들에는 20~30 대가 두드러지게
많을 수 있다.
두번째 사례의 경우에도, ‘검출오류’의 문제를 의식하고 한 병원에서 진단한 고학력자
1,000 명과 저학력자 1,000 명을 대상으로 비교하는 등의 실험군 통제가 필요하겠다.
2. 올바른 결과해석
논문에서의 결론, ‘경제적 지위가 향상돼야 건강해진다.’는 모순이다. 이 결론이 맞을
경우, 첫 번째 사례와 두 번째 사례가 충돌하게 되는데, 위에서 언급한 여타의 문제로 둘
다 올바른 해석이 아니다. 또한, 첫 번째 사례대로 고학력자가 대사증후군이 발병될
확률이 낮다는 것이 맞는 말이라고 해도, 이것이 바로 경제적 지위가 향상될 경우
건강해질 수 있다는 결론을 끌어내는 것은 아니다. 학력과 대사증후군 사이에는 ‘상관관
계’만 있을 뿐 ‘인과관계’의 여부는 알 수 없다. 인과관계를 조사하기 위해서는
부분상관계수를 구하는 등추가적 연구가 필요하겠다.
□상기통계이외에통계작성과정의문제로인하여초래된점이있다면현황, 문제점,
대안등을자유롭게기재