본문 바로가기

Memo

통계 자료를 볼 때 주의할 점

대학에서 사회학을 공부한 사람들은 사회 통계학과 사회조사방법론이라는 걸 배운다. 두 가지 모두 미국 사회학파의 영향을 받은 것으로써 사회 현상을 분석하기 위한 근거 자료로 통계 데이터를 추출하는 방법을 배우게 된다. 이 과정을 거치며 통계적 자료라는 것이 얼마나 왜곡될 수 있는 가를 뼈 저리게 배운다, 물론 그렇지 않은 사람도 있지만. 통계 자료를 볼 때 주의해야 할 많은 요건이 있다. 이 요건에 관심을 갖지 않으면 늘 통계 자료의 왜곡에 휘둘리게 된다.

그 중 하나는 통계 자료의 모 집단과 표본 집단의 수를 확인하는 것이다. 사회조사를 할 때 가장 중요한 것 중의 하나가 이것이다. 조사를 잘 하는 것과 조사 결과를 분석하는 것도 중요하지만 모 집단과 표본 집단을 제대로 설정하지 못한 경우 아무런 의미가 없는 결과를 도출하게 된다. 마치 '우리 동네 사람들을 대상으로 조사하니 통일을 원치 않는 비율이 80%였다'라고 말하는 것과 같다.

실제로 한국인에 대한 표본 추출을 통해 조사한 결과도 이와 같을 수 있다. 왜냐면 모든 통계는 일반을 반영하기 때문이다. 그 반대인 일반도 통계를 반영한다. 이런 경우 '틀린 말은 아니지만 통계적 가치는 없다'고 표현하는 게 옳다. 유사한 사례는 오늘 보도자료로 배포한 모 온라인 리쿠르팅 업체의 대학생 구직 관련 글이다. 일부를 옮겨 온다.

취업포털 커리어(www.career.co.kr, 대표 김기태)가 서울지역 대학교 취업협의회에 소속된 23개 대학의 취업보도실장 및 담당자들을 대상으로 설문조사를 실시해 11일 발표한 바에 따르면, 현재 취업지도를 진행함에 있어 가장 큰 애로사항(복수응답)을 묻는 의견에 56.5%가 ''기업과 학생의 눈높이 차이 극복''이라고 응답했다.

("취업 지도, ''눈높이 맞추기'' 어려워", 2006-07-11, 세계일보)

위 자료는 매우 좁은 영역에서 통계적 가치를 가질 뿐이다. 즉, 서울지역 대학교 중 23개 대학의 일부 업무 담당자의 의견을 반영한 조사일 뿐이다. 그러나 제목은 마치 한국 대학생의 취업 실태를 조사한 듯 뽑아 놓고 있다. 부제목에서 '서울 지역 대학 담당자 조사'라고 붙여 두긴 했지만 기껏 23개 대학의 담당자를 대상으로 조사하여 몇 %라고 표현하는 기사 내용을 보면 진실성에 의심이 된다.

물론 이 기사는 나름의 의미가 있다. 앞서 이야기했듯 어떤 일반도 통계를 반영하기 때문이다. 실제 전수 조사(모 집단 전체 조사)를 해도 위와 비슷한 결과가 나올 수 있다. 그러나 23개 대학의 추출 이유도 나와 있지 않고 표본으로써 가치도 언급하지 않고 있기 때문에 '예측'할 수 없다. 결국 통계적으로는 아무런 의미가 없는 조사라고 말할 수 있다.

통계의 시대에 살고 있는 사람들이 보다 현명하게 통계 자료를 받아 들이려면 작은 노력이 필요하다. 그 중 하나는 어떤 통계 자료의 '모집단, 표본 집단, 추출 근거'를 표기하고 있는 지 확인하는 것이다. 이것이 명확히 표기되지 않은 통계 관련 자료라면 일단 무시해도 관계없다.

'Memo' 카테고리의 다른 글

블로그와 리크루팅  (0) 2006.07.11
Policy of human reputation  (1) 2006.07.11
쓸데없는 관심  (0) 2006.07.11
선생님과의 대화  (0) 2006.07.10
Ajax instant suggest function  (2) 2006.07.10