본문 바로가기
사는 이야기/생각상자

잘못된 통계자료도 때로는 도움이 된다

by 알 수 없는 사용자 2006. 11. 30.
 '정보사회의 통계활용' 레포트를 방금 끝냈다. 하고 나니 두세 시간이면 끝날 걸 가지고 2주동안 왜 그리
질질 끌어왔는지 내가 황당할 정도. 정말로 눈코뜰새 없이 바쁘긴 하지만, 역시 그보다는 마음의 여유가
없는 탓이겠지. 레포트는 잘못된 통계분석 자료 4개 이상 찾아서 수업시간에 배운 통계적 지식을 활용하여
오류를 지적하는 것으로, 예시로 준 자료들은 GDP변화추이와 같은 공식 자료에는 달러 환율변화를 고려해
야 하는 것이나, 산술평균 대신 기하평균을 사용해야 한다는 점을 찾아내는, 비교적 생각을 많이 해야하는
과제였다.

 하지만 수업 끝나고 출근해서 하루종일 일 처리를 문서작업을 하다보니 어느덧 12시. 그제서야 꾸역꾸역
레포트를 쓰기 시작한 나에게 그런 고도의 사고과정이 가능할 리 없다. 구글신과 네이버를 사용해 무단
펌질하는 나 자신을 반영하는 건지..이런 것만 걸린다.






2. 이 통계자료는 흥미 위주의 자료들이 그렇듯이 서울지역 대학생이라는 모집단에 비해 턱없이

   적은 표본만을 가지고 데이터를 추출하면서도, 표본 추출방법에 대한 논의가 전혀 없다는 점에서

  신뢰성이 극히 낮다고 할 수 있다. 그러나 그보다 더 큰 오류는 척도에 있다. 제시된 4점 척도에서

  얻고자 하는 데이터는 다음과 같다.

 

1.       둘 다 많다.

2.       여학생이 남학생보다 많다.

3.       남학생이 여학생보다 많다.

4.       둘 다 적다.  

 

 그런데 제시된 자료를 살펴보면 2번 항목이 크게 왜곡되어 있는 것을 알 수 있다. 얻고자 하는 데이터

3번과 대치되는 항목일 뿐인데 여학생들에게 반감을 사는 질문 때문에 2번 항목의 응답 비율은 극히

적다. 애초에 분류 기준이 잘못되어 있는데 결과만 보면 마치 여학생들은 된장녀가 실제로 존재하지

않는다고 방어하는 것처럼 보인다.


 통계적 지식이고 나발이고 필요없는 자료. 저 그림 하나면 됐지 쓸데없는 설문조사는 왜 하는건지.. '된장녀를

만들려고 작정을 했다' 라는 한마디를 이렇게 길게 늘어놓을 수 있는 나에게 놀라고 있다. 역시 좃선일보...하면

서 다른 걸 찾는데. 이번엔 더 대단한 것이 걸렸다. 위의 것은 애교에 불과하다.

http://news.empas.com/show.tsp/20061009n00880/


4. 기사의 제목만 봐도 통계자료 해석의 왜곡이 보이지만, 논리적으로 짚어 보자. 우선 표본 추출과정

에서 심각한 왜곡이 발생되었다. 전교조 교사의 비율과 서울대 입학생 수의 관계를 조사하려면 정확한

변인 통제까지는 아니더라도, 전교조 교사의 비율의 높고 낮음이 서울대 입학생의 수를 좌우하는 가장

큰 변인이 되어야 한다. 실제로 전교조 교사의 비율만으로 볼 때는 강남교육청과 남부교육청이 최소/

대값이지만 전교조 교사 비율보다는 지역 자체의 특성이 훨씬 큰 영향을 미친다는 것을 상식으로도 알

수 있다.

 

 .........아예 할 말이 없는 자료에 또 이만큼을 휘갈겨놓은 나에게 다시금 놀람과 동시에, '이딴 거 가지

고 제 때울거면 진작좀 할걸' 하는 진정한 지적 후회가 밀려온다. 황당함이 정도를 초월하니 오히려 교훈

이 됐다.








 

'사는 이야기 > 생각상자' 카테고리의 다른 글

감정 정리  (0) 2007.01.30
나는 오타쿠인가 아닌가?  (0) 2006.12.05
소리  (0) 2006.10.06
고2와 대3  (0) 2006.09.14
나도 이제 된장남  (0) 2006.08.18