관리 메뉴

느루독서심리연구센터(010-2788-3025)

[논문을 위한 통계] 통계 공부하자! - 8번으로 끝내는 통계 기초!(1) 본문

논문 잘 쓰는 법/논문을 위한 통계학 강의

[논문을 위한 통계] 통계 공부하자! - 8번으로 끝내는 통계 기초!(1)

느루독서심리연구센터(010-2788-3025) 2018. 1. 19. 09:58
728x90
SMALL

 이 글은 한국상담학신문(265-21-00636)에서 발행하는 글입니다.


Key word: 통계(statistics), 통계 기초, 통계의 함정, 확률과 통계, 상관관계



1. 통계


통계: "집단적 현상이나 수집된 자료의 내용에 관한 수량적인 기술. 사회나 자연 현상을 정리. 분석하는 수단으로 쓰기도 한다."

-출처: 네이버 국어사전 정의((http://krdic.naver.com/detail.nhn?docid=39612600)


통계에 대한 정의같이 딱딱한 이야기는 위에 있는 박스(box) 설명이면 충분하다고 생각합니다^^ 저는 통계를 '어디에 사용하는지, 왜 사용하는지, 어떻게 사용하는지'가 더 필요할 거라 생각하기에~ '통계'라는 단어는 한쪽으로 밀어 놓고 통계를 배우기 위한 도입부로 일상생활에서 접하는 예를 들어 생각해보려고 합니다.


학교 폭력, 납치 등 험악한 사건이 일어나면 대개 가해자들은 다른 사람들과 다를 바 없는 '보통' 사람이라는 뉴스가 종종 보입니다. 그런데 보통 사람은 어떤 사람일까요? 명쾌한 해답이 나오지가 않죠?^^ 




정부와 통계청에서는 국민의 생활과 관련된 각종 평균값들을 발표합니다. 예를 들어서 다음과 같은 자료가 있습니다. 


'대한민국 일반 회사원은 7시간 28분을 자고 난 후 1시간 반이 걸려 출근을 한다. 월 157시간을 일하며, 그 중 야근하는 시간은 9.8시간 정도이다. 하루 중 퇴근 후에는 취미 생활로 1시간을 그 중 집안일을 하는 시간은 30대 남성이 20분, 40대 남성이 15분 정도이다.'


위의 수치는 제가 임의로 대입한 수치입니다!! 오해하지 마세요.^^ 여기서 여러분은 평균값만으로 평균적인 일반 회사원의 모습이 상상되시나요? 또 앞에서 발표한 내용대로 생활하는 회사원이 과연 몇 명이나 될까요? 결론부터 말하자면, 위처럼 단편적인 수치로는 아무런 사실도 확인할 수 없습니다. 


자료의 특징에서 다루겠지만, 대푯값은 평균값 외에도 매우 많고 자료의 종류와 목적에 맞게 사용하지 않으면 터무늬없는 결론이 되어버립니다.


위의 경우에도 '보통 7시간 28분 정도는 잔다.'라는 정보는 알 수 있지만, 자는 시간이 00시부터인지 16시인지는 주어진 정보가 없기 때문에 함부로 '보통 회사원은 00시에 취침해서 7시 28분 정도에 일어나고, 8시 반에 집을 나서서 1시간 반 정도를 출근하는데 써서 10시에는 회사에 도착해!'라고 할 수 없는 것입니다. 


<사진출처: 지식채널e>


2. 통계의 함정


통계는 자료를 어떻게 나타낼 것인가, 외에도 다음과 같은 것을 고려해야 합니다. 


통계청에서 일하시는 통계학자 '알슬신'씨가 어느날 갑자기 다음과 같은 통계자료를 가지고 오며 고속도로는 전쟁보다도 위험하기 때문에 폐쇄해야 한다고 주장합니다. 



(1776년 ~ 1976년) 1,100,000명의 미국인이 전쟁에서 사망하였습니다. 


(1900년 ~ 1976년) 2,200,000명의 미국인이 고속도로에서 사망하였습니다.  



얼핏 보면 200년간 전쟁에서 사망한 사람보다 고작 76년간 고속도로에서 사망한 사람의 수가 2배나 많기 때문에, 고속도로가 전쟁보다 더 위험하다고 생각합니다. 하지만 조금만 생각을 더 해보면 이 결과는 고속도로가 전쟁보다 더 위험하다는 것을 보여주기엔 적합하지 않습니다.


다음과 같은 사실을 고려해서 생각해 봅시다.


-참전한 사람의 수와 고속도로를 이용하는 사람의 수는 다르다.

-해당 년도에서 전쟁은 200년간 지속된 적이 없다.


고속도로는 하루 24시간, 수백~수천만의 자동차가 이동하고 있고, 전쟁은 수천, 수만의 인원이 몇 달에서 몇 년간 제한적으로 지속이 되죠. 많이 위의 통계를 전쟁 중 시간 당 군인의 사망률이나 참가 군인 중 전사자의 비율로 바꾼다면 결과는 확연하게 뒤집힐 것입니다. '알슬신'씨는 상황을 고려하지 않고 자료를 다루어서, 단순한 수치 결과만을 보고 고속도로가 전쟁보다 위험하다는 결론을 내린 것이죠.


즉, 통계에서는 상황적인 요인도 함께 생각하고 자료를 다뤄야지만 위의 '알슬신'씨처럼 통계적 오류를 범하지 않고, 통계의 함정에 빠지지 않는 것입니다.  

 

3. 확률과 통계


여러분에게 "자료를 잘 다루기 위해서 어떤 수확이 필요할까요?" 라고 질문하면, 구체적인 답보다는 학교에서 배웠던 단원명이 먼저 떠오르실 것 같네요. 


'확률과 통계', 이 문단의 제목이기도 한데요. 정확한 답입니다. 통계는 다양한 자료를 가지고 확률적인 계산을 통해 결론을 도출합니다. 


그렇다면, "확률과 통계의 차이는 무엇인가요?"라는 질문에 대한 대답은 하실 수 있으신가요? 뭔가 떠오르시지만 말로 하기엔 어려우시죠? 


간단한 예를 들어 보겠습니다~^^ 확률을 공부하실 때, 가장 많이 보본 예시는 바로! '동전 던지기'니까 이걸로 알아봅시다! 



-확률에서는?

동전을 10번 던졌을 때, 앞면이 6번 나오고 뒷면이 4번 나올 확률은 얼마일까요?


-통계에서는?

동전을 10번 던젔을 때, 앞면이 6번 나오고 뒷면이 4번 나왔습니다. 이 동전은 앞면이 나올 확률과 뒷면이 나올 확률이 같은가요? 



 위 질문에 대한 답은 나중으로 마뤄뤄두고, 본래 질문인 '확률과 통계의 차이'에 대해서 생각해 봅시다!


확률에서 주로 다루는 것은 여러 사건에서 확률을 구체적으로 구하는 것입니다. 반면에 통계에서는 확률적인 분석을 기초로 사건이 생기는 원인을 추측하는 것을 주로 다루죠.


즉, 통계는 확률을 기초로 사건, 현상을 해석하거나 분석하는 것을 목표로 하는 것입니다.




4. 상관관계


경주, 포항 등 요즘 한반도에도 지진이 먼 이야기로는 느껴지지 않죠. 갑자기 지진으로 피해를 받게 되면, 과학기술이 발전한 지금에도 지진을 예측하지 못한다는 사실이 그저 답답하기만 하죠. 가끔 지진을 예측했다고 방송이나 기사에 나오는 것도 정확히 예측한 것인지 못 미더워하며 의구심을 품죠. 만약 지진 발생을 객관적으로 증명할 수 있다면 세계적으로 인정받을 수 있는 일이겠죠.


지진 연구 외에도 사람들은 여러 현상들의 원인을 밝혀내고, 현상을 예측하기 위해 많이 노력하고 있는데요. 예를 들어, 야구와 같은 경우가 있겠네요.



과거: 시속 150km의 속구를 던지는 투수가 있는 팀이 이겼다.


현재: 시속 130km의 볼을 던지는 투수가 상대팀을 계속 이긴다.

 


볼의 속력이 느리면, 취기 쉽습니다. 따라서 '속구를 던지는 투수가 있는 팀이 유리하다.'는 사실과 결과가 다를 때 사람들은 다른 원인을 찾습니다. 실제로 볼의 속력이 느리더라도 타자가 볼을 치지 못한다면, 해설자는 '볼의 컨트롤이 좋네요.', '변화구가 대단합니다!'라는 등의 멘트를 합니다. 


이처럼 사람들은 여러 사건들 사이의 관계를 찾아내 특정 시키고자 하는 일을 예전부터 해 왔습니다. 그러면서 이를 체계적이고, 구체적으로 밝혀내기 위해 수학과 과학도 함께 발전하게 되었습니다. 그 중에서도 통계는 현상을 해석하거나 분석하는 것을 목표로 발전되어 온 것입니다. 필연적으로 현상에서 상관관계를 밝혀내는 일이 필요하게 되었습니다. 


즉, 통계는 상관관계를 밝혀내는 학문입니다. 


5. 일상생활 속 통계


일상샐활에서 통계에 근거한 판단이 얼마나 깊이 스며들어 있는지 알아볼까요?


여러분이 가족을 위해 식사를 준비하면서, 국을 끓이고 있다고 생각해 봅시다. 된장국일 수도 있고, 콩나물국일 수도 있고, 여러분이 좋아하는 국이라고 생각하세요. 어느 정도 끓었다면, 여러분은 이제 간을 보실 텐데요. 간을 맞춘다고 국을 전부 마시는 분은 없겠지요? 골고루 저어서 한 숟가락 맛보도 국의 맛을 판단합니다. 이거이 통계에서 말하는 추정입니다.


다른 예를 볼까요?


이번에는 가계부를 작성하는 경우입니다. 과거에 기록해 놓은 지출을 바탕으로 나중에 지출할 것을 예상해 살림 계획을 세웁니다. '연말이랑 연초, 명절에는 지출이 많으니 미리 저축해야지'라고 사전에 준비를 합니다.


성적이 떨어졌을 때도 머리로는 통계적인 생각을 합니다. '저번 학기 성적 평균이 얼마지?', '이번 성적과 비교하면 어떠지?' 같은 고민을 하고는 어떤 점이 문제였는지를 찾아낼 것입니다.


이런 것처럼 여러분은 이미 일상생활에서 통계의 원리를 활용하고 있습니다. 때문에!! 이제부터 배워나갈 통계를 자신감을 가지고 공부하시길 바랍니다~


-한국상담학신문-

건강한 가족회복을 위해 최선을 다하겠습니다!

제휴 및 강의 문의: loving3025@hanmail.net 


LIST
Comments