관리 메뉴

느루독서심리연구센터(010-2788-3025)

통계 공부하자! - 8번으로 끝내는 통계 기초! (3) 본문

논문 잘 쓰는 법/논문을 위한 통계학 강의

통계 공부하자! - 8번으로 끝내는 통계 기초! (3)

느루독서심리연구센터(010-2788-3025) 2018. 1. 23. 00:01
728x90
SMALL

 이 글은 한국상담학신문(26221-00646)에서 발행하는 글이니다.


Key word: 통계(statistics), 통계 기초, 확률, 표본, 사건, 배반사건, 덧셈정리, 여사건, 조건부 확률, 곱셈정리, 독립사건


1. 사건(event): 사전적 의미)


국어사전에서는 '특정 시간에 어떤 일이 일어난 것'을 뜻합니다. 우리가 공부해나갈 수학, 특히나 확률에서는 '실험에서 발생할 수 있는 결과들'을 기본 사건(elementary event), 또는 사건이라고 부릅니다. 


예를 들어서 여러분이 "아침 11시에 '심리학 그리고 생각' 밴드를 보았다."라고 하는 것은 국어사전에서 말하는 사건이라 할 수 있을 것이고, "주사위에서 어떤 수가 잘 나오는지 알아 보기 위해 주사위를 10번 던져보았고, 6이 4번, 3이 2번, 1, 2, 4, 5가 각각 1번씩 나왔다."라는 상황에서 '6이 4번 나왔다'와 같은 것이 수학에서 말하는 사건이라 할 수 있는 것입니다. 


2. 사건


그렇다면 사건에 대해 좀 더 자세히 알아가 보기 위해서 동전 하나를 던져봅시다. 결과는 앞면 또는  또는 뒷면밖에 없습니다. 옆면으로는 동전이 서지 않으니까요. 


즉, 일어날 수 있는 사건은 '앞면이 나온다.', '뒷면이 나온다.' 2개가 있는 것이죠. 


그런데 여러분은 실험이나 조사를 할 때 1번만으로, 1명에게 묻는 것만으로 조사를 끝내나요? 

아니죠! 적어도 3번, 10명이라고 말하시면서 여러 번 실험하고, 여러 사람에게 설문을 하시겠죠. 수학에서도 마찬가지랍니다. 

알고 싶어 하는 현상에서 사건을 단 한 번만 관찰하지 않는다는 말입니다. 


예시로 다시 한 번 동전을 한번 던져봅시다!

어떤 면이 나왔나요? 저는 그림이 있는 면이 나왔는데요. 지금 동전을 던져보는 실험을 한 번 했고, 결과는 그림면이 나왔으니까.


"다음에 동전을 던졌을 때는 무조건 그림이 나온다." 처럼 말 할 수 있나요? 당연히 말도 안 되는 소리겠죠. 여러분은 여러 번의 실험을 하게 될 것이고, 각각의 사건을 관리해야 됩니다. 그래서 다음과 같은 용어가 필요하게 되는데요. 바로 '표본점', '표본공간'이라는 용어입니다. 다시 동전을 던져봅시다. 이때 적어도 3번 이상 던져보시고 결과를 표나 그림으로 정리해보세요. 


저는 위 그림처럼 정리를 했습니다. 자주색의 점들은 각각의 결과로 앞 또는 뒤의 값을 가집니다. 즉 점 하나하나가 사건이라고 볼 수 있는 것이죠. 


이런 것처럼 일어날 수 있는 각각의 결과, 사건을 표본점이라고 합니다. 모든 표본점을 통틀어서, 포함하는 전체(집합)을 표본 공간이라고 합니다. 이 단어들이 입에 붙지 않으면 소리내서 '표본점!, 표본 공간!'이라고 여러번 소리내서 말해봐야 합니다! 그래야 익숙해 집니다. 


표본공간은 보통 S로 나타내는데요. 위의 경우에는 표본공간, S = {앞면, 뒷면}이고, 표본점은 '앞면' 또는 '뒷면'이겠죠. 


다음은 1~15가 적힌 카드 중 한 장을 뽑을 때를 나타낸 것입니다.  


일어날 수 있는 각각의 결과, 사건을 표본점이라 한다고 했는데요. 위 그림은 왜 여러 점을 함께 묶고 사건이라고 부르는 것일까요? 


사건은 표본공간에 포함되는 집합, 부분집합이라고도 할 수 있습니다. 어떤 사건인지에 따라 하나의 표본점을 가리킬 수도, 또는 여러 개의 표본점을 가리킬 수도 있기 때문입니다. 


예를 들어 다음과 같은 것입니다.  


 


사건 A : '3의 배수를 뽑았을 때'

사건 B : '2의 배수를 뽑았을 때'

사건 C : '1을 뽑았을 때'

 


A는 3, 6, 9, 12, 15의 결과가 나오는 표본점을 포함해야 되고, B는 2, 4, 6, 8, 12의 결과가 나오는 표본점을 포함해야 된다는 것이 금방 이해되시겠죠? 


그렇다면 다시 동전던지기로 돌아가서 그 때 나올 수 있는 사건들에 대해 생각해 볼까요. 


'사건은 표본공간의 포함되는 집합, 부분집합이다.'라고 했지만 쉽게 이야기하면 사건은 '일어날 수 있는 결과'를 말하는 것입니다. 


동전 던지기에서 나올 수 있는 결과는 앞면, 뒷면 밖에 없었죠. 

그렇다면 여러분이 예상할 수 있는것은 다음과 같을 것입니다. 


1) 앞면이 나올거야. 

2) 뒷면이 나올거야.

3) 앞면 또는 뒷면이 나올거야

4) 앞면과 뒷면이 동시에 나올거야.



3번은 무책임한 것 같고, 4번은 말도 안 되는 이야기 아닌가라고 하시면 할 말은 없지만, 저것도 말할 수 있는 예장 중 하나입니다. 이것을 집합으로 바꿔보자면 다음 그림과 같습니다. 

처음에 나오는 기호(동그라미에 선이 들어간 그림)는 공집합을 나타내는 기호입니다. 표본점을 아무것도 포함하지 않는다는 것인데요. 4)번처럼 절대 일어나지 않는 경우에는 어떤 표본점도 포함할 수 없겠죠. 즉 절대 일어나지 않는 사건을 말합니다. 이러한 사건은 '공사건'이라고 합니다. 


그리고 마지막에 나온 {앞면, 뒷면}과 같은 경우, 3)번처럼 모든 결과를 포함하는 사건은 표본 공간 전체를 나타내는 것과 동일하기 때문에 '전사건'이라고 합니다.


이번에는 공사건과 전사건 이외의 사건의 종류를 알아봅시다!


합사건, 곱사건, 여사건에 대해 알아볼 것입니다. 주사위를 한 번 던지는 것을 예시로 알아봅시다!


우선 주사위 던지기에서 표본공간은 다음과 같습니다. 



사건 A와 사건 B 중에서 적어도 1개가 일어나는 사건을 사건 A와 사건 B의 '합사건'이라고 합니다. A U B로 표시하고 A 합집합 B로 읽습니다. 


A = 홀수의 눈이 나올 사건 = {1, 3, 5}

B = 3이하의 눈이 나올 사건 = {1, 2, 3}


A U B = {1, 2, 3, 5}


다음으로 사건 A와 사건 B가 동시에 일어나는 사건을 사건 A와 사건 B의 '곱사건'이라고 합니다. 

 B 로 표시하고 A 교집합 B로 읽습니다.


위의 경우, A B는 다음과 같습니다. 


또한 '사건 A가 일어나지 않는 사건'을 A의 '여사건'이라고 하며 로 나타냅니다. 


A여사건 = {2, 3, 6}


3. 확률을 한 마디로 하면? 



확률

"일정한 조건 아래에서 어떤 사건이나 사상이 일어날 가능성의 정도, 또는 그런 수치. 수학적으로는 1을 넘을 수 없고 음이 될 수도 없다. 확률 1은 항상 일어남을 의미하고, 활률 0은 절대로 일어나지 않음을 의미한다."

-네이버 국어사전(http://krdic.naver.com/detail.nhn?docid=43120100)




 사건적인 정의는 이런데 여러분은 '확률이 뭐죠?'라고 묻는다면 어떻게 대답하실지가 궁금합니다. 이번 문단에서 확률에 대해 배우고 여러분만의 정의를 만드셨으면 합니다. 


위의 정의처럼 확률은 사건이 일어날 확실성의 정도, 비율을 말합니다. 확률은 항상 0부터 1사이의 값을 가지는데요. 주사위 던지기를 예로 들어 설명하겠습니다. 


우선, 한 가지 표시방법에 대해 아셔야 합니다. 

사건 A가 일어날 확률은 P(A)라고 쓰고 [피 에이]라고 읽습니다. P는 영어 Probability의 머리글자입니다. 



주사위가 변형되지 않았고, 어느 쪽으로 치우치지 않은 공정한 주사위의 경우, 표본공간, 전사건 S는 S={1, 2, 3, 4, 5, 6}이죠. 표본점의 개수는 보시는 것처럼 6개이며 n(S)로 나타냅니다. 


S = {1, 2, 3, 4, 5, 6}

n(S) = 6


A = {1, 3, 5}

n(A) = 3 


한편 홀수 눈이 나오는 경우를 사건 A라고 한다면, A={1, 3, 5}이고 표본점의 개수는 3개가 됩니다. 


따라서 주사위를 던질 때, 사건 A가 일어날 확률, 홀수가 나올 확률은 다음과 같이 정의할 수 있습니다. 



이 내용을 조금 더 일반화 해볼까요. 

주사위 던지기, 동전 던지기처럼 몇 번이라도 반복할 수 있고, 결과가 우연에 좌우되는 시행(실험이나 관찰을 수학에서 이르는 말입니다.)에서 일어날 수 있는 전사건 S의 경우의 수를 N이라고 하겠습니다. 


N=n(S)


위의 주사위 던지기와 같은 경우 'N = n(S) = 6'이죠. 

이 때 사건 A의 표본점 개수가 a개, 'n(A) = a'라고 한다면 사건 A가 일어날 확률은 다음과 같습니다. 


n(A) = a



이를 응용해서 주사위를 던져 짝수가 나올 확률을 구해보면 다음과 같습니다. 

우선 짝수가 나오는 경우를 사건 B라고 한다면, 



S = {1, 2, 3, 4, 5, 6}

n(S) = 6


B = {2, 4, 6}

n(B) = 3 




위와 같이 정리가 되겠죠? 


그렇다면 공사건과 전사건의 활률에 대해 알아봅시다. 

먼저 공사건은 어떠한 표본점도 가지지 않는 사건이었죠. 즉 Φ = { }’이고, ‘n(Φ) = 0’ 이니다.


 


예를 들어서 일반적인 주사위를 던져서 7이 나오는 사건의 경우 공사건이 되겠죠. 

확률을 한 번 구해봅시다. 




확실히 일반 주사위를 던져서 7이 나오는 경우는 불가능하죠. 

즉 사건의 확률이 0이라는 것은 그 사건이 절대 일어나지 않는다는 것입니다. 


다음은 전사건입니다. 표본공간을 모두 포함하는 사건으로 기억하시죠? 따라서 '전사건 = 표본공간 = S'이고, 'n(전사건) = n(표본공간) = n(S)'이죠. 


예를 들어, 주사위를 던져서 6 이하의 수가 나오는 사건의 경우는 전사건이 되겠죠. 

확률을 구해보겠습니다!

 

즉 확률이 1인 경우 어떤 경우에도 사건이 일어난다는 것을 의미합니다. 



4. 배반시건의 확률


사건의 종류에 대해서 배웠다고 생각했는데 새로운 사건이 등장했네요.

이름 때문에 착각하셨을 수도 있지만, 여러분은 최소한의 사건의 종류에 대해서는 다 배웠습니다. 앞으로 등장할 '~~사건'은 사건 A와 사건 B의 관계에 대한 것이라고 보시면 좋을 것 같습니다. 


그렇다면 먼저 배반사건에 대해 다뤄보겠습니다. 

'동시에 일어나지 않는 사건'이라고 생각하시면 됩니다. 

이는 사건 A와 사건 B의 공통부분이 없을 때, 즉 AB = Φ 인 경우에는 한 쪽 사건이 일어 나면 다른 쪽 사건은 절대 일어나지 않는 A와 B를 부르는 말입니다.


예를 들어 다음과 같은 경우를 생각해 봅시다. 

사건 A를 홀수 눈이 나오는 경우, 사건 B를 짝수 눈이 나오는 경우라고 해봅시다. 

일반적인 주사위를 던지는 경우 짝수 눈이 나온다면 홀수 눈은 절대 나올 수 없습니다. 즉 사건 A와 B는 동시에 일어나지 않습니다. 다음과 같이 수식으로 보면 두 사건의 교집합이 공집합, 즉 공사건으로 조건인 AB = Φ 가 성립하는 것을 볼 수 있습니다.  


A = {1, 3, 5}

B = {2, 4, 6}


 B = {  }  = Φ


따라서 사건 A와 B는 배반사건이라 할 수 있습니다. 


두 사건이 배반사건이라면 확률은 어떤 영향을 받을까요? 

이에 대한 예시로 조커를 뺀 52(13*4)장의 플레일 카드를 생각해봅시다!


사건 A를 스페이드 카드, 사건 B를 하트 카드라고 합시다. 따라서 'P(A) = P(B) = 이 되죠.


생각해보면 'P(AUB_ = '이니다. 

따라서 다음과 같은 수식어 성립이 성립한다는 것을 알 수 있습니다.  


일반적으로 사건 A와 사건 B가 배반사건이라면 다음과 같은 공식이 성립됩니다.


P(AUB) = P(A)+P(B)

이를 '덧셈정리'라고 합니다. 

이는 사건 A와 사건 B가 배반사건일 때, A의 표본점 개수와 B의 표본점 개수를 더한 값이 A와 B의 합사건의 표본점 개수와 같기 때문입니다. 즉 다음의 식이 성립한다는 것을 알 수 있습니다. 


n(AUB)=n(A)+n(B)


따라서 양 변을 전사건의 표본점 개수 n(S)로 나누어도 등식이 성립하기 때문에 다음의 식이 함께 성립하고 덧셈정리가 유도되는 것을 알 수 있습니다. 


그런데 배반사건에 대해 공부하시면서 여사건이 떠오르시진 않나요?

'사건 A가 일어나지 않는 사건'을 A의 여사건이라고 할 만큼 A와 A의 여사건은 당연히 배반 사건이겠죠? 


예를 들어 주사위를 던져 올수인 사건을 A라고 하면, A의 여사건은 짝수일 사건이기에 둘은 배반사건이라는 것을 금방 아실 수 있을 것입니다. 


그렇다면 여사건에 위의 배반사건의 확률에서 배운 내용을 적용시켜 봅시다.  


주사위를 던져서 홀수가 나올 사건을 사건 A라고 합시다. 그렇다면 는짝수가 나올 사건이겠죠.


이 상황에서 일 것입니다. 


그럼 위의 덧셈정리를 이용해 볼까요. 

어떤 사건 A라 하더라도 위의 수식은 성립합니다. 여사건의 정의부터 '사건 A가 일어나지 않는 사건'으로 사건 A와 여사건이 배반사건임을 말했기 때문입니다.


또한 여기서 사건 A와 여사건의 합사건은 전사건이 됨을 알 수 있습니다. 

따라서 다음 두 식을 알 수 있습니다.  



5. 조건부 확률


만약 야구를 좋아하신다면, 지금 배울 '조건부 활률'이라는 용어를 모르더라도 누구보다도 이 용어의 개념에 대해 잘 알고계실 것이라고 생각합니다. 


'두산의 승률은 5할인데 홈구장에서는 승률이 7할로 성적이 좋아'

'김재혁 선수는 좌투수에 약한데, 우투수는 4할에 가까울 만큼 강해.'


위의 두 문장처럼 '홈구장', '우투수'와 같은 조건에 따라 확률이 변하는 것을 조건부 확률이라고 하는 것입니다. 


주사위 던지기를 예로 들어 한 번 살펴봅시다. 

 

A = 1이 나오는 사건 = {11]

B = 홀수가 나오는 사건 = {1, 3, 5} 


여기에 '홀수가 나왔을 때, 이 중 1이 나올 확률은?'이 바로 조건부 확률에 대해 생각하는 것입니다. '홀수가 나오는 경우'라는 조건이 붙었기 때문입니다. 


홀수는 1, 3, 5로 3개의 수가 있습니다. 이 중 1을 나오는 경우는 단 한 개죠. 따라서 구하는 확률은 3개 중 1개를 선택하기 때문에 1/3(3분의 1)이라 할 수 있습니다. 

이처럼 사건 B가 일어났을 때, 사건 A가 일어날 확률을 조건부 확률이라 하고 기호로는 다음과 같이 표시합니다. 



그렇다면 조건부 확률은 어떻게 구해야 할까요? 

일반적으로는 다음과 같은 식으로 구할 수가 있습니다. 



앞의 예를 살펴보면 '이기 때문에 값이 1/3(3분의 1)로 길게 나오는 것을 알 수 있습니다. 


위의 식은 유용하게 쓸 수 있는 식입니다만 사건의 개수를 모르면 사용할 수가 없습니다. 때문에 일상생활을 확률과 통계로 옮기는 경우, 사용하지 못하는 경우가 많습니다. 따라서 이를 다음과 같이 변형해서 사용합니다. 



이것을 '조건부 확률의 정의'라고 합니다. 또한 이를 한 번 더 변형시켜 다음과 같은 식으로 사용하기도 합니다.  



이러한 공식들을 '곱셈정리'라고 합니다. 


그럼 앞서 나온 문제를 곱셈정리를 응용해서 풀어봅시다. 



A = 1이 나오는 사건 = {11]


B = 홀수가 나오는 사건 = {1, 3, 5}


P(AlB) = ? 



입니다. 한편 'P(B) = 1/2(2분의 1)입니다. 


따라서 곱셈정리를 응용하면 다음과 같이 답을 구할 수가 있습니다. 



6. 독립사건


가끔 주변을 둘러보면 환경에 상관없이 꾸준한 사람들이 있습니다. 학교에서든지, 집에서든지, 수업 중, 여행 중 영향을 받지 않는 사람이 있죠. 


독립사건은 이런 사람들처럼 조건에 영향을 받지 않는 것을 말합니다. 

'조건'이라고 하니 갓 배운 조건부 확률이 떠오르시죠? 

독립사건을 정의하는 식은 다음과 같습니다. 


조건으로 작용하는 사건 B에 관계없이 사건 A가 일어날 확률이 동일하죠. 이와 같을 때, 사건 A와 B는 독립 또는 독립사건이라고 말합니다. 


그렇다면 독립사건에서 곱셈정리는 어떻게 될까요? 

위 식에서 (P(AlB)가 P(A)로 바뀔 수 있으니 다음과 같은 식이 될 것입니다. 



익숙해지기 위한 연습문제로 다음을 한 번 풀어봅시다. 



김재혁 씨의 구단이 100번 경기한 결과 60승 40패를 했습니다. 이 중 홈구장에서는 30번의 경기를 치렀고, 18승 12패로 승률이 0.6입니다. 이 때 사건 A와 사건 B를 다음과 같다 할 때, '홈구장에서 한 경기 중 이긴 경기', 즉 AB의 확률을 구하세요.   


A = 이긴 경기


B = 홈구장에서 한 경기



우선 사건들의 확률을 모두 구해봅시다. 

이를 독립사건의 정의식에 대입하면 


위와 같이 성립한다는 것을 알 수 있고, A와 B는 독립한다는 것을 알 수 있습니다. 

따라서 홈구장에서 경기를 치르더라도 승패에는 영향을 주지 않는다는 결론도 내일 수가 있습니다. 

#논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, #논문통계, 논문통계, #논문통계, #SPSS통계, #SPSS통계, #SPSS 통계, #SPSS 통계, #SPSS 통계, #SPSS통계, #SPSS통계, #SPSS통계, #SPSS통계, #SPSS통계, #SPSS통계, #SPSS통계

-한국상담학신문-

건강한 가족회복을 위해 최선을 다하겠습니다!

제휴 및 강의 문의: loving3025@hanmail.net


LIST
Comments