확률을 고등학생 때 공부해보기도 했고, 배우는데 크게 무리가 없었지만,
통계학을 공부해보면서 공리와 정의의 중요성을 느꼈다.
그래서 이번 기회에 제대로 정리하고 시작해보려고 한다.
확률은 과정(Procedure)과 관측(observation)으로 이루어진 반복가능한 확률실험(Experiment)에 기반을 둔다.
여기서 관측된 것을 결과(Outcome)이라 하며, 결과의 집합을 사건(Event)이라고 한다.
과정, 관측, 확률실험, 결과, 사건의 정의가 애매하고 와닿지 않는다.
최종적으로 이 단어들을 예시를 통해 이해하는 것을 목표로 확률의 근본이 어떤 녀석인지 알아보자.
집합론을 확률에 적용하기
상호배타적 (Mutually Exclusive)
전체집합 S에 A_i 라는 집합들이 있을 때, 이것들이 위의 조건을 만족하면 상호배타적이라 한다.
A와 B가 있다고 했을때 이런 그림이다.
전체 망라적 (Collectively Exhaustive)
각 집합들을 모두 합쳤을 때, 전제집합이 될 때, 이 집합들을 전체 망라적이라 한다.
여기서 위의 모든 집합을 합집합 한다는 의미를 번거롭게 썼으므로 저런의미의 표현을 다음과 같이 바꿔서 사용하겠다.
분할 (Partition)
상호배타적이며, 동시에 전체 망라적인 집합은 중요한 의미를 갖기 때문에 따로 정의를 해두도록 하자.
용어 정리하기
확률 실험 (Experiment)
실험이라는 단어를 보면 실험실같은 공간이 떠올라서, 이게 무슨 용어인지 직관적으로 오지 않을 수 있다.
여기서의 의미는 내가 보고 싶은 대상에 대해 반복적으로 일어나는 현상 을 의미한다.
즉, 내가 관심이 있는 것을 정하면, 그것이 확률 실험이다.
예를 들어, 동전 던지기에서, 앞면이 나올까 그렇지 않을까에 관심이 있다하면,
이것이 확률 실험이다.
이 확률 실험은 상식적으로 생각해도 같은 행위에 대해 다른 생각이 들 수 있다.
예를 들어, 동전 던지기라는 같은 과정 을 보더라도,
어떤 사람은 몇번만에 앞면이 나올까? 에 관심을 둘 수도 있고,
어떤 사람은 10번 던졌을 때 앞면이 몇번 나올까? 에 관심을 둘 수도 있다.
즉, 어떤 관측 을 하느냐는 사람마다 다를 수 있다.
결국 확률 실험이라는 녀석은 과정과 관측의 단계로 구성되어 있다.
모델 (Model)
실제 확률 실험은 너무 복잡하다.
즉, 동전을 던진다고 했을 때, 우리가 이 확률이 1/2라고 생각하는 것은
사실 머릿속으로 이 동전이 던져질 때의 가장 지배적으로 영향을 미치는 것이 동전의 모양에 있다고
직관적으로 생각했기 때문일 가능성이 가장 높다.
하지만 실제 동전던지기가 아닌 더 복잡한 현상에 대한 확률을 고려할 때,
이 자체는 완전 랜덤의 영역일지 모른다.
따라서 우리는 내가 관심있는 확률실험에 대한 모델 을 가지고 분석하게 된다.
예를 들어, 버스장류장에서 버스를 기다리는 시간에 영향을 주는 요소들을 고려해 보면,
- 시간대
- 지나가는 차들의 속도
- 버스정류장 주변의 도로공사 현황
등을 고려할 수 있다.
다른 요소들이 어마어마하게 많지만, 우리는 이것들을 모두 고려할 수 없기 때문에
중요한 부분만을 부각시킨 확률모델이 필요하다.
따라서 지금부터 쓰는 용어중 확률 실험은, 이 모델로 매핑된 녀석을 의미하도록 하겠다.
결과 (Outcome)
확률 실험의 결과 란 그 확률 실험의 모든 가능한 관측을 의미한다.
표본 공간 (Sample space)
확률실험의 표본 공간이란 그 확률실험의 모든 가능한 결과 (outcome) 들의 집합을 의미한다.
이 때, 그 결과들은 가장 작은 단위의 알갱이로 세분되고 (finest-grain)
상호 배타적이며 (mutally exclusive), 전체 망라적 (collectively exhaustive) 이어야 한다.
-
finest-grain
모든 결과는 개별적으로 구분 가능해야 한다.
-
Mutally Exclusive
두 개 이상의 결과가 동시에 발생할 수 없다.
-
Collectively Exhaustive
확률 실험의 가능한 모든 결과는 표본 공간에 속해야 한다.
사건 (Event)
사건 은 확률 실험의 결과들의 집합이다.
즉, 내가 궁금한 실험에 대해 모든 가능한 결과들을 나열했을 때, (표본 공간)
그 중에서도 특정한 상황이 궁금할 때, (사건)
사건이 발생했다고 한다.
Summary
Set Theory | Probability |
---|---|
부분집합 | 사건 |
전체집합 | 표본공간 |
원소 | 결과 |