목록통계 (6)
완숙의 블로그
유도된 랜덤변수 랜덤 변수 X를 송수신한 데이터의 메가바이트 단위의 양이라고 하자. 그리고 Y를 해당 월의 요금이라고 하자. 그렇다면 Y와 X는 어떠한 함수로서 표현이 가능할 것이다. 이 때 Y를 유도된 랜덤변수 라고 한다. 유도된 랜덤변수의 PMF 자 여기서 X는 이산 랜덤변수이기 때문에, 랜덤 변수 X 는 PMF를 갖는다. 이 정보를 가지고 우리는 을 구할 수 있다. 그런데 우리는 Y의 값에 따른 확률, 즉 Y의 PMF를 구해야 한다. Y와 X간의 관계가 정의되어 있고, X도 이산 랜덤변수이므로, Y역시 이산랜덤변수이다. 따라서 랜덤 변수 Y도 PMF를 가지게 된다. 그런데 여기서 X의 값에 따라 Y의 값이 결정되는데, 이해를 돕기 위해 예를 들어보자. 이런 관계를 갖고 있다고 할 때, $X=2, X..
Cumulative Distribution Function, CDF 이산 랜덤변수인 경우에는 x 이하 모든 변수의 값을 더한다. 연속 랜덤변수인 경우에는 -무한대로 부터 해당 랜덤변수값까지의 적분값이다. 특정한 범위에 속할 확률 Mean 평균은 확률실험의 관찰 값들의 집합을 대변하는 수이다. 기댓값은 확률 실험의 확률 모델을 나타내는 수이다. 평균과 기댓값을 우리는 같은 단어로 지금까지는 생각해 왔을지 모른다. 하지만 이것은 약간의 다른점이 존재하는데, 평균 값은 실제 실험이 진행된 결과 집합에 대해 이를 대변하는 수이고, 기댓값 은 내가 만든 확률 모델의 집합을 대변하는 수이다. 기댓값의 계산 Sample space 의 원소에 속하는 각각의 x에 대해 그 해당 확률을 곱하고 모두 더한 것. 이 식은, ..
Bernoulii Random Variables 두 개의 가능한 결과만을 갖는 부분확률 실험을 베르누이 시행이라 한다. Geometric Random Variables 두 개의 결과 중 어떤 한 특정 결과를 최초로 관찰할 때 까지의 베르누이 시행 횟수를 기하랜덤변수라 한다. p는 마지막에 결과가 출력되는 확률! Binomial Random Variables n번 시행중 x 번이 나오는 횟수를 X라 하면, X는 이항 랜덤 변수이다. Pascal Random Variables 특정 시행 횟수를 만족할 때까지의 확률을 계산한 PMF 가 있다면 이는 파스칼 랜덤 변수이다. 식을 잠깐 뜯어보면, x번째에서 k번 성공할 확률은, x-1번째까지의 경우에서 k-1 번째까지 성공할 경우를 모두 구하고 마지막에 x번째에서..
확률 모델에서는 개개의 사건에 0과 1 사이의 실수를 부여하고 이를 그 사건의 확률이라 한다. 상호배타적인 사건들의 합집합의 확률은 그 합집합을 구성하는 개개의 사건의 확률의 합이 된다. 저번까지 확률과 집합론은 연결한 결과는 다음과 같다. Set TheoryProbability 부분집합사건전체집합표본공간원소결과 그렇다면 전체집합 S 에서, 각각의 부분집합인 사건에 대해 확률을 부가하는 일이 남아있다. Axioms of Probability 확률 P[.] 란 표본공간에서 정의되는 사건에 다음을 만족하는 실수를 부여하는 함수 이다. 공리1 : 임의의 사건 A에 대해서 P[A] >= 0 이다. 공리2 : P[S] = 1 공리3 : 상호배타적인 사건 A1, A2 ... 에 대해 이 공리 3개로 부터 모든 정의..
확률을 고등학생 때 공부해보기도 했고, 배우는데 크게 무리가 없었지만, 통계학을 공부해보면서 공리와 정의의 중요성을 느꼈다. 그래서 이번 기회에 제대로 정리하고 시작해보려고 한다. 확률은 과정(Procedure)과 관측(observation)으로 이루어진 반복가능한 확률실험(Experiment)에 기반을 둔다. 여기서 관측된 것을 결과(Outcome)이라 하며, 결과의 집합을 사건(Event)이라고 한다. 과정, 관측, 확률실험, 결과, 사건의 정의가 애매하고 와닿지 않는다. 최종적으로 이 단어들을 예시를 통해 이해하는 것을 목표로 확률의 근본이 어떤 녀석인지 알아보자. 집합론을 확률에 적용하기 상호배타적 (Mutually Exclusive) 전체집합 S에 A_i 라는 집합들이 있을 때, 이것들이 위의 ..