완숙의 블로그

[Stochastic Process] 19 - 중요도 검사, 가설검증, 최대 가능도 방법 (Hypothesis test, Maximum Likelihood ) 본문

Mathmatics/Statistics

[Stochastic Process] 19 - 중요도 검사, 가설검증, 최대 가능도 방법 (Hypothesis test, Maximum Likelihood )

완숙 2019. 6. 24. 21:28

가설 검증

이진 가설의 검증

 

  • H0, H1 두개의 가능한 결론을 가진다.

  • P[H0], P[H1] = 1 - P[H0] 두 확률은 사전 확률이라고 한다.

    결과 관측되기 전에 얻어진 사전 확률 모델 지식이다.

 

 

 

 

정확도 측정

 

  • P[A1|H0] : False Alarm

    0이라 생각했는데, 1이 나온 경우

  • P[A0|H1] : Missing

    1이라 생각했는데 0이 나온 경우

 

 

이 두가지의 정확도를 측정하는 파라미터는, 표본집합 S가 어떻게 A0와 A1으로 나뉘느냐에 따라

값이 다르게 측정된다.

 

 

예를 들어 A0가 95%, A1이 5%를 차지하도록 기준점을 잡았다면,

P_miss 값은 크게 측정이 되나,

P_FA 값은 작게 측정이 될 것이다.

 

 

즉, 당연히 0이 많이 나오는 집합이라면, 놓치는 확률도 높을 것이다.

이렇게 직관적으로 이해할 수 있다.

 

 

 

ROC curve

 

어떤 가설을 내가 세우냐에 따라 A0, A1 집합은 나뉘며,

그에 따른 P_FA, P_miss 확률 역시 변화한다.

 

 

기본적으로 P_FA, P_miss 는 trade-off 관계를 가지며,

이 두 관계를 그래프로 그려놓은 것이 ROC curve 이다.

 

 

스크린샷 2019-06-16 오후 2 33 32

 

 

 

 

 

MAP 최대 사후확률 검증

 

 

 

 

 

 

 

 

 

 

이 에러확률을 최소로 하는 가설을 채택한다.

 

 

 

 

이 때 이것을 검증하는 규칙은 다음과 같다.

 

 

스크린샷 2019-06-16 오후 2 37 49

 

 

 

 

즉, 더 큰 사후확률을 갖는 집합을 선택하면 Error 확률을 최소화 할 수 있다.

 

따라서 이 검증 방법을 최대 사후확률 검증 방법이라 한다.

 

 

이 것을 좀 더 정리해서 나타내면,

 

 

 

스크린샷 2019-06-16 오후 2 39 47

 

 

 

 

최소 비용(MC) 검증

 

 

MAP 검증은, P_Error 를 만들 때, FA와 Miss 확률의 가중치를 같게 평가했다.

 

하지만 내가 어떤 집합을 어떤 가설을 세우고,

어떤 중요도에 더 가중치를 주는지는 모른다.

 

따라서 가중치를 준 상태에서 P_Error를 최소화 하는 것이 최소비용 검증방법이다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

스크린샷 2019-06-16 오후 2 51 28

 

 

 

 

 

최대 가능도 (ML) 검증

 

 

사전 확률 P[H0], P[H1] 이 없어도 검증 할 수 있는 방법이다.

 

 

위에서 MAP, MC 검증은, 가설을 검증할 떄 있어서, P[H0], P[H1] 의 비율값을 토대로

검증을 수행했지만,

 

 

이제는 P[H0], P[H1] 값이 각각 1/2 라고 가정한 상태에서

왼쪽의 가능도(likelihood)의 비율만을 가지고 판단하는 방법이다.

 

 

이 방법은 사전확률을 모르더라도 수행할 수 있다는 장점이 있다.

 

 

 

 

스크린샷 2019-06-16 오후 2 54 18

Comments