가설 검증
이진 가설의 검증
H0, H1 두개의 가능한 결론을 가진다.
P[H0], P[H1] = 1 - P[H0] 두 확률은 사전 확률이라고 한다.
결과 관측되기 전에 얻어진 사전 확률 모델 지식이다.
정확도 측정
P[A1|H0] : False Alarm
0이라 생각했는데, 1이 나온 경우
P[A0|H1] : Missing
1이라 생각했는데 0이 나온 경우
이 두가지의 정확도를 측정하는 파라미터는, 표본집합 S가 어떻게 A0와 A1으로 나뉘느냐에 따라
값이 다르게 측정된다.
예를 들어 A0가 95%, A1이 5%를 차지하도록 기준점을 잡았다면,
P_miss 값은 크게 측정이 되나,
P_FA 값은 작게 측정이 될 것이다.
즉, 당연히 0이 많이 나오는 집합이라면, 놓치는 확률도 높을 것이다.
이렇게 직관적으로 이해할 수 있다.
ROC curve
어떤 가설을 내가 세우냐에 따라 A0, A1 집합은 나뉘며,
그에 따른 P_FA, P_miss 확률 역시 변화한다.
기본적으로 P_FA, P_miss 는 trade-off 관계를 가지며,
이 두 관계를 그래프로 그려놓은 것이 ROC curve 이다.
MAP 최대 사후확률 검증
이 에러확률을 최소로 하는 가설을 채택한다.
이 때 이것을 검증하는 규칙은 다음과 같다.
즉, 더 큰 사후확률을 갖는 집합을 선택하면 Error 확률을 최소화 할 수 있다.
따라서 이 검증 방법을 최대 사후확률 검증 방법이라 한다.
이 것을 좀 더 정리해서 나타내면,
최소 비용(MC) 검증
MAP 검증은, P_Error 를 만들 때, FA와 Miss 확률의 가중치를 같게 평가했다.
하지만 내가 어떤 집합을 어떤 가설을 세우고,
어떤 중요도에 더 가중치를 주는지는 모른다.
따라서 가중치를 준 상태에서 P_Error를 최소화 하는 것이 최소비용 검증방법이다.
최대 가능도 (ML) 검증
사전 확률 P[H0], P[H1] 이 없어도 검증 할 수 있는 방법이다.
위에서 MAP, MC 검증은, 가설을 검증할 떄 있어서, P[H0], P[H1] 의 비율값을 토대로
검증을 수행했지만,
이제는 P[H0], P[H1] 값이 각각 1/2 라고 가정한 상태에서
왼쪽의 가능도(likelihood)의 비율만을 가지고 판단하는 방법이다.
이 방법은 사전확률을 모르더라도 수행할 수 있다는 장점이 있다.