- 베이즈 정리
여기서는 확률이라는 단어를 '주장에 대한 신뢰도'로 생각해보자.
이러한 관점은 확률에 대한 베이지안 주의(Bayesianism) 관점으로 볼 수 있다.
반면, 전통적인 확률관은 빈도주의(frequentism)이라고 볼 수 있다.
가령 동전의 앞면이 나올 확률이 50%라고 하면, 빈도주의자들은 100번 동전을 던졌을 때 50번은 앞면이 나온다고 해석하고, 베이지안 주의자들은 동전의 앞면이 나왔다는 주장의 신뢰도가 50%라고 보는 것.
H는 Hypothesis의 약자로써 가설 혹은 '어떤 사건이 발생했다는 주장'을 의미한다.
E는 Evidence의 약자로 '새로운 정보'를 의미한다.
따라서 P(H) 는 어떤 사건이 발생했다는 주장에 관한 신뢰도를 의미하고,
P(H | E) 는 새로운 정보를 받은 후 갱신된 신뢰도를 의미한다.
P(H)와 P(H | E) 는 각각 사전 확률, 사후 확률이라고 부르는데, 사전(事前), 사후(事後)라는 단어를 생각해본다면
‘Evidence를 관측하여 갱신하기 전 후의 내 주장에 관한 신뢰도' 라고 할 수 있다.
● 예시
질병 A의 발병률은 0.1%로 알려져있다. 이 질병이 실제로 있을 때 질병이 있다고 검진할 확률(민감도)은 99%,
질병이 없을 때 없다고 실제로 질병이 없다고 검진할 확률(특이도)는 98%라고 하자.
만약 어떤 사람이 질병에 걸렸다고 검진받았을 때, 이 사람이 정말로 질병에 걸렸을 확률은?
● Solution