컴공생의 다이어리
베이즈 정리(Bayes Theorem) 본문
베이즈 정리(Bayes Theorem)
베이즈 정리는 새로운 정보를 토대로 어떤 사건이 발생했다는 주장에 대한 신뢰도를 갱신해 나가는 방법이다.
베이즈 정리 증명
서로 영향을 끼칠 때의 두 사건에 대한 조건부 확률을 사용해 베이즈 정리를 증명할 수 있다.
다음과 같이 식을 정리하다보면 결과적으로 A가 일어났을 때의 B의 확률(P(B|A))를 구할 수 있다.
문제 적용
이제 free라는 메일이 와있을 때(A) 그것이 스팸메일인지(B) 아닌지를 구분해야 하는 문제에 나이브 베이즈 문제를 적용시켜보자. 10개의 메일 중에, 3개는 스팸메일이다. 그리고 그와 상관없이 free라는 단어를 포함하는 메일이 4개가 있다.
기본적으로 필요한 요소는 3가지 이다.
- P(spam) : 스팸메일의 확률 = 3/10
- P(free) : free를 포함하는 메일의 확률 = 4/10
- P(free|spam) : 스펨메일 중에 포함된 free를 포함하는 메일 = 2/3
최종적으로 P(spam|free)는 아래와 같이 구할 수 있다.
728x90
반응형
'데이터 분석 & 머신러닝' 카테고리의 다른 글
선형 회귀(Linear Regression) (0) | 2021.01.10 |
---|---|
머신러닝의 종류(지도 학습, 비지도 학습, 강화 학습) (0) | 2021.01.10 |
확률(Probability) (0) | 2021.01.09 |
엔트로피, 정보이득 계산과 ID3알고리즘 (0) | 2021.01.09 |
불순도(Impurity)와 엔트로피(Entropy) (3) | 2021.01.08 |
Comments