목록베이즈 (2)
컴공생의 다이어리
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/kUTvN/btq20Fnij9t/lTlFzDckYZaJazvHp9mgGK/img.png)
일반적으로 원인에 대한 결과의 확률은 잘 알려져 있다. 예를 들어 자동차 고장 원인에 대한 증상들의 확률에 대해 얘기해보자. 자동차 고장 원인에는 배터리, 센서, 연료, 필터 등이 있다고 하고 증상에는 차가 멈춤, 급발진 등이 있다고 한다면 여기서 고장 원인은 앞사건(먼저 일어난 사건), 증상은 뒷사건이다. 앞서 말했듯이 원인(앞사건)에 대한 결과(뒷사건)은 잘 알 수 있다. 그러나 보통은 자동차가 일단 고장이 나면 그 증상을 일으키는 원인이 무엇인지를 찾아야 하며 이때 우리는 증상에 따른 원인들의 확률을 찾아야 한다. 이 확률을 구하기 위해 사용되는 것이 바로 베이즈 정리이다. 베이즈 정리(Bayes' theorem) - 어떤 조건 확률을 구할 때, 그 조건 상황이 역으로 되어 있는 확률을 이용하는 것..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dJv0e6/btqS6YH1yWd/1NkOyax6g5aZnww6jMGvk0/img.png)
베이즈 정리(Bayes Theorem) 베이즈 정리는 새로운 정보를 토대로 어떤 사건이 발생했다는 주장에 대한 신뢰도를 갱신해 나가는 방법이다. 베이즈 정리 증명 서로 영향을 끼칠 때의 두 사건에 대한 조건부 확률을 사용해 베이즈 정리를 증명할 수 있다. 다음과 같이 식을 정리하다보면 결과적으로 A가 일어났을 때의 B의 확률(P(B|A))를 구할 수 있다. 문제 적용 이제 free라는 메일이 와있을 때(A) 그것이 스팸메일인지(B) 아닌지를 구분해야 하는 문제에 나이브 베이즈 문제를 적용시켜보자. 10개의 메일 중에, 3개는 스팸메일이다. 그리고 그와 상관없이 free라는 단어를 포함하는 메일이 4개가 있다. 기본적으로 필요한 요소는 3가지 이다. P(spam) : 스팸메일의 확률 = 3/10 P(fre..