컴공생의 다이어리
베이즈 정리(Bayes' theorem) 본문
일반적으로 원인에 대한 결과의 확률은 잘 알려져 있다. 예를 들어 자동차 고장 원인에 대한 증상들의 확률에 대해 얘기해보자. 자동차 고장 원인에는 배터리, 센서, 연료, 필터 등이 있다고 하고 증상에는 차가 멈춤, 급발진 등이 있다고 한다면 여기서 고장 원인은 앞사건(먼저 일어난 사건), 증상은 뒷사건이다. 앞서 말했듯이 원인(앞사건)에 대한 결과(뒷사건)은 잘 알 수 있다. 그러나 보통은 자동차가 일단 고장이 나면 그 증상을 일으키는 원인이 무엇인지를 찾아야 하며 이때 우리는 증상에 따른 원인들의 확률을 찾아야 한다. 이 확률을 구하기 위해 사용되는 것이 바로 베이즈 정리이다.
베이즈 정리(Bayes' theorem)
- 어떤 조건 확률을 구할 때, 그 조건 상황이 역으로 되어 있는 확률을 이용하는 것
- P(원인 | 결과) = P(앞사건 | 뒷사건)
- 사건이 두가지 일때의 베이즈 정리
: 두사건 A1, A2는 상호배반, A1∪A2는 표본공간 전체일 때,
사전확률(Prior) : 사건이 일어나기 전 확률 - P(A1), P(A2)
사후확률(Posterior) : 사건이 일어난 후의 확률 - P(A1|B), P(A2|B)
베이즈 정리 예시
▶ 문제
어느 대학에 합격한 신입생 중 남학생의 확률을 알고자 한다. 해당 대학에 응시한 남학생과 여학생의 비율이 0.6과 0.4이고 남학생의 합격률은 0.3이고 여학생의 합격률은 0.5이다.
남자 | 0.6 | 합격 | 0.3 |
불합격 | 0.7 | ||
여자 | 0.4 | 합격 | 0.5 |
불합격 | 0.5 |
▶ 풀이
P(앞사건 | 뒷사건)을 구해야 한다. 여기서 앞사건은 성별이며 뒷사건은 합격여부이다. P(앞사건 | 뒷사건)은 조건부 확률이기 때문에 P(앞사건 ∩ 뒷사건)/P(뒷사건)이다.
P(뒷사건)은 P(남자∩합격)+P(여자 ∩ 합격)이며 P(앞사건 ∩ 뒷사건)은 P(남자∩합격)이기 때문에 최종적으로 식은 다음과 같다.
출처 : EXCEL, SPSS, R로 배우는 통계학입문/강상욱 외 8인 공저/자유아카데미/2014
'확률및통계' 카테고리의 다른 글
이산형 확률분포(Discrete probability distribution) - 확률질량함수(pmf), 누적 분포 함수(cdf), 기댓값(평균), 분산, 표준편차 (0) | 2021.05.11 |
---|---|
확률 변수(Random Variable)란? (0) | 2021.04.27 |
공분산(Covariance)의 성질 (0) | 2021.04.24 |
확률(Probability)의 정의, 규칙, 종류(결합, 주변) (0) | 2021.04.15 |
연관성 척도(Measure of Association) - 공분산(Covariance), 상관계수(Correlation Coefficient) (0) | 2021.04.14 |