목록정리 (3)
컴공생의 다이어리
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/kUTvN/btq20Fnij9t/lTlFzDckYZaJazvHp9mgGK/img.png)
일반적으로 원인에 대한 결과의 확률은 잘 알려져 있다. 예를 들어 자동차 고장 원인에 대한 증상들의 확률에 대해 얘기해보자. 자동차 고장 원인에는 배터리, 센서, 연료, 필터 등이 있다고 하고 증상에는 차가 멈춤, 급발진 등이 있다고 한다면 여기서 고장 원인은 앞사건(먼저 일어난 사건), 증상은 뒷사건이다. 앞서 말했듯이 원인(앞사건)에 대한 결과(뒷사건)은 잘 알 수 있다. 그러나 보통은 자동차가 일단 고장이 나면 그 증상을 일으키는 원인이 무엇인지를 찾아야 하며 이때 우리는 증상에 따른 원인들의 확률을 찾아야 한다. 이 확률을 구하기 위해 사용되는 것이 바로 베이즈 정리이다. 베이즈 정리(Bayes' theorem) - 어떤 조건 확률을 구할 때, 그 조건 상황이 역으로 되어 있는 확률을 이용하는 것..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/6FuF8/btqVOru9i4I/uAytY3eA0CNFglxguNCQi1/img.png)
Kaggle(캐글) Titanic(타이타닉) 생존자 예측에서 사용했던 머신러닝 모델을 간단하게 정리했다. 모델 종류 Logistic Regression, SVM(Support Vector Machines), K-NN(K Nearest Neighborhood), Gaussian Naive Bayes, Perceptron, Linear SVC, Stochastic Gradient Descent, Decision Tree, Random Forest 파워포인트 일단 짧게 요약해서 정신이 없고 이해하기 어려워서 나중에 하나씩 자세하게 다시 정리할 계획이다!
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dJv0e6/btqS6YH1yWd/1NkOyax6g5aZnww6jMGvk0/img.png)
베이즈 정리(Bayes Theorem) 베이즈 정리는 새로운 정보를 토대로 어떤 사건이 발생했다는 주장에 대한 신뢰도를 갱신해 나가는 방법이다. 베이즈 정리 증명 서로 영향을 끼칠 때의 두 사건에 대한 조건부 확률을 사용해 베이즈 정리를 증명할 수 있다. 다음과 같이 식을 정리하다보면 결과적으로 A가 일어났을 때의 B의 확률(P(B|A))를 구할 수 있다. 문제 적용 이제 free라는 메일이 와있을 때(A) 그것이 스팸메일인지(B) 아닌지를 구분해야 하는 문제에 나이브 베이즈 문제를 적용시켜보자. 10개의 메일 중에, 3개는 스팸메일이다. 그리고 그와 상관없이 free라는 단어를 포함하는 메일이 4개가 있다. 기본적으로 필요한 요소는 3가지 이다. P(spam) : 스팸메일의 확률 = 3/10 P(fre..