본문 바로가기

Codestates AI 부트캠프/1. Introduction to Data Sceince

[통계학] 2-1 Bayes' Theorem

1. 이항 분포 

정의

독립적으로 반복되어지는 행위에 의해서, 결과값이 2개 옵션을 가지는 사건의 확률을 결정하는 함수.

 

이항 분포의 조건

① n번의 독립시행

② 관심 사건 A가 일어날 확률 p / A가 일어나지 않을 확률 (1-p)

③ n번 중 A가 일어난 횟수 k

 

확률 질량 함수

독립시행 n번 중 사건 A가 k번 일어날 확률 함수는 아래와 같다

코드로도 구현해볼 수 있다

from  scipy.stats  import  binom 

k=35
n=100
p=0.75

rv = binom.pmf(k, n, p)
rv

 

2. 조건부 확률

주어진 사건이 일어났을 때 다른 한 사건이 일어날 확률을 뜻한다. 사건 B가 일어났을 때, 사건 A가 일어날 조건부 확률은 P(A|B)로 표기한다. 

 

아래 유튜브에는 조건부 확률과 베이즈 이론이 쉽게 정리되어 있다. 한번 보고 넘어가자
https://www.youtube.com/watch?v=Y4ecU7NkiE

 

3. 이유 불충분의 원리

아무 정보가 없는 상황에서 가능한 모든 사건에 동일한 확률을 할당해야한다는 원칙. 베이즈 이론에서 정보가 없을 때의 사전 확률로 쓰인다. 예를 들어, 동전이 어디로 휘었는지 알 수 없다면, 던졌을 때 앞면이 나올 확률과 뒷면이 나올 확률은 50:50으로 같다는 것이다.

 

4. 베이즈 정리

사건 B가 발생함으로써 사건 A의 확률이 어떻게 변화하는지를 표현한 정리다. 사전 확률을 기반으로 새로운 정보를 활용해 사후 확률을 예측할 수 있다.