1. 이항 분포
정의
독립적으로 반복되어지는 행위에 의해서, 결과값이 2개 옵션을 가지는 사건의 확률을 결정하는 함수.
이항 분포의 조건
① n번의 독립시행
② 관심 사건 A가 일어날 확률 p / A가 일어나지 않을 확률 (1-p)
③ n번 중 A가 일어난 횟수 k
확률 질량 함수
독립시행 n번 중 사건 A가 k번 일어날 확률 함수는 아래와 같다
코드로도 구현해볼 수 있다
from scipy.stats import binom
k=35
n=100
p=0.75
rv = binom.pmf(k, n, p)
rv
2. 조건부 확률
주어진 사건이 일어났을 때 다른 한 사건이 일어날 확률을 뜻한다. 사건 B가 일어났을 때, 사건 A가 일어날 조건부 확률은 P(A|B)로 표기한다.
아래 유튜브에는 조건부 확률과 베이즈 이론이 쉽게 정리되어 있다. 한번 보고 넘어가자
https://www.youtube.com/watch?v=Y4ecU7NkiE
3. 이유 불충분의 원리
아무 정보가 없는 상황에서 가능한 모든 사건에 동일한 확률을 할당해야한다는 원칙. 베이즈 이론에서 정보가 없을 때의 사전 확률로 쓰인다. 예를 들어, 동전이 어디로 휘었는지 알 수 없다면, 던졌을 때 앞면이 나올 확률과 뒷면이 나올 확률은 50:50으로 같다는 것이다.
4. 베이즈 정리
사건 B가 발생함으로써 사건 A의 확률이 어떻게 변화하는지를 표현한 정리다. 사전 확률을 기반으로 새로운 정보를 활용해 사후 확률을 예측할 수 있다.
'Codestates AI 부트캠프 > 1. Introduction to Data Sceince' 카테고리의 다른 글
[통계학] 2-4 AB test (0) | 2023.02.26 |
---|---|
[통계학] 2-3 Hypothesis Test / p-value 활용 (0) | 2023.02.26 |
[통계학] 2-2 Central Limit Theorem (0) | 2023.02.26 |
[DS 기초] 1-3 & 1-4 Data Wrangling (0) | 2023.02.26 |
[DS 기초] 1-1 & 1-2 EDA, Feature Engineering (0) | 2023.02.15 |