본문 바로가기

통계학

[통계학] Z-Score

Z-Score

Z-Score은 표준편차의 그래프에서 특정 경우가 표준편차 상에 어떤 위치를 차지하는지를 보여주는 수치다. 표준 점수(Standard Score), 정규 점수, Z변수로 불리기도.

쉽게 말해서, 표준편차의 그래프에서 x축에 특정 위치 a를 짚는다. 그리고 a가 평균에서 얼마나 떨어져 있는지를 나타낸다. 단, 표준편차의 수준에서 나타낸다.

z = (a - μ) / ∂ 

참고 : https://ko.wikipedia.org/wiki/%ED%91%9C%EC%A4%80_%EC%A0%90%EC%88%98

누군가 데이터셋을 정규화하자고 말하면 다음과 같은 작업 순서를 가진다

① 표본 분포의 그래프를 그린다
② 표본 분포의 평균과 표준편차를 구한다
③ 표본 분포의 평균을 0으로 두고, 표준편차를 1로 만든다
④ 0을 기준으로 왼쪽으로 -1∂, -2∂, -3∂… , 오른쪽으로 1∂, 2∂, 3∂…의 값을 표시한다

→ 이제 어떤 값이든 Z-Score를 통하여 x축의 위치를 말할 수 있다. z = (a - μ) / ∂ 의 공식에서 μ=0, ∂=1이 되었기 때문이다.

또, Z-Score를 알면, 모집단의 평균이 특정 범위 속에 속할 확률을 구할 수 있다. Z-Score 관련 표가 있어 찾아보면 해결된다. 

예시)
표준점수(z) 0.0(= (편차치 t) 50) 이상은 전체의 50%이다.
표준점수 1.0(=편차치 60) 이상은 전체의 15.866%이다.
표준점수 2.0(=편차치 70) 이상은 전체의 2.275%이다.
표준점수 3.0(=편차치 80) 이상은 전체의 0.13499%이다.
표준점수 4.0(=편차치 90) 이상은 전체의 0.00315%이다.
표준점수 5.0(=편차치 100) 이상은 전체의 0.00002%이다.
출처 : 위키피디아

이는 정규 분포의 모양이 달라도 모두 '똑같이'  적용된다.

'통계학' 카테고리의 다른 글

[통계학] 통계적 유의성 / p-value  (0) 2023.02.26
[통계학] 중심 극한 정리  (1) 2023.02.26
[통계학] 분포  (0) 2023.02.26