2025년, 코딩은 선택이 아닌 필수!

2025년 모든 학교에서 코딩이 시작 됩니다. 먼저 준비하는 사람만이 기술을 선도해 갑니다~

강의자료/인공지능수학

[인공지능수학] 표준점수

원당컴1 2023. 1. 27. 13:18

1. 표준점수란?

데이터가 정규분포를 따른다고 가정하고 각 값이 평균에서 얼마나 떨어져 있는지 표준편차를 사용해 변환한 점수를 표준점수(standard score) 또는 z점수 라고 한다.

예를 들면 다음과 같다.

출생한 아기의 몸무게와 키에 대한 데이터가 있다고 가정해 보자.몸무게와 키가 평균으로부터 얼마만큼 떨어져 있는지 나타내려면 몸무게는 1kg, 키는 5cm 와 같이 다른 단위를 써야 한다.게다가 이런 수치만 보아서는 평균으로부터 몸무게가 더 멀리 떨여져 있는지, 키가 더 멀리 떨어져 있는지 알기 어렵다.

그래서 z점수라는 값을 사용한다.

2. 표준점수(z점수) 구하기

z점수는 평균까지의 거리를 표준편차로 나눈 값이다.

식은 다음과 같다.

z점수 = (x - 모집단평균)/모집단의 표준편차 와 같이 구한다.

만약 아기의 몸무게와 키에 대한 z점수가 각각 1과 0.5라면 아기의 몸무게가 평균에서 1 표준편차만큼 떨어져 있고 키는 0.5 표준편차 만큼 떨어져 있다는 의미이다.

따라서 몸무게가 키에 비해 상대적으로 평균에서 더 멀리 떨어져 있다는 것을 쉽게 알 수 있다.

3. 파이썬 코드로 z점수 구하기

[0,3,5,7,10] 다섯개의 값으로 이루어진 리스트 x가 있을 때 7 에 대한 z 점수를 계산하려면 다음과 같이 넘파이의 표준편차와 평균을 계산 한 후 z점수 공식에 적용 할 수 있다.

import numpy as np

x = [0, 3, 5, 7, 10]

s = np.std(x)
m = np.mean(x)
z = (7 - m) / s
print(z)

0.5872202195147035

4.사이파이(scipy)로 z 점수 구하기

z 점수는 많은 수학 및 과학알고리즘을 제공하는 사이파이(scipy)로 더 편리하게 계산할 수 있다. 다음처럼 사이파이의 stats 모듈을 임포트한 다음 zscore() 함수를 호출하여 배열 x에 대한 모든 z 점수를 계산할 수 있다.

from scipy import stats

stats.zscore(x)

array([-1.46805055, -0.58722022,  0.        ,  0.58722022,  1.46805055])

7에 해당하는 z 점수는 0.58722022 와 같이 동일한 점수를 확인 할 수 있다.

 

참고]

혼자공부하는 데이터 분석

사업자 정보 표시
원당컴퓨터학원 | 기희경 | 인천 서구 당하동 1028-2 장원프라자 502호 | 사업자 등록번호 : 301-96-83080 | TEL : 032-565-5497 | Mail : icon001@naver.com | 통신판매신고번호 : 호 | 사이버몰의 이용약관 바로가기