데이터사이언스

3-7. numpy_기본통계

유니진 2023. 1. 23. 19:25

1. 최댓값, 최솟값

   - max 메소드, min 메소드 사용

 

import numpy as np

array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5])

print(array1.max()) # 최댓값
print(array1.min()) # 최솟값
31
5

 

 

 

 

2. 평균값

   - mean 메소드 사용

 

import numpy as np

array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5])

print(array1.mean()) # 평균값
15.25

 

 

 

 

3. 중앙값

   - median 메소드 사용

   - 특이하게 median 은 numpay array 의 메소드가 아니라, numpy 의 메소드

 

import numpy as np

array1 = np.array([8, 12, 9, 15, 16])
array2 = np.array([14, 6, 13, 21, 23, 31, 9, 5])

print(np.median(array1)) # 중앙값
print(np.median(array2)) # 중앙값
12.0
13.5

 

   - array1 을 정렬하면 중앙값은 12

   - array2 에는 짝수개의 요소가 있으므로 중앙값이 13과 14로 두 개이고 이를 평균내면 13.5 

 

 

 

 

4. 표준 편차, 분산

   - 값들이 평균에서 얼마나 떨어져 있는가 를 나타내는 지표 

 

import numpy as np

array1 = np.array([14, 6, 13, 21, 23, 31, 9, 5])

print(array1.std()) # 표준 편차
print(array1.var()) # 분산
8.496322733983215
72.1875