728x90
Numpy의 기술 통계
- NumPy는 다음과 같은 데이터 집합에 대해 간단한 통계를 계산하는 함수를 제공한다.
- len() : 데이터의 개수
- max(), min() : 데이터의 최댓값, 최솟값
- mean() : 데이터의 평균
- median() : 데이터의 중앙값
- std() : 표준편차
- 분산의 제곱근 값
- var() : 분산( variance) 데이터와 샘플 평균 간의 거리의 제곱의 평균
- 샘플 분산이 작을수록 데이터가 모여있고, 클수록 흩어져 있다.
- percentile() : 사분위수 표현( )
1. len()
- len() : 배열의 데이터 수를 구해주는 함수
2. max() / min()
- np.max() : 배열의 데이터 중 가장 큰 값을 불러오는 함수
- np.min() : 배열의 데이터 중 가장 큰 값을 불러오는 함수
3. mean()
- np.mean() : 데이터의 평균을 구하는 함수
4.median()
- np.median() : 배열의 데이터를 정렬했을 때 가장 중앙에 있는 값을 구하는 함수
5. std()
- np.std() : 표준 편차(standard variance)를 구하는 함수
- 표준 편차(standard variance)란? 분산의 양의 제곱근
6. var()
- np.var() : 분산( variance)이란? 데이터와 샘플 평균 간의 거리의 제곱의 평균
- 분산이 작으면 데이터가 모여있는 것이고 크면 흩어져 있다.
7. percentile()
- np.percentile() : 배열의 사분위수를 표현해준다 .
- 아래와 같이 최댓값, 최솟값, 중앙값을 표현해 주기도 한다.
728x90
'파이썬\python > numpy' 카테고리의 다른 글
<Numpy> 8. 정렬 / 차원축소(Dimension reduction) (0) | 2020.06.13 |
---|---|
<Numpy> 6. 난수 / 난수 시드 설정 / 데이터 순서 교환 suffle() / 데이터 샘플링 choice() / 데이터 카운팅 unique(), bincount() (0) | 2020.06.12 |
<Numpy> 5. 브로드캐스팅(BroadCasting) (0) | 2020.06.12 |
<Numpy> 4. 배열 연결(병합) : stack(), hstack(), vstack(), dstack(), tile() (0) | 2020.06.12 |
<Numpy> 3. Numpy 자료형/ 자료형 변경 dtype() (0) | 2020.06.12 |