728x90

Numpy의 기술 통계 

  • NumPy는 다음과 같은 데이터 집합에 대해 간단한 통계를 계산하는 함수를 제공한다.
  1.  len()   : 데이터의 개수
  2.  max(), min()  :  데이터의 최댓값, 최솟값
  3.  mean()  : 데이터의 평균
  4.  median()  : 데이터의 중앙값
  5.  std()  : 표준편차 
    • 분산의 제곱근 값 
  6.  var()  : 분산( variance) 데이터와 샘플 평균 간의 거리의 제곱의 평균
    • 샘플 분산이 작을수록 데이터가 모여있고, 클수록 흩어져 있다.
  7.  percentile()  : 사분위수 표현(  ) 

1. len()
  • len() : 배열의 데이터 수를 구해주는 함수


2. max() / min()
  • np.max() : 배열의 데이터 중 가장 큰 값을 불러오는 함수
  • np.min() : 배열의 데이터 중 가장 큰 값을 불러오는 함수


 3. mean() 
  • np.mean() : 데이터의 평균을 구하는 함수


4.median()
  • np.median() : 배열의 데이터를 정렬했을 때 가장 중앙에 있는 값을 구하는 함수 


5. std()
  • np.std() : 표준 편차(standard variance)를 구하는 함수
  • 표준 편차(standard variance)란? 분산의 양의 제곱근


6. var()
  • np.var() : 분산( variance)이란? 데이터와 샘플 평균 간의 거리의 제곱의 평균
  • 분산이 작으면 데이터가 모여있는 것이고 크면 흩어져 있다.


7. percentile()
  • np.percentile() : 배열의 사분위수를 표현해준다 .
  • 아래와 같이 최댓값, 최솟값, 중앙값을 표현해 주기도 한다.

728x90

+ Recent posts