본문 바로가기
수학/기초 이산 수학

4-2 . 단변수 통계량

by mogazi 2022. 10. 12.

 

  평균(Average)

 

 

평균으로 자료의 중심을 효율적으로 나타낼 수 있다. 

 

 

한 변수에 속하는 모든 관측값의 크기(정보)를 반영해야 하며 평균을 구하는 방법은 모든 값을 더해서 값의 개수로 나누는 것이다. 

평균은 간단하면서 쉽게 여러 값들의 중심을 나타낼 수 있어서 많이 사용되는 대표적인 통계량이다.

 

 

하지만, 평균은 이상값(outlier)의 영향을 받는다는 단점이 있다.

 

 

관측값과 평균은 차이가 많이 난다. 

이러한 이상값의 영향을 받아 평균이 실제 값과 다르게 계산될 수 있는 관측값과 평균은 차이가 많이 난다. 

 

 

 

 

 

 

  중간값 (median)

 

측값을 크기순으로 나열하였을 때 중앙에 위치하는 관측값을 의미한다. 

평균과는 다르게 이상값에 덜 민감하다.

 

 

 

 

 

 

  최빈값(mode)

 

한 변수에 속한 값 중에서 가장 많이 출현하는 관측값을 의미한다.

 

 

 

 

 

 

 

  분산 (Variance)

 

 

각 관측값이 평균에서 얼마나 퍼져있는지를 보는 척도이다. 

각 관측값과 평균의 차이가 있고, 그 차이들의 평균을 나타낸 것이다. 

모집단으로부터 분산을 구하면 이는 모분산(population variance)이 된다.

 

 

 

 

 

표본에서 얻은 분산은 표본 분산(sample variance)이라고 한다.

 

 

 

 

 

 

 

 

 

  표준편차 (standartd deviation)

 

 

알고 싶은 것은 각 관측값이 평균과 대체로 어느 정도 차이 나는지이지만, 분산은 평균과의 차이를 제곱한 값으로 원래 알고자 한 크기가 제곱되어 나타난다. 

 

 

그렇기 때문에 분산을 원래 알고자 하던 크기로 바꾸려면 분산값의 양의 제곱근을 사용해야 한다. 

 

'수학 > 기초 이산 수학' 카테고리의 다른 글

4-4 . 확률  (0) 2022.10.20
4-3 . 다변수 통계량  (0) 2022.10.20
4-1 . 모집단, 모수 , 표본, 통계량  (1) 2022.10.12
3-5 . 코드  (0) 2022.10.12
3-4 . 미적분학 & 편미분  (0) 2022.10.12