● 평균(Average)
평균으로 자료의 중심을 효율적으로 나타낼 수 있다.
한 변수에 속하는 모든 관측값의 크기(정보)를 반영해야 하며 평균을 구하는 방법은 모든 값을 더해서 값의 개수로 나누는 것이다.
평균은 간단하면서 쉽게 여러 값들의 중심을 나타낼 수 있어서 많이 사용되는 대표적인 통계량이다.
하지만, 평균은 이상값(outlier)의 영향을 받는다는 단점이 있다.
관측값과 평균은 차이가 많이 난다.
이러한 이상값의 영향을 받아 평균이 실제 값과 다르게 계산될 수 있는 관측값과 평균은 차이가 많이 난다.
● 중간값 (median)
측값을 크기순으로 나열하였을 때 중앙에 위치하는 관측값을 의미한다.
평균과는 다르게 이상값에 덜 민감하다.
● 최빈값(mode)
한 변수에 속한 값 중에서 가장 많이 출현하는 관측값을 의미한다.
● 분산 (Variance)
각 관측값이 평균에서 얼마나 퍼져있는지를 보는 척도이다.
각 관측값과 평균의 차이가 있고, 그 차이들의 평균을 나타낸 것이다.
모집단으로부터 분산을 구하면 이는 모분산(population variance)이 된다.
표본에서 얻은 분산은 표본 분산(sample variance)이라고 한다.
● 표준편차 (standartd deviation)
알고 싶은 것은 각 관측값이 평균과 대체로 어느 정도 차이 나는지이지만, 분산은 평균과의 차이를 제곱한 값으로 원래 알고자 한 크기가 제곱되어 나타난다.
그렇기 때문에 분산을 원래 알고자 하던 크기로 바꾸려면 분산값의 양의 제곱근을 사용해야 한다.
'수학 > 기초 이산 수학' 카테고리의 다른 글
4-4 . 확률 (0) | 2022.10.20 |
---|---|
4-3 . 다변수 통계량 (0) | 2022.10.20 |
4-1 . 모집단, 모수 , 표본, 통계량 (1) | 2022.10.12 |
3-5 . 코드 (0) | 2022.10.12 |
3-4 . 미적분학 & 편미분 (0) | 2022.10.12 |