● 정규성 검정 (normality test)
사용하는 관측값이 정규 분포를 따르는지 보기 위해 사용되는 통계 검정이다.
사실 통계 분석의 경우 대부분, 데이터의 정규성을 가정하게 되는데 (주어진 자료들이 정규 분포를 따른다고 가정을 하게 되는데)
이때 주어진 값들의 정규성을 통계적인 방법으로 검정한다.
이후, 정규성 검정에서 정한 유의 수준과 검정 통계량에서 얻은 p값을 비교해 귀무 가설의 기각을 결정할 수 있다.
● t 검정 (t test)
두 집단의 평균 차이를 보기 위해 사용된다.
우선 두 집단의 평균 차이가 t 분포를 따른다고 가정하고, 구체적으로 두 집단의 평균에 차이가 있는지를 표본에 대해 통계적인 방법으로 검정하는 것이다.
t 검정 역시 검정 통계량에서 얻는 p값과 유의 수준을 비교해 귀무 가설의 기각을 결정할 수 있다.
● 쌍체 t 검정 (대응 표본 t 검정, Paired t test)
동일한 모집단을 대상으로 처치(treatment)를 한 후 처치 전과 후의 평균을 비교하는 것이다.
대표적인 예로 환자를 대상으로 치료한 후 증상 값의 평균을 비교하는 것을 들 수 있다.
동일한 환자들을 대상으로 새로운 처치법을 적용하는 경우를 생각해보자.
처치 전 환자들의 통증을 측정한 값의 평균과 처치 후 통증을 측정한 값의 평균을 비교할 때 이 검정을 사용하는데,
처치 전후 통증의 평균 값 차이는 통계적으로 유의한지 아닌지에 대한 통계적 결론을 내리는 데 도와준다.
● F 검정 (등분산 검정, f test)
두 집단 혹은 세 집단 이상 사이에 산포도(대표적인 산포도로 분산이 있음) 차이가 있는지를 통계적인 방법으로 검정하는 것으로,
두 집단 이상의 분산 차이를 검정할 때 사용할 수 있다.
각 집단이 갖는 분산이 같은 것을 귀무 가설로, 차이가 있는 것을 대립 가설로 하여 검정하는 방법이다.
등분산 검정 결과, 귀무 가설이 기각되면 집단 간의 분산은 같지 않음을 말할 수 있다.
특히, F 검정(F test)은 두 집단 간에 분산의 차이가 있는지를 통계적인 방법으로 검정하며 회귀모형 해석 등에도 많이 사용된다.
예를 들면, 어떤 지역에서 동일한 제품을 판매하고 직원 수도 동일한 두 가게를 가정하였다.
두 가게가 포함된 상권을 조사하는 과정에서, 두 가게의 일별 매출의 변동을 통해 상권을 이해하고자 한다.
같은 지역에서 객관적인 조건이 같은 두 가게인데, 과연 이 두 곳의 일별 매출 값의 분산은 같을까 아니면 다를까?
등분산 검정, 그중에서도 F 검정을 통해 이를 분석할 수 있다.
두 가게의 매출 값에 대해서 다음과 같이 가설을 세워보자.
F 검정의 결과, 귀무 가설이 기각된다면 객관적으로 동일한 조건을 갖는 두 가게의 매출 값 분산이 통계적으로 다르다고 할 수 있다.
● χ2 검정 (카이제곱 검정, chi-square test)
카이제곱이라는 통계량으로 가설을 검정하는 것이다.
주로, 범주형 자료에서 범주들 간의 독립성 여부를 통계적인 방법으로 검정한다(그외 동일성 검정, 적합성 검정에 적용된다).
예를 들어 주사위를 던지는 경우, 범주 6개가 같은 확률로 발생한다고 볼 수 있는데,
실험에서 주사위를 150번 던진 후 범주별 발생 빈도가 22, 21, 22, 27, 22, 36으로 나타났다면 그때 카이제곱 검정의 가설은 다음과 같다.
만약 카이제곱 검정의 p값이 6%가 나왔고, 이 검정의 유의 수준을 5%라고 설정했다면 귀무 가설은 기각되지 않는다.
실험한 결과에서 주사위의 눈별로 발생하는 빈도가 다름에도 불구하고 이 결과는 기존의 지식인 주사위 각 범주의 발생 확률이 같다는 주장을 기각시키지 못한다.
주사위의 각 범주의 발생 확률이 같다는 통계적 결론을 내리게 된다.
'수학 > 기초 이산 수학' 카테고리의 다른 글
6-1 . 상관 분석 (0) | 2022.10.20 |
---|---|
5-7 . 가설 검정의 오류 (0) | 2022.10.20 |
5-5 . 가설 검정 (0) | 2022.10.20 |
5-4 . 통계적 추론 (0) | 2022.10.20 |
5-3 . 연속형 확률 분포 (0) | 2022.10.20 |