본문 바로가기
수학/기초 이산 수학

6-1 . 상관 분석

by mogazi 2022. 10. 20.

 

  상관 분석 (correlation analysis)

 

 

상관관계라는 통계량으로 비교 대상인 두 집단 사이의 관계를 파악할 수 있게 도와주는 기법이다. 

 

 

예를 들어 ‘공부 시간과 성적 사이의 관계는 어떠한가?’라는 질문에 대해서, 상관관계는 공부 시간이 많으면 성적도 높은 편이다는 식의 답변을 줄 수 있다. 

이때 상관관계는 데이터를 이용하여 직선적인 관계가 존재하는지를 파악한다는 점이 중요하다.

 

 

이러한 직선적 관계는 하나가 늘어날 때 다른 하나는 줄어드는 관계이다.

어떤 변수가 증가할 때 다른 변수도 증가하는지 또는 감소하는지를 나타내는 직선적인 관계를 ‘선형 관계’라 부른다.

 

 

예를 들어 소득과 지출의 관계에 대해 알고 싶다고 하면,

이제 상관분석의 가설은 소득과 지출의 상관관계가 없는지 또는 있는지를 바탕으로 다음처럼 수립할 수 있다.

 

 

 

 

 

 

 

 

 

  상관 계수 (correlation coefficient, r)

 

 

검정 통계량으로 사용되는 상관계수는 두 집단 간의 직선적인 관계를 나타내는 지표로 -1~1 사이의 값을 가진다. 

 

 

두 변수의 공분산을 각 변수의 표준편차로 나눠준, 일종의 표준화된 공분산의 개념이다. 

앞서 살펴본 공분산이 두 변수의 변하는 정도를 선형적으로 파악한 것이라면, 상관계수는 이러한 공분산을 -1~1 사이의 크기로 변환한 것이다. 

 

 

 

 

 

관계수가 1에 가까울수록 ‘양의 상관’으로, x값이 늘어나면 y값도 늘어나는 관계이다. 

반면 -1에 가까울수록 ‘음의 상관’으로, x값이 늘어나면 y값은 줄어드는 관계이다. 

 

여기서 상관계수가 0이 되면 선형 관계가 뚜렷하게 없음을 의미한다.

 

 

 

 

산점도를 그려서 선형 관계가 보이지 않거나 이상값이 많은 (튀는 값이 많은) 경우에는 상관분석이 적절하지 않다.

 

'수학 > 기초 이산 수학' 카테고리의 다른 글

6-3 . 분산 분석  (0) 2022.10.20
6-2 . 분산 분석  (0) 2022.10.20
5-7 . 가설 검정의 오류  (0) 2022.10.20
5-6 . 통계 검정 방법  (0) 2022.10.20
5-5 . 가설 검정  (0) 2022.10.20