상관분석
상관분석이란?
변인 간의 관련성을 경험적으로 분석하는 것
변인 간의 상호 관련성의 정도를 밝혀 보려는 것
두 변인 간의 선형적인 관계를 알아보는 것 : 정적 상관 / 부적 상관
상관분석의 목적
변인 간의 관계를 규명함으로써 주위 현상을 이해하고 해석함.
상관분석의 결과를 인과관계 확인을 위한 실험연구의 가설로 사용할 수 있음.
두 변인 사이에 충분한 관계가 있을 때 한 변인의 측정치에서 다른 변인의 측정치를 예측함.
상관관계 분석 수행 시, 회귀분석에서 변수 간의 인과관계를 분석하기 전에 변수 간의 관련성을 분석하는 선행자료 (가설검정 전 수행) 로 이용
변수 간의 관련성을 위해 상관계수인 피어슨(Pearson) r 계수를 이용하여 관련성 유무와 정도를 파악
단순상관분석
두 변인(준거변인, 예언 변인) 사이의 상관관계를 알아보는 것
산포도 / 공변량 / 적률상관계수 / 결정계수 / 이관계수
(1) 공변량(공분산)
두 변인 X와 Y가 함께 평균 와 로부터 얼마나 퍼져 있는가를 나타냄
정적 상관 이면 +, 부적 상관이면 –
두 변인 간의 선형관계의 방향을 파악할 수 있음
(2) 적률상관계수(Person의 r)
두 변인 모두 연속 변인 (등간/비율 척도) 일 때, 선형성을 가정할 수 있을 때 사용
r = X와 Y의 교적의 평균
-1.0 ≤ r ≤ 1.0 의 값으로 표준화된 지수
특수상관계수
척도치가 서열변인과 서열변인인 경우 : Spearman의 등위상관계수
척도치가 명명변인과 등간변인인 경우 : 양류상관계수, 양분상관계수
척도치가 명명변인과 명명변인인 경우 : Phi(ø)계수
(1) 실험 의 등위상관계수 (rs ) ü
두 변인 모두가 서열 척도 또는 연속 변인을 서열 변인으로 변환 한 경우
두 변인에 등위를 각각 부여하고 등위차를 이용하여 상관계수를 계산
같은 등위가 있을 경우, 등위의 값을 평균하여 사용
극단적 분포일 때도 사용
(2) 양류상관계수 (rpb)
이분변인인 명명척도와 등간/비율척도로 측정된 연속변인 간의 상관 정도를 추정할 때 사용
(3) 양분상관계수 (rb )
한 변인이 연속변인이지만 이분변인으로 간주하고, 나머지 변인은 연속 변인일 때
입학시험의 결과를 합격자/불합격자로 구분하는 경우
'통계' 카테고리의 다른 글
[통계] 시계열 분석 Timeseries Analysis(2) (0) | 2022.11.07 |
---|---|
[통계] 시계열 분석 Timeseries Analysis(1) (0) | 2022.11.07 |
[통계] 로지스틱 회귀분석 (Logistic Regression) (0) | 2022.11.04 |
[통계] 변수선택 (Variable Selection) (0) | 2022.11.04 |
[통계] 요인분석 (Factor Analysis) (0) | 2022.11.04 |