Data Analysis

통계

[통계] 상관분석 (Correlation Analysis)

Holy_Water 2022. 11. 8. 14:40

상관분석

 

상관분석이란?

변인 간의 관련성을 경험적으로 분석하는 것

변인 간의 상호 관련성의 정도를 밝혀 보려는 것

두 변인 간의 선형적인 관계를 알아보는 것 : 정적 상관 / 부적 상관

상관분석 그래프 종류

상관분석의 목적

변인 간의 관계를 규명함으로써 주위 현상을 이해하고 해석함.

상관분석의 결과를 인과관계 확인을 위한 실험연구의 가설로 사용할 수 있음.

두 변인 사이에 충분한 관계가 있을 때 한 변인의 측정치에서 다른 변인의 측정치를 예측함.

 

상관관계 분석 수행 시, 회귀분석에서 변수 간의 인과관계를 분석하기 전에 변수 간의 관련성을 분석하는 선행자료 (가설검정 전 수행) 로 이용

변수 간의 관련성을 위해 상관계수인 피어슨(Pearson) r 계수를 이용하여 관련성 유무와 정도를 파악

단순상관분석

두 변인(준거변인, 예언 변인) 사이의 상관관계를 알아보는 것

산포도 / 공변량 / 적률상관계수 / 결정계수 / 이관계수

 

(1) 공변량(공분산)

두 변인 X Y가 함께 평균 와 로부터 얼마나 퍼져 있는가를 나타냄

정적 상관 이면 +, 부적 상관이면

두 변인 간의 선형관계의 방향을 파악할 수 있음

 

(2) 적률상관계수(Person r)

두 변인 모두 연속 변인 (등간/비율 척도) 일 때, 선형성을 가정할 수 있을 때 사용

 r = X Y의 교적의 평균

-1.0 ≤ r ≤ 1.0 의 값으로 표준화된 지수

 

특수상관계수

척도치가 서열변인과 서열변인인 경우 : Spearman의 등위상관계수

척도치가 명명변인과 등간변인인 경우 : 양류상관계수, 양분상관계수

척도치가 명명변인과 명명변인인 경우 : Phi(ø)계수

 

(1) 실험 의 등위상관계수 (rs ) ü

두 변인 모두가 서열 척도 또는 연속 변인을 서열 변인으로 변환 한 경우

두 변인에 등위를 각각 부여하고 등위차를 이용하여 상관계수를 계산

같은 등위가 있을 경우, 등위의 값을 평균하여 사용

극단적 분포일 때도 사용

 

(2) 양류상관계수 (rpb)

이분변인인 명명척도와 등간/비율척도로 측정된 연속변인 간의 상관 정도를 추정할 때 사용

 

(3) 양분상관계수 (rb )

한 변인이 연속변인이지만 이분변인으로 간주하고, 나머지 변인은 연속 변인일 때

입학시험의 결과를 합격자/불합격자로 구분하는 경우