Data Analysis

통계

[통계] 요인분석 (Factor Analysis)

Holy_Water 2022. 11. 4. 11:22

요인분석

- 변수들의 상관성을 바탕으로 변수를 정제하여 상관관계 분석이나 회귀분석에서 설명변수(독립변수)로 사용된다

- 다수의 변수를 대상으로 변수 간의 관계를 분석하여 공통 차원으로 축약하는 통계기법

 

1) 탐색적 요인분석: 요인 분석을 할 때 사전에 어떤 변수들끼리 묶어야 한다는 전제를 두지 않고 분석하는 방법

2) 확인적 요인 분석: 사전에 묶일 것으로 기대되는 항목끼리 묶였는지를 조사하는 방법

 

 

요인분석을 위한 전제조건

1. 하위요인으로 구성되는 데이터 셋이 준비되어 있어야 한다.

2. 분석에 사용되는 변수는 등간척도나 비율척도여야 하며, 표본의 크기는 최소 50개 이상이 바람직하다.

3. 요인 분석은 상관관계가 높은 변수들끼리 그룹화하는 것이므로 변수 간의 상관관계가 매우 낮다면(보통 ±3이하), 그 자료는 요인 분석에 적합하지 않다.

 

 

요인분석을 수행하는 목적

1. 자료의 요약: 변인을 몇 개의 공통된 변인으로 묶음

2. 변인 구조 파악: 변인들의 상호관계 파악(독립성 등)

3. 불필요한 변인 제거: 중요도가 떨어진 변수 제거

4. 측정 도구의 타당성 검증: 변인들이 동일한 요인으로 묶이는 지를 확인

 

 

요인 분석 결과에 대한 활용방안

1. 타당성 검정: 측정도구가 정확히 측정했는지를 알아보기 위하여 측정변수들이 동일한 요인으로 묶이는지를 검정

2. 변수 축소: 변수들의 상관관계가 높은 것끼리 묶어서 변수를 정제

3. 변수 제거: 변수의 중요도를 나타내는 요인적재량이 0.4미만이면 설명력이 부족한 요인으로 판단하여 제거

4. 활용: 요인 분석에서 얻어지는 결과를 이용하여 상관분석이나 회귀분석의 설명변수로 활용

 

 

요인분석을 활용한 예시

위의 9개의 항목으로 구성된 설문지는 대상자의 몇 가지 측면을 평가하고 있다고 생각되는가?
실제로 자아평가 질문에서는 비슷한 내용의 질문을 여러가지로 평가한다.

위의 설문지를 10명의 사람들로 부터 받은 후 엑셀 or SPSS 등에 입력했다고 하자.
위의 데이터는 9개의 변수로 구성된 데이터라고 볼 수 있다. 각 변수는 1에서 5의 값을 갖는다.

그럼 이 데이터를 요인분석을 수행해보자.
아래와 같은 형식으로 요인분석 결과를 도출할 수 있다.

즉, 원래 9개의 평가항목은 3개의 잠재 요인으로 파악될 수 있다. 물론 여기서 요인명은 자동적으로 추출된 것은 아니고 이해를 위해여 직접 정한 것이다.
요인분석을 통하여 9개의 변수를 3개의 변수로 요약하는 효과를 나타내었다.

원래 9개의 항목이였던 자료를 요인분석을 통해 3개의 변수로 요약하면 위와 같은 결과를 얻을 수 있다