Data Analysis

R 34

[R] 로지스틱 회귀분석관련 실습

핵심 함수 glm() 로지스틱 회귀모델 생성 함수 predict() 로지스틱 회귀모델 예측치 생성 함수 ifelse() - (조건,참,거짓) 특정 조건을 통해서 간단히 전처리할 수 있는 함수 - 조건을 제시하고 해당할 때의 반환값, 해당하지 않을 떄의 반환값을 순서대로 한줄로 구현 가능한 장점이 있음 prediction() predict( )는 일반 함수Generic Function로 여러 가지 방식으로 모델을 만들었을 때 해당 모델로부터 새로운 데이터에 대한 예측값을 구하는 데 사용할 수 있다 performance() prediction 객체를 performance( ) 함수에 넘겨 해당 값을 구하는 함수 plot() ROC커브를 그리는 함수 실습 (날씨 관련 요인 변수로 비(rain) 유무 예측) i..

[R] 변수선택 관련 간단한 실습

핵심 함수 lm() 회귀분석 함수 step() 변수선택 방식을 선택하고 적용하는 함수 (forward, backward, both 총 3개가 있음) summary() 결과값을 나타내는 함수 formula() 제거법 적용 후 남은 값들을 나타내는 함수 실습1 사전준비 install.packages("mlbench") #패키지 설치 library(mlbench) #'mlbench' 라이브러리 실행하여 BodstonHousing 데이터 사용 data("BostonHousing") #데이터 생성 head(BostonHousing) #데이터 확인 전진선택법 (Forward Selection) 활용해보기 ss

[R] 요인분석 연습문제 (+시각화)

핵심함수 spss.system.file: sav파일을 불러올 수 있는 함수 factanal(): 요인 분석 함수의 줄인말로써 요인 분석에서 해석이 어려운 어느 한 요인을 높게 나타나도록 하기 위하여 요인 축을 회전하는 방법 plot(): 기본적으로 plot() 함수는 산점도(scatter plot)를 그리는 함수지만 산점도뿐만 아니라 일반적으로 객체를 시각화하는데 모두 사용할 수 있는 일반적인 함수. cor(): cor()함수는 상관계수를 구하는 함수이다 문제1: 다음은 drinking,water_example.sav 파일의 데이터셋이 구성된 테이블이다. 전체 2 개의 요인에 의해서 7 개의 변수로 구성되어 있다. 아래에서 제시된 각 단계에 맞게 요인 분석을 수행하시오. 단계 1 : 데이터파일 가져오기 ..

[R] 회귀분석 연습문제

핵심함수 정리 lm(): lm( )함수는linear regression의 핵심으로,회귀분석,단일 계층 분석,공분산 분석에 이용할 수 있다. (여기서는 회귀분석용도로 활용하였다.) summary(): - 수치형 변수는 최소값, 제1사분위수(Q1), 중앙값, 평균, 제3사분위수(Q3), 최대값, NA 개수를 보여준다. - 범주형 변수는 table()과 유사한 형식을 보여준다. - 단순 요약 외에도 분산분석, 회귀분석 등 통계모형 피팅 결과를 보여줄 때도 흔히 사용한다. predict(): lm(), glm()과 같은 명령문으로 얻어낸 회귀선으로 주어진 x값에 해당하는 새로운 y값을 predict하는 command cor(): cor()함수는 상관계수를 구하는 함수이다 문제: 1. product.csv 파일의..