Data Science

[R] Logistic Regression로 classification(분류)해보기

MOVE🔥 2018. 6. 14. 03:57
728x90
반응형

Logistic Regression은 Linear Regression과 다르게 0,1 과같이 범주형 결과를 예측하는데 사용된다.

Y는 발생확률을 의미하며 그 식은 다음과 같이 표현 할 수 있다.


R을 이용한 Logistic Regression


# Logistic regression

model_lr = glm(new_gender ~., data = train_data, family = "binomial")

out_lr = predict(model_lr, test_data)


2클래스 문제를 풀기 위해서 family를 binomal로 주었다.


+) 정규분포인 경우 gaussian, 이항분포인 경우 binomial, 포아송분포인 경우 poisson, 역정규분포인 경우 inverse.gaussian, 감마분포인 경우 gamma, 그리고 응답분포가 확실하지 않은 때를 위한 유사가능도 모형인 경우 quasi를 사용할 수 있다. 




모델 신뢰도 검증


library(pROC)

plot(roc(test_data$new_gender, out_lr, direction="<"), col="red", lwd=3, main="ROC")







728x90
반응형