Data Science
[R] Logistic Regression로 classification(분류)해보기
MOVE🔥
2018. 6. 14. 03:57
728x90
반응형
Logistic Regression은 Linear Regression과 다르게 0,1 과같이 범주형 결과를 예측하는데 사용된다.
Y는 발생확률을 의미하며 그 식은 다음과 같이 표현 할 수 있다.
R을 이용한 Logistic Regression
# Logistic regression
model_lr = glm(new_gender ~., data = train_data, family = "binomial")
out_lr = predict(model_lr, test_data)
2클래스 문제를 풀기 위해서 family를 binomal로 주었다.
+) 정규분포인 경우 gaussian, 이항분포인 경우 binomial, 포아송분포인 경우 poisson, 역정규분포인 경우 inverse.gaussian, 감마분포인 경우 gamma, 그리고 응답분포가 확실하지 않은 때를 위한 유사가능도 모형인 경우 quasi를 사용할 수 있다.
모델 신뢰도 검증
library(pROC)
plot(roc(test_data$new_gender, out_lr, direction="<"), col="red", lwd=3, main="ROC")
728x90
반응형