728x90
반응형
Logistic Regression은 Linear Regression과 다르게 0,1 과같이 범주형 결과를 예측하는데 사용된다.
Y는 발생확률을 의미하며 그 식은 다음과 같이 표현 할 수 있다.
R을 이용한 Logistic Regression
# Logistic regression
model_lr = glm(new_gender ~., data = train_data, family = "binomial")
out_lr = predict(model_lr, test_data)
2클래스 문제를 풀기 위해서 family를 binomal로 주었다.
+) 정규분포인 경우 gaussian, 이항분포인 경우 binomial, 포아송분포인 경우 poisson, 역정규분포인 경우 inverse.gaussian, 감마분포인 경우 gamma, 그리고 응답분포가 확실하지 않은 때를 위한 유사가능도 모형인 경우 quasi를 사용할 수 있다.
모델 신뢰도 검증
library(pROC)
plot(roc(test_data$new_gender, out_lr, direction="<"), col="red", lwd=3, main="ROC")
728x90
반응형
'Data Science' 카테고리의 다른 글
데이터사이언스 찍먹해보기 (0) | 2023.03.27 |
---|---|
데이터 전처리 (Data Cleaning) - python (0) | 2023.03.06 |
Supervised Learning - 분류하기 (0) | 2023.02.08 |
[R] kNN 사용해보기 (0) | 2018.06.06 |
댓글