본문 바로가기
Data Science

[R] Logistic Regression로 classification(분류)해보기

by MOVE🔥 2018. 6. 14.
728x90
반응형

Logistic Regression은 Linear Regression과 다르게 0,1 과같이 범주형 결과를 예측하는데 사용된다.

Y는 발생확률을 의미하며 그 식은 다음과 같이 표현 할 수 있다.


R을 이용한 Logistic Regression


# Logistic regression

model_lr = glm(new_gender ~., data = train_data, family = "binomial")

out_lr = predict(model_lr, test_data)


2클래스 문제를 풀기 위해서 family를 binomal로 주었다.


+) 정규분포인 경우 gaussian, 이항분포인 경우 binomial, 포아송분포인 경우 poisson, 역정규분포인 경우 inverse.gaussian, 감마분포인 경우 gamma, 그리고 응답분포가 확실하지 않은 때를 위한 유사가능도 모형인 경우 quasi를 사용할 수 있다. 




모델 신뢰도 검증


library(pROC)

plot(roc(test_data$new_gender, out_lr, direction="<"), col="red", lwd=3, main="ROC")







728x90
반응형

'Data Science' 카테고리의 다른 글

데이터사이언스 찍먹해보기  (0) 2023.03.27
데이터 전처리 (Data Cleaning) - python  (0) 2023.03.06
Supervised Learning - 분류하기  (0) 2023.02.08
[R] kNN 사용해보기  (0) 2018.06.06

댓글