누락된 데이터, 로지스틱 회귀, 그리고 예측값 플롯(또는 두 개)

R-Blogger · 블로그·해설 · 2009-07-18

R-Blogger블로그·해설한국어2009-07-18

누락된 데이터, 로지스틱 회귀, 그리고 예측값 플롯(또는 두 개)

R에서 glm 로지스틱 회귀 모델을 활용한 데이터 분석 데이터 준비 및 모델 적합 먼저 miss 데이터를 불러오고, glm 함수를 이용해 종속 변수 a를 독립 변수 b에 대해 로지스틱 회귀 모델을 적합합니다. miss_attach miss_result1 결과1 요약 Call: glm(formula = a ~ b, family = binomial(logit)) Deviance Residuals: Min 1Q Median 3Q Max -1.8864 -1.2036 0.7397 0.9425 1.4385 Coefficients: Estimate Std. Error z value Pr(|z|) (Intercept) -5.96130 1.40609 -4.240 2.24e-05 *** b 0.10950 0.02404 4.555 5.24e-06 *** ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 279.97 on 203 degrees of freedom Residual deviance: 236.37 on 202 degrees of freedom (3 observations deleted due to missingness) AIC: 240.37 Number of Fisher Scoring iterations: 5 결과2 요약 detach(miss) attach(miss2) result2 Call: glm(formula = a ~ b, family = binomial(logit)) Deviance Residuals: Min 1Q Median 3Q Max -1.8864 -1.2036 0.7397 0.9425 1.4385 Coefficients: Estimate Std. Error z value Pr(|z|) (Intercept) -6.00590 1.41620 -4.241 2.23e-05 *** b 0.11010 0.02420 4.549 5.39e-06 *** ---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: 278.81 on 202 degrees of freedom Residual deviance: 235.14 on 201 degrees of freedom AIC: 239.14 Number of Fisher Scoring iterations: 5 시각화 예시 모델 예측값과 실제 데이터를 함께 시각화하면 추세를 한눈에 파악할 수 있습니다. plot(b, fitted(result1)) plot(b, fitted(result1), type="n") curve(invlogit(coef(result1)[1] + coef(result1)[2]*x), add=TRUE)
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
원문에서 전체 글 읽기
작성자
R-Blogger
출처
R-Blogger
플랫폼
R-Blogger
분류
블로그·해설
언어
한국어
발행일
2009-07-18