Intercept(절편) 지정 금지

R-Blogger · 블로그·해설 · 2009-06-17

R-Blogger블로그·해설한국어2009-06-17

Intercept(절편) 지정 금지

influence.ME 활용 사례: 반복적으로 데이터 삭제 후 모델 추정 최근 한 연구자에게 연락을 받았습니다. 그 연구자는 influence.ME 패키지를 사용하여 모델 추정치를 얻고, 이후 반복적으로 일부 데이터를 삭제하고자 하였습니다. 해당 사례에서 관측치는 지역 내에 중첩되어 있었으나, 각 지역별 관측치 수가 매우 불균형했습니다. 이러한 상황에서는 표본 수가 작은 단위(예: 지역)가 모델에 미치는 영향이 과대 평가될 위험이 있습니다. influence.ME는 군집(Cluster) 단위의 influence를 추정해 주므로, 불균형한 데이터 구조에서도 보다 정확한 민감도 분석을 수행할 수 있습니다. 기술적으로는 lm.influence 혹은 glm.influence 함수를 활용하여 군집 단위의 Cook’s distance, DFBETAs 등을 구합니다. 이후 drop 혹은 subset 인자를 활용해 반복적으로 관측치를 제거하면서 모델을 재추정합니다. 추가적으로, influence.ME는 R의 lme4 패키지와 원활히 통합됩니다. 예시 코드는 다음과 같습니다. library(influence.ME) model <- lmer(response ~ predictors + (1 | area), data = df) inf <- lm.influence(model, by = "area") summary(inf) 위 예시처럼 by = "area" 인자를 지정하면, 각 지역별로 influence 값을 계산해 줍니다. 이 값을 바탕으로 어느 지역이 모델에 과도하게 영향을 주는지를 판단할 수 있습니다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
원문에서 전체 글 읽기
작성자
R-Blogger
출처
R-Blogger
플랫폼
R-Blogger
분류
블로그·해설
언어
한국어
발행일
2009-06-17