R-Blogger블로그·해설한국어2009-08-17
이원분산분석: R에서의 이원 ANOVA
두 요인에 대한 분산분석(2요인 ANOVA) 소개 일원분산분석은 그룹 간 평균이 같은지를 확인하는 유용한 기법이지만, 두 개 이상의 요인이 동시에 작용하는 복잡한 문제에는 한계가 있다. 예를 들어, “구역(zone)”과 “블록(block)” 두 가지 변수를 고려하여 그룹 간 평균이 요인에 따라 달라지는지를 파악하려면 2요인 분산분석(two‑way ANOVA)을 사용해야 한다. 예시 데이터: 연도와 월별 수익 다음은 5년간 월별 수익(천 달러)을 이중 배열(두 차원) 형태로 정리한 표이다. \begin{tabular}{|c||ccccc||r|} \hline Months & Year 1 & Year 2 & Year 3 & Year 4 & Year 5\\\hline January&15&18&22&23&24\\ February&22&25&15&15&14\\ March&18&22&15&19&21\\ April&23&15&14&17&18\\ May&23&15&26&18&14\\ June&12&15&11&10&8\\ July&26&12&23&15&18\\ August&19&17&15&20&10\\ September&15&14&18&19&20\\ October&14&18&10&12&23\\ November&14&22&19&17&11\\ December&21&23&11&18&14\\ \hline \end{tabular} 위 데이터를 통해 수익이 연도와 월 중 어느 요인에 의해 달라지는지, 혹은 두 요인 모두가 독립적으로 작용하는지를 검정하려 한다. R에서 2요인 ANOVA 수행하기 먼저, 표에 있는 모든 값을 행별로 나열한 벡터를 만든다. revenue = c( 15,18,22,23,24, 22,25,15,15,14, 18,22,15,19,21, 23,15,14,17,18, 23,15,26,18,14, 12,15,11,10,8, 26,12,23,15,18, 19,17,15,20,10, 15,14,18,19,20, 14,18,10,12,23, 14,22,19,17,11, 21,23,11,18,14 ) 월에 해당하는 팩터(12개의 레벨, 각 레벨마다 5회 반복)를 만든다. months = gl(12,5) 연도에 해당하는 팩터(5개의 레벨, 각 레벨마다 1회 반복)를 만든다. 이 때 전체 관측값 수를 지정한다. years = gl(5, 1, length(revenue)) 선형 모델을 적합하고 ANOVA 표를 확인한다. fit = aov(revenue ~ months + years) anova(fit) Analysis of Variance Table Response: revenue Df Sum Sq Mean Sq F value Pr(F) months 11 308.45 28.04 1.4998 0.1660 years 4 44.17 11.04 0.5906 0.6712 Residuals 44 822.63 18.70 결과 해석 월 요인의 차이의 유의성은 F = 1.4998이며, p‑값은 0.05보다 크므로 귀무가설을 채택한다. 즉, 월별 평균 수익이 서로 같으며 월 요인은 수익에 유의한 영향을 주지 않는다. 연도 요인의 차이의 유의성은 F = 0.5906이며, 역시 p‑값이 0.05보다 크므로 귀무가설을 채택한다. 따라서 연도별 평균 수익도 서로 같으며 연도 요인은 수익에 유의한 영향을 주지 않는다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- R-Blogger
- 출처
- R-Blogger
- 플랫폼
- R-Blogger
- 분류
- 블로그·해설
- 언어
- 한국어
- 발행일
- 2009-08-17