분산분석: ANOVA, 다중 비교

R-Blogger · 블로그·해설 · 2009-07-17

R-Blogger블로그·해설한국어2009-07-17

분산분석: ANOVA, 다중 비교

분산분석(ANOVA) 및 다중비교 ANOVA 모델은 가우시안 분포를 따르는 가정 하에, 여러 집단의 평균을 서로 비교할 수 있는 정규분포 기반 방법입니다. 아래 예시를 통해 구체적으로 살펴보겠습니다. 예시: 슈퍼마켓 체인 매장 전력소비 비교 슈퍼마켓 체인 매장 관리자는 4개의 매장에서 월별 전력소비(kWh)가 동일한지를 확인하려고 합니다. 6개월 동안 매월 마지막 날 데이터를 수집한 결과는 다음과 같습니다. 매장 A: 65, 48, 66, 75, 70, 55 매장 B: 64, 44, 70, 70, 68, 59 매장 C: 60, 50, 65, 69, 69, 57 매장 D: 62, 46, 68, 72, 67, 56 ANOVA 검정을 진행하기 전에, 등분산성을 검정해야 합니다. R에서는 Bartlett 검정과 Fligner–Killeen 검정을 제공합니다. 1. Bartlett 검정 a = c(65, 48, 66, 75, 70, 55) b = c(64, 44, 70, 70, 68, 59) c = c(60, 50, 65, 69, 69, 57) d = c(62, 46, 68, 72, 67, 56) dati = c(a, b, c, d) groups = factor(rep(letters[1:4], each = 6)) bartlett.test(dati, groups) 결과: Bartlett test of homogeneity of variancesdata: dati and groupsBartlett's K-squared = 0.4822, df = 3, p-value = 0.9228 p-value가 0.05보다 크므로, 등분산 가설 H0를 채택합니다. 또한, qchisq(0.950, 3)를 이용해 χ²표를 비교하면 7.81보다 작으므로 동일 결론을 얻습니다. 2. Fligner–Killeen 검정 fligner.test(dati, groups) 결과: Fligner-Killeen test of homogeneity of variancesdata: dati and groupsFligner-Killeen:med chi-squared = 0.1316, df = 3, p-value = 0.9878 Bartlett 검정과 동일하게 등분산 가설을 채택합니다. 3. ANOVA 모델 수행 fit = lm(formula = dati ~ groups) anova(fit) 분산분석 테이블: Analysis of Variance Table Response: dati Df | Sum Sq | Mean Sq | F value | Pr(F) groups | 3 | 8.46 | 2.82 | 0.0327 | 0.9918 Residuals | 20 | 1726.50 | 86.33 p-value가 0.05보다 크므로, 네 개의 평균이 통계적으로 동일하다는 H0를 채택합니다. 또한 qf(0.950, 20, 3) 값 8.66보다 작은 계산된 F값을 확인해 동일 결론을 확인합니다. 요약 등분산성이 확인된 경우, ANOVA를 통해 그룹 간 평균 차이가 통계적으로 유의미한지를 판단할 수 있습니다. 본 예시에서는 전력소비가 네 매장 간에 유의미한 차이가 없음을 확인했습니다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
원문에서 전체 글 읽기
작성자
R-Blogger
출처
R-Blogger
플랫폼
R-Blogger
분류
블로그·해설
언어
한국어
발행일
2009-07-17