웹사이트 트렌드 분석: Google Analytics 데이터 활용

R-Blogger · 블로그·해설 · 2009-08-18

R-Blogger블로그·해설한국어2009-08-18

웹사이트 트렌드 분석: Google Analytics 데이터 활용

서론 이 글은 이전에 발표한 Cox-Stuart 테스트를 활용한 트렌드 분석과 단순 선형 회귀분석에 대한 두 게시물의 요약본이다. 제안하는 목표는 장기간에 걸친 사이트 방문자 수의 추세를 평가하는 것이다. Google Analytics를 사용한다. 이 도구는 다양한 보고서를 Excel CSV 형식으로 저장할 수 있기 때문이다. 단계별로 보고서를 저장하는 방법, Excel에서 R로 데이터를 가져오는 방법, 마지막으로 일일 방문자 수가 증가 추세인지 감소 추세인지 추정하는 방법을 살펴보자. Google Analytics에서 ad hoc 보고서 만들기 로그인 후 분석하려는 날짜 범위를 선택한다. 그 다음 Visits를 클릭한다. 이 시점에서 보고서를 저장하려면 Export를 클릭한 뒤 CSV for Excel을 선택한다. CSV 파일을 저장하고 Excel로 엽니다. Excel에서 다음과 같은 모습이 보인다. Excel에서 R로 데이터 가져오기 데이터를 R에 가져오는 과정은 매우 간단하다. 관심 있는 열(예: Visits)을 선택하고 CTRL + C로 클립보드에 복사한다. (Visits 셀을 꼭 선택해야 한다. 이후에 사용한다.) 그 다음 R을 열고 다음 명령어를 입력한다. myvisit myvisit Visits1 332 413 344 455 466 377 318 379 3410 3411 4812 3913 33... 위는 하나의 열 데이터프레임이며, 열 이름은 Visits이다. 따라서 Excel에서 헤더를 선택해 두는 것이 중요하다. Cox-Stuart 테스트 수행 Cox-Stuart 테스트를 수행하는 함수는 다음과 같다. 먼저 데이터프레임을 함수 cox.stuart.test가 읽을 수 있는 형식으로 변환한다. visits 이제 Cox-Stuart 테스트를 실행한다. cox.stuart.test(visits) Cox-Stuart test for trend analysis data: visits Increasing trend, p-value = 0.0012 결과가 명확하다. 방문자 수에 대한 증가 추세가 검정에서 유의미하게 나타났다 (p-value < 0.05). 단순 선형 회귀분석 추세가 증가인지 감소인지 확인하려면 회귀선의 기울기를 살펴본다. 먼저 일자를 벡터로 만든다. days 프로그램으로 산점도를 그리고 회귀선을 추가한다. plot(days, visits, type="b") 이 그래프만으로는 추세를 직관적으로 파악하기 어렵다. 회귀분석을 진행한다. fit Call: lm(formula = visits ~ days) Residuals: Min 1Q Median 3Q Max -22.714 -6.197 -1.313 5.648 31.153 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 31.79694 2.27151 13.998 < 2e-16 *** days 0.19815 0.04242 4.671 1.04e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 10.81 on 90 degrees of freedom Multiple R-squared: 0.1951, Adjusted R-squared: 0.1862 F-statistic: 21.82 on 1 and 90 DF, p-value: 1.043e-05 회귀선의 기울기(비계수)는 0.19815로 양수이며, 이는 증가 추세를 의미한다. t‑검정에서 기울기와 그에 대한 p‑값이 유의미하므로 증가 추세가 통계적으로 유의함을 확인할 수 있다. 마지막으로 회귀선을 그래프에 직접 그려본다. plot(days, visits, type="b") abline(fit, col="red", lwd=3) 그래프를 보면, Cox-Stuart 테스트와 일치하여 증가 추세가 명확히 보인다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
원문에서 전체 글 읽기
작성자
R-Blogger
출처
R-Blogger
플랫폼
R-Blogger
분류
블로그·해설
언어
한국어
발행일
2009-08-18