R-Blogger블로그·해설한국어2009-07-18
불규칙 데이터에서 통계 계산 (R: plyr & reshape 패키지)
열악한 형식의 데이터에서 통계 계산하기 (R용 plyr 및 reshape 패키지 활용)최근 저는 데이터 집합의 선형 모델 계수를 검증하도록 요청받았습니다. 입력 파일의 각 행은 “site”를 나타내고 각 열은 시간에 따른 종속 변수를 담고 있습니다 (예: 열 1은 시간 단계 1, 열 2는 시간 단계 2 등). 이러한 형식은 R의 lm()함수에 직접 투입할 수 없으므로 다소 불편합니다.또한, 각 site(행)에 대해 기울기, 절편 및 R‑제곱 값을 포함하는 열로 출력이 포맷되어야 했습니다. 기본적인 R 함수만으로 재구성 및 모델 적합을 수작업으로 수행할 수 있으나, 이번 작업은 R의 reshape와 plyr패키지를 활용한 사례 연구가 될 수 있었습니다.reshape패키지는 “wide” 형식과 “long” 형식 간 변환에 사용됩니다. 본 예시에서 첫 번째 단계는 이 변환입니다. plyr패키지는 데이터 세트를 그룹화 요인에 따라 서브셋으로 나누고, 서브셋에 임의 함수를 적용한 뒤 여러 형식으로 결합 결과를 반환할 수 있습니다.아래에는 원본 입력 데이터, 원하는 출력 형식 및 사용된 R 코드를 나열합니다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- R-Blogger
- 출처
- R-Blogger
- 플랫폼
- R-Blogger
- 분류
- 블로그·해설
- 언어
- 한국어
- 발행일
- 2009-07-18