R에서 그룹화된 데이터 요약

R-Blogger블로그·해설한국어2009-07-17

R에서 그룹화된 데이터 요약

R에서 그룹화된 데이터의 기본 통계량 계산하기 동료가 최근 R에서 그룹화된 데이터에 대해 기본 요약 통계량을 계산하는 방법을 문의했습니다. 아래에 제가 제안한 몇 가지 예시를 소개합니다. 1. base R의 aggregate 함수 사용하기 # 예시 데이터 df <- data.frame( 그룹 = c('A', 'A', 'B', 'B', 'C'), 값 = c(10, 20, 15, 25, 30) ) # 평균 계산 aggregate(값 ~ 그룹, data = df, FUN = mean) # 표준편차 계산 aggregate(값 ~ 그룹, data = df, FUN = sd) 2. plyr 패키지의 ddply 함수 활용하기 # plyr 설치 및 로드 install.packages("plyr") library(plyr) # 그룹별 평균, 최소, 최대 ddply(df, .(그룹), summarise, 평균 = mean(값), 최소 = min(값), 최대 = max(값)) 위 예시들은 간단한 통계량을 그룹별로 빠르게 계산할 수 있는 방법을 보여 줍니다. 필요에 따라 더 복잡한 요약 함수나 사용자 정의 함수를 넣어 활용하시면 됩니다. 추가 자료 plyr 패키지에 대한 보다 자세한 문서는 R Documentation에서 확인하실 수 있습니다.

원문 URL

전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.

원문에서 전체 글 읽기

작성자: R-Blogger
출처: R-Blogger
플랫폼: R-Blogger
분류: 블로그·해설
언어: 한국어
발행일: 2009-07-17