R-Blogger블로그·해설한국어2025-10-22
gssrdoc 업데이트
gssr과 gssrdoc 패키지 소개 정기 독자들은 이미 gssr과 gssrdoc, 두 R 패키지를 유지하고 있다는 사실을 알고 계실 겁니다. gssr은 General Social Survey(GSS)의 연간, 누적, 패널 데이터를 R에서 쉽게 활용할 수 있도록 제공하며, gssrdoc은 GSS의 코드북을 R의 integrated help system에 함수나 객체처럼 문서화하여, R 콘솔이나 IDE에서 ? 명령으로 동일하게 조회할 수 있도록 해 줍니다. pkgdown과 부가 기능 pkgdown을 활용해 패키지를 문서화함으로써 부수적으로 웹사이트를 얻을 수 있습니다. gssrdoc의 경우, 모든 GSS 변수를 탐색할 수 있는 인덱스 페이지가 제공됩니다. GSS 데이터 배경 GSS는 미국 사회 과학의 허블 우주 망원경과 같은 역할을 하며, 미국 가구의 특성 및 의견을 가장 오래 지속적으로 대표적으로 반영한 데이터입니다. 데이터는 NORC에서 무료로 제공되지만, SPSS, SAS, STATA 형식으로 배포됩니다. 이러한 형식을 R에서 보다 쉽게 활용하기 위해 패키지를 개발했습니다. 가치와 무료 공개 중요한 점은 R은 무료 및 오픈소스 프로젝트이며, 다른 플랫폼은 그렇지 않다는 사실입니다. 이번 주에는 gssrdoc의 도움말 페이지를 정리하고 몇 가지 개선을 진행했습니다. gss_doc 객체 사용 예시 library(tibble) library(gssrdoc) gss_doc # A tibble: 6,694 × 10 # variable description question value_labels var_yrtab yrballot_df module_df subject_df norc_id norc_url # <chr> <chr> <chr> <chr> <list> <list> <list> <list> <chr> <chr> # 1 year GSS year "GSS year" "[NA(d)] do… 1 https:/… … # … 6,684 more rows gss_doc 객체는 일반 컬럼 외에 여러 list-column을 포함합니다. 이는 데이터 프레임 내부에 데이터 프레임을 삽입하는 개념이며, tibble 형태로 표시됩니다. 리스트와 데이터 프레임 리스트는 서로 다른 길이와 타입의 요소를 저장할 수 있어, 데이터를 구조화할 때 유용합니다. 예를 들어 다음과 같은 리스트가 있을 수 있습니다. $todo_home [1] "Laundry" "Clean bathroom" "Feed cat" "Bring out rubbish bins" $important_dates [1] "1776-07-04" "1788-06-21" "2025-01-18" $keycode [1] 8675309 $storage_tiers [1] 128 256 512 1024 이 리스트를 표로 변환하면 의미가 없으며, 대신 중첩 리스트를 사용하면 더 복잡한 구조를 표현할 수 있습니다. R과 데이터프레임 R은 LISP/스킴 스타일의 리스트 처리 언어이며, APL과 같은 고전 배열 언어의 기능을 결합한 언어입니다. 데이터 분석에서는 행이 케이스(개체), 열이 변수(특성)를 나타내는 직사각형 테이블이 주요 구조입니다. 데이터 프레임은 같은 길이의 벡터를 열로 가지는 리스트이며, 행이 같은 인덱스를 공유합니다. gss_doc 객체와 문서화 gss_doc에는 yr_yrtab, yrballot_df 같은 리스트 컬럼이 포함되어 있으며, 각 질문에 대한 연도별 교차표와 질문이 포함된 설문 부문 정보를 담고 있습니다. 이를 활용해 수천 페이지의 문서를 생성하고, 웹사이트에서는 “See Also” 섹션으로 교차 참조를 제공합니다. GSS Data Explorer와의 연계 각 gssrdoc 도움말 페이지는 해당 변수의 GSS Data Explorer 페이지로 연결됩니다. Data Explorer는 특정 추세를 빠르게 확인하고 시각화하거나 변수 내용을 요약하는 데 유용합니다. gssrdoc은 Data Explorer를 대체할 목적으로 만들어진 것이 아니라, 다른 관점에서 정보를 제공하기 위한 보조 도구입니다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- R-Blogger
- 출처
- R-Blogger
- 플랫폼
- R-Blogger
- 분류
- 블로그·해설
- 언어
- 한국어
- 발행일
- 2025-10-22