사례 필터링

R-Blogger블로그·해설한국어2009-06-17

사례 필터링

데이터 분석과 시각화에서 필수적인 케이스 필터링 데이터 분석과 시각화에서 가장 중요한 작업 중 하나는 특정 케이스를 필터링하는 것입니다. 예를 들어, 두 다른 그룹을 동일하게 분석하거나 하나의 그룹과 그 하위 집합을 비교하고 싶을 때 R에서는 케이스를 단순히 걸러내는 대신에, 원하는 하위 집합을 객체로 만들고 필요할 때마다 호출할 수 있도록 지원합니다. 예시: 미국 국회 데이터 활용 Keith Poole이 개발한 2차원 절차를 사용하면, 국회의원들을 특정 포인트에 배치할 수 있습니다. 이번 예제에서는 110회 국회(2017~2019)의 민주당과 공화당 의원들을 비교해 보겠습니다. 데이터 준비 library(voteview) # voteview 데이터 프레임은 101회 이후의 모든 국회 데이터 포함 # 110회 국회에서 민주당과 공화당 의원만 별도로 객체 생성 dems110 <- subset(voteview, congress == 110 & party == "DEM") reps110 <- subset(voteview, congress == 110 & party == "REP") 시각화 plot(c(-1.5, 1.5), c(-1.5, 1.5), type = 'n', xlab = "1st dimension", ylab = "2nd dimension", col.axis = "#777777", col.lab = "#777777", cex.axis = 0.75, cex.lab = 1.25, main = "DW-nominate scores, 110th Congress", col.main = "#444444") abline(v = 0, col = "#cccccc") points(dwnom2 ~ dwnom1, data = dems110, pch = "D", col = "blue", cex = 0.75) points(dwnom2 ~ dwnom1, data = reps110, pch = "R", col = "red", cex = 0.75) 위 코드는 110회 국회에서 민주당과 공화당 의원들의 DW‑nominate 점수를 2차원 평면에 시각화한 것입니다. 좌표 축은 각각 첫 번째 차원과 두 번째 차원을 나타내며, 파란색 D는 민주당 의원, 빨간색 R은 공화당 의원을 표시합니다. 결과 해석 Figure 1. 국회의 양극화 현상을 한눈에 보여 줍니다. 양쪽 그룹이 서로 다른 축에 분포하며, 이는 두 정당 간의 이념적 차이가 크게 존재함을 시사합니다. 이후 게시물에서는 이 시각화 코드의 각 요소가 수행하는 역할을 자세히 설명하도록 하겠습니다.

원문 URL

전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.

원문에서 전체 글 읽기

작성자: R-Blogger
출처: R-Blogger
플랫폼: R-Blogger
분류: 블로그·해설
언어: 한국어
발행일: 2009-06-17