예제 7.3: 연속형 예측변수에 대한 이분형 결과용 잡음이 있는 단순 산점도와 스무더

R-Blogger · 블로그·해설 · 2009-06-17

R-Blogger블로그·해설한국어2009-06-17

예제 7.3: 연속형 예측변수에 대한 이분형 결과용 잡음이 있는 단순 산점도와 스무더

예시 7.3: 연속 예측변수와 이분형 결과를 위한 스무더가 있는 단순 지터 스캐터플롯두 값을 가진 y 변수가 있을 때에도 스캐터플롯을 보는 것이 유용합니다. 예를 들어, 범주화가 더 타당한지 혹은 선형 가정이 더 타당한지를 판단하는 데 도움이 됩니다. 그러나 변형되지 않은 스캐터플롯은 y 값이 0 또는 1인 경우 시각적으로 구분하기 어렵기 때문에 별로 유용하지 않습니다. 이 경우 지터링(섹션 5.2.4)이 도움이 됩니다. 또한, 데이터에 스무딩 라인을 그려 놓는 것이 종종 유용합니다. 섹션 7.2에서 생성한 데이터를 사용하여 예시를 보여 드립니다.SAS 예시SAS에서는 지터를 추가한 뒤, overlay 옵션을 사용해 지터값과 관측값을 같은 플롯에 표시합니다. 지터값을 점으로 표시하고, 기호문(섹션 5.2.2, 5.2.6)으로 실제(지터가 적용되지 않은) 데이터에 스무딩 라인을 그립니다.data ds2; set test; yplot = ytest + uniform(0) * .2; run; symbol1 i = sm50s v = none c = black; symbol2 i = none v = dot c = black; proc gplot data = ds2; plot (ytest yplot) * xtest / overlay; run;이와 같은 플롯이 생성됩니다.R 예시R에서는 지터가 적용된 값과 예측 변수를 스캐터플롯으로 표시합니다(섹션 5.1.1). plot() 함수 내부에서 jitter() 함수를 호출합니다. 이후, 실제(지터가 적용되지 않은) 데이터에 기반한 스무딩 라인을 lines() 함수(섹션 5.2.1)와 lowess() 객체(섹션 5.2.6)를 사용해 추가합니다.plot(xtest, jitter(ytest)) lines(lowess(xtest, ytest))결과 플롯은 다음과 같습니다. 이 플롯들은 유용하지만 다소 보기 흉합니다. 다음 예시에서는 더 보기 좋은 플롯을 만들 것입니다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
원문에서 전체 글 읽기
작성자
R-Blogger
출처
R-Blogger
플랫폼
R-Blogger
분류
블로그·해설
언어
한국어
발행일
2009-06-17