R-Blogger블로그·해설한국어2025-05-23
필터
필터 | R-bloggers이 페이지의 해결책을 보려면 JavaScript가 필요합니다. JavaScript를 활성화하고 페이지를 다시 로드하거나 GitHub에서 소스 파일을 다운로드한 뒤 로컬에서 코드를 실행하시기 바랍니다.목표파이프라인을 활용한 효율적인 전처리 및 모델 학습에 대해 배운 내용을 회귀 문제에 적용합니다. 미국 워싱턴 주의 킹 카운티에 있는 주택 가격을 모델링하는 것을 목표로 합니다.set.seed(124) library(mlr3verse) library(mlr3tuningspaces) data("kc_housing", package = "mlr3data")먼저 간단한 특성 전처리를 수행합니다.# 날짜를 숫자형 변수로 변환 library(anytime) dates = anytime(kc_housing$date) kc_housing$date = as.numeric(difftime(dates, min(dates), units = "days")) # 가격을 1,000으로 나누어 규모 조정 kc_housing$price = kc_housing$price / 1000 # NA가 포함된 열 삭제 yr_renovated = kc_housing$yr_renovated sqft_basement = kc_housing$sqft_basement kc_housing[,c(13, 15)] = NULL # 요인(범주형) 열 생성 kc_housing[,c(8, 14)] = lapply(c(8, 14), function(x) { as.factor(kc_housing[,x]) })데이터의 개요를 확인합니다.str(kc_housing)출력 예시:'data.frame': 21613 obs. of 18 variables: $ date : num 164 221 299 221 292 ... $ price : num 222 538 180 604 510 ... $ bedrooms : int 3 3 2 4 3 4 3 3 3 3 ... $ bathrooms : num 1 2.25 1 3 2 4.5 2.25 1.5 1 2.5 ... $ sqft_living : int 1180 2570 770 1960 1680 5420 1715 1060 1780 1890 ... $ sqft_lot : int 5650 7242 10000 5000 8080 101930 6819 9711 7470 6560 ... $ floors : num 1 2 1 1 1 1 2 1 1 2 ... $ waterfront : Factor w/ 2 levels "FALSE","TRUE": 1 1 1 1 1 1 1 1 1 1 ... $ view : int 0 0 0 0 0 0 0 0 0 0 ... $ condition : int 3 3 3 5 3 3 3 3 3 3 ... $ grade : int 7 7 6 7 8 11 7 7 7 7 ... $ sqft_above : int 1180 2170 770 1050 1680 3890 1715 1060 1050 1890 ... $ yr_built : int 1955 1951 1933 1965 1987 2001 1995 1963 1960 2003 ... $ zipcode : Factor w/ 70 levels "98001","98002",..: 67 56 17 59 38 30 3 69 61 24 ... $ lat : num 47.5 47.7 47.7 47.5 47.6 ... $ long : num -122 -122 -122 -122 -122 ... $ sqft_living15: int 1340 1690 2720 1360 1800 4760 2238 1650 1780 2390 ... $ sqft_lot15 : int 5650 7639 8062 5000 7503 101930 6819 9711 8113 7570 ... - attr(*, "index")= int(0)데이터에 무상관 특성 추가이 연습에서는 결과 변수(가격)와 대부분 무상관인 두 개의 인위적 특성을 생성합니다.# 무상관 특성 x1 kc_housing$x1
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- R-Blogger
- 출처
- R-Blogger
- 플랫폼
- R-Blogger
- 분류
- 블로그·해설
- 언어
- 한국어
- 발행일
- 2025-05-23