R을 이용해 임의 크기의 CSV를 Parquet로 변환

R-Blogger · 블로그·해설 · 2025-03-22

R-Blogger블로그·해설한국어2025-03-22

R을 이용해 임의 크기의 CSV를 Parquet로 변환

거대한 CSV를 Parquet으로 변환하는 방법: R에서 바로 실행하기 대용량 CSV 파일을 Parquet 포맷으로 변환하면 저장 공간 절약과 읽기/쓰기 속도 향상에 큰 도움이 됩니다. 이번 포스트에서는 R을 활용해 손쉽게 변환하는 과정을 소개합니다. 필요 패키지 설치 install.packages(c("arrow", "readr")) CSV 파일 읽어오기 library(readr) library(arrow) df Parquet 파일로 저장 write_parquet(df, "big_dataset.parquet") 위 단계를 따라 하면 수십 GB의 CSV도 몇 분 안에 Parquet 파일로 변환할 수 있습니다. arrow 패키지 공식 문서를 참고해 추가 옵션을 활용해 보세요.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
원문에서 전체 글 읽기
작성자
R-Blogger
출처
R-Blogger
플랫폼
R-Blogger
분류
블로그·해설
언어
한국어
발행일
2025-03-22