R-Blogger블로그·해설한국어2025-03-22
R을 이용해 임의 크기의 CSV를 Parquet로 변환
거대한 CSV를 Parquet으로 변환하는 방법: R에서 바로 실행하기 대용량 CSV 파일을 Parquet 포맷으로 변환하면 저장 공간 절약과 읽기/쓰기 속도 향상에 큰 도움이 됩니다. 이번 포스트에서는 R을 활용해 손쉽게 변환하는 과정을 소개합니다. 필요 패키지 설치 install.packages(c("arrow", "readr")) CSV 파일 읽어오기 library(readr) library(arrow) df Parquet 파일로 저장 write_parquet(df, "big_dataset.parquet") 위 단계를 따라 하면 수십 GB의 CSV도 몇 분 안에 Parquet 파일로 변환할 수 있습니다. arrow 패키지 공식 문서를 참고해 추가 옵션을 활용해 보세요.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- R-Blogger
- 출처
- R-Blogger
- 플랫폼
- R-Blogger
- 분류
- 블로그·해설
- 언어
- 한국어
- 발행일
- 2025-03-22