R-Blogger블로그·해설한국어2009-10-17
ORD 세션에서 R-Forge까지 RProtoBuf로 12시간 안에
ORD Sessions에서 R-Forge까지 12시간 안에 RProtoBuf를 이용한 경험어제, 시카고 지역 Google Summer of Code 멘토 Borja Sotomayor의 초대로 두 번째 ORD Sessions에 참석했습니다. 이 모임은 Inventable 본사에서 열리며, 시카고 지역의 몇몇 기술자와 오픈소스 매니아들이 업무 후 피자와 맥주를 곁들여 몇 시간 동안 코드를 논의합니다. 좋은 분위기였고, 제가 좋아하는 데이터 분석 도구인 R와 멋진 Protocol Buffers를 결합해 보는 좋은 변명이 필요했습니다.Protocol Buffers란 무엇인가요? Google 개요 페이지에 따르면, Protocol Buffers는 구조화된 데이터를 직렬화하기 위한 유연하고 효율적인 자동화 메커니즘이라고 합니다. XML과 비슷하지만 더 작고 빠르며 단순합니다. 데이터를 구조화하는 방식을 한 번 정의하면, 다양한 언어와 데이터 스트림을 통해 구조화된 데이터를 손쉽게 쓰고 읽을 수 있는 특수한 소스 코드를 자동으로 생성할 수 있습니다. 또한 기존 형식에 맞춰 컴파일된 프로그램을 깨뜨리지 않고 데이터 구조를 업데이트할 수도 있습니다. 같은 페이지에 이어서, 현재 Google 내부에서는 12,183개의 .proto 파일에 정의된 48,162개의 서로 다른 메시지 타입이 사용되고 있으며, RPC 시스템과 다양한 저장소의 영구 데이터 저장에 활용된다고 합니다.그렇게 세 시간 뒤, 저는 C++ 예제인 ‘addressbook reader’를 아주 작지만 완전한 R 패키지로 래핑하여 R CMD check를 통과시켰습니다. 데이터의 공통 언어가 또 하나의 언어와 만난 셈이었습니다.잠자리에 들기 전, 저는 R-Forge(모두가 좋아하는 R 호스팅 사이트)에 새 프로젝트를 급히 등록했고, Stefan Theussl의 끊임없는 도움과 시차 덕분에 프로젝트가 승인되어 다음 날 아침에 바로 사용할 수 있었습니다. SVN 저장소에 파일을 채워 넣자, ORD Sessions 해커페스트가 끝난 지 12시간 만에 RProtoBuf 프로젝트가 R-Forge에 올라갔습니다.앞으로 몇 일 안에 RProtoBuf에 대한 후속 작업을 진행할 예정이며, 이는 제 Rcpp R/C++ 인터페이스 패키지에도 몇 가지 변화를 가져올 수 있습니다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- R-Blogger
- 출처
- R-Blogger
- 플랫폼
- R-Blogger
- 분류
- 블로그·해설
- 언어
- 한국어
- 발행일
- 2009-10-17