PMML과 오픈소스 데이터 마이닝

R-Blogger · 블로그·해설 · 2009-11-17

R-Blogger블로그·해설한국어2009-11-17

PMML과 오픈소스 데이터 마이닝

PMML과 오픈 소스 데이터 마이닝오픈 소스 도구는 비용 효율적이면서도 강력한 데이터 마이닝 옵션을 제공합니다. 아래의 도구들은 PMML(통합 모델 표현 언어) 표준을 준수하여 오픈 소스와 상용 벤더 간 모델 교환을 용이하게 하고, 예측 모델을 생산 환경에 배포하는 확실한 경로를 제시합니다.R 프로젝트통계 컴퓨팅을 위한 R 프로젝트는 오픈 소스 및 커뮤니티 컴퓨팅 프로젝트의 지지자들 사이에서 가장 많이 사용되고 존경받는 통계 패키지입니다. CRAN(Comprehensive R Archive Network)에서는 필요한 패키지를 거의 무제한으로 찾아볼 수 있습니다. 여기서 R PMML패키지를 찾을 수 있습니다. 이 패키지는 의사결정 트리, 신경망 등 다양한 모델의 PMML 내보내기를 지원합니다. 최근 저자는 Graham Williams와 공동으로 기사를 발표했으며, 그 기사는 The R Journal웹사이트에서 직접 다운로드할 수 있습니다. 패키지에 대한 코드를 기여하고자 하시는 분은 저희에게 연락하시기 바랍니다.KNIMEKonstanz 대학교에서 개발한 KNIME은 사용자가 시각적으로 데이터 흐름을 만들고 실행할 수 있도록 지원하는 오픈 소스 플랫폼입니다. 2008년 12월에 공개된 KNIME 2.0 이후로 사용자는 PMML 모델을 KNIME으로 가져오고 내보낼 수 있습니다. KNIME 내에서 R을 사용할 수 있기 때문에 R PMML패키지를 활용해 R 모델을 PMML로 변환하고 내보내는 것도 가능합니다. 향후 KNIME 버전은 PMML 지원을 더욱 확장할 것으로 예상됩니다.WekaWaikato 대학교에서 개발한 Weka는 데이터 마이닝 문제를 해결하기 위한 방대한 기계 학습 알고리즘 모음을 제공합니다. 현재 Weka에는 PMML 내보내기 기능이 없지만, Mark Hall이 PMML 가져오기 기능을 구현 중입니다. Weka는 이미 회귀, 의사결정 트리, 신경망과 같은 모델을 가져올 수 있으며, 변환 및 내장 함수 추가와 함께 PMML 지원이 지속적으로 확대되고 있습니다.RapidMiner최근 Rapid-I는 최신 RapidMiner 소프트웨어 버전에서 PMML 지원을 추가할 계획을 발표했습니다. 이전 명칭 YALE이었던 RapidMiner는 모든 데이터 마이닝 측면에 대한 연산자를 제공하는 오픈 소스 플랫폼입니다. KNIME과 마찬가지로 Rapid-I는 IBM, MicroStrategy, SPSS, SAS, Zementis와 같은 기업과 함께 Data Mining Group(DMG)의 최신 기업 중 하나입니다. DMG는 이미 PMML에 대한 기능을 개선하고 강화하는 작업을 진행 중입니다.PMML 토론 포럼PMML에 대한 지속적인 토론과 최신 소식을 보시려면 LinkedIn의 PMML 그룹 또는 Analytic Bridge의 PMML 토론 포럼에 참여하시기 바랍니다. PMML 리소스, 예제 및 유용한 자료는 Zementis 웹사이트의 PMML 페이지에서 확인하실 수 있습니다.
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
원문에서 전체 글 읽기
작성자
R-Blogger
출처
R-Blogger
플랫폼
R-Blogger
분류
블로그·해설
언어
한국어
발행일
2009-11-17