공식 저널R Project한국어2025-10-21
R의 Theft 생태계를 이용한 특징 기반 시계열 분석
지금까지 과학 전반에서 시계열이 측정 및 분석되어 왔습니다. 시계열의 구조를 정량화하는 한 가지 방법은 일련의 요약 통계량, 즉 '특징(features)'을 계산한 다음, 특징 벡터로 시계열을 표현하는 것입니다. 이렇게 생성된 특징 공간은 해석 가능하고 유익하며, 클러스터링, 회귀, 분류를 포함한 기존의 통계적 학습 접근법을 시계열 데이터셋에 적용할 수 있게 합니다. Matlab, R, Python, Julia의 'catch22' (22개 특징), R의 'feasts' (43개 특징), R의 'tsfeatures' (62개 특징), Python의 'Kats' (40개 특징), Python의 'tsfresh' (783개 특징), Python의 'TSFEL' (156개 특징) 등 다양한 프로그래밍 언어에 걸쳐 시계열 특징을 계산하기 위한 여러 오픈소스 소프트웨어 패키지가 존재합니다. 하지만 이러한 패키지에 대한 단일 접속 지점이 없고, 모든 특징 집합에 접근하려면 여러 언어에 능숙해야 하며, 이러한 특징 추출 패키지들은 시계열 분류와 같은 특징 기반 시계열 분석을 위한 포괄적인 방법론 파이프라인이 부족하다는 몇 가지 문제가 있습니다. 본 연구에서는 R용으로 두 개의 보완적인 통계 소프트웨어 패키지인 'theft' (Tools for Handling Extraction of Features from Time series)와 'theftdlc' (theft 'downloadable content')를 통해 이러한 문제에 대한 해결책을 제시합니다. 'theft'는 위에서 나열된 여섯 가지 오픈소스 시계열 특징 집합과 사용자가 지정한 사용자 정의 특징을 포함한 특징을 계산하기 위한 통합되고 확장 가능한 프레임워크입니다. 'theftdlc'는 추출된 특징의 성능을 처리하고 해석하기 위한 함수 모음을 포함하는 'theft'의 확장 패키지로, 포괄적인 데이터 시각화 템플릿, 저차원 투영, 시계열 분류 등이 포함됩니다. 과학 및 산업 분야에서 대규모 시계열 데이터의 양과 복잡성이 증가함에 따라, 'theft'와 'theftdlc'는 시계열의 유익한 구조를 포괄적으로 정량화하고 해석하기 위한 표준화된 프레임워크를 제공합니다.
RR FoundationThe R Journaljournal
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- Trent Henderson, Ben D. Fulcher
- 출처
- The R Journal issues and recent articles
- 플랫폼
- R Project
- 분류
- 공식 저널
- 언어
- 한국어
- 발행일
- 2025-10-21