비모수 시리얼 간격 추정

R-Blogger · 블로그·해설 · 2025-08-23

R-Blogger블로그·해설한국어2025-08-23

비모수 시리얼 간격 추정

동기부여: 역학 지연의 이해 역학 지연은 질병과 관련된 두 가지 명확한 사건 사이의 시간을 알려주는 개념입니다. 감염성 질환의 시리즈 인터벌(SI)은 원인자(감염자)의 증상 발현 시점과 피감염자(감염된 사람)의 증상 발현 시점 사이의 시간을 의미합니다. SI는 역학 지연 중 가장 널리 사용되는 지표이며, 질병 전파 모델링에 핵심적인 역할을 합니다. 감염자의 평균 감염당 발생률(재생산수)과 SI 사이에는 밀접한 관계가 존재합니다. 따라서 SI 분포에 대한 정확한 지식은 발생 기간 중 전파 역학을 명확히 이해하는 데 필수적입니다. SI 데이터와 관측의 어려움 감염자–피감염자 쌍의 증상 발현 시각은 라인 리스트 데이터에서 얻어지며, 관측은 보통 달력 날짜로 기록됩니다. 수학적으로는 달력 날짜보다 숫자를 사용하는 것이 편리하므로, 보통 날짜는 통계 분석을 위해 정수로 변환됩니다. SI 데이터에서 가장 큰 과제는 간격 검열(censoring)입니다. 이는 정확한 증상 발현 시간이 관측되지 않고, 두 시점 사이에서만 발생한 것으로만 알려져 있기 때문입니다. 예를 들어, 증상 발현 시각이 ‘7월 15일’이라면, 그 일 내에서 정확한 시각을 알 수 없으므로 7월 15일과 7월 16일 사이에서 발생했다고 가정합니다. 따라서 SI 데이터는 interval‑censored 상태가 됩니다. 아래 그림은 SI 데이터의 거친 구조를 보여 주며, 이로 인해 추정 문제에 복잡성이 추가됩니다. 출처: Gressani O, Hens N. (2025). Nonparametric serial interval estimation with uniform mixtures. PLOS Computational Biology 21(8): e1013338. 새로운 비모수 추정기 Gressani와 Hens (2025)는 PLOS Computational Biology에 논문을 발표하며, 기본 SI 분포에 대한 가정 없이 SI 누적 분포 함수(CDF)를 추정하는 새로운 추정기를 제안했습니다. 이 추정기는 균일 분포의 혼합(mixture)으로 구성되며, 주요 입력값으로 s_{iL} (하한)과 s_{iR} (상한)만 요구합니다. 다양한 SI 특성의 점 추정값은 닫힌 형태로 제공되며, 부트스트랩을 통해 신뢰 구간(confidence interval)을 계산합니다. 비모수 방법은 상대적으로 단순하고 계산 속도와 안정성이 우수합니다. 또한, R로 작성된 EpiDelays 패키지에 사용자 친화적 루틴이 제공됩니다. 본 게시물은 SI 비모수 추정법을 처음 접해보는 사용자에게 간단한 실습 경험을 제공하는 것을 목표로 합니다. EpiDelays 패키지 설치 GitHub에서 EpiDelays 패키지를 설치하려면 다음 명령어를 사용하십시오. install.packages("devtools") devtools::install_github("oswaldogressani/EpiDelays") 시뮬레이션 데이터 활용 estimSI() 루틴은 다양한 SI 특성(평균, 중앙값, 표준편차 등)의 비모수 추정값(점 추정값, 표준오차, 신뢰 구간)을 계산합니다. 이 루틴은 두 개의 입력만 필요합니다: x: n 행과 2 열을 가진 데이터 프레임. 첫 번째 열은 SI 창의 하한 s_{iL}, 두 번째 열은 상한 s_{iR}를 담습니다. nboot: 부트스트랩 샘플 크기(기본값 2000). 90% 및 95% 신뢰 구간을 만들 때 사용됩니다. 아래 예시는 시뮬레이션 데이터를 사용해 estimSI()를 적용하는 과정을 보여 줍니다. 시뮬레이션 데이터 생성 simSI() 루틴은 최소 두 일의 폭(두께)을 갖는 SI 창을 인위적으로 생성할 수 있습니다. 목표 SI 분포는 평균 muS, 표준편차 sdS가 사용자가 지정한 Gaussian 분포를 가정합니다. 아래 코드는 평균 3일, 표준편차 2일인 Gaussian 분포에서 15개의 SI 창을 생성합니다. set.seed(2025) simdata
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
원문에서 전체 글 읽기
작성자
R-Blogger
출처
R-Blogger
플랫폼
R-Blogger
분류
블로그·해설
언어
한국어
발행일
2025-08-23