R-Blogger블로그·해설한국어2025-08-22
Bioconductor로 항생제 내성(AMR) 유전자 학습
Bioconductor를 활용한 E. coli ESBL 유전자 분석 플래시카드 대신 Bioconductor를 사용해 이 과정을 Rube Goldberg 기계처럼 구현했습니다! NCBI에서 3,280개의 E. coli 유전체를 분석해 84.4%의 샘플에서 ESBL 유전자를 감지했습니다. CTX‑M‑15가 가장 흔했습니다. 이 과정을 통해 유전자 명명법과 서열 분석을 이해하는 데 도움을 주었습니다. 📊🔬 동기부여 항생제 저항성(AMR) 유전자를 모두 배우고 기억하는 데 어려움을 겪어왔습니다. 플래시카드를 만들고 암기하려 할 수 있겠지만, 왜 쉽게 할 때 Rube Goldberg 기계로 만들지 않겠습니까? Bioconductor를 재방문하고 배우는 기회로 삼아 보자고 생각했습니다. 가자! 사고 과정 하지만 어떻게 해야 할까요? 배워야 할 내용이 많습니다. 임상적으로 어느 정도 적용 가능하거나 이해의 격차를 연결할 수 있도록 다음과 같은 질문을 스스로에게 던졌습니다. Escherichia coli에서 확장 스펙트럼 베타락타마제(ESBL) 생산을 조절하는 유전자는 무엇인가요? 이 유전자는 종과 속 전반에 걸쳐 같은 DNA 서열을 가지고 있나요? 면책 조항 저는 생물정보학자가 아니며 AMR 분야에서 일하지 않습니다. 본문과 방법은 임상 AMR 및 미생물학자들이 흔히 사용하는 유전학 용어에 대한 기억 연상력을 향상시키려는 시도입니다. 주의 깊게 검토하시고, 오류를 발견하시면 알려주시기 바랍니다. 또한, 일부 분석 결과는 rmarkdown knitting 시 큰 지연을 초래했으므로 실행되지 않았으며, 여기 게시된 결과는 재현 가능해야 합니다. 실행하지 못하셨다면 다시 알려주시기 바랍니다. 목표 NCBI에서 E. coli 데이터 다운로드 방법 Class A 베타락타마제 유전자 다운로드 방법 유전자 감지 방법 NCBI에서 모든 ESBL E. coli를 평가하기 질문에 대한 답변 본 글에서는 위의 질문들에 대한 답을 제시하고, 개선 가능성을 탐구하며, 배운 교훈을 정리합니다. 개선의 기회 향후 연구 및 분석을 위한 잠재적 개선 사항과 학습 포인트를 논의합니다. 배운 교훈 이번 프로젝트를 통해 얻은 주요 학습 내용과 인사이트를 정리합니다. E. coli 데이터 다운로드 방법 두 개의 다른 그룹을 선택합니다. 첫 번째 그룹은 단순히 박테리아를 검색하고 처음 10개를 다운로드합니다. 두 번째 그룹은 ESBL 그룹을 명시적으로 필터링합니다. 정규 E. coli: 여기 클릭 하여 페이지로 이동합니다. 처음 10개의 E. coli를 선택한 뒤 Download → Download Package를 클릭합니다. 선택은 위와 같이 기본값으로 두고 Download를 누르면 zip 파일이 다운로드됩니다. zip 파일을 다운로드한 뒤 압축을 해제하면 data 폴더 아래에 NCBI RefSeq 어셈블리와 같은 여러 폴더가 생깁니다. 각 폴더에는 해당 박테리아의 전체 유전체 서열을 포함한 fna 파일(FASTA 파일)이 들어 있습니다. 첫 번째 어셈블리를 살펴보겠습니다. (sequence %>% filter(assembly != "none") %>% group_by(file) %>% mutate(n = row_number()) %>% filter(n == 1) %>% ungroup(file) %>% select(esbl_seq) %>% mutate(gene = str_extract(esbl_seq, "(?"))
원문 URL
전체 글은 원문 페이지에서 이어서 읽을 수 있습니다.
- 작성자
- R-Blogger
- 출처
- R-Blogger
- 플랫폼
- R-Blogger
- 분류
- 블로그·해설
- 언어
- 한국어
- 발행일
- 2025-08-22