– LC-MS 기반 metabolomics 데이터에서 가장 조용히 사라지는 정보 LC-MS 기반 untargeted metabolomics 데이터를 처음 접하는 연구자라면 거의 비슷한 경험을 하게 된다. 분석이 끝난 뒤 feature table을 열어보면 수천 개, 때로는 수만 개의 peak가 존재한다. 그러나 annotation 단계로 넘어가면 그중 상당수는 이름을 얻지 못한다. spectral library와 매칭되지도 않고, 정확한 분자식도 확정되지 않으며, biological pathway에도 쉽게 연결되지 않는다. 이렇게 남겨진 peak들은 대부분 “unknown feature”라는 이름으로 정리된다.문제는 많은 metabolomics 연구에서 바로 이 지점에서 중요한 선택이 이루어진다는 것이다..
Metabolomics 해석에서 발생하는 ‘확신의 역설’ Metabolomics 연구를 수행하다 보면 연구자들은 자연스럽게 하나의 목표를 향해 달려가게 된다. 바로 metabolite identification 정확도를 최대한 높이는 것이다. LC-MS 기반 metabolomics 데이터는 수천에서 수만 개의 feature를 생성하고, 그 중 상당수는 이름이 붙지 않은 채 “unknown” 상태로 남는다. 이 때문에 많은 연구자들은 annotation 정확도를 높이고 가능한 많은 metabolite를 Level 1 혹은 Level 2 수준으로 식별하는 것을 연구의 핵심 목표로 설정한다.그러나 metabolomics 연구가 축적되면서 한 가지 흥미로운 현상이 반복적으로 관찰되기 시작했다. annotatio..
1. Metabolomics에서 identification이 어려운 구조적 이유LC-MS 기반 untargeted metabolomics에서 검출되는 feature는 매우 많습니다.일반적인 plasma metabolomics 데이터:검출 feature: 5,000–20,000개정확히 identification된 metabolite: 5–15%즉 대부분의 신호는 unknown feature입니다.이 현상이 발생하는 이유는 몇 가지가 있습니다.1) metabolome의 다양성Human metabolome에는 다음이 포함됩니다.endogenous metabolitemicrobiome metabolitediet-derived compounddrug metaboliteenvironmental chemical즉 가..
1. Negative result는 “분석이 실패했다”는 의미가 아니다많은 연구자가 다음과 같이 오해한다:유의한 metabolite 없음 → 실험 실패그룹 간 차이 없음 → 분석 민감도 부족biomarker 발견 실패 → 연구 가치 없음하지만 metabolomics에서 negative result는 종종 다음을 의미한다:생물학적 차이가 실제로 없음질병 기전이 대사 수준이 아닌 다른 계층에 있음효과 크기가 임상적으로 의미 없는 수준분석 설계가 confounder를 제거했기 때문에 “진짜 신호”만 남음👉 즉, negative result는 오히려 과학적으로 더 정직한 결과일 수 있다.2. False discovery를 줄이는 가장 강력한 방어선Metabolomics는 high-dimensional 데이터 ..
1. QC는 “정밀도”를 확인할 뿐 “정확성”을 보장하지 않는다✔ QC가 평가하는 것instrument stability반복 측정 정밀도 (precision)signal drift✔ QC가 평가하지 않는 것biological relevancematrix representativenesssample-specific suppressionmetabolite misannotation👉 즉, QC는 기기가 안정적인지만 본다.2. QC가 실제 샘플을 대표하지 못하는 문제가장 흔한 구조적 오류QC sample = pooled sample하지만 실제 샘플은:질병 상태약물 복용극단적 대사 상태고지혈, 고단백, 용혈 등👉 QC는 평균 상태일 뿐극단적 matrix 조건을 반영하지 못한다.실제 영향상황QC 결과실제 샘플I..
1. 왜 이 구분이 그렇게 중요한가metabolomics 데이터의 변이는 크게 두 축에서 발생한다.✔ Biological variation (생물학적 변이)개인 간 유전적 차이식이, 생활습관, 약물 복용질병 상태circadian rhythmmicrobiome 차이👉 연구자가 찾고 싶은 진짜 신호✔ Analytical variation (분석 변이)sample preparation 오차extraction efficiency 차이LC retention time driftMS sensitivity fluctuationbatch effection suppression / matrix effect👉 제거하거나 보정해야 할 기술적 노이즈2. 가장 먼저 확인해야 할 질문실무에서는 항상 이 질문부터 시작한다.❓ 질..
같은 혈장 샘플을 두 번 분석했는데feature 수가 달라지고, PCA 위치가 바뀌고,심지어 주요 metabolite의 상대적 abundance까지 달라지는 경험.이때 가장 먼저 떠오르는 질문은 이것입니다.무엇이 바뀌었는가?놀랍게도, 표면적으로는 아무것도 바뀌지 않은 것처럼 보입니다.같은 샘플같은 LC 조건같은 MS 설정QC도 정상그럼에도 결과는 달라집니다.이 현상을 이해하려면“샘플”이라는 단어를 다시 정의해야 합니다.1️⃣ 샘플은 고정된 물질이 아니라 ‘변하는 시스템’이다우리는 종종 샘플을 정적인 대상으로 생각합니다.하지만 실제 생물학적 샘플은 시간에 따라 변합니다.보관 중에도 대사 반응은 계속된다냉동 보관 중이라도 완전히 멈추는 것은 아닙니다.효소 잔존 활성산화 반응미생물 대사 (특히 stool, u..
‘모르기 때문에 안전했던 시기’가 끝난다1️⃣ 문제 ①: “과잉 해석(over-interpretation)”의 폭발기존:대부분의 feature는 unknown해석 가능한 신호만 제한적으로 사용보수적 결론 가능bottleneck 붕괴 이후:수천 개 feature에 구조 class 추정pathway 연결 가능biological 의미 자동 생성👉 문제는 여기서 시작됩니다.위험한 문장 예시“이 환자군에서 산화 스트레스 증가가 관찰됨”“지질 대사 이상이 암 진행과 관련됨”이 문장들이:실제 causal 관계가 아니라annotation 알고리즘의 편향일 가능성2️⃣ 문제 ②: False plausibility의 증가Foundation model 또는 고급 annotation 시스템은“그럴듯한 설명”을 매우 잘 만들..
- Total
- Today
- Yesterday
- Biomarker
- Proteomics
- 해석
- 정량분석
- 치료제
- biological signal
- Multi-omics
- 분석
- audit
- AI
- 제약
- 바이오마커
- LC-MS
- lc-ms/ms
- 신약개발
- 약물분석
- 대사체 분석
- 분석팀
- metabolomics
- ich m10
- 정밀의료
- 제약산업
- Targeted Metabolomics
- 시스템
- 데이터
- Spatial metabolomics
- bioanalysis
- matrix effect
- 임상시험
- 미래산업
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
