티스토리 뷰

— 우리는 발견하고 있는 것이 아니라, 선택하고 있을지도 모른다
untargeted metabolomics를 처음 접했을 때,
많은 사람들이 비슷한 감정을 느낀다.
“이건 완전히 다른 차원의 데이터다.”
수천 개의 feature,
예상하지 못한 metabolite,
그리고 그 안에서 보이는 패턴들.
마치 아무것도 모르는 상태에서
새로운 생물학을 발견하는 느낌이다.
하지만 이 기대감은
생각보다 쉽게 착각으로 바뀐다.
그리고 그 착각은 하나의 문장으로 정리할 수 있다.
“이 데이터는 샘플의 실제 상태를 그대로 보여준다.”
이 문장이야말로
untargeted metabolomics에서 가장 위험한 착각이다.
1. 우리가 보고 있는 것은 ‘전체’가 아니다
untargeted라는 단어는
모든 것을 본다는 인상을 준다.
하지만 실제로는 전혀 다르다.
우리는 다음 조건을 만족하는 것만 본다.
- 특정 LC 조건에서 분리된 것
- 특정 ionization 조건에서 이온화된 것
- 특정 detection threshold를 넘은 것
즉, 이 데이터는
“존재하는 metabolite의 전체”가 아니라
“측정 조건에서 살아남은 일부”다.
문제는 이 제한된 데이터로
전체 biological system을 해석한다는 점이다.
2. Feature는 metabolite가 아니다
untargeted metabolomics에서 가장 흔한 착각 중 하나는
feature를 metabolite로 간주하는 것이다.
하지만 실제로 하나의 feature는 다음일 수 있다.
- parent ion
- fragment ion
- adduct
- isotope
- noise
즉, 우리가 보고 있는 peak 하나는
“하나의 물질”이 아닐 가능성이 높다.
그럼에도 불구하고
이 feature에 이름을 붙이고
pathway에 넣는 순간,
해석은 이미 위험해진다.
3. fold change는 의미가 있어 보이지만 위험하다
untargeted 데이터에서
가장 먼저 보는 것은 fold change다.
- 2배 증가
- 3배 감소
이 숫자들은 매우 설득력 있다.
하지만 여기에는 중요한 문제가 있다.
이 값은 농도의 변화가 아니라
signal의 변화다.
그리고 signal은 다음에 영향을 받는다.
- ion suppression
- matrix effect
- LC separation
- peak integration
즉, fold change는
“측정 시스템의 결과”일 가능성이 항상 존재한다.
4. 패턴은 쉽게 만들어진다
PCA나 clustering을 보면
종종 매우 깔끔한 separation이 나온다.
- control vs disease 완벽 분리
- treatment effect 명확
이런 결과는 굉장히 매력적이다.
하지만 이 패턴이
항상 biological origin이라고 보장할 수는 없다.
왜냐하면 패턴은
다음 요소로도 쉽게 만들어지기 때문이다.
- batch effect
- matrix composition 차이
- LC-MS condition drift
즉,
“보이는 패턴 = 의미 있는 차이”는 아니다.
5. annotation이 붙는 순간 확신이 생긴다
feature에 이름이 붙는 순간
데이터는 갑자기 “의미 있는 것”이 된다.
- metabolite 이름
- pathway mapping
- literature 연결
이 과정은 분석을 완성하는 단계처럼 보인다.
하지만 실제로는
가장 위험한 단계일 수도 있다.
왜냐하면
- 잘못된 annotation 가능성
- ambiguous match
- database bias
이 존재하기 때문이다.
특히 untargeted에서는
“확실한 identification”보다
“가능한 추정”이 훨씬 많다.
6. pathway analysis는 결과를 더 그럴듯하게 만든다
pathway analysis는
개별 metabolite를 하나의 이야기로 묶어준다.
그래서 결과가 더 설득력 있어 보인다.
- 특정 pathway activation
- metabolic shift
- disease mechanism 연결
하지만 이 단계에서 가장 큰 문제가 발생한다.
잘못된 feature들이 모이면
더 그럴듯한 잘못된 이야기가 만들어진다.
즉, 오류가 증폭된다.
7. 재현되지 않는 이유는 이미 시작 단계에 있다
많은 사람들이 이렇게 생각한다.
“왜 다른 cohort에서는 결과가 안 나올까?”
하지만 문제는 대부분
초기 단계에서 이미 시작된다.
- feature detection
- normalization
- filtering
이 과정은 모두
데이터를 “선택”하는 과정이다.
즉,
untargeted 분석은 발견(discovery)이 아니라
선택(selection)의 연속이다.
8. 가장 위험한 순간: 결과가 너무 잘 설명될 때
분석을 하다 보면
모든 것이 맞아떨어지는 순간이 있다.
- pathway 연결됨
- literature와 일치
- biological story 완성
이 순간이 가장 위험하다.
왜냐하면 이때
사람은 검증을 멈추기 때문이다.
9. 그럼 무엇을 해야 하는가
완전히 피할 수는 없지만
방향은 분명하다.
1) feature를 의심하는 습관
이게 정말 metabolite인지 먼저 확인해야 한다.
2) analytical validation 먼저
- LC 조건 변경
- ionization 조건 확인
- internal standard 활용
3) orthogonal approach 사용
- targeted validation
- 다른 플랫폼 비교
4) “이 결과가 틀렸다면?” 질문하기
이 질문이 가장 중요하다.
결론: untargeted는 자유가 아니라 제한이다
untargeted metabolomics는
모든 것을 보는 기술이 아니다.
오히려
많은 제약 속에서 일부만 보는 기술이다.
문제는 이 제한된 데이터를 가지고
우리는 전체를 설명하려 한다는 점이다.
그래서 가장 위험한 착각은 이것이다.
“나는 새로운 것을 발견했다”
하지만 실제로는
그저
측정 조건이 허락한 것 중 일부를 선택했을 뿐일지도 모른다.
이 사실을 인지하는 순간,
분석의 방향은 완전히 달라진다.
'제약산업' 카테고리의 다른 글
| Matrix effect vs Biological signal 구분하는 방법 (0) | 2026.04.15 |
|---|---|
| Ion suppression이 metabolite pathway 해석을 왜곡하는 방식 (0) | 2026.04.13 |
| Metabolomics workflow에서 LC-MS 조건이 결과 해석에 미치는 영향 (0) | 2026.04.12 |
| 재현되지 않는 omics 연구의 공통된 설계 패턴 (0) | 2026.04.11 |
| 연구자가 기대한 방향으로 데이터가 보이기 시작하는 순간 (0) | 2026.04.10 |
| p-value 중심 해석이 metabolomics 연구를 단순화시키는 이유 (0) | 2026.04.09 |
| 유의미한 결과만 보고하는 문화가 과학을 왜곡하는 방식 (0) | 2026.04.08 |
| Omics 데이터가 ‘스토리 만들기 도구’가 되는 순간 (0) | 2026.04.07 |
- Total
- Today
- Yesterday
- 해석
- LC-MS
- bioanalysis
- 제약산업
- 정량분석
- Spatial metabolomics
- 정밀의료
- metabolomics
- lc-ms/ms
- 미래산업
- 시스템
- 약물분석
- 바이오마커
- 제약
- 약물개발
- 분석팀
- 신약개발
- ich m10
- Proteomics
- audit
- 치료제
- matrix effect
- Biomarker
- 임상시험
- 분석
- 데이터
- AI
- Multi-omics
- Targeted Metabolomics
- 대사체 분석
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
