티스토리 뷰
– 복잡한 생물학을 ‘유의/비유의’로 축소하는 순간

Metabolomics 연구에서 p-value는 거의 모든 분석의 중심에 있다. 환자군과 대조군을 비교하고, 수백에서 수천 개의 metabolite 중에서 통계적으로 유의한 변화를 보이는 것들을 선별하는 과정은 매우 익숙한 분석 흐름이다.
문제는 이 과정이 너무 자연스럽게 반복되면서, 어느 순간 metabolomics 연구 전체가 “유의한 metabolite를 찾는 작업”으로 단순화된다는 점이다.
하지만 metabolomics 데이터가 담고 있는 정보는 그렇게 단순하지 않다. 대사체는 수많은 생리적 변수, 환경 요인, 시간적 변화, 그리고 복잡한 네트워크 구조를 반영한다. 그럼에도 불구하고 p-value 중심 해석은 이 복잡한 시스템을 이분법적인 구조로 축소시켜 버린다.
이 글에서는 왜 p-value 중심 접근이 metabolomics 연구를 과도하게 단순화시키는지, 그리고 그로 인해 어떤 중요한 정보들이 사라지는지를 살펴보고자 한다.
1. 연속적인 biological variation이 ‘있다/없다’로 바뀐다
Metabolite 수준은 본질적으로 연속적인 변수이다.
예를 들어 특정 metabolite는 다음과 같은 분포를 가질 수 있다.
- 건강한 사람: 0.8 ~ 1.5
- 환자: 1.0 ~ 2.0
이 경우 두 집단 사이에는 분명한 차이가 존재하지만 동시에 상당한 overlap도 존재한다.
하지만 p-value 기반 분석에서는 이 연속적인 차이가 다음과 같이 변환된다.
- p < 0.05 → 의미 있음
- p ≥ 0.05 → 의미 없음
이 과정에서 중요한 정보가 사라진다.
- 효과 크기의 크기
- 분포의 형태
- 개인 간 variability
즉 실제로는 부분적으로 겹치는 두 집단의 복잡한 구조가 단순히 “차이가 있다/없다”로 축소된다.
2. 네트워크 구조가 개별 feature 리스트로 분해된다
Metabolomics 데이터의 중요한 특징은 metabolite들이 서로 독립적인 존재가 아니라 network 형태로 연결되어 있다는 점이다.
예를 들어 하나의 metabolic pathway에서는 여러 metabolite가 동시에 변화할 수 있다. 하지만 p-value 기반 분석에서는 다음과 같은 과정이 이루어진다.
- 각 metabolite별로 독립적으로 통계 검정 수행
- 유의한 metabolite 리스트 생성
- 리스트 기반 해석
이 과정에서 다음과 같은 문제가 발생한다.
- 동일 pathway에 속한 metabolite 중 일부만 선택됨
- 약한 변화는 모두 제외됨
- 전체 metabolic 흐름이 분해됨
결과적으로 metabolomics 데이터가 가진 시스템 수준의 정보(system-level information)가 사라지고, 단순한 feature 리스트로 축소된다.
3. 작은 차이는 과소평가되고, 큰 차이는 과대해석된다
p-value는 효과 크기(effect size)와 샘플 수(sample size)에 모두 영향을 받는다.
이로 인해 다음과 같은 현상이 발생할 수 있다.
- 매우 작은 차이지만 샘플 수가 많아 p-value는 작음
- biologically 중요한 변화지만 variability가 커서 p-value는 큼
즉 p-value는 biological importance를 직접적으로 반영하지 않는다.
하지만 실제 연구에서는 종종 다음과 같은 해석이 이루어진다.
- p-value가 작다 → 중요한 변화
- p-value가 크다 → 중요하지 않음
이 과정에서 metabolomics 데이터의 중요한 특징이 왜곡된다.
- subtle하지만 의미 있는 변화는 무시됨
- 우연히 안정적인 작은 변화는 강조됨
4. 시간적(dynamic) 정보가 완전히 사라진다
Metabolomics는 매우 dynamic한 시스템을 반영한다.
Metabolite는 다음과 같은 시간적 변화를 보일 수 있다.
- 분 단위 변화
- 식후 급격한 변화
- circadian rhythm
하지만 대부분의 metabolomics 연구는 single time-point 데이터를 기반으로 분석된다. 그리고 p-value 분석은 이 snapshot 데이터를 기반으로 이루어진다.
이 경우 다음과 같은 문제가 발생한다.
- transient 변화는 포착되지 않음
- timing에 따른 biological 의미 차이가 무시됨
- dynamic regulation이 정적인 차이로 해석됨
즉 metabolomics 데이터의 중요한 특징인 시간적 구조가 완전히 제거된다.
5. 해석이 “스토리 만들기”로 연결된다
p-value 기반 분석을 통해 얻어진 결과는 보통 다음과 같은 형태를 가진다.
- 유의한 metabolite 리스트
- pathway enrichment 결과
이 정보만으로는 biological mechanism을 직접 설명하기 어렵다. 따라서 연구자는 자연스럽게 다음과 같은 작업을 수행하게 된다.
- 일부 metabolite를 선택
- pathway를 연결
- 하나의 설명 구조 생성
이 과정에서 metabolomics 데이터는 객관적인 관찰 결과라기보다 설명 가능한 이야기 구조로 재구성된다.
특히 다음과 같은 패턴이 자주 나타난다.
- 가장 설명하기 쉬운 pathway 선택
- 기존 지식과 맞는 해석 강조
- 불일치 데이터는 제외
이 과정은 의도적이지 않을 수 있지만 결과적으로 데이터 해석을 단순화시킨다.
6. 그렇다면 무엇이 필요한가
p-value 자체는 잘못된 도구가 아니다. 문제는 그것이 유일한 해석 기준이 될 때 발생한다.
Metabolomics 데이터를 보다 제대로 이해하기 위해서는 다음과 같은 접근이 필요하다.
- effect size 중심 해석
- distribution 기반 비교
- network-level 분석
- longitudinal data 활용
- biological context 고려
즉 단일 지표가 아니라 여러 층위의 정보를 함께 해석하는 구조가 필요하다.
결론
p-value 중심 해석은 metabolomics 연구를 빠르고 명확하게 만들어준다. 수천 개의 feature 중에서 중요한 후보를 선별하는 데 매우 유용한 도구이기 때문이다.
하지만 그 과정에서 다음과 같은 단순화가 발생한다.
- 연속적인 biological variation의 이분화
- 네트워크 구조의 분해
- 효과 크기의 왜곡
- 시간 정보의 소실
- narrative 중심 해석 강화
결국 metabolomics 데이터는 단순한 “유의한 metabolite 리스트”가 아니라 복잡한 생물학적 시스템의 표현이다.
따라서 중요한 것은 p-value를 버리는 것이 아니라, 그것을 출발점으로만 사용하고 그 너머의 구조를 해석하려는 시도라고 할 수 있다.
'제약산업' 카테고리의 다른 글
| 유의미한 결과만 보고하는 문화가 과학을 왜곡하는 방식 (0) | 2026.04.08 |
|---|---|
| Omics 데이터가 ‘스토리 만들기 도구’가 되는 순간 (0) | 2026.04.07 |
| 임상 적용을 목표로 할 때 metabolomics 연구 설계가 달라져야 하는 이유 (0) | 2026.04.06 |
| Precision Medicine에서 Metabolomics가 과대평가되는 지점 (0) | 2026.04.05 |
| 통계적으로 유의하지만 임상적으로 무의미한 결과의 특징 (0) | 2026.04.04 |
| 환자 코호트가 바뀌는 순간 metabolite significance가 사라지는 이유 (0) | 2026.04.03 |
| Biomarker 후보가 실제 임상에서 실패하는 전형적인 패턴 (0) | 2026.04.02 |
| Metabolomics 결과가 임상 의사결정으로 이어지지 못하는 이유 (0) | 2026.04.01 |
- Total
- Today
- Yesterday
- 정량분석
- Targeted Metabolomics
- audit
- 대사체 분석
- 신약개발
- bioanalysis
- 바이오마커
- 약물개발
- 시스템
- Proteomics
- LC-MS
- 분석팀
- AI
- Multi-omics
- 정밀의료
- 데이터
- 임상시험
- Biomarker
- 분석
- lc-ms/ms
- metabolomics
- 치료제
- matrix effect
- 미래산업
- ich m10
- 약물분석
- Spatial metabolomics
- 데이터 해석
- 제약산업
- 제약
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
