티스토리 뷰
– 왜 다른 병원에서 같은 결과가 재현되지 않을까

Metabolomics 연구를 진행하다 보면 한 번쯤 이런 경험을 하게 된다.
처음 연구에서는 특정 metabolite가 환자군과 대조군을 매우 잘 구분하는 것처럼 보인다. 통계적으로도 매우 강한 차이를 보이며, PCA나 PLS-DA 같은 multivariate 분석에서도 분명한 separation이 나타난다. 논문으로 정리하면 충분히 설득력이 있어 보인다.
하지만 이후 다른 병원에서 환자를 모집하거나, 새로운 코호트를 확보하여 분석을 반복하면 예상치 못한 일이 발생한다. 이전 연구에서 가장 중요한 biomarker처럼 보였던 metabolite가 더 이상 유의하지 않거나, 심지어 변화 방향조차 달라지는 경우가 나타난다.
이 현상은 metabolomics 연구에서 매우 흔하게 관찰된다. 같은 질병을 대상으로 한 연구임에도 불구하고 코호트가 바뀌는 순간 metabolite significance가 사라지는 이유는 단순히 통계적 우연 때문만이 아니다. 실제로는 여러 층위의 변동성이 동시에 작용한다.
이 글에서는 환자 코호트가 바뀌는 순간 metabolite significance가 흔들리는 주요 원인을 살펴보고자 한다.
1. 질병 자체보다 환자 배경이 더 큰 변수를 만들 수 있다
Metabolite는 단순히 질병 상태만 반영하는 분자가 아니다. 오히려 metabolite 농도는 환자의 생활 환경과 생리적 상태에 매우 민감하게 반응한다.
예를 들어 다음과 같은 요소들은 metabolite 수준에 큰 영향을 줄 수 있다.
- 식습관
- 약물 복용
- 수면 패턴
- 신체 활동량
- 장내 미생물 구성
- 음주 및 흡연
특히 혈장이나 소변 metabolomics에서는 이러한 요인의 영향이 매우 크다.
예를 들어 어떤 metabolite가 질병 환자에서 증가하는 것으로 관찰되었다고 가정해 보자. 하지만 그 metabolite가 특정 식단이나 장내 미생물과도 강하게 연관되어 있다면 다른 지역에서 모집된 환자 코호트에서는 완전히 다른 패턴이 나타날 수 있다.
결국 첫 번째 연구에서 관찰된 차이는 질병 때문이 아니라 코호트의 생활 습관 차이를 반영했을 가능성도 있다.
2. 질병의 정의 자체가 코호트마다 다르다
임상 연구에서 동일한 질병 이름이 사용되더라도 실제 환자 구성은 상당히 다를 수 있다.
예를 들어 같은 질환이라도 다음과 같은 차이가 존재할 수 있다.
- 질병 진행 단계
- 치료 여부
- 합병증 존재 여부
- 환자의 연령 분포
이러한 차이는 metabolomics 데이터에 직접적인 영향을 준다.
예를 들어 암 환자를 대상으로 metabolomics 분석을 수행한다고 가정해 보자. 한 연구에서는 초기 단계 환자가 많고, 다른 연구에서는 진행성 환자가 많다면 metabolite profile이 크게 달라질 수 있다.
이 경우 metabolite significance가 사라진 것처럼 보이지만 실제로는 질병의 biological state 자체가 달라진 것일 수도 있다.
3. 코호트 크기가 작을수록 우연한 패턴이 나타나기 쉽다
Metabolomics 데이터는 일반적으로 다음과 같은 구조를 가진다.
- 수백에서 수천 개의 metabolite feature
- 수십에서 수백 개의 샘플
이 구조에서는 통계적 자유도 문제가 쉽게 발생한다.
특정 코호트에서 유의미하게 보이던 metabolite가 사실은 그 데이터셋에만 존재하는 패턴일 가능성이 있다. 특히 다음과 같은 경우 이러한 문제가 더 쉽게 나타난다.
- 샘플 수가 적은 경우
- multiple testing correction이 충분하지 않은 경우
- feature selection 과정이 반복된 경우
이러한 상황에서는 discovery cohort에서 매우 강력해 보이던 biomarker가 validation cohort에서 사라지는 일이 흔하다.
4. 분석 조건 차이가 작은 신호를 증폭하거나 약화시킬 수 있다
Metabolomics 연구에서는 분석 조건의 미묘한 차이도 결과에 영향을 줄 수 있다.
예를 들어 다음과 같은 요소들이 다를 수 있다.
- sample storage 기간
- extraction 방법
- LC gradient 조건
- mass spectrometer calibration 상태
특정 metabolite signal이 매우 강한 biological signal이 아니라면 이러한 실험 조건 차이에 의해 쉽게 영향을 받을 수 있다.
이 경우 discovery 연구에서 관찰된 metabolite significance는 실제 biological difference가 아니라 분석 시스템의 특성을 반영했을 가능성도 있다.
5. 질병보다 더 강한 biological variation이 존재할 수 있다
Metabolomics 데이터에서는 종종 질병 효과보다 개인 간 변동성이 더 크게 나타난다.
예를 들어 다음과 같은 경우를 생각해 볼 수 있다.
- 환자 A와 환자 B 사이의 metabolite 차이
- 환자 A와 건강 대조군 사이의 metabolite 차이
이 두 차이를 비교했을 때 개인 간 변동성이 더 크다면 질병 신호는 쉽게 묻힐 수 있다.
특히 다음과 같은 metabolite들은 개인 간 변동성이 매우 크다.
- lipid species
- bile acids
- microbiome 관련 metabolite
따라서 특정 코호트에서는 우연히 질병 신호가 강하게 보일 수 있지만 다른 코호트에서는 개인 변동성이 더 크게 나타날 수 있다.
6. Metabolomics는 환경 정보를 강하게 반영한다
Genomics 데이터와 달리 metabolomics 데이터는 환경 요인의 영향을 강하게 받는다.
예를 들어 다음과 같은 요인은 metabolite profile을 크게 변화시킬 수 있다.
- 지역 식문화
- 생활 환경
- 미생물 노출
- 약물 처방 패턴
따라서 서로 다른 지역이나 병원에서 모집된 환자 코호트는 질병이 같더라도 metabolite profile이 상당히 다를 수 있다.
이러한 특성 때문에 metabolomics biomarker는 population-specific signal이 될 가능성이 높다.
결론
Metabolomics 연구에서 특정 metabolite가 질병과 강하게 연관된 것처럼 보이더라도 코호트가 바뀌는 순간 그 significance가 사라지는 경우는 매우 흔하다.
그 이유는 단순히 통계적 오류 때문이 아니라 다음과 같은 다양한 요인이 동시에 작용하기 때문이다.
- 환자 생활 환경 차이
- 질병 상태의 다양성
- 개인 간 biological variation
- 분석 조건 차이
- 코호트 규모 문제
결국 metabolomics biomarker 연구에서 가장 중요한 것은 discovery 단계에서 강한 signal을 찾는 것이 아니라 다양한 코호트에서 동일한 biological 의미가 유지되는지를 확인하는 것이다.
'제약산업' 카테고리의 다른 글
| Biomarker 후보가 실제 임상에서 실패하는 전형적인 패턴 (0) | 2026.04.02 |
|---|---|
| Metabolomics 결과가 임상 의사결정으로 이어지지 못하는 이유 (0) | 2026.04.01 |
| 데이터 통합보다 중요한 ‘질문 설계’의 역할 (0) | 2026.03.31 |
| Multi-omics 통합에서 가장 먼저 무너지는 가정들 (0) | 2026.03.30 |
| Pathway 분석이 과학적 사실처럼 오해되는 순간 (0) | 2026.03.29 |
| Proteomics–Metabolomics 불일치가 의미하는 생물학적 메시지 (0) | 2026.03.28 |
| Transcriptomics와 Metabolomics 결과가 충돌할 때 어떻게 해석할 것인가 (0) | 2026.03.27 |
| Multi-omics 통합 분석이 기대만큼 재현되지 않는 이유 (0) | 2026.03.26 |
- Total
- Today
- Yesterday
- 정밀의료
- 분석팀
- 신약개발
- bioanalysis
- 치료제
- 약물분석
- 바이오마커
- LC-MS
- Spatial metabolomics
- AI
- 데이터 해석
- audit
- metabolomics
- 시스템
- Proteomics
- ich m10
- Biomarker
- 데이터
- lc-ms/ms
- Targeted Metabolomics
- matrix effect
- 임상시험
- 제약
- 약물개발
- 정량분석
- 제약산업
- 대사체 분석
- 분석
- Multi-omics
- 미래산업
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
