티스토리 뷰

우리는 더 많은 것을 발견하게 되었을까, 아니면 더 많은 것을 해석하게 되었을까
오랫동안 생명과학 연구는 하나의 전형적인 흐름을 따랐다.
연구자는 먼저 가설(hypothesis)을 세운다.
특정 단백질이 질병에 관여할 것이라고 생각한다.
특정 효소가 약물 반응을 조절할 것이라고 예상한다.
그리고 그 가설을 검증하기 위한 실험을 설계한다.
이러한 방식은 지금도 과학의 기본 구조다.
하지만 Metabolomics가 등장하면서 상황이 조금 달라졌다.
특히 고해상도 LC-MS/MS 기반 Untargeted Metabolomics가 발전하면서 연구자들은 이전에는 불가능했던 질문을 하기 시작했다.
"우리가 무엇을 찾아야 하는지 모른다면?"
"아예 가설 없이 데이터를 보면 어떨까?"
"질병이 우리에게 알려주지 않은 변화는 무엇일까?"
이것이 바로 hypothesis-free 접근의 출발점이었다.
그리고 이 변화는 생각보다 훨씬 큰 영향을 생명과학 연구 전반에 남겼다.
1. Hypothesis-driven 연구의 한계
과거의 연구는 대부분 hypothesis-driven 방식이었다.
예를 들어 당뇨병 연구를 한다고 가정해보자.
연구자는 이미 알고 있는 대사 경로를 중심으로 연구를 설계한다.
- Glucose
- Insulin
- Glycolysis
- TCA cycle
이런 요소들을 측정한다.
이 방식은 강력하다.
하지만 한 가지 문제도 있다.
우리는 이미 알고 있는 것만 보게 된다.
즉 연구자의 지식이 연구 범위를 결정한다.
만약 중요한 변화가 전혀 예상하지 못한 경로에서 발생한다면?
아예 관찰되지 않을 수 있다.
2. Untargeted Metabolomics의 등장
LC-MS 기술이 발전하면서 수백~수천 개의 대사체를 동시에 측정할 수 있게 되었다.
이제 연구자는 특정 분자만 보는 것이 아니라 전체 metabolome을 관찰할 수 있게 되었다.
질병군과 대조군을 비교하면:
- 예상했던 변화
- 예상하지 못했던 변화
- 전혀 알려지지 않았던 신호
까지 발견할 수 있다.
이것은 생명과학 연구 방식 자체를 바꾸기 시작했다.
3. 발견(Discovery)의 시대가 열렸다
Hypothesis-free 접근의 가장 큰 장점은 발견 능력이다.
실제로 많은 중요한 바이오마커는 예상하지 못한 곳에서 발견되었다.
연구자는 특정 경로를 찾으려 했지만,
실제로는 전혀 다른 대사 경로가 더 강하게 변하고 있었다.
만약 기존 가설만 검증했다면 영원히 발견되지 않았을 변화들이다.
4. 연구자의 편견을 줄일 수 있었다
과학자는 객관적이어야 한다.
하지만 현실에서는 누구나 편견을 가진다.
이미 유명한 pathway를 더 주목한다.
이미 알려진 단백질을 더 중요하게 생각한다.
Hypothesis-free 접근은 이러한 편향을 어느 정도 줄여준다.
데이터가 먼저 말하게 만드는 것이다.
적어도 원칙적으로는 그렇다.
5. 그러나 새로운 문제가 등장했다
흥미로운 점은 hypothesis-free 접근이 성공하면서 새로운 문제가 생겼다는 것이다.
바로 너무 많은 결과가 나온다는 점이다.
예전에는:
한 개의 가설
↓
한 개의 실험
↓
한 개의 결론
구조였다.
하지만 Untargeted Metabolomics에서는:
수천 개 feature
↓
수백 개 differential metabolite
↓
수십 개 pathway
가 동시에 나온다.
문제는 여기서부터 시작된다.
6. 데이터는 가설 없이 생성되지만 해석은 가설 없이 불가능하다
많은 사람들이 오해하는 부분이다.
실험은 hypothesis-free일 수 있다.
하지만 해석은 그렇지 않다.
PCA가 분리되었다.
Volcano plot에서 300개 feature가 변했다.
Pathway enrichment가 나왔다.
그 다음에는 무엇을 해야 할까?
결국 연구자는 스토리를 만들어야 한다.
즉 가설이 다시 등장한다.
7. Pathway Enrichment가 새로운 가설 생성기가 되었다
과거에는 연구자가 먼저 pathway를 선택했다.
이제는 pathway enrichment가 pathway를 제안한다.
예를 들어:
Amino acid metabolism
↓
Lipid metabolism
↓
Oxidative stress pathway
가 나타난다.
연구자는 여기서 가장 설득력 있는 이야기를 선택한다.
문제는 이 과정이 생각보다 주관적이라는 점이다.
8. False Discovery도 함께 증가했다
수천 개의 feature를 분석하면 우연한 차이도 많아진다.
특히 Untargeted Metabolomics에서는:
- Unknown feature
- Annotation uncertainty
- Missing value
- Multiple testing
문제가 존재한다.
즉 hypothesis-free 접근은 새로운 발견을 가능하게 했지만,
동시에 새로운 false discovery도 만들어냈다.
9. Unknown Metabolite의 시대
과거에는 알려진 대사체만 분석했다.
지금은 다르다.
Untargeted 분석에서는 상당수 feature가 정확히 무엇인지 모르는 경우가 많다.
흥미롭게도 가장 강한 신호가 unknown인 경우도 있다.
이것은 과학적으로 매우 흥미롭다.
동시에 매우 답답하다.
변화는 보이는데 의미를 모르는 것이다.
10. Biomarker 발견 연구가 폭발적으로 증가했다
Hypothesis-free 접근은 바이오마커 연구를 크게 성장시켰다.
질병군
vs
대조군
을 비교하면 수많은 후보가 나온다.
하지만 여기에도 함정이 있다.
발견(discovery)은 쉽지만 검증(validation)은 어렵다.
실제로 수많은 바이오마커 후보가 후속 연구에서 사라진다.
11. Multi-omics 시대를 열었다
Hypothesis-free 철학은 Metabolomics를 넘어갔다.
현재는:
- Transcriptomics
- Proteomics
- Metabolomics
- Lipidomics
를 통합하는 Multi-omics 연구가 일반적이다.
즉 특정 가설을 검증하기보다 전체 시스템을 관찰하는 방향으로 연구가 이동했다.
12. Machine Learning과 가장 잘 맞는 분야가 되었다
AI와 머신러닝은 hypothesis-free 접근과 매우 잘 맞는다.
왜냐하면 알고리즘은 사전 지식 없이 패턴을 찾을 수 있기 때문이다.
실제로 많은 Metabolomics 연구가:
Random Forest
XGBoost
Neural Network
등을 활용한다.
하지만 여기에도 문제가 있다.
패턴은 찾지만 이유는 설명하지 못하는 경우가 많다.
13. Correlation의 홍수
Hypothesis-free 접근 이후 가장 흔하게 등장한 문제다.
Feature A
Feature B
Disease
사이에 상관관계가 보인다.
그러나 상관관계는 원인을 설명하지 않는다.
결국 발견은 쉬워졌지만 메커니즘 규명은 여전히 어렵다.
14. Metabolomics는 가설을 없앤 것이 아니라 가설 생성 방식을 바꿨다
많은 사람들이 생각하는 것처럼 hypothesis-free 접근은 가설을 없앤 것이 아니다.
오히려 가설 생성 위치를 바꾸었다.
과거:
가설
↓
실험
↓
검증
현재:
데이터
↓
가설 생성
↓
검증
즉 hypothesis generation의 출발점이 연구자에서 데이터로 이동한 것이다.
15. 진짜 변화는 겸손함이었다
Hypothesis-free 접근이 가져온 가장 큰 변화는 기술이 아니라 사고방식일 수 있다.
과거 연구자는:
"무엇이 중요한지 안다."
라는 전제에서 시작했다.
지금은:
"중요한 것이 무엇인지 모를 수도 있다."
라는 전제에서 시작한다.
이 차이는 생각보다 크다.
결론
Metabolomics에서 hypothesis-free 접근은 단순한 분석 기법의 변화가 아니라 생명과학 연구 패러다임 자체를 바꾼 사건이었다. 연구자는 더 이상 특정 대사체나 특정 경로만을 바라보지 않게 되었고, 전체 metabolome을 관찰하면서 예상하지 못했던 변화와 새로운 바이오마커, 새로운 생물학적 현상을 발견할 수 있게 되었다.
하지만 동시에 새로운 도전도 등장했다. 수천 개의 feature와 수백 개의 통계적 결과 속에서 진짜 신호와 우연한 신호를 구분해야 했고, 발견된 상관관계를 실제 메커니즘으로 연결해야 하는 과제가 남았다. 결국 hypothesis-free 접근은 가설을 제거한 것이 아니라, 데이터를 통해 새로운 가설을 생성하는 방식으로 과학의 흐름을 바꾼 것이다.
오늘날 Metabolomics는 discovery science의 상징처럼 여겨진다. 그러나 경험이 많은 연구자일수록 한 가지 사실을 잘 알고 있다. 데이터를 가설 없이 수집하는 것은 가능하지만, 그 데이터를 이해하는 순간 우리는 다시 가설의 세계로 들어가게 된다는 점이다.
그래서 Metabolomics의 진정한 가치는 "가설이 없는 연구"에 있는 것이 아니라, "이전에는 상상하지 못했던 가설을 만들어낼 수 있는 연구"에 있다고 볼 수 있다.
'제약산업' 카테고리의 다른 글
| 대사체 안정성 문제가 임상 연구에서 특히 중요한 이유 (0) | 2026.06.15 |
|---|---|
| 내부 표준(Internal Standard) 선택이 Metabolomics 정량 신뢰도에 미치는 영향 (0) | 2026.06.14 |
| 샘플 보관 조건이 Metabolomics 결과를 바꿔버리는 사례 (0) | 2026.06.13 |
| 전처리 방법 선택이 생물학적 결론을 바꾸는 이유 (0) | 2026.06.12 |
| 재현되지 않는 Proteomics 연구의 공통된 패턴 (0) | 2026.06.11 |
| Multi-omics Integration에서 발생하는 해석 오류 (0) | 2026.06.10 |
| Proteomics 데이터로 Mechanism을 단정하면 위험한 이유 (0) | 2026.06.09 |
| Functional Annotation의 한계 (0) | 2026.06.08 |
- Total
- Today
- Yesterday
- biological signal
- audit
- Missing Value
- Proteomics
- 임상시험
- 미래산업
- 시스템
- 분석
- LC-MS
- 재현성
- metabolomics
- 해석
- 대사체 분석
- 치료제
- bioanalysis
- 데이터
- Targeted Metabolomics
- 바이오마커
- AI
- 정밀의료
- 제약
- 약물분석
- 정량분석
- 제약산업
- Multi-omics
- matrix effect
- 신약개발
- lc-ms/ms
- Biomarker
- 분석팀
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
