티스토리 뷰
단백질 변화는 메커니즘의 증거가 아니라, 메커니즘을 추정하기 위한 단서일 뿐이다
Proteomics 연구를 하다 보면 매우 익숙한 흐름이 있다.
질병군과 대조군을 비교한다.
수천 개의 단백질 중 일부가 유의하게 변화한다.
Pathway enrichment를 수행한다.
Network analysis를 수행한다.
그리고 마지막에 이런 결론이 등장한다.
"본 연구 결과는 PI3K-AKT signaling pathway가 질병 진행을 유도함을 시사한다."
"Protein X가 염증 반응을 조절하는 핵심 메커니즘으로 확인되었다."
"Mitochondrial dysfunction이 주요 병인 기전으로 작용한다."
논문을 읽는 입장에서는 매우 자연스럽게 느껴진다.
실제로 많은 연구가 이런 구조를 가지고 있다.
문제는 여기서 사용되는 "mechanism"이라는 단어다.
왜냐하면 대부분의 경우 Proteomics가 직접 보여주는 것은 mechanism이 아니라 변화(change)이기 때문이다.
그리고 변화와 메커니즘은 생각보다 훨씬 다른 개념이다.
Proteomics를 오래 할수록 알게 되는 사실이 하나 있다.
수천 개의 단백질 변화를 발견하는 것보다,
그 변화가 왜 발생했는지를 설명하는 것이 훨씬 어렵다는 점이다.
1. Proteomics는 기본적으로 관찰(Observation) 기술이다
가장 먼저 이해해야 할 것은 Proteomics의 본질이다.
Proteomics는 세포 안에서 어떤 단백질이 얼마나 존재하는지를 측정한다.
즉 다음과 같은 정보를 제공한다.
- Protein abundance
- Fold change
- Relative quantification
- Presence / absence
하지만 제공하지 않는 것도 있다.
- 원인
- 결과
- 조절 방향
- 인과관계
- 생물학적 의도
즉 Proteomics는 "무슨 일이 일어났는가"는 알려주지만,
"왜 일어났는가"는 알려주지 않는다.
그런데 mechanism은 본질적으로 "왜"에 대한 설명이다.
2. 변화는 메커니즘이 아니다
예를 들어 어떤 질병에서 미토콘드리아 단백질이 감소했다고 하자.
많은 연구자는 이렇게 해석한다.
"미토콘드리아 기능 저하가 질병의 원인이다."
하지만 실제 데이터가 보여준 것은 단 하나다.
미토콘드리아 관련 단백질이 감소했다.
이 감소가:
- 질병의 원인인지
- 질병의 결과인지
- 보상 반응인지
- 부수적 현상인지
Proteomics만으로는 알 수 없다.
즉 변화 자체는 메커니즘이 아니다.
3. Correlation을 Causation으로 착각하기 쉽다
Proteomics 해석에서 가장 흔한 오류다.
예를 들어:
Disease severity ↑
Protein X ↑
강한 상관관계가 관찰되었다.
이때 연구자는 쉽게 생각한다.
"Protein X가 disease progression을 유도한다."
하지만 실제로는 반대일 수도 있다.
Disease progression
↓
Stress response
↓
Protein X 증가
즉 Protein X는 원인이 아니라 결과일 수 있다.
Proteomics는 이 둘을 구분하지 못한다.
4. Reverse Causation은 생각보다 흔하다
실제 생물학에서는 원인과 결과가 자주 뒤집힌다.
예를 들어 암 조직에서 glycolysis 관련 단백질이 증가했다고 하자.
많은 논문은:
"Glycolysis activation이 암을 촉진한다."
라고 쓴다.
하지만 실제로는:
암 성장
↓
산소 부족
↓
대사 재편성
↓
Glycolysis 증가
일 수도 있다.
즉 증가한 단백질은 메커니즘의 원인이 아니라 결과다.
5. Compensatory Response 문제
세포는 수동적인 시스템이 아니다.
문제가 발생하면 이를 보상하려고 한다.
예를 들어:
산화 스트레스 증가
↓
항산화 단백질 증가
가 발생할 수 있다.
Proteomics에서는 항산화 단백질 upregulation이 보인다.
이를 보고:
"항산화 pathway 활성화가 질병을 유도한다."
라고 해석하면 틀릴 수 있다.
실제로는 세포가 문제를 해결하려고 노력하는 흔적일 수 있다.
6. Proteomics는 Activity를 직접 측정하지 않는다
Mechanism은 보통 기능(function)과 연결된다.
하지만 Proteomics는 대부분 abundance를 측정한다.
예를 들어 kinase abundance가 증가했다고 하자.
이것이 kinase activity 증가를 의미할까?
그렇지 않을 수 있다.
실제 활성은:
- phosphorylation
- localization
- cofactor binding
- complex formation
에 의해 결정된다.
즉 abundance 변화만으로 기능적 메커니즘을 단정하기 어렵다.
7. Pathway Enrichment는 Mechanism이 아니다
많은 연구에서 pathway enrichment 결과를 곧바로 mechanism으로 해석한다.
예를 들어:
PI3K-AKT pathway enrichment
가 나타났다고 하자.
그러면 논문은 종종:
"PI3K-AKT signaling activation이 주요 메커니즘이다."
라고 결론 내린다.
하지만 enrichment는 단순히:
해당 pathway 구성원들이 많이 포함되었다
는 의미다.
실제 pathway flux가 증가했는지는 알 수 없다.
즉 pathway enrichment는 mechanism evidence가 아니라 hypothesis evidence다.
8. Network Analysis도 Mechanism을 증명하지 않는다
Network analysis에서 hub protein이 발견되었다고 하자.
많은 연구자는:
"Hub protein이 핵심 조절자다."
라고 생각한다.
하지만 hub는:
- annotation bias
- literature bias
- interaction density
의 영향을 강하게 받는다.
중앙에 있다고 원인이라는 뜻은 아니다.
9. Time Information이 없다
Mechanism을 이해하려면 시간 순서가 중요하다.
원인은 결과보다 먼저 발생해야 한다.
하지만 대부분의 Proteomics 연구는 단일 시점(snapshot) 분석이다.
예를 들어:
질병 환자
vs
건강인
비교만 수행한다.
그러면:
어떤 변화가 먼저 일어났는지 알 수 없다.
즉 시간 정보가 없는 상태에서 메커니즘을 단정하기 어렵다.
10. Hidden Variable 문제
Proteomics에서는 보이지 않는 제3의 요인이 존재할 수 있다.
예를 들어:
염증
↓
Protein A 증가
↓
Protein B 증가
가 발생한다고 하자.
A와 B는 강한 상관관계를 가진다.
하지만 실제로는 서로 아무 관계가 없다.
공통 원인이 염증일 뿐이다.
Mechanism 해석은 이런 hidden variable에 매우 취약하다.
11. 동일한 데이터에서 전혀 다른 메커니즘이 나올 수 있다
흥미로운 사실이 있다.
동일한 Proteomics 데이터라도 연구자에 따라 결론이 다를 수 있다.
어떤 연구자는:
- Metabolism
에 집중한다.
다른 연구자는:
- Inflammation
에 집중한다.
또 다른 연구자는:
- Mitochondrial dysfunction
에 집중한다.
모두 같은 데이터에서 나온다.
이것은 데이터가 메커니즘을 직접 보여주는 것이 아니라 해석의 여지를 남긴다는 뜻이다.
12. 진짜 Mechanism 연구는 Intervention이 필요하다
Mechanism을 주장하려면 단순 관찰을 넘어야 한다.
대표적인 방법은 개입(intervention)이다.
예를 들어:
Protein X knockdown
↓
Disease phenotype 감소
가 관찰된다.
이 경우에는:
Protein X가 실제로 기여한다는 근거가 생긴다.
즉 Mechanism은 보통:
관찰
↓
가설
↓
개입 실험
↓
검증
과정을 거쳐야 한다.
13. Proteomics의 진짜 역할
이 사실이 Proteomics의 가치를 떨어뜨리는 것은 아니다.
오히려 반대다.
Proteomics의 진짜 강점은:
Mechanism을 증명하는 것
이 아니라
Mechanism 후보를 찾는 것
이다.
즉 Proteomics는 hypothesis-generating technology다.
14. 실무적으로 Mechanism을 해석하는 방법
Proteomics 결과를 볼 때는 다음 질문을 해야 한다.
원인인가 결과인가?
Reverse causation 가능성은 없는가?
Activity evidence가 있는가?
Abundance 외에 기능적 증거가 있는가?
Time-course 데이터가 있는가?
변화 순서를 확인했는가?
Intervention 결과가 있는가?
Knockdown 또는 inhibition 실험이 있는가?
Alternative explanation은 없는가?
보상 반응이나 stress response일 가능성은 없는가?
15. Mechanism이라는 단어를 사용할 때 주의해야 하는 이유
실제 과학에서 mechanism은 매우 강한 주장이다.
Mechanism을 주장한다는 것은:
- 원인
- 경로
- 결과
사이의 연결을 설명한다는 뜻이다.
하지만 대부분의 Proteomics 연구는 여전히 관찰 연구(observational study)에 가깝다.
따라서 많은 경우 더 정확한 표현은:
"associated with"
"linked to"
"consistent with"
"suggestive of"
이다.
이 차이는 논문에서는 작아 보이지만 과학적으로는 매우 크다.
결론
Proteomics 데이터는 세포 안에서 어떤 단백질이 변화했는지를 보여주는 강력한 도구다. 그러나 그 변화 자체가 곧 메커니즘을 의미하지는 않는다.
Proteomics는 abundance를 측정할 뿐 activity를 직접 측정하지 않으며, 원인과 결과를 구분하지 못하고, 시간 정보도 부족하며, hidden variable과 compensatory response의 영향을 받을 수 있다. 또한 pathway enrichment와 network analysis 역시 메커니즘을 증명하는 것이 아니라 메커니즘 후보를 제시하는 수준에 머무는 경우가 많다.
따라서 Proteomics 결과만으로 특정 단백질이나 pathway를 질병의 핵심 메커니즘으로 단정하는 것은 위험할 수 있다.
결국 Proteomics는 메커니즘의 종착점이 아니라 출발점이다. 진짜 메커니즘은 Proteomics가 발견한 단서를 바탕으로 기능 실험, 시간 경과 연구, 유전자 조작, 약물 개입 연구 등을 통해 검증될 때 비로소 설득력을 갖게 된다.
이 사실을 이해하기 시작하면 이전에는 너무 명확해 보였던 Volcano plot과 Pathway enrichment 결과가 다르게 보이기 시작한다. 왜 같은 데이터에서 서로 다른 연구자들이 서로 다른 메커니즘을 주장하는지, 왜 많은 biomarker가 결국 drug target으로는 실패하는지, 왜 Proteomics 이후에 반드시 functional validation이 필요한지에 대한 답이 바로 이 지점에 숨어 있기 때문이다.

'제약산업' 카테고리의 다른 글
| Functional Annotation의 한계 (0) | 2026.06.08 |
|---|---|
| Protein interaction 데이터의 신뢰성 문제 (0) | 2026.06.07 |
| Database Bias가 해석을 왜곡하는 방식 (0) | 2026.06.06 |
| Network analysis가 과해석으로 이어지는 이유 (0) | 2026.06.05 |
| Proteomics에서 Causation vs Correlation 구분하는 방법 (0) | 2026.06.04 |
| Pathway enrichment가 잘못된 결론을 만드는 과정 (0) | 2026.06.03 |
| Upregulated Protein이 항상 기능 증가를 의미하지 않는 이유 (0) | 2026.06.02 |
| Multiple testing correction이 결과를 바꾸는 방식 (0) | 2026.06.01 |
- Total
- Today
- Yesterday
- 미래산업
- Spatial metabolomics
- 제약
- Missing Value
- 해석
- 분석팀
- 바이오마커
- matrix effect
- lc-ms/ms
- 데이터
- 분석
- Multi-omics
- Targeted Metabolomics
- 제약산업
- 신약개발
- AI
- 치료제
- metabolomics
- Proteomics
- audit
- 약물분석
- biological signal
- 임상시험
- bioanalysis
- 정밀의료
- 대사체 분석
- 시스템
- Biomarker
- LC-MS
- 정량분석
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
