티스토리 뷰

제약산업

단백질 abundance vs 기능 문제

pharma_info 2026. 3. 17. 20:43
728x90

 많이 검출된 단백질이 생물학적으로 중요한가?

1. Proteomics 데이터의 기본 착각

Proteomics 결과에서 흔히 보는 표:

 

Protein Fold change p-value
Albumin ↑ 1.2 0.01
CRP ↑ 1.5 0.02
Transcription factor X 변화 없음 0.8

👉 대부분 연구자는 변화가 큰 단백질에 집중합니다.

하지만 실제 생물학적 영향력은 정반대일 수 있습니다.

✔ Albumin: 농도 높지만 기능 변화 없음
✔ TF X: 농도 변화 없지만 활성 변화 → 질병 핵심 조절자

2. Abundance는 측정 용이성의 결과일 뿐이다

왜 어떤 단백질이 더 자주 보이는가?

✔ 고농도
✔ 이온화 효율 높음
✔ tryptic peptide 생성 용이
✔ database 매칭 용이

👉 기술적 검출 편향(detection bias)

즉,

보이는 단백질 ≠ 중요한 단백질
보이는 단백질 = 측정하기 쉬운 단백질

 

3. 기능은 abundance가 아니라 “활성 상태”에 의해 결정된다

대표적 예시

3.1 효소 (Enzyme)

  • 총량 변화 없음
  • phosphorylation 상태 변화
  • 활성 증가 → 대사 경로 변화

3.2 전사인자 (Transcription factors)

  • 농도 일정
  • nuclear translocation 발생
  • 유전자 발현 대규모 변화

3.3 수용체 (Receptors)

  • 총 단백질 양 일정
  • ligand binding 상태 변화
  • 신호전달 활성화

👉 proteomics abundance만으로 기능 해석 불가능

4. Post-translational modification (PTM)의 영향

PTM은 단백질 기능을 완전히 바꿀 수 있습니다.

주요 PTM

  • phosphorylation
  • acetylation
  • glycosylation
  • ubiquitination
  • oxidation

예:


상태 단백질 양 기능
비인산화 동일 비활성
인산화 동일 활성화

👉 abundance 데이터만으로는 완전히 놓침

5. Cancer proteomics에서 특히 위험한 해석 오류

종양 조직에서 흔히 나타나는 현상:

✔ structural protein 증가
✔ stress protein 증가
✔ ECM protein 증가

하지만 실제 종양 진행을 결정하는 요소는:

  • signaling pathway activation
  • transcriptional reprogramming
  • metabolic rewiring

👉 abundance 기반 해석 → 결과 왜곡

6. Plasma proteomics에서 abundance의 함정

혈장에서 상위 단백질:

  • Albumin
  • Immunoglobulins
  • Fibrinogen

이들은 질병 특이성이 낮습니다.

반면 중요한 신호:

  • cytokines
  • growth factors
  • signaling peptides

👉 극저농도 → 검출 어려움 → 해석에서 제외

7. Fold change 중심 분석의 한계

Fold change는 abundance 변화만 반영합니다.

문제:

  • baseline이 높은 단백질이 더 유리
  • 작은 변화도 통계적으로 유의
  • 기능적 영향과 무관

예:

단백질  Base line 변화 Fold
Albumin 40 mg/mL +2 1.05
IL-6 2 pg/mL +2 2.0

👉 IL-6가 훨씬 큰 생물학적 의미
👉 그러나 검출 신뢰도 낮아 제외될 가능성

8. 네트워크 관점에서의 중요도: Hub protein vs abundant protein

시스템 생물학에서는 중요도를 다르게 정의합니다.

네트워크 중요도

✔ hub protein
✔ pathway regulator
✔ signal amplifier
✔ rate-limiting enzyme

이들은 종종:

  • 저농도
  • 검출 어려움
  • 변동성 높음

👉 abundance 기반 분석에서 소외됨

9. Biomarker 연구에서 발생하는 대표적 오류

실패 패턴

1️⃣ 고농도 단백질 변화 발견
2️⃣ biomarker 후보 선정
3️⃣ 외부 코호트에서 재현 실패

이유:

  • 질병 특이성 부족
  • 염증 등 비특이 반응 반영
  • 기능적 연관성 낮음

10. Abundance 중심 해석이 발생하는 구조적 이유

10.1 기술적 이유

  • detection limit
  • dynamic range 제한
  • DDA acquisition bias

10.2 분석 파이프라인 이유

  • fold change 중심 ranking
  • p-value 중심 필터링
  • pathway enrichment의 입력 편향

10.3 출판 편향

  • 큰 변화 선호
  • 시각적으로 명확한 결과 선호

11. 기능 중심 해석으로 전환하는 전략

11.1 PTM proteomics 통합

  • phosphoproteomics
  • glycoproteomics
  • ubiquitinome 분석

11.2 Pathway activity 추정

단백질 개별 변화가 아니라:

✔ pathway enrichment
✔ upstream regulator analysis
✔ network centrality 평가

11.3 Multi-omics 통합

기능은 abundance보다 다음에서 더 잘 드러납니다:

  • transcriptomics
  • metabolomics
  • phosphoproteomics
  • flux analysis

12. 임상 biomarker 관점에서의 교훈

좋은 biomarker는:

✔ 질병 메커니즘과 연결
✔ 기능적 변화 반영
✔ 특정성 높음

반면 실패하는 biomarker는:

❌ abundance 변화만 반영
❌ 염증/스트레스 반응 반영
❌ 비특이적 변화

13. 가장 위험한 순간

Proteomics 결과를 보고 다음과 같이 말하는 순간:

“이 단백질이 많이 증가했으니 질병 원인이다.”

이것은 상관관계를 인과관계로 오해하는 전형적인 오류입니다.

14. 기억해야 할 핵심 문장

✔ 보이는 단백질은 측정하기 쉬운 단백질이다
✔ 기능은 abundance가 아니라 상태(state)에 의해 결정된다
✔ 저농도 단백질이 시스템을 제어하는 경우가 많다
✔ fold change는 기능적 중요도를 의미하지 않는다

마무리

Proteomics 데이터 해석에서 가장 중요한 전환점은
“얼마나 많이 존재하는가”에서
“무엇을 하고 있는가”로 질문을 바꾸는 것
입니다.

이 전환이 이루어질 때:

  • biomarker 실패율 감소
  • pathway 해석 정확도 향상
  • multi-omics 통합 가치 증가

단백질 abundance vs 기능 문제
단백질 abundance vs 기능 문제

728x90