티스토리 뷰

728x90

– 서로 다른 생물학적 층위가 다른 이야기를 할 때

Transcriptomics와 Metabolomics 결과가 충돌할 때 어떻게 해석할 것인가
Transcriptomics와 Metabolomics 결과가 충돌할 때 어떻게 해석할 것인가

 

Multi-omics 연구를 진행하다 보면 연구자들이 가장 당황하는 순간 중 하나가 있다. Transcriptomics 결과와 metabolomics 결과가 서로 다른 방향을 가리키는 상황이다.

예를 들어 RNA-seq 분석에서는 특정 metabolic pathway 관련 유전자들이 강하게 up-regulated 되어 있는데, metabolomics 데이터에서는 해당 pathway의 metabolite 농도가 거의 변하지 않거나 오히려 감소하는 경우가 나타날 수 있다. 연구자는 자연스럽게 다음과 같은 질문을 던지게 된다.

“둘 중 어느 데이터가 맞는 것일까?”

하지만 실제 생물학에서는 이 질문 자체가 조금 잘못된 경우가 많다. transcriptomics와 metabolomics는 같은 현상을 서로 다른 층위에서 관찰하는 데이터이기 때문에 반드시 동일한 방향의 변화를 보여야 하는 것은 아니다. 오히려 두 데이터가 서로 충돌하는 순간은 생물학적 조절 메커니즘을 이해할 수 있는 중요한 단서가 되기도 한다.

이 글에서는 transcriptomics와 metabolomics 결과가 서로 맞지 않을 때 어떤 관점으로 해석해야 하는지, 그리고 이러한 불일치가 왜 발생하는지 살펴보고자 한다.

1. RNA 발현은 ‘가능성’을 의미할 뿐이다

Transcriptomics 데이터에서 측정되는 것은 기본적으로 mRNA abundance이다. 즉 특정 유전자가 얼마나 많이 전사되고 있는지를 보여준다.

하지만 mRNA 수준의 변화가 곧바로 metabolic activity로 이어지는 것은 아니다. 유전자 발현은 단지 효소가 만들어질 가능성이 높아졌다는 신호일 뿐이며, 실제 metabolic flux는 다음과 같은 다양한 요소에 의해 결정된다.

  • 단백질 번역 효율
  • 단백질 안정성
  • 효소 활성 조절
  • substrate availability
  • cofactor 농도

이 때문에 transcriptomics 데이터만으로 metabolic pathway의 실제 활성도를 판단하기는 어렵다. metabolomics 데이터와 충돌하는 것처럼 보이는 이유도 바로 여기에 있다.

2. 단백질 단계의 조절

Transcriptomics와 metabolomics 사이에는 중요한 중간 단계가 존재한다. 바로 proteomics, 즉 단백질 수준이다.

많은 연구에서 mRNA와 단백질 abundance 사이의 상관관계는 생각보다 낮은 것으로 알려져 있다. 그 이유는 단백질 수준에서 다양한 조절이 발생하기 때문이다.

대표적인 예는 다음과 같다.

  • translation efficiency 차이
  • protein degradation
  • post-translational modification
  • enzyme activation/inactivation

예를 들어 특정 metabolic enzyme의 mRNA가 증가하더라도, 해당 단백질이 빠르게 분해되거나 활성화되지 않는다면 실제 metabolic pathway는 거의 변화하지 않을 수 있다.

이러한 경우 transcriptomics와 metabolomics 결과는 자연스럽게 서로 다른 방향을 보이게 된다.

3. 대사 시스템의 항상성(homeostasis)

대사 시스템의 가장 중요한 특징 중 하나는 항상성 유지 능력이다. 생체는 metabolic imbalance가 발생하지 않도록 다양한 보상 메커니즘을 가지고 있다.

예를 들어 어떤 metabolic pathway의 enzyme 발현이 증가하면 다음과 같은 일이 동시에 발생할 수 있다.

  • feedback inhibition
  • substrate depletion
  • alternative pathway activation

이러한 조절 메커니즘 때문에 pathway 관련 유전자 발현이 증가하더라도 metabolite 농도는 거의 변하지 않을 수 있다.

즉 transcriptomics 데이터는 “시스템이 변화를 시도하고 있다”는 신호일 수 있지만, metabolomics 데이터는 “시스템이 여전히 균형을 유지하고 있다”는 상태를 보여줄 수도 있다.

4. Metabolite 농도와 metabolic flux는 다르다

Metabolomics 데이터는 보통 metabolite concentration을 측정한다. 하지만 metabolic pathway의 실제 활성도는 metabolite 농도보다 metabolic flux와 더 밀접하게 관련되어 있다.

예를 들어 glycolysis pathway를 생각해 보자. pathway flux가 증가하더라도 intermediate metabolite 농도는 크게 변하지 않을 수 있다.

이러한 상황은 다음과 같이 설명할 수 있다.

  • substrate 공급 증가
  • 효소 활성 증가
  • downstream pathway 활성 증가

이 세 가지가 동시에 일어나면 metabolite pool size는 거의 일정하게 유지될 수 있다. 이 경우 transcriptomics 데이터에서는 enzyme 발현 증가가 나타나지만 metabolomics에서는 metabolite 농도 변화가 거의 나타나지 않을 수 있다.

5. 시간 차이(time lag)

Transcriptomics와 metabolomics 데이터는 서로 다른 시간 스케일을 반영한다.

mRNA 발현 변화는 비교적 빠르게 나타나지만, metabolic state 변화는 더 느리게 나타날 수도 있다. 반대로 metabolite 농도는 매우 빠르게 변할 수 있지만 RNA 발현은 느리게 반응할 수도 있다.

예를 들어 어떤 stimulus가 세포에 가해졌다고 가정해 보자.

초기 단계

  • metabolite 변화 먼저 발생

후기 단계

  • gene expression 변화 발생

이러한 시간 차이를 고려하지 않으면 transcriptomics와 metabolomics 결과가 서로 충돌하는 것처럼 보일 수 있다.

6. 세포 유형과 조직 이질성

특히 조직 샘플을 분석할 때 중요한 문제는 cellular heterogeneity이다. transcriptomics와 metabolomics 데이터는 서로 다른 세포 집단의 영향을 다르게 받을 수 있다.

예를 들어 특정 조직에서

  • RNA-seq → 특정 세포 유형의 발현 변화 반영
  • metabolomics → 전체 조직의 metabolite pool 반영

이러한 차이 때문에 두 데이터가 서로 다른 biological signal을 나타낼 수 있다.

7. Microbiome 영향

Metabolomics 데이터는 종종 microbiome 대사의 영향을 크게 받는다. 특히 혈액이나 장 관련 샘플에서는 microbiome-derived metabolite가 상당한 비율을 차지한다.

반면 transcriptomics 데이터는 보통 host gene expression을 반영한다.

이 경우 metabolomics 변화가 host gene expression과 직접 연결되지 않을 수 있다. 예를 들어 특정 metabolite 변화가 microbiome metabolism 때문이라면 transcriptomics 데이터에서는 관련 변화가 나타나지 않을 수 있다.

8. 기술적 요인의 가능성

물론 transcriptomics와 metabolomics 데이터 충돌이 항상 생물학적 이유 때문만은 아니다. 다음과 같은 기술적 요인도 고려해야 한다.

  • metabolite annotation 오류
  • batch effect
  • sample preparation 차이
  • normalization 방법 차이

특히 untargeted metabolomics에서는 일부 metabolite identification이 불확실할 수 있기 때문에 데이터 해석 전에 이러한 부분을 확인하는 것이 중요하다.

9. 데이터 충돌을 해석하는 현실적인 접근

Transcriptomics와 metabolomics 결과가 서로 맞지 않을 때 가장 중요한 것은 어느 데이터가 맞는지를 판단하려는 접근에서 벗어나는 것이다.

대신 다음과 같은 질문을 던지는 것이 도움이 된다.

  • 이 pathway에서 실제 flux 변화가 있었을 가능성은 있는가
  • 관련 enzyme 단백질 수준은 어떻게 변했는가
  • metabolite ratio나 precursor-product 관계는 어떻게 변했는가
  • 시간에 따른 변화 패턴은 어떠한가

이러한 질문을 통해 두 데이터 사이의 관계를 더 정확하게 이해할 수 있다.

결론

Transcriptomics와 metabolomics 데이터가 서로 충돌하는 상황은 multi-omics 연구에서 매우 흔하게 나타난다. 하지만 이러한 불일치는 단순한 오류라기보다 생물학적 시스템의 복잡성을 반영하는 신호일 가능성이 높다.

RNA 발현, 단백질 수준, 대사체 농도는 각각 서로 다른 층위에서 생물학적 상태를 반영한다. 따라서 이들이 항상 동일한 방향의 변화를 보여야 하는 것은 아니다.

오히려 이러한 차이를 이해하는 과정에서 연구자는 효소 조절, metabolic flux, feedback regulation과 같은 중요한 생물학적 메커니즘을 발견할 수 있다. 결국 multi-omics 연구의 핵심은 서로 다른 데이터가 동일한 이야기를 하기를 기대하는 것이 아니라, 왜 서로 다른 이야기를 하고 있는지를 이해하는 것이라고 할 수 있다.

728x90