티스토리 뷰

728x90

Metabolomics에서 ‘보이는 것’과 ‘존재하는 것’의 차이
Metabolomics에서 ‘보이는 것’과 ‘존재하는 것’의 차이

— 우리는 데이터를 보고 있는가, 아니면 조건이 만든 환상을 보고 있는가

metabolomics 데이터를 처음 열어보는 순간,
대부분의 사람들은 비슷한 감정을 느낀다.

“이 안에 모든 정보가 들어 있다.”

수천 개의 peak,
정리된 feature table,
그리고 통계적으로 정리된 결과들.

이 모든 것이
샘플의 상태를 그대로 보여주는 것처럼 느껴진다.

하지만 이 믿음은
생각보다 쉽게 무너진다.

왜냐하면 metabolomics에서
가장 중요한 구분이 하나 있기 때문이다.

“보이는 것”과 “실제로 존재하는 것”은 다르다.

그리고 이 차이를 이해하지 못하는 순간,
해석은 이미 틀어지기 시작한다.

1. LC-MS는 ‘현실’을 보여주지 않는다

많은 사람들이 LC-MS 데이터를
현실의 반영이라고 생각한다.

하지만 실제로 LC-MS는
현실을 그대로 보여주지 않는다.

오히려 이렇게 정의하는 것이 더 정확하다.

“특정 조건에서 선택된 일부 신호만 보여주는 시스템”

이 말이 중요한 이유는 간단하다.

우리가 보는 데이터는

  • 존재하는 모든 metabolite가 아니라
  • 검출된 일부 metabolite이기 때문이다

즉,

보이지 않는다고 해서 존재하지 않는 것은 아니다.

2. 존재하지만 보이지 않는 것들

실제 biological sample에는
수많은 metabolite가 존재한다.

하지만 그중 상당수는
LC-MS 데이터에 나타나지 않는다.

그 이유는 다양하다.

1) Ionization 실패

이온화되지 않으면
존재해도 검출되지 않는다.

2) Ion suppression

다른 강한 신호에 의해
묻혀버리는 경우

3) LC 조건 미스매치

분리 조건에 맞지 않으면
검출되지 않음

4) Detection threshold

신호가 약하면
noise로 처리됨

결국,

존재는 하지만
데이터에서는 “없는 것”처럼 보인다.

3. 반대로, 보이지만 존재하지 않는 것들

더 위험한 경우도 있다.

데이터에는 존재하지만
실제로는 존재하지 않을 수도 있다.

예를 들면:

  • fragment ion
  • adduct
  • isotope
  • in-source reaction product
  • noise

이들은 LC-MS에서는
“명확한 peak”로 보인다.

하지만 실제 biological entity는 아니다.

즉,

“보인다”는 이유만으로
존재를 확신하는 순간 오류가 시작된다.

4. 숫자는 진실처럼 보인다

metabolomics 데이터는
숫자로 정리된다.

  • intensity
  • fold change
  • p-value

이 숫자들은 매우 설득력 있다.

하지만 중요한 사실이 있다.

이 숫자들은 ‘농도’가 아니라 ‘신호’다

그리고 신호는 다음에 영향을 받는다.

  • ionization efficiency
  • matrix effect
  • LC separation
  • instrument condition

즉,

숫자는 정확해 보이지만
그 의미는 불안정하다.

5. 패턴은 현실이 아닐 수 있다

PCA나 clustering 결과를 보면
명확한 separation이 나타나는 경우가 많다.

이때 우리는 쉽게 결론을 내린다.

“두 그룹은 확실히 다르다”

하지만 이 패턴이
항상 biological difference를 의미하는 것은 아니다.

패턴은 다음으로도 만들어진다.

  • batch effect
  • sample preparation 차이
  • LC-MS drift

즉,

패턴은 존재하지만
그 의미는 우리가 해석하는 것이다.

6. annotation이 만드는 착각

feature에 이름이 붙는 순간
데이터는 갑자기 “현실”이 된다.

  • metabolite 이름
  • pathway 연결
  • literature 근거

이 과정은 분석의 완성처럼 보인다.

하지만 실제로는
가장 위험한 단계일 수 있다.

왜냐하면

  • 잘못된 매칭
  • ambiguous identification
  • database bias

가 존재하기 때문이다.

즉,

이름이 붙었다고 해서
그것이 진짜라는 보장은 없다.

7. 우리는 발견하고 있는 것이 아니다

untargeted metabolomics는
종종 “발견의 도구”라고 불린다.

하지만 실제로는 다르다.

이 과정은 다음의 연속이다.

  • detection
  • filtering
  • normalization
  • selection

즉,

우리는 발견(discovery)이 아니라
선택(selection)을 하고 있다.

그리고 이 선택 과정은
결과를 크게 바꾼다.

8. 가장 위험한 순간

분석을 하다 보면
모든 것이 잘 맞아떨어지는 순간이 온다.

  • 통계적으로 유의
  • pathway 연결됨
  • 기존 연구와 일치

이 순간은 매우 만족스럽다.

하지만 동시에 가장 위험하다.

왜냐하면 이때
사람은 의심을 멈추기 때문이다.

9. 실무에서 반드시 던져야 할 질문

좋은 metabolomics 분석가는
데이터를 보면서 항상 질문한다.

“이게 정말 존재하는 것인가?”

그리고 이어서 묻는다.

“이건 단지 보이는 것일 뿐인가?”

이 두 질문이
분석의 방향을 결정한다.

10. 그 차이를 줄이는 방법

완전히 해결할 수는 없지만
줄일 수는 있다.

1) Orthogonal validation

  • targeted LC-MS
  • 다른 분석 플랫폼

2) Internal standard 활용

signal vs 실제 변화 구분

3) LC 조건 다양화

조건에 따라 유지되는 signal 확인

4) annotation 신중하게

확신이 아니라 “가능성”으로 표현

결론: metabolomics는 해석의 학문이다

metabolomics는
단순한 측정 기술이 아니다.

이건

“보이는 것과 존재하는 것을 구분하는 학문”이다

우리가 보는 데이터는
현실의 일부일 뿐이다.

그리고 그 일부를 가지고
전체를 설명하려 할 때
오류는 반드시 발생한다.

그래서 가장 중요한 것은 기술이 아니라
태도다

  • 의심하는 태도
  • 검증하는 태도
  • 확신을 늦추는 태도

이 세 가지가 없다면
아무리 좋은 데이터도
잘못된 결론으로 이어질 수 있다.

728x90