티스토리 뷰

728x90

– LC-MS 기반 metabolomics 해석에서 가장 자주 발생하는 오해

동일한 m/z가 서로 다른 생물학적 의미를 가질 수 있는 이유
동일한 m/z가 서로 다른 생물학적 의미를 가질 수 있는 이유

LC-MS 기반 metabolomics 데이터를 처음 분석하는 연구자들이 가장 자주 하는 질문 중 하나는 이것이다.

“같은 m/z라면 같은 metabolite 아닌가요?”

표면적으로 보면 이 질문은 매우 합리적으로 보인다. 질량분석기에서 측정되는 값은 mass-to-charge ratio(m/z)이기 때문에, 동일한 m/z가 검출된다면 동일한 분자를 의미할 것처럼 보이기 때문이다. 실제로 metabolomics 데이터 처리 과정에서도 feature는 보통 m/z와 retention time 조합으로 정의된다.

하지만 실제 LC-MS 데이터 해석에서는 동일한 m/z 값이 완전히 다른 생물학적 의미를 가진 신호일 수 있다. 심지어 같은 샘플에서 검출된 신호라도 그 해석이 완전히 달라질 수 있다. 이 현상은 metabolomics 연구에서 매우 중요한 문제이며, 잘 이해하지 못하면 데이터 해석에서 큰 오류로 이어질 수 있다.

이 글에서는 LC-MS 기반 metabolomics에서 동일한 m/z가 서로 다른 의미를 가질 수 있는 이유를 분석하고, 이러한 문제를 어떻게 이해해야 하는지 살펴보고자 한다.

1. 구조 이성질체 (Structural Isomers)

동일한 m/z가 다른 의미를 가질 수 있는 가장 대표적인 이유는 구조 이성질체 때문이다. 구조 이성질체는 분자식은 같지만 구조가 다른 화합물을 의미한다.

예를 들어 분자식 C6H12O6을 생각해 보자. 이 분자식은 다음과 같은 다양한 화합물을 포함할 수 있다.

  • glucose
  • fructose
  • galactose

이 화합물들은 동일한 정확 질량을 가지기 때문에 MS 분석에서는 동일한 m/z로 나타날 수 있다. 그러나 이들의 생물학적 역할은 상당히 다르다.

  • glucose → 주요 에너지 공급원
  • fructose → 간 대사와 관련
  • galactose → glycosylation pathway와 관련

즉 동일한 m/z가 완전히 다른 metabolic context를 의미할 수 있다.

2. 위치 이성질체 (Positional Isomers)

Metabolomics에서 특히 중요한 것은 위치 이성질체이다. 이는 분자 구조는 유사하지만 특정 functional group의 위치가 다른 경우를 의미한다.

Lipid metabolomics에서 이러한 문제는 매우 흔하게 나타난다. 예를 들어 동일한 phospholipid라도 fatty acid chain의 위치가 다르면 다른 분자가 된다.

예시:

  • PC(16:0/18:1)
  • PC(18:1/16:0)

이 두 화합물은 분자식이 동일하며 MS에서 동일한 m/z를 보일 수 있다. 하지만 세포막 구조나 대사 경로에서는 서로 다른 의미를 가질 수 있다.

3. 입체 이성질체 (Stereoisomers)

또 다른 중요한 경우는 입체 이성질체이다. 입체 이성질체는 동일한 분자식과 연결 구조를 가지지만 공간 배열이 다른 분자이다.

대표적인 예는 다음과 같다.

  • L-lactate
  • D-lactate

두 화합물은 동일한 질량을 가지며 LC-MS 분석에서는 구분이 어려운 경우도 있다. 하지만 생물학적으로는 완전히 다른 의미를 가진다.

  • L-lactate → 인간 세포 대사의 주요 산물
  • D-lactate → microbiome 대사와 관련

즉 동일한 m/z 신호가 host metabolism과 microbiome metabolism 중 어떤 것을 의미하는지에 따라 해석이 달라질 수 있다.

4. Adduct 형성

LC-MS 분석에서는 하나의 metabolite가 여러 가지 adduct 형태로 검출될 수 있다. 이는 electrospray ionization 과정에서 다양한 이온 형태가 생성되기 때문이다.

예를 들어 하나의 metabolite가 다음과 같은 형태로 나타날 수 있다.

  • [M+H]+
  • [M+Na]+
  • [M+K]+
  • [M+NH4]+

이러한 경우 서로 다른 m/z 값이 생성되지만, 반대로 다른 화합물이 동일한 adduct를 형성하면 같은 m/z 근처에서 overlapping signal이 나타날 수도 있다.

이 때문에 m/z 값만으로 화합물을 확정하는 것은 매우 위험하다.

5. In-source fragmentation

LC-MS 분석에서는 ion source에서 일부 분자가 이미 분해될 수 있다. 이를 in-source fragmentation이라고 한다.

이 경우 하나의 metabolite는 다음과 같은 신호를 동시에 생성할 수 있다.

  • intact ion
  • fragment ion

문제는 이러한 fragment ion이 다른 metabolite의 분자량과 동일한 m/z를 가질 수 있다는 점이다.

즉 분석 데이터에서 동일한 m/z가 실제로는 다음 두 가지 가능성을 동시에 포함할 수 있다.

  • 독립적인 metabolite
  • 다른 metabolite의 fragment

이 차이는 생물학적 해석에서 매우 큰 영향을 미친다.

6. Isotope peak

질량분석에서는 자연적으로 존재하는 동위원소 때문에 여러 isotope peak가 생성된다. 예를 들어 탄소에는 다음과 같은 동위원소가 존재한다.

  • 12C
  • 13C

이 때문에 하나의 metabolite는 다음과 같은 패턴을 보인다.

  • M peak
  • M+1 peak
  • M+2 peak

이러한 isotope peak는 다른 metabolite의 monoisotopic peak와 겹칠 수 있다. 결과적으로 동일한 m/z 위치에서 서로 다른 화합물의 신호가 동시에 존재할 수 있다.

7. Retention time이 중요한 이유

이러한 문제를 해결하기 위해 LC-MS 분석에서는 retention time(RT) 정보가 매우 중요하다.

m/z만으로는 화합물을 구분하기 어렵지만, RT 정보가 추가되면 분리 가능성이 높아진다. 서로 다른 구조의 화합물은 보통 다른 chromatographic behavior를 보이기 때문이다.

따라서 metabolomics 데이터에서는 feature를 보통 다음과 같이 정의한다.

m/z + retention time

그러나 이 방법도 완벽하지는 않다. 매우 유사한 구조를 가진 화합물은 RT도 비슷하게 나타날 수 있기 때문이다.

8. 동일한 m/z가 다른 biological story를 만든다

이러한 이유들 때문에 metabolomics 데이터에서 동일한 m/z는 여러 가지 서로 다른 biological interpretation으로 이어질 수 있다.

예를 들어 동일한 m/z feature가 다음 두 가지 후보를 가질 수 있다고 가정해 보자.

가능성 1

  • inflammatory lipid mediator

가능성 2

  • membrane structural lipid

두 화합물은 질량이 동일할 수 있지만 biological interpretation은 완전히 달라진다.

첫 번째 해석은 염증 반응 활성화를 의미할 수 있고, 두 번째 해석은 단순한 membrane remodeling을 의미할 수 있다.

9. Metabolomics 해석에서 중요한 사고 방식

이러한 이유로 metabolomics 데이터 해석에서는 다음과 같은 사고 방식이 중요하다.

첫째, m/z는 화합물의 정체가 아니라 단서라는 점을 인식해야 한다.
둘째, 하나의 feature는 여러 chemical identity 가능성을 가질 수 있다.
셋째, metabolite annotation은 항상 일정 수준의 불확실성을 포함한다.

이러한 관점을 가지면 데이터 해석에서 과도한 확신을 줄일 수 있다.

결론

LC-MS 기반 metabolomics에서 동일한 m/z 값이 항상 동일한 metabolite를 의미하는 것은 아니다. 구조 이성질체, 입체 이성질체, adduct 형성, in-source fragmentation, isotope peak 등 다양한 요인 때문에 하나의 m/z 신호는 여러 chemical identity 가능성을 포함할 수 있다.

이 때문에 metabolomics 데이터 해석에서는 m/z 값만으로 결론을 내리는 것이 아니라 chromatography, MS/MS 패턴, biological context를 함께 고려해야 한다.

결국 metabolomics 분석에서 중요한 것은 “이 m/z가 무엇인가?”라는 질문뿐 아니라, “이 신호가 어떤 가능성을 포함하고 있는가?”라는 질문을 함께 던지는 것이다.

728x90