티스토리 뷰

728x90

AI가 Metabolite Annotation보다 더 크게 바꾸는 영역
AI가 Metabolite Annotation보다 더 크게 바꾸는 영역

많은 사람들이 AI를 '동정(Annotation) 도구'로 생각하지만, 진짜 변화는 다른 곳에서 시작되고 있다

최근 Metabolomics 분야에서 AI 이야기가 나오면 대부분 가장 먼저 떠올리는 것이 있다.

바로 metabolite annotation이다.

실제로 수많은 논문과 컨퍼런스 발표가 다음과 같은 주제를 다룬다.

  • MS/MS spectrum prediction
  • In silico fragmentation
  • Spectral matching
  • Unknown metabolite identification
  • Structure prediction

이런 흐름만 보면 AI가 Metabolomics에 가져올 가장 큰 변화는 "정체를 모르는 피크를 맞추는 것"처럼 보인다.

물론 이것도 매우 중요한 변화다.

실제로 Untargeted Metabolomics에서 가장 큰 병목 중 하나가 annotation이라는 사실은 누구도 부정하지 않는다.

수천 개 feature를 검출해도 실제로 이름을 붙일 수 있는 것은 일부에 불과하다.

그래서 AI 기반 annotation 기술은 분명 Metabolomics 발전에 큰 기여를 하고 있다.

하지만 흥미롭게도 최근 몇 년간 Metabolomics를 오래 해온 연구자들 사이에서는 조금 다른 이야기가 나오기 시작했다.

AI가 가장 크게 바꾸는 영역은 annotation이 아닐 수도 있다는 것이다.

오히려 annotation보다 훨씬 근본적인 영역,

즉 연구 설계, 데이터 품질 관리, 생물학적 해석, 임상 적용 방식 자체를 바꾸고 있다는 관점이 점점 힘을 얻고 있다.

실제로 향후 10년을 기준으로 보면 annotation은 AI 혁명의 일부일 뿐이고, 더 큰 변화는 다른 곳에서 일어날 가능성이 높다.

1. Annotation은 생각보다 연구의 마지막 단계에 가깝다

많은 사람들이 Metabolomics workflow를 다음과 같이 생각한다.

샘플 준비

LC-MS 분석

Peak detection

Annotation

생물학적 해석

즉 annotation이 핵심 문제라고 본다.

하지만 실제 연구 실패 사례를 보면 의외의 사실이 나타난다.

결론이 잘못되는 이유의 상당수는 annotation 이전 단계에서 이미 발생한다.

예를 들어:

  • Batch effect
  • Sample degradation
  • Missing value
  • Matrix effect
  • Normalization artifact

등이다.

아무리 annotation을 잘해도 입력 데이터 자체가 왜곡되어 있다면 생물학적 결론은 틀릴 수 있다.

2. AI가 가장 먼저 바꾸는 것은 Quality Control(QC)이다

실제로 최근 가장 빠르게 발전하는 분야 중 하나는 AI 기반 QC다.

전통적으로 QC는 연구자가 직접 확인했다.

  • TIC 확인
  • PCA 확인
  • Internal standard 확인
  • RT shift 확인

하지만 대규모 연구에서는 한계가 있다.

수천 개 샘플을 사람이 모두 검토하기 어렵다.

AI는:

  • 이상 샘플 탐지
  • Batch drift 감지
  • Instrument 이상 예측
  • Peak quality 평가

를 자동화하기 시작했다.

그리고 이 변화는 annotation보다 훨씬 직접적으로 데이터 품질을 개선한다.

3. 진짜 혁신은 Missing Value 처리에 있을 수 있다

Metabolomics 데이터를 분석해 본 사람이라면 안다.

Missing value는 annotation보다 더 흔한 문제다.

어떤 피크는 검출되고,

어떤 피크는 사라진다.

현재는:

  • Mean imputation
  • KNN
  • Random forest

등을 사용한다.

하지만 AI는 훨씬 복잡한 패턴을 학습할 수 있다.

특히 다변량 구조를 이용하면 단순 보정보다 훨씬 현실적인 추정이 가능하다.

4. AI는 "정량 데이터 자체"를 재구성하기 시작한다

과거에는 LC-MS 신호를 있는 그대로 사용했다.

지금은 달라지고 있다.

AI는:

  • Peak deconvolution
  • Noise removal
  • Signal reconstruction
  • Peak boundary optimization

을 수행한다.

즉 AI는 annotation 이전에 데이터 자체를 다시 만드는 단계로 들어오고 있다.

5. Batch Effect 보정이 더 큰 변화일 수 있다

임상 Metabolomics의 가장 큰 문제 중 하나는 batch effect다.

실제로 많은 biomarker 연구 실패 원인이 여기에 있다.

AI는 복잡한 batch 구조를 학습하여:

  • Nonlinear correction
  • Hidden batch factor detection
  • Instrument drift prediction

을 수행할 수 있다.

만약 이것이 안정적으로 가능해진다면 재현성 문제 자체가 크게 줄어들 수 있다.

6. AI는 Feature보다 Sample을 이해하기 시작한다

전통적인 Metabolomics는 feature 중심이다.

Feature 1 증가

Feature 2 감소

Feature 3 변화 없음

하지만 AI는 sample 전체 패턴을 본다.

즉 개별 metabolite보다 metabolome 전체를 해석한다.

이는 매우 큰 사고방식 변화다.

7. Biomarker Discovery 방식 자체가 변하고 있다

과거에는:

Volcano plot

상위 metabolite 선택

Biomarker 후보

구조였다.

AI는 다르다.

수백 개 feature의 조합을 본다.

흥미로운 점은 개별적으로 유의하지 않은 metabolite도 조합에서는 중요한 경우가 많다는 것이다.

즉 biomarker의 정의 자체가 바뀌고 있다.

8. Pathway Analysis보다 Patient Stratification이 더 큰 변화

많은 연구자는 여전히 pathway에 집중한다.

하지만 임상에서는 pathway보다 중요한 질문이 있다.

"이 환자는 누구와 비슷한가?"

AI는 metabolome 기반으로 환자를 군집화한다.

그 결과:

동일 질병

서로 다른 metabolic subtype

발견이 가능해진다.

정밀의료 측면에서는 annotation보다 훨씬 큰 영향이다.

9. AI는 Multi-omics Integration의 중심이 된다

Metabolomics 단독 연구는 점점 줄고 있다.

현재는:

  • Genomics
  • Transcriptomics
  • Proteomics
  • Metabolomics

를 함께 분석한다.

문제는 사람이 이 복잡성을 해석하기 어렵다는 점이다.

AI는 이러한 계층 간 관계를 모델링하는 데 매우 강력하다.

향후 Multi-omics 시대에서 AI의 역할은 annotation보다 훨씬 중요해질 가능성이 높다.

10. 실제로 가장 큰 변화는 Hypothesis Generation이다

가장 근본적인 변화는 여기일 수 있다.

과거 연구자는:

가설

실험

결과

순서로 연구했다.

AI 시대에는:

데이터

패턴 발견

가설 생성

검증

순서가 된다.

즉 AI는 분석 도구가 아니라 가설 생성 엔진이 되고 있다.

11. Mechanism 연구도 바뀌고 있다

현재 Metabolomics 연구의 가장 어려운 부분은 mechanism 해석이다.

왜 이 metabolite가 증가했는가?

왜 이 pathway가 활성화되었는가?

AI는 단순 annotation을 넘어서:

  • Causal inference
  • Network modeling
  • Dynamic pathway prediction

으로 확장되고 있다.

물론 아직 초기 단계지만 잠재력은 크다.

12. 임상 적용 영역에서는 Annotation보다 Prediction이 중요하다

병원 입장에서 생각해보자.

의사가 정말 알고 싶은 것은:

"이 피크가 정확히 무엇인가?"

가 아니다.

실제로는:

  • 환자가 악화될 것인가?
  • 약물이 효과가 있을 것인가?
  • 재발할 것인가?

이다.

즉 임상에서는 annotation보다 prediction value가 더 중요할 수 있다.

AI는 바로 이 부분에서 강점을 가진다.

13. 가장 큰 변화는 연구자의 역할 변화일 수 있다

과거 연구자는:

  • Peak 확인
  • Annotation 확인
  • 통계 분석

에 많은 시간을 사용했다.

AI가 발전할수록 이러한 작업은 자동화될 가능성이 높다.

반면 연구자의 역할은:

  • 연구 질문 설계
  • Biological interpretation
  • Validation 전략 수립

으로 이동할 가능성이 크다.

14. AI가 Annotation을 완전히 해결해도 문제가 남는다

가정해보자.

10년 후 AI가 모든 metabolite를 완벽하게 annotation한다고.

그러면 모든 문제가 해결될까?

아니다.

여전히 남는다.

  • Correlation vs causation
  • Sample quality
  • Stability issue
  • Batch effect
  • Biological interpretation
  • Clinical validation

즉 annotation은 중요한 문제지만 전체 문제의 일부에 불과하다.

결론

많은 사람들이 AI가 Metabolomics를 바꾸는 방식으로 metabolite annotation의 자동화를 떠올린다. 실제로 이는 중요한 변화이며, 수많은 unknown feature를 해석할 수 있게 만들고 있다.

그러나 더 큰 변화는 annotation 이후가 아니라 annotation 이전과 이후의 전체 연구 과정에서 일어나고 있다. AI는 이미 QC 자동화, batch effect 보정, missing value 처리, signal reconstruction, biomarker discovery, patient stratification, multi-omics integration, hypothesis generation 영역을 빠르게 변화시키고 있다.

특히 향후 10년을 기준으로 보면 AI의 가장 큰 영향은 "이 피크가 무엇인가?"를 답하는 것이 아니라, "이 데이터가 무엇을 의미하는가?"를 해석하는 방향으로 이동할 가능성이 높다.

결국 Metabolomics에서 AI의 진짜 혁명은 metabolite 이름을 더 많이 맞추는 것이 아니라, 연구자들이 이전에는 보지 못했던 패턴과 질문을 발견하도록 만드는 데 있을지도 모른다.

728x90