티스토리 뷰

728x90

대사체 기반 약물 반응성 예측의 새로운 패러다임

1. 서론: 약물 반응의 복잡성을 넘어, ‘대사체’로 본 새로운 가능성

신약 개발 과정에서 가장 큰 난제 중 하나는 약물의 체내 대사 과정을 예측하는 일이다.
사람의 유전형(genotype), 단백질 발현(proteome), 그리고 미생물 생태(microbiome)까지, 약물의 체내 반응은 복잡한 생물학적 네트워크 속에서 이뤄진다.

그 중심에 있는 것이 바로 metabolome, 즉 대사체다.
대사체는 생체 내에서 일어나는 모든 화학 반응의 ‘결과물’이자, 약물이 세포 수준에서 실제로 어떤 변화를 일으키는지를 반영하는 가장 근접한 지표다.

그런데 문제는 이 대사체 네트워크가 너무 복잡하고 비선형적이라는 것이다.
한 가지 약물이 여러 효소 경로를 거치며 다양한 대사산물을 만들어내고, 이들이 다시 상호작용하면서 예기치 못한 약물–대사체 상호작용 (drug–metabolite interaction, DMI) 을 유발하기도 한다.

이러한 복잡한 상호작용을 기존의 통계적 모델로는 충분히 설명하기 어려웠다.
그러나 최근, 생성형 AI(Generative AI) 의 등장은 이러한 한계를 근본적으로 흔들어놓고 있다.

2. Generative AI의 등장과 약물 대사 예측의 패러다임 전환

생성형 AI는 단순히 패턴을 인식하는 수준을 넘어, 새로운 화합물 구조나 대사 반응 경로 자체를 “생성” 할 수 있다.
대표적인 기술로는 다음과 같은 것들이 있다.


기술 특징 활용 예시
Graph Neural Network (GNN) 분자 구조를 그래프로 학습 대사체–약물 상호작용 네트워크 모델링
Variational Autoencoder (VAE) 화합물의 잠재 공간(latent space) 탐색 새로운 약물 대사산물 구조 예측
Diffusion Model 점진적 확률적 변환을 통해 데이터 생성 약물 분해 경로 시뮬레이션
Transformer 기반 모델 대규모 omics 데이터 학습 cross-omics correlation 예측 (예: metabolite ↔ transcriptome)

이 중 특히 Diffusion + Transformer 혼합 모델은 LC-MS/MS로 측정된 실제 대사체 스펙트럼 데이터를 기반으로 대사 반응 경로를 시뮬레이션하는 데 탁월한 성능을 보이고 있다.

예를 들어, 한미약품이나 삼성바이오로직스 같은 국내 제약사가 보유한 신약 후보물질의 대사체 데이터를 입력으로 넣으면, AI가 해당 화합물이 간세포 내에서 어떤 대사산물로 전환될 가능성이 높은지를 ‘가상 생성’할 수 있다.

3. Drug–Metabolite Interaction (DMI)의 중요성

약물–대사체 상호작용(DMI)은 크게 다음 세 가지 형태로 구분된다.

  1. Competitive inhibition
    → 대사 효소(CYP450 등)에 대한 경쟁적 결합
  2. Metabolite modulation
    → 대사체가 다른 약물의 활성화 또는 불활성화를 조절
  3. Toxic metabolite accumulation
    → 특정 대사체가 세포 독성을 유발 (예: NAPQI in acetaminophen)

기존에는 이러한 DMI를 실험적으로 확인하기 위해 in vitro liver microsome assayin vivo PK study 를 수행해야 했다.
하지만 수천 개의 화합물과 수만 개의 대사체 조합을 실험적으로 검증하는 것은 거의 불가능하다.

이 때문에, AI 기반 in silico 예측 모델이 절실히 필요하게 된 것이다.

4. LC-MS/MS 기반 학습 데이터 구축: 현실과 AI의 접점

AI 모델이 신뢰할 수 있으려면, 먼저 정확하고 정제된 대사체 데이터셋이 필요하다.
이를 위해 핵심적인 역할을 하는 것이 바로 LC-MS/MS (liquid chromatography–tandem mass spectrometry) 분석이다.

(1) LC-MS/MS 데이터 구조화

  • Precursor ion m/z, retention time, fragment spectrum 등의 정보를 feature로 추출
  • MS² fingerprinting을 통해 대사체 구조 유사성 기반 embedding 생성
  • AI 학습을 위한 metabolite vectorization pipeline 구축

(2) 대사 반응 annotation

  • KEGG, HMDB, DrugBank 등 public DB와 cross-reference
  • in-house metabolite library (국내 제약사별)와 통합
  • unknown metabolite는 MS/MS spectral similarity 기반으로 AI가 구조 제안

이렇게 구축된 데이터는 단순한 스펙트럼 모음이 아니라, 화학적 의미를 지닌 학습 가능한 representation으로 변환된다.

5. Generative AI의 학습 구조: 약물–대사 반응 시뮬레이터

AI가 DMI를 학습하는 방식은 크게 세 단계로 구성된다.

  1. Encoding (Representation learning)
    • 약물 구조(SMILES)와 대사체 스펙트럼 데이터를 임베딩 공간으로 매핑
    • 화학적 유사성뿐 아니라 생물학적 경로 정보(KEGG Pathway)를 포함
  2. Generation (Reaction prediction)
    • Transformer 또는 Diffusion 모델이 입력된 약물 구조로부터 가능한 대사산물을 생성
    • 생성된 후보 대사산물의 MS/MS 스펙트럼을 예측하여 LC-MS/MS 결과와 비교
  3. Interaction inference (DMI 예측)
    • 생성된 대사체 중 효소 결합성, 반응속도, 독성 예측을 통해 상호작용 가능성 평가
    • Bayesian framework를 통해 불확실성(uncertainty)까지 계산

6. 실제 적용 사례: 항암제 대사체 상호작용 모델링

(1) Tamoxifen (유방암 치료제)

  • CYP2D6 유전형에 따라 활성 대사체(Endoxifen) 생성량이 다름
  • AI 모델이 대사 효소 변이에 따른 반응속도 차이를 학습
  • 환자 맞춤형 용량 예측 가능 (PK 모델과 연계)

(2) Irinotecan (대장암 치료제)

  • SN-38 대사체가 UGT1A1 효소에 의해 글루쿠로니드화됨
  • 특정 대사체 축적 시 심각한 독성 (neutropenia) 발생
  • Generative AI가 UGT 효소 포화 조건에서의 대사 경로를 재현

(3) Imatinib (CML 치료제)

  • 다중 대사 경로를 거치며 CYP3A4와 상호작용
  • AI 기반 DMI 모델이 병용약물(예: 항진균제)과의 대사 간섭을 사전에 예측

이러한 모델링을 통해, 제약사는 임상 2상 이전 단계에서 대사체 수준의 독성 리스크를 가시화할 수 있다.

7. AI 예측 결과의 ‘설명 가능성 (Explainability)’ 확보

AI가 예측한 결과를 단순히 “신뢰”할 수는 없다.
특히 의약품 규제기관(FDA, EMA, MFDS)은 예측 근거의 설명 가능성(XAI) 을 요구한다.

이를 위해, 최근 다음과 같은 기술이 적용되고 있다.

  • SHAP (SHapley Additive exPlanations):
    각 대사체 feature가 예측에 기여한 정도를 정량화
  • Graph attention visualization:
    분자 구조 상의 반응 hotspot을 시각화
  • Counterfactual metabolite generation:
    특정 대사 경로 변형 시 예측 결과가 어떻게 달라지는지 비교

즉, AI 모델이 ‘왜 그 대사체를 생성했는가’를 화학적 근거와 함께 해석 가능하게 만드는 것이다.

8. Multi-omics 통합: Genomics–Proteomics–Metabolomics 연계

AI 기반 DMI 예측의 정확도를 높이려면, 단순한 대사체 정보만으로는 부족하다.
따라서 최근에는 multi-omics data integration이 핵심으로 부상하고 있다.


Omics 주요 정보  AI 모델 입력 형태
Genomics 대사 효소 유전자 변이 (CYP, UGT 등) one-hot or embedding
Proteomics 효소 발현량, post-translational modification quantitative matrix
Metabolomics LC-MS/MS 기반 대사체 농도, pathway flux vector representation

Generative AI는 이 데이터를 통합하여 “환자별 대사 네트워크” 를 가상으로 재현한다.
즉, 각 환자에게 맞는 digital twin 기반 약물 반응 시뮬레이션 이 가능해지는 것이다.

9. 국내 제약 산업에서의 적용 전망

국내 제약사는 최근 AI-omics 융합 분야에서 빠르게 움직이고 있다.

  • 유한양행:
    AI-driven DMPK 시뮬레이션 플랫폼 개발 중
  • GC녹십자:
    항체약물접합체(ADC) 대사체 분석과 AI 기반 대사 경로 예측 결합

국내 연구 환경에서도 LC-MS/MS + AI + multi-omics 삼박자를 갖춘 플랫폼은
향후 임상 예측 정확도를 획기적으로 높일 수 있을 것으로 기대된다.

10. 결론: “AI는 실험의 대체물이 아니라, 예측의 가속기”

Generative AI는 약물 대사 연구를 단순히 빠르게 만드는 기술이 아니다.
그것은 “예상치 못한 대사 반응을 사전에 이해하는 지적 도구” 다.

AI가 예측한 가상의 대사체를 LC-MS/MS로 검증하고, 그 결과를 다시 모델에 학습시키는 순환 과정은
결국 인간의 과학적 통찰과 기계의 학습 능력이 결합된 지속적 진화의 사이클이다.

앞으로의 신약개발은 단순한 후보물질 발굴을 넘어,
대사체 수준에서 예측 가능한 약물 반응성 설계”로 진화할 것이다.

Generative AI는 그 여정의 중심에 서 있다.
그리고 그 기반에는 변함없이, 정확한 LC-MS/MS 데이터가 자리한다.

 

Generative AI를 활용한 Drug–Metabolite Interaction 예측 모델
Generative AI를 활용한 Drug–Metabolite Interaction 예측 모델

728x90