본문 바로가기

제약산업

약물 재창출을 위한 AI 기반 후보 물질 도출 전략

– 네트워크 분석, 텍스트 마이닝을 활용한 리포지셔닝의 미래 –

1. 약물 재창출이란 무엇인가?

약물 재창출(Drug Repurposing) 혹은 약물 리포지셔닝(Drug Repositioning)은 원래 특정 질환 치료를 위해 개발된 약물이, 전혀 다른 질병의 치료에도 효과가 있음을 찾아내는 전략입니다. 기존의 약물은 이미 안전성, 약동학, 제조 공정이 검증되었기 때문에, 전임상 및 임상 초기 단계를 단축할 수 있는 장점이 있어 개발 비용과 시간 모두를 크게 절감할 수 있습니다.

예를 들어, 항암제로 개발되었던 탈리도마이드는 이후 다발성골수종 치료에 사용되었으며, 시알리스를 포함한 PDE5 억제제는 원래 고혈압 치료제로 개발되었지만 발기부전 치료제로 재창출되었습니다. 이처럼, 실패하거나 단종된 약물 중에도 새로운 적응증을 찾는다면 다시 수익화가 가능하다는 점에서 재창출 전략은 바이오 제약 기업뿐 아니라 스타트업, 학계에서도 주목받고 있습니다.

약물 재창출을 위한 AI 기반 후보 물질 도출 전략
약물 재창출을 위한 AI 기반 후보 물질 도출 전략

2. AI 기반 재창출의 부상: 왜 AI가 필요한가?

기존의 재창출은 우연적 발견이나 실험 중심의 접근이 많았지만, AI 기술의 도입으로 인해 방대한 생물학적, 임상적, 문헌 데이터를 통합적으로 분석할 수 있는 시대가 열렸습니다. 특히 AI는 다음과 같은 이유에서 강력한 도구로 작용합니다.

  • 수천 개 약물 후보 및 수만 개 유전자/단백질 타깃 간 상호작용 예측 가능
  • 임상 결과, 논문, 특허 등 비정형 데이터를 동시에 활용 가능
  • 시간과 비용을 단축하면서도 인간 연구자가 발견하지 못한 패턴을 탐지

이를 통해 기존 약물이 특정 질병과 어떤 생물학적 메커니즘으로 연결될 수 있는지를 추론할 수 있게 되었고, 최근에는 ‘AI-driven Drug Discovery’라는 새로운 산업 분야가 정립될 정도입니다.

 


3. 핵심 전략 ①: 네트워크 분석을 통한 약물-질병 연결망 탐색

(1) 개요

네트워크 분석(Network-based Analysis)은 약물, 질병, 유전자, 단백질 등을 노드(Node)로, 이들 간의 상호작용을 엣지(Edge)로 연결한 지식 그래프(Knowledge Graph)를 기반으로 후보 물질을 도출하는 전략입니다. 이는 생물학적 시스템이 하나의 연속된 네트워크로 구성되어 있다는 시스템 생물학(System Biology)의 개념에서 출발합니다.

(2) 적용 예시

  • Drug-Gene-Disease 네트워크를 기반으로, 특정 유전자가 활성화된 질병 네트워크 내에서, 이미 해당 유전자를 타깃하는 약물이 있는지 탐색
  • 유사한 네트워크 중심성을 가지는 약물 간 유사 적응증 탐색

예를 들어, 한 연구에서는 COVID-19에 대해 숙주 세포의 유전체 단백질 상호작용망(PPI network)을 분석, 기존 약물 중 네트워크 내에서 중심성을 가진 약물로 로파비린, 하이드록시클로로퀸 등을 도출했습니다.

(3) 사용 기술

  • Graph Convolutional Networks (GCN)
  • Node2Vec, DeepWalk 기반 약물/질병 임베딩
  • Cytoscape, Gephi 등의 시각화 도구

4. 핵심 전략 ②: 텍스트 마이닝을 활용한 문헌 기반 후보 탐색

(1) PubMed, ClinicalTrials.gov, 특허 문서 활용

AI 기반 텍스트 마이닝(NLP) 기술은 논문, 임상시험 등록 정보, 특허 등 비정형 문서에서 약물-질병 간 관련성 힌트를 자동 추출하는 데 사용됩니다. 예를 들어, 논문 제목/초록/본문에서 'Drug X alleviates inflammation in Disease Y'라는 문장이 발견되면, 이를 자동 인식하여 관계 추출을 수행합니다.

(2) 최근 도구와 모델

  • SciBERT, BioBERT: 생물학 특화된 BERT 모델
  • MetaMap, cTAKES: 의료 용어 정규화
  • Spark NLP, AllenNLP 기반 문장 레벨 추론

특히 BioBERT는 100만 편 이상의 생의학 논문을 사전학습하여, 약물-질병 간의 잠재적 관계를 고정밀도로 예측하는 데 효과적입니다.

(3) 적용 사례

  • Insilico Medicine은 자체 텍스트 마이닝 엔진을 활용해 항노화 타깃 약물을 재창출
  • IBM Watson은 암 치료제 후보군을 문헌 기반으로 스코어링하여 후속 연구 추천

 


5. 벤치마크 데이터셋과 모델 검증

(1) 대표 벤치마크

데이터셋                                                                      특징                                               활용 예시
DrugBank FDA 승인 약물 정보 약물-타깃 매핑
CTD (Comparative Toxicogenomics Database) 약물-질병 관계 기반 데이터 네트워크 분석 기반 모델 학습
LINCS L1000 약물 처리 후 유전자 발현 패턴 Deep Learning 기반 약물 효과 예측
PubChem BioAssay 생물학적 활성 데이터 QSAR 모델 훈련에 사용
 

(2) 평가 지표

  • AUC-ROC, PR-AUC: 이진 분류 문제에서 성능 확인
  • Top-K Accuracy: 상위 K개 예측 중 실제 질병 타깃 포함 여부
  • Mean Reciprocal Rank (MRR): 순위 기반 후보 약물 리포지셔닝 적절성 평가

이 외에도 외부 검증 세트(hold-out validation), temporal validation, cross-study validation 등을 통한 정량적 성능 검증이 필수적입니다.


6. 국내외 산업 및 학계 동향

(1) 글로벌 기업

  • BenevolentAI: Knowledge Graph 기반 플랫폼으로 코로나19 치료제 바리시티닙(Baricitinib)을 재창출
  • Recursion Pharma: 고속 이미지 기반 Deep Learning 분석으로 재창출 후보 도출
  • Healx (UK): 희귀질환에 대한 약물 재창출 전문, ALS, 근이영양증 타깃 신약 개발

(2) 국내 기업 및 연구기관

  • SK바이오팜: AI 기반 CNS 적응증 재창출 시도
  • 한국한의학연구원: 전통약물의 리포지셔닝을 위한 지식 그래프 구축 연구
  • 가톨릭대-서울대 연합 프로젝트: BioBERT를 활용한 면역질환 약물 탐색

7. 한계와 도전 과제

AI 기반 리포지셔닝 전략은 강력하지만, 다음과 같은 현실적인 한계도 존재합니다.

  • 데이터 품질 문제: 서로 다른 기관/논문/DB 간 용어 통일성 부족
  • 생물학적 해석력 부족: 딥러닝 기반 결과의 블랙박스성
  • 임상 이전의 검증 부족: 알고리즘이 제시한 약물이 실제 생체 내 효과를 발휘할지 여부 불확실

이를 극복하기 위해선 AI 예측 → 전임상 검증 → 소규모 임상시험으로 이어지는 통합 R&D 플랫폼 구축이 필요하며, 최근에는 ‘AI-human co-discovery’의 형태로 연구자와 AI가 상호작용하는 구조도 제안되고 있습니다.


8. 결론: 신약개발의 미래, 재창출과 AI의 만남

약물 재창출은 ‘실패한 약물에 새로운 생명을 불어넣는 전략’일 뿐 아니라, 기존 임상경험을 바탕으로 더 신속하고 안전하게 신약을 공급할 수 있는 경로이기도 합니다. 특히 AI 기술의 발전으로, 무한에 가까운 조합과 패턴 중에서 최적의 타깃과 약물을 연결할 수 있는 가능성이 열리고 있습니다.

앞으로는 다양한 병태생리 기전이 밝혀지고, 정밀의료가 정착함에 따라 환자 맞춤형 약물 재창출 플랫폼이 확산될 것이며, 국가 간 데이터 공유와 글로벌 AI 네트워크의 연계도 더욱 중요해질 것입니다. 제약 산업의 미래는 AI와 리포지셔닝의 접점에서 새로운 돌파구를 모색하고 있습니다.