티스토리 뷰
– 분해를 예측한다는 것, 그리고 책임을 감당한다는 것
1. Stability는 왜 제약 데이터 과학의 마지막 보루처럼 남아 있었을까
제약 데이터 중에서
AI 적용이 비교적 빨리 자리 잡은 영역은 명확하다.
- 후보물질 스크리닝
- ADME/Tox 예측
- 합성 경로 최적화
반면 stability는 늘 뒤에 남아 있었다.
이유는 단순하지 않다.
stability는 단순한 “물성 예측” 문제가 아니라
시간, 환경, 판단, 규제가 모두 얽힌 영역이기 때문이다.
- 1개월 후 변화
- 3개월 후 변화
- 6개월, 12개월, 24개월…
그리고 그 결과는
“조금 변했다”가 아니라
“출시 가능/불가”라는 결론으로 이어진다.
AI가 예측을 틀렸을 때
그 대가는 너무 크다.
2. 전통적인 stability 접근의 본질적 한계
전통적인 stability 평가는
기본적으로 경험과 보수성의 누적이다.
- 가속 조건 (40°C / 75% RH)
- 장기 조건 (25°C / 60% RH)
- 중간 조건
이 데이터들을 쌓아서
보수적으로 shelf life를 설정한다.
이 접근의 문제는 두 가지다.
2.1 시간 비용
- 실제 장기 데이터는 기다려야만 나온다
- 개발 일정과 항상 충돌한다
2.2 정보 활용의 비효율
- 수천 개의 stability 데이터가 있어도
- 대부분은 “비슷한 결론”으로 끝난다
즉, 데이터는 많지만
패턴은 사람의 직관으로만 소화되고 있었다.
3. AI 기반 stability prediction의 출발점은 ‘대체’가 아니다
중요한 전제부터 짚어야 한다.
AI는 stability 시험을 대체하기 위해 도입되지 않았다.
실제 현장에서의 목적은 훨씬 현실적이다.
- 어떤 조건이 위험한지 미리 걸러내기
- 실험 설계를 더 집중적으로 만들기
- 불필요한 time point를 줄이기
즉,
결정을 대신하는 AI가 아니라
결정을 앞당기는 AI다.
4. AI 기반 stability 모델의 주요 접근 방식
4.1 분자 구조 기반 예측 (Molecule-centric)
가장 초기에 시도된 접근이다.
- 화학 구조
- functional group
- pKa, logP
- 반응성 descriptor
이를 기반으로
- hydrolysis 위험
- oxidation 취약성
- photolability
를 예측한다.
한계
- 실제 분해는 formulation과 matrix에 크게 의존
- “이 분자는 불안정하다”는 말은
실제 제형 안정성과 다를 수 있다
그래서 단독으로는 거의 쓰이지 않는다.
4.2 Degradation pathway 학습 기반 모델
이 단계부터 실제 제약 데이터가 중요해진다.
- Known impurity profile
- Stress test 결과
- LC-MS/MS degradation spectrum
모델은 질문을 이렇게 바꾼다.
“이 분자는 불안정한가?”
→ “이 조건에서 어떤 분해 경로가 활성화될 가능성이 높은가?”
이 접근은
stability를 ‘하나의 수치’가 아니라
‘경로의 확률 분포’로 본다는 점에서 의미가 크다.
4.3 Time-series 기반 stability curve 예측
최근 가장 활발한 영역이다.
- 초기 time point 데이터
- 가속 조건 데이터
- 온도, 습도, pH
을 입력으로 받아
장기 stability curve를 예측한다.
여기서 중요한 점은
AI가 “6개월 후 수치”를 맞히는 게 아니라
- 어느 구간에서 변화가 가속되는지
- 변곡점이 언제 나타나는지
를 예측하려 한다는 것이다.
5. 실제 제약 데이터 적용 사례 (현실 버전)
사례 1. Early formulation screening에서의 실패 회피
한 글로벌 제약사에서는
pre-formulation 단계에서 AI stability 모델을 도입했다.
- 다양한 buffer
- pH range
- excipient 조합
을 모두 실험하는 대신,
AI 모델로
“분해 리스크가 높은 조합”을 먼저 제외했다.
결과는 단순했다.
- 최종적으로 실패할 formulation 상당수를
초기 단계에서 제거 - 실험 자원은 줄었지만
- 최종 성공률은 유지
여기서 중요한 점은
AI 예측이 맞았느냐가 아니라
틀릴 가능성이 높은 실험을 줄였다는 것이다.
사례 2. Shelf life 설정을 위한 보조 지표로의 활용
어떤 회사는
AI 모델을 shelf life 결정에 직접 사용하지 않았다.
대신 이렇게 썼다.
- 전통적 통계 모델 + 실험 데이터
- AI 모델은 risk indicator 역할
즉,
- “이 결과는 통계적으로 문제 없지만
AI 관점에서는 위험 신호가 있다”
이런 경우에만
추가 시험을 설계했다.
AI는 결정을 내리지 않았고,
결정의 불확실성을 가시화했다.
사례 3. Impurity 증가 패턴 조기 감지
Stability data에서 가장 골치 아픈 건
예상치 못한 impurity의 late appearance다.
일부 조직에서는
- 초기 LC-MS impurity profile
- trace level 변화 패턴
을 학습시켜
“지금은 미미하지만,
후반에 커질 가능성이 있는 impurity”를 예측했다.
이건 규제 대응 측면에서 매우 중요하다.
- specification 재설계
- 추가 tox 평가
- control strategy 조정
을 미리 준비할 수 있기 때문이다.
6. 왜 많은 AI stability 모델이 ‘조용히’ 사라지는가
현장에서 자주 보는 실패 패턴도 있다.
6.1 데이터 정합성 문제
- assay 변경
- column 변경
- LOQ 변화
이런 것들이
모델 입장에서는 갑작스러운 분포 붕괴다.
stability 데이터는
AI 친화적인 데이터가 아니다.
6.2 “예측 정확도”에 집착한 경우
- RMSE
- R²
수치는 좋아 보이지만
실제 질문에는 답을 못 한다.
“이 데이터를 믿고 시험을 줄여도 되는가?”
이 질문에 답하지 못하면
모델은 결국 참고용으로만 남는다.
7. 성공적인 AI stability 적용의 공통점
실제로 살아남은 사례들을 보면
공통점이 있다.
- 결정을 대신하지 않는다
- 불확실성을 줄이는 방향으로 쓰인다
- 규제 문서에 “AI”라는 단어를 최소화한다
- 내부적으로는 사람이 최종 판단한다
AI는
stability 과학자의 경쟁자가 아니라
조기 경보 시스템으로 자리 잡았다.
8. 규제 관점에서의 현실적 접근
현재 규제 기관의 태도는 비교적 명확하다.
- AI 예측 자체를 인정하지 않는 건 아니다
- 하지만 근거 없이 대체하는 것은 절대 허용하지 않는다
그래서 현실적인 전략은 이렇다.
- AI 결과를 supporting evidence로 위치시키기
- 왜 이 모델을 참고했는지 설명 가능하게 만들기
- 모델이 틀렸을 때의 대응 시나리오 명시
AI는 문서에서 조용해야 한다.
대신 논리는 더 단단해야 한다.
9. Stability prediction의 미래는 “숫자”가 아니다
앞으로의 AI stability 모델은
“몇 개월”을 맞히는 방향으로 가지 않을 가능성이 크다.
대신
- 어느 조건이 가장 위험한가
- 언제부터 관리 전략을 바꿔야 하는가
- 어떤 impurity를 먼저 봐야 하는가
이런 질문 중심의 도구가 될 것이다.
마무리하며
AI 기반 stability prediction은
아직 완성된 기술이 아니다.
하지만 이미 한 가지는 분명해졌다.
Stability는 더 이상 기다림의 과학만은 아니다.
AI는 시간을 압축하고,
사람은 책임을 진다.
이 역할 분담이 명확할수록
AI stability 모델은
현장에서 오래 살아남는다.

'제약산업' 카테고리의 다른 글
| 분석팀을 위한 LIMS–ELN–CDMS 통합 전략 (0) | 2026.01.13 |
|---|---|
| Annotation confidence를 정량화하는 새로운 기준 (0) | 2026.01.13 |
| Metabolomics에서 annotation bottleneck 붕괴 시나리오 (0) | 2026.01.12 |
| 장비 vendor 로그 데이터의 한계와 활용 전략 (1) | 2026.01.11 |
| LC-MS 장비 예방 정비(PM) 스케줄링을 위한 predictive maintenance 모델 (0) | 2026.01.10 |
| Foundation model을 이용한 MS/MS 스펙트럼 해석, 분석가는 무엇을 다르게 보게 되는가 (0) | 2026.01.09 |
| AI 기반 calibration curve 이상치(outlier) 탐지 시스템 (0) | 2026.01.08 |
| Retention time drift 예측 모델 구축으로 재분석률 낮추기 (0) | 2026.01.07 |
- Total
- Today
- Yesterday
- Spatial metabolomics
- lc-ms/ms
- 대사체 분석
- LC-MS
- 신약개발
- 분석팀
- bioanalysis
- 디지털헬스케어
- 바이오마커
- 머신러닝
- 분석
- 미래산업
- 항암제
- metabolomics
- 팬데믹
- 정밀의료
- 정량분석
- 신약 개발
- Multi-omics
- 약물분석
- AI
- 치료제
- Lipidomics
- Toxicometabolomics
- 바이오의약품
- 임상시험
- 제약산업
- 약물개발
- Targeted Metabolomics
- 제약
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
