티스토리 뷰

728x90

 

1. "피크는 있는데 RT가 어긋났다"는 말이 반복되기 시작했다

LC-MS/MS 분석을 일정 기간 이상 운영해본 조직이라면, 재분석(reanalysis)의 상당수가 분석법 자체의 실패가 아니라 retention time(RT) drift에서 시작된다는 사실을 체감하고 있을 것이다. QC 기준을 살짝 벗어난 RT, 내부표준과의 미묘한 어긋남, batch 후반으로 갈수록 커지는 RT 변동은 결국 analyst의 재확인 요청으로 이어지고, 그 결과 재주입·재전처리·재분석이라는 악순환이 발생한다.

특히 국내 제약사 R&D 조직에서는 임상 샘플, TDM, 대규모 비임상 분석이 병행되면서 하루에도 여러 batch가 돌아간다. 이 환경에서 RT drift는 단순한 장비 컨디션 문제가 아니라 분석 조직의 생산성을 갉아먹는 구조적 문제가 된다.

2. Retention time drift는 왜 반복적으로 발생하는가

RT drift는 하나의 원인으로 설명되지 않는다. 오히려 여러 작은 요인이 누적되면서 발생한다.

첫째, LC 시스템의 열적 안정성이다. 컬럼 오븐 온도, autosampler 온도, 실험실 환경 온도는 미세하게 변하고, 이 변화는 RT에 그대로 반영된다.

둘째, mobile phase 상태 변화다. 장시간 운전 시 용매의 탈기 상태, buffer 농도 미세 변화, pH drift가 누적된다.

셋째, column aging과 batch 간 차이다. 같은 컬럼이라도 사용량이 늘어나면 stationary phase의 특성이 달라지고, 이는 gradient에서 RT 이동으로 나타난다.

넷째, 시스템 운영 변수다. injection sequence, wash 조건, dwell volume 차이, pump seal 상태 등은 RT drift를 예측 불가능하게 만든다.

이처럼 RT drift는 단일 이벤트가 아니라 시간에 따라 축적되는 현상이며, 사후 대응만으로는 재분석률을 줄이기 어렵다.

3. 기존 RT 관리 방식의 한계

대부분의 분석팀은 다음과 같은 방식으로 RT 문제를 관리해왔다.

  • RT tolerance window 설정
  • 내부표준(IS) RT 기준 비교
  • QC sample에서만 RT 확인

이 방식은 단순하고 직관적이지만, 한계가 분명하다. RT window는 보수적으로 잡을수록 false alarm이 늘어나고, 느슨하게 잡으면 실제 drift를 놓친다. 또한 QC sample은 batch 전체의 RT 변화를 대표하지 못하는 경우가 많다.

결국 RT 문제는 발생 후 발견되는 구조에 머무르게 되고, 이는 재분석을 줄이지 못한다.

4. 관점을 바꾸다: RT를 예측 가능한 변수로 다룬다

RT drift 예측 모델의 핵심은 단순하다. RT를 고정된 값이 아니라, 시간과 조건에 따라 변하는 연속 변수로 인식하는 것이다.

즉, "이번 batch에서 RT가 틀렸다"가 아니라,
"현재 시스템 상태라면 이 analyte의 RT는 이 범위로 이동할 가능성이 높다"라고 예측하는 접근이다.

이 관점 전환이 가능해지면, RT drift는 QC 실패 요인이 아니라 사전에 관리 가능한 리스크가 된다.

5. 1단계: 예측 모델 구축을 위한 데이터 정의

RT 예측 모델의 품질은 데이터 정의에서 이미 결정된다. 국내 제약사 R&D 조직에서 현실적으로 활용 가능한 데이터는 다음과 같다.

  • historical LC-MS/MS raw data
  • injection order
  • batch ID 및 run time
  • column ID 및 사용 이력
  • mobile phase lot 및 교체 시점
  • system suitability 결과

중요한 점은, 새로운 실험을 추가할 필요가 거의 없다는 것이다. 이미 존재하는 로그 데이터와 분석 결과를 구조화하는 것만으로도 충분한 출발점이 된다.

6. Feature engineering: LC-MS/MS에 특화된 변수 설계

RT 예측에서 유효한 feature는 단순히 시간 정보만이 아니다.

  • injection index (batch 내 순서)
  • 이전 injection과의 RT 차이
  • IS RT drift 패턴
  • gradient 시작 후 경과 시간
  • column usage cumulative count

이러한 feature는 RT drift의 방향성과 속도를 모델이 학습하도록 돕는다. 특히 IS 기반 feature는 분석법 특이성을 반영하는 데 매우 중요하다.

 

7. 모델 선택: 복잡함보다 안정성

RT 예측은 classification이 아니라 regression 문제다. 국내 제약사 환경에서는 다음과 같은 모델이 현실적이다.

  • Linear regression + regularization
  • Random forest regression
  • Gradient boosting regression

딥러닝 기반 시계열 모델도 가능하지만, 설명 가능성과 유지보수 측면에서 과도한 복잡성은 오히려 리스크가 된다.

8. 예측 결과를 어떻게 활용할 것인가

RT 예측 모델의 목적은 "정확한 RT 숫자"가 아니라 의사결정 지원이다.

실무적으로는 다음과 같이 활용된다.

  • 예상 RT 범위 이탈 시 사전 alert
  • batch 중단 또는 조건 조정 판단
  • 재주입 대상 샘플 선별
  • analyst 검토 우선순위 지정

이렇게 되면, 재분석은 사후 대응이 아니라 선별적 개입으로 바뀐다.

9. 재분석률 감소로 이어지는 구조

RT 예측 모델이 자리 잡으면 다음과 같은 변화가 나타난다.

  • 불필요한 재주입 감소
  • QC 실패율 감소
  • analyst 판단 일관성 증가
  • batch 전체 처리 시간 단축

결과적으로 RT drift는 더 이상 분석팀의 스트레스 요인이 아니라, 관리 가능한 운영 지표가 된다.

10. 국내 제약사 R&D 조직 도입 시 주의할 점

  • RT 예측 모델은 SOP를 대체하지 않는다
  • QC 기준과 충돌하지 않도록 설계해야 한다
  • QA와 초기부터 커뮤니케이션이 필요하다
  • 모델 성능보다 운영 안정성이 중요하다

이 원칙이 지켜지지 않으면, 모델은 PoC에서 멈추게 된다.

11. 마무리하며

Retention time drift는 LC-MS/MS 분석에서 피할 수 없는 현상이다. 그러나 예측하지 못하는 현상일 필요는 없다.

RT 예측 모델은 분석팀의 판단을 빼앗는 도구가 아니라, 판단을 앞당기는 도구다. 국내 제약사 R&D 조직에서 재분석률을 줄이고 분석 신뢰성을 높이고자 한다면, RT drift를 데이터로 다루는 시도는 충분히 검토할 가치가 있다.

Retention time drift 예측 모델 구축으로 재분석률 낮추기
Retention time drift 예측 모델 구축으로 재분석률 낮추기

 

728x90