티스토리 뷰

728x90

 

1. Calibration curve에서 문제는 항상 마지막에 드러난다

LC-MS/MS 기반 bioanalysis에서 calibration curve는 단순한 계산 절차가 아니다. 분석 결과 전체의 신뢰성을 떠받치는 구조물에 가깝다. 그럼에도 불구하고, 실제 분석 현장에서는 calibration curve의 문제를 가장 나중에, 그것도 ISR 실패나 재분석 요구가 들어온 뒤에야 인지하는 경우가 많다.

특정 농도 포인트 하나가 튀어 있는 것처럼 보이지만, 명확히 제외할 근거가 부족해 고민하다가 결국 재분석으로 이어지는 경험은 국내 제약사 분석팀이라면 누구나 한 번쯤 겪어봤을 것이다. 문제는 이러한 판단이 여전히 사람의 눈과 경험에 크게 의존하고 있다는 점이다.

이 지점에서 최근 주목받는 접근이 바로 AI 기반 calibration curve 이상치(outlier) 탐지 시스템이다. 이는 단순히 통계 기법을 자동화하는 것이 아니라, 분석 조직의 판단 기준을 데이터 기반으로 정형화하려는 시도에 가깝다.

2. Calibration curve 이상치는 왜 반복적으로 발생하는가

Calibration curve에서 이상치는 단일 원인으로 설명되지 않는다. 오히려 여러 작은 변수가 겹쳐서 나타난다.

첫째, 저농도 영역의 신호 불안정성이다. LLOQ 근처에서는 noise, carryover, matrix effect의 영향이 증폭된다.

둘째, 전처리 변동성이다. 특히 manual step이 남아 있는 workflow에서는 pipetting error, evaporation 차이가 농도 포인트 하나를 흔든다.

셋째, 기기 상태의 미세 변화다. spray instability, RT drift, ion transmission 변화는 특정 injection에서만 영향을 미칠 수 있다.

넷째, 내부표준(IS) 거동의 비일관성이다. IS 자체가 matrix 영향을 받거나 adsorption 문제를 겪는 경우, response ratio가 왜곡된다.

이러한 요인들은 개별적으로는 치명적이지 않지만, calibration curve에서는 한 포인트의 이상으로 집약되어 나타난다.

3. 기존 이상치 판단 방식의 한계

전통적으로 calibration curve 이상치는 다음과 같은 기준으로 판단되어 왔다.

  • back-calculated concentration의 허용 오차 초과
  • 잔차(residual) 기반 판단
  • R² 값 저하
  • analyst의 시각적 판단

이 방식은 규제 친화적이고 직관적이지만, 한계도 분명하다. 특히 borderline case에서는 “제외해도 될 것 같지만, 명확한 근거가 부족한” 상황이 반복된다. 이때 결정은 개인의 성향에 따라 달라지고, 이는 조직 차원의 일관성을 해친다.

4. 관점 전환: 이상치를 ‘제거 대상’이 아닌 ‘패턴’으로 본다

AI 기반 이상치 탐지의 핵심은, 이상치를 단일 포인트의 문제가 아니라 패턴의 결과로 해석하는 데 있다.

즉, “이 점이 튀었는가?”가 아니라,
“이 점은 과거 정상 curve 패턴과 얼마나 다른가?”를 묻는다.

이 접근이 가능해지면, 이상치는 사후 제거 대상이 아니라 사전 경고 신호가 된다.

5. 1단계: 학습 데이터 정의 – 새로운 실험은 필요 없다

국내 제약사 R&D 조직에서 AI 기반 이상치 탐지를 도입할 때 가장 큰 오해는 ‘새로운 데이터가 필요하다’는 생각이다. 실제로는 이미 충분한 데이터가 존재한다.

  • historical calibration curve 데이터
  • 각 포인트의 response, ratio, residual
  • batch 정보, 분석자 정보
  • QC 및 ISR 결과

특히 과거에 논란이 되었던 curve, 재분석으로 이어진 batch는 모델 학습에 있어 매우 가치 있는 자산이다.

6. Feature engineering: calibration curve 특화 변수

모델이 이상치를 학습하려면, 단순 농도–response 값 이상의 정보가 필요하다.

  • 농도 구간별 residual 패턴
  • 인접 포인트와의 기울기 변화
  • IS response 안정성 지표
  • batch 내 위치(injection order)
  • 동일 농도 historical 분포 대비 편차

이러한 feature는 analyst가 직관적으로 느끼는 “이상함”을 수치로 변환하는 역할을 한다.

7. 모델 선택 전략: 규제 환경을 고려한다

Calibration curve 이상치 탐지는 classification 문제에 가깝다. 국내 제약사 환경에서는 다음 접근이 현실적이다.

  • rule-based + ML hybrid
  • isolation forest, one-class SVM
  • gradient boosting 기반 binary classifier

중요한 것은 모델의 복잡성보다 설명 가능성운영 안정성이다. Inspector 앞에서 “왜 이 포인트를 이상치로 봤는가”를 설명할 수 있어야 한다.

8. 결과 해석과 analyst 개입 구조

AI 기반 시스템은 최종 결정을 내리지 않는다. 대신 다음을 제공한다.

  • 이상치 likelihood score
  • 과거 유사 사례 비교
  • exclusion 시 curve 변화 예측

최종 제외 여부는 여전히 analyst의 몫이다. 다만 그 판단은 이제 데이터로 뒷받침된다.

9. 재분석률 감소로 이어지는 메커니즘

이상치 탐지 시스템이 자리 잡으면, 재분석률은 구조적으로 감소한다.

  • 불필요한 논쟁 감소
  • curve 승인 속도 증가
  • ISR 실패 사전 차단
  • batch 재수행 빈도 감소

결과적으로 calibration curve는 ‘불안 요소’가 아니라, 예측 가능한 관리 대상이 된다.

10. 국내 제약사 도입 시 주의사항

  • SOP를 대체하려 하지 말 것
  • QA와 초기부터 논의할 것
  • 모델 결과를 기록으로 남길 것
  • 성능보다 일관성을 우선할 것

이 원칙이 지켜지지 않으면, 시스템은 PoC에서 멈춘다.

11. 마무리하며

AI 기반 calibration curve 이상치 탐지 시스템의 가치는 자동화 그 자체에 있지 않다. 진짜 가치는, 분석 조직의 판단 기준을 데이터로 남기는 과정에 있다.

국내 제약사 R&D 조직에서 재분석률과 분석 리스크를 동시에 줄이고자 한다면, calibration curve를 더 이상 감각의 영역에 두어서는 안 된다.

 

AI 기반 calibration curve 이상치(outlier) 탐지 시스템
AI 기반 calibration curve 이상치(outlier) 탐지 시스템

 

728x90