티스토리 뷰

728x90

 

1. 분석팀에서 "이 피크를 믿어도 되나"라는 말이 나오기 시작했다

LC-MS/MS 분석을 오래 해온 조직일수록, peak를 보는 눈은 숙련되어 있다. 문제는 그 숙련이 특정 개인에게 의존해 있다는 점이다. TDM, 대규모 임상, 고처리량 분석이 일상이 된 지금, 하루 수백~수천 개의 chromatogram을 사람이 일일이 판단하는 구조는 더 이상 지속 가능하지 않다. 국내 제약사 R&D 조직에서도 최근 몇 년 사이 공통적으로 등장하는 고민이 있다.

“같은 데이터를 두고 분석자마다 판단이 다르다”, “QC에서는 문제 없었는데 ISR에서 깨진다”, “신규 인력이 들어오면 peak 판단 기준을 다시 교육해야 한다”. 이 지점에서 peak integration 자동화보다 한 단계 앞선 개념, 즉 peak classification이 본격적으로 논의되기 시작한다.

Peak classification은 ‘적분을 자동으로 해준다’는 개념이 아니다. 그보다 먼저, 이 피크가 신뢰 가능한 신호인지 아닌지를 분류하는 역할이다. 이 기능이 제대로 작동하면, 분석자는 모든 데이터를 보지 않아도 되고, QC와 ISR 실패율 역시 구조적으로 낮출 수 있다.

2. 왜 지금 국내 제약사에 peak classification 자동화가 필요한가

국내 제약사 분석 조직의 환경은 몇 가지 공통된 특징을 가진다. 장비 수준은 글로벌과 큰 차이가 없지만, 인력은 항상 빠듯하다. 임상 단계가 진행될수록 분석 건수는 늘어나고, 동시에 규제 대응에 대한 요구 수준도 높아진다.

이런 환경에서 peak 판단을 전적으로 사람에게 맡기는 구조는 세 가지 리스크를 만든다.

첫째, 재현성 리스크다. 동일 샘플을 서로 다른 분석자가 볼 때 판단이 달라질 수 있다. 이는 ISR 실패로 직결된다.

둘째, 확장성 리스크다. 분석 규모가 커질수록 숙련 분석자의 병목이 심해진다.

셋째, 규제 리스크다. 왜 특정 피크를 제외했는지, 왜 이 값을 채택했는지에 대한 설명이 사람의 경험에 의존하게 된다.

Peak classification 모델은 이 세 가지 리스크를 동시에 완화할 수 있는 도구다. 단, ‘AI를 도입했다’는 선언이 아니라 조직이 실제로 운영 가능한 형태로 들어와야 의미가 있다.

3. 도입 목표를 잘못 설정하면 프로젝트는 시작 전에 실패한다

많은 조직이 peak classification을 이야기할 때 처음부터 이렇게 묻는다.

“딥러닝으로 완전 자동화가 가능한가?”

현실적인 답은 ‘아니다’에 가깝다. 그리고 그 질문 자체가 프로젝트를 실패로 이끄는 출발점이 되기 쉽다. 국내 제약사 R&D 조직에서 설정해야 할 목표는 훨씬 명확하다.

  • 모든 피크를 자동으로 판단하려 하지 않는다
  • 사람이 반드시 봐야 할 데이터만 선별한다
  • 잘못된 피크를 놓치지 않는 것이 최우선이다

즉, human-in-the-loop 구조가 기본 전제다. 모델은 분석자를 대체하는 것이 아니라, 분석자의 판단 부담을 줄이고 판단 기준을 일정하게 만드는 역할을 맡는다.

4. 1단계: 준비기 (0~6개월) – 기술보다 조직을 먼저 정비한다

4-1. 분석팀 내부 역할 정의

가장 먼저 해야 할 일은 ‘AI 담당자’를 뽑는 것이 아니라, 분석팀 내 책임 주체를 명확히 하는 것이다. 모델은 IT 부서가 아니라 분석팀의 도구다. 따라서 요구사항 정의, 성능 판단 기준은 반드시 분석팀이 가져가야 한다.

4-2. 데이터 정리: 새로운 실험보다 과거 데이터를 본다

대부분의 조직에는 이미 수년 치 raw data가 쌓여 있다. 여기에는 성공한 데이터뿐 아니라 실패한 데이터, 애매했던 피크도 모두 포함되어 있다. Peak classification 모델 학습에 있어 가장 가치 있는 데이터는 바로 이 ‘애매한 데이터’다.

이 단계에서는 완벽한 annotation을 목표로 하지 않는다. 최소한의 기준으로, 신뢰 가능한 peak / 명확한 noise / 판단이 갈렸던 케이스 정도만 구분해도 충분하다.

5. 2단계: PoC 단계 (6~12개월) – 작게, 그러나 끝까지 간다

5-1. 범위를 의도적으로 제한한다

PoC 단계에서 가장 흔한 실패는 욕심이다. 여러 assay, 여러 matrix를 한 번에 다루려다 모두 어중간해진다. 성공 확률을 높이려면 다음과 같이 범위를 자른다.

  • 단일 assay
  • 단일 matrix
  • QC 실패 이력이 있는 데이터 포함

5-2. 모델 선택: 복잡함보다 설명 가능성

Random forest, gradient boosting 같은 전통적 ML 모델은 여전히 강력하다. 특히 규제 환경에서는 모델이 왜 그런 판단을 했는지 설명할 수 있어야 한다. 딥러닝은 PoC 성공 이후에 고려해도 늦지 않다.

6. 3단계: Pilot 운영 (12~24개월) – 실험실에 올려본다

이 단계부터 모델은 실제 분석 workflow 안으로 들어온다. 모든 결과를 자동으로 확정하지 않는다. 모델이 flag를 달고, 분석자가 최종 판단을 내린다. 중요한 것은 override 기록이다.

분석자가 모델 판단을 뒤집은 이유가 쌓이면, 그 자체가 다음 모델 개선의 학습 데이터가 된다.

7. 4단계: Production 확장 – 조직 자산으로 만든다

Pilot을 통과한 모델은 더 이상 개인 프로젝트가 아니다. SOP에 반영되고, 버전 관리가 시작되며, audit trail이 관리된다. 이때 중요한 원칙은 하나다.

모델은 분석법(validation)의 일부가 아니라, 분석 프로세스를 보조하는 도구다.

이 관점이 정리되지 않으면 QA, 규제 대응에서 불필요한 갈등이 생긴다.

8. 규제 대응 관점에서의 peak classification

ICH M10 환경에서 peak classification 모델은 ‘검증 대상’이 아니라 ‘통제 대상’에 가깝다. 모델 변경 이력, 성능 모니터링, human override 기록이 남아 있다면 충분히 방어 가능하다.

9. 분석팀 실무자용 체크리스트

  • 우리가 자동화하려는 것은 판단인가, 적분인가?
  • historical data를 충분히 활용하고 있는가?
  • false negative를 최소화하는 구조인가?
  • QA와 초기에 논의했는가?
  • override 기록을 자산으로 남기고 있는가?

10. 마무리하며

Peak classification 모델은 단기간에 성과를 보여주는 마법 같은 도구가 아니다. 그러나 제대로 도입되면, 분석팀의 피로도를 낮추고 데이터 신뢰성을 조직 차원에서 끌어올린다.

국내 제약사 R&D 조직에서 이 기술의 진짜 가치는 ‘AI 도입’이라는 말이 아니라, 분석 판단의 기준을 조직 자산으로 만드는 과정에 있다.

머신러닝 기반 Peak Classification 모델 도입 로드맵 – 국내 제약사 R&D 조직을 위한 현실적 접근
머신러닝 기반 Peak Classification 모델 도입 로드맵 – 국내 제약사 R&D 조직을 위한 현실적 접근

 

728x90
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2026/01   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함