티스토리 뷰
– 데이터 자동화, Explainable AI, Anomaly Detection

“분석가는 대체되지 않는다. 다만, 분석의 방식은 바뀐다”
LC-MS/MS는 오랫동안 제약·바이오 분석의 gold standard였다.
정확도, 민감도, 선택성—어느 하나 빠지지 않는 기술이지만,
아이러니하게도 이 장비는 사람의 개입이 가장 많이 필요한 분석 시스템이기도 하다.
- 시퀀스 설계
- 샘플 전처리 편차
- integration 판단
- outlier 제거
- validation 결과 해석
이 모든 과정은 여전히 분석가의 경험과 감각에 의존해 왔다.
그리고 바로 이 지점에서 AI는 LC-MS/MS와 만날 수밖에 없었다.
“AI는 LC-MS/MS를 자동화하기 위해 들어온 것이 아니라,
사람이 감당하지 못하는 복잡도를 흡수하기 위해 들어왔다.”
Part 1. LC-MS/MS 데이터 자동화
– “자동화는 속도를 높이기 위한 것이 아니라, 일관성을 확보하기 위한 것이다”
많은 조직이 AI 기반 자동화를 도입하면서 가장 먼저 기대하는 것은 처리 속도다.
하지만 bioanalysis에서 속도보다 중요한 것은 언제나 재현성이다.
1-1. LC-MS/MS 데이터 파이프라인의 구조적 한계
전통적인 LC-MS/MS 데이터 흐름은 다음과 같다.
- Raw data acquisition
- Vendor software 기반 processing
- Analyst manual review
- Report export
- LIMS 입력
이 구조의 문제는 명확하다.
- 사람 손을 거칠수록 variability는 증가한다
- 판단 기준이 문서화되지 않는다
- 동일 데이터라도 분석가에 따라 다른 결론이 나온다
AI 기반 자동화는 이 지점을 정면으로 겨냥한다.
1-2. AI가 개입할 수 있는 자동화 영역
실제 현장에서 시도되고 있는 자동화 예시는 다음과 같다.
- Peak detection & integration rule 학습
- Batch-to-batch drift 보정
- Calibration curve 적합 모델 자동 선택
- QC failure 패턴 자동 분류
- 재분석 필요 여부 사전 예측
중요한 점은,
👉 AI가 ‘결정’을 내리는 것이 아니라,
사람의 판단을 일관되게 재현하도록 설계된다는 것이다.
Part 2. Explainable AI(XAI) –
“규제 환경에서 AI는 설명되지 않으면 존재할 수 없다”
Bioanalysis 영역에서 AI 도입이 가장 더딘 이유는 명확하다.
“그래서, 왜 그렇게 판단했는가?”
이 질문에 답할 수 없다면,
아무리 성능이 좋아도 규제 환경에서는 사용할 수 없다.
2-1. Black box AI가 bioanalysis에 위험한 이유
- Outlier를 제거한 이유를 설명할 수 없는 모델
- 특정 batch를 이상으로 분류했지만 근거를 제시하지 못하는 시스템
- Audit trail로 재현되지 않는 의사결정
이런 AI는 효율을 높이기는커녕,
👉 data integrity 리스크를 폭발적으로 키운다.
2-2. LC-MS/MS에서의 Explainable AI 적용 예
실무적으로 의미 있는 XAI 접근은 다음과 같은 질문에 답해야 한다.
- 어떤 feature(peak width, S/N, RT shift)가 판단에 가장 크게 기여했는가?
- 이 판단은 과거 어떤 batch 패턴과 유사한가?
- 동일한 조건에서 사람이 판단했을 때와 얼마나 일치하는가?
이 파트에서는,
- feature importance 기반 QC 판단
- attention mechanism을 활용한 chromatogram 해석
- 규제 대응을 고려한 XAI 설계 원칙
을 중심으로 “설명 가능한 자동화”의 현실적인 경계를 다룬다.
Part 3. Anomaly Detection –
“문제가 생겼을 때 찾는 것이 아니라, 생기기 전에 감지한다”
LC-MS/MS 분석에서 가장 비용이 큰 사건은 무엇일까?
- 한두 개의 실패한 샘플이 아니다
- 이미 끝난 batch 전체를 재분석해야 하는 상황이다
Anomaly detection은 이 지점을 겨냥한다.
3-1. 전통적 QC의 한계
기존 QC 시스템은 대부분 사후적이다.
- QC가 기준을 벗어나면 → 문제 인지
- 문제를 인지했을 때는 이미 batch가 끝난 후
AI 기반 anomaly detection은 질문 자체를 바꾼다.
“이 batch는 정상인가?” ❌
“이 batch는 평소와 다르게 행동하고 있는가?” ⭕️
3-2. LC-MS/MS에서의 이상 신호 유형
AI가 감지할 수 있는 이상 패턴은 생각보다 다양하다.
- RT가 허용 범위 내이지만 특정 방향으로 지속 이동
- IS response는 안정적이나 analyte만 서서히 감소
- 특정 injection 이후 noise pattern 변화
- 장비 vendor 로그와 signal drift의 미묘한 상관
이러한 패턴은
👉 사람이 한 batch 안에서 감지하기 거의 불가능하다.
Part 4. AI × LC-MS/MS의 오해와 현실
이 시리즈에서 반드시 짚고 넘어가야 할 사실이 있다.
- AI는 senior analyst를 대체하지 않는다
- 오히려 senior analyst의 사고를 시스템화한다
- 데이터가 나쁘면 AI는 더 나쁜 결론을 낸다
AI 도입의 실패 사례 대부분은 기술 문제가 아니라,
- 학습 데이터 품질
- 판단 기준의 불명확성
- SOP와 모델 간 불일치
에서 시작된다.
“AI × LC-MS/MS 융합기술” 시리즈는
단순히 최신 트렌드를 소개하는 연재가 아니다.
이 시리즈가 계속해서 묻는 질문은 이것이다.
“이 판단을, 사람이 설명할 수 있는가?”
- 설명할 수 없다면 → 규제 환경에서 쓰일 수 없고
- 재현할 수 없다면 → 분석 시스템으로 인정받을 수 없으며
- 책임질 수 없다면 → 자동화가 아니라 위험이다
'제약산업' 카테고리의 다른 글
| R 기반 LC-MS 데이터 자동화 파이프라인 (0) | 2026.02.01 |
|---|---|
| R 기반 LC-MS 데이터 자동화 파이프라인 예시 (0) | 2026.01.31 |
| 데이터 자동화 × R 기반 LC-MS 데이터 활용 전략 (0) | 2026.01.30 |
| Regulatory Ready LC-MS/MS 시리즈 (0) | 2026.01.29 |
| Metabolomics Insight 시리즈 (0) | 2026.01.26 |
| Bioanalysis Deep Dive 시리즈 (0) | 2026.01.25 |
| 분석팀 신입 연구원 교육 로드맵 (1) | 2026.01.24 |
| Lab Digital Transformation을 위한 제약사 내부 조직·인력 구성 전략 (0) | 2026.01.23 |
- Total
- Today
- Yesterday
- lc-ms/ms
- 제약
- 분석팀
- 신약개발
- 미래산업
- Spatial metabolomics
- metabolomics
- 시스템
- 데이터
- 디지털헬스케어
- 정량분석
- matrix effect
- 임상시험
- 머신러닝
- LC-MS
- 대사체 분석
- 약물개발
- 바이오마커
- Targeted Metabolomics
- 바이오의약품
- 분석
- AI
- Multi-omics
- 신약 개발
- 치료제
- bioanalysis
- 팬데믹
- 제약산업
- 약물분석
- 정밀의료
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
