티스토리 뷰

728x90

LC-MS 장비는 왜 항상 ‘고장 나기 직전’에 문제를 일으킬까

LC-MS를 운영해 본 사람이라면 비슷한 경험이 있다.
어제까지는 멀쩡하던 장비가 오늘 아침 갑자기 튜닝이 안 잡힌다.
Sensitivity가 떨어지고, RT가 미묘하게 흔들리고, blank에서도 잡음이 늘어난다.
결국 장비 엔지니어를 부르고 나면 이런 말이 돌아온다.

“소스 클리닝 한 지 꽤 됐네요.”
“펌프 씰이 슬슬 한계였던 것 같습니다.”

돌이켜보면 전조는 있었다.
압력 그래프가 조금씩 거칠어졌고, tuning 결과도 예전만 못했다.
하지만 그 신호는 늘 애매했다.
그래서 우리는 정해진 주기에 따라 PM을 했다.
아직 멀쩡해 보이는 부품도 통째로 교체하고,
정작 필요한 순간에는 예상치 못한 다운타임을 맞았다.

이게 바로 시간 기반 PM(time-based maintenance)의 한계다.

LC-MS 장비 예방 정비(PM) 스케줄링을 위한 predictive maintenance 모델
LC-MS 장비 예방 정비(PM) 스케줄링을 위한 predictive maintenance 모델


Predictive maintenance가 LC-MS에서 특히 어려웠던 이유

제조업 설비나 회전체 장비에서는 predictive maintenance가 비교적 빨리 정착했다.
진동, 온도, 소음 같은 물리적 신호가 명확했기 때문이다.

하지만 LC-MS는 다르다.
이 장비는 기계이면서 동시에 분석 시스템이다.
고장의 정의 자체가 애매하다.

  • 완전히 멈췄다 → 명백한 고장
  • 감도가 20% 떨어졌다 → 고장인가?
  • CV가 살짝 늘었다 → 분석자 문제인가, 장비 문제인가?

이 경계가 흐릿했기 때문에,
LC-MS 유지보수는 오랫동안 숙련자의 경험에 의존해 왔다.

Predictive maintenance 모델을 만들기 어려웠던 이유도 여기 있다.
정답(label)이 명확하지 않았고,
고장이 일어나기 전의 데이터가 체계적으로 쌓여 있지 않았다.

 


Predictive maintenance 모델의 출발점: ‘고장’을 다시 정의하다

LC-MS 예방 정비를 위한 predictive maintenance의 첫 단계는
모델링이 아니라 고장의 정의를 바꾸는 것이다.

여기서 고장은 “장비가 멈춘 상태”가 아니다.
대신 이런 상태를 고장으로 본다.

  • QC sample의 response가 장기 평균 대비 일정 비율 이상 이탈
  • system suitability 실패 빈도의 증가
  • tuning 파라미터의 점진적 drift
  • 동일 조건에서의 RT reproducibility 저하

즉, 분석 성능의 붕괴 조짐 자체를 이벤트로 정의한다.

이렇게 정의하면, LC-MS는 갑자기 고장 나는 장비가 아니라
서서히 신호를 보내는 시스템으로 보이기 시작한다.


LC-MS predictive maintenance에 사용되는 데이터는 생각보다 많다

흥미로운 점은, 대부분의 LC-MS 랩에는 이미 데이터가 존재한다는 것이다.
다만 그걸 maintenance 관점에서 본 적이 없었을 뿐이다.

대표적인 입력 데이터는 다음과 같다.

  • 펌프 압력 프로파일(시간 대비 pressure fluctuation)
  • vacuum level 및 변동성
  • ion source current, spray voltage 안정성
  • tuning log (mass accuracy, resolution trend)
  • QC sample peak area, S/N, CV
  • blank에서의 background 증가 패턴

이 데이터들은 하나하나 보면 사소하다.
하지만 시간 축으로 쌓이면 장비의 생체 신호처럼 작동한다.

 


모델은 ‘언제 고장 난다’를 맞히지 않는다

많은 사람들이 predictive maintenance를
“고장 시점을 정확히 예측하는 모델”로 오해한다.
하지만 LC-MS에서는 그 접근이 거의 불가능하다.

대신 모델이 하는 일은 이것이다.

“지금 장비 상태가 정상 범위에서 얼마나 벗어나고 있는가”

즉, health score 또는 degradation index를 계산한다.

이 과정에서 자주 쓰이는 접근은 다음과 같다.

  • 정상 상태 데이터를 학습한 anomaly detection 모델
  • 장비별 baseline을 반영한 시계열 drift 분석
  • PM 이후 상태를 기준점(anchor)으로 삼는 변화 감지

이 방식의 장점은 명확하다.
고장 데이터가 많지 않아도 모델을 만들 수 있고,
장비마다 다른 성격도 반영할 수 있다.


PM 스케줄링은 ‘정비 시점 추천’ 문제로 바뀐다

Predictive maintenance가 들어오면
PM 스케줄링의 질문도 달라진다.

기존 질문은 이랬다.

“6개월마다 소스 클리닝을 할까, 1년에 한 번 할까?”

이제는 이렇게 바뀐다.

“지금 상태에서 2주 안에 성능 저하 확률이 얼마나 될까?”
“이번 배치 분석이 끝나기 전까지는 괜찮을까?”

즉, PM은 정기 이벤트가 아니라 리스크 관리 결정이 된다.

이 변화는 특히 GMP 환경에서 의미가 크다.
불필요한 분해·재조립은 오히려 variability를 키울 수 있기 때문이다.


실제 현장에서 기대되는 변화

Predictive maintenance 모델이 안정화되면,
랩 운영 방식 자체가 달라진다.

  • 갑작스러운 장비 다운타임 감소
  • PM 작업의 표준화 및 기록 자동화
  • 장비 간 성능 비교의 객관화
  • 엔지니어 의존도 감소

무엇보다 중요한 것은
“왜 이 시점에 PM을 했는지”를 데이터로 설명할 수 있다는 점이다.


LC-MS predictive maintenance의 본질은 AI가 아니다

마지막으로 강조하고 싶은 점이 있다.
이 모든 이야기를 AI 기술로 포장할 수는 있지만,
본질은 분석가의 관점 변화다.

LC-MS를
“고장 나면 고치는 장비”에서
“상태를 지속적으로 모니터링하는 시스템”으로 바라보는 것.

Predictive maintenance 모델은
그 관점을 수치와 그래프로 보여주는 도구에 가깝다.

728x90