티스토리 뷰

728x90

R 기반 LC-MS 자동화에서 절대 건드리면 안 되는 영역
R 기반 LC-MS 자동화에서 절대 건드리면 안 되는 영역

 

 

자동화가 신뢰를 높일 때와, 무너뜨릴 때의 경계선

R은 LC-MS 분석팀에게 엄청난 자유를 준다.
수백 batch의 QC를 몇 초 만에 비교하고,
사람이 놓치는 trend를 자동으로 잡아낸다.

하지만 바로 그 자유 때문에
R 자동화는 잘못 쓰이면 audit 리스크를 증폭시키는 도구가 된다.

규제기관은 R을 싫어하지 않는다.
그들이 싫어하는 것은 통제되지 않는 자동화다.

1️⃣ Raw data 자체를 변형·대체하는 자동화

❌ 가장 위험한 자동화

  • raw data 파일을 R에서 직접 수정
  • peak intensity를 외부 계산값으로 덮어쓰기
  • vendor software 결과를 “정제된 값”으로 치환

이 순간부터 R은
analysis tool이 아니라 data integrity 리스크가 된다.

LC-MS에서 raw data는
👉 “측정된 사실”이지
👉 “해석 가능한 대상”이 아니다.

Raw data는

  • 생성
  • 저장
  • 보호
    의 영역에 남아 있어야 한다.

R은 raw data를 해석할 수는 있지만, 바꿀 수는 없다.

2️⃣ Integration 결과를 자동으로 ‘교정’하는 로직

많은 분석팀이 유혹을 느끼는 지점이다.

  • tailing 보정
  • baseline 자동 재설정
  • peak splitting 자동 병합

기술적으로는 가능하다.
하지만 규제적으로는 거의 항상 위험하다.

왜냐하면 integration은
👉 측정과 해석의 경계선에 있기 때문이다.

Audit에서 이 질문이 나온다.

“이 integration 결과는
사람의 판단인가,
알고리즘의 판단인가?”

이 질문에 명확히 답하지 못하면,
그 결과는 acceptance 불가 영역으로 이동한다.

3️⃣ QC pass / fail을 완전히 자동 판정하는 로직

R로 QC를 자동 판정하는 건 매우 흔하다.
하지만 여기엔 중요한 선이 있다.

안전한 자동화

  • QC 결과 계산
  • acceptance criteria 대비 여부 표시
  • borderline highlight

위험한 자동화

  • QC fail을 자동으로 무시
  • 특정 패턴을 “허용”으로 분류
  • 최종 batch accept 자동 결정

Batch acceptance는
ICH M10 이후 판단의 영역이다.

그 판단을

  • 로그도 없이
  • 서명도 없이
  • 설명도 없이
    자동화하는 순간,

R은 decision black box가 된다.

4️⃣ Exception을 ‘조용히’ 흡수하는 자동화

R 자동화가 가장 위험해지는 순간은
문제가 있었는데, 아무도 몰랐을 때다.

예를 들면:

  • 특정 QC fail을 자동 제외
  • outlier를 자동 제거
  • 재분석 batch를 평균에 포함

분석팀은 편해진다.
하지만 audit에서는 이렇게 보인다.

“문제가 발생했는데
기록이 없다.”

Exception은
👉 반드시 눈에 띄어야 하고,
👉 반드시 사람의 판단을 거쳐야 한다.

5️⃣ Script 수정 이력이 남지 않는 구조

R의 장점이자 함정은
누구나 쉽게 수정할 수 있다는 점이다.

  • 코드 변경
  • 기준값 변경
  • plotting 방식 변경

이게

  • 언제
  • 누가

  • 바뀌었는지 추적되지 않으면,

R 자동화는
Excel보다 위험한 툴이 된다.

Script는 반드시:

  • version 관리
  • change log
  • validation 상태 구분
    이 동반돼야 한다.

6️⃣ Reviewer의 판단을 대체하려는 자동화

가장 위험한 발상은 이것이다.

“사람이 보던 걸 R이 대신 보면 더 정확하지 않을까?”

아니다.
규제 관점에서 사람의 판단은 제거 대상이 아니다.

R의 역할은:

  • 판단을 빠르게 하도록 돕는 것
  • 놓친 신호를 드러내는 것
  • 판단의 근거를 구조화하는 것

Reviewer 서명, comment, 책임은
절대 자동화 대상이 아니다.

7️⃣ SOP 없이 먼저 굴러가는 자동화

많은 조직에서
R 자동화는 이렇게 시작된다.

  • 능력 있는 analyst가 개인적으로 개발
  • 팀에서 유용하다고 사용
  • 어느새 공식 결과에 사용

이때 가장 큰 문제는
👉 자동화가 SOP보다 먼저 존재한다는 것이다.

SOP 없는 자동화는
audit에서 단 한 줄로 정리된다.

“Uncontrolled analytical process.”

 

8️⃣ 반대로, 반드시 자동화해야 하는 영역

“건드리면 안 된다”는 건
“아무 것도 하지 말라”는 뜻이 아니다.

R이 가장 빛나는 영역은 명확하다.

  • QC trend 분석
  • batch 간 비교
  • slope drift 감지
  • 이상 패턴 시각화
  • reviewer 판단을 남길 공간 제공

즉,
👉 계산과 비교는 자동화,
👉 판단과 책임은 사람이다.

마무리하며

R 기반 LC-MS 자동화의 실패는
기술 부족에서 나오지 않는다.

그 실패는
👉 판단의 경계를 자동화하려는 순간 발생한다.

규제 환경에서 자동화는
사람을 없애기 위한 도구가 아니라,
👉 사람의 판단을 증명하기 위한 도구여야 한다.

이 한 문장만 지켜도
R 자동화는
audit 리스크가 아니라
audit 방어 수단이 된다.

728x90