– 분해를 예측한다는 것, 그리고 책임을 감당한다는 것 1. Stability는 왜 제약 데이터 과학의 마지막 보루처럼 남아 있었을까제약 데이터 중에서AI 적용이 비교적 빨리 자리 잡은 영역은 명확하다.후보물질 스크리닝ADME/Tox 예측합성 경로 최적화반면 stability는 늘 뒤에 남아 있었다.이유는 단순하지 않다.stability는 단순한 “물성 예측” 문제가 아니라시간, 환경, 판단, 규제가 모두 얽힌 영역이기 때문이다.1개월 후 변화3개월 후 변화6개월, 12개월, 24개월…그리고 그 결과는“조금 변했다”가 아니라“출시 가능/불가”라는 결론으로 이어진다.AI가 예측을 틀렸을 때그 대가는 너무 크다. 2. 전통적인 stability 접근의 본질적 한계전통적인 stability 평가는기본적으로 경..
– 데이터는 많은데, 왜 설명은 점점 어려워지는가1. 분석팀의 하루는 이미 디지털인데, 왜 일은 여전히 아날로그일까요즘 분석팀을 보면 겉으로는 완전히 디지털이다.LIMS에 시료를 등록하고,ELN에 실험 내용을 기록하고,CDMS에 raw data를 저장한다.그런데 이상한 일이 벌어진다.문제가 생기면 사람들은 다시 엑셀과 메신저, 기억으로 돌아간다.“이 샘플 전처리 조건이 뭐였지?”“이 결과가 나왔을 때 장비 상태 어땠어?”“이 데이터는 누가 어떤 판단으로 pass 시켰지?”시스템은 있는데, 맥락이 없다.정보는 쌓이는데, 이야기가 연결되지 않는다.이게 바로LIMS–ELN–CDMS가 각자 잘 돌아가는데도분석팀 전체의 생산성과 신뢰도는 올라가지 않는 이유다.2. 먼저 인정해야 할 사실: 세 시스템은 원래 목적이..
– metabolomics 해석 패러다임이 ‘이름 붙이기’에서 ‘신뢰도 관리’로 이동하는 이유1. Annotation confidence는 왜 늘 애매하게 남아 있었는가Metabolomics 논문을 수십 편만 읽어봐도 반복해서 등장하는 표현들이 있다.Putatively annotated metaboliteTentative identificationLevel 2 identification according to MSI guideline이 표현들은 모두 한 가지 사실을 우회적으로 말한다.“확실하다고 말하기에는 불안하고,그렇다고 무시하기에는 의미 있어 보인다.”Annotation confidence는 오랫동안 말로 표현되는 감각에 가까웠다.분석가는 마음속으로 이렇게 판단한다.이건 꽤 그럴듯하다이건 조금 위험하..
Metabolomics에서 annotation bottleneck은 기술 문제가 아니라 ‘해석의 한계’였다Metabolomics는 언제나 데이터 생산 속도가 해석 속도를 앞질러 왔다.LC-MS 성능은 해마다 좋아졌고, non-targeted 분석에서는 수천, 많게는 수만 개의 feature가 한 번의 실험에서 쏟아진다.문제는 그다음이다.분석가는 결국 몇 개의 peak 앞에 멈춰 선다.통계적으로 가장 유의한 것들, fold change가 큰 것들, 그림이 예쁜 것들.그리고 그중에서도 이름을 붙일 수 있는 것만 남긴다.이 과정은 자연스럽지만, 동시에 잔인하다.데이터의 대부분은 “이름이 없다는 이유”로 분석에서 탈락한다.이게 바로 annotation bottleneck의 실체다.중요한 점은, 이 병목이라이브러..
LC-MS vendor 로그 데이터는 왜 늘 ‘있지만 부족한가’LC-MS 장비를 켜면 수많은 로그가 자동으로 쌓인다.압력, 전압, 온도, 진공 상태, 에러 코드까지.겉으로 보면 predictive maintenance에 딱 맞는 데이터처럼 보인다.하지만 막상 로그를 열어보면 분석가는 곧 실망하게 된다.값은 있는데, 맥락이 없다.변화는 보이는데, 해석 기준이 없다.예를 들어 펌프 압력 로그를 보자.시간에 따라 압력이 흔들린다.그런데 이 흔들림이 정상 범위인지, 위험 신호인지 판단할 기준은 제공되지 않는다.Vendor는 “이 값은 정상입니다”라고 말하지만,그 정상은 분석 품질과 연결되지 않은 정상이다.Vendor 로그의 첫 번째 한계: 분석 품질과 분리된 데이터가장 근본적인 문제는,vendor 로그가 장비 ..
LC-MS 장비는 왜 항상 ‘고장 나기 직전’에 문제를 일으킬까LC-MS를 운영해 본 사람이라면 비슷한 경험이 있다.어제까지는 멀쩡하던 장비가 오늘 아침 갑자기 튜닝이 안 잡힌다.Sensitivity가 떨어지고, RT가 미묘하게 흔들리고, blank에서도 잡음이 늘어난다.결국 장비 엔지니어를 부르고 나면 이런 말이 돌아온다.“소스 클리닝 한 지 꽤 됐네요.”“펌프 씰이 슬슬 한계였던 것 같습니다.”돌이켜보면 전조는 있었다.압력 그래프가 조금씩 거칠어졌고, tuning 결과도 예전만 못했다.하지만 그 신호는 늘 애매했다.그래서 우리는 정해진 주기에 따라 PM을 했다.아직 멀쩡해 보이는 부품도 통째로 교체하고,정작 필요한 순간에는 예상치 못한 다운타임을 맞았다.이게 바로 시간 기반 PM(time-based ..
MS를 다루는 사람이라면 누구나 비슷한 경험을 한 적이 있을 것이다.정량 분석은 비교적 빠르게 끝났는데, 보고서 마감은 계속 늦어지고 있다. 이유를 들여다보면 대부분 MS/MS 기반 정성 해석에서 막혀 있다. 주요 성분 하나는 구조가 명확한데, 그 주변에 따라붙은 여러 개의 minor peak들, retention time은 비슷하고 MS/MS는 그럴듯한데 딱 잘라 말할 수는 없는 애매한 스펙트럼들 때문이다.“이건 아마 이런 구조일 것 같다.”“여기서 methyl 하나 빠진 형태 같긴 한데…”보고서에는 결국 putative identification, tentatively assigned 같은 표현이 반복해서 등장한다.이 장면은 대사체 분석이든, 분해산물 분석이든, 불순물 분석이든 거의 비슷하다.MS/M..
1. Calibration curve에서 문제는 항상 마지막에 드러난다LC-MS/MS 기반 bioanalysis에서 calibration curve는 단순한 계산 절차가 아니다. 분석 결과 전체의 신뢰성을 떠받치는 구조물에 가깝다. 그럼에도 불구하고, 실제 분석 현장에서는 calibration curve의 문제를 가장 나중에, 그것도 ISR 실패나 재분석 요구가 들어온 뒤에야 인지하는 경우가 많다.특정 농도 포인트 하나가 튀어 있는 것처럼 보이지만, 명확히 제외할 근거가 부족해 고민하다가 결국 재분석으로 이어지는 경험은 국내 제약사 분석팀이라면 누구나 한 번쯤 겪어봤을 것이다. 문제는 이러한 판단이 여전히 사람의 눈과 경험에 크게 의존하고 있다는 점이다.이 지점에서 최근 주목받는 접근이 바로 AI 기반 ..
- Total
- Today
- Yesterday
- 신약개발
- 신약 개발
- 항암제
- 분석
- 디지털헬스케어
- LC-MS
- 치료제
- 정밀의료
- Multi-omics
- 미래산업
- Toxicometabolomics
- metabolomics
- 제약산업
- 약물개발
- 제약
- 분석팀
- Targeted Metabolomics
- 팬데믹
- lc-ms/ms
- 대사체 분석
- Lipidomics
- AI
- 정량분석
- bioanalysis
- 바이오마커
- Spatial metabolomics
- 머신러닝
- 임상시험
- 바이오의약품
- 약물분석
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
