1. Missing value는 오류가 아니라 데이터의 일부다Proteomics 데이터에서 NA는 다음을 의미할 수 있다:단백질이 실제로 존재하지 않음농도가 검출 한계 이하MS/MS sampling 실패peptide 동정 실패데이터 필터링 기준 미충족👉 즉, missing value는 “0”이 아니라 불확실성의 표현이다.2. Missing value의 세 가지 유형통계적으로 missing value는 세 가지로 분류된다.2.1 MCAR (Missing Completely At Random)특징무작위로 발생abundance와 무관기술적 오류 가능성 높음예파일 손상peak picking 오류소프트웨어 버그👉 가장 드물지만, 발견 시 데이터 품질 점검 필요2.2 MAR (Missing At Random)특..
1. 두 전략의 철학적 차이LFQ: 샘플을 독립적으로 측정각 샘플을 별도로 LC-MS 분석MS1 신호 기반 정량👉 장점: 자연 상태 유지👉 단점: run 간 변동 존재TMT: 샘플을 하나로 합쳐 비교isobaric tag로 샘플 labeling혼합 후 단일 LC-MS runreporter ion 기반 정량👉 장점: run 간 변동 제거👉 단점: ratio compression, 복잡한 전처리2. Workflow 비교LFQ workflow단백질 추출digestionLC-MS 분석 (샘플별)feature alignment정량TMT workflow단백질 추출digestionTMT labeling샘플 혼합LC-MS 분석reporter ion 정량👉 핵심 차이: 혼합 시점3. 재현성 관점 비교 항목LFQ..
1. DDA에서 DIA로: 왜 변화가 필요했는가DDA의 강점새로운 단백질 발견에 유리높은 MS/MS 스펙트럼 품질라이브러리 구축 용이그러나 현실적 한계문제영향stochastic sampling재현성 저하missing value통계 분석 왜곡low-abundance 검출 불안정biomarker 신뢰도 하락multi-site 비교 어려움임상 적용 제한👉 연구 단계에서는 유용하지만,정량 플랫폼으로는 불안정했다.2. DIA의 핵심 개념: “모든 것을 본다”DIA 작동 방식m/z 범위를 일정 window로 분할각 window 내 모든 precursor를 fragmentation반복적으로 전체 범위 스캔👉 선택이 아닌 전수 조사 방식핵심 차이특징DDADIAprecursor 선택상위 N개전체샘플링 방식확률적체계적..
1. Shotgun proteomics의 기본 구조: 재현성에 불리한 설계Shotgun proteomics는 일반적으로 다음 workflow를 따른다:단백질 추출효소 소화 (trypsin digestion)LC-MS/MS 분석 (DDA)peptide identificationprotein inference정량 분석이 과정의 핵심 문제는 데이터 획득 방식(DDA) 에 있다.2. 근본 원인 1: DDA의 확률적(stochastic) 샘플링DDA(Data-Dependent Acquisition)의 작동 방식MS1에서 강한 precursor ion 선택상위 N개 이온만 MS/MS 수행즉, 기기는 매 스캔마다 “가장 강한 신호”만 선택한다.왜 이것이 재현성을 깨는가같은 샘플이라도:미세한 noise 차이이온화 효율..
1. Negative result는 “분석이 실패했다”는 의미가 아니다많은 연구자가 다음과 같이 오해한다:유의한 metabolite 없음 → 실험 실패그룹 간 차이 없음 → 분석 민감도 부족biomarker 발견 실패 → 연구 가치 없음하지만 metabolomics에서 negative result는 종종 다음을 의미한다:생물학적 차이가 실제로 없음질병 기전이 대사 수준이 아닌 다른 계층에 있음효과 크기가 임상적으로 의미 없는 수준분석 설계가 confounder를 제거했기 때문에 “진짜 신호”만 남음👉 즉, negative result는 오히려 과학적으로 더 정직한 결과일 수 있다.2. False discovery를 줄이는 가장 강력한 방어선Metabolomics는 high-dimensional 데이터 ..
1. QC는 “정밀도”를 확인할 뿐 “정확성”을 보장하지 않는다✔ QC가 평가하는 것instrument stability반복 측정 정밀도 (precision)signal drift✔ QC가 평가하지 않는 것biological relevancematrix representativenesssample-specific suppressionmetabolite misannotation👉 즉, QC는 기기가 안정적인지만 본다.2. QC가 실제 샘플을 대표하지 못하는 문제가장 흔한 구조적 오류QC sample = pooled sample하지만 실제 샘플은:질병 상태약물 복용극단적 대사 상태고지혈, 고단백, 용혈 등👉 QC는 평균 상태일 뿐극단적 matrix 조건을 반영하지 못한다.실제 영향상황QC 결과실제 샘플I..
1. Batch effect는 단순한 오차가 아니다✔ 일반적인 오해“조금의 drift”“보정하면 해결되는 기술적 문제”✔ 실제 영향Batch effect는 데이터를 다음과 같이 바꾼다:가짜 그룹 차이 생성진짜 biological signal 제거biomarker 후보 뒤바뀜모델 예측력 과대평가재현성 붕괴👉 즉, 연구 결론 자체를 바꿔버린다.2. 가장 위험한 왜곡: 가짜 biological difference 생성시나리오Batch 1 → ControlBatch 2 → Disease결과PCA에서 완벽한 separation 발생→ 연구자는 질병 특이 metabolite라고 해석실제 원인MS sensitivity driftcolumn agingmatrix effect 변화👉 질병이 아니라 분석 순서가 차이를..
1. 왜 이 구분이 그렇게 중요한가metabolomics 데이터의 변이는 크게 두 축에서 발생한다.✔ Biological variation (생물학적 변이)개인 간 유전적 차이식이, 생활습관, 약물 복용질병 상태circadian rhythmmicrobiome 차이👉 연구자가 찾고 싶은 진짜 신호✔ Analytical variation (분석 변이)sample preparation 오차extraction efficiency 차이LC retention time driftMS sensitivity fluctuationbatch effection suppression / matrix effect👉 제거하거나 보정해야 할 기술적 노이즈2. 가장 먼저 확인해야 할 질문실무에서는 항상 이 질문부터 시작한다.❓ 질..
- Total
- Today
- Yesterday
- 약물개발
- bioanalysis
- Spatial metabolomics
- 데이터
- 디지털헬스케어
- 정밀의료
- 미래산업
- 제약
- 신약개발
- Multi-omics
- matrix effect
- audit
- 분석팀
- 분석
- 신약 개발
- LC-MS
- 시스템
- 대사체 분석
- 제약산업
- ich m10
- 치료제
- Targeted Metabolomics
- 바이오마커
- 임상시험
- lc-ms/ms
- 약물분석
- metabolomics
- 정량분석
- AI
- 머신러닝
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |
