Proteomics에서 “숫자”는 정말 단백질 양을 의미할까Proteomics를 처음 배우는 사람들은 보통 abundance table을 보는 순간 강한 확신을 갖게 된다. Sample A에서 어떤 protein intensity가 높게 나왔고, Sample B에서는 낮게 나왔으니 해당 단백질의 실제 양이 변했다고 생각한다. 특히 modern software가 자동으로 normalization, alignment, quantification을 수행하고 fold change와 p-value까지 계산해주기 시작하면 결과는 더욱 신뢰감 있게 보인다.그리고 이 흐름의 중심에는 label-free quantification(LFQ)이 있다.최근 proteomics에서는 LFQ가 거의 표준처럼 사용된다. Stabl..
— 보이지 않는 데이터가 결과를 가장 크게 바꾸는 순간데이터를 보다 보면가끔 이런 순간이 온다.“왜 이 값은 비어 있을까?”처음에는 단순하게 생각한다.측정이 안 됐나 보다값이 없나 보다그래서 자연스럽게 이어진다.missing → 0missing → 무시이 판단은 빠르고 편하다.하지만 이 단순한 선택 하나가전체 결과를 완전히 바꿔버리는 경우가 있다.그리고 더 문제는그 변화가 너무 “그럴듯하게” 보인다는 점이다.우리는 missing을 너무 쉽게 해석한다omics 데이터에서 missing value는예외적인 상황이 아니다.오히려 흔하다.proteomics, metabolomics 모두에서missing value는 기본적으로 존재한다.문제는 이걸 어떻게 이해하느냐다.많은 경우 우리는 이렇게 생각한다.값이 없다 ..
— 가장 직관적인 그래프가 가장 많은 것을 숨길 때처음 Volcano plot을 접했을 때의 느낌을 아직도 기억한다.데이터가 이렇게까지 명확하게 보일 수 있다는 사실이오히려 놀라웠다.좌우로 나뉘어진 점들,위로 올라갈수록 강해지는 신뢰도,그리고 그 위에 표시된 몇 개의 단백질 이름.그건 마치 데이터가 스스로 말하고 있는 것처럼 보였다.“이게 답이야.”그래서 우리는 자연스럽게 그 그림을 믿는다.의심 없이, 망설임 없이.하지만 시간이 지나고,비슷한 실험을 반복하고,결과가 재현되지 않는 순간을 몇 번 겪고 나면이 질문이 떠오른다.“이 그래프는 정말 진실을 보여주는 걸까?”1. Volcano plot은 ‘단순한 시각화’가 아니다겉으로 보면 Volcano plot은 단순하다.x축: log2 fold changey축..
1. Missing value는 오류가 아니라 데이터의 일부다Proteomics 데이터에서 NA는 다음을 의미할 수 있다:단백질이 실제로 존재하지 않음농도가 검출 한계 이하MS/MS sampling 실패peptide 동정 실패데이터 필터링 기준 미충족👉 즉, missing value는 “0”이 아니라 불확실성의 표현이다.2. Missing value의 세 가지 유형통계적으로 missing value는 세 가지로 분류된다.2.1 MCAR (Missing Completely At Random)특징무작위로 발생abundance와 무관기술적 오류 가능성 높음예파일 손상peak picking 오류소프트웨어 버그👉 가장 드물지만, 발견 시 데이터 품질 점검 필요2.2 MAR (Missing At Random)특..
1. Shotgun proteomics의 기본 구조: 재현성에 불리한 설계Shotgun proteomics는 일반적으로 다음 workflow를 따른다:단백질 추출효소 소화 (trypsin digestion)LC-MS/MS 분석 (DDA)peptide identificationprotein inference정량 분석이 과정의 핵심 문제는 데이터 획득 방식(DDA) 에 있다.2. 근본 원인 1: DDA의 확률적(stochastic) 샘플링DDA(Data-Dependent Acquisition)의 작동 방식MS1에서 강한 precursor ion 선택상위 N개 이온만 MS/MS 수행즉, 기기는 매 스캔마다 “가장 강한 신호”만 선택한다.왜 이것이 재현성을 깨는가같은 샘플이라도:미세한 noise 차이이온화 효율..
- Total
- Today
- Yesterday
- 시스템
- bioanalysis
- audit
- AI
- 제약
- Targeted Metabolomics
- 임상시험
- 바이오마커
- 치료제
- 데이터
- metabolomics
- 미래산업
- 정량분석
- 정밀의료
- 대사체 분석
- Spatial metabolomics
- Multi-omics
- 해석
- Biomarker
- 신약개발
- matrix effect
- Proteomics
- 제약산업
- Missing Value
- 약물분석
- LC-MS
- lc-ms/ms
- biological signal
- 분석
- 분석팀
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
