Proteomics 데이터보다 데이터베이스가 더 큰 목소리를 내는 순간Proteomics 분석을 처음 배우면 대부분 데이터 자체에 집중한다.LC-MS/MS 조건은 적절했는가.Protein identification은 충분했는가.FDR은 잘 관리되었는가.Normalization은 적절했는가.물론 모두 중요하다.하지만 실제 연구 경험이 쌓일수록 의외의 사실 하나를 발견하게 된다.최종 해석을 가장 크게 바꾸는 것은 실험 데이터가 아니라 데이터베이스(Database)인 경우가 생각보다 많다는 것이다.실제로 대부분의 Proteomics 분석은 데이터베이스 위에서 이루어진다.Protein identificationFunctional annotationPathway enrichmentNetwork analysisPr..
연결선이 많아질수록 진실에 가까워지는 것이 아니라, 오히려 멀어질 수도 있다Proteomics 연구를 진행하다 보면 어느 순간 반드시 만나게 되는 그림이 있다.수십 개 또는 수백 개의 단백질이 원처럼 배치되어 있고, 그 사이를 수많은 선이 연결하고 있는 네트워크 그림이다.처음 보면 굉장히 설득력이 있다.단순한 Volcano plot보다 훨씬 생물학적으로 보인다.Protein A가 Protein B와 연결되어 있고, Protein C는 여러 단백질과 동시에 연결되어 있다. 어떤 단백질은 네트워크 중앙에 크게 위치하고, 어떤 단백질은 주변부에 작게 배치된다.그리고 연구자는 자연스럽게 생각한다."중앙에 있는 단백질이 핵심 조절자겠구나.""연결선이 많은 단백질이 disease driver겠구나.""이 네트워크가..
단백질이 변했기 때문에 질병이 생긴 것일까, 아니면 질병 때문에 단백질이 변한 것일까Proteomics 연구를 하다 보면 어느 순간 매우 자연스럽게 사용하는 표현이 있다."이 단백질이 암 진행을 유도한다.""이 signaling pathway가 염증 반응을 활성화시킨다.""이 biomarker가 질병 발생의 원인이다."논문을 읽다 보면 이런 문장을 거의 매일 접하게 된다. Volcano plot에서 유의한 단백질을 찾고, pathway enrichment를 수행하고, network analysis까지 마치면 마치 생물학적 메커니즘이 밝혀진 것처럼 느껴진다.하지만 조금만 냉정하게 생각해 보면 한 가지 문제가 보인다.Proteomics가 실제로 측정한 것은 단지 abundance 변화뿐이라는 점이다.어떤 단..
Proteomics에서 가장 그럴듯한 그림이 가장 위험할 수도 있는 이유Proteomics 분석이 끝나면 대부분의 연구자는 비슷한 과정을 거친다.Raw data를 처리하고, protein identification을 수행하고, differential expression 분석을 진행한다. 그리고 마지막 단계에서 pathway enrichment를 수행한다.이때부터 데이터는 갑자기 이해하기 쉬워진다.수천 개의 protein 리스트는 너무 복잡하다. 하지만 pathway enrichment 결과는 훨씬 직관적이다.Inflammatory response activationOxidative phosphorylation suppressionCell cycle regulation alterationPI3K-AKT s..
Proteomics에서 가장 흔하지만 가장 위험한 해석 실수Proteomics 데이터를 분석하다 보면 가장 먼저 눈에 들어오는 것은 변화가 큰 단백질들이다.Volcano plot에서 오른쪽 위에 위치한 단백질.Fold change가 크고 p-value도 매우 작은 단백질.연구자는 자연스럽게 그 단백질에 주목한다.그리고 거의 반사적으로 이런 해석을 시작한다."이 단백질의 기능이 증가했다.""이 pathway가 활성화되었다.""이 단백질이 질병 진행을 촉진한다."사실 대부분의 Proteomics 논문은 이런 흐름으로 전개된다.---------------------------------------Protein abundance 증가↓기능 증가 추론↓생물학적 의미 부여↓메커니즘 제안----------------..
Proteomics에서 “유의한 결과”가 사라지는 가장 조용한 순간Proteomics 데이터를 처음 분석하면 많은 사람들이 이런 경험을 한다.처음 t-test를 돌렸을 때는 significant protein이 수백 개 나온다. Volcano plot도 굉장히 화려하다. Disease와 control 사이 biology가 아주 선명하게 보이는 것 같다. 그런데 FDR correction을 적용하는 순간 상황이 완전히 바뀐다.방금 전까지 빨갛게 보이던 점들이 대부분 회색으로 변한다.유의하다고 생각했던 pathway가 사라진다.특정 signaling protein은 더 이상 significant하지 않다.그리고 연구자는 혼란스러워진다.“아까는 분명 차이가 있었는데 왜 갑자기 사라진 거지?”이 순간부터 많은 ..
p-value 하나로 biology를 자르는 순간 벌어지는 일들Proteomics 데이터를 처음 분석하면 가장 먼저 배우는 것 중 하나가 cutoff다.p-value fold change > 2FDR 논문 대부분도 비슷한 기준을 사용한다. Volcano plot에는 빨간 점과 회색 점이 나뉘어 있고, significant protein list가 pathway analysis로 이어진다. 그래서 자연스럽게 이런 생각을 하게 된다.“통계 기준을 통과한 protein은 진짜 biology겠지.”실제로 statistical cutoff는 필요하다. Proteomics 데이터는 noise가 많고, thousands of proteins를 동시에 비교하기 때문에 우연한 변화도 계속 발생한다. 어떤 기준선은 반드시..
Proteomics에서 peptide가 많아질수록 오히려 biology가 흐려지는 순간Proteomics 데이터를 처음 접하면 많은 사람들이 이렇게 생각한다.“Peptide를 많이 검출할수록 protein identification이 더 정확해지겠지.”실제로도 어느 정도는 맞다. Protein coverage가 높아지면 identification confidence가 증가하고, quantification reproducibility도 좋아질 가능성이 높다. 그래서 proteomics에서는 더 많은 peptide를 얻기 위해 sample prep을 최적화하고, LC gradient를 늘리고, fractionation까지 수행한다.문제는 어느 순간부터 peptide 수 증가가 단순한 정보 증가로 이어지지 않..
- Total
- Today
- Yesterday
- 미래산업
- 시스템
- metabolomics
- bioanalysis
- 정밀의료
- 치료제
- Proteomics
- Missing Value
- Targeted Metabolomics
- 정량분석
- 데이터
- AI
- Biomarker
- LC-MS
- matrix effect
- 신약개발
- 해석
- lc-ms/ms
- 대사체 분석
- Spatial metabolomics
- 제약산업
- 제약
- Multi-omics
- audit
- 임상시험
- 바이오마커
- 약물분석
- biological signal
- 분석
- 분석팀
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
