분석 전 단계에서 이미 결과는 달라지고 있을 수 있다Metabolomics 연구를 처음 시작하면 대부분의 관심은 LC-MS 조건에 쏠린다.어떤 컬럼을 사용할 것인가.Gradient는 어떻게 설정할 것인가.ESI polarity는 무엇을 선택할 것인가.MS resolution은 얼마로 설정할 것인가.실제로 수개월 동안 method development에 시간을 투자하는 경우도 흔하다.하지만 경험이 쌓일수록 연구자들은 조금 다른 사실을 깨닫게 된다.결과를 가장 크게 바꾸는 요인은 때때로 LC-MS가 아니다.오히려 분석기가 켜지기도 전에 이미 결과가 달라져 있는 경우가 있다.바로 샘플 보관(sample storage) 때문이다.Metabolomics는 본질적으로 매우 불안정한 분자를 다룬다.Proteomics..
같은 샘플인데 왜 연구자마다 전혀 다른 생물학을 발견할까Proteomics, Metabolomics, Lipidomics 연구를 처음 시작하는 사람들은 흔히 이렇게 생각한다.분석 결과는 샘플 안에 이미 존재하는 생물학적 정보를 보여주는 것이라고.즉 질병군과 대조군의 차이는 원래 존재하고 있었고, LC-MS/MS는 그것을 단순히 읽어내는 장비라고 생각한다.물론 어느 정도는 맞는 말이다.하지만 실제 Omics 연구를 오래 하다 보면 조금 불편한 사실을 발견하게 된다.우리가 얻는 결과는 샘플이 가진 정보만으로 결정되지 않는다.어떤 전처리(preprocessing)를 선택했는가에 따라 결과 자체가 달라질 수 있다.더 정확히 말하면, 같은 raw data를 가지고도 연구자마다 전혀 다른 생물학적 결론에 도달할 수..
왜 논문에서는 분명히 보였던 바이오마커와 메커니즘이 다른 연구에서는 사라질까Proteomics 분야에서 오랫동안 일하다 보면 한 가지 이상한 경험을 반복하게 된다.논문에서는 매우 강력해 보였던 결과가 있다.p-value는 충분히 낮다.Fold change도 크다.Volcano plot도 깔끔하다.Pathway enrichment도 설득력 있다.논문 결론은 명확하다.특정 단백질은 질병의 핵심 바이오마커이며, 특정 pathway는 질병 발생의 중심 메커니즘이라고 주장한다.그런데 몇 달 뒤 다른 연구실에서 비슷한 실험을 수행한다.결과는 예상과 다르다.중요하다고 했던 단백질은 보이지 않는다.Pathway도 재현되지 않는다.Hub protein도 달라진다.심지어 같은 연구실에서 같은 실험을 반복해도 결과가 달라지..
데이터를 더 많이 모았는데 왜 진실에서 더 멀어질 수 있을까몇 년 전까지만 해도 하나의 omics 데이터만 확보해도 상당히 큰 연구였다.Transcriptomics만 수행하거나,Proteomics만 수행하거나,Metabolomics만 수행해도 충분히 논문이 나올 수 있었다.하지만 최근에는 상황이 완전히 달라졌다.이제는 다음과 같은 조합이 흔하다.Transcriptomics + ProteomicsProteomics + MetabolomicsTranscriptomics + Proteomics + PhosphoproteomicsGenomics + Transcriptomics + Proteomics + Metabolomics이른바 Multi-omics integration 시대다.연구자들은 자연스럽게 생각한다...
단백질 변화는 메커니즘의 증거가 아니라, 메커니즘을 추정하기 위한 단서일 뿐이다Proteomics 연구를 하다 보면 매우 익숙한 흐름이 있다.질병군과 대조군을 비교한다.수천 개의 단백질 중 일부가 유의하게 변화한다.Pathway enrichment를 수행한다.Network analysis를 수행한다.그리고 마지막에 이런 결론이 등장한다."본 연구 결과는 PI3K-AKT signaling pathway가 질병 진행을 유도함을 시사한다.""Protein X가 염증 반응을 조절하는 핵심 메커니즘으로 확인되었다.""Mitochondrial dysfunction이 주요 병인 기전으로 작용한다."논문을 읽는 입장에서는 매우 자연스럽게 느껴진다.실제로 많은 연구가 이런 구조를 가지고 있다.문제는 여기서 사용되는 "m..
단백질의 이름을 아는 것과, 그 단백질이 실제로 무엇을 하고 있는지를 아는 것은 전혀 다른 문제다Proteomics 분석을 처음 시작하면 데이터는 대개 숫자로 가득 차 있다.수천 개의 protein ID, fold change, p-value, abundance 값들이 나열된다.그 자체로는 의미를 읽어내기 어렵다.그래서 대부분의 연구자는 다음 단계로 넘어간다.Functional annotation.즉 검출된 단백질에 기능(function)을 부여하는 과정이다.예를 들어 어떤 단백질이 검출되면:Cell cycleApoptosisInflammationMetabolismSignal transduction같은 기능 카테고리가 붙는다.그리고 연구자는 그 순간부터 데이터를 "해석"하기 시작한다."Cell cycle..
우리가 보고 있는 상호작용은 실제 생물학일까, 아니면 데이터베이스가 만들어낸 환상일까Proteomics 논문을 읽다 보면 거의 빠지지 않고 등장하는 그림이 있다.Differentially expressed protein을 선별한 뒤, 그 단백질들을 interaction database에 넣고 네트워크를 만든 그림이다.수많은 단백질들이 서로 연결되어 있고, 중심에는 몇 개의 hub protein이 자리 잡고 있다. 연구자는 그 네트워크를 보며 특정 단백질이 질병의 핵심 조절자일 가능성을 이야기하고, 특정 pathway가 중요한 역할을 할 것이라고 해석한다.실제로 이런 분석은 이제 거의 표준 절차가 되었다.많은 연구에서 다음과 같은 흐름을 따른다.----------------------------------..
Proteomics 데이터보다 데이터베이스가 더 큰 목소리를 내는 순간Proteomics 분석을 처음 배우면 대부분 데이터 자체에 집중한다.LC-MS/MS 조건은 적절했는가.Protein identification은 충분했는가.FDR은 잘 관리되었는가.Normalization은 적절했는가.물론 모두 중요하다.하지만 실제 연구 경험이 쌓일수록 의외의 사실 하나를 발견하게 된다.최종 해석을 가장 크게 바꾸는 것은 실험 데이터가 아니라 데이터베이스(Database)인 경우가 생각보다 많다는 것이다.실제로 대부분의 Proteomics 분석은 데이터베이스 위에서 이루어진다.Protein identificationFunctional annotationPathway enrichmentNetwork analysisPr..
- Total
- Today
- Yesterday
- 대사체 분석
- 데이터
- 분석팀
- Proteomics
- matrix effect
- biological signal
- 바이오마커
- lc-ms/ms
- 미래산업
- 재현성
- AI
- Multi-omics
- 제약산업
- 신약개발
- metabolomics
- 치료제
- audit
- Missing Value
- 정밀의료
- bioanalysis
- 정량분석
- Targeted Metabolomics
- 제약
- 시스템
- 임상시험
- 분석
- 해석
- 약물분석
- LC-MS
- Biomarker
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
