같은 샘플인데 왜 연구자마다 전혀 다른 생물학을 발견할까Proteomics, Metabolomics, Lipidomics 연구를 처음 시작하는 사람들은 흔히 이렇게 생각한다.분석 결과는 샘플 안에 이미 존재하는 생물학적 정보를 보여주는 것이라고.즉 질병군과 대조군의 차이는 원래 존재하고 있었고, LC-MS/MS는 그것을 단순히 읽어내는 장비라고 생각한다.물론 어느 정도는 맞는 말이다.하지만 실제 Omics 연구를 오래 하다 보면 조금 불편한 사실을 발견하게 된다.우리가 얻는 결과는 샘플이 가진 정보만으로 결정되지 않는다.어떤 전처리(preprocessing)를 선택했는가에 따라 결과 자체가 달라질 수 있다.더 정확히 말하면, 같은 raw data를 가지고도 연구자마다 전혀 다른 생물학적 결론에 도달할 수..
왜 논문에서는 분명히 보였던 바이오마커와 메커니즘이 다른 연구에서는 사라질까Proteomics 분야에서 오랫동안 일하다 보면 한 가지 이상한 경험을 반복하게 된다.논문에서는 매우 강력해 보였던 결과가 있다.p-value는 충분히 낮다.Fold change도 크다.Volcano plot도 깔끔하다.Pathway enrichment도 설득력 있다.논문 결론은 명확하다.특정 단백질은 질병의 핵심 바이오마커이며, 특정 pathway는 질병 발생의 중심 메커니즘이라고 주장한다.그런데 몇 달 뒤 다른 연구실에서 비슷한 실험을 수행한다.결과는 예상과 다르다.중요하다고 했던 단백질은 보이지 않는다.Pathway도 재현되지 않는다.Hub protein도 달라진다.심지어 같은 연구실에서 같은 실험을 반복해도 결과가 달라지..
데이터를 더 많이 모았는데 왜 진실에서 더 멀어질 수 있을까몇 년 전까지만 해도 하나의 omics 데이터만 확보해도 상당히 큰 연구였다.Transcriptomics만 수행하거나,Proteomics만 수행하거나,Metabolomics만 수행해도 충분히 논문이 나올 수 있었다.하지만 최근에는 상황이 완전히 달라졌다.이제는 다음과 같은 조합이 흔하다.Transcriptomics + ProteomicsProteomics + MetabolomicsTranscriptomics + Proteomics + PhosphoproteomicsGenomics + Transcriptomics + Proteomics + Metabolomics이른바 Multi-omics integration 시대다.연구자들은 자연스럽게 생각한다...
단백질 변화는 메커니즘의 증거가 아니라, 메커니즘을 추정하기 위한 단서일 뿐이다Proteomics 연구를 하다 보면 매우 익숙한 흐름이 있다.질병군과 대조군을 비교한다.수천 개의 단백질 중 일부가 유의하게 변화한다.Pathway enrichment를 수행한다.Network analysis를 수행한다.그리고 마지막에 이런 결론이 등장한다."본 연구 결과는 PI3K-AKT signaling pathway가 질병 진행을 유도함을 시사한다.""Protein X가 염증 반응을 조절하는 핵심 메커니즘으로 확인되었다.""Mitochondrial dysfunction이 주요 병인 기전으로 작용한다."논문을 읽는 입장에서는 매우 자연스럽게 느껴진다.실제로 많은 연구가 이런 구조를 가지고 있다.문제는 여기서 사용되는 "m..
단백질의 이름을 아는 것과, 그 단백질이 실제로 무엇을 하고 있는지를 아는 것은 전혀 다른 문제다Proteomics 분석을 처음 시작하면 데이터는 대개 숫자로 가득 차 있다.수천 개의 protein ID, fold change, p-value, abundance 값들이 나열된다.그 자체로는 의미를 읽어내기 어렵다.그래서 대부분의 연구자는 다음 단계로 넘어간다.Functional annotation.즉 검출된 단백질에 기능(function)을 부여하는 과정이다.예를 들어 어떤 단백질이 검출되면:Cell cycleApoptosisInflammationMetabolismSignal transduction같은 기능 카테고리가 붙는다.그리고 연구자는 그 순간부터 데이터를 "해석"하기 시작한다."Cell cycle..
우리가 보고 있는 상호작용은 실제 생물학일까, 아니면 데이터베이스가 만들어낸 환상일까Proteomics 논문을 읽다 보면 거의 빠지지 않고 등장하는 그림이 있다.Differentially expressed protein을 선별한 뒤, 그 단백질들을 interaction database에 넣고 네트워크를 만든 그림이다.수많은 단백질들이 서로 연결되어 있고, 중심에는 몇 개의 hub protein이 자리 잡고 있다. 연구자는 그 네트워크를 보며 특정 단백질이 질병의 핵심 조절자일 가능성을 이야기하고, 특정 pathway가 중요한 역할을 할 것이라고 해석한다.실제로 이런 분석은 이제 거의 표준 절차가 되었다.많은 연구에서 다음과 같은 흐름을 따른다.----------------------------------..
Proteomics 데이터보다 데이터베이스가 더 큰 목소리를 내는 순간Proteomics 분석을 처음 배우면 대부분 데이터 자체에 집중한다.LC-MS/MS 조건은 적절했는가.Protein identification은 충분했는가.FDR은 잘 관리되었는가.Normalization은 적절했는가.물론 모두 중요하다.하지만 실제 연구 경험이 쌓일수록 의외의 사실 하나를 발견하게 된다.최종 해석을 가장 크게 바꾸는 것은 실험 데이터가 아니라 데이터베이스(Database)인 경우가 생각보다 많다는 것이다.실제로 대부분의 Proteomics 분석은 데이터베이스 위에서 이루어진다.Protein identificationFunctional annotationPathway enrichmentNetwork analysisPr..
연결선이 많아질수록 진실에 가까워지는 것이 아니라, 오히려 멀어질 수도 있다Proteomics 연구를 진행하다 보면 어느 순간 반드시 만나게 되는 그림이 있다.수십 개 또는 수백 개의 단백질이 원처럼 배치되어 있고, 그 사이를 수많은 선이 연결하고 있는 네트워크 그림이다.처음 보면 굉장히 설득력이 있다.단순한 Volcano plot보다 훨씬 생물학적으로 보인다.Protein A가 Protein B와 연결되어 있고, Protein C는 여러 단백질과 동시에 연결되어 있다. 어떤 단백질은 네트워크 중앙에 크게 위치하고, 어떤 단백질은 주변부에 작게 배치된다.그리고 연구자는 자연스럽게 생각한다."중앙에 있는 단백질이 핵심 조절자겠구나.""연결선이 많은 단백질이 disease driver겠구나.""이 네트워크가..
- Total
- Today
- Yesterday
- 정밀의료
- 치료제
- Multi-omics
- 제약산업
- 미래산업
- metabolomics
- 임상시험
- 분석
- Targeted Metabolomics
- matrix effect
- 약물분석
- Biomarker
- LC-MS
- 해석
- 정량분석
- 바이오마커
- 제약
- biological signal
- Missing Value
- Proteomics
- 분석팀
- 데이터
- audit
- lc-ms/ms
- 대사체 분석
- 시스템
- 신약개발
- AI
- bioanalysis
- 재현성
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
