데이터를 ‘정리’하는 과정에서 진짜 차이를 지워버릴 때데이터를 처음 받아보면가장 먼저 드는 생각은 이것이다.“값이 너무 들쭉날쭉하다”샘플 간 intensity가 다르고,run마다 scale이 다르고,어떤 샘플은 전체적으로 높고어떤 샘플은 낮다.그래서 우리는 자연스럽게다음 단계를 떠올린다.Normalization전체를 맞추고비교 가능하게 만들고noise를 줄인다이건 너무 당연한 과정이다.그래서 오히려의심하지 않는다.하지만 문제는바로 여기서 시작된다.normalization은 ‘보정’이 아니라 ‘가정’이다우리는 보통 normalization을기술적인 보정이라고 생각한다.하지만 실제로는 그렇지 않다.Normalization은 항상하나의 전제를 포함한다.전체 signal은 비슷하다대부분 feature는 변하지 ..
— 환자의 상태가 아니라, 샘플의 변화가 결과를 만들고 있을 수도 있다임상 연구에서 metabolomics를 적용하면항상 기대가 크다.질병 특이적 biomarker 발견치료 반응 예측환자 stratification데이터는 화려하다.통계적으로 유의미한 결과도 나온다.그런데 어느 순간이상한 일이 발생한다.다른 병원에서 같은 연구를 했는데결과가 재현되지 않는다.또는같은 cohort에서도batch에 따라 결과가 달라진다.이때 대부분 이렇게 생각한다.환자군 차이인가분석 장비 차이인가하지만 실제 원인은훨씬 더 단순한 곳에 있는 경우가 많다.샘플이 이미 변해버렸기 때문이다.1. 임상 샘플은 ‘통제되지 않는 변수의 집합’이다실험실 샘플과 달리임상 샘플은 완전히 통제할 수 없다.채혈 시간 다름공복 여부 다름약물 복용 상..
— 우리는 보정을 하고 있는 걸까, 아니면 또 다른 편향을 만들고 있는 걸까처음 LC-MS 기반 metabolomics를 시작하면누구나 이렇게 배운다.“internal standard(IS)를 쓰면 정량이 정확해진다.”그래서 자연스럽게 생각한다.IS 넣었으니까 문제 없겠지normalization 했으니까 괜찮겠지하지만 실제 데이터를 다루다 보면이 믿음은 금방 흔들린다.internal standard를 넣었는데도결과가 이상하게 변하는 순간이 온다.batch마다 값이 달라지고특정 metabolite만 튀고biological interpretation이 맞지 않는다그때 비로소 깨닫게 된다.문제는 internal standard의 ‘존재’가 아니라‘선택’이었다는 것.1. internal standard는 만능이..
— 우리는 데이터를 보고 있는가, 아니면 조건이 만든 환상을 보고 있는가metabolomics 데이터를 처음 열어보는 순간,대부분의 사람들은 비슷한 감정을 느낀다.“이 안에 모든 정보가 들어 있다.”수천 개의 peak,정리된 feature table,그리고 통계적으로 정리된 결과들.이 모든 것이샘플의 상태를 그대로 보여주는 것처럼 느껴진다.하지만 이 믿음은생각보다 쉽게 무너진다.왜냐하면 metabolomics에서가장 중요한 구분이 하나 있기 때문이다.“보이는 것”과 “실제로 존재하는 것”은 다르다.그리고 이 차이를 이해하지 못하는 순간,해석은 이미 틀어지기 시작한다.1. LC-MS는 ‘현실’을 보여주지 않는다많은 사람들이 LC-MS 데이터를현실의 반영이라고 생각한다.하지만 실제로 LC-MS는현실을 그대로..
우리가 보고 있는 변화는 진짜인가, 아니면 측정의 산물인가metabolomics 데이터를 해석하다 보면어느 순간부터 확신이 생긴다.“이건 분명히 biological difference다.”그런데 시간이 지나고,다른 batch나 다른 cohort에서 같은 분석을 반복하면그 확신은 너무 쉽게 무너진다.같은 pathway, 같은 metabolite인데결과가 재현되지 않는다.이때 많은 사람들이“샘플이 다르기 때문”이라고 생각한다.하지만 실제로 더 자주 등장하는 원인은 이것이다.matrix effect.문제는 이 matrix effect가굉장히 그럴듯하게 “biological signal처럼 보인다”는 점이다.그래서 이 둘을 구분하는 능력은metabolomics 분석에서 가장 중요한 역량 중 하나다.1. Matr..
— 같은 샘플인데 왜 전혀 다른 결론이 나오는가 metabolomics 데이터를 처음 받아봤을 때의 당혹감은 쉽게 잊히지 않는다.같은 샘플을 분석했는데,조건이 조금만 바뀌어도 결과가 완전히 달라진다.어떤 날은 특정 metabolite가 뚜렷하게 보이고,다른 날은 거의 사라진다.처음에는 장비 문제라고 생각하기 쉽다.하지만 경험이 쌓일수록 알게 된다.문제는 장비가 아니라우리가 설정한 LC-MS 조건 그 자체라는 것을.그리고 더 중요한 사실은이 조건들이 단순히 “신호 강도”만 바꾸는 것이 아니라결과 해석의 방향 자체를 바꾼다는 점이다.1. Chromatography가 결정하는 ‘보이는 세계’LC 조건은 metabolomics에서사실상 “무엇을 볼 것인가”를 결정한다.Reverse-phase vs HILICRe..
– 복잡한 생물학을 ‘유의/비유의’로 축소하는 순간Metabolomics 연구에서 p-value는 거의 모든 분석의 중심에 있다. 환자군과 대조군을 비교하고, 수백에서 수천 개의 metabolite 중에서 통계적으로 유의한 변화를 보이는 것들을 선별하는 과정은 매우 익숙한 분석 흐름이다.문제는 이 과정이 너무 자연스럽게 반복되면서, 어느 순간 metabolomics 연구 전체가 “유의한 metabolite를 찾는 작업”으로 단순화된다는 점이다.하지만 metabolomics 데이터가 담고 있는 정보는 그렇게 단순하지 않다. 대사체는 수많은 생리적 변수, 환경 요인, 시간적 변화, 그리고 복잡한 네트워크 구조를 반영한다. 그럼에도 불구하고 p-value 중심 해석은 이 복잡한 시스템을 이분법적인 구조로 축소..
– discovery 연구와 clinical biomarker 연구는 전혀 다른 문제다 Metabolomics 연구는 지난 10여 년 동안 폭발적으로 증가했다. 특히 LC-MS 기반 untargeted metabolomics 기술이 발전하면서 수천 개의 metabolite feature를 동시에 관찰할 수 있게 되었고, 다양한 질병에서 새로운 biomarker 후보들이 제시되었다.논문만 보면 metabolomics는 이미 precision medicine의 핵심 기술처럼 보인다. 특정 metabolite 패턴을 이용해 질병을 진단하고, 환자를 분류하며, 치료 반응을 예측할 수 있다는 연구 결과들이 매우 많기 때문이다.하지만 현실적으로 보면 상황은 조금 다르다.수많은 metabolomics biomarke..
- Total
- Today
- Yesterday
- AI
- Proteomics
- metabolomics
- Spatial metabolomics
- 정량분석
- 미래산업
- 임상시험
- 시스템
- 신약개발
- LC-MS
- Multi-omics
- 정밀의료
- 분석팀
- audit
- 제약산업
- Targeted Metabolomics
- 약물분석
- Biomarker
- 대사체 분석
- 분석
- bioanalysis
- biological signal
- ich m10
- lc-ms/ms
- 치료제
- 바이오마커
- matrix effect
- 제약
- 데이터
- 해석
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
