— 더 선명하게 보는 것이 항상 더 정확한 것은 아닌 이유처음 장비 스펙을 볼 때많은 사람들이 자연스럽게 이렇게 생각합니다.“resolution이 높을수록 좋은 거 아닌가?”이건 틀린 말은 아닙니다.실제로 높은 resolution은 분명히 장점이 많습니다.peak를 더 잘 구분할 수 있고질량 정확도가 올라가고interference를 줄일 수 있습니다그래서 자연스럽게 이어집니다.“그럼 identification도 더 정확해지겠네”여기까지는 맞습니다.하지만 실제 데이터를 다뤄보면조금 다른 경험을 하게 됩니다.같은 샘플인데resolution을 높였더니 protein 수가 줄어들기도 하고반대로 늘어나기도 하고특정 peptide는 아예 사라지기도 합니다이건 단순한 성능 향상의 문제가 아닙니다.👉 무엇을 볼 수 ..
— 같은 시간에 나온다는 이유만으로, 어떤 신호는 사라지고 어떤 신호는 과장된다데이터를 보다 보면이상한 패턴을 만나는 순간이 있다.어떤 peptide는 항상 값이 낮고어떤 peptide는 특정 조건에서만 갑자기 튀고replicate 간 변동이 유독 큰 구간이 있다처음에는 이렇게 생각한다.“샘플 준비 문제인가?”“기기 상태가 불안정한가?”하지만 chromatogram을 자세히 보면공통된 특징이 하나 보인다.👉 피크들이 겹쳐 있다이때부터 문제는 명확해진다.Co-elutionCo-elution은 단순한 ‘분리 실패’가 아니다많은 사람들이 co-elution을이렇게 생각한다.“LC 분리가 덜 된 상태”그래서 해결책도 단순하다.gradient 늘리기column 바꾸기하지만 실제 문제는그보다 훨씬 깊다.Co-el..
— 우리는 농도를 측정하는 걸까, 아니면 경쟁에서 살아남은 신호를 보고 있는 걸까데이터를 보다 보면 이런 순간이 온다.같은 샘플인데 intensity가 다르고replicate 간 변동이 예상보다 크고어떤 peptide는 갑자기 사라진다처음에는 이렇게 생각한다.“기기가 불안정한가?”“샘플 준비가 잘못됐나?”하지만 반복해서 보면이상한 패턴이 하나 보이기 시작한다.👉 특정 peptide들이 항상 같이 흔들린다이 순간부터문제는 다른 방향을 가리킨다.Ion suppressionion suppression은 ‘오류’가 아니라 ‘기본 동작’이다많은 사람들이 ion suppression을예외적인 문제처럼 생각한다.하지만 실제로는 그렇지 않다.ESI 기반 LC-MS에서는👉 ion suppression은 항상 존재한다..
— 우리는 같은 샘플을 분석하는 걸까, 아니면 다른 샘플을 만들어내고 있는 걸까처음에는 단순한 의도로 시작한다.“gradient를 조금만 바꿔보자”60분 → 90분shallow → steepstarting %B 약간 조정이건 흔한 최적화 과정이다.오히려 당연한 단계다.그런데 결과를 보고 나면생각보다 당황하게 된다.검출되는 단백질 수가 달라지고peptide 패턴이 바뀌고differential expression 결과까지 달라진다이 순간 질문이 생긴다.“같은 샘플인데 왜 결과가 바뀌는 걸까?”LC gradient는 단순한 분리 조건이 아니다많은 사람들이 LC gradient를이렇게 생각한다.“분리를 조금 더 잘하기 위한 설정”하지만 실제로는 훨씬 더 큰 역할을 한다.LC gradient는어떤 peptide가..
— 우리가 보고 있는 것은 단백질이 아니라, 단백질의 ‘조각’이다처음 proteomics 데이터를 접하면자연스럽게 이렇게 생각하게 된다.“이건 단백질 데이터다”리스트에는 단백질 이름이 있고,각각의 abundance 값이 있고,그 변화가 정리되어 있다.그래서 해석도 자연스럽게 이어진다.이 단백질이 증가했다이 단백질이 감소했다이건 너무 당연한 흐름이라대부분 의심하지 않는다.하지만 proteomics를 조금 더 깊이 들여다보면이 전제가 얼마나 위험한지 보이기 시작한다.우리는 단백질을 직접 측정하지 않는다LC-MS 기반 proteomics에서실제로 측정하는 것은 단백질이 아니다.우리는trypsin으로 단백질을 잘라서peptide를 만들고그 peptide의 signal을 측정한다즉,proteomics는 prote..
— 어떤 방법을 쓰느냐에 따라 결과 자체가 바뀌는 이유데이터 분석에서 normalization은항상 “필수 단계”로 취급된다.그래서 대부분의 분석 pipeline에서는아무 고민 없이 들어간다.log transformscalingnormalization마치 정해진 순서처럼.하지만 실제로 데이터를 몇 번 다뤄보면이상한 경험을 하게 된다.같은 데이터인데어떤 normalization을 쓰느냐에 따라→ 결과가 완전히 달라진다어떤 경우에는→ 있던 차이가 사라지고어떤 경우에는→ 없던 차이가 생긴다이 순간부터 질문이 생긴다.“대체 어떤 normalization이 맞는 걸까?”먼저 이해해야 할 것: normalization은 “정답”이 없다많은 사람들이 오해하는 부분이다.normalization은더 정확한 값을 만드는 ..
데이터를 ‘정리’하는 과정에서 진짜 차이를 지워버릴 때데이터를 처음 받아보면가장 먼저 드는 생각은 이것이다.“값이 너무 들쭉날쭉하다”샘플 간 intensity가 다르고,run마다 scale이 다르고,어떤 샘플은 전체적으로 높고어떤 샘플은 낮다.그래서 우리는 자연스럽게다음 단계를 떠올린다.Normalization전체를 맞추고비교 가능하게 만들고noise를 줄인다이건 너무 당연한 과정이다.그래서 오히려의심하지 않는다.하지만 문제는바로 여기서 시작된다.normalization은 ‘보정’이 아니라 ‘가정’이다우리는 보통 normalization을기술적인 보정이라고 생각한다.하지만 실제로는 그렇지 않다.Normalization은 항상하나의 전제를 포함한다.전체 signal은 비슷하다대부분 feature는 변하지 ..
— 보이지 않는 데이터가 결과를 가장 크게 바꾸는 순간데이터를 보다 보면가끔 이런 순간이 온다.“왜 이 값은 비어 있을까?”처음에는 단순하게 생각한다.측정이 안 됐나 보다값이 없나 보다그래서 자연스럽게 이어진다.missing → 0missing → 무시이 판단은 빠르고 편하다.하지만 이 단순한 선택 하나가전체 결과를 완전히 바꿔버리는 경우가 있다.그리고 더 문제는그 변화가 너무 “그럴듯하게” 보인다는 점이다.우리는 missing을 너무 쉽게 해석한다omics 데이터에서 missing value는예외적인 상황이 아니다.오히려 흔하다.proteomics, metabolomics 모두에서missing value는 기본적으로 존재한다.문제는 이걸 어떻게 이해하느냐다.많은 경우 우리는 이렇게 생각한다.값이 없다 ..
- Total
- Today
- Yesterday
- bioanalysis
- Biomarker
- 치료제
- Multi-omics
- lc-ms/ms
- LC-MS
- AI
- 바이오마커
- 임상시험
- 미래산업
- ich m10
- 분석팀
- 시스템
- 제약
- Targeted Metabolomics
- 약물분석
- Spatial metabolomics
- 데이터
- audit
- Proteomics
- 해석
- 정량분석
- 분석
- matrix effect
- 신약개발
- 대사체 분석
- metabolomics
- biological signal
- 제약산업
- 정밀의료
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
