티스토리 뷰

— 우리는 샘플을 분석하는 것이 아니라, 이미 ‘가공된 결과’를 해석하고 있다
처음 metabolomics 실험을 설계할 때
많은 사람들이 이렇게 생각한다.
“전처리는 그냥 준비 단계 아닌가?”
- 단백질 제거하고
- 추출하고
- 정리해서 LC-MS에 넣는다
분석의 핵심은
LC-MS라고 믿는다.
하지만 몇 번의 프로젝트를 지나고 나면
이 생각은 완전히 바뀐다.
같은 샘플을 사용했는데
전처리 방법만 바꿨을 뿐인데
결과가 완전히 달라지는 순간을 경험하기 때문이다.
어떤 경우에는
결론 자체가 뒤집힌다.
그때 깨닫게 된다.
문제는 분석이 아니라,
이미 전처리에서 시작되었다는 것.
1. 전처리는 ‘손실’과 ‘선택’의 과정이다
전처리는 단순히 샘플을 정리하는 과정이 아니다.
이건 본질적으로 두 가지를 동시에 수행한다.
- 무엇을 남길 것인가
- 무엇을 버릴 것인가
즉,
전처리는 이미 데이터의 일부를 제거하는 과정이다.
문제는 이 선택이
의도적이든 아니든
결과를 결정한다는 점이다.
2. Extraction solvent 하나로 결과가 달라진다
가장 대표적인 예는 extraction solvent다.
- Methanol
- Acetonitrile
- Water mixture
이 조합은 단순한 선택처럼 보인다.
하지만 실제로는
추출되는 metabolite의 종류를 바꾼다.
예시
- 극성 solvent → polar metabolite 중심
- 비극성 solvent → lipid 계열 중심
즉,
같은 샘플이라도
전혀 다른 metabolome을 보게 된다
3. Protein precipitation의 숨겨진 영향
단백질 제거는
필수 과정처럼 보인다.
하지만 이 과정에서도
많은 변화가 발생한다.
- 단백질과 결합된 metabolite 손실
- co-precipitation
- binding equilibrium 변화
특히 문제는
단백질에 결합된 small molecule이다.
이들은 전처리 과정에서
함께 사라질 수 있다.
결과적으로
실제 존재하던 metabolite가
데이터에서 사라진다
4. Quenching 속도가 결과를 바꾼다
세포나 조직 샘플에서는
quenching이 매우 중요하다.
왜냐하면
대사는 멈추지 않기 때문이다.
- 빠른 quenching → 실제 상태 보존
- 지연 → 대사 계속 진행
특히 glycolysis나 TCA cycle 관련 metabolite는
몇 초~몇 분 사이에도 변한다.
즉,
전처리 속도 = 생물학적 상태 보존 정도
5. Sample cleanup이 bias를 만든다
SPE, filtration 같은 cleanup 과정은
데이터 품질을 높이기 위해 사용된다.
하지만 이 과정 역시
완전히 중립적이지 않다.
- 특정 화합물 retention
- 일부 metabolite 손실
- recovery 차이
즉,
깨끗한 데이터 = 정확한 데이터는 아니다
6. 농도 조정과 희석의 함정
샘플을 희석하거나 농축하는 과정에서도
문제가 발생한다.
- non-linear response
- matrix effect 변화
- ion suppression 변화
특히 희석은
단순한 비율 변화가 아니라
검출 환경 자체를 바꾼다
7. 실제로 발생하는 해석 왜곡
이 모든 요소가 결합되면
다음과 같은 일이 발생한다.
케이스 1
특정 metabolite 감소
→ 질병 관련 downregulation 해석
→ 실제로는 extraction inefficiency
케이스 2
lipid pathway 활성화
→ biological mechanism 제시
→ 실제로는 solvent bias
케이스 3
group 간 차이
→ 통계적으로 유의
→ 실제로는 전처리 batch 차이
이건 단순한 technical error가 아니다.
생물학적 결론 자체가 바뀌는 문제다
8. 왜 이 문제가 위험한가
가장 큰 문제는
이 왜곡이 데이터에서 드러나지 않는다는 점이다.
- QC 통과
- peak 정상
- 통계적으로 유의
모든 것이 정상처럼 보인다.
하지만 실제로는
이미 편향된 데이터다.
9. 가장 위험한 순간
결과가 너무 잘 나올 때다.
- clear separation
- strong fold change
- pathway alignment
이때 사람은 확신한다.
“이건 진짜다”
하지만 그 결과가
전처리에서 만들어진 것이라면?
이건 발견이 아니라
인위적인 결과 생성이다.
10. 실무에서 반드시 해야 할 것
이 문제를 완전히 제거할 수는 없다.
하지만 크게 줄일 수는 있다.
1) 전처리 조건 고정
batch 간 동일 조건 유지
2) recovery 평가
internal standard 활용
3) multiple extraction 비교
조건에 따라 결과 유지되는지 확인
4) stability 고려
전처리 과정 중 변화 평가
5) SOP 문서화
재현성 확보
11. 가장 중요한 질문
모든 metabolomics 분석에서
반드시 던져야 할 질문이 있다.
“이 결과는 biological signal인가,
아니면 전처리 artifact인가?”
이 질문을 하지 않으면
결과는 언제든지 바뀔 수 있다.
결론: 전처리는 분석의 일부가 아니다, ‘결과의 일부’다
많은 사람들이 전처리를
분석 이전 단계로 생각한다.
하지만 실제로는 다르다.
전처리는 결과를 만드는 과정이다
이 단계에서 이미
- 무엇을 볼지
- 무엇을 놓칠지
결정된다.
그래서 좋은 분석가는
LC-MS 조건보다 먼저
전처리를 의심한다.
“나는 지금
샘플을 보고 있는가,
아니면 내가 만든 결과를 보고 있는가?”
이 질문 하나가
데이터 해석의 수준을 완전히 바꾼다.
'제약산업' 카테고리의 다른 글
| Metabolomics에서 ‘보이는 것’과 ‘존재하는 것’의 차이 (0) | 2026.04.18 |
|---|---|
| LC-MS 조건 하나로 결과가 바뀌는 이유 (0) | 2026.04.17 |
| Untargeted metabolomics에서 가장 위험한 착각 (0) | 2026.04.16 |
| Matrix effect vs Biological signal 구분하는 방법 (0) | 2026.04.15 |
| Ion suppression이 metabolite pathway 해석을 왜곡하는 방식 (0) | 2026.04.13 |
| Metabolomics workflow에서 LC-MS 조건이 결과 해석에 미치는 영향 (0) | 2026.04.12 |
| 재현되지 않는 omics 연구의 공통된 설계 패턴 (0) | 2026.04.11 |
| 연구자가 기대한 방향으로 데이터가 보이기 시작하는 순간 (0) | 2026.04.10 |
- Total
- Today
- Yesterday
- Targeted Metabolomics
- audit
- 제약산업
- ich m10
- 대사체 분석
- 분석
- 시스템
- 바이오마커
- metabolomics
- 제약
- 약물분석
- 치료제
- Biomarker
- LC-MS
- Proteomics
- Spatial metabolomics
- 약물개발
- 분석팀
- 미래산업
- 임상시험
- 신약개발
- bioanalysis
- AI
- 정밀의료
- 해석
- Multi-omics
- 데이터
- lc-ms/ms
- 정량분석
- matrix effect
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
