티스토리 뷰

같은 샘플인데 왜 column만 바꿨는데 proteome이 달라질까
Proteomics를 처음 시작할 때 LC column은 생각보다 단순한 부품처럼 보인다. 대부분의 관심은 mass spectrometer 쪽으로 향한다. Orbitrap resolution은 어느 정도인지, scan speed는 충분한지, DIA를 쓸지 DDA를 쓸지 같은 이야기들이 훨씬 중요하게 느껴진다. 반면 LC column은 그저 peptide를 분리해서 넘겨주는 소모품 정도로 취급되는 경우가 많다. 실제로 실험실에서도 column은 어느 순간부터 “원래 쓰던 것”을 계속 사용하는 영역이 된다. 누군가 예전에 잘 쓰던 제품을 반복 구매하고, 문제가 생기면 새것으로 교체하는 정도로 끝난다.
그런데 데이터를 오래 보다 보면 이상한 순간들이 생긴다. 같은 digest를 분석했는데 column을 교체한 이후 peptide identification 수가 갑자기 달라지거나, 특정 protein group만 intensity pattern이 흔들리기 시작한다. 어떤 경우에는 전체 protein 수는 비슷한데 pathway analysis 결과가 미묘하게 달라지기도 한다. 더 흥미로운 것은 instrument condition은 멀쩡하다는 점이다. calibration도 정상이고 spray도 안정적이며 QC peptide도 큰 문제 없이 보인다. 그럼에도 결과는 이전과 같지 않다.
이 시점에서 많은 사람들이 간과하는 사실이 하나 있다. Proteomics에서 LC column은 단순히 “분리 장치”가 아니다. 실제로는 어떤 peptide가 mass spectrometer에 도달할 수 있는지를 결정하는 첫 번째 필터에 가깝다. 그리고 이 필터 구조가 바뀌는 순간, 우리가 관찰하게 되는 proteome 자체가 달라질 수 있다.
1. Proteomics에서 LC는 생각보다 훨씬 큰 역할을 한다
Mass spectrometry가 proteomics의 핵심 기술처럼 보이지만, 실제 acquisition 구조를 보면 LC의 영향은 절대적이다. MS는 동시에 너무 많은 precursor가 들어오는 상황을 처리하지 못한다. 결국 peptide를 시간적으로 분리해서 instrument가 순차적으로 sampling할 수 있게 만드는 과정이 필요하다. 이 역할을 담당하는 것이 LC다.
문제는 peptide separation이 단순한 “정렬” 과정이 아니라는 점이다. 어떤 peptide는 특정 stationary phase에 강하게 retention되고, 어떤 peptide는 거의 retention되지 못한 채 early elution된다. 또 어떤 peptide는 peak가 넓게 퍼지고, 어떤 peptide는 sharp peak 형태로 나타난다. 이 차이는 단순히 chromatogram 모양을 바꾸는 수준에서 끝나지 않는다. 실제 precursor selection probability 자체를 바꿔버린다.
예를 들어 DDA 환경에서는 특정 순간 가장 intensity가 높은 precursor들이 선택된다. 만약 column 특성 때문에 어떤 peptide peak가 넓게 퍼져 intensity가 낮아진다면, 동일 abundance라도 selection 경쟁에서 밀릴 가능성이 높아진다. 반대로 peak compression이 잘 일어나면 signal density가 증가하면서 선택 확률이 올라간다. 결국 LC separation behavior는 acquisition bias를 직접적으로 형성한다.
2. 같은 peptide라도 column에 따라 다르게 보인다
실제 raw data를 비교해보면 이런 차이는 생각보다 훨씬 극적이다. 예를 들어 동일한 HeLa digest를 C18 column 두 종류에서 분석했을 때, 특정 hydrophobic peptide들의 retention behavior가 상당히 다르게 나타나는 경우가 있다.
한 column에서는 peptide가 gradient 후반부에서 sharp하게 elution되면서 precursor intensity가 높게 형성된다. 이 경우 DDA TopN selection에서 안정적으로 선택되고, high-quality MS/MS spectrum을 생성한다. 하지만 다른 column에서는 동일 peptide가 broader peak 형태로 퍼지면서 intensity가 감소한다. 총 ion abundance는 비슷할 수 있지만 순간 peak intensity는 낮아지기 때문에 co-eluting precursor와 경쟁에서 밀려 selection되지 못할 가능성이 커진다.
결과만 보면 특정 peptide가 column A에서는 존재하고 column B에서는 사라진 것처럼 보인다. 하지만 실제로는 peptide abundance가 달라진 것이 아니라 chromatographic behavior가 바뀌었을 뿐이다.
이 현상은 low abundance peptide 영역에서 특히 심하게 나타난다. abundance가 높은 peptide는 어느 정도 chromatographic distortion이 발생해도 여전히 충분한 signal intensity를 유지하지만, low abundance precursor는 peak shape 변화만으로도 detection threshold 아래로 떨어질 수 있다.
3. Particle size는 단순한 efficiency 문제가 아니다
Column specification을 볼 때 가장 먼저 눈에 들어오는 것 중 하나가 particle size다. 일반적으로 particle size가 작을수록 separation efficiency가 높아진다고 알려져 있다. 실제로 sub-2 µm particle column은 sharper peak와 높은 resolving power를 제공하는 경우가 많다.
하지만 proteomics에서는 이 문제가 단순히 “분리가 더 좋다”로 끝나지 않는다. Peak width 자체가 acquisition dynamics를 바꾸기 때문이다.
예를 들어 동일 peptide가 5 µm particle column에서는 약 20초 폭으로 elution되지만, 1.7 µm column에서는 8~10초 수준의 sharper peak로 나타날 수 있다. 이 경우 peak intensity는 증가하지만 동시에 instrument가 sampling할 수 있는 시간 window는 줄어든다.
만약 MS cycle time이 충분히 빠르지 않다면 sharper peak는 오히려 undersampling 문제를 만든다. 실제로 high-efficiency nanoLC 환경에서 TopN이 낮거나 resolution setting이 높은 경우, peak apex를 제대로 sampling하지 못해 quantification reproducibility가 악화되는 사례가 자주 나타난다.
즉 particle size는 chromatographic quality뿐 아니라 scan speed requirement까지 함께 바꾼다.
4. Column length가 proteome coverage를 바꾸는 이유
Column length 역시 단순한 separation capacity 문제가 아니다. Longer column은 일반적으로 peak capacity를 증가시키고 peptide separation을 향상시키지만, 동시에 backpressure와 analysis time을 증가시킨다.
Proteomics에서는 이 trade-off가 매우 중요하다. 긴 column을 사용하면 co-elution이 감소하고 low abundance peptide detection이 향상될 수 있다. 하지만 gradient diffusion이 증가하면서 일부 peptide peak가 broaden될 수 있고, analysis throughput은 감소한다.
실제 plasma proteomics에서는 이런 차이가 꽤 명확하게 나타난다. 50 cm nanoLC column에서는 high complexity matrix 안에서도 peptide separation이 개선되면서 low abundance signaling protein detection이 증가할 수 있다. 하지만 동일 setup에서 shorter column을 사용하면 co-eluting background peptide가 증가하면서 ion suppression이 심해지고 일부 precursor가 selection에서 탈락한다.
결국 column length는 단순한 hardware specification이 아니라 어떤 biological layer를 더 잘 보게 될지를 결정하는 변수에 가깝다.
5. Pore size가 peptide population 자체를 바꾼다
Proteomics에서 자주 간과되는 또 하나의 요소는 pore size다. 일반적으로 small peptide 중심 분석에서는 100 Å pore column이 널리 사용되지만, larger peptide나 partially digested peptide가 많은 환경에서는 300 Å pore column이 더 유리할 수 있다.
문제는 pore accessibility 차이가 특정 peptide population 자체를 선택적으로 enrichment하거나 배제할 수 있다는 점이다. 특히 membrane protein-derived hydrophobic peptide나 PTM-bearing peptide는 pore interaction에 민감하게 반응하는 경우가 많다.
실제 phosphoproteomics dataset에서는 동일 sample이라도 pore size에 따라 phosphopeptide recovery pattern이 달라지는 사례가 보고된다. 어떤 phosphopeptide는 특정 pore environment에서 retention stability가 좋아지면서 detection frequency가 증가하지만, 다른 peptide는 adsorption 증가로 인해 signal loss가 발생한다.
이 경우 연구자는 phosphosite abundance 변화로 해석할 수 있지만, 실제로는 chromatographic accessibility 변화에 가까운 상황일 수 있다.
6. Column aging은 조용히 proteome을 바꾼다
Proteomics 실험에서 가장 흔하지만 가장 잘 숨겨지는 변수 중 하나가 column aging이다. 대부분 column은 시간이 지나면서 stationary phase degradation, void formation, contamination accumulation 같은 변화를 겪는다.
흥미로운 것은 이런 변화가 단순히 peak quality 저하로만 나타나지 않는다는 점이다. 실제로는 특정 peptide population이 선택적으로 영향을 받는다.
예를 들어 hydrophobic peptide는 aged column에서 retention instability를 더 크게 보이는 경우가 많다. 어떤 peptide는 retention time drift가 커지고, 어떤 peptide는 peak tailing이 증가한다. 이 결과 precursor intensity distribution이 변하고 DDA selection pattern까지 달라진다.
실제 longitudinal proteomics study에서 column replacement 이후 갑자기 differential protein pattern이 달라지는 사례는 드물지 않다. 특히 장기간 cohort study에서는 batch effect 상당 부분이 column condition 변화와 연결되는 경우도 있다.
7. NanoLC vs microflow에서도 proteome이 달라진다
최근에는 throughput 문제 때문에 microflow proteomics를 사용하는 경우가 늘고 있다. 그런데 nanoLC에서 microflow로 넘어가는 순간 단순히 sensitivity만 바뀌는 것이 아니다. 실제로 관찰 가능한 proteome landscape 자체가 달라진다.
NanoLC는 높은 ionization efficiency 덕분에 low abundance peptide detection에 강점이 있다. 하지만 spray instability와 clogging 문제에 민감하다. 반면 microflow는 robustness가 뛰어나고 reproducibility가 높지만, 일부 low abundance peptide는 detection threshold 아래로 떨어질 수 있다.
실제 comparative dataset를 보면 nanoLC에서는 signaling pathway protein detection이 우세한 반면, microflow에서는 high abundance structural protein quantification reproducibility가 더 안정적인 경우가 많다.
즉 어떤 LC format을 선택하느냐에 따라 “잘 보이는 biology” 자체가 달라질 수 있다.
8. Column chemistry는 ion suppression 구조까지 바꾼다
Column selection은 ion suppression과도 직접 연결된다. Different stationary phase chemistry는 peptide elution profile을 바꾸고, 결과적으로 어떤 precursor들이 같은 retention time 영역에서 경쟁하게 되는지를 변화시킨다.
예를 들어 특정 column에서는 hydrophobic peptide들이 gradient 후반부에 밀집되면서 co-elution density가 증가할 수 있다. 이 경우 ion competition이 심해지고 일부 precursor가 selective suppression을 받는다.
실제 raw chromatogram을 비교해보면 동일 peptide라도 column chemistry에 따라 precursor intensity pattern이 상당히 다르게 나타나는 경우가 있다. 어떤 peptide는 특정 column에서 consistently 낮은 signal을 보이는데, 이는 biological absence라기보다 co-elution-driven suppression 가능성이 더 크다.
결국 LC column은 단순 separation device가 아니라 ionization ecology 자체를 재구성하는 장치에 가깝다.
9. 왜 우리는 이 문제를 자주 놓치는가
가장 큰 이유는 LC가 너무 “당연한 존재”처럼 취급되기 때문이다. 대부분의 troubleshooting은 mass spectrometer 중심으로 이루어진다. Signal이 약하면 source를 확인하고, identification이 줄면 fragmentation setting을 조정한다. 하지만 chromatographic behavior 변화는 생각보다 자주 간과된다.
또 하나의 이유는 software abstraction이다. 최종 protein table에서는 chromatographic distortion이 직접 보이지 않는다. 연구자는 fold change와 p-value를 보게 되지만, 그 결과가 어떤 peak shape와 precursor selection bias에서 비롯되었는지는 쉽게 드러나지 않는다.
결국 LC-induced bias는 acquisition 초기 단계에서 생성되지만, 해석 단계에서는 biological signal처럼 보이게 된다.
10. 실제 데이터에서 반드시 확인해야 하는 것들
Proteomics에서 LC column 영향을 완전히 제거할 수는 없다. 하지만 최소한 그 구조를 이해하고 점검하는 것은 가능하다.
우선 동일 peptide의 peak shape consistency를 주기적으로 확인할 필요가 있다. 특정 peptide만 반복적으로 broadening되거나 tailing이 증가한다면 column-related bias 가능성을 의심해야 한다.
Retention time drift 역시 중요하다. 특히 longitudinal dataset에서는 subtle RT shift가 precursor selection pattern을 바꾸는 경우가 많다.
Column replacement 전후 데이터를 직접 비교하는 것도 필요하다. 많은 경우 “새 column이 더 좋다”고 생각하지만, 실제로는 proteome sampling pattern 자체가 달라진 상황일 수 있다.
가능하다면 QC peptide panel을 단순 intensity monitoring이 아니라 chromatographic behavior 관점에서도 해석해야 한다. Peak width, asymmetry, retention stability 같은 요소들이 장기적으로 proteomics reproducibility에 더 중요한 경우가 많기 때문이다.
결론
Proteomics에서 LC column은 단순한 separation tool이 아니다. 실제로는 어떤 peptide가 instrument에 도달할 수 있는지, 어떤 precursor가 선택될 수 있는지, 어떤 fragment spectrum이 생성되는지를 결정하는 첫 번째 구조다.
Column chemistry, particle size, pore size, length, aging 상태 같은 요소들은 모두 proteome sampling 방식에 영향을 준다. 결국 같은 sample이라도 어떤 column을 사용하느냐에 따라 관찰되는 proteome landscape 자체가 달라질 수 있다.
이 사실을 이해하기 시작하면 이전에는 단순한 “instrument variability”로 보였던 현상들이 다르게 보이기 시작한다. 왜 특정 peptide가 갑자기 사라졌는지, 왜 batch effect가 반복되는지, 왜 일부 pathway만 흔들리는지에 대한 답이 chromatographic behavior 안에 숨어 있는 경우가 생각보다 많기 때문이다.
'제약산업' 카테고리의 다른 글
| 같은 peptide인데 왜 어떤 날은 사라질까 (0) | 2026.05.12 |
|---|---|
| Fragmentation 조건이 identification에 미치는 영향 (0) | 2026.05.11 |
| TopN, AGC, Injection Time의 상호작용 (0) | 2026.05.10 |
| Dynamic exclusion 설정이 결과를 왜곡하는 방식 (1) | 2026.05.09 |
| Scan speed가 peptide detection을 바꾸는 방식 (0) | 2026.05.08 |
| DDA vs DIA: 결과가 달라지는 근본적인 이유 (0) | 2026.05.07 |
| Resolution vs Scan Speed trade-off 실무 가이드 (0) | 2026.05.06 |
| MS resolution이 identification 결과에 미치는 영향 (0) | 2026.05.05 |
- Total
- Today
- Yesterday
- audit
- Biomarker
- metabolomics
- 해석
- 바이오마커
- 정량분석
- matrix effect
- LC-MS
- 분석
- lc-ms/ms
- 약물분석
- 제약산업
- bioanalysis
- 시스템
- 신약개발
- Proteomics
- Spatial metabolomics
- AI
- 데이터
- 임상시험
- 분석팀
- 제약
- 미래산업
- biological signal
- Targeted Metabolomics
- 대사체 분석
- Multi-omics
- 정밀의료
- ich m10
- 치료제
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
