티스토리 뷰

728x90

Ratio compression이 발생하는 구조
Ratio compression이 발생하는 구조

TMT/iTRAQ에서 실제 biological difference가 점점 작아져 보이는 이유

처음 TMT나 iTRAQ 데이터를 접하면 대부분 비슷한 인상을 받는다. 데이터가 굉장히 깔끔해 보인다는 점이다. Missing value도 적고, replicate consistency도 높으며, reporter ion 기반 quantification 결과가 정돈된 숫자로 떨어진다. Heatmap은 선명하고 PCA clustering도 안정적으로 나타난다.

그리고 어느 순간부터 연구자는 이런 생각을 하게 된다.

“이 정도면 실제 biology를 꽤 정확하게 반영하는 것 아닐까?”

실제로 isobaric labeling 기반 proteomics는 label-free quantification보다 훨씬 정교한 것처럼 보인다. 여러 sample을 하나로 섞어 동시에 분석하기 때문에 LC fluctuation이나 spray instability 같은 run-to-run variability 영향을 줄일 수 있기 때문이다.

하지만 raw spectrum을 오래 보다 보면 이상한 현상이 반복적으로 나타난다.

Western blot에서는 극적으로 증가한 protein인데 TMT에서는 fold change가 작게 나온다. 특정 signaling pathway가 biological context상 강하게 활성화되어야 하는데 reporter ion ratio는 예상보다 훨씬 평평하다. 특히 low abundance phosphoprotein은 실제 regulation이 존재하는 것 같은데도 ratio가 1 근처에 붙어버린다.

처음에는 normalization 문제처럼 보일 수 있다. Database search parameter 때문처럼 느껴질 수도 있다. 그러나 MS2 spectrum과 precursor isolation 구조를 따라가다 보면 결국 하나의 핵심 현상에 도달하게 된다.

실제 biological difference가 LC-MS 안에서 다른 peptide signal에 의해 계속 희석되고 있다는 점이다.

그리고 이 구조가 바로 ratio compression이다.

1. TMT/iTRAQ는 “같이 측정한다”는 점에서 시작된다

Ratio compression을 이해하려면 먼저 isobaric labeling quantification 구조 자체를 이해해야 한다.

TMT/iTRAQ에서는 서로 다른 sample peptide에 서로 다른 tag를 붙인다. 하지만 이 tag들은 MS1 단계에서는 동일 mass를 갖도록 설계되어 있다. 따라서 labeled peptide는 precursor 단계에서 하나의 peak처럼 보인다.

이후 MS2 fragmentation이 일어나면 reporter ion이 떨어져 나오고, 그 reporter ion intensity를 이용해 sample별 abundance를 계산한다.

즉 핵심 아이디어는 매우 단순하다.

“같은 peptide를 동시에 fragmentation하면 더 정확한 상대 정량이 가능하다.”

문제는 실제 LC-MS 환경에서는 “같은 peptide만” fragmentation되는 일이 거의 없다는 점이다.

2. Isolation window 안에는 생각보다 많은 ion이 들어온다

Mass spectrometer는 특정 precursor를 선택할 때 isolation window를 사용한다.

예를 들어 quadrupole가 0.7~1.0 m/z 범위로 precursor를 isolation한다고 가정해보자. 이론적으로는 target precursor만 선택되는 것처럼 느껴진다.

하지만 실제 biological sample은 극도로 복잡하다.

동일 retention time에 수많은 peptide가 함께 elution되고 있고, precursor peak tailing도 존재한다. 결과적으로 isolation window 안에는 target peptide 외에도 다양한 background peptide가 함께 들어오게 된다.

그리고 instrument는 이 ion들을 구분하지 못한 채 함께 fragmentation한다.

즉 MS2 spectrum은 사실상 “혼합 fragmentation 결과”가 된다.

3. Reporter ion에는 contaminant signal도 함께 들어간다

여기서 ratio compression이 시작된다.

예를 들어 어떤 target peptide가 있다고 가정해보자.

  • Sample A: abundance 매우 높음
  • Sample B: abundance 매우 낮음

이론적으로 reporter ion ratio는 극단적으로 차이가 나야 한다.

하지만 isolation window 안에 unrelated contaminant peptide들이 함께 들어왔다고 생각해보자. 이 contaminant peptide들은 대부분 여러 sample에 평균적으로 존재한다.

즉 fragmentation 이후 reporter ion에는 target peptide signal뿐 아니라 background peptide reporter signal까지 함께 섞이게 된다.

결과적으로 원래 극단적이어야 할 ratio가 background average 방향으로 끌려간다.

예를 들어 실제 biology는 10:1인데 observed ratio는 3:1 혹은 2:1 정도로 flattening된다.

즉 biological contrast가 압축된다.

이것이 ratio compression의 본질이다.

4. 왜 low abundance peptide가 더 심하게 눌리는가

Ratio compression은 모든 peptide에 동일하게 작용하지 않는다.

특히 low abundance peptide가 훨씬 더 취약하다.

이유는 단순하다. Target signal 자체가 약하기 때문이다.

High abundance peptide는 contaminant ion이 일부 섞여도 여전히 target-derived reporter signal이 dominant하게 유지될 가능성이 높다.

하지만 low abundance peptide는 background ion contribution이 상대적으로 훨씬 커진다.

즉 contaminant reporter signal이 실제 target ratio를 거의 덮어버릴 수도 있다.

실제 phosphoproteomics TMT dataset에서 중요한 signaling phosphosite가 거의 fold change 1 근처로 flattening되는 이유 중 하나가 바로 이것이다.

Low abundance biology일수록 crowded precursor environment에 더 쉽게 묻힌다.

5. Complex sample일수록 ratio compression은 심해진다

Proteome complexity는 ratio compression에 직접 연결된다.

단순 peptide mixture에서는 isolation interference probability가 상대적으로 낮다. 하지만 실제 tissue lysate나 plasma proteome처럼 complexity가 높은 sample에서는 co-eluting precursor density가 급격히 증가한다.

즉 isolation window 안에 background ion이 들어올 가능성이 훨씬 높아진다.

특히 plasma proteomics처럼 dynamic range가 enormous한 sample에서는 abundant peptide tailing이 low abundance precursor를 쉽게 오염시킨다.

실제 raw MS1 spectrum을 보면 특정 retention time 영역은 거의 precursor cloud처럼 crowded하게 보이는 경우도 많다.

그리고 이 crowded environment 안에서 reporter ion purity는 계속 무너진다.

6. Ratio compression은 “작은 변화”를 만드는 방향으로 작동한다

이 현상의 중요한 특징은 bias 방향이 일정하다는 점이다.

Random noise가 아니다.

Ratio compression은 대부분 abundance difference를 줄이는 방향으로 작동한다.

즉:

  • Upregulated protein → 덜 증가해 보임
  • Downregulated protein → 덜 감소해 보임

결국 모든 biological contrast가 중앙값 방향으로 수렴한다.

그래서 TMT/iTRAQ dataset은 전체적으로 fold change distribution이 surprisingly 좁게 나타나는 경우가 많다.

실제 biology는 훨씬 dynamic할 수 있는데, reporter ion ratio는 compressed biological landscape를 보여준다.

7. 왜 Western blot에서는 더 크게 보이는가

연구자들이 ratio compression을 처음 강하게 체감하는 순간 중 하나는 orthogonal validation이다.

TMT에서는 1.5-fold 정도 증가한 protein이 western blot에서는 훨씬 dramatic하게 증가하는 경우가 있다.

처음에는 western blot variability를 의심할 수 있다. 하지만 반복적으로 비슷한 패턴이 나오면 오히려 TMT ratio가 compressed되었을 가능성이 높다.

특히 low abundance signaling protein에서 이런 현상이 흔하다.

Western blot은 antibody specificity limitation이 있지만, 최소한 co-isolation interference 문제는 없다.

반면 TMT reporter ion은 crowded MS2 environment 안에서 항상 background contamination 영향을 받는다.

즉 orthogonal validation discrepancy는 종종 ratio compression의 흔적이다.

8. SPS-MS3는 왜 등장했는가

Ratio compression 문제를 줄이기 위해 등장한 대표적 전략이 SPS-MS3다.

기본 아이디어는 MS2 fragment ion 일부를 다시 선택해 MS3 단계에서 reporter ion quantification을 수행하는 것이다.

이렇게 하면 MS2 단계의 co-isolated contaminant contribution을 상당 부분 제거할 수 있다.

실제로 SPS-MS3는 ratio accuracy를 개선한다.

하지만 완벽하지는 않다.

MS3 acquisition은 scan speed와 sensitivity를 희생한다. 특히 low abundance peptide는 MS3까지 충분한 signal을 유지하지 못할 수 있다.

또 precursor selection 자체가 imperfect하면 residual interference는 여전히 남는다.

즉 SPS-MS3는 compression을 줄이지만, crowded proteome environment 자체를 없애지는 못한다.

9. Ratio compression은 보이지 않는 bias다

이 문제가 특히 위험한 이유는 abundance table만 봐서는 거의 드러나지 않는다는 점이다.

Reporter ion ratio는 숫자로 깔끔하게 정리된다. Heatmap도 아름답고 replicate consistency도 높다.

그래서 연구자는 데이터를 매우 신뢰하게 된다.

하지만 실제 raw MS2 spectrum 안에서는 수많은 contaminant precursor가 함께 fragmentation되고 있을 수 있다.

문제는 대부분의 software pipeline이 최종 ratio만 보여준다는 점이다.

즉 우리는 “얼마나 contamination되었는가”를 보지 못한 채 compressed abundance를 biology로 해석하게 된다.

10. 실제 데이터에서 반드시 확인해야 하는 것들

TMT/iTRAQ 데이터를 해석할 때는 precursor isolation purity를 반드시 확인할 필요가 있다.

Low purity precursor는 ratio distortion 가능성이 매우 높다.

특히 low abundance signaling protein과 phosphopeptide는 cautious interpretation이 필요하다. 작은 fold change가 실제 biology에서는 훨씬 큰 regulation일 수 있다.

가능하다면 SPS-MS3 acquisition을 사용하는 것이 좋고, Orbitrap resolution과 isolation window width 역시 carefully optimization할 필요가 있다.

또 key finding은 orthogonal validation으로 재확인하는 것이 중요하다. PRM, western blot, DIA verification 같은 방법이 도움이 될 수 있다.

무엇보다 중요한 것은 “작은 fold change = 약한 biology”라고 단순히 결론내리지 않는 것이다.

결론

Ratio compression은 TMT/iTRAQ quantification에서 발생하는 단순 technical inconvenience가 아니다. 실제 biological contrast 자체를 systematic하게 flattening하는 구조적 현상이다.

Co-isolation interference와 crowded precursor environment는 reporter ion purity를 무너뜨리고, 특히 low abundance peptide에서는 실제 biological difference를 background signal 속으로 희석시킨다.

결국 우리가 보는 reporter ion ratio는 순수한 biology라기보다, crowded LC-MS environment 안에서 contamination과 competition을 거친 compressed signal에 가깝다.

이 사실을 이해하기 시작하면 이전에는 “생각보다 변화가 작네” 정도로 보였던 데이터가 다르게 보이기 시작한다. 왜 signaling pathway가 예상보다 약하게 보이는지, 왜 western blot과 TMT 결과가 차이나는지, 왜 low abundance phosphoprotein이 fold change 1 근처로 수렴하는지에 대한 답이 ratio compression 구조 안에 숨어 있는 경우가 생각보다 많기 때문이다.

728x90