티스토리 뷰

728x90

Protein precipitation이 특정 단백질을 잃게 만드는 이유
Protein precipitation이 특정 단백질을 잃게 만드는 이유

Proteomics에서 “정제 과정”이라고 믿었던 단계가 proteome 자체를 바꿔버리는 순간

Proteomics workflow에서 protein precipitation은 너무 익숙한 과정이다. Acetone precipitation, methanol/chloroform precipitation, ethanol precipitation 같은 방법은 거의 기본 protocol처럼 사용된다. Detergent를 제거하고, buffer를 교체하고, unwanted contaminant를 정리하기 위해 많은 실험실이 precipitation 단계를 routine하게 넣는다.

특히 SDS 같은 강한 detergent를 사용한 뒤에는 precipitation이 거의 필수처럼 여겨진다. 그렇지 않으면 downstream trypsin digestion이나 LC-MS ionization이 심하게 방해받기 때문이다.

그래서 대부분의 연구자는 precipitation을 “샘플을 깨끗하게 만드는 단계” 정도로 이해한다. 단백질은 그대로 유지한 채 buffer와 contaminant만 제거된다고 생각한다. 실제 protocol에도 “protein pellet을 회수한다”는 표현이 반복되다 보니, 마치 sample 안의 단백질 전체가 안정적으로 pellet 안에 보존되는 것처럼 느껴진다.

하지만 실제 raw proteomics 데이터를 오래 보다 보면 이상한 패턴이 반복적으로 나타난다. 어떤 protein group은 precipitation 이후 consistently 감소하고, 어떤 membrane protein은 거의 보이지 않게 되며, 어떤 signaling protein은 replicate마다 recovery가 크게 흔들린다.

처음에는 digestion variability나 LC-MS sensitivity 문제처럼 보일 수 있다. 그러나 sample preparation 단계를 하나씩 따라가 보면 원인은 훨씬 앞쪽에 숨어 있는 경우가 많다. 바로 precipitation 자체다.

그리고 이 시점에서 중요한 사실 하나를 이해하게 된다. Protein precipitation은 단순한 “정리 과정”이 아니다. 실제로는 어떤 단백질을 pellet 안에 남기고, 어떤 단백질은 supernatant로 흘려보낼지를 결정하는 강력한 selection 과정이다. 즉 precipitation은 proteome을 보존하는 단계가 아니라, proteome composition 자체를 다시 구성하는 단계에 가깝다.

1. 모든 단백질은 동일하게 침전되지 않는다

Protein precipitation을 처음 배우면 단백질이 solvent condition 변화에 의해 collectively 침전된다고 이해하기 쉽다. 하지만 실제로는 모든 protein이 동일 efficiency로 pellet을 형성하지 않는다.

단백질마다 solubility가 다르고, surface charge distribution도 다르며, hydrophobicity와 structural stability 역시 크게 다르다. 어떤 단백질은 acetone addition 후 빠르게 aggregation되어 pellet을 형성하지만, 어떤 단백질은 상당 부분 soluble 상태로 남는다.

특히 low abundance protein이나 highly soluble protein은 precipitation efficiency가 낮은 경우가 많다. 반대로 aggregation-prone protein은 과도하게 precipitation되기도 한다.

실제 precipitation 후 supernatant를 separately 분석해보면 상당량의 protein이 여전히 용액 안에 남아 있는 경우가 적지 않다.

즉 precipitation은 “모든 protein 회수” 과정이 아니라, 특정 physicochemical property를 가진 protein을 preferentially 선택하는 과정이다.

2. 실제 raw data에서는 특정 protein class가 반복적으로 감소한다

이 현상은 실제 proteomics dataset에서 매우 자주 관찰된다.

예를 들어 동일 lysate를 precipitation-based cleanup과 filter-based cleanup으로 나누어 처리한 뒤 LC-MS/MS를 수행하면 total protein identification 수는 비슷하게 보일 수 있다. 하지만 protein composition을 자세히 보면 상당한 차이가 나타난다.

특정 workflow에서는 membrane-associated protein abundance가 감소하고, 다른 workflow에서는 nuclear regulatory protein recovery가 흔들린다. 특히 low abundance signaling protein은 precipitation batch마다 reproducibility가 크게 떨어지는 경우가 많다.

실제 peptide-level intensity를 비교해보면 어떤 protein-derived peptide는 precipitation 이후 systematic하게 감소한다. 그런데 housekeeping protein peptide는 거의 영향을 받지 않는다.

즉 precipitation-induced loss는 random sample loss가 아니라 protein class-specific selection bias 형태로 나타난다.

3. Membrane protein은 precipitation에서 특히 불리하다

Proteomics에서 membrane protein recovery가 어려운 이유는 digestion accessibility 때문만이 아니다. Precipitation 단계 역시 매우 큰 영향을 준다.

Membrane protein은 hydrophobic region이 많고 detergent dependence가 강하다. 문제는 precipitation 과정에서 detergent가 제거되면 이들 protein의 solubility가 급격히 떨어진다는 점이다.

일부 membrane protein은 pellet 안으로 들어가더라도 이후 resolubilization이 매우 어렵다. Pellet은 형성되었지만 실제 digestion-accessible 상태로 다시 풀리지 않는 것이다.

실제 membrane proteomics 데이터를 보면 precipitation 이후 transmembrane-domain-containing protein abundance가 크게 감소하는 경우가 흔하다.

특히 acetone precipitation은 hydrophobic protein aggregation을 강하게 유도할 수 있다. 이 경우 pellet 내부에서 irreversible aggregation이 발생하면서 digestion accessibility 자체가 무너질 수 있다.

즉 membrane protein은 precipitation 이후 “존재는 하지만 분석 가능한 상태는 아닌” 상황으로 빠지기 쉽다.

4. Low abundance protein은 precipitation loss에 더 취약하다

Protein precipitation loss는 abundance dependence를 강하게 가진다.

High abundance protein은 일부 손실이 발생해도 여전히 충분한 signal을 남길 가능성이 높다. 하지만 low abundance protein은 작은 recovery loss만 발생해도 detection threshold 아래로 떨어질 수 있다.

특히 regulatory protein이나 signaling protein은 원래 abundance 자체가 낮은 경우가 많다. 여기에 precipitation efficiency variability까지 더해지면 reproducibility가 급격히 흔들린다.

실제 clinical proteomics dataset에서는 abundant serum protein은 안정적으로 유지되지만, low abundance cytokine-related protein은 precipitation condition에 따라 detection consistency가 크게 달라지는 사례가 자주 보고된다.

즉 precipitation은 단순 total protein recovery 문제가 아니라, proteome dynamic range 자체를 다시 구성하는 단계다.

5. Pellet이 보인다고 recovery가 좋은 것은 아니다

많은 사람들이 precipitation 이후 pellet이 잘 보이면 protein recovery가 성공적이라고 생각한다. 하지만 실제로 pellet visibility와 analytical recovery는 전혀 다른 문제다.

Pellet 안에 protein이 존재하더라도 resolubilization efficiency가 낮으면 digestion accessibility가 떨어진다. 특히 over-dried pellet은 다시 녹이기 어려워지는 경우가 많다.

실제 raw data를 보면 동일 precipitation protocol에서도 drying duration 차이만으로 peptide recovery pattern이 달라지는 경우가 있다. 어떤 pellet은 잘 풀리지만, 어떤 pellet은 부분적으로 aggregation 상태를 유지한다.

문제는 이런 차이가 특정 protein class에서 더 강하게 나타난다는 점이다. Membrane protein, aggregation-prone protein, large complex-forming protein은 특히 영향을 크게 받는다.

즉 pellet 형성은 recovery의 시작일 뿐이지, 실제 proteomics-compatible 상태를 보장하지 않는다.

6. Organic solvent는 단백질 구조를 완전히 바꾼다

Acetone이나 methanol 같은 organic solvent는 단순히 단백질을 “가라앉히는” 역할만 하지 않는다. 실제로는 protein folding landscape 자체를 크게 흔든다.

일부 protein은 precipitation 과정에서 partial unfolding을 겪고, 일부는 hydrophobic region exposure 증가로 aggregation tendency가 강해진다. 특히 multiprotein complex는 precipitation 동안 structural rearrangement를 겪을 수 있다.

문제는 이 변화가 downstream digestion과 peptide generation efficiency에 직접 연결된다는 점이다.

예를 들어 precipitation 이후 특정 cleavage site accessibility가 감소하면 trypsin digestion efficiency도 떨어질 수 있다. 결과적으로 peptide abundance 자체가 변한다.

즉 precipitation-induced bias는 단순 recovery 문제를 넘어서 digestion chemistry 전체까지 영향을 줄 수 있다.

7. PTM protein은 precipitation bias 영향을 더 크게 받는다

Post-translational modification(PTM)을 가진 protein은 precipitation 과정에서 더 복잡한 behavior를 보이는 경우가 많다.

예를 들어 phosphorylation은 protein charge distribution과 solubility를 변화시킬 수 있다. Glycosylated protein은 structural heterogeneity 때문에 precipitation efficiency variability가 커질 수 있다.

실제 phosphoproteomics workflow에서는 precipitation 이후 phosphoprotein recovery reproducibility가 흔들리는 경우가 적지 않다.

특히 low abundance phosphoprotein은 precipitation-induced loss와 digestion variability를 동시에 겪기 쉽다. 결과적으로 특정 signaling pathway activity가 실제 biology보다 훨씬 약하게 보일 수 있다.

즉 precipitation은 PTM biology 자체를 선택적으로 왜곡할 가능성이 있다.

8. Precipitation loss는 biological signal처럼 보일 수 있다

이 문제가 가장 위험해지는 순간은 precipitation-induced protein loss가 biological regulation처럼 보일 때다.

예를 들어 특정 batch에서 membrane protein recovery가 약간만 감소해도 label-free quantification에서는 membrane signaling downregulation처럼 나타날 수 있다.

특히 peptide 수가 적은 low abundance protein은 이 영향을 극단적으로 받는다. 일부 peptide만 손실되어도 protein abundance estimate 자체가 크게 흔들린다.

실제 differential expression dataset에서는 precipitation condition variability가 특정 pathway enrichment 결과를 바꾸는 사례도 보고된다.

문제는 이런 변화가 replicate consistency를 유지할 수 있다는 점이다. Consistent technical bias는 매우 convincing한 biological pattern처럼 보인다.

9. 왜 precipitation bias는 잘 보이지 않는가

가장 큰 이유는 precipitation이 너무 오래된 “표준 protocol”이라는 점이다.

많은 연구자들은 precipitation을 cleanup 단계로만 생각한다. 단백질 전체는 그대로 유지된다고 자연스럽게 가정한다. 실제로 total protein concentration만 보면 큰 차이가 없어 보이는 경우도 많다.

하지만 proteomics에서 중요한 것은 total mass가 아니라 어떤 protein이 살아남았는가다.

더 큰 문제는 precipitation-induced loss가 대부분 invisible하다는 점이다. 사라진 protein은 downstream 데이터 안에 남지 않는다. Software는 살아남은 peptide만 기반으로 quantification을 수행한다.

결국 연구자는 biology를 해석하고 있다고 생각하지만, 실제로는 precipitation chemistry가 남겨준 proteome subset을 보고 있는 경우가 많다.

10. 실제 데이터에서 반드시 확인해야 하는 것들

Protein precipitation workflow를 평가할 때는 단순 total protein recovery만 보는 것으로 충분하지 않다.

Protein class별 recovery pattern을 확인할 필요가 있다. Membrane protein, nuclear protein, low abundance regulatory protein이 반복적으로 감소한다면 precipitation bias 가능성을 의심해야 한다.

가능하다면 precipitation 전후 supernatant와 pellet을 separately 분석해보는 것도 도움이 된다. 실제로 이 과정을 해보면 예상보다 많은 protein이 supernatant에 남아 있는 경우를 자주 보게 된다.

Pellet resolubilization efficiency 역시 중요하다. Pellet drying condition, resolubilization buffer, sonication 여부에 따라 digestion accessibility가 달라질 수 있기 때문이다.

또 peptide-level inspection을 자주 해야 한다. Protein table만 보면 보이지 않던 precipitation-induced bias가 raw precursor level에서는 훨씬 명확하게 드러나는 경우가 많다.

결론

Protein precipitation은 단순한 cleanup 단계가 아니다. 실제로는 어떤 단백질을 proteomics workflow 안에 남길 것인지 결정하는 강력한 selection 과정이다.

Acetone, methanol/chloroform, ethanol precipitation 같은 방법은 모두 protein solubility와 aggregation behavior를 바꾸고, 특정 protein class를 preferentially 손실시킬 수 있다. 결국 우리가 보는 proteome은 원래 sample 전체가 아니라 precipitation chemistry를 통과해 살아남은 protein들의 결과물에 가까워진다.

이 사실을 이해하기 시작하면 이전에는 설명되지 않던 많은 현상들이 다르게 보이기 시작한다. 왜 membrane protein이 잘 안 보이는지, 왜 signaling protein reproducibility가 낮은지, 왜 특정 pathway가 batch마다 흔들리는지에 대한 답이 precipitation 단계 안에 숨어 있는 경우가 생각보다 많기 때문이다.

728x90