티스토리 뷰

728x90

단백질 추출 방법이 proteomics 결과를 바꾸는 이유
단백질 추출 방법이 proteomics 결과를 바꾸는 이유

같은 조직인데 왜 extraction protocol 하나로 proteome이 달라질까

Proteomics 실험을 처음 설계할 때 많은 사람들이 가장 중요하게 생각하는 단계는 mass spectrometry 분석 조건이다. 어떤 instrument를 사용할지, DIA와 DDA 중 무엇을 선택할지, fragmentation energy는 어떻게 조정할지 같은 요소들에 관심이 집중된다. 반면 단백질 추출 단계는 상대적으로 단순한 준비 과정처럼 취급되는 경우가 많다. 조직을 lysate buffer에 넣고 깨뜨린 뒤 단백질을 녹여내는 과정 정도로 생각하기 쉽다.

하지만 실제 데이터를 오래 보다 보면 생각이 달라진다. 같은 조직을 사용했는데 extraction buffer만 바뀌어도 검출되는 protein population이 달라지고, pathway enrichment 결과가 변하며, 어떤 경우에는 biological conclusion 자체가 뒤집히는 일이 생긴다. 특히 서로 다른 연구실에서 생산된 proteomics 데이터를 비교하다 보면 이런 현상은 훨씬 더 명확하게 드러난다. 동일한 tissue type을 분석했는데도 한 연구에서는 membrane signaling protein이 풍부하게 검출되고, 다른 연구에서는 cytoskeletal protein 위주로 결과가 구성되는 경우가 있다.

처음에는 instrument sensitivity 차이처럼 보일 수 있다. 하지만 raw data를 자세히 들여다보면 문제는 훨씬 앞 단계에서 시작된 경우가 많다. 실제로 proteomics에서 extraction은 단순히 “단백질을 꺼내는 과정”이 아니다. 어떤 단백질을 녹여낼 수 있는지, 어떤 단백질은 남겨두는지, 어떤 상태의 단백질을 보존할지를 결정하는 첫 번째 선택 과정에 가깝다. 결국 extraction protocol은 proteome 전체를 균등하게 반영하는 것이 아니라, 특정 protein population을 선택적으로 드러내는 구조를 만든다.

1. 모든 단백질은 같은 방식으로 추출되지 않는다

Proteomics 데이터를 해석할 때 가장 자주 놓치는 전제 중 하나는 “세포 안의 모든 단백질이 동일하게 용해될 것”이라는 생각이다. 하지만 실제 생물학적 환경에서 단백질은 매우 다른 물리적 상태로 존재한다.

어떤 단백질은 세포질 안에서 비교적 자유롭게 존재하고, 어떤 단백질은 세포막에 깊숙이 박혀 있으며, 어떤 단백질은 거대한 protein complex를 형성하고 있다. 또 어떤 단백질은 세포골격과 강하게 결합되어 있고, 어떤 단백질은 응집체 형태로 존재한다. 이런 구조적 차이는 extraction efficiency를 극단적으로 바꾼다.

예를 들어 일반적인 urea-based lysis buffer는 많은 soluble protein을 효과적으로 용해시키지만, membrane protein recovery는 상대적으로 낮을 수 있다. 반대로 SDS 기반 extraction은 hydrophobic membrane protein을 훨씬 잘 녹여낼 수 있지만, downstream digestion이나 LC-MS compatibility에서 새로운 문제를 만든다.

결국 extraction method는 단순히 “얼마나 많이 추출했는가”의 문제가 아니라, 어떤 종류의 단백질을 preferentially recover했는가의 문제다.

2. 실제 raw data에서 보이는 extraction bias

이 차이는 실제 데이터에서 매우 선명하게 드러난다. 예를 들어 동일한 liver tissue를 두 가지 extraction condition으로 처리했다고 가정해보자.

첫 번째는 8 M urea 기반 extraction이고, 두 번째는 SDS-containing buffer를 이용한 extraction이다. 전체 protein identification 수만 보면 두 조건이 크게 다르지 않을 수 있다. 하지만 protein composition을 비교하기 시작하면 전혀 다른 그림이 나타난다.

Urea extraction에서는 cytosolic enzyme과 ribosomal protein detection이 우세하게 나타난다. 반면 SDS extraction에서는 membrane-associated transporter, receptor protein, mitochondrial membrane complex protein이 더 많이 검출된다.

이 차이는 단순히 detection sensitivity 문제가 아니다. 실제 extraction 단계에서 용해 가능한 protein population 자체가 달라진 결과다.

더 흥미로운 것은 pathway analysis다. Urea dataset에서는 metabolic pathway enrichment가 강하게 나타나는 반면, SDS dataset에서는 signaling pathway와 membrane trafficking 관련 pathway가 상대적으로 강조된다. 만약 연구자가 extraction bias를 인식하지 못한 채 결과를 해석한다면, 서로 다른 biological conclusion에 도달할 가능성도 충분하다.

3. Membrane protein은 왜 항상 어려운가

Proteomics에서 membrane protein 분석이 어려운 이유 역시 extraction과 깊게 연결된다. Membrane protein은 hydrophobic transmembrane domain을 가지고 있기 때문에 일반적인 aqueous buffer 환경에서 잘 용해되지 않는다.

이 문제를 해결하기 위해 detergent를 사용하게 되는데, 여기서 또 다른 trade-off가 발생한다. 강한 detergent는 membrane solubilization efficiency를 높이지만, 동시에 trypsin digestion을 방해하거나 LC-MS ionization에 문제를 일으킬 수 있다.

실제로 SDS는 매우 강력한 membrane solubilizer지만, 제거가 충분히 이루어지지 않으면 ion suppression을 유발하고 spray stability를 크게 떨어뜨린다. 반대로 MS-compatible detergent는 downstream analysis에는 유리하지만 extraction efficiency는 상대적으로 낮은 경우가 많다.

결국 membrane proteomics는 단순히 instrument sensitivity 문제가 아니라 extraction chemistry와 analytical compatibility 사이의 균형 문제에 가깝다.

4. 조직 종류에 따라 extraction behavior는 완전히 달라진다

Extraction bias는 tissue type에 따라서도 극적으로 달라진다. 예를 들어 brain tissue는 lipid content가 높고 membrane structure가 복잡하기 때문에 일반적인 extraction으로는 특정 membrane-associated protein recovery가 매우 낮게 나타날 수 있다.

반면 muscle tissue에서는 contractile protein abundance가 워낙 높기 때문에 low abundance signaling protein이 extraction 단계부터 상대적으로 묻히는 현상이 발생한다. Fibrotic tissue에서는 extracellular matrix protein이 강하게 crosslinked되어 있기 때문에 일반적인 lysis 조건에서는 충분히 회수되지 않는 경우도 많다.

실제 clinical proteomics dataset를 보면 같은 extraction protocol이라도 tissue마다 completely different proteome profile을 만든다. 어떤 tissue에서는 protocol이 매우 안정적으로 작동하지만, 다른 tissue에서는 특정 protein class가 지속적으로 underrepresentation되는 현상이 나타난다.

이 때문에 proteomics에서는 “범용 extraction protocol”이라는 개념이 생각보다 잘 성립하지 않는다.

5. Mechanical disruption도 proteome을 바꾼다

많은 사람들이 extraction을 chemical lysis 중심으로 생각하지만, 실제로는 mechanical disruption 역시 매우 중요한 변수다. Sonication, bead beating, homogenization 방식에 따라 protein release pattern이 달라질 수 있기 때문이다.

예를 들어 강한 bead beating은 tough tissue에서 extraction efficiency를 높일 수 있지만, 동시에 protein complex disruption과 heat generation을 유발한다. 이 과정에서 일부 protein은 partial degradation을 겪거나 aggregation이 증가할 수 있다.

실제 phosphoproteomics에서는 과도한 mechanical stress가 phosphatase activation과 연결되어 phosphorylation pattern 변화를 유발하는 사례도 보고된다. 즉 extraction 과정 자체가 biological state를 일부 변형시킬 가능성이 있다는 의미다.

특히 low abundance PTM 분석에서는 이런 pre-analytical variability가 결과 전체를 흔들 수 있다.

6. Protease activity는 extraction 순간부터 시작된다

Extraction 단계에서 가장 위험한 변수 중 하나는 endogenous protease activity다. 세포가 파괴되는 순간 compartmentalization이 무너지면서 protease가 활성화되고, 일부 protein은 매우 빠르게 degradation되기 시작한다.

이 문제는 sample handling 시간이 길어질수록 심각해진다. 실제 tissue proteomics에서는 collection 후 processing delay만으로 특정 signaling protein abundance가 감소하는 현상이 자주 관찰된다.

Protease inhibitor를 사용하더라도 모든 degradation을 완전히 막을 수는 없다. 특히 extraction efficiency가 낮아 protein release가 느린 경우, 일부 protein은 충분히 용해되기 전에 degradation을 겪을 수 있다.

결국 extraction protocol은 단순한 recovery efficiency 문제가 아니라 “얼마나 원래 상태를 보존할 수 있는가”의 문제이기도 하다.

7. Insoluble fraction은 정말 의미 없는 영역일까

Proteomics workflow에서는 보통 extraction 후 centrifugation을 통해 insoluble debris를 제거한다. 많은 경우 이 pellet fraction은 분석 대상에서 제외된다.

하지만 실제로는 이 영역 안에 중요한 biology가 숨어 있는 경우가 많다. Aggregated protein, cytoskeletal complex, chromatin-associated protein, membrane fragment 같은 요소들이 insoluble fraction에 남을 수 있기 때문이다.

예를 들어 neurodegenerative disease proteomics에서는 insoluble protein aggregate 자체가 핵심 pathology와 연결된다. 그런데 일반 soluble extraction만 사용하면 이런 protein population은 거의 관찰되지 않는다.

실제로 일부 연구에서는 sequential extraction을 통해 soluble fraction과 insoluble fraction을 분리 분석했을 때 completely different disease signature가 나타나는 사례가 보고된다.

즉 extraction 과정에서 버려지는 fraction 역시 biological 의미를 가질 수 있다.

8. Extraction bias는 quantification에도 영향을 준다

많은 사람들이 extraction 문제를 identification bias 정도로 생각하지만, 실제로는 quantification에도 직접 영향을 준다.

예를 들어 특정 condition에서 membrane protein extraction efficiency가 약간만 감소해도, label-free quantification에서는 abundance reduction처럼 보일 수 있다. 특히 comparative proteomics에서는 extraction reproducibility가 충분히 확보되지 않으면 technical variability가 biological signal처럼 나타난다.

이 문제는 normalization으로 완전히 해결되지 않는다. 왜냐하면 extraction bias는 전체 proteome에 균등하게 작용하지 않기 때문이다. 특정 protein class만 선택적으로 영향을 받기 때문에 global normalization을 수행해도 relative abundance distortion이 남게 된다.

실제 differential expression 결과 중 상당수는 downstream statistics 문제가 아니라 upstream extraction variability에서 시작되는 경우가 있다.

9. 왜 extraction bias는 잘 보이지 않는가

가장 큰 이유는 extraction이 너무 초기 단계에서 일어나기 때문이다. 대부분의 연구자는 최종 protein table이나 pathway enrichment 결과를 먼저 보게 된다. 하지만 extraction bias는 데이터 생성의 출발점에서 이미 proteome composition을 바꿔놓는다.

또 하나의 문제는 많은 QC metric이 extraction bias를 충분히 반영하지 못한다는 점이다. Total protein yield가 높고 identification number도 충분하면 protocol이 잘 작동했다고 판단하기 쉽다. 하지만 실제로는 특정 protein population이 지속적으로 underrepresentation되고 있을 수 있다.

특히 reproducibility가 높게 유지되는 경우 이 문제는 더 위험해진다. Consistent bias는 오히려 biological signal처럼 보이기 쉽기 때문이다.

10. 실제 데이터에서 반드시 확인해야 하는 것들

Extraction protocol을 평가할 때는 단순히 total protein yield만 보는 것으로 충분하지 않다. 어떤 protein class가 preferentially recovery되는지 확인할 필요가 있다.

GO enrichment나 subcellular localization analysis를 이용해 extraction bias pattern을 점검하는 것도 중요하다. 특정 extraction에서 membrane protein proportion이 지나치게 낮거나 cytoskeletal protein dominance가 과도하다면 protocol bias 가능성을 의심해야 한다.

가능하다면 동일 sample을 서로 다른 extraction method로 비교해보는 것도 도움이 된다. 이 과정에서 어떤 protein population이 method-sensitive한지 확인할 수 있기 때문이다.

특히 longitudinal study에서는 extraction consistency monitoring이 매우 중요하다. Sample processing batch가 달라지는 순간 extraction behavior도 함께 변할 가능성이 있기 때문이다.

결론

Proteomics에서 단백질 추출은 단순한 준비 과정이 아니다. 실제로는 어떤 단백질이 관찰 가능한 상태로 들어올 수 있는지를 결정하는 첫 번째 선택 단계다.

Extraction buffer chemistry, detergent 종류, mechanical disruption 방식, tissue 특성, processing speed 같은 요소들은 모두 proteome composition에 영향을 준다. 결국 같은 조직이라도 어떤 extraction protocol을 사용하느냐에 따라 completely different proteome landscape가 만들어질 수 있다.

이 사실을 이해하기 시작하면 이전에는 단순한 experimental variability처럼 보였던 현상들이 다르게 보이기 시작한다. 왜 특정 pathway만 반복적으로 변하는지, 왜 membrane protein detection이 불안정한지, 왜 연구실마다 결과가 다른지에 대한 답이 extraction 단계 안에 숨어 있는 경우가 생각보다 많기 때문이다.

728x90
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2026/05   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함