티스토리 뷰

728x90

DDA vs DIA: 결과가 달라지는 근본적인 이유
DDA vs DIA: 결과가 달라지는 근본적인 이유

— 우리는 다른 방식으로 측정하는 게 아니라, 다른 방식으로 ‘선택’하고 있다

처음 proteomics 데이터를 접하면
DDA와 DIA는 단순히 두 가지 acquisition 방식처럼 보인다.

  • DDA는 기존 방식
  • DIA는 더 발전된 방식

그래서 자연스럽게 이렇게 생각하게 된다.

“둘 다 같은 샘플을 분석하는 거니까
결과는 비슷해야 하지 않을까?”

하지만 실제로 데이터를 비교해보면
이 기대는 쉽게 무너진다.

같은 샘플인데도

  • 검출되는 단백질 수가 다르고
  • 특정 pathway는 한쪽에서만 보이고
  • differential expression 결과까지 달라진다

이건 단순한 기술적 차이가 아니다.

👉 데이터를 만들어내는 방식 자체가 다르기 때문이다

출발점부터 다르다: “무엇을 볼 것인가”

DDA와 DIA의 가장 큰 차이는
측정 방식이 아니라

👉 무엇을 선택하느냐에 있다

DDA는 선택한다

DDA(Data-Dependent Acquisition)는
이름 그대로 데이터에 의존해서 선택한다.

실제 동작은 꽤 단순하다.

  • MS1에서 전체 스캔
  • 그 순간 가장 강한 신호를 가진 precursor 선택
  • 선택된 것만 MS/MS 분석

이 과정을 계속 반복한다.

겉으로 보면 효율적인 방식이다.
강한 신호를 우선적으로 분석하니까
좋은 데이터가 나올 것처럼 보인다.

하지만 여기서 이미 중요한 일이 일어난다.

👉 대부분의 신호는 선택되지 않는다

DIA는 선택하지 않는다

반대로 DIA(Data-Independent Acquisition)는
선택을 하지 않는다.

  • m/z 범위를 일정 구간으로 나누고
  • 각 구간을 순서대로 전부 fragmentation

즉,

👉 들어오는 신호를 가능한 한 모두 기록한다

겉으로 보면 더 완전한 방식이다.
놓치는 것이 없을 것처럼 보인다.

하지만 여기에도 또 다른 문제가 숨어 있다.

첫 번째 차이: sampling bias vs interference

DDA와 DIA의 차이는
한 문장으로 요약할 수 있다.

  • DDA → sampling bias
  • DIA → signal interference

DDA에서 벌어지는 일

DDA는 항상 선택을 한다.

그 선택 기준은 단순하다.

👉 “지금 가장 강한 신호”

이 기준은 합리적이지만
문제를 만든다.

실제 상황

  • high abundance peptide → 항상 선택됨
  • low abundance peptide → 거의 선택 안 됨

그리고 이 패턴은 반복된다.

결과

  • 특정 peptide는 항상 데이터에 존재
  • 다른 peptide는 run마다 사라짐

이걸 그대로 해석하면

→ “재현성이 낮다”

하지만 실제로는

👉 선택 편향

DIA에서 벌어지는 일

DIA는 모든 것을 수집한다.

그래서 sampling bias는 줄어든다.

하지만 그 대신

👉 co-fragmentation 문제가 발생한다

상황

같은 window 안에

  • peptide A
  • peptide B
  • peptide C

모두 포함됨

결과

  • fragment ion이 섞임
  • assignment 어려움
  • quantification 왜곡 가능

두 번째 차이: “보이는 것”의 정의

DDA와 DIA는
무엇을 “존재한다”고 판단하는 기준도 다르다.

DDA에서는

👉 선택된 것만 존재한다

선택되지 않으면

→ 데이터에 없음
→ 존재하지 않는 것으로 간주

DIA에서는

👉 신호가 있으면 존재한다

하지만 문제는

→ 그 신호가 누구 것인지 불명확

실제 사례: 같은 단백질, 다른 결과

같은 샘플에서

  • DDA → 단백질 X 검출 안 됨
  • DIA → 단백질 X 검출됨

이걸 보면 혼란스럽다.

누가 맞는 걸까?

답은 둘 다 “맞다”이다.

이유

  • DDA → 선택되지 않아서 없음
  • DIA → 신호는 있지만 혼합된 상태

즉,

👉 서로 다른 기준으로 존재를 정의

세 번째 차이: 정량 방식의 차이

DDA와 DIA는 quantification 방식도 다르다.

DDA

  • MS1 기반 intensity
  • 선택된 peptide만 사용

문제:

  • missing value 많음
  • reproducibility 낮음

DIA

  • fragment 기반 quantification
  • 더 안정적인 신호

하지만

  • interference 영향 큼

실제 사례: fold change 차이

같은 peptide

  • DDA → fold change 3배
  • DIA → fold change 1.5배

이건 단순 오차가 아니다.

👉 측정 방식 자체의 차이

네 번째 차이: 데이터의 구조

DDA와 DIA는
데이터 구조 자체가 다르다.

DDA

  • sparse data
  • selection 기반

DIA

  • dense data
  • overlapping signal

이 차이는 downstream analysis에도 영향을 준다.

  • 통계 결과
  • clustering
  • pathway 분석

모두 달라질 수 있다.

왜 결과 해석이 달라지는가

결국 핵심은 이것이다.

DDA와 DIA는

👉 같은 샘플을 다르게 측정하는 것이 아니라
👉 다르게 관찰한다

  • DDA → 일부를 정확하게 본다
  • DIA → 전체를 넓게 본다

이 차이가

  • 무엇이 보이는지
  • 무엇이 중요해 보이는지

를 바꾼다.

가장 위험한 착각

“DDA와 DIA 중 하나가 더 맞다”

이 생각이다.

하지만 실제로는

👉 둘 다 부분적인 진실이다

실무에서의 현실적인 접근

그래서 실제 연구에서는
이렇게 접근하는 것이 가장 안전하다.

1) 목적에 따라 선택

  • discovery → DDA
  • reproducibility → DIA

2) cross-validation

가능하면

  • DDA + DIA 병행

3) peptide-level 확인

단순 protein 결과 믿지 않기

4) 결과 차이 자체를 분석

왜 다른지 이해하는 것이 중요

핵심 정리

DDA와 DIA의 차이는
기술의 문제가 아니다.

이건

👉 관찰 방식의 차이

  • DDA → 선택된 것만 본다
  • DIA → 모든 것을 보지만 섞여 있다

결론

같은 샘플을 분석해도
같은 결과가 나오지 않는 이유는 단순하다.

👉 우리는 다른 방식으로 데이터를 만들고 있기 때문이다

마지막 질문

다음에 DDA와 DIA 결과를 비교할 때
이 질문을 반드시 해야 한다.

“이 차이는 biology의 차이인가,
아니면 measurement의 차이인가?”

이 질문 하나가
해석의 방향을 완전히 바꾼다.

728x90
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2026/05   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함