DDA vs DIA: 결과가 달라지는 근본적인 이유

티스토리 뷰

제약산업

DDA vs DIA: 결과가 달라지는 근본적인 이유

pharma_info 2026. 5. 7. 20:09

728x90

— 우리는 다른 방식으로 측정하는 게 아니라, 다른 방식으로 ‘선택’하고 있다

처음 proteomics 데이터를 접하면
DDA와 DIA는 단순히 두 가지 acquisition 방식처럼 보인다.

DDA는 기존 방식
DIA는 더 발전된 방식

그래서 자연스럽게 이렇게 생각하게 된다.

“둘 다 같은 샘플을 분석하는 거니까
결과는 비슷해야 하지 않을까?”

하지만 실제로 데이터를 비교해보면
이 기대는 쉽게 무너진다.

같은 샘플인데도

검출되는 단백질 수가 다르고
특정 pathway는 한쪽에서만 보이고
differential expression 결과까지 달라진다

이건 단순한 기술적 차이가 아니다.

👉 데이터를 만들어내는 방식 자체가 다르기 때문이다

출발점부터 다르다: “무엇을 볼 것인가”

DDA와 DIA의 가장 큰 차이는
측정 방식이 아니라

👉 무엇을 선택하느냐에 있다

DDA는 선택한다

DDA(Data-Dependent Acquisition)는
이름 그대로 데이터에 의존해서 선택한다.

실제 동작은 꽤 단순하다.

MS1에서 전체 스캔
그 순간 가장 강한 신호를 가진 precursor 선택
선택된 것만 MS/MS 분석

이 과정을 계속 반복한다.

겉으로 보면 효율적인 방식이다.
강한 신호를 우선적으로 분석하니까
좋은 데이터가 나올 것처럼 보인다.

하지만 여기서 이미 중요한 일이 일어난다.

👉 대부분의 신호는 선택되지 않는다

DIA는 선택하지 않는다

반대로 DIA(Data-Independent Acquisition)는
선택을 하지 않는다.

m/z 범위를 일정 구간으로 나누고
각 구간을 순서대로 전부 fragmentation

즉,

👉 들어오는 신호를 가능한 한 모두 기록한다

겉으로 보면 더 완전한 방식이다.
놓치는 것이 없을 것처럼 보인다.

하지만 여기에도 또 다른 문제가 숨어 있다.

첫 번째 차이: sampling bias vs interference

DDA와 DIA의 차이는
한 문장으로 요약할 수 있다.

DDA → sampling bias
DIA → signal interference

DDA에서 벌어지는 일

DDA는 항상 선택을 한다.

그 선택 기준은 단순하다.

👉 “지금 가장 강한 신호”

이 기준은 합리적이지만
문제를 만든다.

실제 상황

high abundance peptide → 항상 선택됨
low abundance peptide → 거의 선택 안 됨

그리고 이 패턴은 반복된다.

결과

특정 peptide는 항상 데이터에 존재
다른 peptide는 run마다 사라짐

이걸 그대로 해석하면

→ “재현성이 낮다”

하지만 실제로는

👉 선택 편향

DIA에서 벌어지는 일

DIA는 모든 것을 수집한다.

그래서 sampling bias는 줄어든다.

하지만 그 대신

👉 co-fragmentation 문제가 발생한다

상황

같은 window 안에

peptide A
peptide B
peptide C

모두 포함됨

결과

fragment ion이 섞임
assignment 어려움
quantification 왜곡 가능

두 번째 차이: “보이는 것”의 정의

DDA와 DIA는
무엇을 “존재한다”고 판단하는 기준도 다르다.

DDA에서는

👉 선택된 것만 존재한다

선택되지 않으면

→ 데이터에 없음
→ 존재하지 않는 것으로 간주

DIA에서는

👉 신호가 있으면 존재한다

하지만 문제는

→ 그 신호가 누구 것인지 불명확

실제 사례: 같은 단백질, 다른 결과

같은 샘플에서

DDA → 단백질 X 검출 안 됨
DIA → 단백질 X 검출됨

이걸 보면 혼란스럽다.

누가 맞는 걸까?

답은 둘 다 “맞다”이다.

이유

DDA → 선택되지 않아서 없음
DIA → 신호는 있지만 혼합된 상태

즉,

👉 서로 다른 기준으로 존재를 정의

세 번째 차이: 정량 방식의 차이

DDA와 DIA는 quantification 방식도 다르다.

DDA

MS1 기반 intensity
선택된 peptide만 사용

문제:

missing value 많음
reproducibility 낮음

DIA

fragment 기반 quantification
더 안정적인 신호

하지만

interference 영향 큼

실제 사례: fold change 차이

같은 peptide

DDA → fold change 3배
DIA → fold change 1.5배

이건 단순 오차가 아니다.

👉 측정 방식 자체의 차이

네 번째 차이: 데이터의 구조

DDA와 DIA는
데이터 구조 자체가 다르다.

DDA

sparse data
selection 기반

DIA

dense data
overlapping signal

이 차이는 downstream analysis에도 영향을 준다.

통계 결과
clustering
pathway 분석

모두 달라질 수 있다.

왜 결과 해석이 달라지는가

결국 핵심은 이것이다.

DDA와 DIA는

👉 같은 샘플을 다르게 측정하는 것이 아니라
👉 다르게 관찰한다

DDA → 일부를 정확하게 본다
DIA → 전체를 넓게 본다

이 차이가

무엇이 보이는지
무엇이 중요해 보이는지

를 바꾼다.

가장 위험한 착각

“DDA와 DIA 중 하나가 더 맞다”

이 생각이다.

하지만 실제로는

👉 둘 다 부분적인 진실이다

실무에서의 현실적인 접근

그래서 실제 연구에서는
이렇게 접근하는 것이 가장 안전하다.

1) 목적에 따라 선택

discovery → DDA
reproducibility → DIA

2) cross-validation

가능하면

DDA + DIA 병행

3) peptide-level 확인

단순 protein 결과 믿지 않기

4) 결과 차이 자체를 분석

왜 다른지 이해하는 것이 중요

핵심 정리

DDA와 DIA의 차이는
기술의 문제가 아니다.

이건

👉 관찰 방식의 차이다

DDA → 선택된 것만 본다
DIA → 모든 것을 보지만 섞여 있다

결론

같은 샘플을 분석해도
같은 결과가 나오지 않는 이유는 단순하다.

👉 우리는 다른 방식으로 데이터를 만들고 있기 때문이다

마지막 질문

다음에 DDA와 DIA 결과를 비교할 때
이 질문을 반드시 해야 한다.

“이 차이는 biology의 차이인가,
아니면 measurement의 차이인가?”

이 질문 하나가
해석의 방향을 완전히 바꾼다.

728x90

'제약산업' 카테고리의 다른 글

Fragmentation 조건이 identification에 미치는 영향 (0)	2026.05.11
TopN, AGC, Injection Time의 상호작용 (0)	2026.05.10
Dynamic exclusion 설정이 결과를 왜곡하는 방식 (1)	2026.05.09
Scan speed가 peptide detection을 바꾸는 방식 (0)	2026.05.08
Resolution vs Scan Speed trade-off 실무 가이드 (0)	2026.05.06
MS resolution이 identification 결과에 미치는 영향 (0)	2026.05.05
Co-elution이 protein quantification을 망치는 이유 (0)	2026.05.04
Ion suppression이 peptide quantification을 왜곡하는 방식 (0)	2026.05.03

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2026/06 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

글 보관함

제약회사 연구원의 블로그

티스토리 뷰