Untargeted metabolomics에서 가장 위험한 착각

티스토리 뷰

제약산업

Untargeted metabolomics에서 가장 위험한 착각

pharma_info 2026. 4. 16. 20:40

728x90

— 우리는 발견하고 있는 것이 아니라, 선택하고 있을지도 모른다

untargeted metabolomics를 처음 접했을 때,
많은 사람들이 비슷한 감정을 느낀다.

“이건 완전히 다른 차원의 데이터다.”

수천 개의 feature,
예상하지 못한 metabolite,
그리고 그 안에서 보이는 패턴들.

마치 아무것도 모르는 상태에서
새로운 생물학을 발견하는 느낌이다.

하지만 이 기대감은
생각보다 쉽게 착각으로 바뀐다.

그리고 그 착각은 하나의 문장으로 정리할 수 있다.

“이 데이터는 샘플의 실제 상태를 그대로 보여준다.”

이 문장이야말로
untargeted metabolomics에서 가장 위험한 착각이다.

1. 우리가 보고 있는 것은 ‘전체’가 아니다

untargeted라는 단어는
모든 것을 본다는 인상을 준다.

하지만 실제로는 전혀 다르다.

우리는 다음 조건을 만족하는 것만 본다.

특정 LC 조건에서 분리된 것
특정 ionization 조건에서 이온화된 것
특정 detection threshold를 넘은 것

즉, 이 데이터는

“존재하는 metabolite의 전체”가 아니라
“측정 조건에서 살아남은 일부”다.

문제는 이 제한된 데이터로
전체 biological system을 해석한다는 점이다.

2. Feature는 metabolite가 아니다

untargeted metabolomics에서 가장 흔한 착각 중 하나는
feature를 metabolite로 간주하는 것이다.

하지만 실제로 하나의 feature는 다음일 수 있다.

parent ion
fragment ion
adduct
isotope
noise

즉, 우리가 보고 있는 peak 하나는
“하나의 물질”이 아닐 가능성이 높다.

그럼에도 불구하고
이 feature에 이름을 붙이고
pathway에 넣는 순간,

해석은 이미 위험해진다.

3. fold change는 의미가 있어 보이지만 위험하다

untargeted 데이터에서
가장 먼저 보는 것은 fold change다.

2배 증가
3배 감소

이 숫자들은 매우 설득력 있다.

하지만 여기에는 중요한 문제가 있다.

이 값은 농도의 변화가 아니라
signal의 변화다.

그리고 signal은 다음에 영향을 받는다.

ion suppression
matrix effect
LC separation
peak integration

즉, fold change는
“측정 시스템의 결과”일 가능성이 항상 존재한다.

4. 패턴은 쉽게 만들어진다

PCA나 clustering을 보면
종종 매우 깔끔한 separation이 나온다.

control vs disease 완벽 분리
treatment effect 명확

이런 결과는 굉장히 매력적이다.

하지만 이 패턴이
항상 biological origin이라고 보장할 수는 없다.

왜냐하면 패턴은
다음 요소로도 쉽게 만들어지기 때문이다.

batch effect
matrix composition 차이
LC-MS condition drift

즉,

“보이는 패턴 = 의미 있는 차이”는 아니다.

5. annotation이 붙는 순간 확신이 생긴다

feature에 이름이 붙는 순간
데이터는 갑자기 “의미 있는 것”이 된다.

metabolite 이름
pathway mapping
literature 연결

이 과정은 분석을 완성하는 단계처럼 보인다.

하지만 실제로는
가장 위험한 단계일 수도 있다.

왜냐하면

잘못된 annotation 가능성
ambiguous match
database bias

이 존재하기 때문이다.

특히 untargeted에서는
“확실한 identification”보다
“가능한 추정”이 훨씬 많다.

6. pathway analysis는 결과를 더 그럴듯하게 만든다

pathway analysis는
개별 metabolite를 하나의 이야기로 묶어준다.

그래서 결과가 더 설득력 있어 보인다.

특정 pathway activation
metabolic shift
disease mechanism 연결

하지만 이 단계에서 가장 큰 문제가 발생한다.

잘못된 feature들이 모이면
더 그럴듯한 잘못된 이야기가 만들어진다.

즉, 오류가 증폭된다.

7. 재현되지 않는 이유는 이미 시작 단계에 있다

많은 사람들이 이렇게 생각한다.

“왜 다른 cohort에서는 결과가 안 나올까?”

하지만 문제는 대부분
초기 단계에서 이미 시작된다.

feature detection
normalization
filtering

이 과정은 모두
데이터를 “선택”하는 과정이다.

즉,

untargeted 분석은 발견(discovery)이 아니라
선택(selection)의 연속이다.

8. 가장 위험한 순간: 결과가 너무 잘 설명될 때

분석을 하다 보면
모든 것이 맞아떨어지는 순간이 있다.

pathway 연결됨
literature와 일치
biological story 완성

이 순간이 가장 위험하다.

왜냐하면 이때
사람은 검증을 멈추기 때문이다.

9. 그럼 무엇을 해야 하는가

완전히 피할 수는 없지만
방향은 분명하다.

1) feature를 의심하는 습관

이게 정말 metabolite인지 먼저 확인해야 한다.

2) analytical validation 먼저

LC 조건 변경
ionization 조건 확인
internal standard 활용

3) orthogonal approach 사용

targeted validation
다른 플랫폼 비교

4) “이 결과가 틀렸다면?” 질문하기

이 질문이 가장 중요하다.

결론: untargeted는 자유가 아니라 제한이다

untargeted metabolomics는
모든 것을 보는 기술이 아니다.

오히려

많은 제약 속에서 일부만 보는 기술이다.

문제는 이 제한된 데이터를 가지고
우리는 전체를 설명하려 한다는 점이다.

그래서 가장 위험한 착각은 이것이다.

“나는 새로운 것을 발견했다”

하지만 실제로는
그저

측정 조건이 허락한 것 중 일부를 선택했을 뿐일지도 모른다.

이 사실을 인지하는 순간,
분석의 방향은 완전히 달라진다.

728x90

'제약산업' 카테고리의 다른 글

내부 표준 선택이 metabolomics 정량 신뢰도에 미치는 영향 (0)	2026.04.20
전처리 방법 선택이 생물학적 결론을 바꾸는 이유 (0)	2026.04.19
Metabolomics에서 ‘보이는 것’과 ‘존재하는 것’의 차이 (0)	2026.04.18
LC-MS 조건 하나로 결과가 바뀌는 이유 (0)	2026.04.17
Matrix effect vs Biological signal 구분하는 방법 (0)	2026.04.15
Ion suppression이 metabolite pathway 해석을 왜곡하는 방식 (0)	2026.04.13
Metabolomics workflow에서 LC-MS 조건이 결과 해석에 미치는 영향 (0)	2026.04.12
재현되지 않는 omics 연구의 공통된 설계 패턴 (0)	2026.04.11

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2026/07 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

글 보관함

제약회사 연구원의 블로그

티스토리 뷰