ChatGPT로 질량분석결과 분석하기
본문 바로가기
프로테오믹스(단백체학)

ChatGPT로 질량분석결과 분석하기

by Hyoungjoo 2026. 4. 14.
반응형

질량분석기로 얻은 데이터에서 의미 있는 결과를 도출하거나 명확한 결론을 내고 싶을 때가 많습니다. 이때 꼭 필요한 것이 바로 생물정보학과 통계 분석입니다. 하지만 아쉽게도 통계 분석은 제 전문 분야가 아닙니다. 그래서 데이터를 보기 좋게 정리하거나, 중요한 결과를 끌어내야 할 때면 늘 다른 사람의 도움이 필요 합니다.

 

문제는 이런 분석을 해주시는 분들은 대부분 매우 바쁘다는 점입니다. 여러 사람의 요청을 처리하다 보면 제 차례가 오기까지 꽤 오랜 시간이 걸리곤 합니다.  그런데 요즘은 ChatGPT가 이 과정을 많이 도와주고 있습니다. 예전에는 엑셀만으로 처리하기 어려웠던 작업들도 이제는 ChatGPT를 이용해 훨씬 수월하게 해결할 수 있게 되었습니다.

 

통계 분석의 가장 큰 장점은 복잡한 결과를 한눈에 파악할 수 있게 만든다는 점입니다. 그리고 이렇게 정리된 결과는 다음 단계로 넘어갈지, 어떤 방향으로 실험을 이어갈지 판단하는 데 큰 도움이 됩니다. 예전에는 특정 스펙트럼 한두 개로 예로 들어 장단점을 설명하는 경우가 많았습니다. 물론 그런 방식도 의미가 있지만, 일부 예시에만 의존하게 되는 한계가 있습니다.  데이터로부터 보다 포괄적인 결과를 산출하는 것이 더 좋습니다.  이렇게 하려면 아무래도 수작업으로는 힘들겠지요.

 

최근에는 Skyline data에서 export한 긴 파일을 이용해, 간단하게 GraphPad Prism용 그래프를 만드는 작업도 하고 있습니다. 연구소에서 ChatGPT를 구독합니다. 한 번 작업 과정을 잘 만들어 두면, 이후에는 같은 형식의 파일만 입력해도 ChatGPT가 알아서 정리해 주기 때문에 훨씬 편리합니다. 마치 요리 레시피를 한 번 만들어 두고, 다음부터는 같은 순서로 손쉽게 따라 하는 것과 비슷합니다.

 

예를 들어 PRM 분석에서는 FAIMS 조건과 noFAIMS 조건에서 얻은 타켓 펩타이드의 matched fragment ion 개수를 비교할 수 있습니다. 각 펩타이드마다 검출된 b ion과 y ion 정보가 있고, 이 데이터를 Prism에 그대로 옮겨 그래프로 그리면 조건 간 차이를 직관적으로 확인할 수 있습니다. 아래 표는 skyline에서 export한 파일입니다.

 

Skyline에서 export한 원본 파일

 

 

 

이 파일을 ChatGPT를 이용하여 아래와 같은 테이블로 만들었습니다.

 

ChatGPT가 만든 테이블

 

만들어진 테이블을 Prism 프로그램에 붙여넣어 아래와 같은 그래프를 만들었습니다.  실제로 그래프를 보면 전반적으로 FAIMS 조건에서 더 많은 matched ion이 검출되는 경향을 확인할 수 있습니다

 

Prism으로 만들 그래프

 

 

 

아래는 Freestyle에서 Export한 CSV 파일만으로 ChatGPT가 그린 HCD와 EThcD 스펙트럼입니다. EThcD가 더 많은 fragment ion을 생성한다는 것을 보여주는 결과입니다. 예전에는 FreeStyle에서 해당 스펙트럼을 PPT 파일로 카피해서 수작업으로 하기도 했었습니다.

 

 

물론 Python을 잘하시는 분들은 더 쉽게  더 잘 만들 수 있습니다.  하지만 이 부분에 지식이 전혀 없는  저 같은 사람에게는  ChatGPT가 큰 도움을 줍니다. 

 

 

 

댓글