반응형
오래된 문헌이지만 최근에 보게 되었습니다.
아시겠지만 엑셀에는 날짜를 자동으로 인식하여 변경해주는 기능이 있습니다. 하지만 이러한 기능때문에 gene name이 날짜로 바뀌는 일이 발생합니다.
예를 들면 SEPT2(Septin 2) 나 MARCH1(Membrane-Associated Ring Finger)는 2-Sep 과 1-Mar 로 바뀌는 경우가 생깁니다.
수많은 리스트중에서 자동변환된것이라 연구자는 알아차리기가 어렵습니다. 실제 논문에 등재된 supplementary 데이타에서 이런 오류를 많이 발견할수 있었다고 하네요.
저자는 NCBI GEO에 등재된 4321개의 엑셀파일을 조사한결과 약 39.7%에 해당하는 결과가 오류를 가지고 있었다고 합니다.
이렇게 변환된 결과는 아마 차후 통계처리하는 과정에서도 영향을 줄수 있을것 같습니다.
참고문헌
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-1044-7
'프로테오믹스(단백체학)' 카테고리의 다른 글
Proteome Discoverer 결과파일에서 원하는 단백질 fasta 파일 추출하기 (0) | 2021.08.27 |
---|---|
시스템 상태와 분석법 최적화를 위한 QC 검증 툴-Proteomics Quality Control (PTXQC) (0) | 2021.08.25 |
MSFragger, 데이타베이스 검색 프로그램 (0) | 2021.08.19 |
N-terminal glutamine (Q) 과 glutamic acid (E)의 pyroglutamate Modification (0) | 2021.08.18 |
Raw 파일에 사용된 method를 Xcalibur에서 바로 불러오기 (0) | 2021.07.28 |
댓글