엑셀의 글자 자동 오류 수정으로 gene name이 바뀌는 현상
본문 바로가기
프로테오믹스(단백체학)

엑셀의 글자 자동 오류 수정으로 gene name이 바뀌는 현상

by Hyoungjoo 2021. 8. 25.
반응형

오래된 문헌이지만 최근에 보게 되었습니다.

 

아시겠지만 엑셀에는 날짜를 자동으로 인식하여 변경해주는 기능이 있습니다. 하지만 이러한 기능때문에 gene name이 날짜로 바뀌는 일이 발생합니다.

 

예를 들면 SEPT2(Septin 2) 나 MARCH1(Membrane-Associated Ring Finger)는 2-Sep 과 1-Mar 로 바뀌는 경우가 생깁니다. 

 

수많은 리스트중에서 자동변환된것이라 연구자는 알아차리기가 어렵습니다.  실제 논문에 등재된 supplementary  데이타에서 이런 오류를 많이 발견할수 있었다고 하네요.

 

저자는 NCBI GEO에 등재된 4321개의 엑셀파일을 조사한결과 약 39.7%에 해당하는 결과가 오류를 가지고 있었다고 합니다.

 

이렇게 변환된 결과는 아마 차후 통계처리하는 과정에서도 영향을 줄수 있을것 같습니다. 

 

참고문헌

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-016-1044-7

 

https://www.nature.com/articles/d41586-021-02211-4?utm_source=Nature+Briefing&utm_campaign=8a9bfd19e1-briefing-wk-20210820&utm_medium=email&utm_term=0_c9dfd39373-8a9bfd19e1-42573675 

 

 

댓글