p 값에 대해 간단한 해석
본문 바로가기
프로테오믹스(단백체학)

p 값에 대해 간단한 해석

by Hyoungjoo 2020. 6. 22.
반응형

최근에  p-value 가 생물학분야 논문에서 오용되고 있다는  글을 보게 된다.  사실 통계학 전문이 아닌 나로써는 어떻게 오용되고 있는지 조차 알지 못한다.   소프트웨어에서 계산된 p 값이 0.05 이하로 나오면 실험이 큰 문제없이 진행되었다고 생각해왔다. 

 

그러나  p 값이 0.05 보다 작다고 하더라고 세워진 가설이 참이 확률이 95% 이상이라는 것을 의미하지 않으며 P 값만으로 연구결과의 성공여부를 결정하면 안된다고들 한다. 

 

몇가지 자료를 찾아보고 내가 쉽게 이해한 P-값의 해석은 아래와 같다(그러므로 틀릴수도 있다)

 

통계학이라는 관점으로 보자면  옳고 그름의 문제라기 보다는 세워진 가설을 증명할 수 있는냐 없느냐의 문제이다. 

자료를 찾아보면 아주 어려운 말인 귀무가설, 대립가설이 나온다 (이 말 자체가 통계학 수식보다 어렵다)

귀무가설 ( null hypothesis, H0)  :  비교하고자 하는 대상이 있을 경우 의미있는 차이가 없다는 가설이다.

대립가설: (alternative hypothesis, 기호 H1) : 귀무가설과 반대개념으로 비교하고자 하는 대상 사이에 특정한 관련이 있다는 가설이다.

 

내가 세운 가설(대립가설, 효과가 있음)이 맞다는 것을 증명하기 위해서는  귀무가설(효과가 전혀없음)이 틀렸음을 증명하면 되는것이다.  아닌것은 아니라고 증명하는 꼴이다.

 

내가 만든 약물이 효과가 있다는 것을 증명하기 위해 반대의 결과(효과가 전혀없음) 맞지 않다는 것을 증명하는 것이다.  실제 약물을 주입한 결과와 가짜 약물(그냥 ) 먹었을때 차이가 없다 (귀무가설) 것이 틀린다를 증명하면 결국은 약물이 효과가 있다(대립가설) 말이다.

 

여기서 분석한 결과의 p값이 일반적인 cut-off 값인  0.05 이하 이거나 혹은 0.05 이상인 경우를 가정해 보자

P-value 두가지 종류의 결론에  도달하는데 사용된다.

p-value cut-off(e.g, 0.05)보다  경우  귀무가설을 기각(reject)하는데 있어서 충분한 증거가 없다

p-value cut-off(e.g, 0.05)보다 작을 경우 귀무가설을 기각(reject)하는데 있어서 충분한 증거가 있다

 

 다르게 쉽게 표현하자면  If the p-value is low, the null must go, If the p-value is above, the null we love.

 

또한 p값을 논의할때  임의로 선택한 샘플이 실제 모집단을 대표할 수 있느냐 하는 부분도 있다.  우리가 실험하는 시료의 수는 제한적인다. 모든 환자의 시료를 다 분석할 수 없다. 이렇게 시료(샘플)에서 얻어진 결과가 실제로 모집단(전체 집단, 사실 무한대)를 대표 할 수 있어야 된다.  특정한 수의 시료(샘플)군을 가져와서 실험하는데  시료(샘플)군에 따라 결과가 차이가 난다면 이 결과는 실제 모집단의 수치를 반영하지 못하는 것이다.   p <0.05 이하이면 퍼센트로는 95% 이상이다.  P 값이 0.05 보다 작다는것은 얻어진 결과값이  95%의 확률보다 높다는 의미이다.  즉  특정 시료(샘플)에서 얻어진 결과는 다음의 다른 시료(샘플)에서 수행한 결과와 같은 확율이 95% 이상이 된다는 말로도 해석된다.

 

앞으로 프로그램에서 얻어진 p 값을 해석할때 조금더 주의있게 봐야겠다.

댓글