나의 연구분석을 위해서는 도대체 몇명의 환자의 시료가 필요할것인가?
많을수록 좋습니다. 하지만 환자 시료의 경우 무한정 수를 늘리는 것은 현실적으로 불가능합니다. 필요없이 많이 확보하는것도 윤리적인 문제가 될수 있습니다. 물론 시료수가 적게 되면 적절한 통계분석이 어렵게 됩니다. 보통 Grants를 쓰거나 publication을 할때 요구되는 최소한의 시료수가 있습니다. 보통 시료의 수가 30개 이상이 되면 정규분포도가 형성합니다. 그래서 이 정도의 시료 수이면 대체적으로 만족합니다. 하지만 실험에 따라 30명의 환자의 시료를 구하는것이 쉽지 않을 때도 있습니다. 의미있는 결과를 도출하기 위해 필요한 가장 최소의 시료수를 사용한다면 가장 좋을 것입니다. 하지만 어떻게 이 숫자를 결정할 할수 있을까요?
검증력 분석 (Power Analysis) 은 적절한 샘플수를 결정하는데 사용되는 통계분석입니다.
Power analysis: The probability that a statistical test will reject a false null hypothesis. 너 그 거짓말이 진짜거짓말이냐? T-test 등으로 p 값이 산출했는데 만약 이 p 값이 진짜 믿을수 있는 값인가? 라고 의문을 가질 수 있을것입니다.
여러가지 이유로 실제 귀무가설이 참임에도 불구하고 거짓으로 결과값이 나올수(1종 오류, α 오류) 있고 또한 실제 귀무가설이 거짓임에도 불구하고 참으로 결과값이 나올수가 있습니다 (2종 오류, β 오류). 모든 통계분석은 100% 맞을수가 없습니다. 즉 P=0.05이면 100개중 5개는 틀릴 가능성이 있다는것입니다.
이러한 이유로 일반적으로 2종 오류의 검증력은 80% 이상으로 선택합니다. Jacob Cohen(1988)에 의하면 대부분의 연구자들에 있어서 1종 오류가 2종 오류보다 약 4배 더 위험하다고 합니다. 그래서 0.05 * 4=0.2 (80%) 로 정해졌는데 약간은 임의적일수도 잇습니다. 검증력에 영향을 주는 요소가 여러가지가 있지만 시료의 수가 그 대표적인 요소입니다. 즉 신뢰할만한 검증력값을 얻을수 있을 만큼의 샘플의 수가 필요한것입니다. 사실 검증력을 계산하는 법은 정확히 모르겠지만 아무튼 검증력 분석은 신뢰성 있는 정량분석을 위한 시료의 수를 결정하는데 사용된다고 합니다. 인터넷을 검색해보니 이러한 적절한 샘플 수를 결정해주는 툴이 있는것 같습니다 (예, G-power). 이러한 프로그램을 사용할때 검증력이란 개념을 알고 쓰면 더 좋지 않을까 생각합니다.
'프로테오믹스(단백체학)' 카테고리의 다른 글
Web-based tool normalize omics data: Normalizer 사용법 (0) | 2020.06.07 |
---|---|
BioPureSPN HILIC (ERLIC) Spin-column의 용량및 성능검증 (0) | 2020.06.03 |
C18 Spin-Column 으로 High pH Reverse-Phase chromatography Fractionation 하는 법 (2) | 2020.05.10 |
C18 Reverse Phase Chromatography SpinColumns (Harvard Apparatus)을 이용한 펩타이드 전처리 (8) | 2020.05.06 |
3M C18 Extraction Disks를 이용한 소량 펩타이드 정제 (7) | 2020.04.25 |
댓글