두개의 값(value)이 있는 명목형 변수간의 검증을 하기 위한 방법으로 chi squared test를 진행한다고 했다. 그렇지만, 명목형 변수에 여러개의 카테고리가 존재할 수 있다. 이럴 때 어떤 방식으로 두 변수의 차이를 검증할까? 이 때 쓸 수 있는 방법은 Fisher test, McNemar's test, Mantel-Haenzel test 같은 test들이 있다. 하나, 하나 간단히 설명하도록 하겠다.
1. Fisher test
두 개의 명목형 변수의 연관성 또는 독립성을 검정할 때 쓸 수 있다. Fisher test의 가장 좋은 점은 최소 카운트가 5보다 작은 셀이 20% 이하인 경우, 즉, 모든 거의 모든 경우에 사용할 수 있다.
Fisher test의 귀무가설(H0)은 두 카테고리 변수 간에 관련이 없다는 것이다. 이는 카이제곱 검정에서와 동일한 가정이다.
2. McNemar's test
맥니머 검사는 두 개의 카테고리형 변수를 검정할 때 쓰이지만 보통은 두 치료의 효과를 비교할 때 쓰인다. 예를 들어 A라는 치료와 B라는 치료를 받은 사람들이 있고 각각 정상, 비정상으로 군이 나뉘어진다면 두 치료 중에 어떤 치료가 더 효과가 있는지 비교해볼 수 있을 것이다. 이럴 때 쓰인다는 것이다!
McNemar test의 귀무가설(H0)는 두 처치(치료)의 효과가 같다는 것이다.
*그러나 각 McNemar test에도 한계가 있는데, 바로 처치(치료)를 각각 받은 집단의 합이 20 이상이어야 한다는 점이다.
3. Mantel-Haenzel test
마지막으로 멘텔 헨첼 테스트가 있다. 이 test는 두 카테고리 변수 간의 상관성을 비교할 때 다른 영향 요인이 될 수 있는 변수들을 고려하고 싶을 때, 즉, 더 robust한 상황에서 검증을 하고자 할 때 할 수 있는 방법이다.
지금까지 카테고리형 변수들간의 관계를 검증하는 방법들에 대해서 알아보았다. 조금 대략적으로 적긴했다. 추후에는 이런 테스트들을 실제로 어떤 식으로 python, R을 이용해서 할 수 있는지 포스팅 해보겠다.
'Medical Statistics' 카테고리의 다른 글
카테고리(명목형) 데이터 분석 - 카이제곱 검정 (0) | 2022.03.06 |
---|---|
Kruskal-Wallis test (0) | 2022.01.05 |
Wilcoxon rank-sum test(윌콕슨 순위합 검정) (0) | 2021.11.24 |
비모수 검정에 대해서 알아보자 (0) | 2021.11.22 |
ANOVA에 대해서 알아보자 (0) | 2021.11.19 |