Medical Statistics

ANOVA에 대해서 알아보자

sokki 2021. 11. 19. 19:51

ANOVA, 이름이 뭔지 모르겠다. Analysis of Variance의 줄임말이다. 한국말로 번역하면 분산 분석이라고 하는데,

보통 3개 이상의 연속형 자료를 비교하고자 할 때 사용하는 방법이다. 예를 들어 A, B, C 집단의 평균 차이가 있는지 검정하고 싶을 때 쓰이는 방법이라고 볼 수 있다.

ANOVA의 귀무가설(H0)은 모든 집단의 평균은 같다, 혹은 모든 집단의 검정하고자 하는 통계치가 같다, 이다.

통계적으로 유의해서 만일 귀무가설(H0)을 기각하게 될 경우 사후 분석(post-hoc)을 해줘야 한다. 이를 위해 multiple comparsion을 진행하게 되는데, 주로 여기서 Bonferroni 혹은 Dunnett procedure가 사용된다. 

ANOVA를 진행할 때 가정이 있는데 다음과 같다.

  • 정규성 : 각각의 그룹들의 분포 형태가 정규분포를 따른다
  • 독립성 : 각 관측치들이 독립이어야 한다. 
  • 분산의 동질성 : 비교되는 그룹들의 분산이 어느 정도 비슷해야 한다.