통계

[기초통계] 분산분석(평균검증) t-test, anova

excelsu 2022. 6. 22. 15:08

0. z-test 

 - 모집단의 분산을 알때 사용 (잘 사용하지 않음)

 

1. t-test (주로 범주형->연속형 데이터에 사용)

 - 두 집단의 평균이 차이가 있는지 0.05이하 -> 두 집단간 차이가 있다.

   1)독립표본 : 독립된 두집단의 차이

   2)대응표본 : 한집단의 두가지 경우

   3)일표본 : 한집단의 특정값과 비교

 - 선행조건 : 등분산, 독립성, 정규성

 

2. 분산분석(ANOVA/F-test) (주로 범주형->연속형 데이터에 사용)

 - 세개 이상의 '집단'(세개의변수x) 평균이 차이가 있는지 -> 0.05이하 차이가 있다.

   1)일원배치 분산분석 : 하나의 독립변수x->종속변수y

   2)이원배치 분산분석 : 두개의 독립변수x->종속변수y

   3)다원배치 분산분석 : 세개이상의 독립변수x->종속변수y

 - 선행조건 : 등분산, 정규성, 다중공선성검증

 - 사후검정 : 분산분석은 차이가 있다만 알려주기때문에 어느집단간 차이가있는지 알기위해 하는 분석

       - 던칸(Duncan), 피셔의 최소유의차(LSD), 튜기(Tukey)의 HSD방법 등