통계
[기초통계] 분산분석(평균검증) t-test, anova
excelsu
2022. 6. 22. 15:08
0. z-test
- 모집단의 분산을 알때 사용 (잘 사용하지 않음)
1. t-test (주로 범주형->연속형 데이터에 사용)
- 두 집단의 평균이 차이가 있는지 0.05이하 -> 두 집단간 차이가 있다.
1)독립표본 : 독립된 두집단의 차이
2)대응표본 : 한집단의 두가지 경우
3)일표본 : 한집단의 특정값과 비교
- 선행조건 : 등분산, 독립성, 정규성
2. 분산분석(ANOVA/F-test) (주로 범주형->연속형 데이터에 사용)
- 세개 이상의 '집단'(세개의변수x) 평균이 차이가 있는지 -> 0.05이하 차이가 있다.
1)일원배치 분산분석 : 하나의 독립변수x->종속변수y
2)이원배치 분산분석 : 두개의 독립변수x->종속변수y
3)다원배치 분산분석 : 세개이상의 독립변수x->종속변수y
- 선행조건 : 등분산, 정규성, 다중공선성검증
- 사후검정 : 분산분석은 차이가 있다만 알려주기때문에 어느집단간 차이가있는지 알기위해 하는 분석
- 던칸(Duncan), 피셔의 최소유의차(LSD), 튜기(Tukey)의 HSD방법 등