7. 통계 — 추론통계 (가설검정)
표본분포·중심극한정리
- 중심극한정리 (CLT): 표본 ↑ (n≥30) → 표본평균 분포는 정규분포 근사
- 표준오차 (SE): σ/√n
가설검정
- H0 (귀무가설): 차이 없음
- H1 (대립가설): 차이 있음 (양측·단측)
- 유의수준 α: 1종 오류 허용 (보통 0.05)
- 검정통계량: z·t·F·χ² 등
- p-value: 귀무 하에서 관측값 이상 나올 확률
- 판단: p < α이면 H0 기각 (=유의함)
오류
- 1종 오류 (α): H0 참인데 기각
- 2종 오류 (β): H0 거짓인데 채택
- 검정력 = 1-β (참 거짓을 거짓이라 판단)
주요 검정
| 검정 | 용도 |
|---|---|
| z검정 | 모평균 (모분산 알려진 경우) |
| t검정 (1·2·대응) | 모평균 (모분산 모름) / 두 집단 평균 비교 / 짝지은 표본 |
| 분산분석 (ANOVA) | 3집단 이상 평균 비교 (F검정) |
| 카이제곱 (χ²) | 적합도·독립성·동질성 (범주형) |
| 회귀분석 | 독립-종속 관계 |
| 상관분석 | 두 변수 관계 강도 (Pearson·Spearman) |
신뢰구간
- 95% 신뢰구간: x̄ ± z₀.₀₂₅ × SE = x̄ ± 1.96 × σ/√n
- 해석: "100번 반복하면 95번 모수 포함"
📌 출제: t/F/χ² 적용 + 1종/2종 오류 매년.