9. 자료 분석·통계 패키지
분석 절차
- 코딩 (응답 → 숫자)
- 편집 (이상치·결측치 처리)
- 입력 (Excel·SPSS·R·Python)
- 기술통계 (분포·중심·산포)
- 추론통계 (검정·회귀)
- 해석·보고
결측치 처리
- 완전제거: 누락 케이스 제외
- 평균 대체: 평균값으로 채움
- 중앙값·최빈값 대체
- 회귀 대체: 다른 변수로 예측
- 다중대체 (MI): 여러 값 생성 후 통합
이상치 처리
- 탐지: 박스플롯·z-score (>3)·IQR×1.5
- 처리: 제거·변환·통계량 보정 (윈저화)
주요 통계 패키지
| 패키지 | 특징 |
|---|---|
| SPSS | 직관적 GUI. 사회과학 표준 |
| SAS | 대규모 기업·금융 |
| R | 오픈소스. 패키지 풍부 |
| Python | pandas·numpy·scipy·statsmodels·scikit-learn |
| Stata | 경제학·정책 분석 |
| Excel | 기본 분석. 분석도구 |
📌 출제: 결측치·이상치 처리.