단원 9 · 사회조사분석사 2급

9. 자료 분석·통계 패키지

완전제거평균 대체중앙값·최빈값 대체회귀 대체다중대체 MI📌 출제

9. 자료 분석·통계 패키지

분석 절차

  1. 코딩 (응답 → 숫자)
  2. 편집 (이상치·결측치 처리)
  3. 입력 (Excel·SPSS·R·Python)
  4. 기술통계 (분포·중심·산포)
  5. 추론통계 (검정·회귀)
  6. 해석·보고

결측치 처리

  • 완전제거: 누락 케이스 제외
  • 평균 대체: 평균값으로 채움
  • 중앙값·최빈값 대체
  • 회귀 대체: 다른 변수로 예측
  • 다중대체 (MI): 여러 값 생성 후 통합

이상치 처리

  • 탐지: 박스플롯·z-score (>3)·IQR×1.5
  • 처리: 제거·변환·통계량 보정 (윈저화)

주요 통계 패키지

패키지특징
SPSS직관적 GUI. 사회과학 표준
SAS대규모 기업·금융
R오픈소스. 패키지 풍부
Pythonpandas·numpy·scipy·statsmodels·scikit-learn
Stata경제학·정책 분석
Excel기본 분석. 분석도구
📌 출제: 결측치·이상치 처리.