단원 8 · 사회조사분석사 2급

8. 통계 — 회귀·상관

피어슨 상관계수 r스피어만 순위상관단순선형회귀다중회귀회귀계수 b결정계수 R²조정 R²F검정t검정변수 선택📌 출제

8. 통계 — 회귀·상관

상관분석

  • 피어슨 상관계수 (r): -1 ≤ r ≤ 1. 두 등간/비율 변수 선형관계
  • 스피어만 순위상관: 서열척도
  • 해석: |r| < 0.3 약함, 0.3~0.7 중간, > 0.7 강함
  • 주의: 상관 ≠ 인과

회귀분석

  • 단순선형회귀: Y = a + bX + ε
  • 다중회귀: Y = a + b₁X₁ + b₂X₂ + ... + ε
  • 회귀계수 b: X가 1단위 변화 시 Y의 변화량
  • 결정계수 R²: 0~1. 모형 설명력
  • 조정 R²: 변수 수 보정

회귀 가정

  1. 선형성
  2. 독립성 (잔차)
  3. 등분산성
  4. 정규성 (잔차)
  5. 다중공선성 X (VIF < 10)

회귀 진단

  • 잔차 분석·이상치·영향력 관측치 (Cook's D)
  • 다중공선성: 분산팽창인자 VIF, 공차 (Tolerance)

모형 비교

  • F검정: 회귀 전체 유의성
  • t검정: 개별 회귀계수 유의성
  • 변수 선택: 전진·후진·단계
📌 출제: 상관계수 + 회귀계수 해석.