품질관리(QAQC) 데이터 부트캠프(본캠프)

본캠프_8주차(금)_TIL(심화 프로젝트)

Wat_zy 2025. 11. 7. 13:01

✅ 오늘 한 것

심화 프로젝트


✏️ 오늘 배운 점

 

오늘은 통계 분석에서 모수검정(Parametric Test)비모수검정(Non-parametric Test) 을 수행하기 전에 반드시 등분산성(Homoscedasticity)정규성(Normality) 을 먼저 확인해야 한다는 것을 배웠습니다.

이는 두 가지 이유 때문입니다.

  • 모수검정은 데이터가 정규분포를 따른다는 가정집단 간 분산이 동일하다는 가정(등분산성) 하에서만 유효하기 때문입니다.
  • 만약 이 두 조건이 충족되지 않는다면, 데이터의 분포 형태에 덜 민감한 비모수검정을 적용해야 합니다.
# 정규성 확인 
from scipy.stats import shapiro

for col in ['엽병장','초장','관부직경','착과수']:
    stat, p = shapiro(df[col])
    print(f"{col} 정규성 검정: p={p:.4f}")
    
# 등분산성 확인
from scipy.stats import levene

for col in ['엽병장','초장','관부직경','착과수']:
    groups = [df[df['온실번호']==i][col] for i in range(1,5)]
    stat, p = levene(*groups)
    print(f"{col} 등분산성 검정: p={p:.4f}")

📌추가로 해야할 점

심화 프로젝트