✅ 오늘 한 것
심화 프로젝트
✏️ 오늘 배운 점
오늘은 통계 분석에서 모수검정(Parametric Test) 과 비모수검정(Non-parametric Test) 을 수행하기 전에 반드시 등분산성(Homoscedasticity) 과 정규성(Normality) 을 먼저 확인해야 한다는 것을 배웠습니다.
이는 두 가지 이유 때문입니다.
- 모수검정은 데이터가 정규분포를 따른다는 가정과 집단 간 분산이 동일하다는 가정(등분산성) 하에서만 유효하기 때문입니다.
- 만약 이 두 조건이 충족되지 않는다면, 데이터의 분포 형태에 덜 민감한 비모수검정을 적용해야 합니다.
# 정규성 확인
from scipy.stats import shapiro
for col in ['엽병장','초장','관부직경','착과수']:
stat, p = shapiro(df[col])
print(f"{col} 정규성 검정: p={p:.4f}")
# 등분산성 확인
from scipy.stats import levene
for col in ['엽병장','초장','관부직경','착과수']:
groups = [df[df['온실번호']==i][col] for i in range(1,5)]
stat, p = levene(*groups)
print(f"{col} 등분산성 검정: p={p:.4f}")
📌추가로 해야할 점
심화 프로젝트
'품질관리(QAQC) 데이터 부트캠프(본캠프)' 카테고리의 다른 글
| 본캠프_9주차(화)_TIL(심화 프로젝트 기간) (0) | 2025.11.11 |
|---|---|
| 본캠프_9주차(월)_TIL(심화 프로젝트 기간) (0) | 2025.11.10 |
| 본캠프_8주차(목)_TIL(2차 프로젝트 시작) (0) | 2025.11.06 |
| 본캠프_8주차(수)_TIL(랜덤 포레스트, XGBoost 정리) (0) | 2025.11.05 |
| 본캠프_8주차(화)_TIL (0) | 2025.11.04 |