✅ 오늘 한 것
시계열(복습 & 라이브세션), Tableau 개인 과제
✏️ 오늘 배운 점
시계열
ACF 해석: 잔차의 자기상관함수 막대가 모두 신뢰구간(파란색 음영) 안쪽에 있다는 것은 잔차들 사이에 유의미한 상관관계가 없다는 뜻
즉, 잔차가 무작위적인 백색 소음(White Noise)에 가깝다는 좋은 신호
잔차가 과거 값과 상관성이 없어야 좋은 모델
Ljung-Box 검정 해석:
귀무가설(H_0): 잔차 간에 상관관계가 없다 (백색 소음이다).
대립가설(H_1): 잔차 간에 상관관계가 있다.
--> 상관성이 없을수록 좋은 모델이라는 것을 의미한다.
AIC: 모델의 복잡성(k)과 적합도(L)와 사이의 균형을 중시하며, 적합도가 더 높은 모델을 선호

BIC: 샘플 수 n에 대한 로그값을 사용해 모델 복잡성에 더 큰 패널티를 부여

AIC와 BIC는 가장 낮은 값을 가진 모델을 선택하는 것이 원칙
두 지표 모두 낮을수록 더 좋은 모델로 간주하지만, BIC는 더 간소한 모델을 선호
Autro-ARIMA: ARIMA와 SARIMA 모델에서 사용되는 최적 차수(p, d, q, P, D, Q, s)를 자동으로 탐색해주는 도구
- Auto-ARIMA의 주요 기능
- p, d, q (비계절성 차수) 및 P, D, Q, s (계절성 차수)를 자동으로 선택
- AIC/BIC 기준으로 최적 모델 탐색
- 비계절적과 계절적 데이터를 모두 지원
- 수작업으로 차수 선택하는 번거로움을 줄여 시간 절약!
계절성 분석: seasonal = True
계절 주기: m(=1;연도별 데이터, =4;분기별 데이터, =12;월별 데이터, =52;주간 데이)
최대 차수(p+d+q) 제한: max_otder
p, q 시작 초기 값: start_p, start_q
p, q 최대 값: max_p, max_q
Prophet: 기본적으로 추세를 직선이나 곡선으로 표현하며, 주기성은 일간, 주간, 연간 주기를 자동으로 감지
- Prophet의 장점
- 비정상 데이터 및 결측치 처리: 결측치가 있더라도 데이터를 손쉽게 처리
- 빠른 계산 속도: 대규모 데이터에서도 빠르게 작동
- 직관적인 파라미터 조정: 추세와 주기성의 강도를 쉽게 조절
- 휴일 효과 반영: 사용자가 직접 정의한 휴일이나 명절 효과를 반영
- Prophet의 단점
- 복잡한 상호작용 반영 어려움: ARIMA/SARIMA처럼 세부 조정을 할 수 없다는 한계
- 비선형성 추세 반영 한계: 복잡한 비선형 추세를 반영하는 데 한계
- add_country_holidays : 특정 국가의 휴일을 자동으로 반영
- yearly_seasonality : True로 설정해 연간 계절성을 반영
- add_seasonality(): 사용자 정의 주기성을 추가하여 데이터의 특성을 더욱 세밀하게 반영
✏️ 오늘의 질문
1. 시계열 데이터에서 백색 소음의 특성을 보이는 것이 모델이 데이터를 왜 잘 설명하고 있다는 것을 의미하는가?
시계열 모델의 잔차가 백색 소음의 특성을 보인다는 것은 모델이 시계열 데이터 속의 추세, 계절성, 자기상관 구조 등 예측 가능한 모든 패턴을 이미 제거했다는 뜻이다.
즉, 잔차에 상관성이 전혀 남아있지 않기 때문에 모델이 데이터를 구조적으로 정확히 설명하고 있으며, 예측 가능한 정보는 모두 모델이 포착했다는 것을 의미한다.
2. 인적성검사에서 1,5점은 거만해보일 수 있기에 2~4점으로 작성하는 것이 더 좋을 수 있다.
📌추가로 해야 할 점
시계열(복습 & 라이브세션), Tableau 개인 과제
'품질관리(QAQC) 데이터 부트캠프(본캠프)' 카테고리의 다른 글
| 본캠프_11주차(금)_TIL(시계열) (0) | 2025.11.28 |
|---|---|
| 본캠프_11주차(목)_TIL(시계열, 심화 프로젝트[바이오]) (0) | 2025.11.27 |
| 본캠프_11주차(화)_TIL(Tableau, 시계열) (0) | 2025.11.25 |
| 본캠프_11주차(월)_TIL(Streamlit) (0) | 2025.11.24 |
| 본캠프_10주차(금)_TIL(Streamlit, Tableau) (0) | 2025.11.21 |