✅ 오늘 한 것
PPT 제작
✏️ 오늘 배운 점
1️⃣ 메인 페이지: 플랫폼의 가치 제안 (App Main)
플랫폼의 설계 목적이 단순한 예측을 넘어 '실험 의사결정 지원'에 있음을 강조했습니다.
- 연구 배경: 실제 에피토프는 1% 미만이라는 극단적 데이터 불균형 문제를 명시하고, 자원 낭비를 막기 위한 사전 필터링의 필요성을 역설했습니다.
- 핵심 가설: 2-Stage(CatBoost + XGBoost) 구조를 통해 '노이즈 90% 제거'와 '결합 확신도 검증'이라는 단계적 전략을 수립했습니다.
- 작동 원리: ProtT5(문맥)와 ESM-2(구조) 임베딩의 역할을 구분하고, Stage 1(탐색)과 Stage 2(검증)의 목적을 명확히 정의했습니다.
- 설계 철학: 정확도(Accuracy) 대신 MCC 지표를 채택하고, 임계값(Threshold)을 모델의 핵심 로직으로 통합한 전문성을 부각했습니다.
2️⃣ 정보 페이지: 사용 안내 및 한계 (About)
사용자가 도구를 오남용하지 않도록 가이드라인을 제시하고, 프로젝트의 공신력을 확보했습니다.
- 주요 용도: 연구 및 탐색 목적으로서의 '후보군 우선순위 도출'을 주력 기능으로 정의했습니다.
- 기술적 한계: 선형 에피토프(Linear)에 국한된다는 점과 인간 데이터 위주의 학습 편향 가능성을 투명하게 공개하여 신뢰도를 높였습니다.
- 향후 계획: 병렬 예측 인프라 확충 및 이메일을 통한 피드백 창구를 마련했습니다.
- 프로젝트 배경: 팀스파르타 내일배움캠프 QAQC 3기 최종 프로젝트임을 명시하며 기술적 도전 과제들을 정리했습니다.
3️⃣ 결과 해석 가이드: Final Score의 정의
사용자가 예측 점수를 어떻게 받아들여야 하는지 구체적인 가이드를 설정했습니다.
- 점수 해석: Final Score를 '조건부 결합 가능성의 지표'로 정의하고, 0 ~ 100 사이의 상대적 확신도로 설명했습니다.
- 신뢰 등급: 점수대에 따라 High / Medium / Low Confidence로 구분하여 실험 우선순위를 직관적으로 결정할 수 있게 했습니다.
- 가중치 설계: 실험 실패 비용을 고려하여 정밀도 중심의 Stage 2에 0.6의 가중치를 부여한 논리를 완성했습니다.
📌추가로 해야 할 점
PPT 제작
'품질관리(QAQC) 데이터 부트캠프(본캠프)' 카테고리의 다른 글
| 본캠프_22주차(목)_TIL(PPT 정리 & 대시보드 완료) (0) | 2026.02.05 |
|---|---|
| 본캠프_22주차(수)_TIL(대시보드 수정) (0) | 2026.02.04 |
| 본캠프_21주차(월)_TIL(PPT 제작) (1) | 2026.02.02 |
| 본캠프_20주차(금)_TIL(PPT 제작) (0) | 2026.01.30 |
| 본캠프_20주차(목)_TIL(PPT 제작 & 대시보드 기능 구현) (0) | 2026.01.29 |