품질관리(QAQC) 데이터 부트캠프(본캠프)

본캠프_22주차(화)_TIL(PPT 제작)

Wat_zy 2026. 2. 3. 08:30

✅ 오늘 한 것

PPT 제작


✏️ 오늘 배운 점

1️⃣ 메인 페이지: 플랫폼의 가치 제안 (App Main)

플랫폼의 설계 목적이 단순한 예측을 넘어 '실험 의사결정 지원'에 있음을 강조했습니다.

  • 연구 배경: 실제 에피토프는 1% 미만이라는 극단적 데이터 불균형 문제를 명시하고, 자원 낭비를 막기 위한 사전 필터링의 필요성을 역설했습니다.
  • 핵심 가설: 2-Stage(CatBoost + XGBoost) 구조를 통해 '노이즈 90% 제거'와 '결합 확신도 검증'이라는 단계적 전략을 수립했습니다.
  • 작동 원리: ProtT5(문맥)와 ESM-2(구조) 임베딩의 역할을 구분하고, Stage 1(탐색)과 Stage 2(검증)의 목적을 명확히 정의했습니다.
  • 설계 철학: 정확도(Accuracy) 대신 MCC 지표를 채택하고, 임계값(Threshold)을 모델의 핵심 로직으로 통합한 전문성을 부각했습니다.

2️⃣ 정보 페이지: 사용 안내 및 한계 (About)

사용자가 도구를 오남용하지 않도록 가이드라인을 제시하고, 프로젝트의 공신력을 확보했습니다.

  • 주요 용도: 연구 및 탐색 목적으로서의 '후보군 우선순위 도출'을 주력 기능으로 정의했습니다.
  • 기술적 한계: 선형 에피토프(Linear)에 국한된다는 점과 인간 데이터 위주의 학습 편향 가능성을 투명하게 공개하여 신뢰도를 높였습니다.
  • 향후 계획: 병렬 예측 인프라 확충 및 이메일을 통한 피드백 창구를 마련했습니다.
  • 프로젝트 배경: 팀스파르타 내일배움캠프 QAQC 3기 최종 프로젝트임을 명시하며 기술적 도전 과제들을 정리했습니다.

3️⃣ 결과 해석 가이드: Final Score의 정의

사용자가 예측 점수를 어떻게 받아들여야 하는지 구체적인 가이드를 설정했습니다.

  • 점수 해석: Final Score를 '조건부 결합 가능성의 지표'로 정의하고, 0 ~ 100 사이의 상대적 확신도로 설명했습니다.
  • 신뢰 등급: 점수대에 따라 High / Medium / Low Confidence로 구분하여 실험 우선순위를 직관적으로 결정할 수 있게 했습니다.
  • 가중치 설계: 실험 실패 비용을 고려하여 정밀도 중심의 Stage 2에 0.6의 가중치를 부여한 논리를 완성했습니다.

📌추가로 해야 할 점

PPT 제작