품질관리(QAQC) 데이터 부트캠프(본캠프)

본캠프_22주차(수)_TIL(대시보드 수정)

Wat_zy 2026. 2. 4. 08:30

✅ 오늘 한 것

대시보드 수정


✏️ 오늘 배운 점

1. 브랜드 아이덴티티 구축 (Branding)

팀의 아이디어와 프로젝트의 성격을 결합하여 명확한 브랜드명을 확정했습니다.

  • 프로젝트 명: Cellect Epitope (B-cell + Select + Epitope)
  • 로고 컨셉: 세포(Cell) 모티브 + 연두색(생명/성장) 컬러.

  • UI 디테일: 기본 로딩바 대신, CSS를 활용해 팀 로고가 빙글빙글 회전하는 커스텀 로딩 화면을 구현하여 브랜딩 효과를 높이기로 했습니다.

2. 텍스트 및 용어 고도화 (Copywriting)

'데모' 느낌을 지우고, 전문 연구원들이 신뢰할 수 있는 학술적 용어로 텍스트를 전면 수정했습니다.

  • 용어 정립:
    • '숙주' → '공여체(Donor)' 또는 '면역 환경' (의학적/생물학적 정확성 확보)
    • 'Binding' → '항체 결합(Binding)'으로 병기 및 문맥에 맞게 사용.
  • 메인 카피: "실험의 99% 자원 낭비를 막기 위한 데이터 기반의 첫걸음", "Linear B-cell Epitope Screening Platform" 등.
  • About 페이지:
    • 프로젝트 배경(팀스파르타), 기술적 한계(선형 에피토프 한정, 3D 구조 미반영 방어 논리), 업데이트 계획 등을 체계화했습니다.

3. 기술 논리 및 검증 (Methodology)

모델의 설계 철학을 단순 성능 나열이 아닌 '전략적 선택'으로 포장했습니다.

  • 임베딩 이원화 전략:
    • ProtT5 (1,024D): 학습 데이터 적합성 (문맥 파악)
    • ESM-2 (1,280D): 미지의 데이터에 대한 일반화 성능 (구조 정보 반영)
  • 2-Stage Cascade:
    • Stage 1: Recall 중심 (놓치지 않기)
    • Stage 2: Precision 중심 (틀리지 않기)
  • 성능 해석의 반전: FN 감소보다 TN(노이즈)을 3만 개에서 2,800개로 1/10 압축하여 실험 효율을 극대화했다는 점을 핵심 가치로 내세웠습니다.

4. 시각화 및 코드 구현 (Implementation)

모델의 '설명 가능성(XAI)'을 확보하기 위해 3가지 시각화 요소를 도입하고, 관련 파이프라인 코드를 작성했습니다.

  • 구현 기능: 모델 로드 → 예측 → 시각화 파일 생성
  • 시각화 3종:
    1. Feature Importance: 모델이 어떤 정보(구조 vs 문맥)를 중요하게 봤는지 확인.
    2. Embedding Space (t-SNE): 에피토프들이 공간상에서 군집을 이루는지 확인.
    3. Physicochemical Radar Chart: Top 후보의 이화학적 특성(친수성, 전하 등) 분석.

📌추가로 해야 할 점

대시보드 수정