품질관리(QAQC) 데이터 부트캠프(본캠프)

본캠프_15주차(금)_TIL(딥러닝, 고민해결소)

Wat_zy 2025. 12. 26. 08:50

✅ 오늘 한 것

실무에 쓰는 머신러닝 기초(딥러닝)


✏️ 오늘 배운 점

실무에 쓰는 머신러닝 기초

딥러닝

인경 신경망(ANN)

  • 퍼센트롭(Perceptron)의 단층 구조 → 다층 퍼셉트론(MLP) → 딥러닝(Deep Neural Network)
  • 왜 '딥(deep)'인가?
    • 입력 계층(Input layer)과 출력 계층(Output layer) 사이에 여러 개의 은닉층(Hidden layer)을 두어 복잡한 패턴까지 학습 가능

딥러닝의 핵심 아이디어

  • 계층적 특징 학습
  • 비선형 변환을 반복 적용
    • 많은 은닉층이 비선형 활성화 함수를 통해 데이터를 변환하면서 복잡한 패턴 학습
  • 오차역전파(Backpropagation)
    • 예측과 실제 값의 차이를 신경망 거꾸로 전달하며 가중치 업데이트

딥러닝 적용 절차

  • 데이터 수집 → 데이터 전처리(결측값 처리, 정규화 등) → 모델 설계 → 모델 학습(훈련) → 검증(Validation) 및 성능 평가 → 최종 모델 활용

주요 딥러닝 아키텍처

CNN(Conveolutional Neural Network)

  1. 개념
    • 주로 이미지, 영상에 특화된 구조
    • 합성곱(Convolution) 연산을 통해 픽셀 영역의 지역적 특성 추출
  2. 작동 원리
    • 합성곱 레이어
      • 필터(또는 커널)를 이용해 이미지(특징 맵)를 스캔하며 특징 추출
    • 풀링(Pooling) 레이어
      • 특징 맵의 크기를 줄이고 주요 특징만 요약
    • 완전연결(FC, Fully Connected) 레이어
      • 추출된 특징 기반으로 분류나 회귀 수행
  3. 활용 예시
    • 자율주행 차량에서 도로 표지판 인식, 차선 탐지, 물체 인식(보행자, 차량 등)
    • 의료 영상 분석(CT, MRI 등)에서 질병 부위 정확 탐

RNN(Recurrent Neural Network)

  1. 개념
    • 순차적(시퀀스) 데이터 처리에 특화된 신경망 구조
    • 문장(텍스트), 음성 신호, 주가 등 시간 순서가 있는 데이터를 다룸
  2. 작동 원리
    • 이전 단계(시점)의 은닉 상태(정보)를 다음 단계로 넘겨주며 연쇄적으로 학습
    • 순환 구조로 인해 과거의 정보를 기반으로 현재 출력에 영향을 줌
  3. 문제점과 개선
    • 장기 메모리 문제가 발생(기울기 소실, 폭주 문제) → LSTM(Long Short-Term Memory), GRU(Gated Recurrent Unit)으로 개선
  4. 활용 예시
    • 음성 인식, 기계 번역, 감정 분석, 시계열 예측(주가, 날씨 등)

Transformers

  1. 개념
    • 어텐션(Attention) 메커니즘을 활용하여 입력 전체에서 중요한 부분에 집중
    • RNN 없이도 순차 데이터(문장 등) 처리가 가능 → 병렬 연산이 가능해 학습 속도 대폭 향상
  2. 작동 원리
    • 인코더(Encoder)와 디코더(Decoder) 구조로 분리
    • 어텐션을 통해 단어 간 연관성(의미, 문맥)을 효율적으로 학습
  3. 활용 예시
    • BERT, GPT 시리즈 등 대형 언어 모델
    • 최신 NLP 작업 전반(번역, 요약, 질의응답, 텍스트 생성 등)에 활용
  4. 중요성
    • 현재 많은 대형 모델들이 Transformers 기반
    • 자연어 처리뿐 아니라 영상, 음성 등 멀티모달에도 응용 가능

강화학습(Reinforcement Learning)

  • 에이전트(Agent)가 환경(Environment)과 상호작용하며 행동(Action)에 따라 보상(Reward)을 받아 학습
  • 보상을 최대화하는 방향으로 정책(Policy)을 학습해 최적의 행동을 찾음

고민해결소

1. 

Q. 대학원 진학 이후 석사 취득 이후 취업을 시도한다면 학사보다는 낫지 않을까?

A. 석사 학위가 학사보다 유리할 수는 있겠지만, 해당 직무에서 석사가 '필수'가 아닌 '우대' 사항이라면 기회비용을 따져보아야 한다고 생각했습니다. 대학원에서 보내는 2년의 시간이 현장에서 부딪히며 쌓는 2년의 실무 경험보다 무조건 앞선다고 확신할 수 없었기에 우선 취업에 도전하여 실무 역량을 키우는 것이 더 좋은 방향이라 판단했습니다.

 

2.

1년 내에 이직한다면 "중고 신입", 2년 정도 경험이 쌓이고 이직한다면 "경력 이직"이라고 볼 수 있다.

 

3.

Q. 데이터를 처음 받았을 때 무엇을 먼저 보고 어떻게 방향을 잡아야 할까?

A. 비즈니스 목적을 먼저 정의 Why What How

맥락, 데이터 파악 → Target 변수/지표 설정 → 가설 수립

 

4. 

Q. 분석은 어디까지 진행해야 실무적으로 의미 있는 프로젝트라고 볼 수 있는가?

A. 실무에서의 완성도는 활용성/실행 가능성(Actionability)에 달려 있다.

  • 의사결정의 근거가 되는가?: "그래서 무엇을 해야 하는가?"(=So What)라는 질문에 답하기
  • 비용 대비 효율(ROI)
  • 해석 가능한 결과

✏️ 오늘의 질문

1. 딥러닝과 머신러닝의 차이는 무엇인가?

머신러닝: 사람의 개입으로 특징을 추출해 모델을 학습하는 전통적인 방법

딥러닝: 신경망(특히 다층 구조)을 사용해 데이터를 스스로 표현(특징 추출)하며 학습하는 것


📌추가로 해야 할 점

최종 프로젝트