품질관리(QAQC) 데이터 부트캠프(본캠프)

본캠프_8주차(월)_TIL

Wat_zy 2025. 11. 3. 09:49

✅ 오늘 한 것

통계 & 머신러닝 개인 과제, 머신러닝 특강


✏️ 오늘 배운 점

scikit-learn에서 LinearRegression 모델은 
X: 2차원 배열

y: 1차원 배열

을 요구한다.

X = [[ ]]

y = [ ]

 

선형회귀에서 회귀식 구하기:

a = model.coef_[0]

b = model.intercept_

 

y = a*X + b

 

선형회귀는 “얼마나(값)”를 예측하고 로지스틱회귀는 “무엇일 확률(클래스)”을 예측한다.

# 선형 회귀
from sklearn.linear_model import LinearRegression
model1 = LinearRegression()
model1.fit(X_train, y_train)
y_pred = model1.predict(X_test)

# 로지스틱 회귀
from sklearn.linear_model import LogisticRegression
model2 = LogisticRegression()
model2.fit(X_train, y_train)
y_pred = model2.predict(X_test)

 

로지스틱 회귀 분석: 어떤 일이 일어날 가능성을 0 ~ 1 사이 숫자로 표현

확률 → 오즈비 → 로짓 → 선형식 순으로 변환

오즈비: 실패확률 대비 성공확률의 비율(0~무한대)

로짓: 오즈비로 사용 시 기울기가 가파르기에 로그를 사용하여 변환

로지스틱 함수: 로짓을 다시 확률로 변환하는 역함수

어떤 실수값이라도 0과 1 사이의 확률로 변환


📌추가로 해야할 점

통계 & 머신러닝 개인 과제, 졸업 시험