품질관리(QAQC) 데이터 부트캠프(본캠프)

본캠프_3주차(4일)_TIL

Wat_zy 2025. 9. 25. 09:37

✅ 오늘 한 것

 아티클 스터디, 코드카타, 데이터 전처리 & 시각화 라이브 세션, Python 라이브러리 세션


✏️ 오늘 배운 점

def solution(s):
    if (len(s) == 4 or len(s) == 6) and s.isdigit():
        return True
    else:
        return False

문자열이 숫자로 이루어진 것인지 확인해주는 함수를 만드는데 검색을 통해, isdigit()는 문자열이 숫자의 형태로 이루어져 있는지 확인하여 True를 반환하고, isdecimal()은 어떤 문자열이 int로 변환이 가능하면 True를 반환하기에 이를 통해 문자열이 숫자로 이루어졌는지 확인할 수 있는 코드를 작성할 수 있었다.

• isdecimal() : 어떤 문자열이 int로 변환이 가능하면 True 반환

• isdigit() : 어떤 문자열이 숫자의 형태면 True 반환

 

def convert_krw_to_usd(a, b):
    return round(a / b, 2)
    
print(convert_krw_to_usd(1200000, 1350))

이 코드에서 소수점 자리를 찾으려면 sql에서 round 함수를 사용하는 것이 익숙하다보니 round 함수를 통하여 소수점 2자리까지 return하도록 하는 함수를 만들었지만, 다른 사람의 풀이를 통해 python에서는 .nf를 통해 (n=정수, 소수점 n자리까지 남기라는 뜻, f = float(실수)) 문제에서 주어지는 소수점 n자리까지 찾을 수 있도록 하는 것을 배울 수 있었다.


.shape():  DataFrame의 (row, column)을 알 수 있게 하는 문법

.tolist(): 값과 컬럼을 리스트로 변환


- 리스트 컴프리헨션(List Comprehension)

기존의 for문을 한 줄로 줄여주는 문법

구조: [표현식 for 변수 in 반복가능객체], [표현식 for 변수 in 반복가능객체 if 조건]

 

- 리스트 슬라이싱(List Slicing)

리스트의 특정 부분을 잘라내는 기능

문법: 리스트[start : end : step]

 

- 람다 함수(Lambda Function) + map/filter

"이름 없는 한 줄짜리 함수"

문법: "lambda 매개변수 : 표현식"

• map 함수

map(function, iterable): iterable의 각 원소에 함수 적용

결과는 map object로 반환되기에 list()로 변환해야 확인 가능

iterable : for문으로 순회할 수 있는 객체

• filter 함수

filter(function, iterable): function이 True인 원소만 남김

결과가 filter object로 반환되기에 list()로 변환해야 확인 가능

 

map + filter 도 가능하다.

# 홀수만 뽑아서 3배로 만들기
tripled_odds = list(map(lambda x: x * 3, filter(lambda x: x % 2 == 1, data)))
print("홀수 3배:", tripled_odds)

describe(): 데이터의 분포와 중심경향 파악

value_counts(): 데이터의 빈도

value_counts(normalize=True): 데이터의 비율

왜도 > 0 : 평균값 > 중앙값 > 최빈값

왜도 < 0 : 평균값 < 중앙값 < 최빈값 

--> 평중최


✏️ 오늘의 핵심

파이썬의 문자열 처리, 데이터 전처리, 그리고 함수 활용에서 여러 가지 새로운 문법과 차이를 배웠다.

숫자 처리에서는 SQL의 ROUND처럼 round()뿐 아니라 .nf 형식으로도 소수점 자릿수를 제어할 수 있음을 알게 되었다.

또한 리스트 컴프리헨션, 슬라이싱, 람다 함수, map·filter 조합을 통해 코드를 간결하게 작성하는 방법을 익혔고, describe(), value_counts() 등으로 데이터 분포를 파악하는 과정에서 왜도(평균-중앙값-최빈값 관계)를 다시 확인할 수 있었다.

즉, 오늘은 데이터 처리와 표현에서 파이썬다운 문법을 활용해 효율성과 정확성을 높이는 법을 배운 하루였다.


📌추가로 해야할 점

Python 라이브러리 & 문법 복습 & 코드 복습, 세션 내용 예습 & 복습

'품질관리(QAQC) 데이터 부트캠프(본캠프)' 카테고리의 다른 글

본캠프_3주차(토)_TIL  (0) 2025.09.26
본캠프_3주차(5일)_TIL  (0) 2025.09.25
본캠프_3주차(3일)_TIL  (0) 2025.09.24
본캠프_3주차(2일)_TIL  (0) 2025.09.23
본캠프_3주차(1일)_TIL  (0) 2025.09.22