햇빛이 따사로운 화창한 15일차 아침
구름이 생각보다 많이 있지만, 햇빛이 적절히 비치는게 어제랑 비슷하다 ㅎㅎ
오늘도 파이팅 넘치는 하루를 시작해보자!
데이터 분석 입문 주차
본캠프 3주차
오늘은 당연히 코드카타로 시작!
데이터 전처리 & 시각화를 끝내고 예정된 라이브 세션을 진행하겠다.
코드카타
아침을 깨우는 시간
뇌를 말랑말랑하게~
알고리즘 문제와 SQL 문제를 풀어보자!
오늘은 두 문제 씩 나열해보겠다.
알고리즘 문제 1
리스트를 만들어서 푸는 문제
answer = [] : 빈 리스트 생성
for i in range(1, n+1): : range를 이용한 반복문
answer.append(x*i) : x에 i를 곱해서 리스트에 추가
처음에 range를 (a, b, c)로 간격 설정해서 풀었으나, 계속 틀려서 답안을 봤는데... 너무 허탈해서.. 어이가 없다.
이 문제는 내가 너무 어렵게 생각했나 싶기도 하다.
알고리즘 문제 2
12345를 반대로 뒤집어 리스트에 담는 방법
n_list = [] : 빈 리스트 형성
for i in list(str(n)): : n을 문자형으로 전환한 것을 list 형식으로 바꿔 i라는 변수로 반복
n_list.append(int(i)) : 문자형 i를 정수형(int())으로 바꿔 리스트에 추가
answer = n_list[::-1] : 순서를 반대로 뒤집는다
SQL 문제 1
생물 종, 이름, 성별 및 중성화 여부를 아이디 순으로 조회하는데, 알 수 없는 이름은 no name으로 바꿔라
조회할 컬럼 : animal_type, name, sex_upon_intake
가져올 테이블 : animal_ins
여기서 ifnull은 뭐냐? 결측값을 다른것으로 바꿔주는것!
그래서 ifnull(해당 컬럼, '결측 값 내 바꿔줄 것')
SQL 문제 2
경기도에 위치한 창고의 ID, 이름, 주소, 냉동시설 여부를 조회 하는데, 냉동시설 여부가 null인 경우 n으로 출력
창고id기준으로 오름차순 정렬
조회할 컬럼 : warehouse_id, warehouse_name, address, freezer_yn
가져올 테이블 : food_warehouse
조건 설정(경기도) : where address like '경기도%'
정렬 : order by warehouse_id
ifnull 쓰는 것은 앞선 문제에서 언급!
오전 라이브 세션
데이터 리터러시에 대해 알아보자
데이터 리터러시
문제를 정의하고 가설을 설정해서 데이터를 전처리, 그 후 결론 도출까지 이르기까지 일련의 필요한 과정
본캠프 Day 7, 8 - 데이터 리터러시에 자세한 정보가 담겨있다
데이터라는게 분석하고 사고를 기르는 것이 중요한 부분이다
하지만, 신경써야 하는 건 도메인(분야)도 마찬가지!
도메인을 잘 설정해야 거기에 관한 지식을 데이터 분석에 유리하고 방향을 잘 잡아낼 수 있다!
오후 라이브 세션
데이터 전처리, 심화로 들어가보자
데이터 분석 종합반에서 배운! 메서드 기억하나?
.dropna() : 데이터프레임에서 결측치를 포함한 행이나 열을 제거하는 데 사용된다
이번 세션에서 알아가는게 몇 개있다
.dropna()의 괄호 안에
결측치가 포함된 행만 제거
결측치가 포함된 열 전체 제거
결측치를 대체하는 방법
평균값, 중위수, 최빈값, 특정값, 예측값
.fillna(): 결측치를 대체하는 데 사용된다!
고급 결측치 처리: 전 값 또는 뒷 값을 채워주는 방식
이놈은 시간순서가 있는 데이터의 경우 앞뒤 값을 활용한 대체가 효과적
선형 보간법(인터폴레이션): 전 값과 뒷 값의 평균값을 사용하여 결측치를 대체하는 방법
데이터 유형 변경
astype(): 데이터 유형을 변경할 때 사용된다
예시로 astype({'series' : int}) 시리즈 열을 인수형으로 바꾼것
to_numeric(): 결측치 값을 특정 값으로 변경하는 데 사용!
마치면서
오늘 아쉬운 점은 집중력이 저하되서 데이터 전처리 및 시각화 강의를 다 듣지 못했다.
3주차 강의는 들었지만... 4주차를 놓치고 말았다.
정리를 끝내지 못했을뿐더러 강의를 그저 물흐르듯이 듣기만 한 듯...?
음, 일단 오늘도 노트북이 맛이좀 가려고했다.(열 + 배터리 감소)
그래서 문제해결을 위해 기존에 쓰던 노트북을 가져와 분할을 했지만
효과가 미미한 것 같아서 AI 힘을 이용해 개선점을 찾았다.
작업별로 나눠서 써보려고 한다.
Chrome - zep, colab 구동
Safari - 강의 및 출결관리, 기타 웹
vscode - 제일 필요할 순간에 키고, 웬만해서는 colab
맥북 - 화면 밝기 줄이고, 거치대 사용
일단 시도는 해보고 안되면, 도움 요청을...!
내일은 3주차 보강하고 4주차를 완벽히 끝내놓도록하겠다.
어려움이 직면해도.. 앞으로 나아가보자
'[내일배움캠프]' 카테고리의 다른 글
[QA/QC_2기]본캠프 Day 17: 데이터 전처리 및 시각화 완성해가기 (0) | 2025.06.02 |
---|---|
[QA/QC_2기]본캠프 Day 16: 정신이 없는 오늘 (0) | 2025.05.30 |
[QA/QC_2기]본캠프 Day 14: 데이터 분석 (1) | 2025.05.28 |
[QA/QC_2기]본캠프 Day 13: 첩첩산중 (6) | 2025.05.27 |
[QA/QC_2기] 본캠프 Day 11: 주말 보강 학습 (1) | 2025.05.25 |