2025/01 12

TIL_3W4D_라이브 세션 & 아티클 스터디

[라이브 세션]-01/03주제: 데이터 전처리&시각화https://colab.research.google.com/drive/1x-q_x_71mR6W5YPguX74zPEJXKwIw5SV?usp=sharing wine data.ipynbColab notebookcolab.research.google.com배운내용 정리:결측치 제거중복값 제거이상치 제거최신화 (행추가, 컬럼 추가 - 조인(1.컬럼 정리(중복된 컬럼) 2.행 정리(기준, 벤다이어그램)데이터가 최신화 되지 않았다면? : 행 추가새로운 공정이 추가되었다면?: 컬럼 추가선그래프막대그래프:퀼리티 5,6이 대다수이고, 약 70% 차지한다산점도: 수치형 데이터를 대상/가로축,세로축으로 받은 데이터의 상관관계를 파악, 경향성 파악가능히트맵: 품질에 영향을 ..

QCQA_1기 2025.01.03

TIL_3W3D_데이터 전처리 & 시각화 (+데일리 루틴)

[데이터 시각화] - 목적패턴 발견 및 이해의사 결정 지원효과적인 커뮤니케이션[Maplotlib]: 파이썬에서 시각화를 위한 라이브러리 중 하나로, 다양한 종류의 그래프를 생성하기 위한 도구를 제공import matplotlib.pyplot as plt [데이터 셋 불러오기] 강의에서는 Seaborn이라는 라이브러리에서 불러올 수 있는 내장 데이터 셋을 가지고 실습을 진행iris 데이터셋: 붓꽃의 꽃잎과 꽃받침의 길이와 너비를 포함한 데이터셋tips 데이터셋: 음식점에서의 팁과 관련된 정보를 담고 있는 데이터셋titanic 데이터셋: 타이타닉 호 승객들의 정보를 포함한 데이터셋flights 데이터셋: 연도별 항공편 정보를 담고 있는 데이터셋planets 데이터셋: 외계 행성 발견에 대한 정보를 담고 있는..

QCQA_1기 2025.01.02