QCQA_1기 24

TIL_3W4D_라이브 세션 & 아티클 스터디

[라이브 세션]-01/03주제: 데이터 전처리&시각화https://colab.research.google.com/drive/1x-q_x_71mR6W5YPguX74zPEJXKwIw5SV?usp=sharing wine data.ipynbColab notebookcolab.research.google.com배운내용 정리:결측치 제거중복값 제거이상치 제거최신화 (행추가, 컬럼 추가 - 조인(1.컬럼 정리(중복된 컬럼) 2.행 정리(기준, 벤다이어그램)데이터가 최신화 되지 않았다면? : 행 추가새로운 공정이 추가되었다면?: 컬럼 추가선그래프막대그래프:퀼리티 5,6이 대다수이고, 약 70% 차지한다산점도: 수치형 데이터를 대상/가로축,세로축으로 받은 데이터의 상관관계를 파악, 경향성 파악가능히트맵: 품질에 영향을 ..

QCQA_1기 2025.01.03

TIL_3W3D_데이터 전처리 & 시각화 (+데일리 루틴)

[데이터 시각화] - 목적패턴 발견 및 이해의사 결정 지원효과적인 커뮤니케이션[Maplotlib]: 파이썬에서 시각화를 위한 라이브러리 중 하나로, 다양한 종류의 그래프를 생성하기 위한 도구를 제공import matplotlib.pyplot as plt [데이터 셋 불러오기] 강의에서는 Seaborn이라는 라이브러리에서 불러올 수 있는 내장 데이터 셋을 가지고 실습을 진행iris 데이터셋: 붓꽃의 꽃잎과 꽃받침의 길이와 너비를 포함한 데이터셋tips 데이터셋: 음식점에서의 팁과 관련된 정보를 담고 있는 데이터셋titanic 데이터셋: 타이타닉 호 승객들의 정보를 포함한 데이터셋flights 데이터셋: 연도별 항공편 정보를 담고 있는 데이터셋planets 데이터셋: 외계 행성 발견에 대한 정보를 담고 있는..

QCQA_1기 2025.01.02

TIL_3W2D_데이터 전처리 & 시각화 (+세션)

[실습 환경 세팅]Visual studio codeJupyterPythonTMI원래 다운받아져있던 파이썬과 새로 다운받은 버전의 파이썬의 충돌 -> 기존 파이썬 제거 후 다시 코드 실행 -> 잘됨  [데이터 전처리&시각화 연습 파일]코드를 작성하기 전에 미리 적어주어야함 왼쪽 코드를 실행하면 오른쪽 사진과 같이 temp라는 폴더에 csv파일과 xlsx파일로 저장이 됨이때 그냥 위 코드를 실행하면 error가 나는데 Ctrl+shift+~ 누르고 terminal에  pip install openpyxl을 작성 후 실행하면, 다시 사진의 왼쪽 코드를 실행하면 error 없이 진행됨  columns: 데이터프레임의 열(컬럼) 이름을 반환head(): 데이터프레임의 처음 5개 행을 반환/ 기본값은 5행이며, 원..

QCQA_1기 2024.12.31

TIL_3W1D_데이터 리터러시

[데이터 리터러시] 1) 데이터 리터러시의 정의데이터를 읽는 능력데이터를 이해하는 능력데이터를 비판적으로 분석하는 능력결과를 의사소통에 활용할 수 있는 능력데이터 수집과 데이터  원천을 이해하고 주어진 데이터에 대한 다양한 활용법을 이해하고 데이터를 통해 핵심지표를 이해하는 것2) 데이터 분석에 대한 접근법 (크게 3단계로 분류)문제 및 가설정의 (생각)데이터 분석 (작업)결과 해석 및 액션 도출 (생각)[문제정의]데이터 분석 프로젝트의 성공을 위한 초석분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술프로젝트의 목표를 설정하고 분석 방향을 설정🧐 상황: 3개월 전부터 자사 제품의 사용자 수가 감소하고 있다.사용자 수를 늘리기 위한 포인트 이벤트를 하고 있지만,효과가 없어 보인다. 또한 자사 ..

QCQA_1기 2024.12.30

TIL_2W4D_데이터 분석 파이썬 종합반 5주차(알면 유용한 파이썬 문법들!)

[드라이브 마운트]:컴퓨터에서 외부 저장 장치를 시스템에 연결하여 접근할 수 있도록 설정하는 과정from google.colab import drivedrive.mount('/content/drive')*위 코드를 이용하여 원하는 데이터 파일을 구글 드라이브 중 원하는 폴더(contet)에 넣을 수 있다! [파일 확장자] - CSV/Excel/JSON/Text 파일CSV 파일(.csv) : 쉼표 (,) 형태로 구분하여 데이터를 저장Excel 파일(.xls, .xlsx): 표 형태로 데이터를 저장JSON 파일 (.json): 데이터를 간단하게 저장텍스트 파일(.txt,.dat): 일반 텍스트로 된 데이터를 저장 [확장자에 따른 파일 불러오는 함수]import pandas as pdCSV 파일(.csv) :..

QCQA_1기 2024.12.27

TIL_Python 개인과제 (Level 1,2,3)

[문제 1-1]: 변수와 자료형 [문제 1-2] : 리스트 [문제 1-3]: 딕셔너리 [문제 1-4]: 조건문 [문제 1-5]: 반복문 [문제 1-6]: 함수 [문제 1-7]: 혼합문제 [문제 2-1]: 숫자 리스트의 평균을 계산하는 방법 [문제 2-2]: 최고 온도와 최저 온도 간 온도차를 구하는 함수 작성 [문제 2-3]: 특정 개수 이상의 데이터의 합 구하기 [문제 2-4]: 가장 많이 판매된 제품의 이름과 수량을 반환하는 함수 작성 [문제 3-1]: 이메일 주소가 올바른 형식을 갖추고 있는지 판단하는 코드 작성 [문제 3-2]: 공장 환경에서 이동 데이터를 활용해 장비의 효율성 평가 [문제 3-3]: 혼합된 설비 코드를 전처리하는 프로그램 구현(아라비아 숫자로 변환)

QCQA_1기 2024.12.26

TIL_2W3D_데이터 분석 파이썬 종합반 4주차(함수)

[함수]: 함수는 입력을 받아 원하는 처리를 한 후 출력을 내보내는 일련의 작업을 수행하는 코드 블록/ 프로그램 내에서 특정한 기능을 수행하기 위해 코드를 논리적으로 그룹화하여 재사용 가능한 형태로 정의 def 함수이름(매개변수1, 매개변수2, ...):     # 함수 내부에서 수행할 작업     return 결과값  # (선택적) 함수의 결과를 반환 def 를 이용하여 함수를 정의함수 이름 뒤 소괄호 안에 매개변수(입력 값)를 정의함수 내부에서 필요한 작업을 수행한 후, return을 사용하여 결과값을 반환함수를 호출할 때는 함수 이름을 적고, 소괄호 안에 인수(함수에 전달할 값)을 넣어 호출예시)# 함수 정의 def greet(name):     message = "Hello, " + name + ..

QCQA_1기 2024.12.26

TIL_2W3D_데이터 분석 파이썬 종합반 3주차(조건문,반복문)

[조건문] - if/elif/else: 파이썬의 조건문은 프로그램의 흐름을 제어하는 중요한 요소 중 하나특정 조건이 참(True)인 경우에만 특정 코드 블록을 실행하도록 함파이썬에서 조건문은 if, elif(else if), else 키워드를 사용하여 구성조건문은 들여쓰기와 띄어쓰기가 중요!조건문은 중첩하여 사용 가능 (첨부 사진 참고)조건문을 한 줄로도 표현 가능 (첨부 사진 참고)if 조건:     # 조건이 참일 때 실행될 코드 elif 다른조건:     # 다른 조건이 참일 때 실행될 코드 else:     # 위의 조건이 모두 거짓일 때 실행될 코드 x = 10 if x > 0:   print("양수입니다.") elif x     print("음수입니다.") else:     print("0입니..

QCQA_1기 2024.12.26

TIL_2W2D_데이터 분석 파이썬 종합반 2주차(튜플,딕셔너리)

리스트와 튜플의 차이를 이해하는 것이 중요! [튜플]: 파이썬 튜플은 변경할 수 없는 시퀀스 자료형으로, 여러 개의 요소를 저장하는 컨테이너리스트와 유사하지만, 한 번 생성된 이후에는 요소를 추가,삭제,수정할 수 없음파이썬에서 데이터를 보호하고 싶을 때 주로 사용() 소괄호를 사용하여 생성 (괄호가 없어도 생성 가능), 각 요소는 , 쉼표로 구분튜플의 인덱싱도 리스트와 동일하게 제일 왼쪽에 있는 요소부터 0,1,2,3..... [튜플] - 메서드count(): 지정된 요소의 개수를 반환index(): 지정된 요소의 인덱스를 반환list(): 튜플을 리스트로 변경하는 함수 tuple(): 리스트를 튜플로 변경하는 함수# 튜플 생성 my_tuple = (1, 2, 3, 4, 1, 2, 3) # count()..

QCQA_1기 2024.12.24

TIL_2W1D_데이터 분석 파이썬 종합 2주차 (리스트)

1주차에서는 변수와 변수 중에서도 문자열과 숫자열에 대해서 배움!2주차에서는 리스트, 튜플, 딕셔너리를 배울 예정!  [리스트]: 리스트는 파이썬에서 가장 자주 사용되는 데이터 구조 중 하나로, 여러 항목들을 담을 수 있는 가변한 시퀀스대괄호[ ]를 이용하여 리스트를 만들 수 있음리스트의 인덱싱: 리스트에서 특정 값에 접근하거나 일부분을 추출하는 방법앞에서 순서를 정할 때는 0,1,2,..... (왼쪽에서 오른쪽으로)/ 뒤에서 순서를 정할 때는 -1,-2......(오른쪽에서 왼쪽으로)중첩된 리스트에서도 인덱싱이 가능# 리스트 생성 numbers = [1, 2, 3, 4, 5] # 첫 번째 요소에 접근하기 first_number = numbers[0] print("First number:", first_..

QCQA_1기 2024.12.23