2024/12 12

TIL_3W2D_데이터 전처리 & 시각화 (+세션)

[실습 환경 세팅]Visual studio codeJupyterPythonTMI원래 다운받아져있던 파이썬과 새로 다운받은 버전의 파이썬의 충돌 -> 기존 파이썬 제거 후 다시 코드 실행 -> 잘됨  [데이터 전처리&시각화 연습 파일]코드를 작성하기 전에 미리 적어주어야함 왼쪽 코드를 실행하면 오른쪽 사진과 같이 temp라는 폴더에 csv파일과 xlsx파일로 저장이 됨이때 그냥 위 코드를 실행하면 error가 나는데 Ctrl+shift+~ 누르고 terminal에  pip install openpyxl을 작성 후 실행하면, 다시 사진의 왼쪽 코드를 실행하면 error 없이 진행됨  columns: 데이터프레임의 열(컬럼) 이름을 반환head(): 데이터프레임의 처음 5개 행을 반환/ 기본값은 5행이며, 원..

QCQA_1기 2024.12.31

TIL_3W1D_데이터 리터러시

[데이터 리터러시] 1) 데이터 리터러시의 정의데이터를 읽는 능력데이터를 이해하는 능력데이터를 비판적으로 분석하는 능력결과를 의사소통에 활용할 수 있는 능력데이터 수집과 데이터  원천을 이해하고 주어진 데이터에 대한 다양한 활용법을 이해하고 데이터를 통해 핵심지표를 이해하는 것2) 데이터 분석에 대한 접근법 (크게 3단계로 분류)문제 및 가설정의 (생각)데이터 분석 (작업)결과 해석 및 액션 도출 (생각)[문제정의]데이터 분석 프로젝트의 성공을 위한 초석분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술프로젝트의 목표를 설정하고 분석 방향을 설정🧐 상황: 3개월 전부터 자사 제품의 사용자 수가 감소하고 있다.사용자 수를 늘리기 위한 포인트 이벤트를 하고 있지만,효과가 없어 보인다. 또한 자사 ..

QCQA_1기 2024.12.30

TIL_2W4D_데이터 분석 파이썬 종합반 5주차(알면 유용한 파이썬 문법들!)

[드라이브 마운트]:컴퓨터에서 외부 저장 장치를 시스템에 연결하여 접근할 수 있도록 설정하는 과정from google.colab import drivedrive.mount('/content/drive')*위 코드를 이용하여 원하는 데이터 파일을 구글 드라이브 중 원하는 폴더(contet)에 넣을 수 있다! [파일 확장자] - CSV/Excel/JSON/Text 파일CSV 파일(.csv) : 쉼표 (,) 형태로 구분하여 데이터를 저장Excel 파일(.xls, .xlsx): 표 형태로 데이터를 저장JSON 파일 (.json): 데이터를 간단하게 저장텍스트 파일(.txt,.dat): 일반 텍스트로 된 데이터를 저장 [확장자에 따른 파일 불러오는 함수]import pandas as pdCSV 파일(.csv) :..

QCQA_1기 2024.12.27

TIL_Python 개인과제 (Level 1,2,3)

[문제 1-1]: 변수와 자료형 [문제 1-2] : 리스트 [문제 1-3]: 딕셔너리 [문제 1-4]: 조건문 [문제 1-5]: 반복문 [문제 1-6]: 함수 [문제 1-7]: 혼합문제 [문제 2-1]: 숫자 리스트의 평균을 계산하는 방법 [문제 2-2]: 최고 온도와 최저 온도 간 온도차를 구하는 함수 작성 [문제 2-3]: 특정 개수 이상의 데이터의 합 구하기 [문제 2-4]: 가장 많이 판매된 제품의 이름과 수량을 반환하는 함수 작성 [문제 3-1]: 이메일 주소가 올바른 형식을 갖추고 있는지 판단하는 코드 작성 [문제 3-2]: 공장 환경에서 이동 데이터를 활용해 장비의 효율성 평가 [문제 3-3]: 혼합된 설비 코드를 전처리하는 프로그램 구현(아라비아 숫자로 변환)

QCQA_1기 2024.12.26

TIL_2W3D_데이터 분석 파이썬 종합반 4주차(함수)

[함수]: 함수는 입력을 받아 원하는 처리를 한 후 출력을 내보내는 일련의 작업을 수행하는 코드 블록/ 프로그램 내에서 특정한 기능을 수행하기 위해 코드를 논리적으로 그룹화하여 재사용 가능한 형태로 정의 def 함수이름(매개변수1, 매개변수2, ...):     # 함수 내부에서 수행할 작업     return 결과값  # (선택적) 함수의 결과를 반환 def 를 이용하여 함수를 정의함수 이름 뒤 소괄호 안에 매개변수(입력 값)를 정의함수 내부에서 필요한 작업을 수행한 후, return을 사용하여 결과값을 반환함수를 호출할 때는 함수 이름을 적고, 소괄호 안에 인수(함수에 전달할 값)을 넣어 호출예시)# 함수 정의 def greet(name):     message = "Hello, " + name + ..

QCQA_1기 2024.12.26

TIL_2W3D_데이터 분석 파이썬 종합반 3주차(조건문,반복문)

[조건문] - if/elif/else: 파이썬의 조건문은 프로그램의 흐름을 제어하는 중요한 요소 중 하나특정 조건이 참(True)인 경우에만 특정 코드 블록을 실행하도록 함파이썬에서 조건문은 if, elif(else if), else 키워드를 사용하여 구성조건문은 들여쓰기와 띄어쓰기가 중요!조건문은 중첩하여 사용 가능 (첨부 사진 참고)조건문을 한 줄로도 표현 가능 (첨부 사진 참고)if 조건:     # 조건이 참일 때 실행될 코드 elif 다른조건:     # 다른 조건이 참일 때 실행될 코드 else:     # 위의 조건이 모두 거짓일 때 실행될 코드 x = 10 if x > 0:   print("양수입니다.") elif x     print("음수입니다.") else:     print("0입니..

QCQA_1기 2024.12.26

TIL_2W2D_데이터 분석 파이썬 종합반 2주차(튜플,딕셔너리)

리스트와 튜플의 차이를 이해하는 것이 중요! [튜플]: 파이썬 튜플은 변경할 수 없는 시퀀스 자료형으로, 여러 개의 요소를 저장하는 컨테이너리스트와 유사하지만, 한 번 생성된 이후에는 요소를 추가,삭제,수정할 수 없음파이썬에서 데이터를 보호하고 싶을 때 주로 사용() 소괄호를 사용하여 생성 (괄호가 없어도 생성 가능), 각 요소는 , 쉼표로 구분튜플의 인덱싱도 리스트와 동일하게 제일 왼쪽에 있는 요소부터 0,1,2,3..... [튜플] - 메서드count(): 지정된 요소의 개수를 반환index(): 지정된 요소의 인덱스를 반환list(): 튜플을 리스트로 변경하는 함수 tuple(): 리스트를 튜플로 변경하는 함수# 튜플 생성 my_tuple = (1, 2, 3, 4, 1, 2, 3) # count()..

QCQA_1기 2024.12.24

TIL_2W1D_데이터 분석 파이썬 종합 2주차 (리스트)

1주차에서는 변수와 변수 중에서도 문자열과 숫자열에 대해서 배움!2주차에서는 리스트, 튜플, 딕셔너리를 배울 예정!  [리스트]: 리스트는 파이썬에서 가장 자주 사용되는 데이터 구조 중 하나로, 여러 항목들을 담을 수 있는 가변한 시퀀스대괄호[ ]를 이용하여 리스트를 만들 수 있음리스트의 인덱싱: 리스트에서 특정 값에 접근하거나 일부분을 추출하는 방법앞에서 순서를 정할 때는 0,1,2,..... (왼쪽에서 오른쪽으로)/ 뒤에서 순서를 정할 때는 -1,-2......(오른쪽에서 왼쪽으로)중첩된 리스트에서도 인덱싱이 가능# 리스트 생성 numbers = [1, 2, 3, 4, 5] # 첫 번째 요소에 접근하기 first_number = numbers[0] print("First number:", first_..

QCQA_1기 2024.12.23

TIL_2W1D_데이터 분석 파이썬 종합반 1주차

[Colab 주요 단축키]코드 실행: 코드 셀을 실행하려면 Shift + Enter 새 코드 셀 추가: 코드 셀을 추가하려면 코드 셀 위에서 Ctrl + M A 코드 셀 삭제 : 코드 셀을 삭제하려면 코드 셀 위에서 Ctrl + M D 코드 셀 분할: 코드 셀을 분할하려면 코드 셀 위에서 Ctrl + M - 셀 유형 변경: 코드 셀을 마크다운 셀로 변경하려면 코드 셀 위에서 Ctrl + M M(*마크다운)실행 취소(뒤로 되돌리기): 실행을 취소하려면 Ctrl +M Z [출력문]: 코드상의 어떤 결과물들을 출력시켜 그 결과물을 볼 수 있도록 해주는 문법/ 코드 작성 시 수시로 확인하기 위해, 에러를 수정하기 위해서, 점검하기 위해, 데이터 시각화를 위해 등등 다양한 경우에서 사용되기 때문에 가장 많이 쓰는..

QCQA_1기 2024.12.23

TIL_1W2D_데이터 분석 종합반 1,2주차 요약

[1주차 요약] 1) 엑셀 확장프로그램 XLMiner Analysis TookPak을 correlation 활용correlation: 어떤 항목의 값의 경향성이 다른 항목의 값에 영향을 받는지 확인할 수 있음2) 파이썬라이브러리 : 데이터 분석 시, 특정한 동작을 할 수 있게 하는 코드 모음집 [2주차 요약] 1) 변수:하나의 변수에 하나의 값을 저장데이터를 담는 컨테이너특정한 이름이 있는 상자에 원하는 데이터를 담아두었다가, 그 이름만 부르면 데이터 쉽게 호출2) 리스트 []:하나의 변수에 여러가지 값을 저장순서가 있는 데이터들의 모음집데이터들의 번호는 "0"부터 시작(0,1,2,3....)3) 딕셔너리{}:하나의 변수에 여러가지 값을 저장"이름"과 "이름이 해당하는 값"이 쌍으로 이뤄진 데이터들의 모..

QCQA_1기 2024.12.20