분류 전체보기 24

TIL_6W2D_머신러닝 기초(2)

머신러닝의 이해와 라이브러리 활용 기초(2)강의 내용 실습 선형회귀 (Tip 실습)단순회귀 VS. 다중회귀    단순선형회귀다중선형회귀(범주형 데이터 사용)------------------------------------------범주형 데이터 처리(Sex_en 컬럼 생성)#범주형 데이터 바꾸기def get_sex(x):    if x == 'Female':        return 0    else:        return 1 #값을 컬럼에 넣어주기 위해서tips_df['sex_en'] = tips_df['sex'].apply(get_sex)MSE,r2_score 계산 (단순선형회귀): x변수(total_bill) 1개, y변수(tip)#학습x = tips_df[['total_bill']]y = ti..

QCQA_1기 2025.01.21

TIL_6W1D_머신러닝 기초(1)

머신러닝의 이해와 라이브러리 활용 기초(1)강의 내용 실습    # !pip install scikit-learn# !pip install numpy# !pip install pandas# !pip install matplotlib# !pip install seabornimport sklearnimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns 1. Weight VS. Height:  몸무게와 키의 상관관계  weights = [87,81,82,92,90,61,86,66,69,69]heights = [187,174,179,192,188,160,179,168,168,174]print(len(weig..

QCQA_1기 2025.01.20

TIL_5W5D_통계학 기초 정리(3-6주차)

통계학 기초 정리 이어서,,,3주차 유의성 검정[수업목표]각각의 유의성 검정 방법들을 이해하고 특징을 파악신뢰구간과 가설검정의 관계제 1종 오류와 2종 오류[목차]A/B 검정가설검정t검정다중검정카이제곱검정제 1종 오류와 제 2종 오류1. A/B 검정A/B 검정은 두 버전 중 어느 것이 더 효과적인지 평가하기 위해 사용되는 검정 방법사용자들을 두 그룹으로 나누고, 각 그룹에 다른 버전을 제공한 후, 반응을 비교목적: 두 그룹 간의 변화가 우연이 아니라 통계적으로 유의미한지를 확인import numpy as np import scipy.stats as stats# 가정된 전환율 데이터 group_a = np.random.binomial(1, 0.30, 100)  # 30% 전환율 group_b = np.ra..

QCQA_1기 2025.01.20

TIL_5W3D~4D_통계학 기초 정리(1-2주차)

통계학 기초 완강이다-! (배속으로 들었지만...ㅎ) 1주차 데이터 분석과 통계[수업목표]데이터 분석에 있어서 통계가 중요한 이유기술통계와 추론통계에 대한 개념과 차이점통계분석 방범의 다양한 종류[목차]데이터 분석에 있어서 통계가 중요한 이유기술통계와 추론통계다양한 분석 방법1. 데이터 분석에 있어서 통계가 중요한 이유데이터를 이해하고 해석하는 데 중요한 역할을 함데이터를 요약하고 패턴을 발견할 수 있음추론을 통해 결론을 도출하는 과정을 도움데이터 기반의 의사결정을 내릴 수 있음2. 기술 통계와 추론 통계    [기술통계]데이터를 요약하고 설명하는 통계 방법주로 평균, 중앙값, 분산, 표준편차 등을 사용데이터를 특정 대표값으로 요약평균(Mean): 평균은 모든 데이터를 더한 후, 데이터의 개수로 나누어 ..

QCQA_1기 2025.01.17

TIL_5W2D_첫번째 프로젝트 시작과 끝

첫 프로젝트 끝      [튜터님 피드백]세계지도 시각화 너무 좋았고 특히 애니메이션을 넣어서 연도별 시각화 너무 좋았다.결론이 너무 범위가 커서 분석을 더 디테일하게 했다면 좋았을 것 같다. 그래도 엄청 잘했다! -> 다음에 프로젝트를 한다면, 데이터를 객관적으로 분석하고 너무 넓은 범위의 결론을 내는 것보다는 확실한 깊이있는 결론을 내야겠다. [다른 조 리뷰]4조: 필요한 데이터에 대한 정보의 의미를 잘 전달해주고, 어떤 데이터인지 조 내에서 예상을 하고 예상도를 첨부한 것이 인상적이었다.3조: 먼저 가설을 설정하고 데이터를 분석하는 흐름도 좋았고, 남들이 생각해보지 않은 시각(요일별 분석)에서 편견없는 가설을 설정한 것이 좋았다.5조: 한 부분에 대해서 데이터를 깊이 있게 분석을 했고, 분석에서 나..

QCQA_1기 2025.01.15

TIL_5W1D_지금까지 푼 데일리 루틴 정리(알고리즘_프로그래머스)

1. 두 수의 차정수 num1과 num2가 주어질 때, num1에서 num2를 뺀 값을 return하도록 soltuion 함수를 완성해주세요. 2. 두 수의 곱정수 num1, num2가 매개변수 주어집니다. num1과 num2를 곱한 값을 return 하도록 solution 함수를 완성해주세요. 3. 몫 구하기정수 num1, num2가 매개변수로 주어질 때, num1을 num2로 나눈 몫을 return 하도록 solution 함수를 완성해주세요.  4. 나이출력머쓱이는 선생님이 몇 년도에 태어났는지 궁금해졌습니다. 2022년 기준 선생님의 나이 age가 주어질 때, 선생님의 출생 연도를 return 하는 solution 함수를 완성해주세요. 5. 숫자 비교하기정수 num1과 num2가 매개변수로 주어집니..

QCQA_1기 2025.01.13

TIL_4W4D~4W5D_프로젝트, 아티클 스터디

이틀동안은 프로젝트 데이터 분석하느라 거의 아무것도 못했다.엑셀 파일 하나에 데이터 분석할 게 이렇게 많다는 사실에 놀라고,데이터가 이렇게 더러울 수도 있다는 거에 다시 새삼 놀랐다.실전 연습인 것 같아서 더 열심히 하게 되는 것 같다.우리 조원들도 다들 열심히하셔서 같이 힘을 내서 하게 된다.어제는 세계지도 노가다하느라 다같이 10시넘도록 나머지 공부도 했다.1조 한끼줍쇼 프로젝트 파이팅!!https://colab.research.google.com/drive/1j2KkygKzT0DjcHYdbgjj7p6teNeBHvXC#scrollTo=3owEAVvJymA5 한끼줍쇼Colab notebookcolab.research.google.com  [아티클 스터디]-01/10주제: 데이터 속 거짓말 발견하기htt..

QCQA_1기 2025.01.10

TIL_4W3D_새로운 주차 시작/ 엑셀보다 쉽고 빠른 SQL 1주차

아래  5가지 주제 중에서 "[생산] 세계 식량 생산 데이터 탐색" 을 고름. 프로젝트 명: FOOD&FEED프로젝트 목표:주요 변수를 기반으로 생산량을 예측하여 지속 가능한 농업과 식량 공급의 효율화를 실현할 수 있다.프로젝트 핵심 내용:- EDA(탐색적 데이터 분석) 인간 소비용 식량과 가축 사료 생산 데이터를 분석.국가별 식량 생산량 분포와 주요 변수 탐색.이상치 및 데이터 불균형 문제 확인.- 시각화 및 비교 분석 인간 식량과 가축 사료 간의 생산 비율 비교.국가별 및 연도별 식량 생산량 트렌드 분석.- 결론 도출 식량 생산 패턴의 통찰력 제공 및 정책적 제언.   https://colab.research.google.com/drive/1j2KkygKzT0DjcHYdbgjj7p6teNeBHvXC?..

QCQA_1기 2025.01.08

TIL_4W2D_파이썬을 이용한 시각화 특강 복습&아티클 스터디

TMI우리조에는 커피 요정이 있다!!!!! 파이썬을 이용한 시각화 특강(김준성 튜터님)https://teamsparta.notion.site/Python-4d564d934bb04fce874d36b09048ce9a [Python]파이썬을 활용한 시각화 | Notion[수업 목표]teamsparta.notion.site  [쥬피터 노트북 단축키] - 이정도는 알아두기!! A: 현재 셀 위에 새로운 셀 추가B: 현재 셀 아래에 새로운 셀 추가D, D (D 두 번): 현재 셀 삭제Z: 마지막 셀 삭제 취소Y: 셀을 코드 셀로 변경M: 셀을 마크다운 셀로 변경Ctrl + Enter: 셀 실행 (편집 모드에서)Shift + Enter: 셀 실행 후 다음 셀로 이동 (편집 모드에서) [matplotlib 사용 문법]..

QCQA_1기 2025.01.07

TIL_4W1D_데이터 전처리&시각화 개인과제

Level 1,2:Level 3: 작성 코드: 아래 코드들은 개인과제 제출용으로 오류가 많을 수 있음! (참고하실 때 주의) LEVEL1🔩 Level. 1 : 데이터 전처리공장 데이터('Defects', 'Temperature' 등)를 포함한 CSV 파일을 읽어와, 품질 분석에 앞서 필수적으로 수행해야 하는 전처리 작업을 진행합니다.  - CSV 파일 읽기 및 데이터 기본 확인1. CSV 파일을 읽어 'DataFrame(df)' 을 생성합니다.2. 데이터셋 미리보기 : 'df'의 상위 5개 행을 출력하세요.3. 데이터 정보 : 컬럼명, 데이터 타입, 결측치 등 기본 정보를 출력하세요.4. 기술 통계 : 평균, 표준편차, 최소/최대값 등 기술 통계를 출력하세요.5. 결측값 개수 : 각 열별로 결측값이 몇..

QCQA_1기 2025.01.06