[라이브 세션]-01/03
- 주제: 데이터 전처리&시각화
- https://colab.research.google.com/drive/1x-q_x_71mR6W5YPguX74zPEJXKwIw5SV?usp=sharing
- 배운내용 정리:
<전처리>
결측치 제거
중복값 제거
이상치 제거
최신화 (행추가, 컬럼 추가 - 조인(1.컬럼 정리(중복된 컬럼) 2.행 정리(기준, 벤다이어그램)
데이터가 최신화 되지 않았다면?
: 행 추가
새로운 공정이 추가되었다면?
: 컬럼 추가
선그래프
막대그래프
:퀼리티 5,6이 대다수이고, 약 70% 차지한다
산점도
: 수치형 데이터를 대상/가로축,세로축으로 받은 데이터의 상관관계를 파악, 경향성 파악가능
히트맵
: 품질에 영향을 미치는 주요 변수는 알코올 함량(히트맵,0.48), 휘발 산도(히트맵,-0.41)
[아티클 스터디]- 01/02
- 주제: 데이터 분석의 트랜드
- https://blog.sknetworks.co.kr/23126
- 요약: AI 기술을 결합한 데이터 분석이 다양한 산업에서 활용되며, 주요 기업들의 사례를 통해 최신 트렌드를 살펴봄
- 주요포인트:
- 벤츠: 클라우드 기반 데이터 플랫폼(MO350)으로 생산 데이터를 실시간 분석, 효율성 15% 향상.
- 의료산업: 다양한 데이터(텍스트, 이미지 등)를 통합하여 정확한 진단과 맞춤형 치료 제공.
- 허닭: AI를 활용한 판매 데이터 분석 자동화로 매출 200% 성장.
- 넷플릭스: 사용자 데이터를 분석해 인기 콘텐츠를 예측, 성공적인 오리지널 콘텐츠 제작.
→ 데이터 분석의 성공을 위해선 일관성 있는 데이터 관리, 전사적 데이터 활용 문화, 협업 촉진이 필수적
- 핵심개념: AI 기반 데이터 분석, 데이터 기반 의사결정 문화
- 용어정리:
- 멀티모달 (Multimodal): 여러 유형의 데이터를 함께 사용하는 분석 기법 (예: 텍스트, 이미지, 비디오, 오디오 데이터 결합).
- 클라우드 기술 (Cloud Technology): 데이터를 인터넷을 통해 원격 서버에서 저장하고 처리하는 기술.
- 머신 러닝 (Machine Learning): 데이터를 통해 패턴을 학습하고 예측하는 인공지능 기술.
[아티클 스터디]-01/03
- 주제: 직관적인 데이터 시각화 만들기
- https://yozm.wishket.com/magazine/detail/1792/
- 요약: 데이터 시각화의 직관성(우리의 뇌가 시각 정보를 처리하는 방식)
- 주요포인트:
[콜린 웨어 박사의 시각 정보 처리 3단계]
1단계: 뚜렷한 시각 요소 파악하기
-뇌는 시각 정보를 빠르게 처리하고, 색, 질감, 방향, 배열 등 기본적인 시각 요소를 추출
-뚜렷하게 눈에 띄는 시각 요소들이 감각 기억에 저장.
-색깔, 형태, 크기 등 기본적인 시각 요소들이 눈에 띄며, 이를 통해 시각 정보가 첫 번째로 뇌에 입력.
2단계: 패턴 알아차리기
-추출된 시각 요소들을 바탕으로 패턴을 찾아냄
-이 과정에서 게슈탈트 원리(근접성, 유사성, 공동 운명 등)가 중요한 역할을 하여, 뇌는 시각적 요소들을 그룹화하고 패턴을 인식
-비슷한 색이나 형태의 요소들이 묶여 보이고, 가까운 위치에 있는 요소들은 연관되어 보임.
3단계: 해석하기
-추출된 시각 요소와 패턴을 기반으로 뇌는 의미를 부여하고 해석
-기존 지식이나 텍스트와 연결하여 새로운 정보를 이해하고 해석
-시각 정보를 통해 데이터를 해석하고, 중요한 인사이트나 결론을 도출.
- 핵심개념: 데이터 시각화
- 용어정리:
- 시각화 :데이터를 시각적 형태(그래프, 차트 등)로 변환하여, 정보를 더 쉽게 이해하고 분석할 수 있도록 돕는 과정.
- 전주의적 속성 :시각적 자극을 인지할 때, 의식적인 주의를 기울이지 않아도 뇌가 자동으로 빠르게 인식하는 기본적인 시각적 특징(예: 색, 크기, 위치, 형태 등).
- 게슈탈트 원리 :인간의 뇌가 시각적 요소들을 개별적으로 인식하기보다는, 요소들을 하나의 전체로 인식하려는 경향이 있다는 이론. 주요 원리로는 근접성, 유사성, 폐쇄성 등이 있음.
- 공동 운명 :동일한 방향으로 움직이거나 변화하는 요소들은 서로 관련이 있다고 인식하는 원리. 시각적으로 같은 방향으로 이동하는 것들이 하나의 그룹으로 인식됨.
'QCQA_1기' 카테고리의 다른 글
TIL_4W2D_파이썬을 이용한 시각화 특강 복습&아티클 스터디 (0) | 2025.01.07 |
---|---|
TIL_4W1D_데이터 전처리&시각화 개인과제 (0) | 2025.01.06 |
TIL_3W3D_데이터 전처리 & 시각화 (+데일리 루틴) (0) | 2025.01.02 |
TIL_3W2D_데이터 전처리 & 시각화 (+세션) (0) | 2024.12.31 |
TIL_3W1D_데이터 리터러시 (0) | 2024.12.30 |