01. 강의 개요
☑️ 강의소개
- Pandas를 활용한 데이터 전처리
- Matplotlib을 활용한 데이터 시각화
- 데이터 분석가에 대한 고민
02. 데이터 분석가란
데이터 분석가 | - 정형 데이터를 분석하여 기업의 의사 결정 지원 - 데이터베이스, 스프레드시트 등에서 데이터 추출, 정제, 보고서 및 시각화 생성 - 기술적인 기술 필요, SQL, Excel, 시각화 등을 활용하여 업무 수행 |
데이터 사이언티스트 | - 데이터를 활용하여 예측, 패턴 발견, 복잡한 분석 수행하여 비즈니스 문제 해결 - 통계, 머신러닝, 딥러닝 등의 기술과 알고리즘을 사용하여 데이터를 분석하고 모델을 구축 - 데이터 수집, 전처리, 모델링, 평가 및 해석을 포함한 end-to-end 데이터 분석 작업 수행 |
비즈니스 분석가 | - 비즈니스 문제를 이해하고 해결 - 비즈니스 프로세스 및 요구 사항을 파악, 데이터 기반으로 의사 결정 지원 - 업무 프로세스 개선, 비즈니스 모델 분석, 요구 사항 관리 등을 수행 |
프로덕트 분석가 | - 제품이나 서비스의 성과 평가 및 개선 - 사용자 행동 및 제품 성능과 관련된 데이터를 분석 → 제품 개선에 기여 - 제품 경험, 사용자 행동에 대한 분석 → A/B 테스트 사용자 경로 분석 등 |
BI 분석가 | - 기업의 비즈니스 인텔리전스 플랫폼과 도구 사용하여 데이터 시각화하고 보고서 작성 - 기업 내부 데이터의 시각화 및 의사 결정에 필요한 정보 제공 - BI 도구(Tableau, Power BI 등)를 사용하여 대시보드 구축, 데이터 시각화 및 보고서 작성 |
03. 데이터 전처리와 시각화의 필요성
☑️ 데이터의 목적
- 데이터의 목적 : 설득
- 설득을 잘 하는 방법? 데이터를 잘 전달 ☞ 시각화
- 적절한 시각화 자료 = 분석 결과를 더 돋보이게 함
☑️ "어떤 목적으로 데이터를 분석할 것인가"
- 전처리를 어떻게 할 것인가 ❌
- 무엇을 위해 ~ 이런 형태의 데이터가 필요하다 ⭕ : 사전에 데이터를 어떻게 분석할 것인가 미리 설계하는 습관 필요
- 분석 설계 예시
- 목표 설정하기
- 예상 산출물 정의하기
- As-is Vs To-be 생각하기 : 현재 문제와 상황이 무엇인지 인지하고 어떤식으로 개선할 것인가 생각하며 분석 방향성을 설정하기
'데이터 관련 공부 자료 > 데이터 전처리 및 시각화' 카테고리의 다른 글
[데이터 전처리 & 시각화] Pandas 알아보기, 인덱스 이해 (2) | 2024.09.11 |
---|