01. 데이터 리터러시
1. 데이터 리터러시의 정의
- 데이터를 읽고, 이해하고, 비판적으로 분석하여 그 결과를 의사소통에 활용할 수 있는 능력
- 데이터 수집과 데이터 원천을 이해
- 주어진 데이터에 대한 다양한 활용법을 이해
- 데이터를 통한 핵심지표를 이해
✔️ 올바른 질문을 던질 수 있도록 만들어 줌
2. 데이터 분석에 대한 착각
- 데이터의 분석 방법에 대한 공부만 함
- 데이터를 잘 분석하거나 가공하면 원하는 정보를 얻을 것이라 생각함
- 분석에 실패하면 방법론, 스킬이 부족하다고 생각
3. 데이터 해석 오류 사례
1) 심슨의 역설(Simpson's Paradox)
- 심슨의 패러독스란 부분에서 성립한 관계가 전체에 대해서 성립하지 않는 모순적인 경우를 일컫음
- 전체에 대한 결론이 개별 집단에 그대로 적용되지는 않음
✔️ 유의미한 집단 구분 등 세부적인 조건을 고려할 필요성
2) 시각화를 활용한 왜곡
- 자료 표현 방법에 따라 해석의 오류 여지가 존재
✅ 매해 노동자와 자본가가 버는 시간당 액수의 증가를 세 가지 방식으로 나타낸 사례 (《The Economist》의 자료)
|
3) 샘플링 편향 (Sampling Bias)
- 표본이 편향되면, 전체 데이터와 다른 결과를 얻게 될 수 있음
4) 상관관계와 인과관계
- 상관관계
- 두 변수가 얼마나 관련성이 있느냐를 의미
- 인과관계
- 하나의 요인으로 인해 다른 요인이 변화하는 형태를 의미
- 원인과 결과가 명확함
4. 데이터 리터러시가 필요한 이유
1) 데이터 분석에 대한 접근법
- 위 단계 중 생각이 주를 이루는 단계에서 데이터 리터러시가 필요함
✔️ 데이터 분석이 목적이 되지 않도록 분석의 이유를 항상 생각해야 함
'데이터 관련 공부 자료 > 데이터 리터러시' 카테고리의 다른 글
[데이터 리터러시(Data literacy) 강의 - 5] 결론 도출 (0) | 2024.08.06 |
---|---|
[데이터 리터러시(Data literacy) 강의 - 4(2)] 지표 설정 (0) | 2024.08.06 |
[데이터 리터러시(Data literacy) 강의 - 4(1)] 지표 설정 (0) | 2024.08.06 |
[데이터 리터러시(Data literacy) 강의 - 3] 데이터의 유형 (0) | 2024.08.06 |
[데이터 리터러시(Data literacy) 강의 - 2] 문제 정의 (0) | 2024.08.06 |