데이터 관련 공부 자료/데이터 리터러시

[데이터 리터러시(Data literacy) 강의 - 1] 데이터 리터러시의 정의

뜌비뜌바밥 2024. 8. 6. 15:46
01. 데이터 리터러시

 

1. 데이터 리터러시의 정의

  • 데이터를 읽고, 이해하고, 비판적으로 분석하여 그 결과를 의사소통에 활용할 수 있는 능력
  • 데이터 수집과 데이터 원천을 이해
  • 주어진 데이터에 대한 다양한 활용법을 이해
  • 데이터를 통한 핵심지표를 이해

  ✔️   올바른 질문을 던질 수 있도록 만들어 줌

 

2. 데이터 분석에 대한 착각

  • 데이터의 분석 방법에 대한 공부만 함
  • 데이터를 잘 분석하거나 가공하면 원하는 정보를 얻을 것이라 생각함
  • 분석에 실패하면 방법론, 스킬이 부족하다고 생각

3. 데이터 해석 오류 사례

    1) 심슨의 역설(Simpson's Paradox)

  • 심슨의 패러독스란 부분에서 성립한 관계가 전체에 대해서 성립하지 않는 모순적인 경우를 일컫음
  • 전체에 대한 결론이 개별 집단에 그대로 적용되지는 않음

  ✔️ 유의미한 집단 구분 등 세부적인 조건을 고려할 필요성

    
     2) 시각화를 활용한 왜곡

  • 자료 표현 방법에 따라 해석의 오류 여지가 존재

<The Economist> 자료

✅ 매해 노동자와 자본가가 버는 시간당 액수의 증가를 세 가지 방식으로 나타낸 사례 (《The Economist》의 자료)
  • 왼쪽은 있는 그대로의 자료
  • 중간은 증가량에 로그를 취한 자료
  • 오른쪽은 노동자와 자본가의 최초 수입을 100%로 놓고 이후의 증가율에 대한 자료 

 

    3) 샘플링 편향 (Sampling Bias)  

  • 표본이 편향되면, 전체 데이터와 다른 결과를 얻게 될 수 있음

    4) 상관관계와 인과관계

  • 상관관계
    • 두 변수가 얼마나 관련성이 있느냐를 의미
  • 인과관계
    • 하나의 요인으로 인해 다른 요인이 변화하는 형태를 의미
    • 원인과 결과가 명확함

4. 데이터 리터러시가 필요한 이유

     1) 데이터 분석에 대한 접근법

  • 위 단계 중 생각이 주를 이루는 단계에서 데이터 리터러시가 필요함

  ✔️ 데이터 분석이 목적이 되지 않도록 분석의 이유를 항상 생각해야 함