아티클 스터디

[아티클 스터디] 데이터 속 거짓말 발견하기

뜌비뜌바밥 2024. 10. 2. 15:00

오늘의 아티클

 

데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT

간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화

yozm.wishket.com


아티클 요약

목적
  • 시각화된 데이터가 부정확한 정보 전달 및 시각적 오해를 불러일으킬 수 있음
  • 이러한 문제가 왜 일어나는지 이해하고, 데이터 시각화를 정확하게 판단하고 볼 수 있는 눈을 길러야 함
데이터 시각화에서의 왜곡
  1. 막대그래프
    - 어떤 변수의 값을 기준선으로부터 막대 길이로 나타낸 그래프, 불연속적인 데이터를 다룸

    1) 왜곡
    ✅ 기준선이 ‘0’인지 확인하기
    막대그래프는 높이가 바로 변수의 값으로 인식되기 때문에 기준선을 ‘0’으로 두는 것이 중요함. 그러나 일부 자료에서는 기준을 0으로 두지 않아 왜곡된 정보를 전달하는 경우가 있음

     Y축 살펴보기
    막대그래프를 만들 때 하나의 값이 다른 값들에 비해 상대적으로 크면 물결선 표시를 해서 높이를 축약하는 경우가 있음. 이때 2개의 Y축이 존재하는 그래프가 될 수 있음.
    ⚠️강조하고 싶은 내용에 따라 기준선을 변경하는 경우가 있으므로 기준선의 값이 0인지, Y축이 동일한지 확인하는 습관이 필요함

  2. 선 그래프 (Line chart)
    - 시간에 따른 연속적인 변화를 보여주는 데이터를 표현하는데 주로 사용
    - 변화를 보여주는 것이 목적이므로 특정한 경우를 제외하고 기준선을 ‘0’으로 두지는 않음
    - 다만, 변화가 스케일에 따라 다르게 인식되므로 스케일을 사용하는 데 주의해야 함

    1) 왜곡
     두 개의 Y축을 멀리하기
    두 개의 다른 Y축을 가지는 그래프를 겹쳐 그리는 경우, 스케일에 따라 완전히 다른 해석이 가능함
    ⚠️ 두 개의 Y축을 하나의 그래픽에서 사용하는 것은 반드시 지양해야 하며 대신 각각의 그래프로 표현하기

  3. 누적 그래프
    1) 왜곡
     누적 그래프를 이용해 실제 판매 증감 여부와 다른 결과 산출

  4. 파이 차트
    - 어떤 변수의 전체 합을 100%로 했을 때, 각 부분의 구성 비율을 보여주는 데 주로 쓰임
    - 파이 차트에 쓰일 수 있는 데이터의 종류에는 한계가 있음

    1) 왜곡
     전체의 합 = 100%
    파이 차트를 사용할 수 없는 데이터를 파이 차트로 사용하는 경우가 있음

    3D는 피하자
    동일한 데이터에도 각도에 따라 보이는 면적의 크기가 달라짐. 이에 면적의 크기로 인해 데이터 값에 대한 왜곡 발생 가능
  5. 지도
    - 위치 정보를 가지는 데이터를 시각화할 때 지도를 많이 활용함
    - ex: 날씨, 태풍 지도, 선거 결과, 인구 이동 등

    1) 왜곡
    그래프의 시점 (출처 오류)
    지도는 시점이 포함되어 만들어지는 시각화 자료이므로, 잘못된 시점의 자료를 제공할 수 있음
    ⚠️ 데이터 출처(시점)를 확인하기

    ✅ 시각화 방법
    지역의 면적으로 인해 왜곡된 정보 전달이 가능

    ⚠️인구 비례 등의 방법을 이용하는 것이 조금 더 정확한 정보를 제공할 수 있음

     맥락
    위에서도 언급한 시점 + 표현의 과장으로 왜곡된 정보 제공
    ⚠️어떤 배경에서 어떤 데이터를 이용해 만들어졌는지 확인하기

생각 정리
  • 학교에서 통계 수업을 들을 때부터 교수님께서 항상 강조하셨던 부분이다. 통계로 거짓말 할 수 있다는 말
  • 그때부터 항상 데이터 관련 정보를 볼 때 더 꼼꼼하게 보려고 노력을 했던 거 같다.
  • 한편으론 통계적 표현을 통해 마케팅을 하는 곳도 많아서 잘못된 정보를 전달하는 것이 아니고, 위의 사항들에 위배되지 않는 선에서 똑똑하게 이용하는 방법에 대해서도 알 필요가 있지 않을까하는 생각도 문득 들었다. 물론 그 방법이 무엇인지에 대해서는 알아봐야겠지만!