오늘의 아티클
데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT
간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화
yozm.wishket.com
아티클 요약
목적
- 시각화된 데이터가 부정확한 정보 전달 및 시각적 오해를 불러일으킬 수 있음
- 이러한 문제가 왜 일어나는지 이해하고, 데이터 시각화를 정확하게 판단하고 볼 수 있는 눈을 길러야 함
데이터 시각화에서의 왜곡
- 막대그래프
- 어떤 변수의 값을 기준선으로부터 막대 길이로 나타낸 그래프, 불연속적인 데이터를 다룸
1) 왜곡
✅ 기준선이 ‘0’인지 확인하기
막대그래프는 높이가 바로 변수의 값으로 인식되기 때문에 기준선을 ‘0’으로 두는 것이 중요함. 그러나 일부 자료에서는 기준을 0으로 두지 않아 왜곡된 정보를 전달하는 경우가 있음
✅ Y축 살펴보기
막대그래프를 만들 때 하나의 값이 다른 값들에 비해 상대적으로 크면 물결선 표시를 해서 높이를 축약하는 경우가 있음. 이때 2개의 Y축이 존재하는 그래프가 될 수 있음.
⚠️강조하고 싶은 내용에 따라 기준선을 변경하는 경우가 있으므로 기준선의 값이 0인지, Y축이 동일한지 확인하는 습관이 필요함 - 선 그래프 (Line chart)
- 시간에 따른 연속적인 변화를 보여주는 데이터를 표현하는데 주로 사용
- 변화를 보여주는 것이 목적이므로 특정한 경우를 제외하고 기준선을 ‘0’으로 두지는 않음
- 다만, 변화가 스케일에 따라 다르게 인식되므로 스케일을 사용하는 데 주의해야 함
1) 왜곡
✅ 두 개의 Y축을 멀리하기
두 개의 다른 Y축을 가지는 그래프를 겹쳐 그리는 경우, 스케일에 따라 완전히 다른 해석이 가능함
⚠️ 두 개의 Y축을 하나의 그래픽에서 사용하는 것은 반드시 지양해야 하며 대신 각각의 그래프로 표현하기 - 누적 그래프
1) 왜곡
✅ 누적 그래프를 이용해 실제 판매 증감 여부와 다른 결과 산출 - 파이 차트
- 어떤 변수의 전체 합을 100%로 했을 때, 각 부분의 구성 비율을 보여주는 데 주로 쓰임
- 파이 차트에 쓰일 수 있는 데이터의 종류에는 한계가 있음
1) 왜곡
✅ 전체의 합 = 100%
파이 차트를 사용할 수 없는 데이터를 파이 차트로 사용하는 경우가 있음
✅3D는 피하자
동일한 데이터에도 각도에 따라 보이는 면적의 크기가 달라짐. 이에 면적의 크기로 인해 데이터 값에 대한 왜곡 발생 가능 - 지도
- 위치 정보를 가지는 데이터를 시각화할 때 지도를 많이 활용함
- ex: 날씨, 태풍 지도, 선거 결과, 인구 이동 등
1) 왜곡
✅그래프의 시점 (출처 오류)
지도는 시점이 포함되어 만들어지는 시각화 자료이므로, 잘못된 시점의 자료를 제공할 수 있음
⚠️ 데이터 출처(시점)를 확인하기
✅ 시각화 방법
지역의 면적으로 인해 왜곡된 정보 전달이 가능
⚠️인구 비례 등의 방법을 이용하는 것이 조금 더 정확한 정보를 제공할 수 있음
✅ 맥락
위에서도 언급한 시점 + 표현의 과장으로 왜곡된 정보 제공
⚠️어떤 배경에서 어떤 데이터를 이용해 만들어졌는지 확인하기
생각 정리
- 학교에서 통계 수업을 들을 때부터 교수님께서 항상 강조하셨던 부분이다. 통계로 거짓말 할 수 있다는 말
- 그때부터 항상 데이터 관련 정보를 볼 때 더 꼼꼼하게 보려고 노력을 했던 거 같다.
- 한편으론 통계적 표현을 통해 마케팅을 하는 곳도 많아서 잘못된 정보를 전달하는 것이 아니고, 위의 사항들에 위배되지 않는 선에서 똑똑하게 이용하는 방법에 대해서도 알 필요가 있지 않을까하는 생각도 문득 들었다. 물론 그 방법이 무엇인지에 대해서는 알아봐야겠지만!
'아티클 스터디' 카테고리의 다른 글
[아티클 스터디] 데이터 분석의 시작은 Business 다. (2) | 2024.10.01 |
---|---|
[아티클 스터디] SQL 가독성을 높이는 다섯 가지 사소한 습관 (5) | 2024.09.30 |
[아티클 스터디] 데이터 시각화는 왜 중요할까? (4) | 2024.09.27 |
[아티클 스터디] 데이터 기반 의사결정의 장점 (2) | 2024.09.26 |
[아티클 스터디] 확실히 알아두면 만사가 편해지는 머신러닝 10가지 알고리즘 (2) (0) | 2024.08.13 |