오늘의 소감
생각보다 파이썬에 대한 이해가 많이 부족하다.
파이썬 코드카타를 손도 못대고 멍하니 바라보는 시간이 너무 늘었다.
문제를 어떻게 해결해야하는지 감도 안오는 상태다.
내일부터는 부지런히 해보아야지
오늘은 아티클 스터디에서 데이터 시각화로 인해 발생할 수 있는 다양한 왜곡에 대해 알아보았다.
데이터 분석자로써, 또는 그래프를 읽는 독자로써 마땅히 제시된 시각화 자료에 대해 비판적인 자세로 볼 필요가 있겠다.
Today I Leared
아티클 스터디
- 데이터 속 거짓말 발견하기
[https://yozm.wishket.com/magazine/detail/1821/]
데이터 속 거짓말 발견하기
[배경 및 목적]
- 시각화된 데이터가 부정확한 정보 전달 및 시각적 오해를 불러일으킬 수 있음
- 이러한 문제가 왜 일어나는지 이해하고, 데이터 시각화를 정확하게 판단하고 볼 수 있는 눈을 길러야 함
[데이터 시각화에서의 왜곡]
- 막대그래프
- 어떤 변수의 값을 기준선으로부터 막대 길이로 나타낸 그래프, 불연속적인 데이터를 다룸
1) 왜곡
✅ 기준선이 ‘0’인지 확인하기
막대그래프는 높이가 바로 변수의 값으로 인식되기 때문에 기준선을 ‘0’으로 두는 것이 중요함. 그러나 일부 자료에서는 기준을 0으로 두지 않아 왜곡된 정보를 전달하는 경우가 있음
✅ Y축 살펴보기
막대그래프를 만들 때 하나의 값이 다른 값들에 비해 상대적으로 크면 물결선 표시를 해서 높이를 축약하는 경우가 있음. 이때 2개의 Y축이 존재하는 그래프가 될 수 있음.
⚠️ 강조하고 싶은 내용에 따라 기준선을 변경하는 경우가 있으므로 기준선의 값이 0인지, Y축이 동일한지 확인하는 습관이 필요함 - 선 그래프 (Line chart)
- 시간에 따른 연속적인 변화를 보여주는 데이터를 표현하는데 주로 사용
- 변화를 보여주는 것이 목적이므로 특정한 경우를 제외하고 기준선을 ‘0’으로 두지는 않음
- 다만, 변화가 스케일에 따라 다르게 인식되므로 스케일을 사용하는 데 주의해야 함
1) 왜곡
✅ 두 개의 Y축을 멀리하기
두 개의 다른 Y축을 가지는 그래프를 겹쳐 그리는 경우, 스케일에 따라 완전히 다른 해석이 가능함
⚠️ 두 개의 Y축을 하나의 그래픽에서 사용하는 것은 반드시 지양해야 하며 대신 각각의 그래프로 표현하기 - 누적 그래프
1) 왜곡
✅ 누적 그래프를 이용해 실제 판매 증감 여부와 다른 결과 산출 - 파이 차트
- 어떤 변수의 전체 합을 100%로 했을 때, 각 부분의 구성 비율을 보여주는 데 주로 쓰임
- 파이 차트에 쓰일 수 있는 데이터의 종류에는 한계가 있음
1) 왜곡
✅ 전체의 합 = 100%
파이 차트를 사용할 수 없는 데이터를 파이 차트로 사용하는 경우가 있음
✅3D는 피하자
동일한 데이터에도 각도에 따라 보이는 면적의 크기가 달라짐. 이에 면적의 크기로 인해 데이터 값에 대한 왜곡 발생 가능 - 지도
- 위치 정보를 가지는 데이터를 시각화할 때 지도를 많이 활용함
- ex: 날씨, 태풍 지도, 선거 결과, 인구 이동 등
1) 왜곡
✅그래프의 시점 (출처 오류)
지도는 시점이 포함되어 만들어지는 시각화 자료이므로, 잘못된 시점의 자료를 제공할 수 있음
⚠️ 데이터 출처(시점)를 확인하기
✅ 시각화 방법
지역의 면적으로 인해 왜곡된 정보 전달이 가능
⚠️ 인구 비례 등의 방법을 이용하는 것이 조금 더 정확한 정보를 제공할 수 있음
✅ 맥락
위에서도 언급한 시점 + 표현의 과장으로 왜곡된 정보 제공
⚠️ 어떤 배경에서 어떤 데이터를 이용해 만들어졌는지 확인하기
향후 계획
파이썬 강의를 끝내고 개념정의, 복습, 문제풀기 등 다양한 task 수행해보기
'스파르타 코딩클럽 > 매일회고록' 카테고리의 다른 글
Today I Learned. DAY 11- [아티클 스터디] 데이터 기반 의사결정의 장점 (0) | 2024.07.17 |
---|---|
Today I Leared Day 10 - 파이썬 코드카타 (0) | 2024.07.12 |
Today I Learned. Day 8 - 파이썬 입문 (0) | 2024.07.10 |
Today I Learned. Day 7 - MySQL 기간 산출 코드 (0) | 2024.07.09 |
Today I Learned. Day 6 - 데이터 리터러시 (0) | 2024.07.09 |