시각화로 전달하는 데이터 인사이트
다양한 정보를 집약하는 효율적 시각화
![[사진 = pixabay]](https://cdn.iworldtoday.com/news/photo/202110/405568_209809_2513.png)
[월드투데이 김새민 기자] 데이터 시각화는 데이터 배경지식이 없는 사람들에게 데이터의 인사이트를 공유하는 데 방점을 둔다. 시각화된 그래프에 집약적으로 '정보'를 담아내는 것이 효율적인 데이터 시각화이다.
시각화는 데이터 분석에 유용하다. 시각적인 포맷으로 데이터를 바라보면, 이전에는 보이지 않았던 정보가 드러난다. 대량의 데이터도 시각화로 한눈에 볼 수 있고, 데이터의 패턴도 파악할 수 있다. 시간의 흐름에 따른 변화를 분석하고 싶다면, 선 그래프로 확인하는 게 직관적일 것이다.
시각화 분석 플랫폼인 태블로는 공식 사이트에서 '시각화는 데이터를 더 이해하기 쉬운 형식으로 조정하고, 유용한 정보를 강조하여 스토리텔링을 돕는다'고 언급했다.
효율적인 시각화는 데이터에 대한 배경지식이 없는 사람들에게 인사이트를 전달할 때도 효과적이다. 데이터를 모르는 사람들에게 시각화 결과로 데이터를 '설명'할 수 있다. 시각화에 '정보'를 담아 전달하고자 하는 바를 집약하면서, 이해도를 높인다.
![[사진 = 동적시각화, final report 공식 홈페이지]](https://cdn.iworldtoday.com/news/photo/202110/405568_209832_3732.gif)
2016년 다보스 포럼이 발표한 '일자리의 미래 보고서'에 따르면, 2020년 가장 유망한 직종 중 하나는 데이터 분석가였다. 포럼에서는 4차 산업혁명을 주도하는 인재의 역량 중 하나로 '협업 능력'을 선정하기도 했다.
시각화는 데이터 분석가의 협업 능력을 보여준다. 분석 결과를 공유해야 하는 분석가는, 시각화를 통해 도출한 인사이트를 설명한다. 명확하게 전달하기 위해서는, 정보를 스토리텔링 하는 능력이 필요하다.
동적시각화
표현하고자 하는 바를 최소한의 차트에 담기 위해 동적 시각화가 주목받고 있다. 동적 시각화는 차트를 보는 사람들이 시각화 결과와 상호작용할 수 있다는 것을 의미한다. 마우스 스크롤에 따라 지도가 확대되거나 축소되는 것이 대표적인 예이다.
지난 2020년, 코로나 확진자의 동선을 지도 위에 표시한 '코로나맵'이 화제가 되었다. '코로나맵'은 클릭과 확대로 이용자가 원하는 정보를 편리하게 찾을 수 있다.
동적 시각화는 다양한 정보를 전달하기에 용이하고, 사람들이 '원하는' 결과를 즉각적으로 확인할 수 있다는 것이 장점이다. 동적 시각화에 효과적인 파이썬 라이브러리로는 Plotly, Bokeh 등이 있다.
Plotly는 차트에 커서를 갖다 대면 정보가 표시되는 효과를 줄 수 있다. 이는 Bokeh도 마찬가지다. 보통 산점도는 x축과 y축만으로 정보를 표시하는 게 다지만, 동적 시각화를 통해서는 그 이외의 정보까지 하나의 그래프에 담을 수 있다.
![[사진 = 위젯으로 변경하는 그래프, Bokeh 홈페이지]](https://cdn.iworldtoday.com/news/photo/202110/405568_209833_487.gif)
위젯을 설정하여 그래프를 즉각적으로 변경할 수도 있다. 위젯을 조작하면, 그래프는 사용자와 실시간 상호작용하며 변화한다. 위젯을 시간으로 설정하면, 시간에 따라 그래프가 어떻게 변화하는지를 보여줄 수 있다.
대시보드
![[사진 = 코로나19 확진 사례와 관련하여 위치별로 직원을 보여주는 인력 분석 대시보드, 태블로 홈페이지]](https://cdn.iworldtoday.com/news/photo/202110/405568_209824_3516.gif)
데이터 대시보드는 한 개 이상의 시각화 차트를 한 화면에 배치해 놓은 화면 자체를 말한다. 대시보드는 여러 시각화 차트를 어떻게 배치할 것인지가 관건이다.
같은 데이터를 분석해도, 데이터에서 도출한 바는 다를 것이다. 이처럼 시각화 결과도 분석자에 따라 달라진다. 분석의 목적이 무엇인지, 분석 과정에서 어떤 점에 주목해 데이터를 파악해 나갔는지에 따른 '이야기'를 데이터 대시보드에 구성하는 것이다.
우선 핵심지표를 중심으로 두고 핵심지표를 설명하는 부가 지표들을 주변에 배치하는 방법이 기본이다. 여러 개의 차트를 하나의 화면에 구성하는 것이므로 차트 별 색깔에 유의하여 전체 대시보드가 한눈에 들어오면서도, 여러 차트가 구별이 되도록 색 선정에 유의해야 한다.
어느 위치에 차트를 두면 사람들이 대시보드에 담긴 여러 정보를 효과적으로 파악할 수 있을 것인지를 고민하고 설계하는 것도 분석자의 역량이다.
데이터 시각화는 커뮤니케이션 능력과 직결된다. 시각화를 제대로 활용한다면, 다른 사람과 분석 결과를 공유하는, 소통하는 분석자가 될 수 있다.

