본문 바로가기

_

청소년 데이터는 어떻게 분석할 수 있을까?

청소년 데이터 분석하기

 

 

안녕하세요, 자몽입니다. 😊

지난번 포스팅에서는 ‘청소년 데이터는 어떻게 수집할 수 있을까?’라는 주제로 글을 올렸었는데요.

 

👩‍ 아직 안 보신 분도, 또 보고 싶은 분도 여기 클릭! 👇

https://youth01lap.tistory.com/62?category=909385


위 포스팅에 이어서, 이번엔 수집한 청소년 데이터를 어떻게 시각화할 수 있는지 알려드리려고 해요. 데이터를 시각화하기 위해서는 먼저 사용할 도구(툴)를 선택해야 하는데요.

 

데이터 시각화 도구에는 R, Python(파이썬), Tableau(태블로), Flourish, Microsoft Excel(엑셀), QGIS 등이 있답니다. 여기서 R과 Python(파이썬)의 경우에는 프로그래밍 언어를 사용해야 하기 때문에 프로그래밍에 관한 공부가 선행되어야 하는데요. 하지만 그 밖의 Tableau(태블로), Flourish, 엑셀 등의 도구는 프로그래밍 언어를 사용하지 않고도 버튼 클릭, 드래그 등을 사용하여 누구나 쉽게 데이터 시각화가 가능합니다.

 

그래서 오늘은 누구나 쉽게 데이터 시각화가 가능한, 태블로라는 도구를 사용하여 청소년 데이터를 분석해보고자 합니다.


태블로는 우선 가입이 필요한데요,

대학생일 경우에는 학생인증을 통해서 1년 간 무료로 사용 가능하며,

일반인은 월 서비스 이용료를 지급해야 합니다.

하지만, ‘태블로 퍼블릭’ 이라는 서비스를 이용하면 무료로 누구나 사용 가능해요!

대신, 태블로 퍼블릭을 사용할 경우에는 자신의 컴퓨터가 아니라, 태블로의 웹서버에 데이터와 분석결과가 저장된다는 점, 꼭 유의해주세요!

(태블로 퍼블릭의 경우에는, 다른 사람들에게 공개해도 되는 데이터, 공공 데이터 등을 이용하시길 추천드립니다!)

 

🔽아래에서 태블로 퍼블릭을 다운받을 수 있어요!

https://public.tableau.com/ko-kr/s/




그렇다면, 태블로를 이용하여 청소년 데이터를 시각화 분석해볼까요?

간단한 예시로, 청소년 인구 데이터를 가져와볼게요!



먼저, 다운받은 태블로 퍼블릭 프로그램을 실행해보면,

 

 

이런 기본창이 뜰거예요. 여기서, 자신이 들고올 ‘원본 데이터’ 파일형식을 왼편에서 클릭해주세요. 저는 Microsoft Excel(CSV, xlsx 파일) 을 선택해볼게요. 그럼, 컴퓨터에서 자신이 원하는 데이터를 불러올 수 있어요.

 


저는 우선 주요 OECD 국가의 전체인구 대비 아동청소년 인구 데이터(비율 데이터)를 가져와보았어요. 데이터를 불러오면 아래와 같은 화면을 볼 수 있어요. 이곳에서 데이터 정제(전처리)를 할 수 있답니다!

 

 

데이터 순서나 형태 등을 원하는 대로 정제하고 나면, 왼편 하단의 [시트1]을 클릭해주세요!

 

 

그럼 이런 화면이 나오는데요.

 

 

조금 확대해서 보면, 가장 왼편에 [국가], [인구수(비율)]가 눈에 들어올 거에요.

이건 이전에 데이터 전처리 과정에서 본, 데이터를 이루고 있는 요소(행, 컬럼 등)입니다!

 

태블로가 이렇게 알아서 원본 데이터 내부의 요소들을 인식하고 우리에게 보여주니, 더할 나위없이 편리하겠죠?

 

또한, 이 요소를 행과 열에 드래그(끌어오기)하는 것만으로도 해당 요소를 분석해준답니다.

 

 



저는 우선 [국가]라는 요소를 [열]에 드래그해서 옮겨보았어요. - 파란색 캡슐

그러니 자동적으로 시트1에 해당 컬럼에 있는 값들이 표로 나타내어 지네요!

독일, 미국, 영국, 이탈리아, 일본 등 다양한 나라가 보이죠!

 

 

 

 

이번엔 [인구수(비율)][행](초록색 캡슐)으로 드래그해보았더니, 이렇게 자동적으로 막대그래프가 그려졌습니다!

각 [국가]에 해당하는 [인구수] 값들이 매칭되면서 시각화되었어요.

 

 

 

😢혹시 막대 그래프가 마음에 들지 않으신가요?

 

 

 

 

그렇다면, 우측 상단의 [표현 방식]을 주목해주세요!!

막대 그래프 이외에도 원차트, 지도 맵, 트리 맵, 버블차트, 영역형 차트 등 정말 다양한 시각화 방법들을 선택할 수 있답니다!

 

 

 

 

이 그래프는 '트리 맵'이라고 하는데요. 각 요소별 값(숫자 또는 빈도)을 영역크기와 색상으로 나타낼 수 있어요.

원하는 요소에 마우스를 올려놓으면(마우스오버) 각 요소의 값들을 직접 확인할 수 있답니다!

 

 

 

 

 

 

이렇게 가로형 막대 그래프로도 표현할 수 있구요!

 

 

 

 

 

동글동글한 버블차트로도 데이터를 표현할 수 있어요!

 

 

 


원하는 그래프를 선택하고 나면, 시트명을 원하는대로 바꿀 수 있답니다.

저는 '국가별 아동청소년 인구비율'이라고 이름을 지어보았어요. 😊

 

 

 


이렇게 태블로는 딱딱하게 멈춰진 정적인 차트에서 그치지 않고, 내가 원하는 데이터를 선택하여 반응형 차트를 구현할 수 있답니다!



이렇게 만들어진 [시트]를 모아모아 [대시보드]를 만들 수 있어요.

 

대시보드란, 웹에서 한 화면에서 다양한 정보를 중앙 집중적으로 관리하고 찾을 수 있도록 하는 사용자 인터페이스(UI) 기능을 일컬어요.

 

🔽🔽🔽결국 태블로 대시보드도 한눈에 다양한 데이터를 이해할 수 있도록 만든 것이죠! 🔽🔽🔽

 

 

 



어떤가요? 👀

데이터 시각화 차트들을 이렇게 대시보드 형태로 표현하니, 한눈에 관련 현황을 알아볼 수 있지 않나요?

 

우와, 청소년 데이터 시각화 대시보드를 더 보고 싶다구요?

 

그럼, 한국청소년활동진흥원 태블로에 놀러오세요! 😃  👇👇

https://public.tableau.com/app/profile/.24966587

 

한국청소년활동진흥원 태블로 - Profile | Tableau Public

한국청소년활동진흥원 태블로's Tableau Public profile. View interactive data visualizations published by this author.

public.tableau.com

 

청소년특별회의 정책과제, 청소년 인구 변화, 인터넷 이용실태, 정신건강 등 정말 다양한 분야의 데이터가 대시보드에 담겨 있답니다! 😊

 

 


 

여러분, 오늘 이렇게 태블로에 대해서 알아보았는데 어떠셨나요?

데이터를 알아가는 분들께 조금이나마 도움이 되었으면 좋겠어요.

 

사실 데이터는 멀리 있지 않아요. 그리고 친해지기 어려운 친구도 아니랍니다! 😉

태블로, Flourish 등 간편한 데이터 시각화 도구를 조금씩 사용하다보면, 어느덧 자연스럽게 데이터와 친해져 있을 거에요!

 

 

이만, 저는 다음 시간에도 데이터에 대한 주제로 돌아오겠습니다.

오늘도 데이터와 조금 더 친해진 하루 되시길 바라요! 💖