본문 바로가기

_

청소년 데이터는 어떻게 수집할 수 있을까?

 

 

안녕하세요. 자몽입니다 😊

 

요즘 언론매체나 연구자료를 접하다보면 금융, 의료, 교육 등 사회 전 분야에서 데이터에 대한 관심이 깊어지고 있음을 새삼 느끼곤 합니다. 청소년 분야에서도 마찬가지인데요.

 

그 일례로 2021년 2월, 안동경찰서에서는 경찰의 각종 정보를 지리적으로 분석한 시스템인 지리적 프로파일링 시스템(GeoPros)을 통해 최근 1년간 관내 학교폭력과 청소년 비행 신고 다수지역 데이터를 분석하여, 청소년 비행우려 지역(18개소)으로 선정했다고 해요. 이를 바탕으로 위기청소년을 적극적으로 발굴하여 청소년 보호 활동에 힘쓰고 있다고 합니다.



이렇게 데이터를 실제로 활용하기 위해서는 먼저, 활용할 데이터를 생산하거나 수집해야 해요.

그렇다면 우리의 관심 분야인 청소년 데이터는 어디에서 수집할 수 있을까요?

 

첫번째는, 공공포털에서 청소년 관련 데이터를 다운로드 받는 방법입니다. 아래에서 데이터를 다운받을 수 있는 공공포털에 대해서 설명드리겠습니다.

 

 

 1) 공공데이터포털(https://www.data.go.kr/)

 

 ✅ 행정안전부와 한국지능정보사회진흥원(NIA)가 운영하고 있는 공공데이터 사이트로, 각 부처나 공공기관에 분포되어 있는 공공데이터를 한데 모아 제공하고 있습니다. 데이터 제공기관별, 주제별로도 데이터를 검색하고 다운받을 수 있습니다.

 

 🎁 (데이터 예시) 청소년의 현재 음주율, 청소년백서, 대구광역시 청소년단체, 울산광역시 청소년쉼터, 서울특별시 청소년인구 통계, 경기도 김포시 청소년시설 데이터 등

 

 

 

 2) 통합 데이터 지도(https://www.bigdata-map.kr/)

 

 ✅ 통합 데이터 지도는 공공과 민간에서 제공하는 데이터를 쉽게 검색하고 활용할 수 있도록 지원합니다. 데이터 지도는 16대 빅데이터 플랫폼과 AI Hub, 데이터스토어, Kotra, 한국관광공사, 쿠콘 등 데이터 파트너들과 함께하는데요. 분산되어 있는 청소년 데이터를 손쉽게 찾을 수 있답니다!

 

 🎁 (데이터 예시) 청소년 동아리 운영 현황, 청소년 고민 순위 정보, 청소년 이용 공간 정보, 청소년 지도인력 정보, 청소년 유해매체정보, 청소년 캠프 운영 정보, 청소년 문화 성향 정보, 청소년 정책 참여 현황, 청소년 또래상담 데이터 등



 

 3) 서울시열린데이터광장(https://data.seoul.go.kr/)

 

 ✅ 서울특별시청에서 운영 중인 공공데이터 사이트로, 서울시 전반의 데이터를 다운받을 수 있습니다.

 

 🎁 (데이터 예시) 서울시 청소년 수련시설 통계, 서울시 청소년인구 통계, 서울대공원 일일입장객수 정보, 서울시 가정폭력 발생현황 통계, 서울시 소년범죄 발생현황 통계, 서울시 강북구 지역아동센터 현황, 서울시 청소년수련관 강좌정보 데이터 등



 

 4) 국가통계포털(https://kosis.kr/)

 

 ✅ 통계청에서 운영 중인 공공데이터 사이트로, 국내통계(주제별, 기관별 등), 국제통계, 북한통계 등 다양한 통계 데이터를 보거나 다운받을 수 있습니다.

 

 🎁 (데이터 예시) 연도별 다문화청소년패널조사 데이터, 아동청소년인권실태조사 데이터, 청소년매체이용및유해환경실태조사 데이터, 청소년건강행태조사 데이터, 청소년 문해율 데이터 등

 

 

 

 5) 문화 빅데이터 플랫폼(https://www.bigdata-culture.kr/bigdata/user/main.do)

 

 ✅ 한국문화정보원이 운영하고 있는 공공데이터 사이트로, 현재 한국청소년활동진흥원이 해당 플랫폼의 센터로 구성되어 있습니다. 문화 빅데이터 포털에서 청소년 활동과 관련된 다양한 데이터를 만나볼 수 있어요!

 

 🎁 (데이터 예시) 청소년 고민 순위 정보, 청소년 이용공간 정보, 청소년 관심키워드 분석 데이터, 청소년 방과후 이용장소 데이터, 청소년 또래상담 데이터, 청소년 국제교류 프로그램 데이터, 청소년 해외 자원봉사 프로그램 데이터 등



 

 6) e-나라지표(https://www.index.go.kr/main.do)

 

 ✅ 국가정책 수립, 점검 및 성과측정 등을 목적으로 중앙행정기관이 선정하고 관리하는 주요 지표인 나라지표를 제공하는 웹기반의 통계정보시스템입니다. e-나라지표 사이트에서도 다양한 지표 데이터를 보고 다운받을 수 있답니다.

 

 🎁 (데이터 예시) 1388 청소년 전화 접수현황, 청소년 가출실태, 전국 청소년 상담 내용 및 대상현황, 청소년 유해매체 및 약물경험 실태, 청소년 현재 흡연율, 청소년 현재 음주율, 청소년 수련시설 설치현황, 청소년 방과후 아카데미 운영 현황, 청소년 인구 및 구성비 데이터 등




 7) AI Hub(https://www.aihub.or.kr/)

 

 ✅ AI Hub는 과학기술정보통신부와 한국지능정보사회진흥원이 운영하고 있는 사이트로, 지능정보산업인프라조성 사업으로 추진한 AI학습용 데이터와 국내외 기관과 기업에서 보유한 AI 학습용 데이터를 개방하고 있습니다.

 

 🎁 (데이터 예시) 수학분야 학습자 역량 측정 데이터, 영유아 교육 영상콘텐츠 방송 데이터 등

 

 

 

덧붙여, 청소년사업 종사자만을 위해 운영되고 있는 빅데이터 정보 페이지가 있는데요. 바로 우당탕 실험실이라고 하는 곳입니다. 혹시 들어보셨나요? 우당탕 실험실은 한국청소년활동진흥원이 보유하고 있는 청소년 데이터에 대한 정보제공은 물론, 다양한 청소년 데이터의 분석결과를 담은 분석 리포트도 수시로 발간하고 있답니다! 틈이 날 때 이따금씩 방문하신다면, 유익한 정보를 얻을 수 있을거에요!

 

 

 🔽우당탕 실험실(https://www.notion.so/0272657c75a24afc8b89f339c4d93ae7) 🔽

 




청소년 데이터를 수집할 수 있는 대표적인 공공데이터 사이트를 알아보았는데요. 이 밖에도 환경 빅데이터 플랫폼, 금융 빅데이터 플랫폼, 서울 빅데이터 캠퍼스 등 정말 많은 공공데이터 제공 사이트가 있으니, 청소년 데이터 이외에도 다양한 데이터를 만나보시기 바랍니다. 😉



 

그렇다면, 이렇게 공공과 민간에 개방되어 있는 청소년 데이터를 수집하는 방법 외에는 또 어떤 것들이 있을까요?

청소년 데이터를 수집하는 방법 두번째는 바로, 업무 중에 생산된 데이터를 활용하거나 새롭게 수집하는 것입니다.

 

업무 중에 데이터는 자연적으로 생산될 수도 있고, 사전에 수집계획을 세워 새롭게 생산해낼 수도 있습니다. 예를 들어볼까요? 한국청소년활동진흥원 A 사원은 진흥원이 주관하는 정책사업의 지역별 분포를 알고 싶다고 가정을 해보겠습니다. 그럼 정책사업의 세부 데이터(사업지역, 기간, 내용 등)들이 필요하겠죠? A 사원은 자신 또는 타 직원이 보유하고 있는 정책사업 데이터를 내부에서 수집하여, 정책사업의 지역별 분포를 분석해볼 수 있을 거에요.

 

 

 

세번째는, 웹크롤링을 통해 인터넷에서 청소년 데이터를 수집하는 방법입니다. 웹크롤링이란, 인터넷에 있는 웹 페이지를 방문해 자료를 수집하는 것입니다. 주로 특정 키워드에 대한 뉴스기사나 웹 문서들을 한번에 수집할 때 주로 쓰입니다. 웹크롤링은 파이썬, 자바와 같은 프로그래밍 언어를 통해 가능한데요. 크롤링 시 필요한 프로그래밍 코드의 경우에는 구글링을 통해서 쉽게 얻을 수 있답니다.

 

😢혹시 프로그래밍에 대한 어려움이 있으셔도 걱정하지 마세요. 요즘은 이러한 웹크롤링을 프로그래밍 언어 없이도 간편하게 수행하여 분석결과를 제공해주는 사이트들이 있답니다! 아래에서 설명드릴게요.

 

 

 

1) 빅카인즈(https://www.bigkinds.or.kr/)

 ✅ 위 그림은 빅카인즈를 통해 '청소년'이라는 키워드 주제의 뉴스기사를 크롤링하여 워드클라우드 형태로 시각화해본 결과인데요. 누구나 클릭 한번으로 1분만에 가능하답니다. 청소년과 관련된 뉴스기사를 크롤링해보고 싶으신 분은, 빅카인즈를 이용해보세요!

 

 

 

2) 썸트렌드(https://some.co.kr/)

 

 ✅ 위 그림은 썸트렌드라는 사이트에서 SNS 상 웹크롤링을 통해  '청소년'이라는 키워드 관련 데이터를 수집하고, 감정분석까지 시행해본 결과인데요. 긍정과 부정, 그리고 중립까지 색상으로 시각적인 표현을 하여, 한눈에 분석 결과를 더욱 잘 알 수 있어요.




3) 위고몬(https://www.wigomon.ai/)

 

 ✅ 위 그림은 위고몬 사이트에서 ‘청소년’에 대한 실시간 빅데이터를 통합 분석한 결과입니다. 위고몬은 신문, 방송, 통신 등 전통미디어와 인터넷 매체, SNS, 커뮤니티 등 뉴미디어의 빅데이터를 분석하여, 내가 입력한 키워드에 대한 정보를 제공해주는데요. 위고몬에서 키워드만 입력하면, 키워드의 버즈량 추이, 감성 분석, 채널 분석, 연관어 분석, 감성어 분석 등의 결과를 바로 알 수 있답니다.



 

👀오늘의 포스팅을 정리해보자면, 

 

청소년 데이터를 수집 방법에는 크게 공공포털 사이트에서 다운로드, 업무 중 생성된 데이터 활용, 그리고 웹크롤링이 있습니다. 데이터를 수집하기 전, 스스로 어떤 데이터가 필요한지 생각해보고 그에 따라 방법을 선택하여 데이터를 수집해나가면 좋겠어요. 특히 하나의 데이터 소스에 국한되지 않고, 다양한 곳에서 수집한 여러 데이터를 융합하고 분석한다면, 그 활용가치는 매우 커질 것이라 생각합니다.

 

지금도 데이터는 끊임없이 만들어지고 있습니다. 여러분이 업무를 하면서, 휴대전화를 사용하면서, SNS를 활용하면서 자신도 모르게 계속 데이터를 만들어내고 있을 거에요. 우리는 이따금씩 이러한 데이터가 낭비되지 않고 어떻게 쓰여야할지 한번쯤 고민해보는 시간을 가져보는 건 어떨까요? 그렇다면, 청소년 데이터를 통해 색다른 가치가 만들어지지 않을까요?

 

 

오늘, 여러분은 어떤 데이터를 만들고 있나요?

혹은, 어떤 데이터를 활용해보고 싶나요? 😊

 

 

 

 

Youth01Lap

청소년사업 디지털화 정보협동 청년모임 은 국내 청소년사업의 디지털화를 위해 국내외 디지털 청소년사업 사례, 실무도구, 관련 정책 및 연구자료 등을 조사,편집하고 콘텐츠로 개발하여 청소년사업 종사자분들과 나누고자 하는 취지로 결성된 모임입니다. 1기는 2020년 최초 구성됐으며, 현재(2021년)는 만 21세부터 39세까지의 다양한 전공과 직업을 가진 청년 8명이 온라인으로 모여 자발적으로 학습하고 토론하며 함께 하고 있습니다.

 

자몽

안녕하세요. 자몽입니다. 함께 청소년 디지털 전환에 관한 이야기를 나누며 성장해나가고 싶어요. 궁금한 점이나 함께 의견을 나누고 싶으신 분은 언제든지 댓글로 달아주세요. 감사합니다! 😉