본문 바로가기

_

청소년 데이터는 어떻게 수집할 수 있을까?

 

 

안녕하세요. 자몽입니다 😊

 

요즘 언론매체나 연구자료를 접하다보면 금융, 의료, 교육 등 사회 전 분야에서 데이터에 대한 관심이 깊어지고 있음을 새삼 느끼곤 합니다. 청소년 분야에서도 마찬가지인데요.

 

그 일례로 2021년 2월, 안동경찰서에서는 경찰의 각종 정보를 지리적으로 분석한 시스템인 지리적 프로파일링 시스템(GeoPros)을 통해 최근 1년간 관내 학교폭력과 청소년 비행 신고 다수지역 데이터를 분석하여, 청소년 비행우려 지역(18개소)으로 선정했다고 해요. 이를 바탕으로 위기청소년을 적극적으로 발굴하여 청소년 보호 활동에 힘쓰고 있다고 합니다.



이렇게 데이터를 실제로 활용하기 위해서는 먼저, 활용할 데이터를 생산하거나 수집해야 해요.

그렇다면 우리의 관심 분야인 청소년 데이터는 어디에서 수집할 수 있을까요?

 

첫번째는, 공공포털에서 청소년 관련 데이터를 다운로드 받는 방법입니다. 아래에서 데이터를 다운받을 수 있는 공공포털에 대해서 설명드리겠습니다.

 

 

 1) 공공데이터포털(https://www.data.go.kr/)

 

 ✅ 행정안전부와 한국지능정보사회진흥원(NIA)가 운영하고 있는 공공데이터 사이트로, 각 부처나 공공기관에 분포되어 있는 공공데이터를 한데 모아 제공하고 있습니다. 데이터 제공기관별, 주제별로도 데이터를 검색하고 다운받을 수 있습니다.

 

 🎁 (데이터 예시) 청소년의 현재 음주율, 청소년백서, 대구광역시 청소년단체, 울산광역시 청소년쉼터, 서울특별시 청소년인구 통계, 경기도 김포시 청소년시설 데이터 등

 

 

 

 2) 통합 데이터 지도(https://www.bigdata-map.kr/)

 

 ✅ 통합 데이터 지도는 공공과 민간에서 제공하는 데이터를 쉽게 검색하고 활용할 수 있도록 지원합니다. 데이터 지도는 16대 빅데이터 플랫폼과 AI Hub, 데이터스토어, Kotra, 한국관광공사, 쿠콘 등 데이터 파트너들과 함께하는데요. 분산되어 있는 청소년 데이터를 손쉽게 찾을 수 있답니다!

 

 🎁 (데이터 예시) 청소년 동아리 운영 현황, 청소년 고민 순위 정보, 청소년 이용 공간 정보, 청소년 지도인력 정보, 청소년 유해매체정보, 청소년 캠프 운영 정보, 청소년 문화 성향 정보, 청소년 정책 참여 현황, 청소년 또래상담 데이터 등



 

 3) 서울시열린데이터광장(https://data.seoul.go.kr/)

 

 ✅ 서울특별시청에서 운영 중인 공공데이터 사이트로, 서울시 전반의 데이터를 다운받을 수 있습니다.

 

 🎁 (데이터 예시) 서울시 청소년 수련시설 통계, 서울시 청소년인구 통계, 서울대공원 일일입장객수 정보, 서울시 가정폭력 발생현황 통계, 서울시 소년범죄 발생현황 통계, 서울시 강북구 지역아동센터 현황, 서울시 청소년수련관 강좌정보 데이터 등



 

 4) 국가통계포털(https://kosis.kr/)

 

 ✅ 통계청에서 운영 중인 공공데이터 사이트로, 국내통계(주제별, 기관별 등), 국제통계, 북한통계 등 다양한 통계 데이터를 보거나 다운받을 수 있습니다.

 

 🎁 (데이터 예시) 연도별 다문화청소년패널조사 데이터, 아동청소년인권실태조사 데이터, 청소년매체이용및유해환경실태조사 데이터, 청소년건강행태조사 데이터, 청소년 문해율 데이터 등

 

 

 

 5) 문화 빅데이터 플랫폼(https://www.bigdata-culture.kr/bigdata/user/main.do)

 

 ✅ 한국문화정보원이 운영하고 있는 공공데이터 사이트로, 현재 한국청소년활동진흥원이 해당 플랫폼의 센터로 구성되어 있습니다. 문화 빅데이터 포털에서 청소년 활동과 관련된 다양한 데이터를 만나볼 수 있어요!

 

 🎁 (데이터 예시) 청소년 고민 순위 정보, 청소년 이용공간 정보, 청소년 관심키워드 분석 데이터, 청소년 방과후 이용장소 데이터, 청소년 또래상담 데이터, 청소년 국제교류 프로그램 데이터, 청소년 해외 자원봉사 프로그램 데이터 등



 

 6) e-나라지표(https://www.index.go.kr/main.do)

 

 ✅ 국가정책 수립, 점검 및 성과측정 등을 목적으로 중앙행정기관이 선정하고 관리하는 주요 지표인 나라지표를 제공하는 웹기반의 통계정보시스템입니다. e-나라지표 사이트에서도 다양한 지표 데이터를 보고 다운받을 수 있답니다.

 

 🎁 (데이터 예시) 1388 청소년 전화 접수현황, 청소년 가출실태, 전국 청소년 상담 내용 및 대상현황, 청소년 유해매체 및 약물경험 실태, 청소년 현재 흡연율, 청소년 현재 음주율, 청소년 수련시설 설치현황, 청소년 방과후 아카데미 운영 현황, 청소년 인구 및 구성비 데이터 등




 7) AI Hub(https://www.aihub.or.kr/)

 

 ✅ AI Hub는 과학기술정보통신부와 한국지능정보사회진흥원이 운영하고 있는 사이트로, 지능정보산업인프라조성 사업으로 추진한 AI학습용 데이터와 국내외 기관과 기업에서 보유한 AI 학습용 데이터를 개방하고 있습니다.

 

 🎁 (데이터 예시) 수학분야 학습자 역량 측정 데이터, 영유아 교육 영상콘텐츠 방송 데이터 등

 

 

 

덧붙여, 청소년사업 종사자만을 위해 운영되고 있는 빅데이터 정보 페이지가 있는데요. 바로 우당탕 실험실이라고 하는 곳입니다. 혹시 들어보셨나요? 우당탕 실험실은 한국청소년활동진흥원이 보유하고 있는 청소년 데이터에 대한 정보제공은 물론, 다양한 청소년 데이터의 분석결과를 담은 분석 리포트도 수시로 발간하고 있답니다! 틈이 날 때 이따금씩 방문하신다면, 유익한 정보를 얻을 수 있을거에요!

 

 

 🔽우당탕 실험실(https://www.notion.so/0272657c75a24afc8b89f339c4d93ae7) 🔽

 




청소년 데이터를 수집할 수 있는 대표적인 공공데이터 사이트를 알아보았는데요. 이 밖에도 환경 빅데이터 플랫폼, 금융 빅데이터 플랫폼, 서울 빅데이터 캠퍼스 등 정말 많은 공공데이터 제공 사이트가 있으니, 청소년 데이터 이외에도 다양한 데이터를 만나보시기 바랍니다. 😉



 

그렇다면, 이렇게 공공과 민간에 개방되어 있는 청소년 데이터를 수집하는 방법 외에는 또 어떤 것들이 있을까요?

청소년 데이터를 수집하는 방법 두번째는 바로, 업무 중에 생산된 데이터를 활용하거나 새롭게 수집하는 것입니다.

 

업무 중에 데이터는 자연적으로 생산될 수도 있고, 사전에 수집계획을 세워 새롭게 생산해낼 수도 있습니다. 예를 들어볼까요? 한국청소년활동진흥원 A 사원은 진흥원이 주관하는 정책사업의 지역별 분포를 알고 싶다고 가정을 해보겠습니다. 그럼 정책사업의 세부 데이터(사업지역, 기간, 내용 등)들이 필요하겠죠? A 사원은 자신 또는 타 직원이 보유하고 있는 정책사업 데이터를 내부에서 수집하여, 정책사업의 지역별 분포를 분석해볼 수 있을 거에요.

 

 

 

세번째는, 웹크롤링을 통해 인터넷에서 청소년 데이터를 수집하는 방법입니다. 웹크롤링이란, 인터넷에 있는 웹 페이지를 방문해 자료를 수집하는 것입니다. 주로 특정 키워드에 대한 뉴스기사나 웹 문서들을 한번에 수집할 때 주로 쓰입니다. 웹크롤링은 파이썬, 자바와 같은 프로그래밍 언어를 통해 가능한데요. 크롤링 시 필요한 프로그래밍 코드의 경우에는 구글링을 통해서 쉽게 얻을 수 있답니다.

 

😢혹시 프로그래밍에 대한 어려움이 있으셔도 걱정하지 마세요. 요즘은 이러한 웹크롤링을 프로그래밍 언어 없이도 간편하게 수행하여 분석결과를 제공해주는 사이트들이 있답니다! 아래에서 설명드릴게요.

 

 

 

1) 빅카인즈(https://www.bigkinds.or.kr/)

 ✅ 위 그림은 빅카인즈를 통해 '청소년'이라는 키워드 주제의 뉴스기사를 크롤링하여 워드클라우드 형태로 시각화해본 결과인데요. 누구나 클릭 한번으로 1분만에 가능하답니다. 청소년과 관련된 뉴스기사를 크롤링해보고 싶으신 분은, 빅카인즈를 이용해보세요!

 

 

 

2) 썸트렌드(https://some.co.kr/)

 

 ✅ 위 그림은 썸트렌드라는 사이트에서 SNS 상 웹크롤링을 통해  '청소년'이라는 키워드 관련 데이터를 수집하고, 감정분석까지 시행해본 결과인데요. 긍정과 부정, 그리고 중립까지 색상으로 시각적인 표현을 하여, 한눈에 분석 결과를 더욱 잘 알 수 있어요.




3) 위고몬(https://www.wigomon.ai/)

 

 ✅ 위 그림은 위고몬 사이트에서 ‘청소년’에 대한 실시간 빅데이터를 통합 분석한 결과입니다. 위고몬은 신문, 방송, 통신 등 전통미디어와 인터넷 매체, SNS, 커뮤니티 등 뉴미디어의 빅데이터를 분석하여, 내가 입력한 키워드에 대한 정보를 제공해주는데요. 위고몬에서 키워드만 입력하면, 키워드의 버즈량 추이, 감성 분석, 채널 분석, 연관어 분석, 감성어 분석 등의 결과를 바로 알 수 있답니다.



 

👀오늘의 포스팅을 정리해보자면, 

 

청소년 데이터를 수집 방법에는 크게 공공포털 사이트에서 다운로드, 업무 중 생성된 데이터 활용, 그리고 웹크롤링이 있습니다. 데이터를 수집하기 전, 스스로 어떤 데이터가 필요한지 생각해보고 그에 따라 방법을 선택하여 데이터를 수집해나가면 좋겠어요. 특히 하나의 데이터 소스에 국한되지 않고, 다양한 곳에서 수집한 여러 데이터를 융합하고 분석한다면, 그 활용가치는 매우 커질 것이라 생각합니다.

 

지금도 데이터는 끊임없이 만들어지고 있습니다. 여러분이 업무를 하면서, 휴대전화를 사용하면서, SNS를 활용하면서 자신도 모르게 계속 데이터를 만들어내고 있을 거에요. 우리는 이따금씩 이러한 데이터가 낭비되지 않고 어떻게 쓰여야할지 한번쯤 고민해보는 시간을 가져보는 건 어떨까요? 그렇다면, 청소년 데이터를 통해 색다른 가치가 만들어지지 않을까요?

 

 

오늘, 여러분은 어떤 데이터를 만들고 있나요?

혹은, 어떤 데이터를 활용해보고 싶나요? 😊

 

 

 

 

Youth01Lap

청소년사업 디지털화 정보협동 청년모임 은 국내 청소년사업의 디지털화를 위해 국내외 디지털 청소년사업 사례, 실무도구, 관련 정책 및 연구자료 등을 조사,편집하고 콘텐츠로 개발하여 청소년사업 종사자분들과 나누고자 하는 취지로 결성된 모임입니다. 1기는 2020년 최초 구성됐으며, 현재(2021년)는 만 21세부터 39세까지의 다양한 전공과 직업을 가진 청년 8명이 온라인으로 모여 자발적으로 학습하고 토론하며 함께 하고 있습니다.

 

자몽

안녕하세요. 자몽입니다. 함께 청소년 디지털 전환에 관한 이야기를 나누며 성장해나가고 싶어요. 궁금한 점이나 함께 의견을 나누고 싶으신 분은 언제든지 댓글로 달아주세요. 감사합니다! 😉



  • 너부리 2021.07.27 15:46

    항상 데이터를 어디서 구해야 하는 고민을 했었는데, 유용한 정보 감사합니다.
    그리고 웹크롤링은 대단한 기술이 있어야 한다는 생각에 시도조차 못해 봤는데 위에 사이트에서 시도해 보면 좋을 것 같습니다.
    이제는 굳이 전문업체를 통하지 않아도 기초적인 데이터 작업을 혼자서도 할 수 있지 않을까하는 용기가 생기네요.
    용기를 주셔서 감사합니다.

    • Youth01Lap 자몽_ 2021.07.28 09:56 신고

      네! 이제는 꼭 프로그래밍 기술을 깊이 익히지 않아도, 개방된 분석 전문 사이트를 통해서 손쉽게 데이터를 분석하고 시각화할 수 있더라구요! 꼭 데이터 분석전문가가 아니더라도, 이제는 누구나 데이터를 만져볼 수 있다는 것에 정말 행복합니다. 감사합니다 ! 😊

  • Youth01Lap #저스틴 2021.07.27 16:37 신고

    제가 아직도 모르는 곳들이 이렇게나 많았군요. 앞으로 매우 유용하게 활용할 수 있을 것 같습니다.
    한편으로는 청소년 분야에서 직접 생산되어 관리되는 데이터의 필요성에 대해 다시 한 번 필요성을 절감하기도 했습니다. 개인적으로는 고민이 많은 지점이기도 하고요. 데이터 수집에 대한 안내 고맙습니다. 😃

    • Youth01Lap 자몽_ 2021.07.28 13:10 신고

      저 또한 데이터의 필요성에 대해 동감해요. 청소년 분야의 데이터 활용 활성화가 이루어지기 위해서는, 가장 먼저 많은 의미 있는 데이터들이 축적되어 개방되는 것이 아닐까 생각합니다. 많은 분들이 위의 사이트들을 유용하게 사용하신다면, 더없이 기쁠 것 같아요! ☺

  • 수지 2021.07.27 18:02

    관련 데이터 다운로드까지는 어떻게든 하는데, 활용/분석으로 넘어가는 과정이 저에게는 가장 어려운 것 같아요!
    그래서 수집 전에 목적을 명확히 하는 게 중요하겠죠:) 오늘도 더 공부하고 배울 것들이 많다는 것을 느낍니다ㅎㅎ
    웹크롤링 사이트는 바로 접속해서 검색하고 재밌고 신기하네요. 앞으로 즐겨찾기에 추가해두고 자주 활용해보겠습니다!

    • Youth01Lap 자몽_ 2021.07.28 13:21 신고

      ㅎㅎ 자주 활용해주시겠다니, 정말 기쁘네요. 처음에는 데이터 분석부터 활용까지의 과정이 익숙하진 않지만, 차근차근 익히다보면 어느새 업무에 유용하게 사용하고 있을 것이라 믿습니다. 😊 감사합니다~

  • juniro 2021.08.02 14:19 신고

    다양한 통계 데이터를 확보하는 방법을 알려주셔서 감사해요!! 경찰의 각종 정보를 지리적으로 분석한 시스템인 지리적 프로파일링 시스템(GeoPros) 흥미롭네요. 혹시 이런 공공 데이터를 통해 진흥원이나 청소년수련시설에서 적용한 사례같은것이 있을까요?!

    • Youth01Lap 자몽_ 2021.08.06 13:13 신고

      https://youthdata.kywa.or.kr/ 이곳은 유스데이터 플랫폼이라는 곳인데요. 현재 청소년활동진흥원이 시범적으로 운영하고 있는 사이트입니다. 진흥원이 웹크롤링을 통해 모은 청소년 데이터를 서비스화하여 제공하고 있어요. 청소년의 고민과 관심 데이터를 시각화하거나, 또 청소년들이 이용할 수 있는 '청소년 공간' 정보를 한데 모아 제공하고 있답니다! 시간나실 때 둘러보시면 좋을 듯 합니다 :)!

  • 러너스하이 2021.08.03 11:14

    데이터 수집뿐 아니라 분석툴도 제공하는 사이트까지 유용한 정보를 소개해주셔서 감사해요~ 몇몇가지는 알고 있었던 건데 새로운 사이트, 특히 웹크롤링쪽 사이트는 빅카인즈말고는 다 처음 접해봐요. 청소년뿐 아니라 특정 데이터가 필요할 때 잊지 않고 활용해볼게요! 👍

    • Youth01Lap 자몽_ 2021.08.06 13:15 신고

      감사합니다, 러너스하이님! 말씀하신대로 청소년 데이터 뿐 아니라, 문화, 생활, 안전 등 원하는 다양한 데이터를 찾아볼 수 있으니, 유용하게 사용해주시면 좋을 것 같아요!!

  • 채소_ 2021.08.09 13:38 신고

    데이터를 찾아볼 수 있는 곳, 데이터 분석&시각화를 경험해볼 수 있는 곳까지. 다양한 서비스를 소개해주심을 매우매우 감사합니다. 특히 빅카인즈 등은 데이터에 대한 친숙도를 높여줄 수 있어서..많은 분들이 해보면 좋을 것 같아요!
    청소년 데이터와 관련해서는 앞으로.. 여러 사이트를 뒤지지 않더라도, 하나의 통합된 플랫폼이 있으면 좋겠다는 생각이 듭니다.
    소중한 정보들이 가득 담긴 글. 잘 보고 갑니다. :D

    • Youth01Lap 자몽_ 2021.08.11 21:53 신고

      미흡한 글이지만 잘 읽어주셔서 너무 감사드려요, 채소님 :) ㅎㅎ 특히 한국청소년활동진흥원에서는 청소년 데이터 이야기가 한데 모인 유스데이터 통합플랫폼을 올해 말, 오픈할 예정입니다. 그때, 꼭 찾아주시면 좋을 것 같아요!

  • _레오_ 2021.08.12 23:25 신고

    디지털화 되어가는 사회 속에서 데이터에 대한 궁금증과 더불어 분석하고 시각화하는 것에 대한 갈증이 있었는데 자몽님의 글을 통해 해갈하고 있음을 느꼈답니다. 좋은 글 감사드리며 위에 나와있는 다양한 설명 자료를 체득하여 현장에서 사용해봐야 할 것 같네요. 데이터와 친해지기 위해 노력해보겠습니다! :D

    • Youth01Lap 자몽_ 2021.08.23 13:48 신고

      제 글이 조금이나마 데이터와 친해지기 위한 갈증해소에 도움이 되었다면 너무나 기쁘네요! 데이터를 활용하고 현장에 적용시켜나간다면 분명 또다른 색다른 가치들이 생겨날 것이라 굳게 믿습니다! 감사합니다 :)