본문으로 바로가기 주메뉴 바로가기
자료실-메타정보

KEI 북한환경동향


▶ 북한 환경동향 키워드 분석 개요
- KEI에서 발간하는 북한환경동향 보고서는 한국과 북한의 신문기사 중에 북한환경에 관련된 가용한 기사를 정리한 것으로 북한 연구자에게 원시자료로서 의미를 갖는다. 하지만 일일이 기사를 다 읽지 않고서는 전체적인 이슈의 변화를 찾기가 어렵다. 따라서 워드클라우드 분석 및 토픽모델분석을 통해서 연도별 이슈를 추출하고 많이 언급된 단어를 추출하여 이미지화하는 방식의 텍스트 분석을 실시하고자 하였다,


▶ 워드클라우드와 토픽 모델링 방법 결과 비교

위드클라우드 토핑 모델링 기법
- 워드 클라우드는 단어 빈도수의 시각화를 위한 목적으로 사용
- 텍스트에서 가장 빈번하게 나타나는 단어를 더 크고 더 눈에 띄게 표시하여,
   어떤 주제나 단어가 중요한지 빠르게 파악하게 함
- 텍스트에서 관련된 단어들을 찾는데 사용
- 텍스트 데이터에서 어떤 주제가 자주 다루어지고 있는지를 파악, 다양한 주제로
   분류 가능
- 대규모 문서 집합의 상관관계를 통계적으로 분석
※ 대표적으로 잠재 디리클레어 할당 알고리즘 LDA(Latent Dirichlet Allocation)
      을 사용
중간 산출물


최종결과물 예시
중간 산출물


최종결과물 예시



▶ 2017~2022년 6개년 전체 KEI북한환경동향 키워드 분석

토픽 모델 결과 (2017~2022년)
검증을 위한 워드클라우드
▶ 2017~2019년 KEI 북한환경동향 키워드 분석



▶ 2017년 키워드 분석



토픽 모델 결과 (2017년)
검증을 위한 워드클라우드




▶ 2018년 키워드 분석



토픽 모델 결과 (2018년)
검증을 위한 워드클라우드




▶ 2019년 키워드 분석



토픽 모델 결과 (2019년)
검증을 위한 워드클라우드
▶ 2020년~2022년 KEI 북한환경동향 키워드 분석



▶ 2020년 키워드 분석



토픽 모델 결과 (2020년)
검증을 위한 워드클라우드




▶ 2021년 키워드 분석



토픽 모델 결과 (2021년)
검증을 위한 워드클라우드




▶ 2022년 키워드 분석



토픽 모델 결과 (2022년)
검증을 위한 워드클라우드
원본 출처:  추장민, 정성운(2017), 「KEI 북한환경동향 2017년」, 한국환경연구원
이현우, 정성운, 정행운(2018), 「KEI 북한환경동향 2018년」, 한국환경연구원
김호석(2019), 「KEI 북한환경동향 2019년」, 한국환경연구원
강택구(2020), 「KEI 북한환경동향 2020년」, 한국환경연구원
강택구, 이준호, 이경민, 김진환(2021), 「KEI 북한환경동향 2021년」, 한국환경연구원
강택구, 김진환, 이영표, 이준호(2022), 「KEI 북한환경동향 2022년」, 한국환경연구원
  • 30147 세종특별자치시 시청대로 370 세종국책연구단지 B동(과학ㆍ인프라동) 한국환경연구원 8층-11층
  • Tel. 044-415-7777 Fax. 044-415-7799 E-mail. ceink@kei.re.kr
  • COPYRIGHT © KEI All rights reserved.