KEI 북한환경동향
| 위드클라우드 | 토핑 모델링 기법 |
|---|---|
|
- 워드 클라우드는 단어 빈도수의 시각화를 위한 목적으로 사용 - 텍스트에서 가장 빈번하게 나타나는 단어를 더 크고 더 눈에 띄게 표시하여, 어떤 주제나 단어가 중요한지 빠르게 파악하게 함 |
- 텍스트에서 관련된 단어들을 찾는데 사용 - 텍스트 데이터에서 어떤 주제가 자주 다루어지고 있는지를 파악, 다양한 주제로 분류 가능 - 대규모 문서 집합의 상관관계를 통계적으로 분석 ※ 대표적으로 잠재 디리클레어 할당 알고리즘 LDA(Latent Dirichlet Allocation) 을 사용 |
중간 산출물
최종결과물 예시
|
중간 산출물
최종결과물 예시
|
![]() |
| 토픽 모델 결과 (2017~2022년) |
![]() |
| 검증을 위한 워드클라우드 |
![]() |
| 토픽 모델 결과 (2017년) |
![]() |
| 검증을 위한 워드클라우드 |
![]() |
| 토픽 모델 결과 (2018년) |
![]() |
| 검증을 위한 워드클라우드 |
![]() |
| 토픽 모델 결과 (2019년) |
![]() |
| 검증을 위한 워드클라우드 |
![]() |
| 토픽 모델 결과 (2020년) |
![]() |
| 검증을 위한 워드클라우드 |
![]() |
| 토픽 모델 결과 (2021년) |
![]() |
| 검증을 위한 워드클라우드 |
![]() |
| 토픽 모델 결과 (2022년) |
![]() |
| 검증을 위한 워드클라우드 |