이지순(통일연구원)
김정은은 권력을 승계한 후
세계적인 추세에 맞게 문명한 사회와
문화를 건설하겠다는 사회주의 문명국 건설을 내세웠다. 현시대를 지식경제시대로 정의하며 지식의 향상을 통해 경제발전을 도모하겠다
는 목표도 세웠다. 사회주의 문명국 건설은 김정은 체제의 국가발전 목표이며, 새로운 시대 전환을 모색하는 중심 담론이다. 사회문화 정 책은 2016년 제7차 당대회 전, 2017년 핵무력완성, 2018년 경제건설 총력전 선언을 중심으로 세 시기로 구분된다. 당대회 이전은 ‘새 시대 문명국가 건설기(2012~2015)’로 세계화와 문명화를 목표로 단기간에 성과를 낼 수 있는 분야에 정책을 집중하여 주민들이 시대변화를 긍정 적으로 체감하던 시기였다. 핵무력완성 시기는 ‘현상유지기(2016~2017)’로 새로운 정책을 제시하기보다 기존의 정책을 지속하며 핵개 발에 건설 동력이 집중되었다. 2018년 이후는 ‘문명국가 건설 고도화 기(2018~2020)’로서 핵개발에 집중되었던 과학기술이 경제발전 초 석으로 전환되던 시기였다.
사회문화 정책은 김정은 집권 초기에 제시한 5대 중점과제인 ‘교
육,
체육, 문학예술
, 보건, 도덕’을 일관성있게 추진하였다. 시기와 대내외 적 환경변화에 따라 사회문화 5대 과제 외에 중심 과제가 추가되기도 했다. 이하에서는 김정은 담화와 연설에 대한 텍스트마이닝 분석과 정 성적 분석을 통해 어떤 부문에서 정책의 일관성을 보이고, 어떤 정책에 서 부분적 변화를 보이는지 분석하고자 한다.가. 텍스트마이닝 분석 (1) 단순빈도 분석
2012년부터 2020년까지 사회문화 분야 문서는 15건이다. 문서 전 체에서 명사형 단어는 4,033개이다. 말뭉치 내 명사형 단어는 806개 이고, 한 문서 내 평균 명사형 단어 수는 268.87개이다. 가장
많은
문서가 발표된 해는 2016년으로 4건이다. 2016년에 제7차 당대회를 개최하면서 사회문화 분야 문서도 다른 해에 비해 많이 생성되었다.2016년을 제외한다면 해마다 1건 정도 발생했고, 2018년과 2019년에 는 2, 3개로 늘었지만 문서 길이는 짧아서 명사의 수도 적은 편이다.
<표 Ⅱ-23> 명사형 단어 수
연도 2012~2020 2012 2013 2014 2015 2016 2017 2018 2019 2020
문서 수 15 1 1 1 1 4 1 2 3 1
전체문서 내 명사형 단어 수
4,033 90 64 93 140 2,887 17 208 327 207 말뭉치 내
명사형 단어 수
806 78 50 65 101 611 14 136 176 135 한 문서 내
평균 명사형 단어 수
268.87 90.00 64.00 93.00 140.00 721.75 17.00 104.00 109 207.00 출처: 저자 작성.
<그림 Ⅱ-13>의 워드 클라우드는 빈도가 높은 단어를 부각하여 각
연도별 키워드를 직관적으로 보여준다. 2012년부터 2020년까지 사회 문화 분야에서 가장 많이 사용된 단어는 ‘교육’, ‘기술’, ‘과학기술’, ‘체
육’, ‘발전’, ‘문화’, ‘인민’, ‘수준’, ‘인재’, ‘세계’ 등이다. 워드 클라우드
를 통해 연도별로 고빈도 단어가 어떻게 변하는지살펴볼 수 있다.
<그림 Ⅱ-13> 워드 클라우드(2012~2020)
2012~2020 2012 2013
2014 2015 2016
2017 2018 2019
2020 출처: 저자 작성.
‘새 시대 문명국가 건설기(2012~2015)’의 중심
키워드는 ‘건설’,
‘문화’, ‘인민’, ‘체육’, ‘교육’이다. 수도 평양을 아름답게 꾸리는 사업 과 함께 도시미화와 체육문화시설 건설에 집중했던 현상은 2012년의
‘인민’, ‘문화’, ‘수준’, ‘건설’, ‘체육’, ‘생활’, ‘평양’으로 나타나고 있다.
2014년에 새로운 키워드로 부상한 ‘혁명’, ‘열풍’ 키워드는 2013년 12 월 장성택을 숙청한 “반당반혁명적종파” 사건이 생긴 이후 내부결속 을 다졌던 정황과 관련되어 있다. 2015년에는 건설을 담당하는 ‘일군’
이 가장 두드러진 가운데 ‘애국’, ‘혁명’, ‘혁명정신’, ‘백두’, ‘정신’ 등 사상적 요소를 강화하는 단어가 많이 사용된 것이 특징이며, ‘민족’이
마련과
관련된 키워드로 파악된다.
‘현상유지기(2016~2017)’에는 제7차 당대회가 문명국 건설의 과 제로 제시한 체육, 교육, 문학예술, 보건 등이 고르게 상위빈도에 분 포되어 있다.
특히 과학기술 키워드의 약진이 눈에 띄며 ‘세계’, ‘발
전’, ‘기술’, ‘첨단’ 등이 새롭게 편입했다. 핵개발과 군사적 긴장이 고 조된 2017년에는 사회문화 분야의 어휘 종류와 빈도가 대폭 줄었다.워드 클라우드의 여백이 이를 반영한다.
‘문명국가 건설 고도화기(2018~2020)’는 ‘과학’, ‘교육’, ‘인재’, ‘발 전’을 중심으로 ‘위원장’, ‘조선로동당’이 강조되어 있다. 과학기술과 인재양성은 자립경제를 이루기 위한
밑바탕으로 인식되었다. 특히
2018년 ‘위원장’과 ‘조선로동당’ 빈도 증가는 남북 및 북미 정상회담 개최가 김정은의 업적과 위상 강화로 과시되었음을 보여준다. 그러나 대북제재가 지속되자 제7차 당대회에서 제시한 “자강력만이 살길이 고 승리의 길”176)이라는 관점이 과학기술을 통한 경제발전으로 옮겨 가면서 과학기술중시를 ‘국풍’으로확립하는 분위기가 되었다.
<그림 Ⅱ-14> 단순빈도
사회문화
Samples 140
120 100 80 60 40 20
과학기술 교육 체육 발전 기술 과학 문화 당 인민 혁명 인재 세꼐 국가 사회주의 수준 사상 경제 연구 의료 첨단 대학 보건 생활 건설 근로자 봉사 강화 문명 역할 예술
Counts
출처: 저자 작성.
176) “조선로동당 제7차대회에서 한 당중앙위원회 사업총화보고,” 뺷로동신문뺸, 2016.5.8.
사회문화 분야의 단순빈도 분석은 전체문서(2012~2020)와 연도별 문서에서 단어사용 빈도를 분석한 것이다. <그림 Ⅱ-14>는 전체 문건 에서 많이 사용된 ‘당’, ‘인민’, ‘혁명’을 포함하여 사회문화 분야에서
많이 사용한 단어를 보여준다. ‘과학기술’, ‘교육’, ‘체육’이 가장 많이
언급되었다. <표 Ⅱ-24>는 전체 문서의 ‘당’, ‘인민’, ‘혁명’을 제외한 단순빈도 분석 결과이다. 고빈도 단어는 사회문화 분야가 중시한 정책
을 나타낸다. 가장 많이 사용된 단어는 ‘과학기술’이다. 정권 초기에 발전전략으로 제시한 지식경제시대는 과학과 교육 정책으로 나타났 다. 또한 ‘과학기술’과 더불어 ‘과학’, ‘기술’이 별개의 단어로 언급된 것을 포함하면 과학기술이 정책의 중심에있다는 것을 알 수 있다.
<표 Ⅱ-24> 단순빈도 (2012~2020)
키워드 단순빈도수 키워드 단순빈도수
과학기술 135 과학 61
교육 98 문화 60
체육 77 인재 50
발전 70 세계 43
기술 64 국가 42
출처: 저자 작성.
전체시기의 단순빈도를 보면 과학기술 다음으로 ‘교육’, ‘체육’,
‘발전’, ‘문화’, ‘인재’, ‘세계’, ‘국가’ 순으로 많이 언급되었다. 과학기
술의 발전을 위해 교육을 중시하고, 인재를 육성하여 세계와 경쟁할
기술을 발전시키겠다는 기획이 선명하게드러나 있다.
아래의 <표 Ⅱ-25>는 연도별 최상위 5개 단어 리스트이다. 김정은
정권이 각 연도별로 어떤 정책에 초점을 맞추었는지 보여준다. 다만, 사회문화 분야 분석에 사용된 총 문서 개수가소량이고, 2016년을
경우 5번째에 함께 수록하여 변화의 추이를
살펴보도록 한다.
‘새 시대 문명국가 건설기(2012~2015)’에는 시기별 분절이 확인된 다. 우선 2012~2014년은 ‘문화’, ‘체육’, ‘교육’, ‘건설’이 상위빈도에 고루 분포했다. 2014년까지 평양 중심으로 실시된 도시재건 사업, 의 무교
육 제도를 개편
한 교육개혁과 체육중시 열풍 등이 반영되어 있다.2014년에는 ‘창조’, ‘예술’, ‘문학예술’이 상위빈도에
올랐는데, 이는
김정은이 ‘모란봉악단의 일본새’와 ‘모란봉악단의 창조기풍’을 모범적 인 사례로 제시하고 이를 따라 배울 것을 요구한 것과 관련되어 있다.
한편, 2015년에는 ‘백두’, ‘혁명’, ‘애국’, ‘정신’을 강조하여 이전과 는 이질적인 분위기를 보여주는데, 이는 2015년 신년사에서 ‘정치 사상강국’을 핵심 정책의 하나로 내세운 것과 관련되어 있다. 이 시 기에 북한은 자본주의 문화 단속을 위해 형법을 개정하여 외래문화
‘침투’에 대응했으며, 외부문화와 통신 접촉을 강하게 단속하며 내 부를 통제했다.
<표 Ⅱ-25> 단순빈도 최상위 5개 단어 리스트
2012 2013 2014
키워드 단순빈도수 키워드 단순빈도수 키워드 단순빈도수
문화 3 문화 4 체육 9
체육 3 건설 3 교육 6
건설 3 인민 3 인민 3
교육 2 문명 3 혁명 3
수준, 생활, 평양, 도시 2
사회주의 문명국, 도덕, 누리,
생활
2
강국건설,열풍, 과학기술, 구상, 의료, 개선, 예술, 창작, 세계, 문학예술
2
2015 2016 2017
키워드 단순빈도수 키워드 단순빈도수 키워드 단순빈도수
일군 7 과학기술 116 교육 3
백두 5 교육 57 과학 2
혁명 4 기술 52 체육 1
애국 4 체육 50 문학예술 1
정신 4 발전 49
보건, 문화, 혁명, 앙양,
문명, 강국건설, 시설, 환경,
일신, 바람 1
2018 2019 2020
키워드 단순빈도수 키워드 단순빈도수 키워드 단순빈도수
과학 8 발전 13 교육 11
위원장 7 교육 12 조선로동당 9
조선로동당 6 인재 10 위원장 9
교육 5 사회주의 9 과학 8
혁명 5 문화 9 절약 7
출처: 저자 작성.
‘현상유지기(2016~2017)’는 ‘과학’, ‘과학기술’이 최고빈도를 보여주
던 시기였다. 제7차 당대회에서 ‘전민과학기술인재화’가 제시된 이래
‘과학기술’ 키워드가 상위빈도에 분포되었다. 빈도수는 적지만 당대회 에서 문명강국 건설에 필요하다고 호명된 ‘교육’, ‘과학’, ‘체육’, ‘문학
예술’ 등이 고루 언 급된 것도 이 시기의 특징이다. 특히 ‘앙양’, ‘일신’,
‘바람’과
같은 단어는 정책 시행과 유지에 주력한 것을 반영한다.
‘문명국가 건설 고도화기(2018~2020)’는 경제 재건을 목표로 경제 건설 총력전을 제시한 때로서 경제적 자강을 위해 ‘과학’이 중시되고, 과
학 인재를 양
성하는 ‘교육’이 다시 강조되는 양상이 키워드에서 나타식 사회주의’가 높은 빈도로 언급되었다.
(2) TF-IDF 분석
단순빈도는 간단하고 편리하게 키워드를 도출하는 장점이 있지만, 해당 키워드의 특이성을 드러내지 못하는 단점이 있다. 출현 빈도가
낮아도 특정 문서에서 중요한 의미를 가질 수 있는 키워드를 추출한
것이 TF-IDF이다. 사회문화 분야는 대상 문서의 수가많지 않아
IDF 계산이 가능한 때는 2016, 2018, 2019년 정도에 불과하다. 그러 나 키워드 출현 변화는 김정은 정권이 중점을 둔 사회문화 정책을 살펴보는 데 시사점을 준다.
<표 Ⅱ-26> TF-IDF 키워드 리스트
2012~2020(전체) 2016 2018 2019
키워드 TF-IDF
점수 키워드 TF-IDF
점수 키워드 TF-IDF
점수 키워드 TF-IDF 점수 건설 0.2203 강성국가
건설 0.2739 과학기술 0.2645 기술 0.2689 문화 0.1913 청년 0.2739 사회주의 0.2645 기풍 0.2016 도시 0.1877 체육 0.1748 의료 0.1984 의료 0.2016 평양 0.1718 조국 0.1369 문화 0.1984 사회주의 0.2016
체육 0.1676 자강,
믿음 0.1369 경제, 창조,
체육, 생산 0.1984 문화 0.2016 주: 2012~2015, 2017, 2020년은 문서 개수가 1이므로 IDF 계산 불가.
출처: 저자 작성.