• Tidak ada hasil yang ditemukan

일반적으로 교과서를 구성하는 보편적인 요소는 문자 언어이므로, 교과 서의 내용 타당성이나 학습 효율성을 결정하는 것은 문자로 기술된 부분이 라고 할 수 있다(이성영, 2011). 따라서 본 연구에서는 교과서의 문자로 기술된 모든 텍스트를 분석의 대상으로 정하고, 이에 대한 내용 분석과 개 념 관계망 분석을 수행하였다.

개념 관계망을 이용한 내용 분석 연구의 과정은 먼저 텍스트 마이닝을 통해 분석 대상에 포함되어 있는 자연어 형태의 텍스트를 수집하고, 다음 으로 수집된 텍스트를 컴퓨터가 기계적으로 분석할 수 있도록 데이터를 전 처리(pre-processing) 하는 과정을 거치게 된다. 그리고 전처리 과정을 통해 추출된 키워드들 중에서 개념 관계망에 포함될 노드(node)인 개념들 을 선정하고, 그 개념들 사이의 관계(edge)를 네트워크(network, 관계 망)로 생성하게 된다.

본 연구에서는 교과서 내용을 개념 관계망으로 생성하기 위하여 전체 텍스트로부터 형태소 분석을 통해 모든 키워드를 추출하였고, 추출된 키워 드들의 빈도와 생물학에서의 의미를 고려하여 연구자가 개념을 1차적으로 선정하였다. 이때 연구자의 주관적 판단에 의한 영향을 최소화하고 교과서 의 내용이 최대한 반영될 수 있도록 1차 선정 개념에는 가능한 많은 개념 이 포함되도록 하였다. 그리고 하나의 명제(문장)를 경계로 하여 분석 단 위에서 동시 출현한 개념들을 연결하여 개념 관계망을 생성하고 해석하였

다(Danowski, 1993; Doerfel & Barnett, 1999; Leydesdorff &

Welbers, 2011).

이러한 과정을 통해 현행 과학과 교육과정의 생물 내용을 한 눈에 보여 줄 생물학 개념의 개념 관계망(semantic network)을 생성하였고, 생성 된 주요 생명과학 개념 관계망에 대한 네트워크 분석을 통해 교육과정과 교과서의 내용 구성 및 체계에 대한 시사점을 얻고자 하였다. 본 연구의 절차는 다음과 같고, <그림 Ⅲ-1>과 같이 요약될 수 있다.

1단계는 데이터베이스 구축의 단계이다. 이 단계에서는 분석대상 교과 서의 생명 영역 관련 단원의 내용을 코퍼스 형태의 데이터로 구축하게 된 다. 이를 위해 2009 개정 교육과정 따라 출판된 초·중·고등학교 과학 교 과서의 생명 영역 관련 단원과 고등학교 생명과학Ⅰ·Ⅱ 교과서에서 문자로 기술된 내용들은 모두 추출하여 코퍼스 자료로 구축하였다. 이 코퍼스에는 추출된 명제(문장)의 원문과 이 후 분석 과정에서 중의적으로 해석될 수 있는 문장의 정제 결과 등이 포함되며, 데이터베이스에는 이 후 분석 단계 에서 생성되는 형태소 분석 및 키워드 추출 결과, 개념의 빈도와 개념 간 관계 분석의 결과 등이 저장될 수 있도록 하였다.

<그림 Ⅲ-1> 연구의 절차

2단계는 데이터 전처리의 단계로, 교과서의 내용에 대한 개념 관계망 분석을 위한 기초 작업이라 할 수 있다. 교과서에서 추출된 생명과학 교육 과정의 내용을 문장 단위로 나누고, 다시 각 문장에서 생물학 지식을 구성 하는개념을 추출하기 위하여 형태소 분석을 통해 키워드를 추출하였다. 다 음으로 추출된 키워드들을 선별하여 생물학 관련 개념을 선정하였고, 내용 분석을 위하여 그 빈도와 고유도, 개념들 사이의 관계의 강도(weight)와 근접도(proximity)를 분석하였다. 이 때 개념 간의 관계의 강도는 두 개 념이 한 문장에 같이 쓰인 정도로, 이 분석 데이터를 바탕으로 개념 간 관 계의 근접 행렬을 계산하고, 가중된 네트워크를 생성하고 분석하였다. 문 장별로 추출 된 개념들의 집합에서 특정 개념들이 동시에 출현하는 빈도와 근접도가 높다는 것은 해당 개념이 같은 주제 연관될 가능성이 높고 서로 관계가 밀접하다는 것을 의미한다.

본 연구에서는 문장의 형태소 분석과 개념 추출을 위하여 강승식 (2012)의 한국어 형태소 분석 라이브러리(KLT)에 기반 한 ‘개념관계분석 프로그램(Concept Relation Analyzer)’를 개발하여 사용하였다.

3단계는 2단계에서 추출한 개념들이 형성하는 네트워크, 즉 의미망을 분석하는 단계이다. 이 단계에서는 추출된 개념별로 그 개념이 네트워크의 의미형성에서 가지는 중요도와 역할을 알아보기 위하여 개념의 빈도와 중 심성(연결정도, 사이중심성) 분석을 수행하였다. 다음으로 개념들이 함께 출현하는 빈도(weight)와 각 개념 사이의 근접도(proximity)에 대한 분 석을 통해 주요 개념들 사이에 어떤 관계가 형성되고 있는지 분석하였다.

이러한 분석을 통해 도출된 주요 개념과 관계를 중심으로 의미망에 대한 군집 분석을 수행하고 이를 관계망으로 시각화하였다. 이를 통해 생명과학 교과서에서 많은 개념들과 긴밀한 관련을 맺고 있는 핵심 개념이 무엇인지 를 알아보았다. 그리고 핵심 개념을 중심으로 형성되는 개념의 군집들이 나타내는 생물학의 핵심 주제와 그 주제들이 이루는 생물학 지식의 체계 대해 생물 교육의 관점에서 분석하였다. 개념 관계망에 대한 네트워크 분

석과 시각화를 위해서는 Gephi v0.9.1(Bastian, Heymann, &

Jacomy, 2009)를 사용하였다.

4단계는 연계성 분석 단계이다. 앞선 단계의 연구에 의해 구축된 생명 과학 영역의 주요 개념 관계망에 대하여 학교급에 따라 네트워크가 어떻게 변화하고 발달하는지 알아보는 연계성 분석을 수행하였다. 먼저 초·중·고 학교급의 교과서에 대한 군집 분석을 통해 나타난 생물학의 핵심 주제들 사이의 수평적 연계성, 즉 내용의 통합성을 알아보았다. 이를 위해 각 개 념군을 대표하는 핵심 개념과 전역적 중심성을 나타내는 개념들을 중심으 로 형성된 주요 관계를 분석하고 해석하였다. 다음으로 생물학의 핵심 주 제에 대한 내용이 학년이 올라감에 따라 어떻게 심화되고 있는지에 대한 수직적 연계성을 알아보기 위하여 각 주제 별로 학교급별 교과서에 따른 학습량의 변화에 대한 양적 분석과 함께 그 내용의 심화 정도를 송순희 등 (1991)의 분석 준거에 따라 계속성과 계열성의 관점에서 정성적으로 분 석하였다.

그리고 이러한 일련의 연구 과정을 통해 얻어진 결과를 바탕으로 과학 과 생명 영역의 내용 구성 및 체계에 대한 교육적 시사점을 도출하고자 하 였고, 연구 결과의 교육적 활용 방안을 논의 하였다.