변수 의견지도자 인식
지도자의견 설득력
매체출연 공신력 매력 소통
반응성 소통 통제성 의견지도자
인식 1
의견지도자
설득력 .74** 1
매체활동 .65** .18* 1
공신력 .91** .61** .69** 1 매력 .84** .53** .74** .88** 1 반응성소통 .85** .58** .75** .91** .91** 1 통제성소통 .90** .73** .66** .93** .89** .96** 1 주1. 표시된 숫자는 Pearson의 상관계수임. *
p<.05,
**p<.01,
***p<.001.
4절 자료의 분석방법
질문들을 푸는 데 적합한지 판단하기 위해 먼저 변수들 간의 상관관계를 확인할 것이다.
본격적으로 연구질문을 검증하기 위하여 교차분류 다층모형 (cross-classified multilevel model) 분석을 수행할 것이다. 연구질문에 기술한 바와 같이 이 연구는 주요 인물의 매체활동, 공신력, 매력, 소통 양식을 근거로 인물을 의견지도자라고 인식하는지(종속변수 1), 그리고 의견지도자로서 설득력(종속변수 2)을 예측할 수 있는지 파악하는 것을 목적으로 한다. 많은 사회과학 연구에서 다중회귀분석(multiple regression)을 통해 독립변수들의 설명력이 유의미한지 알 수 있으며, 여 러 변수 중 어떤 변수의 설명력이 더 큰 지 파악할 수 있기 때문에 기본 적인 통계방법으로 활용되어왔다.
그러나 개별 자료의 구조에 따라 회귀분석을 수행하는 것이 적절하 지 않을 수 있다. 특히 중첩된 구조를 가진 자료를 분석할 때에는 잔차 의 분산이 균등하지 않을 수도 있고, 다중공선성으로 인하여 회귀선을 왜곡할 수도 있기 때문이다. 여러 개의 독립변수를 분석단위로 삼아 다 중회귀분석을 할 경우, 집단 내 개별 값은 서로 상관을 가지기 때문에 표준오차가 과소 추정되어 검정통계량 값이 부풀려지고, 결과적으로 타 당성을 잃는 문제가 발생할 가능성이 있다. 따라서 자료 구조상 위계적 (hierarchical)이거나 중첩된(nested) 경우라면, 집단 내 구성원들 사이의 상관을 고려해야 하기 때문에 단층모델보다 다층모델을 사용하여 종속변 수를 예측하는 것이 더 효과적으로 변수 관계를 설명할 수 있다(강상진, 2016; 백영민, 2018).
다층모형을 활용한 연구는 1980년대 후반부터 본격적으로 학술지에 등장하기 시작하여 사회과학과 교육학 분야에서 많이 쓰이고 있는 분석 방법이다. 다층모형은 연구대상에 관한 자료가 1개 수준 이상으로 조직 화되어 있는 경우에 쓰는 분석으로 분석 단위는 개인이지만, 맥락상 개 인이 ‘상위 수준의 집합’ 단위 안에 포함되어 있을 때 개인이 소속된 집 단의 효과를 고려하여 모형을 설계한 것이다. 자료의 구성이 위계적이거 나 중첩되어 있을 때, 즉 조사대상이 개인 수준의 분석단위와 개인이 속
한 상위 집단 수준으로 나누어진 구조인 경우에는 다층모형 분석을 사용 하여 보다 정확하게 종속변수를 예측할 수 있다.
다층모형은 특히 교육학 연구에 많이 활용된다. 대부분 국가에서 학 교는 표준화된 학제를 갖추고 있으며 학생의 성취는 개인 속성인 동시에 학교 특성의 영향을 받거나, 지역 특성의 영향을 수 있기 때문이다. 예를 들어 고등학생의 성취도를 연구하고자 수학점수를 예측하는 연구를 할 때, 10개의 고등학교에서 각각 10명의 학생을 뽑아 총 100개의 수학점수 자료를 구했다고 가정한다. 수학점수 자료는 학생 ‘개인의 특성’일 뿐 아 니라 위계적 관계에 있는 ‘학교’의 특성과 ‘지역’의 특성이 동시에 종속변 수에 영향을 미칠 수 있기 때문에 학생 개인의 자료만으로 단층모형 회 귀분석을 사용한다면 종속변수를 예측하는 데 오류가 생길 수 있다. 같 은 학교에 속한 관측치들은 위계적 데이터의 특징인 공유분산을 갖고 있 기 때문에 서로 독립적이라고 가정하기 어려우며, 같은 학교가 가진 특 성을 나타낼 가능성이 크기 때문이다. 이러한 자료에서 10개의 학교 내 에서 학생의 점수 분포를 살펴보면 학교마다 회귀선의 절편과 기울기가 다르게 나타날 수 있어 개별적 자료로 일반 회귀분석을 사용하는 것은 바람직하지 않다(백영민, 2018; 정혜원, 2016; Hox, 2002).
따라서 변수들 사이에 위계적 관계 혹은 중첩된 관계가 나타나는 자 료를 분석한다면 이를 고려하여 독립변수를 적절한 수준(level)으로 설정 하고, 수준에 따른 변수의 특성을 고려한 후 종속변수를 추정해 주어야 정확한 예측이 가능하다. 다층모형을 나타낸 도식과 다층모형 분석을 할 때 사용하는 기본 수식은 아래와 같다.
<그림 5-4> 다층모형의 구조
<표 5-12> 다층모형의 식
1수준 모형(within-cell model)
2수준 모형(between-group model)
혼합모형
(mixed model)
그런데 자료의 구조에 따라 수준이 3개 이상일 수도 있고, 수준은 2 가지인데 관찰단위가 두 가지 집단에 이중 소속되어 서로 교차된 효과가 나타날 수도 있다. 또한 실제 현실에서 다층자료의 구조는 완벽하게 위 계적일 수 없다. 예를 들어 학생의 수학점수를 연구할 때, 특정 학교 소 속이자 특정 지역에 속한 학생의 수학점수에는 ‘학교의 분산’과 ‘동네의 분산’이 동시에 작용할 수 있다(Hox, 2002). 따라서 학생의 학업성취에 미치는 학교의 효과와 동네의 효과를 함께 파악하기 위해서는 내재적 다 층모형(Nested Multi-level model)이 아닌, 교차적 다층자료 모형(Cross multilevel model)을 사용하는 것이 바람직한 분석방법이다. 내재적 다층 모형은 ‘중학교와 중학교 재학생’처럼 하위 수준의 분석단위가 동일한 상 위 집단에 소속되어있다는 가정을 전제로 하지만, 학생이라는 관찰단위 가 ‘학교’에도 속하고 ‘동네’에도 속해 2개 이상의 무선효과를 갖는 구조 라면 교차분류 다층모형(Cross-classified multilevel models: CCMM)을 통해 학생의 성취에 미치는 ‘학교의 효과’와 ‘동네의 효과’가 교차된 자료 를 분석할 수 있다.
교차분류 다층모형은 상위집단의 효과와 하위 집단에서 두 변수가 가진 분산요인을 계산할 수 있기 때문에 종속변수에 영향을 미치는 변수 의 영향력을 분석할 때, 교차하는 두 집단의 영향력이 어느정도인지 각 각 측정할 수 있다는 장점이 있다. 즉 교차분류 다층모형에서 분산비율 (ICC)을 구함으로써 각 수준의 분산이 전체 분산의 어느정도를 설명하는 지 알 수 있는데, 일반적으로 ICC값이 0.05~0.06 이상일 경우 다층모형을 사용하는 것이 바람직한 것으로 간주한다(강상진, 2016; Glaser &
Hastings, 2011). 이처럼 교차분류 다층모형에서는 독립된 요인들을 각 수준에 맞게 배치하여 종속변수에 미치는 영향을 파악하는 것이 중요하 다. 2수준 교차분류 다층모형을 나타낸 도식과 종속변수를 구하는 수식 을 아래 그림과 표에 제시하였다.
<그림 5-5> 교차분류 다층모형의 구조
<표 5-13> 교차분류 다층모형의 식
1수준 모형(within-cell model)
2수준 모형(between-group model)
통합모형 (mixed model)