• Tidak ada hasil yang ditemukan

뒤에 의사결정을 하는 데 있는 반면, 형성평가의 목적은 학습의 개별화 의 추구, 피드백, 학습곤란의 진단, 학습동기 유발에 있다. 이러한 설명은 총괄평가란 용어의 전통적 성격과 형성평가란 용어의 대안적 성격을 나 타내고 있다고 할 수 있다. 실제로 국내 교육평가 연구자들은 향후 미래 교육으로서 교육평가가 지향해야 할 방향으로 결과중심적인 총괄평가보 다 과정중심적인 형성평가를 지향해야 한다는 점에 동의하고 있으며(강 태훈, 류성창, 2017; 류성창 외, 2012; 성태제 외, 2013; 지은림, 2010; 허 경철, 2013), 대안적 평가의 실천적 형태로서 과정중심 수행평가의 추진 방향으로 ‘평가의 형성적 기능’을 강조하고 있다(전경희, 2016).

이처럼 교육평가의 새로운 동향으로서 재조명받고 있는 형성평가는 수 업(instruction)과 평가의 통합, 수업 과정 중에서의 즉각적이고 지속적인 평가 기반의 피드백, 수업의 조절, 학생의 자기평가(self-assessment)를 핵심적인 특징으로 하고 있다. 이러한 특징들은 형성평가 개념이 갖고 있는 교육적 함의들을 여실히 보여준다고 할 수 있다.

그러나 국내 교육현장에서 형성평가의 개념은 중간 중간 작은 단위의 과정 평가를 수행하여 총괄평가에 반영하는 평가를 지칭하거나, 중간에 실시하는 작은 단위의 평가(mini summative) 자체를 지칭하는 것으로 간주되고 있다(박정, 2018: 485). 실제로 우리나라 교사들은 형성평가를 단위 수업의 평가나 단원 평가로 인식하고 있는 것으로 드러났다(남정희 외, 1999; 박영석, 2009). 이는 형성평가 개념이 그 교육적 중요성에도 불 구하고 국내 교육현장에서 피상적으로 수용되고 있음을 보여준다.

따라서 교육평가의 새로운 동향을 나타내는 형성평가 개념을 명료화함 으로써 국내 교육현장에서 평가의 대안적 접근을 나타내는 용어들의 본 의를 분명히 이해하고, 일상적으로 사용되는 형성평가 개념에 대한 오해 를 제거할 필요가 있다. 더불어, 이와 같은 개념적 명료화는 성장 마인드 셋 개념이 도덕과 평가 영역에 적용됨에 있어서 형성평가가 어떤 개념적 틀을 제공할 수 있는지를 밝혀줄 것이다.

형성평가 개념은 교육현장에서 일상적으로 사용되는 용어인데다가, 학 자들마다 접근하는 방식의 차이가 있기 때문에 국내외 연구자들은 형성 평가의 개념적 혼재를 지적하고 있다(박정, 2013: 722; 박정, 2018: 485;

McMillan, 2014; 손원숙 외 역, 2015: 120). 따라서 형성평가 개념의 기원 을 먼저 살펴볼 필요가 있다.

형성평가는 최근에 새롭게 등장한 개념이 아니다. 이 개념은 Scriven(1967)이 교육의 목표 달성 여부를 파악하는 총괄평가 (summative evaluation)와 그 과정에서 수행되는 평가로서 형성평가 (formative evaluation)를 구분하기 위해 제시한 것에서 시작되었으며. 이 후 Bloom(1969)이 총괄평가를 학기말에 학생의 학업성취도를 평가하는 것으로, 형성평가를 교수학습 과정에서 피드백을 제공하는 것으로 정의 하였다. Bloom의 정의는 현재 형성평가를 교수학습 과정에서 이루어지 는 평가로 인식하는 경향의 근거가 된다(박정, 2018: 486).

그러나 최근 많은 교육학자들에 의한 형성평가 개념에 대한 재조명은 Scriven이나 Bloom의 주장이 아니라 Black & Wiliam(1998b)의 논문으 로부터 촉발되었다. 이 논문으로부터 재조명 받은 형성평가의 효과와 영 향력은 1987년부터 1997년까지 교실평가를 다룬 600여 편의 논문들 중 형성평가와 직접적으로 관련이 있는 것으로 판단되는 250편의 논문들을 정리하여 형성평가의 효과를 밝힌 연구(Black & Wiliam, 1998a)와 영국 의 교육평가위원회(Assessment Reform Group: ARG)의 연구지원으로부 터 수행된 6개 중학교에 재직 중인 24명의 수학과 과학 교사들을 대상으 로 18개월의 워크샵을 운영하여 교실평가에 적용한 후에 형성평가의 효 과를 밝힌 연구(Black et al., 2003)에 의해 실증적으로 입증되었다. 이러 한 배경으로 인해, 최근에 형성평가 개념의 교육적 중요성은 교육연구자 들에게 더욱 재조명되고 있으며, 교육평가 관련 담론에서 형성평가를 언 급하지 않고 학습자의 변화와 향상을 말하는 것은 아주 어려운 일이 되 고 있다(Shepard, 2009; 김성숙 외, 2015; 박정, 2013; 박정, 2018).

형성평가 개념에 대해 가장 많이 인용되고 있는 정의는 영국 교육평가 개혁위원회(Assessment Reform Group: ARG, 2002)에서 사용하고 있는

“학습자와 교사가 학습자의 현재 상태, 도달해야 하는 목표와 그 목표에 도달하는 방법을 결정하기 위해 증거를 수집하고 해석하는 과정”일 것이 다(박정, 2018: 486). 그러나 ARG의 정의는 형성평가가 학습을 위한 평 가로서 재조명된 배경을 충분히 반영하고 있지 못하다는 문제가 제기될 수 있다. 이와 관련하여, Klenowski(2009)과 Swaffield(2011)은 이러한 정의가 교육과정에서 제시하는 목표 달성에 초점을 둔 전통적인 관점과 다르지 않다는 점을 비판하였으며, Bennett(2011)은 형성평가 개념의 혼 재를 논의하면서 형성평가를 단지 평가도구나 과정으로 개념화하는 것을 경계하고 있다. 즉 ARG의 정의와 이에 대한 연구자들의 비판에는 형성 평가의 개념적 혼재성이 반영되어 있다.

따라서 형성평가 개념을 더 구체적으로 명료화할 필요가 있다. 이는 형 성평가가 가진 장점들의 발현이 형성평가 개념에 대한 올바른 해석을 조 건으로 하기 때문이다(Black et al., 2003). 이를 위해, 먼저 학습결과에 대한 평가, 학습을 위한 평가, 학습으로서의 평가와 형성평가 개념의 관 계를 탐색하고자 한다.

1) 학습결과에 대한 평가, 학습을 위한 평가, 학습으로서의 평가와 형성 평가

앞서 언급한 바와 같이, 학습을 위한 평가는 1992년에 Mary James가 ASCD에서 전통적인 평가로서 ‘학습결과에 대한 평가’를 ‘총괄평가’로, 대안적인 평가로서 ‘학습을 위한 평가’를 ‘형성평가’로 구분하면서 본격적 인 교육적 담론의 주제로 등장한 개념이다(Wiliam, 2011: 39), 이러한 구 분은 교육평가 연구자들의 많은 관심을 불러일으켰으며, Earl(2003)에 의 해 ‘학습으로서의 평가’라는 용어가 등장하면서 더욱 확대된 양상을 보여 주고 있다. 즉 ‘학습결과에 대한 평가’와 ‘총괄평가’는 전통적인 평가를 의미하는 반면, ‘학습을 위한 평가’, ‘학습으로서의 평가’, ‘형성평가’는 대 안적인 평가를 의미하는 것으로 다뤄지고 있다. McMillan(2014)은 이를 다음과 같은 표의 형태로 요약하여 제시하고 있다.

[표 2-1] 학습결과에 대한 평가, 학습을 위한평가, 학습으로서의 평가의 특징 비교표(McMillan, 2014; 손원숙 외 역, 2015: 43, 일부 표현 수정)

McMillan의 비교표에서 학습결과에 대한 평가의 특징은 많은 교육평가 학습결과에 대한 평가

Assessment of Learning

학습을 위한 평가 Assessment for Learning

학습으로서의 평가 Assessment as Learning

총괄적 형성적

평가의 본질은 학습과정 에 학생을 참여시키는 것

학습결과를 보증하는 것 후속적인 학습에 대한 필요를 기술하는 것

학습에대한 자기점검 능 력을 향상시키는 것 수업 종료 시점에 실시:

산발적

수업 과정에서 실시: 지 속적

수업의 각 단위 동안 실 시

규준참조적 기준의 사용 교사들에게 수업을 교정 할 수 있도록 함

학습평가 기준에 대한 학생의 이해를 강조함 학습했던 내용에 기반한

질문 교정적인 수업을 제안함 학생이 교정적인 수업을 선택함

일반적 구체적 구체적

학부모에게 성적표를 제 공하기 위함

학생에게 피드백을 제공 하기 위함

학생의 자기점검 능력을 향상시키기 위함

학생의 동기를 감소시킴 학생의 동기를 향상시킴 학생의 동기를 향상시킴 효율적이지만 피상적인

평가 심층적인 평가 평가가 학생들을 가르침

신뢰도에 초점 타당도에 초점 타당도에 초점

지연된 피드백 즉각적 피드백 즉각적 피드백

요약적 판단 진단적 진단적

개론서에서 전통적인 평가의 특징들로 지목되는 요소들을 포함하고 있는 반면, 학습을 위한 평가 및 학습으로서의 평가의 특징은 대안적 평가의 특징들로 지목되는 요소들을 포함하고 있음을 알 수 있다. 특히 위 표에 서 알 수 있는 바와 같이, 학습을 위한 평가와 학습으로서의 평가의 특 징은 ‘형성적’인 반면, 학습결과에 대한 평가의 특징은 ‘총괄적’이다.

McMillan(2014)은 최근 교육평가의 동향인 학습을 위한 평가를 지향해 야 하며, 학습으로서의 평가의 중요성 또한 유념해야 한다는 입장을 취 하고 있다. 이는 교육평가 연구자들에게 ‘학습을 위한 평가’, ‘학습으로서 의 평가’, ‘형성평가’가 교육평가의 새로운 동향으로서 간주되는 반면, ‘학 습결과에 대한 평가’, ‘총괄평가’가 전통적 평가로 간주되고 있다는 점을 보여준다.

그러나 Black과 동료들(2003; 김진호 외 역, 2019: 234-235)은 학습을 위한 평가와 형성평가의 관계가 모호하다는 점을 다음과 같이 지적한 바 있다.

사람들은 과거에 형성적이라는 단어를 단지 잦은 비공식적 시험(예: 미 시적 총괄평가)을 의미하는 것으로 간주하였고, 형성평가를 학교의 정규 시험의 평가결과와는 구분되는 학교 숙제와 쪽지 시험 등에 관한 채점 결과로 이해하였다. 또 어떤 사람들에게 형성적이라는 것은 공식적 시험 과 대비되는, 하지만 학습 향상의 목적에 국한되는 비공식적 시험을 의 미한다. 그러나 우리는 형성적 시험을 학습 향상을 위해 그리고 둘 이상 의 목적을 달성하기 위해 활용할 수 있다. '학습을 위한 평가'라는 문구 는 '형성평가'를 대체하는 일반 용어가 되었지만, 여기에는 여전히 모호 한 구석이 존재한다. 학습에 관한 정보는 그와 같은 정보를 제공하기 위 해 고안된 평가를 통해 확보될 수 있지만, 이것이 단지 학교 생활기록 차원의 것이거나 장기적인 교육과정 개선의 목적으로만 활용된다면, 현 재 가르치고 있는 학생들의 학습에 도움이 되지 못할 것이다.

Black과 동료들의 지적은 단순히 형성평가를 학습을 위한 평가에, 총괄 평가를 학습결과에 대한 평가에 환원시키기 어렵다는 점을 명료하게 설 명해주고 있다. 형성평가가 학습을 위한 평가를 의미하는 것으로 간주하