가. 데이터의 의미
‘데이터(data)’는 라틴어 ‘datum’의 복수형으로, ‘주어진 것(thing given)’이라는 뜻을 지닌다. 데이터와 비슷하게 사용되는 것이 정보 (information)로 두 개념 사이에는 분명한 차이가 있다. 데이터를 바탕으 로 정보가 만들어지고, 이러한 정보가 모여서 지식이 구성된다(Liew,
2007). 데이터를 활용하여 의미 있는 정보를 추출하고, 숨어있는 규칙들 을 찾아내기도 하며(김동일, 2016), 과학적 의사결정의 재료로 표현하기 도 한다(김용민, 2018).
데이터는 사용 목적과 맥락에 따라 다양한 뜻으로 이용되므로 과학교 육에서 데이터의 의미를 어떻게 사용하고 있는지 확인할 필요가 있다.
대부분의 과학 탐구 관련 연구에서 사용하는 데이터는 설계한 실험을 수 행하는 과정에서 얻게 되는 실험 결과를 의미하였다(신미영, 2008; 조현아 외, 2013; 정은주, 손정우, 2019). 구자옥(2006)은 실시간 데이터(real time data)를 이용하여 지구과학 탐구 수업에 관한 연구를 하였는데, 이때의 실 시간 데이터는 시간의 흐름에 따라 측정된 데이터를 의미한다. 하지만 즉 각적으로 갱신되는 자료는 학생들이 분석하는 동안에 시간의 지연이 생기 거나 화산폭발과 같은 자료를 사건 발생 후 기록까지 상당한 시간이 흘러 가므로, 교육활동에서 의미하는 실시간 데이터는 지속적으로 갱신되는 최 근의 데이터까지 포함하였다. Hug & McNeil(2008)은 데이터의 종류를 두 가지로 나누고 출처에 따라 실험을 통해 수집된 데이터를 1차 데이터, 다 른 사람에 의해 정리된 결과를 2차 데이터라고 정의하였다. 결과적으로 과학 교육에서 의미하는 데이터는 측정을 통해 얻은 값을 의미한다.
H. Bergson의 ‘연속적 존재론’에 따르면 현대 과학은 3가지 특징을 갖는다(이정우, 2004). 우리의 세계는 연속적이나 과학은 분할하여 분석 하며, 이 세계는 질적인 풍요로움을 특징으로 하는데 과학은 양적인 것 에 초점을 맞춘다는 것이다. 또한, 우주는 새로운 존재로 계속해서 바뀌 나 과학은 법칙성, 동일성, 결정론에 입각한다. 우리의 세계는 끊임없는 변화와 흐름을 특징으로 하는 연속성을 갖지만, 과학은 그 본성에 따라 그것을 자르고 조작하여 분석한다. 모든 분석은 분할하려는 순간에 어떤 방식으로든 세계를 왜곡시킬 수밖에 없다. 따라서 지속성을 갖는 시간과
세계는 직관을 통해 읽어낼 필요가 있다(이정우, 2008).
실험실에서 얻는 데이터는 자연 현상에 인위적 조작을 가하거나 가설 에 근거한 통제 속에서 나타난 결과를 관찰한 것으로 단시간 내에 용이 하게 결론을 도출하기 위한 시도로(최돈형, 1990), 공간과 시간의 의미가 중요하지 않다. 반면 자연의 현상을 파악하는 과학에서 지속적인 시간에 따른 변화를 파악하는 일은 매우 필수적이다. 따라서 기후나 생태, 해류 등의 자연 현상에 관련된 데이터는 시공간의 의미가 포함된다. 기후, 해 류, 날씨 등을 다루는 많은 연구에서는 real time data 즉, 실시간 데이 터라는 용어를 활용한다.
구성주의 학습이론을 기반으로 하는 본 연구의 탐구 활동에서 학습 맥 락은 매우 중요하며, 학습 맥락은 학생들의 실제 생활과 연계될 때 발생 한다. 이에 많은 연구자들은 실세계 데이터(real world data) 또는 실제 적 데이터(authentic data)를 이용한 학습을 중시한다(Hancock et al., 1992; Woolnough, 2000; Chinn & Malhotra, 2002; Ucar & Trundle, 2011; Grimshaw, 2015; Smucker & Bailer, 2015). 따라서 본 연구에서 의미하는 데이터는 실세계에서 얻을 수 있는 환경을 ‘측정’한 데이터로 한정한다.
나. 데이터 기반 과학탐구 사례
데이터 중심의 과학 탐구가 학교 탐구에서도 가능해진 데는 학교 탐 구 환경의 변화이며, 그 중 가장 큰 영향은 인터넷과 과학탐구 도구의 발달이다. 도구는 과학 탐구의 핵심적 요소로(최취임, 이선경, 2016), 탐 구 맥락에서 문제 해결을 위해 적당한 도구를 선정하는 것은 과학자의 탐구와 본질적으로 유사하므로 단순한 실험 기구 이상의 의미를 갖는다
(이재원 외, 2017). 이에 학교 현장에서는 기존 초자류 위주의 과학 실험 도구 이외에 과학 기술의 발달에 따라 IoT 기반의 센서와 MBL (Microcomputer-Based Laboratory, 이하 MBL), 정보를 검색하고 데이 터 처리를 위한 PC와 테블릿 등을 보급하였다. MBL은 센서와 인터페이 스를 기본으로 하고 이를 수집하고 그래프로 나타낼 수 있는 소프트웨어 까지를 의미한다. MBL의 소프트웨어는 인터페이스에 센서를 꽂아 수집 된 자료를 컴퓨터 화면에 바로 그래프 형태로 나타나게 한다. 따라서 짧 은 시간 동안 여러 개의 센서를 활용하여 많은 데이터를 수집할 수 있으 며, 다양한 실험 설계, 변인통제 등의 과학에 대한 탐구적 접근을 격려한 다(Thornton, 1987).
MBL과 같이 컴퓨터와 센서 기술의 발달로 인해 실시간으로 다양한 변인과 지속적인 변화 관찰이 가능하도록 잦은 빈도로 측정이 가능해졌 다(Glasgow et al., 2004; Henjum et al., 2010; Parra et al., 2015). 이러 한 기술적 개선은 학생 수준에서 이루어지는 과학 탐구가 실제 자연 현 상을 이용할 수 있는 기반이 될 수 있다. 성능이 개선된 MBL의 경우 WiFi 공유기 또는 블루투스 기능을 탑재하고 있어 측정 데이터를 컴퓨 터로 옮길 수 있다.
IoT(Internet of Thing, 이하 IoT)는 사물인터넷과 같은 말로 가전제 품 전자 기기 및 스마트 홈 스마트 카 스마트 팩토리 등 다양한 분야에 서 사물을 네트워크로 연결하여 정보를 공유하는 기술이다(Gubbi et al., 2013). IoT 기술의 발달은 우리 주변의 환경을 실시로 관찰할 수 있게 함으로써 즉각적인 피드백을 가능하게 하였다(채여라 외, 2017). 이러한 실시간 원거리 모니터링 시스템은 환경에 대한 데이터를 제공할 수 있으 며, 결과적으로 학생들의 학습 능력 향상을 도울 수 있다(Brogan et al., 2016). 따라서 탐구 도구의 발달과 인터넷의 활성화가 접목하여 IoT 기
반의 과학탐구 도구가 발달할 수 있었다.
데이터 기반 과학탐구는 기존의 학교 과학탐구와는 다른 몇 가지 특징 이 나타난다. 첫째, 데이터의 양이 방대하다. 일반적인 의미의 빅데이터 수준은 아니지만, 기존 학생들이 학교 탐구에서 경험하던 탐구 데이터에 비해 그 양이 많은 편이다. 학교에서 이루어지는 탐구 대부분은 안내된 탐구로 이론을 확인하는 형태로 이루어지며(Chinn & Malhotra, 2002; 최 취임, 이선경, 2016), 제한된 시간 내에 마무리되어야 하므로 결과를 예 측할 수 있는 형태의 단순한 실험이 주를 이룬다. 하지만 실생활에서 이 루어지는 다양한 현상을 측정하는 데이터 기반의 과학탐구는 시간의 흐 름에 따른 여러 변인의 변화값을 연속적으로 측정하기 때문에 데이터의 양이 매우 많다.
둘째, 대체로 통제된 환경에서 측정된 데이터가 아니기 때문에 일반적 인 통제 실험에 비해 데이터의 편차가 크거나 잘못된 데이터가 삽입될 수 있다. 보통의 연역적 실험은 가설을 설정한 후 변인을 통제하여 가설에서 설정한 인과관계가 정확한지 판단하는 형태로 실험이 이루어진다. 하지만 데이터 기반 탐구는 통제된 상태가 아니라 일상생활에서 일어나는 현상들 을 측정한 값이므로 정확한 인과관계를 파악하는 데는 무리가 있다. 오히 려 데이터를 이용하여 다양한 그래프를 그려보고 형태적인 특성을 통찰하 여 변인들과의 관계를 파악하는 것이 더욱 중요한 요소일 수 있다. 따라 서 수집한 데이터의 값이 어떤 외부적인 요인에 의해서 갑자기 큰 값을 갖거나 예상과는 다른 결과일 때 데이터가 갖는 것이 단순한 오류인지, 아 니면 새로운 발견인지에 대한 결정이 필요하다. 또한 많은 데이터들은 IoT 기술을 이용하여 데이터베이스에 저장된다. 따라서 IoT 센서가 매우 정밀하거나 안정하지 않다면 데이터의 타당성에 의심을 받을 수 있다.
셋째 실생활 맥락에서 이루어지는 현상을 양적으로 측정할 수 있다.
학교에서 일어나는 일반적인 과학탐구는 실생활 맥락에서 이루어지기 보 다는 교육과정 등에 영향을 받는다. 학교 과학탐구가 탈맥락적이라는 지 적은 꾸준하게 지적되고 있는 부분으로, 학생들의 동기나 흥미를 감소시 키는 요인이 된다(Chinn & Malhotra, 2002; Bevins & Price, 2016; 박상 태 외, 2002; 김희령, 여성희, 2004; 최취임, 이선경, 2016). 그에 비해 데 이터 기반 과학탐구는 자연의 현상을 있는 그대로 측정하므로 학생들의 과학적 호기심을 좀 더 자극하고 동기 유발을 할 수 있다(Griffis et al., 2008; Chang et al., 2009; 구자옥, 2006).
넷째 데이터에 대한 다양한 해석이 가능하다. 데이터 기반 과학탐구의 경우는 학생들이 미시적으로 접근하는지, 거시적으로 접근하는지에 따라 다양한 결과 해석이 가능하다. 또한 다양한 변인을 측정하면서 어떤 변 인들을 선택하여 연관성을 살펴볼 것인지, 어떤 형태로 변형할 것인지에 대해 개인 또는 모둠의 의견이 다르기 때문에 하나의 자료로도 다양한 결과가 도출될 수 있다.
데이터 기반의 과학탐구는 인터넷이 발달하는 2000년 초기부터 학교에 서 다양한 형태로 시도되어 왔다.
Brogan et al.(2016)은 STEM 교육의 하나로 라즈베리파이를 이용하 여 pH와 용존 산소량, 산소감소량, 혼탁도, 전류랑, 온도 등을 센서로 수 집하여 수질의 실시간 모니터링 시스템을 구축하였다. 그리고 그날의 강 우량과 바람, 압력과 습도를 측정하여 수질과 연관 지어 데이터를 해석 할 수 있도록 하였다. 또한, 이렇게 수집된 데이터가 데이터베이스에 축 적될 수 있도록 하고 인터넷을 통해 언제 어디서나 접근 가능할 수 있도 록 하여, 학생들이 수질을 지속해서 관찰하고 탐구할 수 있도록 하였다.
이는 사회적 가치가 있는 물의 지속가능성 교육뿐 아니라 물의 상태 변 화와 같은 과학적 지식의 연계와 물의 순환에 대한 시스템 사고를 가능