BAB III
METODE PENELITIAN
A. Lokasi dan Subjek Populasi atau Sampel Penelitian
Lokasi yang digunakan dalam penelitian ini adalah salah satu SMP Negeri di kota Bandung. Alasan peneliti memilih lokasi tersebut dikarenakan sekolah tersebut memiliki sarana laboratorium IPA yang layak, alat-alat eksperimen yang ada di sekolah tersebut cukup lengkap dan sekolah tersebut telah terakreditasi A, sehingga peneliti berasumsi bahwa sekolah tersebut sesuai untuk dilakukan penelitian dengan treatment levels of inquiry.
Populasi yang diambil dalam penelitian ini adalah seluruh siswa kelas VIII di SMP tersebut, dengan jumlah populasi 437 orang, namun dikarenakan
keterbatasan dana, tenaga dan waktu, maka peneliti hanya mengambil sampel dari populasi tersebut. Untuk penentuan ukuran sampel disesuaikan dengan
saran dari ahli Roscoe yaitu “ukuran sampel yang layak dalam penelitian adalah antara 30 sampai dengan 500 orang” (Sugiyono, 2011, hlm.131). Metode pengambilan sampel yang digunakan dalam penelitian ini adalah nonrandom sampling yaitu pengambilan sampel yang tidak memberikan peluang yang sama bagi setiap anggota populasi untuk dipilih menjadi anggota
sampel, seperti yang dikemukakan oleh Fraenkel, J.R (2012, hlm.94)
bahwa“…each of the individuals selected must possess all the criteria mentioned. Each member of the population does not have an equal chance of being selected”. Dikarenakan kondisi sekolah yang tidak memperbolehkan untuk mengubah kelas yang sudah ada, maka pengambilan sampel tidak mungkin dilakukan secara random dan hanya mungkin dipilih secara nonrandom sampling. Adapun teknik sampling yang digunakan ialah purposive sampling yaitu pengambilan anggota sampel dari populasi yang dilakukan dengan pertimbangan tertentu (Sugiyono, 2011, hlm.120). Beberapa pertimbangan yang dijadikan acuan pemilihan sampel yaitu didasarkan atas
tersebut relatif mudah dikondisikan dan siswanya lebih aktif dalam
pembelajaran, sehingga berdasarkan pertimbangan tersebut, maka sampel yang digunakan dalam penelitian ini adalah 37 orang siswa kelas VIII A di
salah satu SMP Negeri di kota Bandung tahun ajaran 2013-2014.
B. Desain Penelitian
Desain penelitian yang dipilih dalam penelitian ini adalah one-group pretest-posttest design. Dalam desain penelitian ini tidak terdapat kelompok pembanding atau kontrol, seperti yang dikemukakan Creswell, J.W (1994, hlm.130) bahwa “…with preexperimental design, the research does not have
a control group to compare with the experimental group”. Selain itu terdapat pretest sebelum diberikan perlakuan, seperti yang dikemukakan Fraenkel, J.R (2012, hlm. 269) bahwa “in the one-group pretest-posttest design , a single group is measured or observed not only after being exposed to a treatment of
some sort, but also before”, dengan demikian hasil perlakuan dapat diketahui lebih akurat, karena dapat membandingkan keadaan sebelum dengan keadaan sesudah diberi perlakuan (Sugiyono, 2011, hlm.110-111). Pola desain ini dapat diilustrasikan sebagai berikut: (Sugiyono, 2011, hlm.111; Creswell,
J.W, 1994, hlm.130; Fraenkel, J.R, 2012, hlm. 269)
O1 = pretest (sebelum diberi treatment) O2 = posttest (setelah diberi treatment) X = treatment levels of inquiry
Alasan peneliti memilih design penelitian ini adalah (1) disesuaikan
dengan tujuan penelitian yaitu untuk mengetahui peningkatan achievement siswa SMP setelah diterapkan levels of inquiry, karena dengan desain ini peneliti dapat memperoleh peningkatan achievement siswa dari selisih nilai tes sebelum dengan sesudah diberi perlakuan; (2) disesuaikan dengan teknik
sampling yang digunakan yaitu purposive sampling; (3) keterbatasan peneliti untuk dapat mengontrol semua variabel luar yang mungkin mempengaruhi penelitian.
O
1X O
2Secara lengkap prosedur penelitian akan dijelaskan sebagai berikut:
Tahap Persiapan:
Kegiatan yang dilakukan dalam tahapan ini adalah :
a. Menentukan sekolah yang dijadikan lokasi penelitian, membuat surat perizinan dari universitas dan menghubungi pihak sekolah
b. Melaksanakan studi pendahuluan, meliputi observasi, wawancara guru dan siswa serta tes soal TIMSS untuk mengetahui kemampuan siswa.
c. Merumuskan masalah terkait adanya ketidaksesuaian antara fakta dilapangan dengan kondisi ideal yang ada pada teori
d. Melaksanakan studi literatur dan studi kurikulum untuk mencari solusi permasalahan
e. Menentukan variabel, sampel serta desain penelitian yang akan digunakan. f. Menyiapkan perangkat pembelajaran berupa RPP dan LKS
g. Membuat dan menyusun instrumen penelitian berupa soal achievement dan lembar keterlaksanaan levels of inquiry
h. Membuat dan menguji coba set alat percobaan yang akan digunakan dalam pembelajaran
i. Menjudgement instrumen penelitian kepada judgement expert
j. Merevisi kembali hasil judgment, kemudian menunjukkan instrumen yang sudah direvisi dan meminta penilaian judgement expert
k. Melakukan uji coba instrumen dan menganalisis butir soal (validitas, reliabilitas, tingkat kesukaran dan daya pembeda)
l. Menentukan butir soal mana yang akan dipakai
Tahap Pelaksanaan
Kegiatan yang dilakukan dalam tahapan ini adalah :
a. Memberikan pretest berupa tes achievement pada pokok bahasan optik untuk mengetahui kemampuan awal siswa
c. Selama diberikan treatment, siswa diberikan Lembar Kegiatan Siswa dan juga dilakukan perekaman video serta penilaian observer pada lembar keterlaksanaan levels of inquiry
d. Memberikan posttest berupa tes achievement pada pokok bahasan optik untuk mengetahui peningkatan achievement siswa setelah diterapkan levels of inquiry.
Tahap Akhir
Kegiatan yang dilakukan dalam tahapan ini adalah :
a. Mengolah data hasil pretest, posttest, LKS dan lembar observasi. b. Menganalisis dan membahas hasil penelitian.
c. Memberikan simpulan berdasarkan hasil penelitian serta saran
untuk pengembangan penelitian selanjutnya.
Secara singkat prosedur penelitian digambarkan sesuai diagram di bawah ini:
TAHAP PERSIAPAN
Melaksanakan Studi literature & studi kurikulum
Merumuskan masalah, sampel,variabel dan desain penelitian
Judgement instrument dan revisi
Membuat RPP, instrument penelitian, alat percobaan Menentukan sekolah tempat penelitian
Membuat surat izin studi pendahuluan, Menghubungi pihak sekolah
Melaksanakan studi pendahuluan
Uji coba instrument dan revisi
C. Metode Penelitian
Penentuan metode penelitian didasarkan pada rumusan masalah serta tujuan penelitian yang hendak dicapai yaitu ingin mengetahui peningkatan achievement siswa setelah diterapkan levels of inquiry, sehingga metode penelitian yang dipilih adalah eksperimental-deskriptif. Fraenkel, J.R (2012, hlm. 265) menyatakan bahwa karakteristik metode ini yaitu “in an experimental study, researchers look at the effect(s) of at least one independent variable on one or more dependent variables”. Jenis metode eksperimental yang digunakan dalam penelitian ini adalah pre-experimental design. Jenis pre-experimental design menyaratkan bahwa sampling yang dipilih tidak boleh dilakukan secara random (Sugiyono, 2011, hlm.74) karena masih terdapat variabel luar yang ikut berpengaruh terhadap terbentuknya
variabel dependen, seperti yang dikemukakan Fraenkel,J.R (2012, hlm. 269) bahwa “… poor experimental designdo not have built-in controls for threats to internal validity. In addition to the independent variable, there are a
number of other plausible explanations for any outcomes that occur”. Selain itu digunakan juga metode deskriptif yaitu metode yang ditujukan untuk menggambarkan secara sistematis fakta atau karakteristik objek yang diteliti secara tepat (Sukardi, 2009, hlm. 157).
Gambar 3.2 Skema Prosedur Penelitian TAHAP
AKHIR TAHAP PELAKSANAAN
Pretest acvhievement siswa berdasarkan kerangka TIMSS
Penerapan levels of inquiry dan perekaman video
Posttest acvhievement siswa berdasarkan kerangka TIMSS
Pengolahan data penelitian
Kesimpulan dan saran Analisis data penelitian
D. Definisi Operasional
Variabel-variabel yang akan diteliti didefiniskan secara operasional sebagai berikut:
1. Levels of inquiry merupakan model pembelajaran yang diterapkan secara komprehensif dan sistematis, bertujuan untuk meningkatkan pemahaman konseptual siswa serta mengembangkan pemahaman siswa tentang penyelidikan ilmiah dan sifat ilmu pengetahuan. Tahapan pada levels of inquiry adalah discovery learning, interactive demonstration, inquiry lesson, inquiry laboratory, real-word application, dan hypothetical inquiry. Dalam penelitian ini, tahapan levels of inquiry yang digunakan ialah mulai dari discovery learning hingga guided-inquiry laboratory dengan alasan disesuaikan tingkat subjek penelitian yaitu siswa SMP. Untuk melihat keterlaksanaan levels of inquiry digunakan lembar observasi keterlaksanaan levels of inquiry dan transkrip rekaman video penerapan levels of inquiry.
2. Achievement adalah hasil yang dicapai oleh seseorang setelah mengalami pembelajaran dan bersifat kognitif. Achievement yang dimaksud mengacu pada kerangka penilaian TIMSS 2015 yang terdiri dari dua dimensi yaitu
dimensi konten dan dimensi kognitif. Untuk menentukan seberapa besar
peningkatan achievement siswa digunakan perhitungan persentase skor gain (selisih posttest dan pretest) serta effect size-Cohen (d).
E. Instrumen Penelitian
Instrumen penelitian merupakan sebuah alat yang digunakan untuk
mengumpulkan data. Bentuk instrumen yang digunakan adalah tes dan non tes. Instrumen bentuk tes yang digunakan mencangkup tes achievement, sedangkan instrumen bentuk non tes yang digunakan mencakup penilaian LKS dan transkrip video. Penjelasan instrumen penelitian yang digunakan dalam
1. Tes achievement
Instrumen tes yang digunakan dalam penelitian ini adalah instrumen tes achievement. Fraenkel, J.R (2012, hlm.127) menyatakan bahwa “achievement tests measure an individual’s knowledge or skill in a given
area or subject”. Tes ini digunakan untuk mengukur peningkatan achievement siswa setelah diberikan treatment levels of inquiry. Hal tersebut senada dengan pernyataan yang diungkapkan Fraenkel, J.R (2012, hlm.127) bahwa “achievement tests are mostly used in schools to measure learning or the effectiveness of instruction”. Tes ini dilakukan dua kali yaitu saat pretest dan posttest, dengan menggunakan soal tes yang sama, hal tersebut dilakukan untuk meminimalisir faktor lain (perbedaan kualitas
instrumen) yang dapat mempengaruhi hasil pretest dan posttest, sehingga perbedaan hasil yang diperoleh benar-benar disebabkan oleh pengaruh
treatment yang diberikan.
Penyusunan instrumen ini disesuaikan dengan materi, kompetensi dasar, kompetensi inti yang hendak dicapai oleh siswa dan diadaptasi dari soal-soal TIMSS. Untuk pengembangan instrumen akan dijelaskan pada bagian proses pengembangan instrumen dan perangkat tes achievement dapat dilihat pada lampiran 3.4.
Instrumen ini mencakup dimensi konten yaitu optik dan dimensi kognitif yaitu knowing, applying dan reasoning. Format soal pada tes ini berupa multiple choice dengan empat alternatif pilihan dan pertanyaan essay yang membangun respon siswa (constructed respon). Penskoran soal PG yaitu skor 1 jika menjawab benar dan 0 jika salah. Sedangkan
penskoran soal CR yaitu dengan rentang skor 2 sampai 0. Sedangkan untuk jumlah soal yang diteskan pada setiap domain berbeda-beda yaitu
Tabel 3.1 Distribusi Soal Achievement
Domain TIMSS Nomor Soal Jumlah Soal
Domain Knowing 1,5,10,24,6,7,23,25,13,21,27 11 Domain Applying 4,11,8,22,12,29,17,20,26,2,3 11 Domain Reasoning 9,28,30,32,14,15,16,31,19,18 10
2. Lembar observasi keterlaksanaan levels of inquiry
Lembar observasi ini bertujuan untuk menilai keterlaksanaan levels of inquiry meliputi aktivitas yang dilakukan guru dan siswa. Kegiatan pembelajaran yang diamati mulai dari tahap discovery hingga inquiry lab. Bentuk yang digunakan yaitu menggunakan bentuk checklist (√) dengan skala Guttman (ya-tidak). Jika kegiatan yang tercantum pada lembar observasi terlaksana dalam penerapan levels of inquiry maka observer memberikan tanda checklist (√) pada kolom Ya dengan skor satu, begitu juga sebaliknya. Lembar observasi yang digunakan dalam penelitian dapat dilihat di lampiran 3.6.
3. Transkrip video penerapan Levels of inquiry
Transkrip video ini berisi tentang gambaran interaksi siswa dan guru
selama penerapan levels of inquiry yang terekam melalui video pembelajaran. Bentuk instrumen ini adalah time and motion logs. Fraenkel, J.R (2012, hlm.125) menyatakan bahwa “…a time-and-motion study is the observation and detailed recording over a given period of time of the activities of one or more individuals. Melalui transkrip video ini, peneliti dapat mengambil hal penting yang kemudian dapat dianalisis untuk mengetahui kualitas keterlaksanaan levels of inquiry. Transkrip video yang digunakan dapat dilihat di lampiran 4.5.
4. Lembar Kegiatan Siswa (LKS)
dengan fungsi LKS yang kedua, LKS mampu digunakan untuk melihat
sejauh mana terlatihkannya aspek domain kognitif siswa selama pembelajaran levels of inquiry. Format LKS dapat dilihat di lampiran 2.2.
F. Proses Pengembangan Instrumen
Dalam penelitian ini tidak semua soal tes achievement yang digunakan berasal dari tes yang terstandar, maka instrumen tersebut harus diuji terlebih dahulu supaya diperoleh instrumen yang valid dan reliabel, sehingga diharapkan dapat memberikan hasil penelitian yang benar.
1. Uji Validitas
Validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu instrumen. Sebuah instrumen dikatakan valid apabila
instrumen tersebut mengukur apa yang hendak diukur, artinya instrumen tersebut dapat mengungkap data variabel yang diteliti secara tepat.
(Arikunto. S, 2010, hlm.211 & Sugiyono, 2011, hlm.173). Untuk melihat tingkat validitas suatu tes dalam penelitian ini, maka instrumen tes diujikan dengan dua cara:
a. Pengujian validitas isi (content validity)
Validitas isi adalah validitas yang mengecek kecocokan diantara
butir-butir tes yang dibuat dengan indikator, materi atau tujuan
pembelajaran yang telah ditetapkan (Sugiyono, 2011, hlm.183). Validitas isi hanya dapat ditentukan berdasarkan judgement para ahli, seperti yang dikemukakan oleh Fraenkel, J.R (2012, hlm.125) bahwa
“…a common way to do this is to have someone look at the content and format of the instrument and judge whether or not it is appropriate. … someone who knows enough about what is to be measured to be a competent judge.”
Sehingga dalam penelitian ini, pengujian validitas isi dilakukan
pendapatnya untuk mengecek kesesuaian antara soal dengan konsep,
kesesuaian soal dengan kerangka TIMSS dan indikator serta aspek penyajian soal. Setelah judgement experts melakukan pengecekan instrumen, maka selanjutnya judgement experts memberikan penilaian terhadap setiap butir soal dengan skala penilaian berupa skala rating politomi dengan rentang nilai 1-5, kemudian peneliti melakukan perhitungan validitas isi menggunakan indeks V dari Aiken dengan alasan validitas ini hanya digunakan untuk butir yang penilaiannya menggunakan skala politomi. Adapun rumus indeks V adalah: (Ridho,
A, 2013, hlm.18; Aiken, 1980, hlm.956)
Dengan: V = validitas ; N= banyaknya ahli atau panelis ; c= skor
kategori tertinggi (5); = r – l ; r = nilai rating yang diberikan ahli ;
l = skor kategori terendah (1).
Untuk menginterpretasi nilai validitas isi yang diperoleh dari perhitungan di atas, maka digunakan pengklasifikasian validitas seperti yang ditunjukkan pada Tabel kriteria validitas di bawah ini:
Tabel 3.2. Kriteria Validitas Ahli
Hasil Validitas Kriteria validitas
Berikut ini akan disajikan hasil rekapitulasi validitas isi berdasarkan
hasil judgement ahli.
Tabel 3.3 Rekapitulasi Validitas Ahli
Kriteria Validitas Nomor Soal Jumlah Soal
Tidak Valid - 0
Berdasarkan Tabel 3.3, diperoleh informasi bahwa dari 32 soal pilihan ganda dan constructed response yang dijudgement didapatkan 68,75% memiliki kategori sangat tinggi, 25% dengan kategori tinggi, 3,125 % dengan kategori sedang dan 3,125% dengan kategori rendah. Dikarenakan soal nomor 23 menunjukkan kategori rendah maka peneliti mengganti soal tersebut.
b. Pengujian validitas empiris
Setelah dilakukan pengujian validitas isi oleh tim ahli, maka
instrumen tersebut di uji cobakan kepada siswa kelas IX di SMP Negeri 12 Bandung dengan jumlah sampel uji coba 40 orang. Setelah
di dapatkan hasil uji coba, langkah berikutnya yaitu pengujian validitas butir soal yang dilakukan dengan bantuan Microsoft Excel yaitu dengan teknik korelasi product moment dengan angka kasar yang dikemukakan Pearson sebagai berikut :
dengan N = jumlah siswa;
= koefisien korelasi antara variabel X dan variabel Y = skor tiap butir soal; = skor total tiap butir soal
Dasar mengambil keputusan yaitu jika rhitung > r tabel maka item pertanyaan berkorelasi signifikan terhadap skor total sehingga dinyatakan valid, namun jika rhitung < r tabel maka item pertanyaan tidak berkorelasi signifikan terhadap skor total sehingga dinyatakan tidak
valid. Nilai koefisien korelasi Pearson (rtabel) diambil dengan taraf signifikansi α sebesar 0,05 dan n merupakan banyaknya data yang sesuai. Tabel Pearson dapat dilihat di lampiran 3. Untuk menginterpretasikan nilai koefisien korelasi yang diperoleh dari
dikemukakan oleh Guilford seperti yang ditunjukkan pada Tabel di
Berikut ini akan disajikan hasil rekapitulasi validitas butir soal pilihan ganda berdasarkan hasil uji coba instrument.
Tabel 3.5 Rekapitulasi Validitas Soal Pilihan Ganda
Kriteria Validitas Nomor Soal Jumlah Soal
Sangat tinggi - 0 memiliki kategori sangat rendah dan 10% memiliki kategori tidak valid. Sedangkan untuk hasil rekapitulasi validitas butir soal
constructed respone disajikan pada tabel dibawah ini.
Tabel 3.6 Rekapitulasi Validitas Soal Constructed Response
Kriteria Validitas Nomor Soal Jumlah Soal
Untuk menentukan butir soal mana yang digunakan maka peneliti
menggunakan pertimbangan validitas uji coba dan validitas ahli. Hal ini dikarenakan ketika uji instrumen berlangsung, sampel uji coba
tidak mengerjakan soal dengan serius dan banyak yang saling mencontek, sehingga penentuan butir soal tidak mungkin sepenuhnya didasarkan pada hasil uji coba. Oleh karena itu peneliti mempercayakan kredibilitas tim ahli sebagai bahan pertimbangan untuk memutuskan penentuan butir soal. Soal yang memiliki kriteria rendah menurut validitas uji coba, terlebih dahulu dicocokkan dengan
hasil validitas ahli dengan tujuan apakah memang benar soal tersebut memiliki kriteria rendah berdasarkan kedua hasil validitas. Jika hasil
validitas ahli dan validitas uji coba sama-sama menunjukkan kriteria rendah maka soal tersebut direvisi atau bahkan diganti. Namun
sebaliknya jika validitas ahli menunjukkan hasil yang berkebalikan dengan validitas uji coba maka soal tersebut tetap digunakan.
2. Reliabilitas
Reliabilitas berhubungan dengan masalah kepercayaan. Suatu
instrumen dikatakan reliabel apabila instrumen yang digunakan beberapa kali untuk mengukur obyek yang sama akan menghasilkan data yang sama, meskipun oleh orang, waktu dan tempat yang berbeda pula (Arikunto S, 2009, hlm.86 & Sugiyono, 2011, hlm.173). Untuk pengujian reliabilitas instrumen, peneliti melakukan teknik internal consistency, maksudnya ialah peneliti mengujicobakan instrumen hanya sekali saja,
kemudian data yang diperoleh dari hasil uji coba di analisis. Untuk soal pilihan ganda, teknik analisis yang digunakan ialah teknik Belah Dua
(Split-Half Technique) dengan bantuan Microsoft excel, yaitu dilakukan dengan cara membagi tes menjadi dua bagian yang relatif sama, sehingga
reliabilitas belahan tes dapat dihitung dengan menggunakan rumus
korelasi angka kasar Pearson sebagai berikut:
dengan: n = banyak subjek ; x1 = kelompok data belahan pertama x2 = kelompok data belahan kedua
Untuk mengetahui koefisien reliabilitas alat evaluasi keseluruhan menggunakan rumus Spearman Brown yaitu:
Dengan :
merupakan korelasi antara skor-skor setiap belahan tes
merupakan koefisien reliabilitas yang sudah disesuaikan.
Sedangkan untuk soal constructed response menggunakan teknik analisis alpha cronbach seperti yang dikemukakan oleh Fraenkel, J.R (2012, hlm.158) bahwa “...alpha cronbach to be used in calculating the reliability of items that are not scored right versus wrong, as in some
essay tests where more than one answer is possible”. Adapun rumus perhitungannya adalah (Arikunto S, 2010, hlm.239)
=
Dengan : ; k = banyaknya butir pertanyaan
=jumlah varians butir; =varians total
Kriteria suatu instrumen dikatakan reliable apabila koefisien reliabilitasnya lebih besar dari r tabel. Untuk menginterpretasikan derajat reabilitas instrumen dapat menggunakan tolak ukur yang dikemukakan oleh Guilford seperti yang ditunjukkan pada tabel kriteria reliabilitas di bawah ini:
Koefisien Korelasi Kriteria reliabilitas
0,80 < r ≤ 1,00 Sangat tinggi
0,60 < r ≤ 0,80 Tinggi
0,40 < r ≤ 0,60 Cukup
0,20 < r ≤ 0,40 Rendah
0,00 < r ≤ 0,20 Sangat rendah
Berdasarkan perhitungan yang dilakukan dengan menggunakan rumus spearman brown pada soal pilihan ganda dan dengan rumus alpha cronbach pada soal constructed response maka diperoleh masing-masing nilai reliabilitas yaitu 0,53 dan 0,55. Kedua nilai tersebut berada pada
kategori cukup. Sehingga dapat disimpulkan bahwa instrumen tes yang digunakan pada penelitian ini memiliki tingkat keajegan yang cukup.
3.Taraf Kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau terlalu sulit. Indeks kesukaran adalah bilangan yang menunjukkan sukar atau mudahnya suatu soal. Besarnya indeks kesukaran antara 0,00 (sukar) sampai 1,00 (mudah). Rumus mencari indeks kesukaran adalah :
keterangan :
P : indeks kesukaran
B : banyaknya siswa yang menjawab soal itu dengan betul JS : jumlah seluruh siswa peserta tes
Tabel 3.8. Klasifikasi Indeks Kesukaran
Indeks kesukaran Kriteria
0,00 – 0,30 Sukar
0,3 1– 0,70 Sedang
0,71 – 1,00 Mudah
(Arikunto.S, 2009, hlm..207-210) Tabel dibawah menyajikan hasil taraf kesukaran tiap butir soal setelah dilakukan uji coba instrumen
Tabel 3.9 Rekapitulasi Tingkat Kesukaran
Kriteria Nomor Soal Jumlah Soal
Sukar 17, 21, 23, 24, 25, 31, 32 7
Mudah 1,2,3,5,6,7,8,9,10,11,12,13,16,19,27 15
Berdasarkan tabel diatas diperoleh informasi bahwa dari 32 soal yang diujicobakan maka 21,875% berada pada kategori sukar, 31,25 % berada pada kategori sedang dan 46,875% berada pada kategori mudah.
4. Daya Pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk
membedakan antara siswa yang pandai dengan siswa yang tidak pandai. Angka yang menunjukkan besarnya daya pembeda disebut indeks
diskriminasi. Indeks ini berkisar antara 0,00 sampai 1,00. Berbeda dengan tingkat kesukaran, pada indeks diskriminasi terdapat tanda negatif. Rumus
untuk menentukan daya pembeda adalah :
Keterangan : D : daya pembeda
BA : banyaknya peserta kelompok atas yang menjawab soal tersebut dengan benar
BB : banyaknya peserta kelompok bawah yang menjawab soal tersebut
dengan benar
JA : banyaknya peserta kelompok atas JB : banyaknya peserta kelompok bawah
PA : proporsi peserta kelompok atas yang menjawab benar PB : proporsi peserta kelompok bawah yang menjawab benar
Tabel 3.10. Klasifikasi Daya Pembeda
Daya pembeda Kriteria
0,71 – 1,00 Baik sekali
0,41 – 0,70 Baik
0,21 – 0,40 Cukup
0,00 – 0,20 Jelek
(Arikunto.S, 2009, hlm. 211-218) Berikut ini akan disajikan hasil rekapitulasi daya pembeda butir soal
pilihan ganda dan constructed response berdasarkan hasil uji coba instrument.
Tabel 3.11 Rekapitulasi Daya Pembeda Soal Pilihan Ganda
Baik sekali 4,23 2 diujicobakan diperoleh 6,25% dari soal total memiliki kriteria baik sekali, 9,375% memiliki kriteria baik, 37,5% memiliki kriteria cukup dan 46,8% memiliki kriteria jelek. Banyaknya soal dengan daya pembeda jelek
dikarenakan saat uji coba instrumen banyak siswa yang saling bekerja sama dan menjawab secara asal. Secara keseluruhan hasil uji coba
instrumen dipaparkan pada tabel di bawah ini.
Tabel. 3.12 Hasil Pengembangan Instrumen
N o
Validitas Reliabilitas Daya Pembeda Tingkat Kesukaran Validitas Ahli
Keterangan Nilai Kategori Nilai Kategori Nilai Kategori Nilai Kategori Nilai Kategori
27 0.21 Rendah 0.53 Sedang -0.05 Sangat
Jelek 0.775 Mudah 0.667 Tinggi Dipakai 28 0.46 Sedang 0.53 Sedang 0.35 Cukup 0.625 Sedang 0.896 Sgt Tinggi Dipakai 29 0.53 Sedang 0.55 Sedang 0.6 Baik 0.475 Sedang 0.875 Sgt Tinggi Dipakai 30 0.15 Sangat
Rendah 0.53 Sedang 0.15 Jelek 0.325 Sedang 0.854 Sgt Tinggi Dipakai 31 0.47 Sedang 0.55 Sedang 0.15 Jelek 0.0375 Sukar 0.938 Sgt Tinggi Dipakai 32 0.57 Sedang 0.55 Sedang 0.35 Cukup 0.1125 Sukar 1 Sgt Tinggi Dipakai
G. Teknik Pengumpulan Data
Dalam penelitian ini, teknik pengumpulan data yang digunakan adalah sebagai berikut.
1. Tes
Tes yang dilakukan peneliti ialah tes achievement. Tes ini digunakan untuk mengukur peningkatan achievement siswa sebelum dan sesudah treatment levels of inquiry. Waktu pelaksanaannya ialah 80 menit.
2. Observasi
Teknik observasi yang digunakan dalam penelitian ini adalah teknik observasi nonpartisan karena peneliti tidak sebagai pengamat, namun peneliti meminta tiga orang yang bertugas sebagai pengamat independen artinya ketiga orang tersebut hanya mengamati kegiatan pembelajaran, tetapi tidak terlibat dalam kegiatan pembelajaran. Jenis observasi nonpartisipan yang dipilih peneliti ialah observasi terstruktur karena observasi tersebut telah dirancang secara sistematis tentang hal apa yang
akan diamati melalui lembar observasi.
3. Metode Dokumentasi dengan Video Rekaman
Video rekaman digunakan untuk merekam penerapan levels of inquiry selama pembelajaran berlangsung. Peneliti meminta tolong satu orang untuk bertugas merekam pembelajaran. Setelah di dapatkan rekaman video
maka peneliti mentranskripkan video dan menganalisis apakah tahapan levels of inquiry telah di lakukan dengan baik atau tidak.
H. Analisis Data
Teknik pengolahan data untuk tes achievement dilakukan dengan menghitung selisih persentase skor pretest dan skor posttest serta menghitung nilai effet size. Perhitungan effect size dimaksudkan untuk mengetahui besarnya peningkatan achievement siswa setelah diterapkan levels of inquiry. Rosenthal (dalam Dunst, C.J, dkk, 2004, hlm.1) menyatakan bahwa “an effect size is a measure of the magnitude of the strength of a relationship between an independent (intervention) and dependent (outcome) variable”. Selain itu, salah satu artikel yang berjudul understanding, using and calculating effect size mengemukakan bahwa
In an educational setting, effect size is one way to measure the effectiveness of a particular intervention. Effect size enables us to measure both the improvement (gain) in learner achievement for a group of learners and the variation of student performances expressed on a standardised scale. (Government of South Australia, 2014, hlm.1) Tidak hanya itu Schagen, I (2009, hlm.3) juga menyatakan bahwa effect size dapat digunakan untuk membandingkan progress dari waktu ke waktu
“… to compare progress over time on the same test (most common use)…”. Melalui effect size juga dapat menunjukkan seberapa besar kontribusi penerapan treatment levels of inquiry terhadap achievement siswa, seperti yang dikemukakan Schagen, I (2009, hlm.2) bahwa “an effect size is a measure that is independent of the original units of measurement; it can be a useful way to measure how much effect a treatment or intervention had”. Adapun langkah-langkah yang digunakan dalam pengolahan data adalah sebagai berikut:
a. Pemberian skor soal PG dengan metode right only, yaitu jawaban benar diberi skor 1 dan jawaban salah atau soal yang tidak di jawab
diberi skor 0. Total skor setiap siswa diperoleh dengan menghitung jawaban benar yang dijawab siswa
c. Penggabungan skor pilihan ganda dan constructed response dilakukan dengan menjumlahkan skor soal pilihan ganda dan soal constructed response sehingga didapatkan skor total
Stotal = SPG + SCR
dengan Stotal = skor total, SPG = skor pilihan ganda dan SCR = skor constructed response
d. Perhitungan persentase skor total pretest dan persentase skor total posttest, dengan cara sebagai berikut:
e. Perhitungan persentase skor gain diperoleh dari selisih persentase skor pretest (Si) dengan persentase skor posttest (Sf). Perhitungan persentase
skor gain dapat menggunakan rumus % G = % Sf – % Si
Setelah didapatkan selisih persentase skor pretest dan skor posttest, langkah selanjutnya yaitu menghitung nilai effect size sebagai berikut: a. Menghitung korelasi antara baseline (pretest) dengan intervention
(posttest) dengan menggunakan rumus korelasi product moment. Nilai korelasi yang diperoleh kemudian diinterpretasi sesuai dengan Tabel 3.2 sebelumnya. Dengan perhitungan korelasi maka peneliti dapat menentukan rumusan yang digunakan untuk menghitung besar effect size. Dikarenakan korelasi yang diperoleh termasuk kategori kecil, maka rumus effect size yang digunakan adalah sebagai berikut:
Cohen (dalam Duns, dkk. 2004, hlm. 6)
dengan d = effect size, = mean posttest, mean pretest, = standar deviasi pretest dan = standar deviasi posttest
Tabel 3.13 Interpretasi Effect Size
Effect Size (d) Kategori
0,0 - 0,1 Tidak berpengaruh (negligible effect)
0,2- 0,4 Kecil (small effect)
0,4 - 0,7 Sedang (medium effect) 0,8 – tak hingga Besar (large effect)
c. Untuk pengolahan achievement siswa pada setiap topik konten optik, peneliti menentukan tingkat penguasaan konsep siswa berdasarkan kriteria yang dikemukakan oleh Arikunto (2009) berikut ini
Tabel 3.14 Tafsiran Kriteria Kemampuan
Persentase Skor (%) Tafsiran
81-100 Sangat Baik
61-80 Baik
41-60 Cukup
21-40 Kurang
0-20 Sangat Kurang
2. Data Observasi Keterlaksanaan Levels of inquiry
Untuk mengetahui keterlaksanaan levels of inquiry, maka peneliti melakukan perhitungan keterlaksanaan levels of inquiry dari setiap tahapan levels of inquiry yaitu dengan menggunakan rumus sebagai berikut;
Kemudian penafsiran hasil perhitungan menggunakan kategori keterlaksanaan sesuai tabel di bawah ini.
Tabel 3.15. Interpretasi Keterlaksanaan
% kate gori kete rlaksanaan (KM) Kate gori
KM = 0 Tidak satupun kegiatan terlaksana
Sebagian kecil kegiatan terlaksana
Hampir setengah kegiatan terlaksana
KM = 50 Setengah kegiatan terlaksana
Sebagaian besar kegiatan terlaksana
Hampir seluruh kegiatan terlaksana
KM = 100 Seluruh kegiatan terlaksana
(Budiarti dalam Koswara, 2010)
Untuk melihat seberapa besar setiap aspek domain kognitif siswa yang
terlatihkan melalui LKS, maka peneliti menghitung dengan menggunakan rumus di bawah ini, kemudian menafsirkan kategori kemampuan yang