S FIS 1000294 Chapter3

(1)

BAB III

METODE PENELITIAN

A. Lokasi dan Subjek Populasi atau Sampel Penelitian

Lokasi yang digunakan dalam penelitian ini adalah salah satu SMP Negeri di kota Bandung. Alasan peneliti memilih lokasi tersebut dikarenakan sekolah tersebut memiliki sarana laboratorium IPA yang layak, alat-alat eksperimen yang ada di sekolah tersebut cukup lengkap dan sekolah tersebut telah terakreditasi A, sehingga peneliti berasumsi bahwa sekolah tersebut sesuai untuk dilakukan penelitian dengan treatment levels of inquiry.

Populasi yang diambil dalam penelitian ini adalah seluruh siswa kelas VIII di SMP tersebut, dengan jumlah populasi 437 orang, namun dikarenakan

keterbatasan dana, tenaga dan waktu, maka peneliti hanya mengambil sampel dari populasi tersebut. Untuk penentuan ukuran sampel disesuaikan dengan

saran dari ahli Roscoe yaitu “ukuran sampel yang layak dalam penelitian adalah antara 30 sampai dengan 500 orang” (Sugiyono, 2011, hlm.131). Metode pengambilan sampel yang digunakan dalam penelitian ini adalah nonrandom sampling yaitu pengambilan sampel yang tidak memberikan peluang yang sama bagi setiap anggota populasi untuk dipilih menjadi anggota

sampel, seperti yang dikemukakan oleh Fraenkel, J.R (2012, hlm.94)

bahwa“…each of the individuals selected must possess all the criteria mentioned. Each member of the population does not have an equal chance of being selected”. Dikarenakan kondisi sekolah yang tidak memperbolehkan untuk mengubah kelas yang sudah ada, maka pengambilan sampel tidak mungkin dilakukan secara random dan hanya mungkin dipilih secara nonrandom sampling. Adapun teknik sampling yang digunakan ialah purposive sampling yaitu pengambilan anggota sampel dari populasi yang dilakukan dengan pertimbangan tertentu (Sugiyono, 2011, hlm.120). Beberapa pertimbangan yang dijadikan acuan pemilihan sampel yaitu didasarkan atas

(2)

tersebut relatif mudah dikondisikan dan siswanya lebih aktif dalam

pembelajaran, sehingga berdasarkan pertimbangan tersebut, maka sampel yang digunakan dalam penelitian ini adalah 37 orang siswa kelas VIII A di

salah satu SMP Negeri di kota Bandung tahun ajaran 2013-2014.

B. Desain Penelitian

Desain penelitian yang dipilih dalam penelitian ini adalah one-group pretest-posttest design. Dalam desain penelitian ini tidak terdapat kelompok pembanding atau kontrol, seperti yang dikemukakan Creswell, J.W (1994, hlm.130) bahwa “…with preexperimental design, the research does not have

a control group to compare with the experimental group”. Selain itu terdapat pretest sebelum diberikan perlakuan, seperti yang dikemukakan Fraenkel, J.R (2012, hlm. 269) bahwa “in the one-group pretest-posttest design , a single group is measured or observed not only after being exposed to a treatment of

some sort, but also before”, dengan demikian hasil perlakuan dapat diketahui lebih akurat, karena dapat membandingkan keadaan sebelum dengan keadaan sesudah diberi perlakuan (Sugiyono, 2011, hlm.110-111). Pola desain ini dapat diilustrasikan sebagai berikut: (Sugiyono, 2011, hlm.111; Creswell,

J.W, 1994, hlm.130; Fraenkel, J.R, 2012, hlm. 269)

O1 = pretest (sebelum diberi treatment) O2 = posttest (setelah diberi treatment) X = treatment levels of inquiry

Alasan peneliti memilih design penelitian ini adalah (1) disesuaikan

dengan tujuan penelitian yaitu untuk mengetahui peningkatan achievement siswa SMP setelah diterapkan levels of inquiry, karena dengan desain ini peneliti dapat memperoleh peningkatan achievement siswa dari selisih nilai tes sebelum dengan sesudah diberi perlakuan; (2) disesuaikan dengan teknik

sampling yang digunakan yaitu purposive sampling; (3) keterbatasan peneliti untuk dapat mengontrol semua variabel luar yang mungkin mempengaruhi penelitian.

O

1

X O

2

(3)

Secara lengkap prosedur penelitian akan dijelaskan sebagai berikut:

Tahap Persiapan:

Kegiatan yang dilakukan dalam tahapan ini adalah :

a. Menentukan sekolah yang dijadikan lokasi penelitian, membuat surat perizinan dari universitas dan menghubungi pihak sekolah

b. Melaksanakan studi pendahuluan, meliputi observasi, wawancara guru dan siswa serta tes soal TIMSS untuk mengetahui kemampuan siswa.

c. Merumuskan masalah terkait adanya ketidaksesuaian antara fakta dilapangan dengan kondisi ideal yang ada pada teori

d. Melaksanakan studi literatur dan studi kurikulum untuk mencari solusi permasalahan

e. Menentukan variabel, sampel serta desain penelitian yang akan digunakan. f. Menyiapkan perangkat pembelajaran berupa RPP dan LKS

g. Membuat dan menyusun instrumen penelitian berupa soal achievement dan lembar keterlaksanaan levels of inquiry

h. Membuat dan menguji coba set alat percobaan yang akan digunakan dalam pembelajaran

i. Menjudgement instrumen penelitian kepada judgement expert

j. Merevisi kembali hasil judgment, kemudian menunjukkan instrumen yang sudah direvisi dan meminta penilaian judgement expert

k. Melakukan uji coba instrumen dan menganalisis butir soal (validitas, reliabilitas, tingkat kesukaran dan daya pembeda)

l. Menentukan butir soal mana yang akan dipakai

Tahap Pelaksanaan

a. Memberikan pretest berupa tes achievement pada pokok bahasan optik untuk mengetahui kemampuan awal siswa

(4)

c. Selama diberikan treatment, siswa diberikan Lembar Kegiatan Siswa dan juga dilakukan perekaman video serta penilaian observer pada lembar keterlaksanaan levels of inquiry

d. Memberikan posttest berupa tes achievement pada pokok bahasan optik untuk mengetahui peningkatan achievement siswa setelah diterapkan levels of inquiry.

Tahap Akhir

a. Mengolah data hasil pretest, posttest, LKS dan lembar observasi. b. Menganalisis dan membahas hasil penelitian.

c. Memberikan simpulan berdasarkan hasil penelitian serta saran

untuk pengembangan penelitian selanjutnya.

Secara singkat prosedur penelitian digambarkan sesuai diagram di bawah ini:

TAHAP PERSIAPAN

Melaksanakan Studi literature & studi kurikulum

Merumuskan masalah, sampel,variabel dan desain penelitian

Judgement instrument dan revisi

Membuat RPP, instrument penelitian, alat percobaan Menentukan sekolah tempat penelitian

Membuat surat izin studi pendahuluan, Menghubungi pihak sekolah

Melaksanakan studi pendahuluan

Uji coba instrument dan revisi

(5)

C. Metode Penelitian

Penentuan metode penelitian didasarkan pada rumusan masalah serta tujuan penelitian yang hendak dicapai yaitu ingin mengetahui peningkatan achievement siswa setelah diterapkan levels of inquiry, sehingga metode penelitian yang dipilih adalah eksperimental-deskriptif. Fraenkel, J.R (2012, hlm. 265) menyatakan bahwa karakteristik metode ini yaitu “in an experimental study, researchers look at the effect(s) of at least one independent variable on one or more dependent variables”. Jenis metode eksperimental yang digunakan dalam penelitian ini adalah pre-experimental design. Jenis pre-experimental design menyaratkan bahwa sampling yang dipilih tidak boleh dilakukan secara random (Sugiyono, 2011, hlm.74) karena masih terdapat variabel luar yang ikut berpengaruh terhadap terbentuknya

variabel dependen, seperti yang dikemukakan Fraenkel,J.R (2012, hlm. 269) bahwa “… poor experimental designdo not have built-in controls for threats to internal validity. In addition to the independent variable, there are a

number of other plausible explanations for any outcomes that occur”. Selain itu digunakan juga metode deskriptif yaitu metode yang ditujukan untuk menggambarkan secara sistematis fakta atau karakteristik objek yang diteliti secara tepat (Sukardi, 2009, hlm. 157).

Gambar 3.2 Skema Prosedur Penelitian TAHAP

AKHIR TAHAP PELAKSANAAN

Pretest acvhievement siswa berdasarkan kerangka TIMSS

Penerapan levels of inquiry dan perekaman video

Posttest acvhievement siswa berdasarkan kerangka TIMSS

Pengolahan data penelitian

Kesimpulan dan saran Analisis data penelitian

(6)

D. Definisi Operasional

Variabel-variabel yang akan diteliti didefiniskan secara operasional sebagai berikut:

1. Levels of inquiry merupakan model pembelajaran yang diterapkan secara komprehensif dan sistematis, bertujuan untuk meningkatkan pemahaman konseptual siswa serta mengembangkan pemahaman siswa tentang penyelidikan ilmiah dan sifat ilmu pengetahuan. Tahapan pada levels of inquiry adalah discovery learning, interactive demonstration, inquiry lesson, inquiry laboratory, real-word application, dan hypothetical inquiry. Dalam penelitian ini, tahapan levels of inquiry yang digunakan ialah mulai dari discovery learning hingga guided-inquiry laboratory dengan alasan disesuaikan tingkat subjek penelitian yaitu siswa SMP. Untuk melihat keterlaksanaan levels of inquiry digunakan lembar observasi keterlaksanaan levels of inquiry dan transkrip rekaman video penerapan levels of inquiry.

2. Achievement adalah hasil yang dicapai oleh seseorang setelah mengalami pembelajaran dan bersifat kognitif. Achievement yang dimaksud mengacu pada kerangka penilaian TIMSS 2015 yang terdiri dari dua dimensi yaitu

dimensi konten dan dimensi kognitif. Untuk menentukan seberapa besar

peningkatan achievement siswa digunakan perhitungan persentase skor gain (selisih posttest dan pretest) serta effect size-Cohen (d).

E. Instrumen Penelitian

Instrumen penelitian merupakan sebuah alat yang digunakan untuk

mengumpulkan data. Bentuk instrumen yang digunakan adalah tes dan non tes. Instrumen bentuk tes yang digunakan mencangkup tes achievement, sedangkan instrumen bentuk non tes yang digunakan mencakup penilaian LKS dan transkrip video. Penjelasan instrumen penelitian yang digunakan dalam

(7)

1. Tes achievement

Instrumen tes yang digunakan dalam penelitian ini adalah instrumen tes achievement. Fraenkel, J.R (2012, hlm.127) menyatakan bahwa “achievement tests measure an individual’s knowledge or skill in a given

area or subject”. Tes ini digunakan untuk mengukur peningkatan achievement siswa setelah diberikan treatment levels of inquiry. Hal tersebut senada dengan pernyataan yang diungkapkan Fraenkel, J.R (2012, hlm.127) bahwa “achievement tests are mostly used in schools to measure learning or the effectiveness of instruction”. Tes ini dilakukan dua kali yaitu saat pretest dan posttest, dengan menggunakan soal tes yang sama, hal tersebut dilakukan untuk meminimalisir faktor lain (perbedaan kualitas

instrumen) yang dapat mempengaruhi hasil pretest dan posttest, sehingga perbedaan hasil yang diperoleh benar-benar disebabkan oleh pengaruh

treatment yang diberikan.

Penyusunan instrumen ini disesuaikan dengan materi, kompetensi dasar, kompetensi inti yang hendak dicapai oleh siswa dan diadaptasi dari soal-soal TIMSS. Untuk pengembangan instrumen akan dijelaskan pada bagian proses pengembangan instrumen dan perangkat tes achievement dapat dilihat pada lampiran 3.4.

Instrumen ini mencakup dimensi konten yaitu optik dan dimensi kognitif yaitu knowing, applying dan reasoning. Format soal pada tes ini berupa multiple choice dengan empat alternatif pilihan dan pertanyaan essay yang membangun respon siswa (constructed respon). Penskoran soal PG yaitu skor 1 jika menjawab benar dan 0 jika salah. Sedangkan

penskoran soal CR yaitu dengan rentang skor 2 sampai 0. Sedangkan untuk jumlah soal yang diteskan pada setiap domain berbeda-beda yaitu

(8)

Tabel 3.1 Distribusi Soal Achievement

Domain TIMSS Nomor Soal Jumlah Soal

Domain Knowing 1,5,10,24,6,7,23,25,13,21,27 11 Domain Applying 4,11,8,22,12,29,17,20,26,2,3 11 Domain Reasoning 9,28,30,32,14,15,16,31,19,18 10

2. Lembar observasi keterlaksanaan levels of inquiry

Lembar observasi ini bertujuan untuk menilai keterlaksanaan levels of inquiry meliputi aktivitas yang dilakukan guru dan siswa. Kegiatan pembelajaran yang diamati mulai dari tahap discovery hingga inquiry lab. Bentuk yang digunakan yaitu menggunakan bentuk checklist (√) dengan skala Guttman (ya-tidak). Jika kegiatan yang tercantum pada lembar observasi terlaksana dalam penerapan levels of inquiry maka observer memberikan tanda checklist (√) pada kolom Ya dengan skor satu, begitu juga sebaliknya. Lembar observasi yang digunakan dalam penelitian dapat dilihat di lampiran 3.6.

3. Transkrip video penerapan Levels of inquiry

Transkrip video ini berisi tentang gambaran interaksi siswa dan guru

selama penerapan levels of inquiry yang terekam melalui video pembelajaran. Bentuk instrumen ini adalah time and motion logs. Fraenkel, J.R (2012, hlm.125) menyatakan bahwa “…a time-and-motion study is the observation and detailed recording over a given period of time of the activities of one or more individuals. Melalui transkrip video ini, peneliti dapat mengambil hal penting yang kemudian dapat dianalisis untuk mengetahui kualitas keterlaksanaan levels of inquiry. Transkrip video yang digunakan dapat dilihat di lampiran 4.5.

4. Lembar Kegiatan Siswa (LKS)

(9)

dengan fungsi LKS yang kedua, LKS mampu digunakan untuk melihat

sejauh mana terlatihkannya aspek domain kognitif siswa selama pembelajaran levels of inquiry. Format LKS dapat dilihat di lampiran 2.2.

F. Proses Pengembangan Instrumen

Dalam penelitian ini tidak semua soal tes achievement yang digunakan berasal dari tes yang terstandar, maka instrumen tersebut harus diuji terlebih dahulu supaya diperoleh instrumen yang valid dan reliabel, sehingga diharapkan dapat memberikan hasil penelitian yang benar.

1. Uji Validitas

Validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu instrumen. Sebuah instrumen dikatakan valid apabila

instrumen tersebut mengukur apa yang hendak diukur, artinya instrumen tersebut dapat mengungkap data variabel yang diteliti secara tepat.

(Arikunto. S, 2010, hlm.211 & Sugiyono, 2011, hlm.173). Untuk melihat tingkat validitas suatu tes dalam penelitian ini, maka instrumen tes diujikan dengan dua cara:

a. Pengujian validitas isi (content validity)

Validitas isi adalah validitas yang mengecek kecocokan diantara

butir-butir tes yang dibuat dengan indikator, materi atau tujuan

pembelajaran yang telah ditetapkan (Sugiyono, 2011, hlm.183). Validitas isi hanya dapat ditentukan berdasarkan judgement para ahli, seperti yang dikemukakan oleh Fraenkel, J.R (2012, hlm.125) bahwa

“…a common way to do this is to have someone look at the content and format of the instrument and judge whether or not it is appropriate. … someone who knows enough about what is to be measured to be a competent judge.”

Sehingga dalam penelitian ini, pengujian validitas isi dilakukan

(10)

pendapatnya untuk mengecek kesesuaian antara soal dengan konsep,

kesesuaian soal dengan kerangka TIMSS dan indikator serta aspek penyajian soal. Setelah judgement experts melakukan pengecekan instrumen, maka selanjutnya judgement experts memberikan penilaian terhadap setiap butir soal dengan skala penilaian berupa skala rating politomi dengan rentang nilai 1-5, kemudian peneliti melakukan perhitungan validitas isi menggunakan indeks V dari Aiken dengan alasan validitas ini hanya digunakan untuk butir yang penilaiannya menggunakan skala politomi. Adapun rumus indeks V adalah: (Ridho,

A, 2013, hlm.18; Aiken, 1980, hlm.956)

Dengan: V = validitas ; N= banyaknya ahli atau panelis ; c= skor

kategori tertinggi (5); = r – l ; r = nilai rating yang diberikan ahli ;

l = skor kategori terendah (1).

Untuk menginterpretasi nilai validitas isi yang diperoleh dari perhitungan di atas, maka digunakan pengklasifikasian validitas seperti yang ditunjukkan pada Tabel kriteria validitas di bawah ini:

Tabel 3.2. Kriteria Validitas Ahli

Hasil Validitas Kriteria validitas

Berikut ini akan disajikan hasil rekapitulasi validitas isi berdasarkan

hasil judgement ahli.

Tabel 3.3 Rekapitulasi Validitas Ahli

Kriteria Validitas Nomor Soal Jumlah Soal

(11)

Tidak Valid - 0

Berdasarkan Tabel 3.3, diperoleh informasi bahwa dari 32 soal pilihan ganda dan constructed response yang dijudgement didapatkan 68,75% memiliki kategori sangat tinggi, 25% dengan kategori tinggi, 3,125 % dengan kategori sedang dan 3,125% dengan kategori rendah. Dikarenakan soal nomor 23 menunjukkan kategori rendah maka peneliti mengganti soal tersebut.

b. Pengujian validitas empiris

Setelah dilakukan pengujian validitas isi oleh tim ahli, maka

instrumen tersebut di uji cobakan kepada siswa kelas IX di SMP Negeri 12 Bandung dengan jumlah sampel uji coba 40 orang. Setelah

di dapatkan hasil uji coba, langkah berikutnya yaitu pengujian validitas butir soal yang dilakukan dengan bantuan Microsoft Excel yaitu dengan teknik korelasi product moment dengan angka kasar yang dikemukakan Pearson sebagai berikut :

dengan N = jumlah siswa;

= koefisien korelasi antara variabel X dan variabel Y = skor tiap butir soal; = skor total tiap butir soal

Dasar mengambil keputusan yaitu jika rhitung > r tabel maka item pertanyaan berkorelasi signifikan terhadap skor total sehingga dinyatakan valid, namun jika rhitung < r tabel maka item pertanyaan tidak berkorelasi signifikan terhadap skor total sehingga dinyatakan tidak

valid. Nilai koefisien korelasi Pearson (rtabel) diambil dengan taraf signifikansi α sebesar 0,05 dan n merupakan banyaknya data yang sesuai. Tabel Pearson dapat dilihat di lampiran 3. Untuk menginterpretasikan nilai koefisien korelasi yang diperoleh dari

(12)

dikemukakan oleh Guilford seperti yang ditunjukkan pada Tabel di

Berikut ini akan disajikan hasil rekapitulasi validitas butir soal pilihan ganda berdasarkan hasil uji coba instrument.

Tabel 3.5 Rekapitulasi Validitas Soal Pilihan Ganda

Sangat tinggi - 0 memiliki kategori sangat rendah dan 10% memiliki kategori tidak valid. Sedangkan untuk hasil rekapitulasi validitas butir soal

constructed respone disajikan pada tabel dibawah ini.

Tabel 3.6 Rekapitulasi Validitas Soal Constructed Response

(13)

Untuk menentukan butir soal mana yang digunakan maka peneliti

menggunakan pertimbangan validitas uji coba dan validitas ahli. Hal ini dikarenakan ketika uji instrumen berlangsung, sampel uji coba

tidak mengerjakan soal dengan serius dan banyak yang saling mencontek, sehingga penentuan butir soal tidak mungkin sepenuhnya didasarkan pada hasil uji coba. Oleh karena itu peneliti mempercayakan kredibilitas tim ahli sebagai bahan pertimbangan untuk memutuskan penentuan butir soal. Soal yang memiliki kriteria rendah menurut validitas uji coba, terlebih dahulu dicocokkan dengan

hasil validitas ahli dengan tujuan apakah memang benar soal tersebut memiliki kriteria rendah berdasarkan kedua hasil validitas. Jika hasil

validitas ahli dan validitas uji coba sama-sama menunjukkan kriteria rendah maka soal tersebut direvisi atau bahkan diganti. Namun

sebaliknya jika validitas ahli menunjukkan hasil yang berkebalikan dengan validitas uji coba maka soal tersebut tetap digunakan.

2. Reliabilitas

Reliabilitas berhubungan dengan masalah kepercayaan. Suatu

instrumen dikatakan reliabel apabila instrumen yang digunakan beberapa kali untuk mengukur obyek yang sama akan menghasilkan data yang sama, meskipun oleh orang, waktu dan tempat yang berbeda pula (Arikunto S, 2009, hlm.86 & Sugiyono, 2011, hlm.173). Untuk pengujian reliabilitas instrumen, peneliti melakukan teknik internal consistency, maksudnya ialah peneliti mengujicobakan instrumen hanya sekali saja,

kemudian data yang diperoleh dari hasil uji coba di analisis. Untuk soal pilihan ganda, teknik analisis yang digunakan ialah teknik Belah Dua

(Split-Half Technique) dengan bantuan Microsoft excel, yaitu dilakukan dengan cara membagi tes menjadi dua bagian yang relatif sama, sehingga

(14)

reliabilitas belahan tes dapat dihitung dengan menggunakan rumus

korelasi angka kasar Pearson sebagai berikut:

dengan: n = banyak subjek ; x1 = kelompok data belahan pertama x2 = kelompok data belahan kedua

Untuk mengetahui koefisien reliabilitas alat evaluasi keseluruhan menggunakan rumus Spearman Brown yaitu:

Dengan :

merupakan korelasi antara skor-skor setiap belahan tes

merupakan koefisien reliabilitas yang sudah disesuaikan.

Sedangkan untuk soal constructed response menggunakan teknik analisis alpha cronbach seperti yang dikemukakan oleh Fraenkel, J.R (2012, hlm.158) bahwa “...alpha cronbach to be used in calculating the reliability of items that are not scored right versus wrong, as in some

essay tests where more than one answer is possible”. Adapun rumus perhitungannya adalah (Arikunto S, 2010, hlm.239)

=

Dengan : ; k = banyaknya butir pertanyaan

=jumlah varians butir; =varians total

Kriteria suatu instrumen dikatakan reliable apabila koefisien reliabilitasnya lebih besar dari r tabel. Untuk menginterpretasikan derajat reabilitas instrumen dapat menggunakan tolak ukur yang dikemukakan oleh Guilford seperti yang ditunjukkan pada tabel kriteria reliabilitas di bawah ini:

(15)

Koefisien Korelasi Kriteria reliabilitas

0,80 < r ≤ 1,00 Sangat tinggi

0,60 < r ≤ 0,80 Tinggi

0,40 < r ≤ 0,60 Cukup

0,20 < r ≤ 0,40 Rendah

0,00 < r ≤ 0,20 Sangat rendah

Berdasarkan perhitungan yang dilakukan dengan menggunakan rumus spearman brown pada soal pilihan ganda dan dengan rumus alpha cronbach pada soal constructed response maka diperoleh masing-masing nilai reliabilitas yaitu 0,53 dan 0,55. Kedua nilai tersebut berada pada

kategori cukup. Sehingga dapat disimpulkan bahwa instrumen tes yang digunakan pada penelitian ini memiliki tingkat keajegan yang cukup.

3.Taraf Kesukaran

Soal yang baik adalah soal yang tidak terlalu mudah atau terlalu sulit. Indeks kesukaran adalah bilangan yang menunjukkan sukar atau mudahnya suatu soal. Besarnya indeks kesukaran antara 0,00 (sukar) sampai 1,00 (mudah). Rumus mencari indeks kesukaran adalah :

keterangan :

P : indeks kesukaran

B : banyaknya siswa yang menjawab soal itu dengan betul JS : jumlah seluruh siswa peserta tes

Tabel 3.8. Klasifikasi Indeks Kesukaran

Indeks kesukaran Kriteria

0,00 – 0,30 Sukar

0,3 1– 0,70 Sedang

0,71 – 1,00 Mudah

(Arikunto.S, 2009, hlm..207-210) Tabel dibawah menyajikan hasil taraf kesukaran tiap butir soal setelah dilakukan uji coba instrumen

Tabel 3.9 Rekapitulasi Tingkat Kesukaran

Kriteria Nomor Soal Jumlah Soal

Sukar 17, 21, 23, 24, 25, 31, 32 7

(16)

Mudah 1,2,3,5,6,7,8,9,10,11,12,13,16,19,27 15

Berdasarkan tabel diatas diperoleh informasi bahwa dari 32 soal yang diujicobakan maka 21,875% berada pada kategori sukar, 31,25 % berada pada kategori sedang dan 46,875% berada pada kategori mudah.

4. Daya Pembeda

Daya pembeda soal adalah kemampuan suatu soal untuk

membedakan antara siswa yang pandai dengan siswa yang tidak pandai. Angka yang menunjukkan besarnya daya pembeda disebut indeks

diskriminasi. Indeks ini berkisar antara 0,00 sampai 1,00. Berbeda dengan tingkat kesukaran, pada indeks diskriminasi terdapat tanda negatif. Rumus

untuk menentukan daya pembeda adalah :

Keterangan : D : daya pembeda

BA : banyaknya peserta kelompok atas yang menjawab soal tersebut dengan benar

BB : banyaknya peserta kelompok bawah yang menjawab soal tersebut

dengan benar

JA : banyaknya peserta kelompok atas JB : banyaknya peserta kelompok bawah

PA : proporsi peserta kelompok atas yang menjawab benar PB : proporsi peserta kelompok bawah yang menjawab benar

Tabel 3.10. Klasifikasi Daya Pembeda

Daya pembeda Kriteria

0,71 – 1,00 Baik sekali

0,41 – 0,70 Baik

0,21 – 0,40 Cukup

0,00 – 0,20 Jelek

(Arikunto.S, 2009, hlm. 211-218) Berikut ini akan disajikan hasil rekapitulasi daya pembeda butir soal

pilihan ganda dan constructed response berdasarkan hasil uji coba instrument.

Tabel 3.11 Rekapitulasi Daya Pembeda Soal Pilihan Ganda

(17)

Baik sekali 4,23 2 diujicobakan diperoleh 6,25% dari soal total memiliki kriteria baik sekali, 9,375% memiliki kriteria baik, 37,5% memiliki kriteria cukup dan 46,8% memiliki kriteria jelek. Banyaknya soal dengan daya pembeda jelek

dikarenakan saat uji coba instrumen banyak siswa yang saling bekerja sama dan menjawab secara asal. Secara keseluruhan hasil uji coba

instrumen dipaparkan pada tabel di bawah ini.

Tabel. 3.12 Hasil Pengembangan Instrumen

N o

Validitas Reliabilitas Daya Pembeda Tingkat Kesukaran Validitas Ahli

Keterangan Nilai Kategori Nilai Kategori Nilai Kategori Nilai Kategori Nilai Kategori

(18)

27 0.21 Rendah 0.53 Sedang -0.05 Sangat

Jelek 0.775 Mudah 0.667 Tinggi Dipakai 28 0.46 Sedang 0.53 Sedang 0.35 Cukup 0.625 Sedang 0.896 Sgt Tinggi Dipakai 29 0.53 Sedang 0.55 Sedang 0.6 Baik 0.475 Sedang 0.875 Sgt Tinggi Dipakai 30 0.15 Sangat

Rendah 0.53 Sedang 0.15 Jelek 0.325 Sedang 0.854 Sgt Tinggi Dipakai 31 0.47 Sedang 0.55 Sedang 0.15 Jelek 0.0375 Sukar 0.938 Sgt Tinggi Dipakai 32 0.57 Sedang 0.55 Sedang 0.35 Cukup 0.1125 Sukar 1 Sgt Tinggi Dipakai

G. Teknik Pengumpulan Data

Dalam penelitian ini, teknik pengumpulan data yang digunakan adalah sebagai berikut.

1. Tes

Tes yang dilakukan peneliti ialah tes achievement. Tes ini digunakan untuk mengukur peningkatan achievement siswa sebelum dan sesudah treatment levels of inquiry. Waktu pelaksanaannya ialah 80 menit.

2. Observasi

Teknik observasi yang digunakan dalam penelitian ini adalah teknik observasi nonpartisan karena peneliti tidak sebagai pengamat, namun peneliti meminta tiga orang yang bertugas sebagai pengamat independen artinya ketiga orang tersebut hanya mengamati kegiatan pembelajaran, tetapi tidak terlibat dalam kegiatan pembelajaran. Jenis observasi nonpartisipan yang dipilih peneliti ialah observasi terstruktur karena observasi tersebut telah dirancang secara sistematis tentang hal apa yang

akan diamati melalui lembar observasi.

3. Metode Dokumentasi dengan Video Rekaman

Video rekaman digunakan untuk merekam penerapan levels of inquiry selama pembelajaran berlangsung. Peneliti meminta tolong satu orang untuk bertugas merekam pembelajaran. Setelah di dapatkan rekaman video

maka peneliti mentranskripkan video dan menganalisis apakah tahapan levels of inquiry telah di lakukan dengan baik atau tidak.

H. Analisis Data

(19)

Teknik pengolahan data untuk tes achievement dilakukan dengan menghitung selisih persentase skor pretest dan skor posttest serta menghitung nilai effet size. Perhitungan effect size dimaksudkan untuk mengetahui besarnya peningkatan achievement siswa setelah diterapkan levels of inquiry. Rosenthal (dalam Dunst, C.J, dkk, 2004, hlm.1) menyatakan bahwa “an effect size is a measure of the magnitude of the strength of a relationship between an independent (intervention) and dependent (outcome) variable”. Selain itu, salah satu artikel yang berjudul understanding, using and calculating effect size mengemukakan bahwa

In an educational setting, effect size is one way to measure the effectiveness of a particular intervention. Effect size enables us to measure both the improvement (gain) in learner achievement for a group of learners and the variation of student performances expressed on a standardised scale. (Government of South Australia, 2014, hlm.1) Tidak hanya itu Schagen, I (2009, hlm.3) juga menyatakan bahwa effect size dapat digunakan untuk membandingkan progress dari waktu ke waktu

“… to compare progress over time on the same test (most common use)…”. Melalui effect size juga dapat menunjukkan seberapa besar kontribusi penerapan treatment levels of inquiry terhadap achievement siswa, seperti yang dikemukakan Schagen, I (2009, hlm.2) bahwa “an effect size is a measure that is independent of the original units of measurement; it can be a useful way to measure how much effect a treatment or intervention had”. Adapun langkah-langkah yang digunakan dalam pengolahan data adalah sebagai berikut:

a. Pemberian skor soal PG dengan metode right only, yaitu jawaban benar diberi skor 1 dan jawaban salah atau soal yang tidak di jawab

diberi skor 0. Total skor setiap siswa diperoleh dengan menghitung jawaban benar yang dijawab siswa

(20)

c. Penggabungan skor pilihan ganda dan constructed response dilakukan dengan menjumlahkan skor soal pilihan ganda dan soal constructed response sehingga didapatkan skor total

Stotal = SPG + SCR

dengan Stotal = skor total, SPG = skor pilihan ganda dan SCR = skor constructed response

d. Perhitungan persentase skor total pretest dan persentase skor total posttest, dengan cara sebagai berikut:

e. Perhitungan persentase skor gain diperoleh dari selisih persentase skor pretest (Si) dengan persentase skor posttest (Sf). Perhitungan persentase

skor gain dapat menggunakan rumus % G = % Sf – % Si

Setelah didapatkan selisih persentase skor pretest dan skor posttest, langkah selanjutnya yaitu menghitung nilai effect size sebagai berikut: a. Menghitung korelasi antara baseline (pretest) dengan intervention

(posttest) dengan menggunakan rumus korelasi product moment. Nilai korelasi yang diperoleh kemudian diinterpretasi sesuai dengan Tabel 3.2 sebelumnya. Dengan perhitungan korelasi maka peneliti dapat menentukan rumusan yang digunakan untuk menghitung besar effect size. Dikarenakan korelasi yang diperoleh termasuk kategori kecil, maka rumus effect size yang digunakan adalah sebagai berikut:

Cohen (dalam Duns, dkk. 2004, hlm. 6)

dengan d = effect size, = mean posttest, mean pretest, = standar deviasi pretest dan = standar deviasi posttest

(21)

Tabel 3.13 Interpretasi Effect Size

Effect Size (d) Kategori

0,0 - 0,1 Tidak berpengaruh (negligible effect)

0,2- 0,4 Kecil (small effect)

0,4 - 0,7 Sedang (medium effect) 0,8 – tak hingga Besar (large effect)

c. Untuk pengolahan achievement siswa pada setiap topik konten optik, peneliti menentukan tingkat penguasaan konsep siswa berdasarkan kriteria yang dikemukakan oleh Arikunto (2009) berikut ini

Tabel 3.14 Tafsiran Kriteria Kemampuan

Persentase Skor (%) Tafsiran

81-100 Sangat Baik

61-80 Baik

41-60 Cukup

21-40 Kurang

0-20 Sangat Kurang

2. Data Observasi Keterlaksanaan Levels of inquiry

Untuk mengetahui keterlaksanaan levels of inquiry, maka peneliti melakukan perhitungan keterlaksanaan levels of inquiry dari setiap tahapan levels of inquiry yaitu dengan menggunakan rumus sebagai berikut;

Kemudian penafsiran hasil perhitungan menggunakan kategori keterlaksanaan sesuai tabel di bawah ini.

Tabel 3.15. Interpretasi Keterlaksanaan

% kate gori kete rlaksanaan (KM) Kate gori

KM = 0 Tidak satupun kegiatan terlaksana

Sebagian kecil kegiatan terlaksana

Hampir setengah kegiatan terlaksana

KM = 50 Setengah kegiatan terlaksana

Sebagaian besar kegiatan terlaksana

Hampir seluruh kegiatan terlaksana

KM = 100 Seluruh kegiatan terlaksana

(Budiarti dalam Koswara, 2010)

(22)