Analisis Miskonsepsi
4. Perbandingan Hasil Uji Coba Soal
Uji coba soal yang dikembangkan terdiri atas 3 tahapan uji coba meliputi uji coba terbatas, uji coba lapangan 1, dan uji coba lapangan 2. Dalam setiap uji coba terdiri atas beberapa butir soal yang dibuat berdasarkan komposisi secara materi (label konsep) maupun secara jenjang kognitif. Berikut ini perbandingan komposisi soal secara materi dari setiap uji coba:
Gambar 4.38 Perbandingan Komposisi Soal Berdasarkan Materi dalam Setiap Uji Coba
Berdasarkan diagram 4.38, terdapat 16 sub pokok bahasan dalam pembuatan soal. Materi tentang kelenjar endokrin dan hormone memiliki presentase paling besar dibandingkan materi yang lainnya . Hal ini bertujuan untuk memadukan informasi dugaan miskonsepsi yang diperoleh dari siswa dan guru. Miskonsepsi
19% 23% 19% 23%
Draf Soal
Analisis Miskonsepsi
Arah Soal (KM) Arah Soal (M) Arah Siswa (KM) Arah Siswa (M)
0%
2%
4%
6%
8%
10%
12%
14%
Sistem Regulasi … Sistem Saraf … Sistem Saraf Pusat Sistem Saraf Tepi Neuron/Sel Saraf Otak Gerak Refleks Gerak Biasa Kelenjar Endokrin Hormon Telinga Hidung Mata Kulit Lidah Zat Psikoaktif
Uji Coba Terbatas Uji Coba Lapangan 1 Uji Coba Lapangan 2
yang sering terjadi terutama pada sub pembahasan neuron, otak, dan hormon.
Sedangkan untuk presentase paling rendah berada pada materi zat psikoaktif. Hal ini bertujuan karena dalam materi tersebut telah banyak dikembangkan dalam pokok bahasan soal yang dikembangkan tidak terlalu banyak.
Setiap uji coba memiliki perbedaan dalam jumlah presentase soal yang dikembangkan. Hal ini terjadi karena pada setiap uji coba diambil soal-soal yang berkategorikan valid. Dengan demikian, dapat diketahui produk soal-soal yang berkualitas dari uji coba yang telah dilakukan.
Berdasarkan jenjang kognitif, setiap uji coba memiliki perbedaan dalam jumlah komposisi soal yang dibuat. Berikut ini perbandingan komposisi soal berdasarkan jenjang kognitif:
Gambar 4.39 Perbandingan Komposisi Soal Berdasarkan Jenjang Kognitif dalam setiap Uji Coba
Berdasarkan diagram 4.39, terdapat 6 jenjang kognitif meliputi C1 – C6 dalam pembuatan soal. Jenjang kognitif C1 memiliki presentase paling besar dibandingkan jenjang kognitif lainnya. Hal ini bertujuan untuk mengetahui dugaan miskonsepsi pada jenjang paling bawah yaitu C1. Apabila pada jenjang ini mengalami dugaan banyak miskonsepsi, kemungkinan pada jenjang berikutnya akan terjadi banyak miskonsepsi juga. Sedangkan komposisi jenjang kognitif C6 memiliki presentase paling sedikit. Hal ini dikarenakan pada jenjang tersebut soal dapat dikategorikan sukar sehingga kemungkinan siswa akan mengalami ketidak pahaman dalam menjawb soal.
Komposisi soal yang dibuat selanjutnya diujicobakan keudian dianlisis dengan menggunakan softwere Anates dan Microsoft Excel. Analisis uji coba soal yang terdiri atas uji coba terbatas, uji coba lapangan 1, dan uji coba lapangan 2 meliputi 9 kriteria yang terdiri atas validitas, reliabilitas, tingkat kesukaran, daya pembeda, kualitas pengecoh (distraktor), faktor tebakan, bias tes, dan
0%
10%
20%
30%
40%
50%
C1 C2 C3 C4 C5 C6
Uji Coba Terbatas Uji Coba Lapangan 1 Uji Coba Lapangan 2
ketidakwajaran skor, serta miskonsepsi siswa. Berikut ini perbandingan kriteria yang dianalisis dalam setiap uji coba:
a. Validitas
Validitas adalah suatu ukuran yang menunjukkan tingkat-tingkat kevalidan atau kesahihan sesuatu instrumen. Suatu instrumen yang valid atau sahih mempunyai validitas tinggi. Sebaliknya, instrumen yang kurang valid berarti memiliki validitas rendah (Arikunto, 2013: 211).
Validitas yang dikembangkan dalam soal memiliki perbedaan antar setiap uji coba. Berikut ini grafik yang menunjukkan perbedaan validitas dalam setiap uji coba:
Gambar 4.40 Perbandingan Validitas dalam Setiap Uji Coba Soal Berdasarkan gambar 4.40, validitas yang dihasilkan dapat dikategorikan baik dikarenakan kategori validitas yang dihasilkan tinggi. Pada uji coba terbatas validitas yag dihasilkan berkategorikan tinggi dengan sangat rendah yang dibuktikan dengan angka korelasi yang dihasilkan sebesar 0,67 dengan 0,02. Sedangkan pada uji coba lapangan 1 validitas yang dihasilkan berkategorikan tinggi dibuktikan dengan angka korelasi sebesar 0,67 dengan 0,80. Adapun pada uji coba lapangan 2 validitas yang dihasilkan berkategorikan sangat tinggi dibuktikan dengan angka korelasi sebesar 0,88.
Korelasi yang dihasilkan semakin meningkat menunjukkan validitas soal sangat baik. Dengan demikian soal yang dibuat dapat diterima dan layak untuk diujikan kepada siswa SMA kelas XI IPA.
b. Reliabilitas
Reliabilitas berarti keandalan, keterpercayaan, atau keajekan kemampuan soal tes apabila digunakan untuk mengetes berkali-kali. Arikunto menyatakan bahwa tes dinyatakan punya tingkat reliabilitas tinggi apabila hasil tes tersebut tetap (Akbar, 2013: 101).
0,67 0,67 0,88
0,02
0,8
Uji Coba Terbatas Uji Coba Lapangan 1 Uji Coba Lapangan 2
Validitas Soal
Draf Soal A Draf Soal B
Reliabilitas yang dikembangkan dalam soal memiliki perbedaan antar setiap uji coba. Berikut ini grafik yang menunjukkan perbedaan reliabilitas dalam setiap uji coba:
Gambar 4.41 Perbandingan Reliabilitas dalam Setiap Uji Coba Soal Berdasarkan gambar 4.41, reliabilitas yang dihasilkan dapat dikategorikan baik dikarenakan kategori reliabilitas yang dihasilkan sangat tinggi. Pada uji coba terbatas reliabilitas yang dihasilkan berkategorikan sangat tinggi dengan sangat rendah yang dibuktikan dengan angka korelasi yang dihasilkan sebesar 0,80 dengan 0,30. Sedangkan pada uji coba lapangan 1 validitas yang dihasilkan berkategorikan tinggi dengan sangat tinggi dibuktikan dengan angka korelasi sebesar 0,81 dengan 0,89. Adapun pada uji coba lapangan 2 validitas yang dihasilkan berkategorikan sangat tinggi dibuktikan dengan angka korelasi sebesar 0,94.
Dengan angka reliabilitas yang dihasilkan semakin meningkat, menunjukkan soal yang dibuat dapat diterima dan layak untuk diujikan kepada siswa SMA kelas XI IPA.
c. Tingkat Kesukaran
Soal dapat dikatakan baik, apabila memiliki tingkat kesukaran yang proposional. Artinya, suatu tes terdiri dari soal yang mudah, sedang, dan sukar dengan jumlah yang proporsional. Pernyataan tersebut sebagaimana diungkapkan oleh Arifin (2013: 266) yang menyatakan bahwa jika suatu soal memiliki tingkat kesukaran yang seimbang (proporsional) maka dapat dikatakan bahwa soal tersebut baik.
Tingkat kesukaran yang dikembangkan dalam soal memiliki perbedaan antar setiap uji coba. Berikut ini grafik yang menunjukkan perbedaan tingkat kesukaran dalam setiap uji coba:
0,8 0,81 0,94
0,3
0,89
Uji Coba Terbatas Uji Coba Lapangan 1 Uji Coba Lapangan 2
Reliabilitas Soal
Draf Soal A Draf Soal B
Gambar 4.42 Perbandingan Tingkat Kesukaran Soal dalam Setiap Uji Coba Soal
Berdasarkan gambar 4.42, tingkat kesukaran yang diperoleh pada setiap uji coba berbeda. Pada uji coba terbatas soal yang dikembangkan didominasi oleh kategori sukar, sedangkan pada uji coba lapangan 1 dan 2 soal yang dikembangkan didominasi oleh kategori sedang. Adapun kategori mudah dari setiap uji coba memiliki presentase terendah.
Indeks kesukaran yang dihasilkan lebih banyak didominasi oleh kategori sedang, menunjukkan soal yang dibuat cukup baik dan layak untuk diterapkan dalam pembelajaran.
d. Daya Pembeda
Daya pembeda soal tes adalah kemampuan soal untuk membedakan antara siswa pandai (berkemampuan tinggi) dengan siswa bodoh (berkemampuan rendah). Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi atau disingkat D (Akbar, 2013: 104).
Daya pembeda yang dikembangkan dalam soal memiliki perbedaan antar setiap uji coba. Berikut ini grafik yang menunjukkan perbedaan daya pembeda dalam setiap uji coba:
Gambar 4.43 Perbandingan Daya Pembeda Soal dalam Setiap Uji Coba Soal
30% 12% 0%
44%23% 28%48% 13%65%
3% 0% 8% 3% 18% 5%
Uji Coba Terbatas Uji Coba Lapangan 1 Uji Coba Lapangan 2