Konstruksi Tes Hasil Belajar

BAB II LANDASAN TEORI

2. Konstruksi Tes Hasil Belajar

Pada kaidah penulisan soal pilihan ganda dari segi konstruksi antara lain, sebagai berikut:

a) Pokok soal harus dirumuskan secara jelas dan tegas.

b) Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang diperlukan saja.

c) Pokok soal jangan memberi petunjuk ke arah jawaban benar.

d) Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda.

e) Panjang rumusan pilihan jawaban harus relatif sama.

f) Pilihan jawaban jangan mengandung pernyataan, “Semua pilihan jawaban di atas salah”, atau “Semua pilihan jawaban di

atas benar”.

g) Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan besar kecilnya nilai angka tersebut, atau kronologisnya.

h) Gambar, grafik, tabel, diagram, dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi.

3) Bahasa

Pada kaidah penulisan soal pilihan ganda dari segi bahasa antara lain, sebagai berikut:

a) Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah Bahasa Indonesia.

b) Jangan menggunakan bahasa yang berlaku setempat, jika soal akan digunakan untuk daerah lainatau nasional.

c) Setiap soal harus menggunakan bahasa yang komunikatif.

d) Pilihan jawaban jangan mengulang kata atau frase yang bukan merupakan satu kesatuan pengertian.

Berdasarkan pendapat para ahli di atas, dapat disimpulkan bahwa kaidah penulisan tes pilihan ganda dapat dilihat dari segi materi, konstruksi, dan bahasa. Hasil tersebut dilakukan untuk menyakinkan bahwa soal berkualitas baik. Sehingga, hal tersebut dapat dijadikan pedoman peneliti dalam menyusun tes hasil belajar kompetensi dasar 1.5 menyelesaikan masalah yang berkaitan dengan Operasi Hitung, KPK, dan FPB untuk siswa kelas V Sekolah Dasar.

2. Konstruksi Tes Hasil Belajar

Tes hasil belajar yang baik dikonstruksikan dengan memenuhi validitas, reliabilitas, dan karakteristik butir soal yaitu daya pembeda, tingkat kesukaran, dan pengecoh.

a. Validitas

Widoyoko (2014: 139), menjelaskan bahwa validitas berkaitan dengan “ketepatan” dengan alat ukur. Suatu tes atau instrumen dikatakan valid apabila tes itu dapat tepat mengukur hasil belajar yang hendak diukur. Surapranata (2004: 50), mengemukakan bahwa validitas adalah suatu konsep yang berkaitan dengan sejauh mana tes telah mengukur apa yang harus diukur.

Sulistyorini (2009: 162), menjelaskan bahwa validitas berarti cocok atau sesuai. Suatu tes dikatakan valid, apabila tes tersebut benar-benar menyasar kepada apa yang dituju. Tes tersebut benar-benar-benar-benar dapat memberikan keterangan atau gambaran tentang apa yang diinginkan.

Berdasarkan pendapat para ahli di atas, dapat disimpulkan bahwa validitas adalah alat ukur yang digunakan untuk mengukur apa yang seharusnya diukur. Suatu tes dapat dikatakan memiliki validitas yang tinggi apabila alat tersebut dapat melakukan fungsi ukurnya sesuai dengan apa yang seharusnya diukur.

Widoyoko (2014: 172), memaparkan bahwa instrumen validitas dibedakan menjadi lima yaitu 1) Validitas Isi, 2) Validitas Konstruk, 3) Validitas Butir, 4) Validitas Kesejajaran, dan 5) Validitas Prediksi. 1) Validitas Isi (Content Validity)

Instrumen yang harus mempunyai validitas isi (content validity) adalah instrumen yang berbentuk tes untuk mengukur

hasil belajar. Sebuah tes dikatakan mempunyai validitas isi apabila dapat mengukur kompetensi yang dikembangkan beserta indikator dan materi pembelajarannya. Untuk menguji validitas isi instrumen tes dapat dilakukan dengan membandingkan antara isi instrumen dengan kompetensi yang dikembangkan dan materi pelajaran yang telah dipelajari. Validitas isi ini berkaitan dengan pertanyaan “sejauh mana butir soal mencakup keseluruhan indikator kompetensi yang dikembangkan dan materi atau bahan yang ingin diukur”.

2) Validitas Konstruk (Construct Validity)

Validitas konstruk mengacu pada sejauh mana suatu instrumen mengukur konsep dari suatu teori, yaitu yang menjadi dasar penyusunan instrumen. Untuk menguji validitas konstruk, dapat digunakan pendapat para ahli (expert judgement). Setelah instrumen dikonstruksi tentang aspek-aspek yang akan diukur dengan berlandaskan teori tertentu maka selanjutnya dikonsultasikan dengan para ahli. Para ahli diminta pendapatnya tentang instrumen yang telah disusun. Para ahli akan memberikan keputusan apakah instrumen yang dibuat tersebut dapat digunakan tanpa perbaikan, ada perbaikan, dan mungkin dirombak total.

3) Validitas Butir (Item Validity)

Setelah pengujian konstruk dari ahli kemudian dilanjutkan dengan uji coba lapangan. Kegiatan ini dilakukan untuk mengetahui validitas butir instrumen. Ada kemungkinan secara konstruk teoritis instrumen tersebut sudah valid karena sudah disusun berdasarkan teori konsep variabel yang akan diukur, dilanjutkan dengan perumusan definisi operasional, indikator, dan penyusunan butir-butir soal, namun setelah diuji cobakan ada yang tidak valid sehingga mengurangi validitas instrumen secara keseluruhan.

4) Validitas Kesejajaran (Concurrent Validity)

Sebuah instrumen dikatakan memiliki validitas kesejajaran (concurrent validity) apabila hasilnya sesuai dengan kriteria yang sudah ada. Kriteria yang sudah ada dapat berupa instrumen lain yang mengukur hal sama tetapi sudah diakui validitasnya misalnya dengan tes terstandar yang telah teruji validitasnya digunakan sebagai kriteria uji validitas instrumen tes sejenis.

5) Validitas Prediksi (Predictive Validity)

Sebuah instrumen dikatakan memiliki validitas prediksi (predictive validity) atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang mengenai hal sama. Validitas prediktif diperoleh

apabila pengambilan skor kriteria tidak bersamaan dengan pengambilan skor tes. Setelah subjek dikenai tes yang akan dicari validitas prediktifnya, lalu diberikan tenggang waktu tertentu sebelum skor kriteria diambil dari subjek yang sama. Validitas prediktif ini biasanya digunakan untuk menguji validitas instrumen bentuk tes.

b. Reliabilitas

Sudjana (1990: 16), mengemukakan bahwa reliabilitas adalah ketetapan atau keajegan alat penilaian dalam menilai apa yang dinilai. Artinya, kapan pun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama.

Masidjo (1995: 208) memaparkan bahwa reliabilitas adalah taraf kemampuan tes dalam menunjukkan konsistensi hasil pengukurannya yang diperlihatkan dalam taraf ketepatan dan ketelitian hasil. Azwar (2009: 4) mengatakan bahwa reliabilitas merupakan sejauh mana hasil suatu pengukuran dapat dipercaya.

Berdasarkan pendapat ketiga ahli di atas dapat disimpulkan bahwa reliabilitas adalah ketetapan atau keajegan pada suatu alat ukur dalam menilai.

Widoyoko (2014: 188-202), mengemukakan bahwa ada dua jenis reliabilitas, yaitu reliabilitas eksternal (external reliability) dan reliabilitas internal (internal reliability).

1. Reliabilitas eksternal (external reliability)

Reliabilitas eksternal diperoleh jika ukuran atau kriteria tingkat reliabilitas berada diluar instrumen yang bersangkutan. Untuk menguji reliabilitas eksternal instrumen terdapat dua cara yaitu dengan metode bentuk paralel (equivalent method) dan metode tes terulang (test- retest method).

a. Metode Bentuk Paralel (equivalent Method)

Instrumen paralel atau ekuivalen adalah dua buah instrumen yang mempunyai kesamaan tujuan, tingkat kesulitan dan susunan, tetapi butir-butir pertanyaan/pernyataan berbeda. Metode paralel dilakukan dengan cara menyusun dua instrumen yang hampir sama (equivalent), kemudian diujicobakan pada sekelompok siswa yang sama (siswa mengerjakan dua kali) kemudian dari hasil uji coba tersebut dikorelasikan dengan teknik korelasi product moment. Metode ini pada umumnya untuk menguji reliabilitas instrumen bentuk tes. Data dari hasil dua kali uji coba, yang satu dianggap sebagai nilai X, sedangkan yang lainnya dianggap sebagai nilai Y.

b. Metode Tes Berulang (Test- retest method)

Metode ini dilakukan untuk menghindari penyusunan instrumen dua kali. Dengan menggunakan metode ini kita hanya menyusun satu perangkat instrumen. Instrumen tersebut

diujicobakan pada sekelompok siswa, hasilnya dicatat. Pada kesempatan yang lain instrumen tersebut diberikan pada sekelompok siswa yang sama untuk dikerjakan lagi, dan hasil yang kedua juga dicatat. Kemudian kedua hasil tersebut dikorelasikan.

2. Reliabilitas Internal (Internal Reliability)

Reliabilitas ini diperoleh jika kriteria maupun perhitungan didasarkan pada data dari instrumen itu sendiri, akan menghasilkan reliabilitas internal. Reliabilitas internal dibedakan menjadi dua yaitu:

a. Instrumen Skor Diskrit

Instrumen skor diskrit adalah instrumen yang skor jawaban/respondennya hanya dua, yaitu 1 (satu) dan 0 (nol). Dengan kata lain hanya dua jawaban yaitu benar dan salah. Jawaban benar diberi skor 1 (satu) sedangkan jawaban salah diberi skor (0). Untuk instrumen yang skornya diskrit (1 dan 0) tingkat reliabilitasnya dapat dicari dengan menggunakan (1) metode belah dua (split-half metods), (2) rumus Flanagan, (3) rumus Rulon, (4) rumus K-R. 20, (5) rumus K-R, (6) rumus Hoyt. b. Instrumen Skor Non Diskrit

Instrumen skor non diskrit adalah instrumen pengukuran yang dalam sistem skoringnya bukan 1 dan 0 (satu dan nol), tetapi

bersifat gradual, yaitu ada penjenjangan skor, mulai dari skor tertinggi sampai skor terendah.

c. Karakteristik Butir Soal 1) Daya Pembeda

Suwarto (2013: 108), mengemukakan bahwa daya pembeda merupakan suatu butir tes yang berfungsi untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada pada kelompok. Zainul dan Nasution (dalam Widoyoko, 2014: 136) menjelaskan bahwa daya beda butir soal adalah indeks yang menunjukkan tingkat kemampuan butir soal membedakan antara peserta tes yang pandai (kelompok atas) dengan peserta tes yang kurang pandai (kelompok bawah) diantara peserta tes.

Purwanto (2009: 102) mengemukakan bahwa daya beda adalah kemampuan butir soal tes hasil belajar membedakan siswa yang mempunyai kemampuan tinggi dan rendah. Daya beda ini berhubungan dengan derajat kemampuan butir membedakan dengan baik perilaku pengambil tes dalam tes yang dikembangkan.

Dari pendapat ahli di atas dapat disimpulkan bahwa daya pembeda merupakan kemampuan setiap butir untuk dapat membedakan antara siswa yang pandai (kelompok atas) dengan siswa yang kurang pandai (kelompok bawah).

2) Tingkat Kesukaran

Widoyoko (2014: 132), mengemukakan bahwa tingkat kesukaran butir soal adalah proporsi peserta tes menjawab dengan benar terhadap suatu butir soal. Purwanto (2009: 99) mengemukakan bahwa tingkat kesukaran (difficulty index) dapat didefinisikan sebagai proporsi siswa peserta tes yang menjawab benar.

Sudjana (2009: 135) mengungkapkan bahwa tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawab soal, bukan dari sudut guru sebagai pembuat soal. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kategori soal yang termasuk mudah, sedang, dan sukar. Perbandingan proporsi jumlah soal untuk tiga kategori tersebut didasarkan atas kurva normal. Sebagian besar soal berada pada kategori sedang, sebagian lagi berada pada kategori mudah dan sukar dengan proporsi yang seimbang. Perbandingan dapat dibuat 25-50-25, 25% soal dengan kategori “mudah”, 50% soal dengan kategori “sedang”, dan 25% soal dengan kategori “sukar”. Proporsi soal dengan kategori sedang lebih banyak dari soal kategori mudah dan soal kategori sukar.

Rakhmat dan Suherdi (2001: 190), menjelaskan bahwa tingkat kesukaran soal yaitu ukuran yang menunjukkan kesulitan soal untuk diselesaikan oleh siswa. Secara sederhana dapat dikatakan bahwa

semua soal dikatakan sukar jika sebagian besar testi gagal menyelesaikan, sebaliknya soal dikatakan mudah jika sebagian besar testi mampu menyelesaikannya.

Berdasarkan definisi di atas, maka dapat disimpulkan bahwa tingkat kesukaran soal adalah kemampuan siswa dalam menjawab soal yang terdiri dari kategori rendah, sedang, dan tinggi yang dapat diketahui dari banyaknya siswa yang menjawab soal dengan benar. 3) Pengecoh

Purwanto (2009: 75), mendefinisikan pengecoh adalah pilihan yang bukan merupakan kunci jawaban. Arikunto (2013: 233), menjelaskan bahwa pengecoh dapat berfungsi dengan baik apabila pengecoh tersebut mempunyai daya tarik bagi peserta tes yang kurang memahami materi.

Surapranata (2004: 43), mengemukakan bahwa pengecoh berfungsi sebagai pengidentifikasi peserta tes yang berkemampuan tinggi. Pengecoh dikatakan berfungsi efektif apabila banyak dipilih oleh peserta didik yang berasal dari kelompok bawah.

Berdasarkan pendapat para ahli di atas, dapat disimpulkan bahwa pengecoh adalah alternatif yang bukan merupakan kunci jawaban yang berfungsi untuk mengecoh peserta tes yang kurang memahami materi. Pengecoh akan berfungsi dengan baik apabila

pengecoh dipilih secara merata oleh peserta didik paling sedikit dipilih oleh 5% pengikut tes.

Dalam dokumen Pengembangan tes hasil belajar matematika kompetensi dasar 1.5 menyelesaikan masalah yang berkaitan dengan operasi hitung, KPK dan FPB untuk siswa kelas V Sekolah Dasar (Halaman 43-54)