• Tidak ada hasil yang ditemukan

Ciri-ciri Kualitas Tes Hasil Belajar

BAB V Penutup yang berisikan kesimpulan dan saran

C. Tes Hasil Belajar

2. Ciri-ciri Kualitas Tes Hasil Belajar

Analisis kualitas tes merupakan suatu tahapan yang harus ditempuh untuk mengetahui derajat kualitas suatu tes. Dalam penilaian hasil belajar diharapkan tes dapat menggambarkan hasil yang objektif dan akurat. Dalam melaksanakan analisis kualitas tes, pembuat soal dapat melakukan analisis secara kualitatif, dalam kaitannya dengan isi dan bentuk, dan analisis secara kuantitatif dalam kaitannya dengan ciri-ciri statistikanya atau prosedur peningkatan secara judgment dan prosedur peningkatan secara empirik. Analisis kualitatif mencakup pertimbangan validitas isi dan konstruk, sedangkan analisis kuantitatif mencakup tingkat kesukaran, daya beda, fungsi pengecoh, validitas dan reliabilitas soal.

a. Tingkat Kesukaran

Berkualitas atau tidaknya butir-butir soal tes hasil belajar dapat dianalisis dari derajat kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing soal yang diujikan kepada siswa. Butir soal yang baik adalah apabila butir-butir soal tersebut tidak terlalu sukar dan tidak terlalu

mudah atau dengan kata lain derajat kesukaran item adalah berada pada kategori sedang atau cukup.52

Menurut Crocker dan Algina yang dikutip dari buku evaluasi hasil belajar mengatakan tingkat kesukaran didefinisikan sebagai proporsi siswa peserta tes yang menjawab benar.53

b. Daya Beda

Daya beda (discriminating power) adalah kemampuan butir soal tes hasil belajar membedakan siswa yang mempunyai kemampuan tinggi dan rendah.54 Daya pembeda soal adalah kemampuan suatu butir soal tes hasil belajar untuk dapat membedakan (mendeskriminasikan) antara siswa yang berkemampuan tinggi (pintar) dengan siswa yang berkemampuan rendah sehingga siswa yang pintar akan menjawab dengan benar lebih banyak dibandingkan dengan siswa yang kurang pintar.55

Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah). Angka yang menunjukkan besarnya daya pembeda disebut indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antar 0,00 sampai 1,00.56

52 Fajri Ismail, Evaluai Pendidikan, (Palembang : Tuna Gemilang Press, 2014), hlm. 188 53 Ibid., hlm. 99

54 Ibid., hlm. 102 55

Anas Sudijono, Op. Cit., hlm. 386

c. Pengertian Pengecoh (distractor)

Pengecoh (distractor) adalah pilihan yang bukan merupakan kunci jawaban. Misalnya: pada soal objektif jenis benar-salah, bila kunci jawabannya adalah salah maka benar merupakan pengecoh. Pada soal objektif pilihan ganda dengan empat pilihan a, b, c, d dan kunci jawabnya adalah c maka a, b, d, merupakan pengecoh.57

Dengan demikian, efektivitas distractor adalah seberapa baik pilihan yang salah tersebut dapat mengecoh peserta tes yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin banyak peserta tes yang memilih distractor tersebut, maka distractor itu dapat menjalankan fungsinya dengan baik.

d. Pengertian Validitas

Pengertian validitas menurut Lewis R Aiken dalam buku Evaluasi

Pendidikan, mengatakan “validity of a test has been defined as the extent

to which the test measures what it was designed to measure” (Validitas tes didefinisikan sebagai sejauh mana tes mengukur apa yang dirancang untuk mengukur ).58 Mengutip dari Cureton dalam buku Evaluasi Pendidikan,

bahwa “ The essential question of test validity is how well a test does the

job it is employed to do” (Pertanyaan penting dari uji validitas adalah

57

Purwanto, Op. Cit, hlm. 75 58 Fajri Ismail, Op. Cit., hlm. 215

seberapa baik tes melakukan pekerjaan itu digunakan untuk melakukan).59 Selanjutnya, Sutrisno Hadi dalam buku Evaluasi Pendidikan menyatakan

“keshahihan dibatasi sebagai tingkat kemampuan suatu instrument untuk mengungkap sesuatu yang menjadi sasaran pokok pengukuran”.60

Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu yang diinginkan diukur.61 Validitas berkenaan dengan ketepatan alat penilaian terhadap konsep yang dinilai sehingga betul-betul menilai apa yang seharusnya dinilai.62

Anasti dan Urbina dalam buku Evalusai Hasil Belajar menjelaskan validitas berhubungan dengan apakah tes mengukur apa yang mesti diukurnya dan seberapa baik dia melakukannya.63

Validitas suatu instrumen evaluasi, tidak lain adalah derajat yang menunjukan di mana suatu tes mengukur apa yang hendak diukur.64 Validitas suatu instrumen evaluasi mempunyai beberapa makna penting diantaranya seperti berikut.65

Validitas berhubungan dengan ketepatan interpretasi hasil tes atau instrumen evaluasi untuk grup individual dan bukan instrumen itu sendiri.

59 Ibid., hlm. 216 60 Ibid.,hlm.216 61

Purwanto, Op. Cit., hlm. 114 62 Nana Sudjana, Op.Cit., hlm.12 63 Ibid.,hlm. 153

64

Singarimbun dan Sofian Effendi, Metode Penelitian Survai (Jakarta: LP3ES, 2011), hlm. 122.

65

Sukardi, Evaluasi Pendidikan Prinsip dan Operasionalnya (Jakarta: PT Bumi Aksara, 2009), hlm. 31.

Validitas diartikan sebagai derajat yang menunjukan kategori yang bisa mencakup kategori rendah, menengah dan tinggi.

Berdasarkan beberapa pendapat tentang pengertian validitas di atas, maka dapat diambil kesimpulan bahwa validitas adalah suatu standar ukuran yang menunjukkan ketepatan dan kesahihan suatu instrumen. Dan dapat diberikan pengertian juga bahwa:

1. Validitas berkaitan dengan pengukuran

2. Validitas memberikan informasi berkaitan dengan tujuan

3. Validitas berkenaan dengan ketepatan alat ukur terhadap konsep yang diukur, sehingga betul-betul mengukur apa yang seharusnya di ukur.

Prinsip suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan oleh para peneliti adalah bahwa ia hanya valid untuk suatu tujuan tertentu saja. Tes valid untuk bidang studi Fiqh belum tentu

valid untuk bidang yang lain misalnya bidang Qur’an Hadits. Validitas

memiliki beberapa karakteristik, antara lain:66

1. Menunjuk kepada hasil dari penggunaan instrumen tersebut bukan pada instrumennya.

2. Menunjukkan suatu derajat atau tingkatan, validitasnya tinggi, sedang atau rendah, bukan valid atau tidak valid.

3. Tidak berlaku umum. Suatu tes Fiqih menunjukkan validitas tinggi untuk mengukur keterampilan memahami, tetapi hanya sedang dalam memahami kemampuan berpikir tentang Fiqh, bahkan rendah dalam memprediksi keberhasilan dalam fiqh untuk masa yang akan datang.

66

Nana Syaodih Sukmadinata, Metode Penelitian Pendidikan (Bandung: PT Remaja Rosdakarya, 2010), hlm. 228-229.

Ada dua unsur penting dalam validitas. Pertama, validitas menunjukan suatu derajat, ada yang sempurna, ada yang sedang dan ada yang rendah. Kedua, validitas selalu dihubungkan dengan suatu putusan atau tujuan yang spesifik. Sebagaimana pendapat R.L. Thorndike dan H.P. Hagen bahwa “validity is always in relation to a specific decision or use” (Validitas selalu dalam kaitannya dengan keputusan tertentu atau penggunaan). Sementara itu, Gronlund mengemukakan ada tiga faktor yang mempengaruhi validitas hasil tes, yaitu:67

1. Faktor instrumen evaluasi

2. Faktor administrasi evalusai dan penskoran 3. Faktor dari jawaban peserta didik

Banyak faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor internal dari tes, faktor eksternal tes dan faktor yang berasal dari peserta didik yang bersangkutan.68

a. Faktor yang berasal dari dalam tes.

Beberapa sumber yang pada umumnya berasal dari faktor internal tes evaluasi di antaranya sebagai berikut:

1. Arahan tes yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas tes.

2. Kata-kata yang digunakan dalam struktur instrumen evaluasi, terlalu sulit.

3. Item-item tes dikonstruksi dengan jelek.

4. Tingkat kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima peserta didik.

5. Waktu yang dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau terlalu longgar.

6. Jumlah item tes terlalu sedikit sehingga tidak mewakili sampel materi pembelajaran.

7. Jawaban masing-masing item evaluasi bisa diprediksi peserta didik.

67 Zainal Arifin, Evaluasi Pembelajaran (Bandung: PT Remaja Rosdakarya, 2011), hlm. 247-248.

b. Faktor yang berasal dari administrasi dan skor. Faktor ini dapat mengurangi validitasi interpretasi tes evaluasi, khususnya tes evaluasi yang dibuat oleh guru. Berikut beberapa contoh faktor yang sumbernya berasal dari proses administrasi dan skor.

1. Waktu pengerjaan tidak cukup sehingga peserta didik dalam memberikan jawaban dalam situasi yang tergesa-gesa.

2. Adanya kecurangan dalam tes sehingga tidak bisa membedakan antara peserta didik yang belajar dengan yang melakukan kecurangan.

3. Pemberian petunjuk dari pengawas yang tidak dapat dilakukan pada semua peserta didik.

4. Teknik pemberian skor yang tidak konsisten, misalnya pada tes esai, juga dapat mengurangi validitas tes evaluasi.

5. Peserta didik tidak dapat mengikuti arahan yang diberikan dalam tes baku.

6. Adanya joki (orang lain bukan peserta didik) yang masuk dan menjawab item tes yang diberikan.

c. Faktor-faktor yang berasal dari jawaban peserta didik Seringkali terjadi bahwa interpretasi terhadap item-item tes evaluasi tidak valid, karena dipengaruhi oleh jawaban peserta didik daripada interpretasi item-item pada tes evaluasi. Sebagai contoh, sebelum tes para peserta didik menjadi tegang karena guru pengampu mata pelajaran dikenal killer, galak dan sebagainya sehingga peserta didik yang ikut tes banyak yang gagal. Contoh lain, ketika peserta didik melakukan tes penampilan keterampilan, ruangan terlalu ramai atau gaduh sehingga para peserta didik tidak dapat konsentrasi dengan baik. Ini semua dapat mengurangi nilai validitas instrumen evaluasi.

Djali dan Pudji Mulyono dalam buku Evaluasi Pendidikan mengatakan bahwa ada tiga jenis validitas yag sering digunakan dalam penyusunan instrument yakni validitas isi, validitas bangun pengertian, dan empiris.69 1. Validitas Isi

Menurut Gregory dikutip dari buku Evaluasi Pendidikan “validitas

ini menunjukkan sejauhmana pertanyaan, tugas atau butir dalam suatu tes atau instrument mampu mewakili secara keseluruhan dan proporsional

perilaku sampel yang dikenai tes tersebut”. 70

69

Fajri Ismail, Loc. Cit, hlm. 216 70 Ibid., hlm. 217

Validitas isi adalah validitas yang diperoleh setelah melakukan penganalisaan, penelusuran, atau pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Validitas isi berkenaan dengan kesanggupan instrument mengukur isi yang harus diukur. Ciri khusus validitas isi ini adalah validitas ini mendasarkan pada analisis logika, tidak dihitung secara statistik.71

2. Validitas Konstruk

Validitas konstruksi dapat diartikan sebagai validitas yang melihat dari segi susunan, kerangka atau rekaannya72. Menurut Sopiah dan Sangaji sebagaimana dikutip dari buku Evaluasi Pendidikan “mengatakan bahwa

validitas konstruk menunjuk kepada seberapa jauh suatu tes mengukur sifat atau bangunan pengertian (konstruk) tertentu dan validitas ini penting bagi tes-tes yang digunakan untuk menilai kemampuan dan sifat-sifat kejiwaan seseorang termasuk sikap, bakat, minat, konsep diri, motivasi

dan sebagainya”.73

Menurut Djali dan Pudji Mulyono seperti dikutip dari buku Evaluasi

Pendidikan “mengatakan bahwa untuk menentukan validitas konstruk

suatu instrument harus dilakukan melalui proses penelahaan teoritis dari suatu konsep variable yang hendak kita ukur, mulai dari perumusan konstruk, penentuan dimensi dan indikator, sampai kepada penjabaran dan penulisan butir-butir item instrument”74

. 3. Validitas empirik

Validitas empirik merupakan validitas yang didasarkan pada analisa data empirik yang bersumber atau didapatkan dari pengamatan di lapangan. Menurut Djali dan Pudji Mulyono seperti dikutip dari buku Evaluasi Pendidikan menjelaskan bahwa validitas empirik sama dengan validitas kriteria yang berarti bahwa validitas ditentukan berdasarkan kriteria, baik kriteria internal dan eksternal. Kriteria internal adalah tes atau instrument itu sendiri yang menjadi kriteria, sedangkan kriteria eksternal adalah hasil ukur instrument atau tes lain di luar instrument itu sendiri yang menjadi kriteria.75

Berdasarkan pendapat di atas dapat dikatakan bahwa suatu tes hasil belajar dapat dikatakan valid secara empirik apabila tes itu diuji dan dianalisa berdasarkan hasil yang didapat dari lapangan.

71 Anas Sudijono, Op.Cit,. hlm. 164 72 Ibid., hlm. 166

73 Fajri Ismail, Op. Cit., hlm. 224 74

Ibid.,

Validitas butir soal item adalah ketepatan mengukur yang dimiliki oleh sebutir item soal, dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.76 Menurut Djali dan Pudji Mulyono seperti dikutip dari buku

Evaluasi Pendidikan mengatakan bahwa “validitas butir soal merupaka

validitas internal di mana validitas butir soal diperlihatkan oleh seberapa jauh hasil ukur butir tersebut konsisten dengan hasil ukur instrument secara

keseluruhan”.

e. Pengertian Reliabilitas

Reliabilitas berasal dari kata rely yang artinya percaya dan reliable yang artinya dapat dipercaya.77 Secara etimologi reliabilitas mengisyaratkan bahwa reliabilitas dalam kontek hasil belajar adalah sejauh mana tes tersebut dapat dipercaya dan diandalkan.78 Reliabilitas adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang dinilainya79

Beberapa ahli memberikan batasan tentang reliabilitas. Menurut Thordike dan Hagen yang dikutip dari buku Evaluasi Hasil Belajar

“reliabilitas berkaitan dengan akurasi instrumen dalam mengukur yang

hendak diukur, kecermatan hasil ukur dan seberapa akurat seandainya

76 Anas Sudijono, Op. Cit., hlm. 182 77 Purwanto, Op. Cit, hlm. 153 78

Fajri Ismail, Op. Cit., hlm. 249 79 Nana Sudjana, Op. Cit., hlm.16

dilakukan pengukuran ulang”.80

Menurut Hopkin dan Antes yang dikutip

dari buku Evaluasi Hasil Belajar menyatakan “reliabilitas sebagai

konsistensi pengamatan yang diperoleh dari pencatatan berulang baik

pada satu objek maupun sejumlah objek.”.81

Menurut Kusaeri yang

dikutip dari buku Evaluasi Pendidikan mengatakan bahwa “reliabilitas

memiliki karakteritik sebagai berikut: 1) reliabilitas merujuk pada hasil yang didapat melalui sebuah instrumen tes, bukan merujuk kepada instrumennya sendiri. 2) reliabilitas merupakan syarat perlu, tetapi belum cukup untuk syarat validitas. 3) reliabilitas utamanya berkaitan dengan

statistik”.82

Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen. Reliabilitas tes berkenaan dengan pertanyaan apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.83

Menurut Nana Sudjana, “Reliabilitas alat penilaian adalah ketetapan

atau keajegan alat tersebut dalam menilai apa yang dinilainya”. Artinya,

kapan pun alat penilaian tersebut digunakan akan memberikan hasil yang

80 Purwanto, Loc. Cit, hlm. 154 81 Ibid., hlm. 154

82

Fajri Ismail, Op. Cit., hlm. 250

83

relatif sama.84 Hal senada juga diungkapkan Chabib Thoha “reliabilitas

sering diartikan dengan keterandalan”. Artinya, suatu tes memiliki

keterandalan jika tes tersebut dipakai mengukur berulang ulang hasilnya sama.85

Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk mengukur atau mengamati sesuatu yang menjadi objek ukur. Reliabilitas merupakan salah satu persyaratan bagi sebuah tes. Reliabilitas sebuah soal perlu karena sebagai penyokong terbentuknya validitas butir soal sehingga sebuah soal yang valid biasanya reliabel. 3. Fungsi Tes Hasil Belajar

Tes sebagai instrumen dalam kegiatan evaluasi memiliki makna tersendiri dalam dunia pendidikan, terutama dalam pembelajaran. Tes merupakan prosedur yang sistematis dipandang sebagai alat dan teknik dalam melakukan evaluasi hasil belajar. Hal ini didasarkan pada kenyataan bahwa tes banyak digunakan oleh seorang guru untuk melakukan evaluasi hasil belajar. Secara umum, ada dua macam fungsi yang dimiliki oleh tes, yaitu:

1. Sebagai alat pengukur terhadap peserta didik. Dalam hubungan ini tes