KUALITAS ALAT EVALUASI (Bahan Ajar 11)
B. VALIDITAS
B.1 Pengertian Validitas
Suatu alat evaluasi disebut valid (absah atau sahih) apabila alat tersebut mampu mengevaluasi apa yang seharusnya dievaluasi.
Oleh karena itu keabsahannya tergantung pada sejauh mana ketepatan alat evaluasi itu dalam melaksanakan fungsinya. Dengan demikian suatu alat evaluasi disebut valid jika ia dapat mengevaluasi dengan tepat sesuatu yang dievaluasi itu. Dalam melakukan penelitian, alat pengumpul data (instrumen) menentukan kualitas data yang dapat dikumpulkan dan kualitas data itu akan menentukan kualitas penelitiannya. Alat pengumpul data harus mendapat penggarapan yang cermat dan teliti, instrumen yang digunakan untuk melakukan pengukuran harus terlebih dahulu dikalibrasi atau divalidasi sebelum digunakan sehingga kita mendapatkan data yang benar-benar valid.
Validitas rasional diperoleh atas dasar hasil pemikiran, atau berdasarkan hasil pemikiran yang logis. Apabila secara rasional setelah dianalisis bahwa tes hasil belajar tersebut secara rasional memang benar-benar telah dapat mengukur apa yang hendak diukur.
Berdasarkan pelaksanaannya validitas dapat dikelompokkan menjadi 2 (dua) jenis yaitu validitas logik dan validitas kriterium,
untuk lebih jelasnya penuls uraikan sebagai berikut : 1. Validitas Logik (Teoritik)
Validitas teoritik atau validitas logik adalah validitas alat evaluasi yang dilakukan berdasarkan pertimbangan (judgement) teoritik atau logika yang dilakukan oleh para ahli atau orang yang dianggap ahli. Ada tiga macam yang termasuk dalam validitas teoritik ini, yakni : validitas isi, validitas konstruk (susunan), dan validitas muka (Face Validity)
1) Validitas Isi
Validitas isi untuk mengetahui sejauh mana suatu tes mampu mengukur tingkat penguasaan terhadap isi atau materi tertentu sesuai dengan tujuan pengajaran atau sejauh mana pertanyaan, tugas atau butir dalam suatu tes atau instrumen mampu mewakili secara keseluruhan dan proposional perilaku sampel yang dikenai tes tersebut, maksudnya tes dapat representatif mewakili keseluruhan materi yang diujikan atau materi yang seharusnya dikuasai secara proposioanal
2) Validitas Konstruk
Validitas Konstruk adalah untuk mengetahui sejauh mana butir-butir instrumen mampu mengukur apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual. Validitas konstruk di dalamnya mengukur variabel- variabel konsep dan perumusan konstruk dimulai berdasarkan sintesis dari teori-teori mengenai konsep variabel yang hendak diukur melalui proses analisis
3) Validitas Muka (Face Validity)
Validitas muka ini bisa juga dimaknaisebagai validitas bentuk soal (pertanyaan, pernyataan,suruhan) atau validitas tampilan yang diartikan sebagai keabsahaan susunan kalimat atau kata-kata dalam soal sehingga jelas pengertiannya atau tidak menimbulkan tafsiran lain. Penyajian alat evaluasi tersebut berkenaan dengan tampilan (kulit, luar, wajah)nya. Pada umumnya alat evaluasi yang mempunyai validitas isi yang baik, validitas
mukanya pun baik pula, tetapi tidak berlaku sebaliknya.
2. Validitas Empirik (Kriterium)
Validitas Empiris adalah validitas yang ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal.
Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, dapat dicontohkan adalah validitas butir yang didalanya berusaha untuk menganalisis apakah ada kesesuaian antara sekor butir dengan sekor total instrumen berarti yang dijadikan kriteria adalah instrumen itu sendiri. Sedangkan kriteria eksternal yaitu hasil ukur instrumen atau tes lain di luar instrumen yang menjadi kriteria, contoh validitas prediktif /ramalan (predictive validity) dan validitas konkuren/bandingan (concurrent validity).
1) Validitas Prediktif
Validitas prediktif yang dijadikan kriteria standar adalah prestasi belajar siswa yang akan datang, karena validitas prediktif bermaksud melihat bagaimana suatu tes dapat dapat memprediksi atau memperkirakan perilaku siswa pada masa yang akan datang, contoh dikorelasikan tes ujian masuk dengan prestasi belajar siswa di masa atau waktu berikutnya. Uji validitas ramalan dapat menggunakan teknik analisis korelasional Product Moment dari Karl Pearson.
2) Validitas Konkuren
Validitas konkuren ialah jika kriteria standarnya adalah sama sama saat atau saat ini, dan bukan masa yang akan datang, contoh tes hasil formatif 1 dikorelasikan dengan tes hasil formatif 2 (yang dijadikan kriteria atau standarnya). Uji validitas konkuren dapat menggunakan teknik analisis korelasional Product Moment dari Karl Pearson.
B.2 Koefisien Validitas
Cara menentukan tingkat (indeks) validitas kriterium ini adalah dengan menghitung koefisien korelasi antara alat evaluasi yang akan diketahui validitasnnya dengan alat ukur lain yang telah dilaksanakan
dan diasumsikan memiliki validitas yang tinggi (baik), sehingga hasil evaluasi yang digunakan sebagai kriterium itu telah mencerminkan kemampuan siswa sebenarnya. Makin tinggi koefisien korelasinya maka semakin tinggi pula validitas alat evaluasi tersebut.
Menurut Turmuzi (John W. Best. 2003) mencari koefisien validitas dapat digunakan 3 (tiga) cara, yaitu dengan menggunakan rumus sebagai berikut:
1. Korelasi produk moment memakai simpangan
𝑟𝑥𝑦 = ∑ 𝑥𝑦
√(𝑥2)(𝑦2) Keterangan:
𝑟𝑥𝑦= koefisien korelasi anatara variabel x dan variabel y 𝑥 = deviasi dari mean utuk nilai variabel X
𝑦 = deviasi dari mean utuk nilai variabel Y
∑ 𝑥𝑦 = jumlah perkalian antara nilai X dan Y 𝑥2= kuadrat dari nilai 𝑥
𝑦2= kuadrat dari nilai y
Interpretasi nilai 𝑟𝑥𝑦 tersebut diartikan pada kategori-kategori interval pada tabel 12 seperti berikut ini;
Tabel 12. Interpretasi nilai korelasi 𝑟𝑥𝑦 pada interval&kategori
Interval Kategori
0,90 ≤ 𝑟𝑥𝑦 ≤ 1,00 Korelasi sangat tinggi 0,70 ≤ 𝑟𝑥𝑦 ˂ 0,90 Korelasi tinggi 0,40 ≤ 𝑟𝑥𝑦 ˂ 0,70 Korelasi sedang 0,20 ≤ 𝑟𝑥𝑦 ˂ 0,40 Korelasi rendah
𝑟𝑥𝑦 ˂ 0,20 Korelasi sangat rendah
Maka untuk menentukan koefisien validitas alat evaluasi dapat digunakan kategori-kategori interval di atas, dalam hal ini nilai 𝑟𝑥𝑦 diartikan sebagai koefisien validitas, sehingga kategori-kategori intervalnya menjadi:
Tabel 13. Interpretasi nilai validitas 𝑟𝑥𝑦 pada interval&kategori
Interval Kategori
0,90 ≤ 𝑟𝑥𝑦 ≤ 1,00 Validitas sangat tinggi (sangat baik) 0,70 ≤ 𝑟𝑥𝑦 ˂ 0,90 Validitas tinggi (baik) 0,40 ≤ 𝑟𝑥𝑦 ˂ 0,70 Validitas sedang (cukup) 0,20 ≤ 𝑟𝑥𝑦 ˂ 0,40 Validitas rendah (kurang) 0,00 ≤ 𝑟𝑥𝑦 ˂ 0,20 Validitas sangat rendah (sangat
kurang) 𝑟𝑥𝑦 ˂ 0,00 Tidak valid
2. Korelasi produk moment memakai angka kasar (raw score) 𝑟𝑥𝑦 = 𝑁 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
√(𝑁 ∑ 𝑋2− (∑ 𝑋)2)(𝑁 ∑ 𝑌2− (∑ 𝑌)2) Dengan N = banyak subyek (testi)
Proses perhitungan dengan menggunakan rumus raw score relative singkat daripada dengan menggunakan rumus simpangan.
3. Korelasi metode rank (rank method correlation) dari spearman-Brown, rumusnya adalah:
𝑟𝑥𝑦 = 1 − 6 ∑ 𝑑2 𝑁(𝑁2− 1) Dengan d = selisih rank antara X dan Y
B.3 Faktor-faktor yang Mempengaruhi Validitas
Dalam hubungannya dengan kegiatan belajar mengajar matematika, faktor-faktor berikut ini akan dapat mengurangi akan dapat mengurangi
fungsi fokok uji sesuai dengan yang diharapkan sehingga bisa merendahkan nilai validitas alat evaluasi tersebut.
1) Petunjuk soal yang tidak jelas; yakni tentang hal-hal yang harus dilakukan peserta ujian(testi).
2) Perbendaharaan kata dan struktur kalimat yang sukar; yakni tidak menggunakan kata yang komunikatif/baku, dan struktur kalimat yang berbelit-belit/tidak berdasarkan SPOK.
3) Penyusunan soal yang kurang baik
4) Hasil cetak soal yang kurang baik (contoh kabur, buram, dsb.) 5) Derajat kesukaran soal yang tidak sesuai; yakni jika semua testi benar
pada semua butir soal itu dikarenakan soalnya mudah dan sebaliknya jika semua testi salah pada semua butir soal itu dikarenakan soalnya sulit. Dengan kata lain kemampuan siswa pada aspek tertentu tidak terungkap sesuai dengan keadaan sebenarnya, maka otomatis validitasnya rendah.
6) Materi tidak representatif; yakni jika pada paket soal memuat aspek kognitif tidak lengkap maka imformasi yang dihasilkan dari soal tersebut juga tentu tidak sempurna demikian sebaliknya akan mempengaruhi validitas.
7) Pengaturan soal yang kurang tepat; yakni pengaturan soal hendaknya disusun dari yang mudah, sedang, dan sulit. Penempatan soal-soal yang sukar pada nomor-nomor awal membuat siswa menghabiskan energy dan waktu yang banyak dan akan mempengaruhi cara menjawab pada soal-soal berikutnya dikarenakan waktunya yang kurang dan gugup (terkuras semua pikirannya pada soal yang sukar).
8) Pola jawaban yang dapat diidentifikasi; yakni pola jawaban pada soal objektif akan mendorong siswa untuk menebak jawaban, sehingga konsep pada soal tidak dipikirkan lagi.