• Tidak ada hasil yang ditemukan

Reliabilitas pengukuran merupakan salah satu properti psikometris yang memegang peranan penting untuk mengevaluasi sebuah alat ukur. Sub bab berikut ini akan memaparkan mengenai pengertian reliabilitas, pendekatan dalam mengestimasi reliabilitas dalam psikometri dan paparan mengenai beberapa formula koefisien reliabilitas yang banyak digunakan oleh peneliti.

1. Reliabilitas

Kata reliabilitas diperkenalkan pertama kali oleh Spearman pada tahun 1910 melalui karyanya yang di muat dalam Journal British of Psychology (Slaney, 2004). Spearman mendefinisikan reliabilitas sebagai koefisien yang menunjukkan hubungan antara dua buah belahan tes yang mengukur hal yang sama. Dicontohkan olehnya bahwa sebuah tes yang dibelah menjadi dua buah belahan dengan belahan pertama berisi item-item genap dan belahan yang lain berisi item-item ganjil.

Reliabilitas hasil pengukuran dapat dilihat melalui berbagai perspektif sehingga ada beberapa terminologi dikaitkan dengan reliabilitas. Tonigan (2000) mengatakan ada tiga terminologi yang menggambarkan reliabilitas hasil pengukuran, yaitu stabilitas (stability), kesetaraan (equivalency), dan konsistensi internal (internal item consistency). Knapp (2002) mengatakan bahwa terminologi yang menggambarkan konsistensi hasil pengukuran bukan hanya pada kata reliabilitas saja melainkan ada kata lain seperti

akurasi (accuracy), presisi (precision), kesepakatan (agreement), ketergantungan (dependability), reproduksibilitas (reproducibility), pengulangan (repeatability). Meskipun digambarkan dengan terminologi yang bermacam-macam namun para ahli memiliki kesepakatan bahwa apa yang dikaji oleh reliabilitas adalah konsistensi hasil pengukuran antar butir dengan butir lainnya, konsistensi hasil penilaian antara rater dengan rater lainnya, konsistensi hasil antara waktu satu dengan waktu lainnya dan konsistensi antara pengukuran satu dengan lainnya.

Beberapa ahli menitik beratkan pengertian reliabilitas dari sisi konsistensi pengukuran yang dikenakan pada situasi dan kondisi berbeda. Lewis (1999) misalnya, mengatakan bahwa reliabilitas adalah informasi mengenai seberapa jauh konsistensi hasil pengukuran jika diterapkan pada kondisi yang berbeda. Asumsi yang dipakai dalam mendefinisikan reliabilitas tersebut adalah proses pengukuran tidak mempengaruhi fluktuasi konstrak yang diukur. Devit et.al (1998) mendefinisikan reliabillitas sebagai konsistensi yang artinya jika pengukuran dilakukan pada situasi yang berbeda, hasil yang didapatkan adalah setara. Reliabilitas ini akan mempengaruhi validitas pengukuran sehingga untuk mendapatkan pengukuran yang valid syarat utama yang perlu dipenuhi adalah pengukuran yang reliabel. Sebaliknya pengukuran dapat saja kurang reliabel meskipun validitas pengukuran tersebut memuaskan. Tidak hanya konsisten pada situasi dan kondisi yang berbeda, reliabilitas juga dinyatakan sebagai ukuran konsistensi pada sampel dan populasi yang sama. The Standards for Educational

and Psychological Testing mendefinisikan reliabilitas hasil pengukuran yang konsisten

jika diterapkan pada populasi individu yang sama.

Pengertian mengenai reliabilitas juga ditinjau oleh para ahli melalui sisi kendali terhadap sesatan pengukuran yaitu dengan melihat reliabilitas sebagai informasi

mengenai keacakan hasil yang diakibatkan pengukuran. Apigian et.al (2005) misalnya, mendefinisikan reliabilitas sebagai indikasi seberapa jauh operasionalisasi pengukuran terbebas dari sesatan acak dan mengukur konstrak dalam pola yang konsisten. Sebuah pengukuran dikatakan terpercaya jika terbebas dari pengaruh faktor lain yang sifatnya acak, baik terkait dengan instrumen maupun kondisi selama pengukuran berlangsung. Beberapa ahli lain mendefinisikan reliabilitas secara operasional yang dapat menggambarkan persamaan matematisnya. Becker (2000) misalnya, mengatakan bahwa reliabilitas adalah perbandingan antara varian temporer di dalam skor tes dengan varian tes secara keseluruhan.

Reliabilitas tidak berkaitan dengan instrumen atau konstrak tes akan tetapi lebih berkaitan dengan pengukuran atau skor hasil ukur. Crocker dan Algina (1986) mengatakan bahwa data dapat bersifat reliabel atau tidak reliabel sedangkan alat ukur tidak berkaitan dengan reliabel atau tidak reliabel. Reliabilitas adalah properti dari skor pada populasi yang dikenai tes. Reliabilitas lebih berkaitan pada data atau skor dan tidak berkaitan dengan alat ukur. Pernyataan tersebut didukung oleh Capraro et.al (2001) yang mengatakan bahwa reliabilitas berkaitan dengan data yang didapatkan dari alat ukur, bukan berkaitan dengan alat ukurnya. Konsep yang tepat dikaitkan dengan reliabilitas adalah skor tes (test score) dan pengukuran (measurement), dan bukan kata tes (test) atau alat ukur (instrument). Leech et.al (2005) mengatakan reliabilitas adalah informasi mengenai pengukuran atau asesmen satu dengan lainnya yang mengukur hal yang sama dan seberapa jauh pengukuran atau asesmen tersebut terbebas dari sesatan pengukuran.

Faktor karakteristik sampel mempengaruhi besarnya koefisien reliabilitas. Thompson (1994) mengatakan bahwa pengukuran yang sama jika dikenakan pada

subjek yang homogen dan subjek yang heterogen memungkinkan untuk menghasilkan nilai koefisien reliabilitas yang berbeda. Reliabilitas tergantung pada karakteristik sampel yang diuji sehingga dapat diartikan bahwa reliabilitas adalah konsistensi hasil pengukuran ketika sebuah tes diberikan kepada sebuah populasi hipotetik individu atau kelompok. Estimasi terhadap reliabilitas turut berubah jika dikenakan pada populasi yang berbeda. Hal ini menjelaskan bahwa reliabilitas adalah fungsi dari skor tes bukan pada instrumen tes yang dipakai.

Pengertian bahwa reliabilitas merupakan properti dari sampel bertentangan dengan pengertian reliabilitas sebagai properti dari atribut ukur. Rudner dan Schafer (2001) mengatakan bahwa reliabilitas adalah seberapa jauh hasil yang diinformasikan oleh sebuah tes sebagai hasil dari atribut yang hendak dianalisis. Ditambahkan oleh ahli tersebut bahwa pengertian reliabilitas yang melibatkan informasi mengenai sampel (group of test takers) kurang lengkap karena memungkinkan adanya variasi hasil pengukuran secara sistematis dan kurang dapat diulangi (repeatable).

Beragam pengertian mengenai reliabilitas dikemukakan oleh para penulis. Kesimpulan mengenai pengertian reliabilitas yang dapat diangkat dari paparan di atas adalah reliabilitas merupakan properti dari ketepatan mengukur atribut ukur dan properti dari populasi yang dikenai tes. Reliabilitas menjelaskan pengulangan perilaku individu yang dibuktikan dengan pengulangan respon individu yang dibangun oleh tes dan nilai skor tes yang setara. Reliabilitas terkait dengan populasi secara spesifik. Tidak seperti validitas yang memiliki kriteria eksternal yang dapat dijadikan acuan (gold standard) untuk melihat kualitas hasil sebuah estimasi, reliabilitas tidak memiliki acuan utama karena kualitas pengukurannya tergantung secara relatif pada skor yang didapatkan dari pengukuran itu sendiri (Lewis, 1999)

2. Validitas Pengukuran

Konsep validitas pertama kali diperkenalkan oleh Guilford yang menjelaskan bahwa tes dapat dikatakan valid jika memiliki korelasi dengan sesuatu yang berkaitan dengannya (Guilford, 1954). Pengertian tersebut dinilai masih terlalu umum sehingga muncul pengertian-pengertian dari para ahli, namun pengertian yang ditandaskan oleh Guilford tersebut secara tidak langsung menjelaskan bahwa konsep validitas tidak mengkaji properti karakteristik instrumen pengukuran akan tetapi lebih menjelaskan pada orientasi dan tujuan pengukuran. Tes yang valid dapat dikatakan telah memenuhi tujuan yang hendak dicapai.

Dari literatur psikometri dikenal pembagian jenis validitas menjadi tiga kategori yaitu validitas isi (content validity), validitas kriteria (criterion-related validity) dan validitas konstrak (contruct validity). Meskipun dibagi menjadi tiga kategori namun pembagian tersebut tidak menunjukkan pandangan yang berbeda mengenai orientasi instrumen pengukuran namun perbedaan tersebut terletak pada standar yang dipakai untuk menentukan instrumen pengukuran tersebut valid ataukah tidak. Pernyataan tersebut didasari oleh pernyataan Cronbach (1990) yang mengatakan bahwa semua validasi adalah satu. Cronbach (1990) menambahkan bahwa validitas konstrak dapat dipakai untuk menjelaskan instrumen pengukuran apabila validitas isi dan validitas kriteria kurang memiliki kekuatan (power) untuk mengklaim validitas.

Pendekatan yang lebih kontemporer lebih mengkaji validitas berdasarkan makna dan interpretasi pengukuran sebagai bentuk lain dari properti psikometris pengukuran. Proses validasi pengukuran harus didasari oleh teori dan objek validasi adalah skor tes. Validitas adalah evaluasi keputusan yang integratif (integrated evaluative judgment) pada seberapa jauh bukti dan rasionalisasi teoritis mendukung kepatutan dan ketepatan

keputusan yang diambil berdasarkan hasil pengukuran. Pengertian tersebut menunjukkan bahwa uji validitas adalah pengujian seberapa jauh kesimpulan (inferences) mengenai hasil pengukuran yang sesuai dengan kondisi yang dihadapi. Paparan yang lebih praktis dapat melihat paparan Landy (1986) yang mengatakan bahwa responden memiliki sejumlah atribut psikologis tertentu sehingga kesimpulan hasil pengukuran dapat dikatakan valid jika mampu menggambarkan atribut psikologis tersebut. Landy (1986) menambahkan bahwa kesimpulan hasil pengukuran tersebut terdiri dari berbagai jenis, misalnya X adalah bagian dari Y, X adalah pendekatan dari Y atau X adalah indikator dari Y. Dengan demikian proses validasi tidak sekedar pada apakah instrumen penguran menggambarkan atribut yang diukur saja.

Dokumen terkait