• Tidak ada hasil yang ditemukan

BAB II LANDASAN TEORI

2.1 Kajian Hasil-hasil Penelitian Terdahulu yang Relevan

2.2.12 Reliabilitas

Reliabilitas menunjuk pada pengertian konsistensi pengukuran, yaitu seberapa konsisten skor tes atau hasil penilaian dari satu pengukuran ke pengukuran yang lain (Grondlund, 1985 dalam Nurgiyantoro, 2010:165). Selain itu, reliabilitas akan menunjukkan seberapa tinggi kita dapat berharap terhadap hasil tes yang bersangkutan.

Pengertian konsisten dalam reliabilitas tes berhubungan dengan hal-hal, (a) tes dapat memberikan hasil yang relatif tetap terhadap sesuatu yang diukur, (b) jawaban peserta didik terhadap butir-butir tes secara relatif tetap, dan (c) hasil tes diperiksa oleh siapa pun juga akan menghasilkan skor yang kurang lebih sama. Hasil pengukuran yang dilakukan tidak hanya mencerminkan berapa banyak peserta didik telah berhasil dalam kegiatan belajar, melainkan juga bagaimana keakuratan tes itu sendiri. Keakuratan tes mempengaruhi skor peserta didik.

(1) Reliabilitas Ulang Biji

Teknik tes ulang uji adalah teknik meperkirakan tingkat reliabilitas tes dengan melakukan kegiatan pengukuran dua kali terhadap tes yang sama kepada peserta didik yang sama pula.

(2) Reliabilitas Belah Dua

Pengujian tes dengan teknik belah dua (split half) dilakukan dengan memisahkan skor hasil ke dalam dua kelompok, yaitu kelompok ganjil dan kelompok genap atau kelompok awal dan kelompok akhir. Caranya ialah dengan menghitung jumlah skor untuk butir-butir soal bernomor ganjil dan genap. Kedua jumlah skor tersebut kemudian dikorelasikan untuk mendapatkan koefisien korelasi (r) antara keduanya.

(3) Reliabilitas Rumus Kuder-Richardson 20 dan 21

Pengujian reliabilitas tes dengan menggunakan rumus K-R 20 dan K-R 21, dilakukan dengan membandingkan skor butir-butir tes. Jika butir-butir tes itu menunjukkan tingginya tingkat kesesuaian (degree of agreement), kita dapat menyimpulkan bahwa hasil pengukuran tes itu konsisten.

(4) Reliabilitas Alpha Cronbach

Koefisien reliabilitas Alpha Cronbach diterapkan pada tes yang mempunyai skala berkala dan dikotomis sekaligus. Artinya, produk uji reliabilitas ini diterapkan pada hasil pengukuran yang berjenjang.

(5) Reliabilitas Bentuk Paralel

Pengujian reliabilitas hasil pengukuran tes dengan teknik butir paralel dilakukan terhadap adanya dua perangkat tes yang bersifat paralel. Untuk menguji reliabilitas

hasil pengukuran tes, kedua perangkat tes tersebut diujicobakan kepada sejumlah subjek yang sama, kemudian hasilnya dikorelasikan. Tinggi rendahnya koefisien korelasi akan mencerminkan reliabilitas hasil pengukuran kedua perangkat tes tersebut.

(6) Reliabilitas Bentuk Tes Uraian

Reliabilitas tes uraian dapat dicari dengan menggunakan rumus koefisien reliabilitas Alpha Cronbach. Rumus ini sebenarnya satu versi dengan rumus Kuder-Richardson.

Dalam penelitian ini, peneliti akan menganalisis reliabilitas Alpha Cronbach dengan menggunakan program SPSS 16.0. Analisis reliabilitas Alpha Cronbach dengan program SPSS 16.0 diawali dengan memasukkan data nilai hasil uji coba siswa (skor total tidak digunakan). Selanjutnya, klik pilihan Analyze >> Scale >>

Reliability Analysis. Setelah itu akan muncul kotak dialog Reliability Analysis.

Kemudian, semua item dipindahkan ke kolom Items. Selanjutnya, pilih OK, maka akan muncul hasil output yang dapat diintepretasikan berdasarkan kriteria yang telah ditetapkan.

Dalam menentukan tingkat reliabilitas soal yang dihasilkan, peneliti menggunakan kriteria reliabilitas yang diungkapkan oleh Guilford (dalam Janniah, 2011: 53). Berikut ini adalah tabel klasifikasi koefisien reliabilitas menurut Guilford.

Tabel 2.15 Klasifikasi Koefisien Reliabilitas

Koefisien Korelasi Interpretasi

0,80 < r11≤ 1,00 Reliabilitas sangat tinggi 0,60 < r11≤ 0,80 Reliabilitas tinggi 0,40 < r11≤ 0,60 Reliabilitas sedang 0,20 < r11≤ 0,40 Reliabilitas rendah 0,00 < r11≤ 0,20 Reliabilitas sangat rendah

r11≤ 0,00 Tidak reliabel

Keterangan:

r11 : koefisien reliabilitas keseluruhan

2.2.16.1 Reliabilitas Antarpenilai (Interrater Reliability)

Rating adalah metode pemberian skor berdasarkan judgment subjektif terhadap

aspek atau atribut tertentu, yang dilakukan melalui pengamatan sistematik secara langsung maupun tidak langsung. Umumnya, suatu metode evaluasi melalui rating

(penilaian) dilakukan oleh lebih dari seorang pemberi penilaian atau penilai untuk meminimalisir pengaruh subjektivitas pemberian skor (Azwar, 2003: 105).

Penilaian terhadap konsistensi atau reliabilitas hasil pemberian penilaian dapat dilakukan dengan memberikan penilaian ulang dan kemudian menghitung korelasi antara kedua pemberian penilaian. Hal ini merupakan semacam replikasi oleh penilai yang sama terhadap kelompok subjek yang sama.

Widhiarso (2011:1) mengungkapkan dua alasan melibatkan penilai dalam pengembangan instrumen penilaian. Pertama, keterlibatan penilai dapat meningkatkan kualitas alat ukur yang dikembangkan. Melibatkan penilai dapat

memastikan bahwa instrumen penilaian yang kita susun relevan dengan apa yang kita ukur dan mewakili keseluruhan ranah ukur. Alasan yang kedua adalah jenis instrumen penilaian yang dikembangkan. Jika instrumen diisi sendiri oleh responden, maka instrumen observasi menggunakan penilai untuk memberikan penilaian.

Pelibatan penilai dalam pengembangan instrumen penilaian membantu kita untuk mengevaluasi instrumen yang kita kembangkan. Dalam penelitian ini, penilai berfungsi sebagai pemberi skor instrumen observasi. Penilai yang bertugas memberikan skor tidak harus profesional dalam bidang yang kita ukur, namun terlatih untuk mengobservasi dalam bidang itu (Widhiarso, 2011: 1).

Kajian reliabilitas yang melibatkan penilai biasanya dinamakan dengan kesepakatan antarpenilai (interrater agreement) atau reliabilitas antarpenilai

(interrater reliability). Dalam kasus reliabilitas antarpenilai, yang diuji

konsistensinya adalah penilainya.

Terdapat dua macam koefisien untuk mengukur kesepakatan antarpenilai atau reliabilitas antarpenilai. Koefisien yang pertama adalah koefisien kappa dari Cohen. Koefisien kappa tepat digunakan ketika (1) penilai yang dipakai tidak banyak (biasanya satu subjek dinilai oleh dua penilai) dan (2) skor hasil penilaiannya bersifat kategori. Biasanya, hanya ada dua kategori yang dikode 0 atau 1 (Widhiarso, 2011: 2).

Koefisien yang kedua adalah koefisien korelasi intra kelas (intraclass correlation

coeffisients/ICC). Koefisien ICC tepat digunakan ketika (1) penilai yang dipakai

kata lain, metode penilaian reliabilitas antarpenilai ini digunakan jika ada beberapa orang penilai menilai individu melalui instrumen penilaian yang menghasilkan data ordinal. (Widhiarso, 2005: 15).

Dalam penelitian ini, peneliti memakai koefisien korelasi intra kelas untuk mengukur reliabilitas antarpenilai. Hal ini disebabkan penilai yang dipakai oleh peneliti lebih dari dua orang dan skor yang dihasilkan berupa data ordinal (bilangan bertingkat), bukan skor yang hanya memiliki kategori 0 atau 1. Analisis reliabilitas antarpenilai ini dapat dilakukan dengan menggunakan program SPSS. Dalam penelitian ini, peneliti menggunakan SPSS versi 16.0.

Koefisien ini dikembangkan atas dasar analisis varians, namun pada kasus tertentu hasilnya memiliki kemiripan dengan koefisien alpha (Widhiarso, 2011: 3). Oleh karena itu, untuk mengetahui tingkat reliabilitas antarpenilai, kriteria yang digunakan sama dengan kriteria yang digunakan untuk mengetahui tingkat reliabilitas

Alpha Cronbach. Untuk menentukan kriteria reliabilitas butir soal dalam penelitian

ini, peneliti menggunakan klasifikasi koefisien reliabilitas menurut Guilford yang telah peneliti paparkan dalam tabel 2.15.