Bagian hani evaluasi tentang reliabilitas

(1)

Reliabilitas

A. Arti Reliabilitas Bagi Sebuah Tes

Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.

Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabila pembaca telah memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan berkali-kali. Instrumen yang baik adalah instrumen yang dapat dengan ajeg memberikan data yang sesuai dengan kenyataan.

Yang sering ditangkap kurang tepat bagi pembaca adalah adanya pendaat bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Dalam pembicaraan evaluasi ini tidak demikian. Ajeg atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan si A mula-mula berada lebih rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, si A juga berada lebih rendah dari B. Itulah yang dikatakan ajeg atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok yang lain. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas instrumen.

Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi tidak valid. Sebalinya, sebuah tes yang valid biasanya reliable.

A reliable measure in one that provides consistent and stable indication of the characteristic being investigated.

Untuk dapat memperoleh gambaran yang ajeg memang sulit karena unsur kejiwaan manusia itu sendiri tidak ajeg. Misalnya kemampuan, kecakapan, sikap dan sebagainya berubah-ubah dari waktu ke waktu.

Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali. Namun secara garis besar dapat dikelompokkan menjadi 3 hal:

(2)

Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Dengan demikian maka semakin panjang tes, maka reliabilitasnya semakin tinggi. Dalam menghitung besarnya reliabilitas berhubung dengan penambahan banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh Spearman dan Brown sehingga terkenal dengan rumus Spearman – Brown.

r_nn= nr

1+(n−1)r Dimana:

R_nn : besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru n: berapa kali butir-butir soal itu ditambah

r : besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah

contoh:

suatu tes terdiri atas 40 butir soal, mempunya koefisien reliabilitas 0,70. Kemudian butir-butir itu ditambah menjadi 60 butir-butir soal. Maka koefisien reliabilitas baru adalah:

r_nn= nr

1+(n−1)r

=

₁₊₍_1,51,5₋×0,70₁₎_×_0,70

=

1,05_1,35

= 0,79

Demikian maka penambahan sebanyak 20 butir soal dari 40 butir, memperbesar koefisien reliabilitas sebesar 0,09. Akan tetapi, penambahan butir-butir soal tes adakalanya tidak berarti, bahkan merugikan. Hal ini disebabkan karena:

1. Sampai pada suatu batas tertentu, penambahan banyaknya butir soal sudah tidak menambah tinggi reliabilitas tes.

2. Penambahan tingginya reliabilitas tes tidak sebanding nilainya dengan waktu, biaya dan tenaga yang dikeluarkan untuk itu. Misalnya seorang guru sudah cukup membuat 100 soal bentuk objektif dan 10 soal bentuk esai sudah cukup mempunyai validitas isi dan tingkah laku. Guru tersebut ingin menambah butir-butir soal sehingga menjadi 200 dan 20 dengan menambahkan soal-soal yang parallel. Tentu saja hal ini hanya akan menambah waktu, biaya dan tenaga saja tanpa ada keuntungan apa-apa. Kualitas butir-butir soal ditentukan oleh:

(3)

b) Baik-tidaknya pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab.

c) Petunjuknya jelas sehingga mudah dan cepat dikerjakan.

2) Hal yang berhubungan dengan tercoba (testee)

Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada kelompok tertentu yang diambil secara dipilih.

3) Hal yang berhubungan dengan penyelenggaraan tes

Sudah disebutkan bahwa faktor penyelenggaraan tes yang bersifat administrative sangat menentukan hasil tes.

Contoh:

1. Petunjuk yang diberikan sebelum tes dimulai akan memberikan ketenangan kepada para tes-tes dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak terdapat pertanyaan. Ketenangan ini tentu saja akan berpengaruh terhadap hasil tes.

2. Pengawas yang tertib akan mempengaruhi hasil yang diberikan oleh siswa terhadap tes. Bagi siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan rasa jengkel dan tidak dapat dengan leluasa mengerjakan tes.

3. Suasana lingkungan dan tempat tes (duduk tidak teratur, suasana disekelilingnya ramai dan sebagainya) akan mempengaruhi hasil tes.

Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan mempengaruhi reliabilitas soal tes.

B. Cara-Cara Mencari Besarnya Reliabilitas

Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.

Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di luar tes (consistency eternal) dan pada tes itu sendiri (consistency internal).

(4)

Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa Inggris disebut alternative-form method (parallel forms).

Dengan metode bentuk parallel ini, dua buah tes yang paralel misalnya tes Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitasnya tes seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan sebagai alat pengetes yang terandalkan.

Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan dua buah tes dan masing-masing dicobakan pada kelompok siswa yang sma. Oleh karena itu, ada orang menyebutkan sebagai double test-double-trial method. Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dlam evaluasi disebut adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.

Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.

2) Metode tes ulang (test-retest method)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut dengansingle-test-double-trial method. Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya.

Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena karena tercoba akan masih ingat akan butir-butir soalnya. Ooleh karena itu, tenggang waktu antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah akan berbeda dan siswa sendiri barangkali sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan berpengaruh pula terhadap reliabilitas.

(5)

effect.Yang penting adalah adanya kesejahteraan hasil atau ketetapan hasil yang diyunjukkan oleh koefisien korelasi yang tinggi.

Siswa Tes Pertama_Skor _Ranking Tes kedua_Skor _Ranking

A 15 3 20 3 Metode ini juga disebut self-correlation method (korelasi diri sendiri) karena mengkorelasikan hasil dari tes yang sama.

3) Metode belah dua atau split-half method

Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes dua kali percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial method.

Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi langsung ditafsirkan itulah koefisiensi reliabilita, maka dengan ketiga metode ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui

2 : korelasi antara skor-skor setiap belahan tes

r₁₁ : koefisien reabilitas yang sudah disesuaikan

Contoh:

Korelasi Antara belajan tes = 0,60

Maka, reabilitas tes = 2₁×0,60

+0,60 = 1,20

(6)

Banyak pemakai metode ini salah membela hasil tes pada waktu, menganalisis. Yang mereka lakukan adalah mengelompokkan hasil separo subjek peserta tes dan separo yang lain kemudian hasil kedua kelompok ini dikorelasikan. Yang benar adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapat dibelah. Ada dua cara membelah butir soal ini, yaitu:

1. Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganjil-genap.

2. Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya disebut belahan awal-akhir.

Contoh Perhitungan Reabilitas Dengan Metode Belah Dua

Langkah pertama yang harus dilakukan adalah mengadakan analisis butir soal yang lebih terkenal dengan nama analisis item. Item yang dapat dijawab dengan benardiberi skor dan bagi yang salah diberi skor 0. Skor-skor untuk seluruh subjek dan seluruh item ini diterakan dalam table analisis sebagai berikut.

TABEL ANALISIS ITEM TES MATEMATIKA

No Nama Nomer item Skor

Total

1,3,5,7 ,9

2,4,6,8, 10

1,2,3,4 ,5

6,7,8,9 ,10 1 2 3 4 5 6 7 8 9 10 Ganjil Genap Awal Akhir

1 Hartati 1 0 1 0 1 1 1 1 1 1 8 5 3 3 5

2 Yoyok 0 0 1 0 1 0 0 1 1 1 5 3 2 2 3

3 Oktaf 0 1 0 0 0 1 0 1 0 1 4 0 4 1 3

4 Wendi 1 1 0 0 1 1 0 0 1 0 5 3 2 3 2

5 Diana 1 1 1 1 1 1 0 0 0 0 6 3 3 5 1

6 Paul 1 0 1 0 1 0 1 0 0 0 4 4 0 3 1

7 Susana 1 1 1 1 1 1 1 0 0 0 7 4 3 5 2

8 Helen 0 1 0 1 1 1 1 1 1 1 8 3 5 3 5

Penyajian contoh membelah diatas berarti bahwa perhitungan reliabilitas dilakukan dengan membelah dengan dua cara. Pembelahannya hanya memilih salah satu saja, untuk selanjutnya dihitung dengan korelasi product moment.

(7)

Table persiapan perhitungan reliabilitas dengan belah dua ganjil-genap adalah sebagai

Kelanjutan dari table ini adalah menghitung dengan rumus korelasi product moment. Dengan menggunakan kalkultor diketahui bahwa:

∑X = 25 ∑ x2 = 93

∑Y = 22 ∑ y2 _{= 76}

∑XY = 63

Setelah menghitung dengan rumus kolelasi product moment dengan angka kasar diketahui bahwa r_xy = -0,3786. Hargatersebut baru menunjukkan reabilitas separo tes. Oleh karena itu, r_xy untuk belahan ini disebut istilah r1

2 1

2 atau r99 . Untuk mencari reliabilitas seluruh tes digunakan rumus spearman-Brown yang rumusnya telah dikemukakan didepan. Jika koefisien reliabilitas separo tes ini dimasukkan kedalam rumus hitungannya demikian:

r₁₁

₌

(8)

2) Pembelahan awal-akhir

Dengan data yang tertera pada table analisis item tes matematika diketahui jumlah skor belahan awal-akhir sebagai berikut.

No Nama Item Ganjil

(1,2,3,4,5)(X)

Item Genap (6,7,8,9,10)(Y)

1 Hartati 3 5

2 Yoyok 2 3

3 Oktaf 1 3

4 Wendi 3 2

5 Diana 5 1

6 Paul 3 1

7 Susana 5 2

8 Helen 3 5

Seperti halnya pada waktu menghitung dengan belahan ganjil genap maka kelanjutannya adalah menghitung dengan rumus korelasi product moment.

Dengan menggunakan kalkulator diketahui:

∑X = 25 ∑ X2 _{= 91}

∑Y = 22 ∑ Y2 = 78

∑XY = 63

Setelah dimasukkan kedalam rumus korelasi product moment dengan angka kasar diperoleh r₁

2 1

2 = -0,3831. Dengan rumus Spearman-Brown diperoleh r11 = -0,5538.

Selain menggunakan rumus kolerasi product moment, dua orang ahli mengajukan rumus lain. Seorang bernama Flanagan menemukan rumus yang perhitungannya menggunakan belah dua ganjil-genap, dan seorang lagi barnama Rulon yang rumusnya diterapkan pada data belahan awal-akhir.

3) Penggunaan rumus Flanagan

r₁₁ =2 [1- S1 2

S_t2+ S2

2

S_t2 ] Dimana:

(9)

S12 = varians belahan pertama (1) yang dalam hal ini varians skor item ganjil S22 = varians belahan kedua (2), yaitu varians skor item genap

St2 = varians total yaitu varians skor total

Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat. Dengan demikian bagi peminat yang menghitung dengan kalkulator statistic varians ini diperoleh dengan mengkuadratkan standar deviasi. Untuk mereka yang tidak menggunakan kalkulator statistic maka varians dapat dicari dengan rumus sebagai berikut:

S2

₌

kalkulator tertera dengan simbul a.

Bagi yang berminat mencari S dulu untuk varians, dapat menggunakan rumus S, yaitu:

S =

√

∑ X2

N

Dimana :

S = standar devinisi

X = simpangan X dan X, yang dicari dari X-X

S2 = varians, slalu ditulis dalam bentuk kuadrat, karena standar deviasi kuadrat N = banyaknya subjek pengikut tes

Berdasarkan data table belahan ganjil genap perhitungannya adalah sebagai berikut.

S1

(10)

¿295−276,13

8 = 2,36

dimasukkan kedalam rumus diperoleh demikian

r₁₁ _{= 2}

(

_{1 -} 1,859+1,937

Sd2 = varians beda (varians different)

D = difference, adalah perbedaan antara skor belahan pertama (awal) dengan skor belahan (akhir)

Dari perhitungan terdahulu diketahui varians total = 2,75

Sd2

=

Dari perhitungan rumus Flanagan maupun Rulon ternyata hasilnya sama, keduanya lebih besar dari 1,00. Secara teoritik koefisien ini salah tetapi karena perbulatan-perbulatan dalam perhitungan, hasil seperti ini dapat saja terjadi.

(11)

kedua, item yang membentuk soal tes harus homogeny atau paling tidak setelah dibelah terdapat keseimbangan Antara belahan pertama dengan belahan kedua.

Untuk mengatasi kesulitan memenuhi persyaratan ini maka reliabilitas dapat dicari dengan runmus yang dikemukakan oleh Kuder dan Richardson. Kedua orang ahli ini menemukan banyak rumus yang diberi nomor. Rumus yang digunakan untuk mencari reliabilitas dan banyak digunakan orang ada dua rumus, yaitu rumus K-R 20 dan rumus K-R 21.

5) Penggunaan rumus K-R 20 Rumus:

r₁₁

_{= (}

n

n−1¿(

S2−∑ pq S2 ) r₁₁ = reliabilitas tes secara keseluruhan

P = proporsi subjek yang menjawab item dengan benar

q = proporsi subjek yang menjawab item dengan salah (q =1 – p) ∑ pq = jumlah hasil perkalian Antara p dan q

n = banyaknya item

S = standar devinisi dari tes (standar devinisi adalah akar varians)

6) Penggunaan rumusan K-R 21 Rumus :

r₁₁

_{= (}

n

n−1¿

(1-

M(n−M)

n S_t2

)

keterangan:

M = mean atau rerata skor total

r11 = ₇7

−1× (1-

3,5(7−3,5)

7×1,85 )

¿1,17× (1- 3,5−3,5

12,95 )

¿1,17× (1- 12,25 12,95 )

¿1,17×(1−0,946)

¿1,17×0,0541

(12)

Jika dibandingkan reliabilitas yang dihitung dengan K-R 20 dan K-R 21 lebih besar yang pertama. Memang menggunakan rumus K-R 20 cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaannya lebih rumit.

r₁₁=Reliabilitas seluruh soal Vr = Varians responden Vs = Varians sisa

Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut. Langkah 1. Mencari jumlah kuadrat responden dengan rumus.

JK₍_i₎

₌

∑ B2

Langkah 2. Mencari jumlah kuadrat item dengan rumus:

JK₍_r₎=∑ Xt

∑B2=¿ jumlah kuadrat jawab benar seluruh item

∑ X

(¿¿t)2=kuadrat dari jumlah skor total

¿

(13)

JK₍_t₎= (∑ B)(∑S) (∑B)+(∑S)

Keterangan :

JK₍_r₎=jumlah kuadrat total

∑B=jumlah jawab benar seluruhitem

∑S=jumlah jawab salah seluruhitem

Langkah 4. Mencari jumlah kuadrat sisa, dengan rumus:

JK₍_s₎=JK₍_t₎−JK₍_r₎−J₍_i₎

langkah5.mencari variansresponden dan varians sisa dengan tabel F .

dalam mencari varians ini diperlukan d.b (derajat kebebasan) dari masing-masing sumber varians kemudian d.b ini digunakan sebagai penyebut terhadap setiap jumlah kuadrat untuk memperoleh variansi.

d.b = banyaknya N setiap sumber varians dikurangi 1.

Jadi,

varians

=

jumlahkuadrat_{d .b}

Langkah 6. Memasukkan kedalam rumus r₁₁

r₁₁=1−Vs

Vr

Mencari reliabilitastes bentuk ukuran

Apa yang sudah dibicarakan didepan atau juga yang banyak terdapat dibuku-buku lain, hanya meliputi uraian mengenai reliabilitas tes bentuk objektif, yaitu soal yang terdiri dari butir-butir soal yang dinilai hanya “benar” dan “salah”. Menilai soal bentuk uraian tidak dapat dilakukan seperti itu. Sesuatu butir soal uraian menghendaki gradualisasi penilaian. Barangkali butir soal nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya5, dan butir soal nomor 3 sampai 10, dan sebagainya.

Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal dicantumkan pada kolom item menurut apa adanya. Rumus yang digunakan adalah rumus alpha sebagai berikut.

n

(n−1)

r₁₁=¿

(14)

Keterangan:

r11=reliabilitas yang dicari

∑αi2=jumlah varians skor tiap−tiap item αt2=varians total

Perlu diingatkan kembali rumus varians yang sudah kita kenal, yaitu:

α2 ₌ X ∑¿

¿ ¿2

¿ ¿

∑ X2−¿ ¿

atau

α2=∑ Xt

2

N - ∑ X

(¿¿t)2

N