RELIABILITAS. RELIABILITAS Page 1

(1)

RELIABILITAS

A. Pengertian Reliabilitas

Menurut Sugiono (2005) Pengertian Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reliabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda. Menurut Sukadji (2000) reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi. Menurut Nursalam (2003) Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara mengukur atau mengamati sama – sama memegang peranan penting dalam waktu yang bersamaan.

Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk mengukur atau mengamati sesuatu yang menjadi objek ukur. Suatu tes dapat dikatakan mempunyai reliabilitas yang tinggi jka tes tersebut dapat memberikan hsil yang tetap sama (konsisten, ajeg). Hasil pengukuran itu harus tetap sama (relative sama) jika pengukurannya diberikan pada subjek yang sama meskipun dilakukan oleh orang yang berbeda, waktu yang berbeda, dan tempat yang berbeda pula. Alat ukur yang reliabilitasnya tinggi disebut alat ukur yang reliable.

Berkaitan dengan penilaian, suatu alat penilaian disebut reliabel jika hasil penilaian tersebut relative tetap jika digunakan untuk subjek yang sama. Yang sering ditangkap kurang tepat adalah adanya pendapat bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Dalam pembicaraan penilaian ini tidak demikian. Ajeg atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg. Jika keadaan Si A mula – mula berada lebih rendah dibanding dengan si B, maka jika diadakan pengukuran ulang, si A juga berada lebih rendah dari B. itulah yang dikatakan ajeg atau tetap, yaitu sama dalam kedudukan siswa di antara anggota kelompok yang lain. Tentu saja tidak dituntut semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas instrumen.

(2)

Sehubungan dengan reliabilitas ini, Scarvia . Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini sangat penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena menyongkong terbentuknya validitas. Sebuah tes mungkin reliabel tetapi tidak valid. Sebalinya, sebuah tes yang valid biasanya reliabel.

Apa yang dimaksud reliabilitas instrumen riset?

Reliabilitas suatu instrumen pengukuran adalah tingkatan konsistensi yang mengukur apakah ini merupakan ukuran. Kualitas ini adalah penting dalam jenis pengukuran. Seseorang yang mempergunakan instrumen pengukuran semacam itu harus mengidentifikasi dan mempergunakan teknik-teknik yang akan membantunya menentukan apa perluasan instrumen pengukurannya yang sesuai dan reliabel.

Sebagaimana sebuah cara membedakan konsep reliabilitas dari konsep validitas, hal yang berguna adalah mengidentifikasi kesalahan acak pengukuran. Kesalahan acak adalah kesalahan yang merupakan suatu hasil perubahan yang murni. Kesalahan acak pengukuran mungkin menekan skor subyek dalam persoalan yang tak dapat diprediksi. Reliabilitas adalah mengenai pengaruh kesalahan acak pengukuran dalam konsistensi skor. Namun beberapa kesalahan yang dicakup dalam pengukuran dapat diprediksi atau sistematis.

Kegunaan dari reabilitas data adalah untuk mengetahui atau menunjukkan keajekan suatu tes dalam mengukur gejala yang sama pada waktu dan kesempatan yang berbeda.

Bagaimana Hubungan Antara Validitas Dan Reliabilitas ?

Validitas adalah sebuah evaluasi terhadap ketepatan interpretasi dan penggunaan hasil asesmen. Validitas mempunyai arti sejauh mana ketepatan dan kecermatan alat ukur mampu melakukan fungsi ukurnya. Selain validitas, alat ukur yang baik juga harus reliabel. Oleh karena itu, alat ukur yang baik adalah alat ukur yang valid dan reliabel.

Ketetapan hasil pengukuran (reliabilitas) sangat diperlukan untuk memperoleh alat ukur yang dapat memberikan hasil pengukuran yang tepat (valid). Walaupun demikian alat ukur yang mempunyai reliabilitas yang tinggi belum tentu secara otomatis mempunyai validitas yang tinggi. Karena tingginya reliabilitas yang

(3)

dihasilkan oleh suatu alat ukur jika tidak dibarengi dengan tingginya validitas dapat memberikan informasi yang salah tentang apa yang ingi anda ukur. Sebagai ilustrasi berikut ini disajikan hasil perlombaan memanah yang diikuti oleh Aldi, Reni dan Fano. Dari 10 anak panah yang telah mereka lepaskan diperoleh hasil sebagai berikut :

Hasil bidikan siapakah yang tidak valid dan tidak reliabel? Hasil bidikan siapakah yang tidak valid tetapi reliabel? Dan hasil bidikan siapakah yang valid dan

(4)

reliabel? Dengan menggunakan pengertian validitas dan reliabilitas yang telah dijelaskan di depan, maka anda akan dapat menjawab ketiga pertanyaan tersebut. Hasil bidikan Reno adalah hasil bidikan yang tidak valid dan tidak reliabel. Mengapa? Hal ini disebabkan karena dari 10 anak panah yang dilepaskan Reni selalu mengenai sasaran yang berbeda.

Bagaimana hasil bidikan Fano? Kalau anda perhatikan hasil bidikan Fano ternyata dari 10 anak panah yang dilepaskan tidak satu pun anak panah yang tepat mengenai sasaran. Walaupun ke 10 anak panah yang dilepaskan tidak tepat pada sasaran yang di tentukan, tetpai hasil bidikan Fano selalu mengenai sasaran yang relative sama. Kalau kita menggunakan konsep validitas dan reliabilitas yang telah dijelaskan didepan maka dapat dikatakan bahwa hasil bidikan Fano adalah tidak valid tetapi reliabel. Hasil bidikan Aldi lah yang dikatakan valid dan reliabel. Mengapa ? Hal ini disebabkan karena ke 10 hasil bidikan Aldi tepat dan tetap mengenai sasaran yang ditentukan.

B. Pelaksanaan Tes Untuk Menentukan Reliabilitas

Untuk mengestimasi reliabilitas suatu alat penilaian (tes dan non tes) ada tiga cara yang paling banyak dipergunakan, yaitu tes tunggal (single test), tes ulang (test

re-test), dan tes ekuivalen (alternate test).

1. Tes Tunggal (single Test)

Tes tunggal adalah tes yang terdiri dari satu perangkat (satu set) yang diberikan terhadap sekelompok subyek dalam satu kali pelaksanaan. Dengan demikian hasil tes ini hanya terdapat satu kelompok data berupa skor hasil tes. Ada bermacam – macam teknik yang bisa digunakan untuk menentukan reliabilitas jenis tes tunggal ini.

2. Tes Ulang (test re-test)

Tes ulang adalah tes yang terdiri dari seperangkat tes yang diberikan kepada sekelompok subyek dua kali. Reliabilitasnya dihitung dengan cara mengkorelasikan hasil tes pertama dengan tes kedua. (Metode tes ulang adalah penggunaan tes yang sama dua kali pada sejumlah peserta tes yang sama).

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-test-double-trial method. Kemudian hasil dari kedua tes tersebut dihitung korelasinya.

(5)

3. Tes Ekuivalen (alternate test)

Tes ekuivalen adalah tes yang terdiri dari dua perangkat dimana soal – soal pada perangkat pertama ekuivalen dengan soal – soal pada perangkat kedua. Pengertian ekuivalen disini adalah soal – soal yang memuat konsep yang sama, tetapi soal tersebut tidak persis sama. Selain memuat konsep yang sama, tingkat kesukarannya pun harus sama. Misalkan untuk soal pemfaktoran suku tiga bentuk x2−5 x+6 ekuivalen dengan bentuk x2−6 x+8 , tetapi tidak ekuivalen dengan bentuk 5 x2+7 x−4 sebab meskipun konsep suku tiga dan pemfaktoranya sama tetapi tingkat kesukarannya berbeda. Untuk menentukan reliabilitasnya dihitung dengan cara mengkorelasikan hasil tes untuk soal perangkat pertama dengan hasil tes dari perangkat kedua.

Tes parallel atau tes ekuivalen bisa juga adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris disebut alternate-forms method (parallel forms). Dengan metode bentuk parallel ini, dua buah tes yang paralel, misalnya Matematika Seri A yang akan dicari reliailitasnya dan Seri B di teskan pada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukan koefisien reliabilitas tes Seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan sebagai alat pengetes yang terandalkan. Dalam menggunakan metode paralel ini pengetes harus menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama.

C. Jenis – Jenis Reliabilitas

Walizer (1987) menyebutkan bahwa ada dua cara umum untuk mengukur reliabilitas, yaitu :

1. Reliabilitas Stabilitas.

Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.

(6)

Mengacu pada keterandalan masing-masing grup. Menguji apakah penyampaian indikator sama jawabannya saat diterapkan ke kelompok yang berbeda-beda.

3. Reliabilitas Seimbang (equivqlence reliability)

Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional, peralatan pengumpulan data, dan / atau pengamat-pengamat. Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah.

Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini). Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing-masing-masing bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah.

Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.

D. Faktor – Faktor Yang Mempengaruhi Reliabilitas 1. Jumlah butir soal

Banyaknya soal pada suatu instrumen ikut mempengaruhi derajat reliabilitasnya. Semakin banyaknya soal-soal maka tes yang bersangkutan cenderung semakin menjadi reliabel.

2. Homogenitas Soal Tes

Soal yang memiliki homogenitas tinggi cenderung mengarah pada tingginya tingkat realibilitas. Dua buah tes yang sama jumlah butir-butirnya akan tetapi berbeda isinya, misalnya yang satu mengukur tentang pengetahuan kebahasaan dan yang satunya tentang kemampuan fisika akan menghasilkan tingkat reliabilitas yang berbeda. Tes fisikan cenderung menghasilkan tingkat reliabilitas

(7)

yang lebih tinggi daripada tes kebahasaan karena dari segi isi kemampuan menyelesaikan soal fisika lebih homogen daripada pengetahuan kebahasaan. 3. Waktu Yang diperlukan untuk menyelesaikan Tes

Semakin terbatasnya waktu dalam pengerjaan tes maka akan mendorong tes untuk memiliki reliabilitas yang tinggi.

4. Keseragaman Kondisi Pada Saat Tes Diberikan

Kondisi pelaksanaan tes yang semakin seraga akan memunculkan reliabilitas yang makin tinggi

5. Kecocokan Tingkat Kesukaran Terhadap Peserta Tes

Bahwa soal-soal dengan tingkat kesukaran sedang cenderung lebih reliabel dibandingkan dengan soal-soal yang sangat sukar atau sangat mudah

6. Heterogenitas Kelompok

Semakin heterogen suatu kelompok dalam pengerjaan suatu tes maka tes tersebut cenderung untuk menunjukkan tingkat reliabilitas yang tinggi

7. Motivasi Individu

Motivasi masing-masing individu dalam mengerjakan suatu instrumen akan mampu mempengaruhi realibilitas. Perbedaan motiviasi antar individu dalam kelompok akan menimbulkan kesalahan acak pada pengukurannya karena individu yang tidak memiliki motivasi tidak akan mengerjakan instrumen tersebut dengan sungguh-sungguh sehingga jawaban yang diberikan tidak akan mencerminkan kenyataan yang sebenarnya.

8. Variabilitas Skor

Instrumen yang menghasilkan rentangan skor yang lebh luas atau lebih tinggi variabilitasnya, akan memiliki tingkat reliabilitas yang lebih tinggi daripada menghasilkan rentangan skor yang lebih sempit , seperti bentuk pilihan ganda cenderung menghasilkan tingkat reliabilitas yang lebih tinggi daripada bentuk benar – salah

Faktor – Faktor Yang Mempengaruhi Reliabilitas Instrumen

Menurut Sukardi (2008:51-52) koefisien reliabilitas dapat dipengaruhi oleh waktu penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang juga mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai berikut::

1) Panjang tes, semakin panjang suatu tes evaluasi, semakin banyak jumlah item materi pembelajaran diukur.

2) Penyebaran skor, koefisien reliabelitas secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang di ukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliable.

(8)

3) Kesulitan tes, tes normative yang terlalu mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas rendah.

4) Objektifitas, yang dimaksud dengan objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil yang sama.

E. Cara – cara Mencari Besarnya Reliabilitas 1. Pendekatan Tes Tunggal

Analisis data untuk pendekatan tes tunggal bisa dibagi ke dalam 2 (dua) macam teknik, yaitu Teknik Belah Dua (Spilt-Half Technique) danTeknik Non Belah Dua (Non Spilt-Half Techique).

a. Teknik Belah Dua

Dalam menentukan reliabilitas suatu tes dengan menggunakan teknik belah dua, dilakukan dengan cara membelah tes tersebut menjadi dua bagian yang sama (relative sama), sehingga masing – masing peserta tes memiliki dua macam skor. Kedua macam skor itu adalah skor untuk bagian (belahan) pertama dan kelompok skor untuk belahan kedua dari tes tadi. Dengan demikian ada dua kelompok skor untuk sekelompok peserta tes.

Karena kedua belahan harus sama, maka salah satu syarat yang harus dipenuhi untuk teknik belah dua ini adalah banyaknya butir soal dalam tes tersebut harus genap, supaya kedua bagian itu banyaknya butir soal sama.

Ada dua cara untuk membelah banyaknya butir soal tes, yaitu :

1. Membelah atas item – item (butir – butir) genap dan item – item (butir – butir) ganjil yang selanjutnya disebut belahan ganjil genap.

2. Membelah atas item – item (butir – butir) awal dan item – item (butir – butir) akhir yaitu separoh junlah pada nomor-nomor awal dan separo pada nomor – nomor akhir yang selanjutnya disebut belahan awal-akhir.

Menurut Saifuddin Azwar, realibilitas ini diukur dengan menentukan hubungan antara skor dua paruh yang ekuivalen suatu tes, yang disajikan kepada seluruh kelompok pada suatu saat. Karena reliabilitas belah dua mewakili reliabilitas hanya separuh tes yang sebenarnya, rumus Spearman-Brown dapat digunakan untuk mengoreksi koefisien yang didapat.

Seperti halnya koefisien validitas yang telah dibahas pada bab terdahulu, untuk koefisien reliabilitas yang menyatakan tingkat keterandalan tes,

(9)

dinyatakan dengan r11 _{. Tolak ukur menginterprestasikan tingkat reliabilitas} tes dapat digunakan tolak ukur yang dibuat oleh Guilford (1956) sebagai berikut :

0,80<r₁₁≤ 1,00 _{reliabilitas sangat tinggi}

0,60<r₁₁≤ 0,80 _{reliabilitas tinggi}

0,40<r₁₁≤ 0,60 _{reliabilitas sedang}

0,20<r₁₁≤ 0,40 _{reliabilitas rendah} r₁₁≤ 0,20 _{reliabilitas sangat rendah}

Untuk menentukan koefisien reliabilitas suatu tes dengan teknik belah dua, ada tiga macam teknik perhitungan, yaitu formula Spearman – Brown, Formula Flanagan, dan formula Rulon.

Formula Spearman – Brown

Prinsip penggunaan formula Spearman – Brown adalah menghitung koefisien korelasi di antara kedua belahan sebagai koefisien reliabilitas bagian (setengah) dari tes tersebut, yang dinotasikan dengan (r ½ ½) . Untuk menghitung (r ½ ½) bisa digunakan rumus product moment dengan angka kasar dari karl Pearson, yaitu :

Untuk menghitung koefisien reliabilitas suatu tes keseluruhan, Spearman – Brown mengemukakan rumus :

Dengan r11: reliabilitas Instrumen

r ½ ½ : Indeks Korelasi antara dua belahan Instrumen r ½ ½ X Y

∑

¿ ¿ ¿ ¿ X

∑

¿2 ¿

∑

Y¿2 N

∑

Y2−¿ X2−¿−¿ N

_∑

¿ ¿

∑

¿.¿ XY −¿ N

∑

¿ ¿ ¿

(10)

Syarat yang harus dipenuhi dalam menggunakan rumus di atas adalah butir soal pada kedua belahan harus setara, yaitu banyaknya butir soal harus sama, memiliki rata – rata nilai sama, mempunyai variabilitas yang sama, dan bentuk distribusi frekuensi yang sama pula. Untuk mendekati kondisi tersebut soal harus disusun sedemikian rupa sehingga butir soal pada belahan pertama dengan pasangannya pada belahan kedua memuat konsep yang sama, dengan indikator yang sama pula. Sehingga setiap butir berpasangan kesetaraannya pada kedua belahan itu.

Contoh perhitungan reliabilitas dengan Formula Spearman – Brown :

No. Subyek Skor Item

1 2 3 4 5 6 7 8 9 10 1 A 3 4 3 4 4 3 3 3 3 3 2 B 4 3 3 4 3 3 3 3 3 3 3 C 2 2 1 3 2 2 3 1 2 3 4 D 3 4 4 3 3 3 4 3 3 4 5 E 3 4 3 3 3 4 3 4 4 3 6 F 3 2 4 4 3 4 4 3 4 4 7 G 2 3 3 4 4 4 3 4 3 2 8 H 1 2 2 1 2 2 1 3 4 3 9 I 4 2 3 3 4 2 1 1 4 4 10 J 3 3 3 4 4 4 4 4 3 3 11 K 4 4 3 4 4 3 4 4 4 2 12 L 3 2 1 2 3 1 1 2 3 3 13 M 4 3 4 3 3 4 3 3 3 4 14 N 2 3 3 4 4 4 3 2 3 4 15 O 3 4 3 2 3 2 4 3 3 3

Tabel persiapan perhitungan reliabilitas dengan belah dua ganjil – genap adalah sebagai berikut Subyek Skor Item Ganjil (X) Skor Item Genap (Y) X . Y A 16 17 272 B 16 16 256 C 10 11 110 D 17 17 289 E 16 18 288 F 18 17 306 G 15 17 255 H 10 11 110 I 16 12 192 J 17 18 306 K 19 17 323 L 11 10 110 M 17 17 289 N 15 17 255

(11)

O 16 14 224

∑

X =229

∑

Y =229

∑

X . Y =3585

∑

X2=3603

∑

Y2=3609 X Y

∑

¿ ¿ ¿ ¿ X

∑

¿2 ¿

∑

Y¿2 N

∑

Y2 −¿ X2−¿−¿ N

∑

¿ ¿

∑

¿.¿ XY −¿ N

_∑

¿ r=¿ ¿ 15 x 3585−229 x 229

√

(15 x 3603−52441)(15 x 3609−52441) ¿ 1334

√

1604 :1694 ¿ 1334 1648,386=0,809

Setelah dihitung dengan rumus korelasi product moment dengan angka kasar diperoleh bahwa rxy = 0,809. Harga tersebut baru menunjukkan reliabilitas separo tes. Sehingga r ½ ½ = 0,809. Untuk mencari reliabilitas seluruh tes digunakan rumus formulasi Spearman – Brown sebagai berikut :

(12)

r₁₁= 2 r₁ 2 1 2 1+r1 2 1 2 =2 x 0,809 1+0,809= 1,618 1,809=0,895

Jika dihitung dengan teknik belah dua metode awal – akhir, akan diperoleh dua kelompok data seperti tabel di bawah ini :

Subyek Skor Bagian Awal (X) Skor Bagian Akhir (Y) X . Y A 18 15 270 B 17 15 255 C 10 11 110 D 17 17 289 E 16 18 288 F 16 19 304 G 16 16 256 H 8 13 104 I 16 12 192 J 17 18 306 K 19 17 323 L 11 10 110 M 17 17 289 N 16 16 256 O 15 15 225

∑

X =229

∑

Y =229

∑

X . Y =3577

∑

X2=3631

∑

Y2=3597

(13)

X Y

∑

¿ ¿ ¿ ¿ X

∑

¿2 ¿

∑

Y¿2 N

_∑

Y2 −¿ X2 −¿−¿ N

∑

¿ ¿

∑

¿.¿ XY −¿ N

_∑

¿ r=¿ ¿ 15 x 3577−229 x 229

√

(15 x 3631−52441)(15 x 3597−52441) ¿ 1214

√

2024 :1514 ¿ 1214 1750,48=0,6935

Setelah dihitung dengan rumus korelasi product moment dengan angka kasar diperoleh bahwa rxy = 0,6935. Harga tersebut baru menunjukkan reliabilitas separo tes. Sehingga r ½ ½ = 0,6935. Untuk mencari reliabilitas seluruh tes digunakan rumus formulasi Spearman – Brown sebagai berikut :

r11= 2 r1 2 1 2 1+r1 2 1 2 =2 x 0,6935 1+0,6935= 1,387 1,6935=0,819

Dari kedua contoh perhitungan diatas ternyata hasilnya ada perbedaan, tetapi jika dirujuk pada tolak ukur reliabilitas, keduanya menunjukkan tingkat reliabilitas yang sama, yaitu tergolong tinggi. Jadi reliabilitas tes soal tersebut adalah tinggi atau baik.

(14)

Menghitung reliabilitas tes dengan menggunakan rumus formula Flanagan tidak didasarkan atas nilai korelasi antara kedua belahan tes, melainkan didasarkan atas varians masing – masing belahan dan varians totalnya. Untuk menghitung koefisien reliabilitas tes, Flanagan mengemukakan formula :

r11=2

(

1−

S₁2+S₂2 S_t2

)

Keterangan :

r₁₁=¿ _{koefisien reliabilitas seluruh tes}

S12=¿ varians belahan pertama

S2 2

=¿ _{varians belahan kedua}

St2=¿ varians skor total

Untuk menghitung varians digunakan rumus sebagai berikut :

S2₌

∑

X2−

(

∑

X

)

2

N N

Sebagai contoh dalam menggunakan formulasi Flanagan ini akan dihitung koefisien reliabilitas untuk tes dengan data seperti di atas dengan menggunakan metode ganjil – genap.

Subyek Skor Item Ganjil (X) Skor Item Genap (Y) Skor Total (Xt) A 16 17 33 B 16 16 32 C 10 11 21 D 17 17 34 E 16 18 34 F 18 17 35 G 15 17 32

(15)

H 10 11 21 I 16 12 28 J 17 18 35 K 19 17 36 L 11 10 21 M 17 17 34 N 15 17 32 O 16 14 30

∑

X =229

∑

Y =229

∑

X_t=458

∑

X2=3603

∑

Y2=3609

∑

Xt2=14382 Sx2=7,1287 SY2=7,5287 St2=26,5153

Setelah diperoleh nilai – nilai varians dari data belahan 1, belahan 2, dan varians total kemudian dimasukkan ke dalam rumus.

r11=2

(

1− S₁2+S₂2 S_t2

)

r₁₁=2

(

1−7,1287+7,5287 26,5153

)

r₁₁=2

(

1−146,574 26,5153

)

=0,9

Jika dirujuk pada tolak ukur reliabilitas tergolong tinggi. Formula Rulon

Formula Rulon didasarkan atas konsep perbedaan antara skor subyek pada belahan pertama dan kedua, yang dapat dipandang sebagai kekeliruan (error) dari proses penilaian. Dengan demikian varians yang diperhitungkan adalah varians perbedaan skor antara kedua belahan itu, yaitu varians kekeliruan. Rumus Rulon sebagai berikut :

r₁₁=1−Sd 2

(16)

Keterangan :

Sd

2

=¿ _{Varians selisih skor subyek pada kedua belahan}

St

2

=¿ _{Varians skor total}

Untuk penggunaan rumus tersebut, kita menggunakan kembali data hasil tes di atas dengan metode awal – akhir. Data yang harus dipersiapkan disusun dalam bentuk tabel seperti dibawah ini.

Subyek Skor Bagian Awal (X) Skor Bagian Akhir (Y) d=|X−Y| X_t A 18 15 3 33 B 17 15 2 32 C 10 11 -1 21 D 17 17 0 34 E 16 18 -2 34 F 16 19 -3 35 G 16 16 0 32 H 8 13 -5 21 I 16 12 4 28 J 17 18 -1 35 K 19 17 2 36 L 11 10 1 21 M 17 17 0 34 N 16 16 0 32 O 15 15 0 30 S_d=2,22 S_t=5,15 Sd2=4,93 St2=26,51

Selanjutnya dimasukkan ke dalam rumus :

r₁₁=1−Sd 2

S_t2

r₁₁=1− 4,93

26,51=0,81

Jika dirujuk pada tolak ukur reliabilitas, tergolong sangat tinggi. b. Teknik Non Belah Dua

Pakar yang mengemukakan teknik non belah dua adalah Kuder dan Richardson. Mereka berpendapat bahwa teknik belah dua kurang baik dalam mencari koefisien reliabilitas, sebab bisa dilakukan dengan cara yang berbeda sehingga menghasilkan yang berbeda pula. Disamping itu dalam

(17)

pelaksanaannya, teknik belah dua sulit sekali memperoleh dua belahan yang setara satu sama lain. Untuk menghindari hal tersebut, Kuder dan Richardson mengemukkan cara untuk menghitung koefisien reliabilitas tanpa membelah tes menjadi dua bagian, tetapi membagi tes menurut banyak nya butir soal yang disajikan, yaitu dengan menganalisis masing – masing butir soal tersebut. Rumus yang digunakan untuk menghitung koefisien reliabilitas tes tanpa membelah tes menjadi bagian adalah rumus KR-20 dan KR-21.

Rumus KR-20 r11=

[

n n−1

]

[

S_t2−

∑

p_iq_i st2

]

Keterangan :

n=¿ _{banyaknya butir soal}

p_i=¿ _{proporsi banyak subyek yang menjawab benar pada butir soal ke - i}

q_i=¿ _{proporsi banyak subyek yang menjawab salah pada butir soal ke - i}

St

2

=¿ _{vaarians skor total}

r₁₁=¿ _{koefisien reliabilitas}

Sebagai contoh kita gunakan hasil tes matematika yang terdiri dari 15 butir soal yang diikuti 10 subyek siswa seperti yang digunakan sebelumnya. Tabel di bawah ini adalah tabel persiapan untuk menghitung koefisien reliabilitas dengan KR-20.

Tabel persiapan penggunaan rumus KR-20.

No Nama Nomor soal Total

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 Aan N. Efendi 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 10 2 Arif Kristanto 0 1 1 1 1 0 0 0 0 0 0 1 0 1 0 6 3 Bayu Inggar 0 1 1 0 1 1 0 0 1 1 1 1 1 0 0 9 4 Aulia 0 1 1 1 1 1 0 0 1 1 1 0 0 0 1 9 5 Novita 1 1 1 0 1 0 0 0 0 1 0 0 0 0 1 6 6 Septian Hadi 0 1 1 1 1 0 0 0 1 1 0 1 0 1 0 8 7 Riska Maulana 1 1 0 1 1 1 1 0 1 1 1 1 1 1 1 13 8 Adi Susianto 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 14 9 Meydin Kartika 1 1 0 1 1 1 0 0 1 1 0 1 0 1 1 10 10 Riswanda 1 1 0 0 1 1 1 0 1 1 1 0 1 0 1 10 n_p 6 10 6 6 10 7 3 0 8 8 6 7 5 6 7

_∑

_X t=¿ 95 n_q 4 0 4 4 0 3 7 10 2 2 4 3 5 4 3

(18)

∑

Xt 2 =¿ 963

∑

p_iq_i=¿ 2,61 p_i .6 1 .6 .6 1 .7 .3 0 .8 .8 .6 .7 .5 .6 .7 q_i .4 0 .4 .4 0 .3 .7 1 .2 .2 .4 .3 .5 .4 .3 p_iq_i .24 0 .24 .24 0 .21 .21 0 .16 .16 .24 .21 .25 .24 .21

Keterangan : Untuk menyingkat tulisan 0,6 ditulis .6, 0,24 ditulis .24 dan seterusnya.

Selanjutnya hasil perhitungan diatas dimasuk kan ke dalam rum,us KR-20 sebagai berikut: r11=

[

n n−1

]

[

S_t2−

∑

p_iq_i st 2

]

r₁₁=

[

15 15−1

][

6,05−2,61 6,05

]

r₁₁=1,07 x 0,56=0,5992

Jika dirujuk pada tolak ukur reliabilitas, tergolong sedang. Rumus KR-21 r₁₁=

(

n n−1

)

(

1− X_t

(

n− X_t

)

n St2

)

Keterangan :

X_t=¿ _{rata – rata skor total}

St2=¿ varians skor total

Keuntungan yang dapat diperoleh dari penggunaan rumus KR-21 adalah kemudahan dalam membuat tabel persiapan karena data nilai yang dibutuhkan hanyalah rata – rata dan varians skor total. Dengan menggunakan kalkulator akan diperoleh :

X_t=_{9,5 dan S}_t2=6,05 Dimasukkan ke dalam rumus KR-21 di atas

(19)

r₁₁=

(

n n−1

)

(

1− X_t

(

n− X_t

)

n St2

)

r11=

(

15 15−1

)

(

1− 9,5 (15−9,5 ) 15(6,05)

)

r₁₁=1,07 x 0,43=0,4601

Yang termasuk ke dalam kategori reliabilitas sedang.

F. Mencari Koefisien Reliabilitas Tes bentuk Uraian

Untuk mencari koefisien reliabilitas tes bentuk uraian tidak bisa dilakukan seperti di atas karena penilaian tidak hanya diberikan pada hasil akhir, melainkan dilakukan pula terhadap proses pengerjaannya. Oleh karena itu skor yang diperoleh karena setiap soal tidak dikotomi (dua kategori benar atau salah). Skor yang diperoleh untuk hasil pekerjaan siswa dinilai setiap soal dan setiap langkah pengerjaan. Jadi skornya bisa berlainan tergantung dari setiap bobot soal. Rumus yang digunakan untuk mencari koefisien reliabilitas tes bentuk uraian dikenal dengan rumus alpha seperti debawah ini.

Rumus Alpha r11=

(

n n−1

)

(

1−

∑

S_i2 S_t2

)

Keterangan :

∑

Si

2

=¿ _{jumlah varians skor setiap butir soal}

St

2

=¿ _{varians skor total}

Subye k

Nomor Soal Skor

Total X (¿¿t) ¿ 1 2 3 4 5 6 7 8 9 10 A 10 10 9 10 4 10 10 6 10 4 83

(20)

B 10 10 8 6 7 8 10 10 8 6 83 C 10 8 10 10 6 10 5 6 4 9 78 D 10 8 10 10 4 10 8 10 6 10 86 E 10 10 10 8 10 7 8 7 9 8 87 F 10 8 10 10 4 8 10 8 6 8 82 G 10 10 6 10 4 7 10 10 10 10 87 H 10 7 10 10 6 10 7 7 8 6 81 I 10 10 10 10 10 10 10 9 10 9 98 J 10 10 7 10 4 5 8 10 9 6 79 X_i 100 91 90 94 59 85 86 83 80 76 844 Xi2 1000 841 830 900 401 751 766 715 678 614 71526 S_i 30 1,14 1,41 1,282 2,3 1,69 1,62 1,61 1,95 1,91 5,41 Si2 0 1,29 2 1,64 5,29 2,85 2,64 2,61 3,8 3,64 29,24

Dari data pada tabel di atas diperoleh

n=10

∑

Si 2 =0+1,29+2+1,64+5,29+2,85+2,64+2,61+3,8+3,6 4 ¿25,76 St 2 =29,24

Dimasukkan ke dalam rumus alpha

r11=

(

n n−1

)

(

1−

∑

S_i2 St 2

)

r₁₁=

(

10 10−1

)(

1− 25,76 29,24

)

r₁₁=(1,11) (0,12)=0,1 3

Koefisien reliabilitas tersebut menyatakan bahwa soal yang dibuat reliabilitasnya sangat rendah.

G. ANCAMAN TERHADAP RELIABILITAS

Semua jenis instrumen tes atau nontes tidak terlepas kesalahan. Hal ini berlaku untuk instrumen tes dalam ilmu-ilmu eksakta dan dalam ilmu-ilmu psikologi dan pendidikan. Misalnya, dalam mengukur panjang dengan suatu penggaris, mungkin ada kesalahan sistematis berhubungan dengan di mana titik nol dicetak pada penggaris dan kesalahan acak berhubungan dengan kemampuan mata dalam membaca tanda-tanda dan memperhitungkan tanda-tanda tersebut. Juga

(21)

memungkinkan bahwa panjang obyek dapat berubah dari waktu ke waktu dan pada lingkungan yang berbeda (misalnya perubahan temperatur). Salah satu tujuan penilaian adalah untuk mengurangi kesalahan tersebut hingga ke tingkatan yang sesuai dengan tujuan tes. Tes yang beresiko tinggi (high-stakes tes), seperti ujian untuk mendapatkan SIM, harus mempunyai kesalahan yang sangat kecil. Tes di kelas dapat mentolerir kesalahan yang lebih tinggi secara wajar kesalahan tersebut mudah dikoreksi sepanjang proses pengujian. Reliabilitas hanya mengacu pada derajat tingkat kesalahan yang tidak sistematis, yang disebut kesalahan acak.

Ada tiga sumber kesalahan utama, yaitu: faktor dalam tes itu sendiri, faktor siswa yang dites, dan faktor penskoran. Umumnya tes berisi suatu koleksi butir yang mengukur keterampilan tertentu. Adakalanya guru secara khas menggeneralisasikan masing-masing butir tes ke semua materi yang diukur oleh tes itu. Sebagai contoh, jika seorang siswa dapat memecahkan beberapa permasalahan seperti 7x8, maka mungkin akan disamaratakan kemampuannya dalam mengalikan angka tunggal bilangan bulat. Juga mungkin akan menyamaratakan suatu kumpulan materi kepada suatu domein yang lebih luas. Jika siswa dapat menyelesaikan penjumlahan, pengurangan, perkalian, dan pembagian, maka mungkin akan disimpulkan bahwa siswa tersebut mampu menyelesaikan operasi pecahan.

Kesalahan dapat pula disebabkan oleh pemilihan butir untuk mengukur domein dan keterampilan tertentu. Materi yang tercakup dalam tes berbeda menurut format masing-masing tes, kesalahan pensampelan, pembatasan butir tes, dan karena menyamaratakan ke data yang tidak diamati, yakni, kemampuan siswa terhadap keseluruhan butir yang mungkin terdapat dalam tes. Ketika keterampilan dan domain yang diukur menjadi lebih rumit, mungkin akan terjadi lebih banyak kesalahan yang disebabkan oleh pensampelan materi. Sumber lain kesalahan tes adalah ketidakefektifan pengecoh dalam tes pilihan ganda, seperti jawaban benar yang lebih banyak, dan tingkat kesukaran butir tes.

Sebagai manusia, para siswa tidaklah selalu konsisten dan juga tidak terlepas dari kesalahan dalam menyelesaikan tes. Apakah tes itu dimaksudkan untuk mengukur kemampuan khusus atau kemampuan siswa secara optimal, perubahan dalam berbagai hal seperti sikap siswa, kesehatan, dan rasa kantuk dapat mempengaruhi kualitas usaha dan konsistensi siswa dalam menyelesaikan tes. Sebagai contoh, peserta tes mungkin membuat kesalahan karena teledor, salah

(22)

menafsirkan petunjuk tes, melupakan instruksi tes, melupakan beberapa butir tes, atau salah baca butir tes.

Kesalahan penskoran merupakan sumber sepertiga dari kesalahan potensial. Pada bentuk tes objektif, penskoran bersifat mekanik, dan kesalahan penskoran harus diperkecil. Pada tes uraian, sumber kesalahan meliputi ketidakjelasan rubrik penskoran, ketidakjelasan apa yang diharapkan dari siswa, dan beberapa kesalahan yang bersumber dari penilai. Para penilai tidaklah selalu konsisten, kadang-kadang merubah ukuran-ukuran mereka selagi menskor, dan terkadang terpengaruh oleh hal-hal yang tidak berhubungan dengan skor tes seperti efek hal-halo, latar belakang siswa, perbedaan persepsi, kebaikan hati atau kepelikan, dan kesalahan dalam penskalaan.