Faktor-Faktor yang Mempengaruhi Reliabilitas Tes

(1)

Faktor-Faktor yang Mempengaruhi Reliabilitas Tes

Adhi Setiyawan

Fakultas Ilmu Tarbiyah dan Keguruan UIN Sunan Kalijaga Yogyakarta

Email: adhi.setiyawan@mail.uin-suka.ac.id

Abstrak

Sebuah tes mengandung skor-skor untuk mengukur kemampuan siswa. Pengukuran merupakan kegiatan untuk menghasilkan skor-skor yang mampu mengukur kemampuan siswa dan menggambarkan karakteristik masing-masing siswa. Reliabilitas dalam tes sangat penting menentukan kualitas tes. Penelitian ini bertujuan menjelaskan faktor-faktor yang mempengaruhi pada reliabilitas tes. Metode yang digunakan dalam penelitian ini adalah studi pustaka. Hasil dari penelitian ini menunjukkan faktor-faktor yang mempengaruhi reliabilitas tes adalah jumlah butir tes (panjang tes), variabilitas kelompok, objektivitas penskoran, metode untuk mengestimasi reliabilitas, level kelompok dan tingkat kesulitan tes, dan homogenitas tes.

Kata Kunci: Faktor, Reliabilitas Tes

Abstract

In achievement test, obtained scores are expected to be able to measure the actual ability of the students. Measurement is a process to obtain a score so that measured attributes of students really describe the characteristics of the person. Reliabillity of the test is very important in determining the quality of a good test. This research aims to describe the factors that affect reliability of the test. The method used in this research is library research. Results of research shows the factors that affect the reliability of a test are the number of test items (length test), variability of the group, scoring objectivity, method or operations used for estimating reliability, group level and difficulty level of the test, and homogeneity tests. Keywords: Factors, Test Reliability

A. Pendahuluan

Penilaian hasil belajar dilakukan untuk mengukur tingkat pencapaian kompetensi peserta didik, bahan penyusunan laporan kemajuan hasil belajar, dan memperbaiki proses pembelajaran oleh guru. Penilaian

(2)

dilakukan secara konsisten, sistematik, dan terprogram dengan menggunakan tes dan nontes dalam bentuk tertulis atau lisan, pengamatan kinerja, pengukuran sikap, penilaian hasil karya berupa tugas, proyek dan/ atau produk, portofolio, dan penilaian diri. Penilaian hasil pembelajaran menggunakan Standar Penilaian Pendidikan dan Panduan Penilaian Kelompok Mata Pelajaran.1

Dalam pelaksanaannya di kelas ternyata tes hasil belajar sering memperoleh pengukuran yang tidak ajeg atau tidak konsisten. Ketika guru melakukan pengukuran lebih dari satu kali, pasti ditemukan perbedaan. Misalnya pada kasus seseorang yang mengambil tes intelegensi memperoleh skor 100 pada tes pertama dan memperoleh skor 115 pada tes kedua. Begitu juga pada tes hasil belajar, seorang siswa mungkin memperoleh skor 5,5 pada ujian akhir sekolah sehingga ia dinyatakan harus menempuh ujian ulang. Pada ujian ulang ternyata ia memperoleh skor 6,5 dan dinyatakan lulus. Berdasarkan beberapa kasus tersebut, terlihat bahwa hasil pengukuran dalam ilmu sosial (pendidikan) menunjukkan sesuatu yang tidak ajeg. Metode untuk mempelajari, mengidentifikasi, dan mengestimasi keajegan skor tes merupakan fokus dari pengkajian reliabilitas.

Dalam tes hasil belajar, skor yang diperoleh diharapkan mampu mengukur kemampuan yang sebenarnya. Pengukuran adalah proses memperoleh skor sehingga atribut seseorang yang diukur benar-benar menggambarkan ciri dari orang tersebut. Reliabillitas tes merupakan hal yang sangat penting untuk menentukan kualitas tes. Apabila siswa memperoleh skor yang tidak ajeg pada beberapa kali ujian, padahal tes yang diberikan sama, maka keputusan akhir mengenai lulus atau tidaknya juga akan berbeda. Maka dari itu, dalam menyusun tes hasil belajar perlu dilihat seberapa besar nilai koefisien reliabilitas dari tes yang akan dipakai. Apabila hasil skor tes pertama sama dengan hasil skor tes kedua, maka tes dikatakan memiliki reliabilitas yang tinggi atau terdapat korelasi yang tinggi antara hasil tes pertama dengan hasil tes kedua. Apabila antara

1_{Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 41 Tahun 2007} Tentang Standar Proses Bab IV Penilaian Hasil Pembelajaran, Hal 18

(3)

hasil tes pertama dan kedua tidak terdapat hubungan atau hubungannya rendah, maka tes itu dikatakan tidak reliabel. Berangkat dari permasalahan tesebut, melalui penelitian ini penulis ingin menelaah tentang faktor apa sajakah yang dapat mempengaruhi reliabilitas. Berdasarkan latar belakang masalah tersebut, maka pokok permasalahan penelitian ini adalah faktor apa saja yang mempengaruhi reliabilitas suatu tes.

B. Pengertian Tes

Tes adalah sehimpunan pertanyaan yang harus dijawab, atau pertanyaan-pertanyaan yang harus dipilih, ditanggapi, atau tugas-tugas yang harus dilakukan oleh orang yang dites (testee) dengan tujuan untuk mengukur suatu aspek (perilaku/atribut) tertentu dari orang yang dites tersebut.2_{Melalui tes, guru dapat memperoleh informasi tentang}

berhasil tidaknya peserta didik dalam menguasai tujuan-tujuan (standar kompetensi, kompetensi dasar, dan indikator) yang telah ditetapkan dalam kurikulum. Guru dapat dengan mudah mendeteksi peserta didik yang sudah menguasai dan yang belum menguasai melalui tes. Begitu pula guru dapat mendeteksi berhasil tidaknya pembelajaran yang telah dilakukan melalui tes. Hasil tes dapat digunakan untuk memberikan laporan kepada pihak tertentu tentang perkembangan kemampuan belajar peserta didik maupun tentang keberhasilan guru mengajar.

Tes merupakan salah satu cara untuk menaksir besarnya tingkat kemampuan manusia secara tidak langsung, yaitu melalui respons seseorang terhadap sejumlah stimulus atau pertanyaan.3_{Tes biasanya digunakan}

untuk mengukur aspek-aspek perilaku manusia, seperti aspek pengetahuan (kognitif), sikap (afektif), maupun keterampilan (psikomotor). Hal yang hendak diukur adalah tingkat penguasaan peserta didik terhadap bahan pelajaran yang telah diajarkan.

2_{Sumarna Surapranata. Panduan Penulisan Tes Tertulis, (Bandung: Remaja Rosdakarya,} 2005), hal 19.

3_{Djemari Mardapi. Teknik Penyusunan Instrumen Tes dan Nontes. (Mitra Cendekia:} Yogyakarta, 2008), hal 67

(4)

Tujuan tes adalah untuk mengetahui tingkat kemampuan peserta didik, mengukur pertumbuhan dan perkembangan peserta didik, mendiagnosis kesulitan belajar peserta didik, mengetahui hasil pengajaran, mengetahui hasil belajar, dan mendorong pendidik mengajar lebih baik dan peserta didik belajar lebih baik.4_{Tujuan-tujuan tes ini menjadi dasar}

pengembangan tes. Tes yang ditujukan untuk suatu tujuan tertentu harus mengarah pada tujuan tersebut.

Sesuai dengan tujuan-tujuan tadi, terdapat beberapa fungsi utama dari tes, yaitu5_{, 1) Fungsi penempatan adalah penggunaan hasil tes untuk}

mengklasifikasikan individu ke dalam bidang atau jurusan yang sesuai dengan kemampuan yang telah diperlihatkan pada hasil belajar yang telah lalu. 2) Fungsi formatif adalah penggunaan tes guna melihat sejauh mana kemajuan belajar yang telah dicapai oleh siswa dalam program pembelajaran. Dalam hal ini tes merupakan umpan balik (feed back) kemajuan belajar dan karena itu biasanya tes diselenggarakan di tengah program pembelajaran yang sedang berjalan. 3) Fungsi diagnostik dilakukan oleh tes apabila hasil tes yang bersangkutan digunakan untuk mendiagnosis kesukaran-kesukaran yang bersangkutan dalam belajar, medeteksi kelemahan-kelemahan siswa yang dapat diperbaiki segera, dan semacamnya. 4) Fungsi sumatif adalah penggunaan tes untuk memperoleh informasi mengenai penguasaan pelajaran yang telah drencanakan sebelumnya dalam suatu program pelajaran. Tes sumatif merupakan pengukuran akhir dalam suatu program pelajaran dan hasilnya dipakai untuk menentukanapakah siswa dapat dinyatakan lulus dalam program pendidikan tersebut, atau apakah siswa dinyatakan dapat melanjutkan ke jenjang program yang lebih tinggi.

Setidak-tidaknya ada empat ciri yang harus dimiliki oleh tes hasil belajar yang baik, yaitu (1) valid (2) reliabel (3) obyektif (4) praktis.6_{Jika tes}

memiliki keempat karakteristik tersebut, maka dapat dipastikan tes hasil belajar itu adalah tes hasil belajar yang baik.

4_{Ibid., hal 68.}

5_{Saifuddin Azwar. Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi Belajar.} Pustaka Pelajar: Yogyakarta, 2011), hal 11

(5)

Ciri pertama adalah valid atau memiliki validitas. Sebuah tes dikatakan telah memiliki validitas apabila tes tersebut dengan secara tepat, secara benar, secara sahih atau secara absah telah dapat mengungkap atau mengukur apa yang seharusnya diungkap atau diukur melalui tes itu. Ciri kedua adalah reliabel atau memiliki reliabilitas. Suatu tes dikatakan telah memiliki reliabilitas apabila skor-skor yang diperoleh para peserta penempuh tes untuk pekerjaan tesnya adalah stabil, kapan saja, dimana saja, dan oleh siapa saja tes itu diuji, diperiksa, dan dinilai. Tingkat reliabilitas ini dapat dilihat melalui seberapa besar koefisien reliabilitas yang diperoleh tes itu. Ciri ketiga adalah obyektif. Suatu tes dikatakan bersifat obyektif jika tes tersebut disusun dan dilaksanakan menurut apa adanya. Mulai dari penyusunannya, (seperti isi atau materi tesnya), sampai pada proses pemberian skor dan penentuan nilainya. Ciri keempat adalah praktis. Suatu tes bersifat praktis jika tes hasil belajar itu dapat dilaksanakan dengan mudah, karena tes itu: (a) sederhana, dalam arti tidak memerlukan peralatan yang banyak atau sulit pengadaannya; (b) lengkap, dalam arti tes tersebut telah dilengkapi dengan petunjuk pengerjaannya, kunci jawaban, dan pedoman penyekorannya.

C. Faktor-Faktor yang Mempengaruhi Reliabilitas Tes Hasil Belajar

Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi jika tes tersebut memberikan data hasil yang ajeg (tetap) walaupun diberikan pada waktu yang berbeda kepada responden yang sama. Reliabilitas merupakan salah satu kriteria yang harus dipenuhi oleh instrumen pengukuran sebelum digunakan untuk mengumpulkan data. Reliabilitas mengacu pada ketetapan atau kekonsistenan alat ukur, meskipun digunakan berulang kali pada subjek yang sama. Hal ini bukanlah berarti bahwa untuk mendapatkan alat ukur yang reliabel harus selalu melalui pengulangan penggunaan alat ukur tersebut pada subjek yang sama,

(6)

Tujuan utama mengestimasi reliabilitas adalah untuk menentukan seberapa besar variabilitas yang terjadi akibat adanya kesalahan pengukuran dan seberapa besar variabilitas skor tes sebenarnya. Banyak prosedur yang dapat ditempuh untuk mengetahui indek koefisien reliabilitas suatu instrumen pengukuran. Ada banyak faktor yang mempengaruhi reliabilitas suatu instrumen.

Menurut teori klasik, reliabilitas dihubungkan dengan pengertian adanya ketepatan suatu tes dalam pengukuran. Reliabilitas adalah kestabilan skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang sama pada situasi yang berbeda atau dari satu pengukuran ke pengukuran lainnya. jadi reliabilitas dapat dinyatakan sebagai tingkat keajegan atau kemantapan hasil dari hasil dua pengukuran terhadap hal yang sama. Hasil pengukuran itu diharapkan akan sama apabila pengukuran itu diulangi.7

Tinggi rendahnya koefisien reliabiitas dipengaruhi oleh beberapa faktor. Beberapa pakar menyebutkan faktor-faktor yang mempengaruhi reliabilitas tes secara berbeda. Menurut Robert M Thorndike dalam bukunya berjudul Measurement and Evaluation in Psychology and Education Seventh Edition, faktor yang mempengaruhi reliabilitas adalah: ..” Variability of the group on the trait the test measures; Level of the group on

the trait the test measures; Length of the test, Operations used for estimating the reliability.” 8_{1) Variabilitas kelompok yang diberikan tes (Variability of the}

group on the trait the test measures); 2) Level kelompok yang diberikan tes

(Level of the group on the trait the test measures); Panjang tes (Length of the

test); Teknik atau rumus yang digunakan untuk menghitung reliabilitas

(Operations used for estimating the reliability).

Sedangkan menurut Gilbert Sax, beberapa kondisi yang mempengaruhi koefisien reliabilitas, 9_{yaitu: …” Objectivity in scoring: Scorer Reliability; The} 7 Sumarna Surapranata, (Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes. Bandung: Remaja Rosdakarya, 2006), hal 89.

8_{Robert M Thorndike, Measurement and Evaluation in Psychology and Education Seventh}

Edition (New Jersey: Prentice Hall, Inc., 2005), hal 125-130.

9_{Gilbert Sax, Principles of Educational and Psychological Measurement and Evaluation (2}nd ed) (San Fransisco: Phoenix Publishing Services, Inc., 1980), hal 267-272.

(7)

variability of the group tested; The number of items on the testThe difficulty

level of the test). Objektifitas penskoran: Reliabilitas pemberi skor (Objectivity in scoring: Scorer Reliability); Variabilitas kelompok yang dites (The variability

of the group tested); Jumlah item pada tes (The number of items on the test); dan Tingkat kesulitan tes (The difficulty level of the test).

Menurut Ebel10_{, koefisien reliabilitas akan bertambah besar untuk}

skor: …from a longer test than from a shorter test, from a test composed of more

homogeneous items than from a more heterogeneous test, from a test composed of more discriminating item than from a test composed of less discriminating items, from a test whose items are of middle difficulty than from a test composed mainly of quite difficult or quite easy items, from a group having a wide range of ability than from a group more homogeneous in ability, from a speeded test than from one all examinees can complete in the time available.

a. dari tes yang lebih panjang daripada tes yang lebih pendek (from a

longer test than from a shorter test)

b. dari tes yang tersusun dari item yang lebih homogen daripada tes yang lebih heterogen (from a test composed of more homogeneous items than from a more heterogeneous test)

c. dari tes yang memiliki daya pembeda lebih tinggi daripada yang mempunyai daya pembeda lebih rendah (from a test composed of more discriminating item than from a test composed of less discriminating items)

d. dari tes yang tingkat kesulitannya sedang daripada tes yang terlalu sulit atau terlalu mudah (from a test whose items are of middle difficulty than from a test composed mainly of quite difficult or quite easy items) e. dari kelompok yang mempunyai jarak kemampuan yang lebar daripada

yang berkemampuan homogen (from a group having a wide range of ability than from a group more homogeneous in ability)

10_{Robert L. Ebel, Essentials of Educational Measurement (3}rd_{ed), (New Jersey: Prentice}

(8)

f. tes yang membutuhkan waktu terbatas daripada waktu yang lebih longgar (from a speeded test than from one all examinees can complete in the time available)

Menurut Crocker dan Algina (1986), dikutip dari Sumarna, menyebutkan bahwa faktor yang mempengaruhi reliabilitas tes antara lain panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat kesukaran soal. Menurut Alen dan Yen (1979) dan Crocker dan Algina (1986) tingkat kesukaran itu memegang peranan yang paling dominan. Hasil penelitian Aiken et. al, dikutip dari Sumarna, menunjukkan bahwa pengaruh tingkat kesukaran memegang peranan yang paling besar pada koefisien reliabilitas. Hal ini disebabkan karena menyangkut variasi jumlah soal yang dapat dijawab benar. Semakin sukar soal-soal dalam perangkat tes akan semakin besar pula variasi skor yang diperoleh belahan.11_{Dengan demikian maka}

akan semakin besar pula reliabilitas tes tersebut. Sebaliknya, semakin rendah tingkat kesukaran suatu soal semakin kecil pula reliabilitasnya. Untuk itu harus dihindari banyaknya terkaan yang dilakukan peserta tes dan diusahakan menyesuaikan pengetahuan peserta tes dengan materi tes yang akan diujikan kepada mereka. Penambahan panjang tes akan menaikkan koefisien reliabilitas sepanjang soal yang digunakan untuk menambah tes itu memiliki kualitas yang sama baik dengan soal-soal lainnya.

Tes yang terdiri atas soal-soal yang banyak akan lebih reliabel dibandingkan dengan tes yang terdiri atas soal yang sedikit. Sebagai contoh kita ambil dalam tes bahasa arab yang terdiri atas 40 soal dengan indeks reliabilitas 0,70. kemudian soal ditambah 20 butir sehingga berjumlah 60. Tes dengan 40 soal ini akan memiliki reliabilitas yang berbeda dengan tes yang terdiri atas 60 soal. Cara menentukan reliabilitas dengan jumlah soal yang berbeda dapat menggunakan persamaan Spearman-Brown sebagai berikut:

11_{Sumarna Surapranata, (Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil Tes.} Bandung: Remaja Rosdakarya, 2006), hal 92.

(9)

r = indeks reliabilitas awal

Penambahan 20 soal pada 40 soal, maka panjang tes sekarang menjadi 60 soal. Panjang tes sekarang adalah 1.5 tes awal. Dengan menggunakan rumus di atas maka:

Penambahan 20 butir soal pada tes awal yang memiliki indeks reliabilitas 0.60 mengakibatkan kenaikan indeks reliabilitas sebesar 0,78.

Maksud dari perubahan panjang tes adalah perubahan pada jumlah item tes. Perubahan panjang tes bukan hanya mengubah mean atau rata-rata dan varians skor tes, tetapi juga mempengaruhi pula reliabilitasnya, seperti pada contoh sebelumnya. Maksud perubahan terhadap reliabilitas hanya dapat diprediksikan apabila item-item yang ditambahkan pada atau dihilangkan dari tes merupakan item atau kumpulan item yang setara dengan lainnya. Para ahli psikometri sepakat bahwa tidak selamanya penambahan panjang tes akan mengakibatkan penambahan indeks reliabilitas. Ada batas-batas kejenuhan yang mengakibatkan indeks reliabilitas tidak berubah.

Berdasarkan paparan di atas, dapat kita identifikasi hal apa saja yang mempengaruhi reliabilitas tes hasil belajar, yaitu:

(10)

reliabilitasnya. Hal ini terjadi karena semakin panjang tes (semakin banyak butir soal) sehingga semakin banyak perilaku yang terukur dengan lebih tepat. Kenaikan reliabilitas sebagai fungsi dari panjang tes dijelaskan oleh formula Spearman-Brown, yaitu:

r_n = indeks reliabilitas setelah ditambahkan soal n = perkalian penambahan awal

r = indeks reliabilitas awal

Apabila tes memiliki banyak butir, maka reliabilitasnya dapat meningkat, asal penambahan butir tersebut mengacu pada pendiskripsian yang jelas terhadap variabel yang diukur. Jadi, dalam menyiapkan suatu tes perlu dipertimbangkan jumlah butirnya. Walaupun ditemukan semakin banyak butir berarti semakin tinggi reliabilitas, bukanlah berarti bahwa perlu disiapkan butir tes sebanyak-banyaknya, tetapi tetap berada pada batas dimensi dan indikator dari variabel yang diukur.

2. Variabilitas kelompok atau heregonitas kelompok

Faktor lain yang berpengaruh terhadap reliabilitas instrument adalah heterogenitas kelompok. Heterogenitas kelompok diperlihatkan oleh besar kecilnya varians distribusi skor subjek pada variabel yang diungkap oleh tes yang bersangkutan. Bila tes yang bersangkutan mengungkap kemampuan bahasa arab maka heterogenitas kelompok diperlihatkan oleh besarnya variasi skor kemampuan berbahasa arab di antara siswa yang dites. Hal ini juga sesuai dengan rumus reliabilitas, yaitu:

(11)

reliabilitas secara langsung dipengaruhi oleh penyebaran skor dalam kelompok yang diukur. Semakin besar penyebaran skor (artinya semakin kelompok bervariasi) maka semakin besar pula indeks reliabilitas yang diperoleh. Akan semakin sulit untuk mengukur perbedaan kemampuan siswa dalam kelompok yang homogen daripada dalam kelompok yang heterogen.

Variabilitas kelompok ini berimplikasi pada penyebaran skor. Koefisien reliabilitas secara langsung dipengaruhi oleh penyebaran skor dalam kelompok yang diukur. Hal-hal lain menjadi sama, semakin besar penyebaran skor maka semakin besar pula indeks reliabilitas yang diperoleh.

3. Objektivitas penskoran

Reliabilitas pemberi skor merujuk kepada keberadaan observer yang berbeda atau kesepakatan pemberi nilai yang mereka berikan pada instrument yang sama. Semakin tinggi kesepakatan, maka reliabilitas pemberi skor akan semakin tinggi juga. Begitu juga sebaliknya. Sebagian besar tes bakat dan tes prestasi standar mempunyai objektivitas yang tinggi. Butir-butir skor tes objektif seperti pilihan ganda dan skor yang dihasilkan tidak dipengaruhi oleh keputusan dan pendapat pemberi skor. Semakin tinggi tingkat objektivitas tes semakin tinggi pula tingkat reliabilitasnya.

4. Metode estimasi reliabilitas

Saat menguji koefisien reliabilitas tes standar, memutuskan metode yang digunakan untuk menentukan besarnya koefisien reliabilitas

(12)

merupakan hal yang penting. Secara umum, besarnya koefisien reliabilitas berkaitan erat dengan metode yang digunakan untuk estimasi reliabilitas. Berikut ini beberapa tes untuk menentukan koefisien reliabilitas:

a. Metode tes ulang (Test Retest Method): mungkin hasilnya lebih besar dibandingkan dengan metode belah dua jika interval waktunya pendek. Koefisien reliabilitas yang dihasilkan menjadi lebih kecil jika interval waktu tesnya ditingkatkan.

b. Tes sejajar (Equivalent Test) tanpa waktu interval: Koefisien reliabilitas cenderung lebih rendah dibandingkan dengan metode belah dua atau tes ulang yang menggunakan interval waktu singkat.

c. Tes Sejajar dengan interval waktu: koefisien menjadi lebih kecil seiring dengan peningkatan interval waktu tes.

d. Metode belah dua (Split-half Method): Metode ini menyediakan sebuah indikasi konsistensi internal tes.

Guru dapat menggunakan salah satu teknik analisis untuk estimasi reliabiltas, yang perlu ditekankan adalah penggunaan teknik tertentu memerlukan data pada kategori interval atau nominal.

5. Level kelompok dan tingkat kesulitan tes

Selain variabilitas dalam kelompok, level kelompok juga mungkin dapat berpengaruh dalam koefisien reliabilitas. Presisi pengukuran dari sebuah tes bisa berhubungan dengan level kemampuan dari orang yang diukur; bagaimanapun juga, tidak ada aturan yang dapat memformulasikan keadaan hubungan ini. Sifat hubungan ini bergantung pada bagaimana cara tes itu disusun. Untuk mereka yang merasa bahwa tes terlalu sulit, sepertinya mereka akan sering menebak, akurasinya akan menjadi rendah. Pada keadaan lain, jika tes terlalu mudah untuk kelompok itu, seperti mereka pasti bisa menjawab kebanyakan item dengan benar, tes tersebut bisa menjadi tidak efektif dalam membedakan dalam anggota kelompok. Hal ini ekuivalen dengan tingkat kesulitan tes. Tes yang sangat mudah atau sangat sulit tidak dapat mengukur perbedaan individu.

(13)

sejarah kelas X akan menjadi lebih reliabel daripada 100 item tes yang mengukur tes sejarah pada tingkat SMA. Begitu juga pada mata pelajaran lainnya, seperti matematika atau bahasa arab, yang lebih membutuhkan pengorganisasian yang lebih padat, dengan ketergantungan yang erat pada bukti-bukti, aturan-aturan, kemampuan, dan hasil, daripada seperti pada mata pelajaran sejarah. Ini adalah aspek lain dari homogenitas tes yang membuat reliabilitas tes yang tinggi menjadi lebih mudah dicapai pada tes matematika dan bahasa asing dibandingkan pada tes hasil belajar materi pendidikan lainnya.

D. Simpulan

Penyusunan tes hasil belajar merupakan hal yang urgen dalam proses pembelajaran. Maka dari itu, tes yang disusun harus mempunyai kualitas yang baik, diantaranya adalah tes bersifat reliabel atau memiliki reliabilitas. Agar tes bersifat reliabel kita perlu tahu faktor apa sajakah yang mempengaruhi reliabilitas tes. Berdasarkan uraian sebelumnya, dapat disimpulkan bahwa faktor-faktor yang mempengaruhi reliabilitas suatu tes adalah jumlah butir tes (panjang tes), variabilitas kelompok, objektivitas penskoran, metode untuk mengestimasi reliabilitas, level kelompok dan tingkat kesulitan tes, dan homogenitas tes. Jika guru memperhatikan hal-hal tersebut diharapkan tes hasil belajar memiliki kualitas yang baik.

Daftar Pustaka

Allen, Mary J. and Yen, Wendy M. Introduction to measurement theory. Monterey, California: Cole Publishing Company. 1979.

(14)

Azwar, Saifuddin. Tes Prestasi: Fungsi dan Pengembangan Pengukuran Prestasi

Belajar. Pustaka Pelajar : Yogyakarta. 2011.

Ebel. Robert L. Essentials of Educational Measurement (3rd_{ed). New Jersey:}

Prentice Hall, Inc. 1979.

Mardalis. Metode Penelitian Suatu Pendekatan Proposal. Jakarta: Bumi Aksara. 1990.

Mardapi, Djemari. Teknik penyusunan instrumen tes dan nontes. Mitra Cendekia : Yogyakarta. 2008.

Peraturan Menteri Pendidikan Nasional Republik Indonesia Nomor 41 Tahun 2007 Tentang Standar Proses.

Sax, Gilbert. Principles of Educational and Psychological Measurement and

Evaluation (2nd_{ed). San Fransisco: Phoenix Publishing Services, Inc.}

1980.

Sudijono, Anas. Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press. 2006.

Surapranata, Sumarna. Analisis, Validitas, Reliabilitas, dan Interpretasi Hasil

Tes. Bandung: Remaja Rosdakarya. 2006.

Surapranata, Sumarna. Panduan Penulisan Tes Tertulis. Bandung: Remaja Rosdakarya. 2005.

Thorndike, Robert M. Measurement and Evaluation in Psychology and