• Tidak ada hasil yang ditemukan

KUALITAS BUTIR SOAL UJIAN AKHIR MADRASAH IBTIDAIYAH GUGUS II TAHUN PELAJARAN 2010/2011 DI KOTA PALANGKA RAYA. Gito Supriadi.

N/A
N/A
Protected

Academic year: 2021

Membagikan "KUALITAS BUTIR SOAL UJIAN AKHIR MADRASAH IBTIDAIYAH GUGUS II TAHUN PELAJARAN 2010/2011 DI KOTA PALANGKA RAYA. Gito Supriadi."

Copied!
29
0
0

Teks penuh

(1)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 KUALITAS BUTIR SOAL UJIAN AKHIR MADRASAH IBTIDAIYAH GUGUS II

TAHUN PELAJARAN 2010/2011 DI KOTA PALANGKA RAYA

Gito Supriadi

Abstract

The study objectives were to analyze and describe the level of difficulty, istinguishing, the validity, and reliability of test items Ibtidaiyah subjects Qur'an Hadith , Morals Aqeedah , Fiqh , Arabic and SKI academic year 2010/2011 in Palangkaraya City Cluster II.

This study uses a quantitative approach , the descriptive format . Data collection techniques with engineering documentation in the form of exam questions and answer sheets of students . While the techniques of data analysis using statistical analysis consists of formulas difficulty level items , distinguishing items , validity and reliability of the test items .The results showed that : (1) difficulty level exam Qur'an Hadith eligible items whose difficulty level is as much as 6 good items . Morals Aqeedah exam no difficulty levels that meet the criteria of good items . Fiqh exam there are 6 items that include criteria for level of difficulty of the good items . Arabic exam there are 17 good items.

Reliability final exam Elementary School Academic Year 2010/2011 in Cluster II of Palangkaraya city 5 ( five ) subjects tested , there are 4 (four) subjects had reliable ie Quran Hadith , Fiqh , Arabic and SKI . While the exam Aqeedah Morals unreliable.

Key Words: Difficulty level, Differential Power, Validity, and Reliability A. LATAR BELAKANG PENELITIAN

Sebagai alat ukur, suatu tes dapat dikatakan berhasil menjalankan fungsi ukurnya apabila mampu memberikan hasil ukur yang cermat dan akurat. Tes yang hasil ukurnya tidak cermat atau tidak dapat menunjukkan perbedaan-perbedaan kecil yang ada pada objek ukurnya tidaklah banyak memberikan informasi yang berguna. Jika sebuah tes tidak mampu menunjukkan perbedaan antara siswa yang mempunyai sedikit kemampuan dan yang mempunyai lebih banyak kecakapan, maka tidak tes tersebut belum dikatakan tes yang baik. Sebuah tes yang berisi soal-soal berkualitas tinggi walaupun dalam jumlah yang sedikit akan jauh lebih berguna daripada sebuah tes yang berisi puluhan soal berkualitas rendah. Soal-soal yang berkualitas rendah tidak saja akan menurunkan fungsi tes akan tetapi akan memberikan hasil pengukuran yang menyesatkan.

Oleh karena itu setiap tes yang telah selesai ditulis, masih harus diuji kualitasnya secara empirik. Soal-soalnya masih harus diuji dengan menggunakan data yang diperoleh melalui suatu prosedur try-out atau dari hasil pengenaan tes di kelas yang sesungguhnya (field tested). Dari data hasil pengenaan tes ini akan diperoleh bukti mengenai kualitas soal-soal tes yang bersangkutan. Kemudian dari hasil analisis terhadap data empirik ini pula diperoleh dasar

Dosen pada Sekolah Tinggi Agama Islam Negeri (STAIN) Palangka Raya dan Ketua Program Studi

Pendidikan Agama Islam STAIN. Alumni Program Studi Penelitian dan Evaluasi Pendidikan (PEP) Universitas Negeri Yogyakarta. Email//Gitosupriadi@gmail.com

(2)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 untuk melakukan perbaikan-perbaikan yang diperlukan. Prosedur kerja dalam melakukan pengujian seluruh soal tes yang didasarkan pada data empirik tersebut dinamai prosedur analisis butir soal.

Pada tahun ajaran 2010/2011 pada jenjang pendidikan termasuk Madrasah Ibtidaiyah di Palangka Raya mengadakan ujian sekolah/madrasah yang penyelenggaraannya dilakukan bersama atau gabungan yaitu madrasah swasta menggabungkan diri dengan madrasah negeri, seperti halnya pada tahun ajaran 2010/2011 Madrasah Ibtidaiyah Negeri Langkai di Palangka Raya sebagai penyelenggara ujian madrasah ibtidaiyah yang membawahi 9 madrasah ibtidaiyah yang ada di gugus II.

Berdasarkan wawancara yang penulis lakukan dengan Ketua Panitia Ujian Akhir Madrasah Ibtidaiyah gugus II bahwa pelajaran yang diujikan adalah terdiri mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI, yang cara pembuatan soal ujian dilakukan oleh Kelompok Kerja Madrasah (KKM) Gugus II yang terdiri dari 9 Madrasah Ibtidaiyah. Soal ujian yang disusun tersebut secara teoritis sudah dilakukan analisis misalnya terkait dengan kesesuaian antara kompetensi yang diukur dengan soal yang dibuat, akan tetapi soal secara empiris belum dilakukan analisis, sehingga belum diketahui bagaimana tingkat kesukaran soal, daya pembeda butir soal, validitas butir soal dan reliabilitas soal ujian madrasah yang digunakan pada ujian madrasah ibtidaiyah tahun ajaran 2010/2011 di Palangka Raya.1

Guna mengetahui lebih lanjut bagaimana tingkat kesukaran butir soal, daya pembeda butir soal, validitas butir soal, dan reliabilitas soal ujian Madrasah Ibtidaiyah tahun ajaran 2010/2011 maka perlu lakukan penelitian dengan judul Kualitas Butir Soal Ujian Akhir Madrasah Ibtidaiyah Tahun Ajaran 2010/2011 di Gugus II Kota Palangka Raya.

B. MASALAH DAN TUJUAN PENELITIAN

Berdasarkan latar belakang penelitian di atas, maka masalah dalam penelitian ini adalah:

1. Bagaimana tingkat kesukaran butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya?

2. Bagaimana daya pembeda butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya?

3. Bagaimana validitas butir soal ujian madrasah ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya?

4. Bagaimana reliabilitas soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya?

Sedangkan tujuan penelitian ini adalah:

1. Menganalis dan mendeskripsikan tingkat kesukaran butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya.

1 Wawancara dengan Ketua Panitia Ujian Madrasah Ibtidaiyah Gugus 2 di MIN Langkai Palangka Raya tanggal

(3)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 2. Menganalis dan mendeskripsikan daya pembeda butir soal ujian Madrasah Ibtidaiyah

mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya.

3. Menganalis dan mendeskripsikan validitas butir soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya.

4. Menganalis dan mendeskripsikan reliabilitas soal ujian Madrasah Ibtidaiyah mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan SKI tahun ajaran 2010/2011 di Gugus II Kota Palangka Raya.

C. MANFAAT PENELITIAN

Berdasarkan tujuan penelitian tersebut di atas, maka kegunaan penelitian ini adalah sebagai berikut:

1. Memberikan informasi kepada Kelompok Kerja Madrasah (KKM) Madrasah Ibtidayah terkait dengan kualitas butir soal ujian Madrasah Ibtidaiyah, yang dapat dijadikan sebagai bahan evaluasi penyusunan butir soal.

2. Berdasarkan hasil analisis butir soal yang peneliti lakukan, maka butir soal yang memenuhi syarat dapat dijadikan sebagai bank soal, sehingga pada tahun-tahun berikutnya soal tersebut dapat digunakan kembali sebagai alat ukur hasil belajar.

D. KAJIAN PUSTAKA

1. Hasil Penelitian Yang Relevan

Penelitian serupa pernah penulis lakukan yaitu tentang analisis butir soal ujian semester mata pelajaran Sejarah Kebudayaan Islam (SKI) kelas III Madrasah Aliyah Negeri Yogyakarta tahun 2007. Hasil penelitian menujukkan bahwa dari 40 butir soal bentuk pilihan ganda terdapat tingkat kesukaran soal yang kategori sedang 22 butir soal, kategori sukar 10 soal dan kategori mudah sebanyak 8 butir. Sedangkan soal yang memenuhi kriteria validitas yang baik yaitu kooefisen biserial sebesar >0,30 sebanyak 32 butir soal dan sisanya gugur (8 soal). Selanjutnya hasil analisis reliabiltas soal SKI sebanyak 40 butir soal tersebut memiliki reliabilas cukup yaitu berdasarkan analisis dengan menggunakan rumus KR20 bahwa soal SKI yang digunakan pada ujian semester di Kelas III MAN Yogyakarya pada tahun 2007 sebesar 0,653.2

Penelitian di atas hanya melakukan analisis satu mata pelajaran saja, sedangkan yang akan penulis lakukan pada penelitian ini adalah menganalisis butir soal ujian madrasah ibtidaiyah untuk 5 (lima) mata pelajaran yang diujikan, yaitu Pkn, Bahasa Indonesia, IPA, Matematika dan IPS yang terkait dengan tingkat kesukaran butir soal, daya pembeda butir soal, validitas butir soal dan reliabilitas tes. Penelitian ini akan dilakukan di gugus 2 madrasah ibtidaiyah Kota Palangka Raya.

2. Analisis Butir Soal

Analisis butir soal dilakukan untuk mengetahui berfungsi tidaknya sebuah soal. Analisis pada umumnya dilakukan melalui dua cara, yaitu analisis soal secara teoritik atau kualitatif dan analisis soal secara empiris atau analisis soal secara kuantitatif.

2 Gito Supriadi, Analisis Butir Soal Ujian Semester Mata Pelajaran SKI di MAN Yogyakarta,( Yogyakarta:

(4)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Analisis soal secara teoritik atau analisis kualitatif dilakukan sebelum diadakan ujicoba, yakni dengan cara mencermati butir-butir soal yang telah disusun dilihat dari kesesuaian dengan kemampuan dasar dan indikator yang diukur serta pemenuhan persyaratan baik dari aspek materi, kontruksi, dan bahasa.3 Sedangkan analisis soal secara kuantitatif menekankan pada karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, distribusi jawaban, dan reliabilitas.4 Pada penelitian ini

penulis tidak akan melakukan analisis soal secara kualitatif, akan tetapi difokuskan pada analisis soal secara kuantitatif yang meliputi parameter tingkat kesukaran soal, daya pembeda, validitas, dan reliabilitas.

3. Alasan Perlunya Analisis Butir Soal

Butir soal buatan guru atau kelompok kerja guru pada umumnya dikonstruksikan secara tergesa-gesa dan jarang atau tidak diujicobakan sebelum diadministrasikan. Akibatnya banyak butir soal yang digunakan dalam ujian tidak dapat memberikan atau menghasilkan informasi yang tidak tepat atau tidak akurat tentang kemampuan siswa. Padahal hasil ujian acapkali digunakan sebagai bahan keputusan tentang kelulusan siswa. Bila keputusan yang diambil didasarkan kepada informasi yang tidak benar atau tidak akurat, yang disebabkan oleh alat yang digunakan untuk mengumpulkan informasi yaitu butir soal yang tidak terkonstruksi secara baik, maka tentu saja keputusan demikian itu adalah keputusan yang tidak dapat dipertanggungjawabkan. Jadi jelasnya bahwa dibutuhkan alat yang dapat dipercaya yang dapat mengukur apakah alat ukur (butir soal) yang digunakan memang dapat dijadikan dasar untuk menentukan keputusan yang bijaksana.

Menurut Asmawi Zainul dan Noehi Nasution ada beberapa alasan mengapa diperlukan analisis butir soal, yaitu:

1. Untuk dapat mengetahui kekuatan dan kelemahan butir tes, sehingga dapat ditentukan butir yang baik atau yang harus direvisi.

2. Untuk menyediakan informasi tentang spesifikasi butir soal secara lengkap, sehingga akan lebih memudahkan bagi guru dalam menyusun perangkat soal yang akan memenuhi kebutuhan ujian dalam bidang dan tingkat tertentu.

3. Untuk segera dapat diketahui masalah yang terkandung dalam butir soal seperti: kemenduaan butir soal, kesalahan meletakkan kunci jawaban, soal yang terlalu sukar atau terlalu mudah atau soal yang tidak membedakan antara siswa yang mempersiapkan diri secara baik atau tidak dalam menghadapi tes.

4. Untuk dijadikan alat guna menilai butir soal yang akan disimpan dalam kumpulan soal atau bank soal. 5

4. Indeks Kesukaran Butir Soal

Sangatlah penting untuk melihat tingkat kesukaran soal dalam rangka menyediakan berbagai macam alat diagnostik kesulitan belajar peserta didik ataupun dalam rangka meningkatkan penilaian berbasis kelas. Baik buruknya butir tes juga

3 Djemari Mardapi, Tes Hasil Belajar, Universitas Negeri Yogyakarta, (Yogyakarta: Tp, 2004) hal. 130

4 Sumarna Surapranata, Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes, ( Bandung: Remaja

Rosdakarya, 2005), hal. 10.

5 Asmawi Zainul dan Noehi Nasution, Penilaian Hasil Belajar, Direktorat Jenderal Pendidikan Tinggi

(5)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 ditentukan oleh tingkat kesukaran butir tersebut, yang diperoleh dari analisis soal. Secara umum, menurut teori klasik, tingkat kesukaran dapat dinyatakan melalui beberapa cara diantaranya (1) proporsi menjawab benar, (2) skala kesukaran linear, (3) indeks Davis, dan (4) skala bivariat. Proporsi jawaban benar (p), yaitu jumlah peserta tes yang menjawab benar pada butir soal yang dianalisis dibandingkan dengan jumlah peserta tes seluruhnya merupakan tingkat kesukaran yang paling umum digunakan.6

Indeks kesukaran suatu soal dinyatakan oleh suatu indeks yang dinamakan indeks kesukaran soal dan disimbolkan oleh huru p. Indeks kesukaran soal merupakan rasio antara penjawab soal dengan benar dan banyaknya penjawab soal. Secara teoretik dikatakan bahwa p sebenarnya merupakan probabilitas empirik untuk lulus soal tertentu bagi kelompok siswa tertentu. Secara matematis tingkat kesukaran butir soal dapat dihitung dengan rumus sebagai berikut:

p = 𝐵

𝑁

Keterangan:

p = proporsi menjawab benar atau tingkat kesukaran

B = banyaknya siswa yang menjawab soal dengan benar

N = jumlah peserta tes

Besarnya indeks kesukaran berkisar antara 0,00 sampai dengan 1,00. Suatu soal yang mempunyai p = 0, artinya soal itu terlalu sukar karena tidak ada peserta tes yang menjawab benar, sedangkan butir yang mempunyai harga p = 1, artinya soal itu terlalu mudah karena setiap peserta tes dapat menjawab dengan benar. Dari penjelasan diatas dapat disimpulkan bahwa semakin tinggi harga p, butir soal tersebut semakin mudah. Hal demikian secara logis sebetulnya dikatakan tingkat kemudahan butir soal.7

Menurut Fernandes seperti dikutip Adi Suryanto8 kategori tingkat kesukaran dibedakan menjadi tiga kategori seperti nampak pada tabel 1 berikut:

Tabel 1 : Kategori Tingkat Kesukaran

Nilai p Kategori

0,00 – 0,24 Sukar

0,25 – 0,75 Sedang

0,76 – 1,00 Mudah

Guna menyusun butir soal untuk naskah ujian menurut Asmawi dan Nasution sebaiknya digunakan butir soal yang tingkat kesukarannya berimbang yaitu: sukar = 25%, sedang = 50%, dan mudah = 25%. Dalam penggunaan butir soal dengan komposisi seperti itu maka dapat diterapkan penilaian berdasarkan acuan norma atau acuan patokan. Bila komposisi butir soal dalam suatu naskah ujian tidak berimbang, maka penggunaan penilaian acuan norma tidaklah tepat, karena informasi kemampuan yang dihasilkan tidaklah akan terdistribusi dalam suatu kurva normal.9

6 Sumarna Surapranata, Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes, hal. 12

7 Allen, M.J. and Yen, W. Introduction to Measurement Theory.( Monterey: Brooks/Cole Publishing Company, 1979), hal. 120

8 Adi Suryanto, dkk, Evaluasi Pembelajaran di SD, (Jakarta: Universitas Terbuka, 2009), hal. 5.23 9 Asmawi Zainul dan Noehi Nasution, Penilaian Hasil Belajar, hal. 177.

(6)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Tingkat kesukaran (p) sebenarnya merupakan nilai rata-rata dari kelompok peserta tes. Oleh karena itu tingkat kesukaran sebenarnya adalah rata-rata sari suatu distribusi skor kelompok dari suatu soal. paling tidak ada dua ciri tingkat kesukaran. Pertama, tingkat kesukaran merupakan ukuran soal, tidak menunjukkan karakteristik soal. Tingkat kesukaran soal dalam hal ini didefinisikan sebagai frekuensi relatif terhadap pengambil tes. Kedua, tingkat kesukaran merupakan karakteristik soal itu sendiri maupun pengambil tes.10

Butir soal yang dianggap dapat digunakan (baik) adalah butir soal yang mempunyai tingkat kesukaran dalam kategori sedang.11

5. Daya Pembeda Soal

Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai (siswa yang mempunyai kemampuan tinggi) dengan siswa yang kurang pandai (siswa yang mempunyai kemampuan rendah). Fungsi dari daya beda itu adalah mendeteksi perbedaan individual yang sekecil-kecilnya di antara para subjek tes, sejalan dengan fungsi dan tujuan tes itu sendiri. Butir yang demikian dikatakan valid atau cermat.12

Indeks yang digunakan dalam membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah adalah indeks daya pembeda (item discrimination). Indeks daya pembeda soal-soal yang ditetapkan dari selisih proporsi yang menjawab dari masing-masing kelompok. Indeks ini menunjukkan keseuaian antara fungsi soal dengan fungsi tes secara keseluruhan. Angka yang menunjukkan besarnya daya pembeda berkisar antara -1 sampai dengan +1. Tanda negatif menunjukkan bahwa peserta tes yang kemampuannya rendah dapat menjawab benar, sedangkan peserta tes yang kemampuannya tinggi menjawab salah. Dengan demikian soal yang indeks daya pembedanya negatif menunjukkan terbaliknya kualitas peserta tes.

Indeks daya pembeda dihitung atas dasar pembagian kelompok menjadi dua bagian, yaitu kelompok atas yang merupakan peserta yang berkemampuan tinggi dengan kelompok bawah yaitu kelompok peserta tes yang berkemampuan rendah. Kemampuan tinggi ditunjukkan dengan perolehan skor yang tinggi dan kemampuan rendah ditunjukkan dengan perolehan skor yang rendah. Pada umumnya para ahli tes membagi kelompok ini menjadi 27% kelompok atas dan 27% kelompok bawah.13

Daya pembeda butir soal dapat dihitung dengan menggunakan rumus: D = PA - PB

D = indeks daya beda butir soal

PA = proporsi kelompok atas yang menjawab benar PB = Proporsi kelompok bawah yang menjawab benar

Indeks daya pembeda yang ideal adalah yang sebesar mungkin mendekati angka 1, semakin besar indeks daya pembeda berarti soal tersebut semakin mampu membedakan antara mereka yang menguasai bahan yang diujikan dan mereka yang tidak menguasai bahan. Semakin kecil indeks daya pembeda (mendekati 0) berarti semakin tidak jelaslah

10 Sumarna Surapranata, Analisis, Validitas, Reliabilitas Tes dan Interpretasi Hasil Belajar... hal. 19 11 Adi Suryanto, dkk, Evaluasi Pembelajaran di SD, (Jakarta: Universitas Terbuka, 2009), hal. 5.23

12 Saifudin Azwar, Tes prestasi : Fungsi dan Pengembangan Pengukuran Prestasi Belajar, (Yogyakarta: Pustaka Pelajar Offset, 2005), hal.137

(7)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 fungsi soal yang bersangkutan dalam membedakan mana subjek yang menguasai bahan pelajaran dan mana subjek yang tidak tahu apa-apa.

Menurut Ebel kriteria indeks daya beda adalah sebagai berikut:

Tabel 2: Indeks Daya Pembeda Soal14 Nilai D Kategori Keterangan

D ≥ 0,40 Sangat baik Diterima

0,30 ≤ D ≤ 0,39 Baik Perlu peningkatan

0,20 ≤ D ≤ 0,29 Cukup Revisi

D ≤ 0,19 Tidak baik Dibuang

6. Validitas Butir Soal

Dua prinsip dasar permasalahan dalam penilaian adalah menentukan apakah sebuah tes telah mengukur apa yang hendak diukur dan apakah sebuah tes telah tepat digunakan untuk membuat suatu keputusan tentang pengambil tes. Secara umum validitas dapat dikatakan sebagai ketepatan alat ukur untuk mengukur sesuatu. Validitas dibedakan menjadi dua macam yaitu validitas logis dan validitas empiris. Validitas logis sama dengan analisis kualitatif terhadap sebuah soal, yaitu untuk menentukan berfungsi tidaknya suatu soal berdasarkan kriteria yang telah ditetantukan, misalnya kriteria materi, konstruksi dan bahasa. Sedangkan validitas empiris adalah analisis kuantitatif yang berhubungan dengan indeks validitas.

Validitas adalah kualitas yang menunjukkan hubungan antara suatu pengukuran (diagnosis) dengan arti atau tujuan kriteria belajar atau tingkah laku. Di dalam buku

Encyclopedia of Education yang ditulis oleh Scarvia B. Anderson dan kawan-kawan,

disebutkan : A test is valid if it measures what it purpose to measure. Artinya sebuah tes dikatakan valid apabila benar-benar dapat mengukur apa yang diukur.15

Purwanto menyatakan, validitas merupakan syarat terpenting dalam suatu alat evaluasi. Suatu teknik evaluasi dikatakan mempunyai validitas yang tinggi (disebut valid) jika teknik evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur.16 Sebagaimana dikatakan oleh Cronbach: “How well a test or evaluative technique does the

job that it is employed to do”.17 Validitas bukanlah suatu ciri atau sifat yang mutlak dari

suatu teknik evaluasi, ia merupakan suatu ciri yang relatif terhadap tujuan yang hendak dicapai oleh pembuat tes.

Dari pendapat di atas maka dapat dikatakan bahwa validitas adalah menunjukkan adanya kesesuaian, ketepatan, kebenaran alat tes dengan antara hasil tes. Atau dengan kata lain, bahwa sebuah tes dapat dikatakan valid apabila dapat mengukur atau mengungkap apa yang seharusnya diungkap atau diukur melalui tes tersebut.

14 Robert L Ebel, Essentials of Educational Measurement Third Edition, (New Jersey: Prentice-Hall Inc,

Englewood Cliffs, 1979), h. 267.

15Suharsimi Arikunto Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi), (Bumi Aksara, Jakarta, 1999), hal. 64-65

16 Ngalim Purwanto, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, (PT. Remaja Rosdakarya, Bandung,

2000), hal. 138.

17 Cronbach, L.J, Essentials of Psychologycal Testing, (New York: Harper & Row, Publisher. Icn., 1984), hal.

(8)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Jadi tes hasil belajar dapat dinyatakan valid apabila hasil belajar sebagai alat pengukur keberhasilan belajar peserta didik, dengan secara tepat, benar, shahih, telah dapat mengukur atau mengungkap hasil belajar yang telah dicapai oleh peserta didik,setelah mereka menempuh proses belajar mengajar dalam jangka waktu tertentu.

Surapranata berpendapat bahwa validitas soal juga merupakan indeks diskriminasi soal atau daya pembeda soal. Angka yang menunjukkan besarnya validitas soal disebut dengan indeks validitas soal yang besarnya berkisar antara -1 sampai dengan +1.18

Terdapat berbagai cara yang digunakan untuk menentukan validitas diantaranya adalah dengan menggunakan korelasi biserial sebagai berikut:

Keterangan:

rbis = Koefisien korelasi biserial

Mp = rerata skor pada tes dari peserta tes yang memiliki jawaban benar

Mt = rerata skor total

St = standar deviasi skor total

p = proporsi peserta tes yang jawabannya benar pada soal q = 1 – p

Guna menetapkan butir soal yang valid dalam penelitian ini memberikan batasan indeks validitas sebesar > 0,30. Hal ini sebagaimana pendapat Nunaly dalam Surapranata bahwa korelasi di atas 0,30 dipandang sebagai butir tes yang baik.19

7. Reliabilitas Tes

Evaluasi pendidikan melibatkan banyak kegiatan teknis dalam menentukan metode dan format penilaian yang dapat digunakan untuk mendapatkan informasi yang dibutuhkan. Informasi tersebut diperlukan dalam menafsir dan menetapkan keputusan untuk kepentingan pendidikan. Penilai membutuhkan keterampilan dalam mengidentifikasi dan memahami berbagai macam perspektif penilaian, baik penilaian kontekstual dan proses maupun penilaian hasil. Karena penilaian merupakan pusat kontrol keberhasilan program pendidikan, maka terdapat dua syarat utama yang harus dipenuhi oleh suatu instrumen penilaian, yaitu validitas dan reliabilitas.

Validitas mengacu pada keberartian, kebenaran, kemanfaatan, dan kesesuaian skor tes. Validitas merupakan karakteristik suatu tes ketika diujikan pada suatu kelompok peserta tes. Validasi suatu instrumen mencakup pengumpulan data empiris dan argumentasi logis untuk menunjukkan bahwa kesimpulan tertentu adalah tepat. Sedangkan reliabilitas yang berarti konsistensi adalah ciri umum dari suatu instrumen pengukuran dan penilaian pendidikan. Konsistensi tinggi skor instrumen dari suatu pengukuran ke pengukuran berikutnya merupakan ciri terpenting dari instrumen yang berkualitas tinggi.

18 Sumarna Surapranata, Analisis, Validitas, Reliabilitas Tes dan Interpretasi Hasil Belajar,... hal. 60. 19 Ibid. Hal. 64 q p x SDt Mt M rbisp

(9)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Reliabilitas telah didefinisikan dengan cara yang berbeda oleh pengarang yang berbeda. Cara yang terbaik untuk membahas reliabilitas adalah sejauhmana hasil pengukuran dari suatu instrumen mewakili karakteristik yang diukur. Sebagai contoh, reliabilitas didefinisikan seberapa besar konsistensi skor tes yang dicapai peserta tes pada pengujian ulang. Definisi ini akan memuaskan jika skor tes dapat menggambarkan kemampuan peserta tes; jika tidak maka skor tes tidak sistematis, tidak dapat diulangi atau tidak terikat. Reliabilitas juga diartikan sebagai indikator ketidakhadiran kesalahan acak. Jika kesalahan acak dapat diperkecil maka skor tes akan lebih konsisten dari suatu pengujian ke pengujian berikutnya.

Definisi teoretis dari reliabilitas adalah proporsi keragaman skor tes yang disebabkan oleh keragaman sistematis dalam populasi peserta tes. Jika terdapat keragaman sistematis yang lebih besar dalam suatu populasi dibanding dengan populasi lainnya, seperti dalam semua siswa sekolah negeri dibandingkan hanya dengan kelas tertentu, tes akan mempunyai reliabilitas lebih besar untuk populasi yang lebih bervariasi. Reliabilitas adalah karakteristik bersama antara tes dan kelompok peserta tes. Reliabilitas tes bervariasi dari suatu kelompok dengan kelompok lainnya.

Arikunto mengartikan bahwa reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil.20

Para profesional pengukuran menganggap reliabilitas sebagai persyaratan utama suatu instrumen penilaian. Dalam teori tes diakui bahwa skor tes akan valid (benar) jika skor tes tersebut reliabel. Asumsi ini didasarkan pada suatu model matematika teori tes dimana skor perolehan terdiri atas skor tulen dan skor galat (obtained score = true score

+ error score). Semakin sedikit kesalahan dalam suatu tes (yaitu semakin reliabel)

semakin valid skor tes. Karenanya, suatu penilaian yang tidak reliabel secara otomatis tidak valid.

Penekanan utama dalam mengumpulkan data untuk menentukan reliabilitas tes adalah pada konsistensi dihubungkan dengan reliabilitas skor atau reliabilitas penilai. Reliabilitas skor berarti bahwa jika suatu tes telah diadministrasikan pada penempuh ujian untuk kedua kalinya, maka penempuh ujian akan tetap memperoleh skor yang sama dengan pengadministrasian yang pertama. Salah satu cara para spesialis pengukuran dalam menentukan reliabilitas skor tes adalah melalui tes standar. Jika penempuh ujian diuji kembali, mereka harus melengkapi tugas yang sama persis dalam kondisi yang juga persis sama. Hal ini akan membantu dalam pencapaian hasil tes yang konsisten.

Tinggi rendahnya koefisien reliabilitas dipengaruhi oleh beberapa faktor. Crocker dan Algina dalam Surapranata menyebutkan bahwa faktor yang mempengaruhi koefisien reliabilitas antara lain panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat kesukaran soal. menurut Crocker dan Algina tingkat kesukaran memegang peranan paling dominan mempengaruhi reliablibitas tes. Hasil penelitian Aiken menunjukkan bahwa pengaruh tingkat kesukaran memegang peranan paling besar pada koefisien reliabilitas. Hal ini disebabkan karena menyangkut variasi jumlah soal yang dapat dijawab benar. Semakin sukar soal-soal dalam perangkat tes akan semakin besar pula variasi skor yang diperoleh belahan. Dengan demikian maka akan semakin besar pula reliabilitas tes tersebut. Sebaliknya semakin rendah tingkat kesukaran suatu soal semakin kecil pula

(10)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 reliabilitasnya.21 Untuk dapat mengestimasi reliabilitas terdapat beberapa metode reliabilitas yaitu (1), test-retest atau stabilitas (2) pararel atau ekuivalen, (3) split-half atau belah dua, (4) interval consintency, dan (5) dengan KR-20.

Dalam penelitian ini teknik yang digunakan untuk mencari reliabilitas tes adalah dengan persamaan KR-20 sebagai berikut:

𝑟11 = ( 𝑘 𝑘 − 1) ( 𝑆2− ∑ 𝑝𝑞 𝑆2 ) Keterangan: r11 = reliabiltas tes

p = proporsi peserta tes menjawab benar

q = proporsi peserta tes menjawab salah (q = 1-p) ∑pq = jumlah perkalian antara p dan q

k = banyaknya soal

Sedangkan kriteria yang digunakan untuk memberikan interpretasi hasil penelitian ini digunakan batasan indeks reliabilitas sebesar 0,70. Artinya bahwa jika tes hasil belajar yang memiliki koofesien reliabilitas sebesar ≥ 0,70 merupakan tes yang baik. Hal ini sebagaimana pendapat Nunnaly dalam Surapranata bahwa koefisien reliabilitas 0,70 sampai 0,80 termasuk reliabilitas cukup tinggi.22

METODE PENELITIAN

Penelitian ini akan dilaksanakan di Madrasah Ibtidaiyah Negeri (MIN) Langkai Kota Palangka Raya yang merupakan sebagai tempat diselenggarakannya ujian madrasah ibtidaiyah pada tahun ajaran 2010/2011.

Penelitian ini menggunakan pendekatan kuantitatif, dengan format deskriptif, yang bertujuan untuk menjelaskan berbagai kondisi, berbagai situasi atau variabel yang timbul di masyarakat yang menjadi objek penelitian berdasarkan apa yang terjadi.23

Berbagai kondisi yang dimaksud dalam penelitian ini adalah karakteristik butir soal yang digunakan sebagai naskah ujian madrasah ibtidaiyah tahun ajaran 2010/2011, yang mencakup tingkat kesukaran soal, daya pembeda soal, validitas soal dan reliabilitas tes.

Data yang digunakan dalam penelitian ini adalah butir soal ujian madrasah ibtidaiyah tahun ajaran 2010/2011 yang terdiri dari mata pelajaran Pkn, Bahasa Indonesia, IPA, Matematika dan IPS serta lembar jawaban siswa.

Teknik yang digunakan untuk pengumpulan data dalam penelitian ini adalah dengan teknik dokumentasi, yaitu:

1. Naskah soal ujian madrasah ibtidaiyah tahun ajaran 2010/2011 yang terdiri dari naskah soal mata pelajaran Pkn, Bahasa Indonesia, IPA, Matematika, dan IPS.

2. Lembar jawaban siswa yang terdiri dari lembar jawaban soal mata pelajaran Pkn, Bahasa Indonesia, IPA, Matematika, dan IPS.

Adapun teknik analisis data yang digunakan dalam penelitian ini adalah:

21 Sumarna Surapranata,... hal. 92 22 Ibid hal. 114.

(11)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 1. Menggunakan rumus proporsi untuk menganalisis tingkat kesukaran butir soal.

Rumus yang dimaksud adalah sebagai berikut: 𝑝 =𝐵

𝑁

p = tingkat kesukaran butir soal

B = banyaknya peserta tes yang menjawab benar N = banyaknya peserta tes

2. Menggunakan rumus daya pembeda soal untuk menganalisis daya pembeda soal. persamaan yang digunakan adalah:

D = PA - PB

D = indeks daya beda butir soal

PA = proporsi kelompok atas yang menjawab benar

PB = Proporsi kelompok bawah yang menjawab benar

3. Menggunakan rumus korelasi biserial untuk menganalisis validitas butir soal, sebagai berikut:

Keterangan:

rbis = Koefisien korelasi biserial

Mp = rerata skor pada tes dari peserta tes yang memiliki jawaban benar

Mt = rerata skor total

St = standar deviasi skor total

p = proporsi peserta tes yang jawabannya benar pada soal q = 1 – p

4. Dengan rumus KR-20 untuk menganalisis reliabilitas tes sebagai berikut: 𝑟11 = ( 𝑘 𝑘 − 1) ( 𝑆2 − ∑ 𝑝𝑞 𝑆2 ) Keterangan: r11 = reliabiltas tes

p = proporsi peserta tes menjawab benar

q = proporsi peserta tes menjawab salah (q = 1-p) ∑pq = jumlah perkalian antara p dan q

k = banyaknya soal

Guna melakukan perhitungan dan pengolahan data, maka penulis menggunakan alat bantu komputer program Microsoft Excel, dengan tetap mengacu pada rumus-rumus yang telah ditetapkan.

HASIL PENELITIAN

Hasil penelitian tentang kualitas butir soal ujan akhir Madrasah Ibtidaiyah tahun pelajaran 2010/2011 di Palangka Raya ini difokuskan pada mata pelajaran yang penyusunan

q

p

x

SDt

Mt

M

r

bis

p

(12)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 soalnya dilakukan oleh Kelompok Kerja Madrasah (KKM) yang terdiri dari mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab dan Sejarah Kebudayaan Islam.

Kualitas butir soal dalam penelitian ini adalah kualitas butir soal ditinjau dari segi tingkat kesukaran, daya pembeda, validitas dan reliabilitas. Adapun hasil penelitian tersebut disajikan sebagai berikut:

A. Tingkat Kesukaran Butir Soal Ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam

1. Tingkat Kesukaran Butir Soal Ujian Qur’an Hadits

Soal ujian akhir madrasah ibtidaiyah tahun pelajaran 2010/2011di Palangka Raya mata pelajaran Qur’an Hadits yang diujikan sebanyak 50 soal dalam bentuk pilihan ganda dengan alternatif pilihan jawaban sebanyak 4 (empat) pilihan (A, B, C, D). Hasil analisis tingkat kesukaran butir soal Qur’an Hadits diperoleh bahwa dari 50 soal Qur’an Hadits yang diujikan terdapat 3 soal (6%) kategori sangat mudah, 39 soal (78%) kategori mudah, 6 soal (12%) kategori sedang, dan 2 soal (4%) kategori sukar. Sedangkan tingkat kesukaran soal kategori sangat sukar tidak ditemukan.

Berdasarkan data tersebut bahwa soal ujian Qur’an Hadits yang dapat digunakan adalah soal yang memiliki tingkat kesukaran dalam kategori sedang sebanyak 6 soal. Hal ini sebagaimana pendapat Suryanto bahwa butir soal yang dianggap sangat bermanfaat (useful) adalah butir soal yang mempunyai tingkat kesukaran dalam kategori sedang.24 Soal-soal yang dimaksud adalah sebagaimana dalam tabel berikut:

Tabel 3

Soal Ujian Qur’an Hadits Yang Memiliki Tingkat Kesukaran Kriteria Sedang Nomor Nomor Soal B P Kategori 1 6 237 0.595 Sedang 2 18 227 0.570 Sedang 3 35 235 0.590 Sedang 4 36 228 0.573 Sedang 5 45 234 0.588 Sedang 6 49 218 0.548 Sedang

2. Tingkat Kesukaran Butir Soal Ujian Akidah Akhlak

Jumlah soal ujian mata pelajaran Akidah Akhlak sebanyak 50 soal dan disajikan dalam bentuk soal pilihan ganda terdiri 4 (empat) pilihan jawaban (A,B,C,D). Hasil analisis tingkat kesukaran butir soal ujian mata pelajaran Akidah Akhlak diperoleh bahwa butir soal yang memiliki kategori Sangat mudah sebanyak 32 soal (64%) dan

(13)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 soal yang memiliki kategori mudah sebanyak 18 soal (36%). Sedangkan soal dalam kategori sukar, sangat sukar, dan sedang tidak ditemukan.

Berdasarkan analisis data di atas bahwa soal ujian Akidah Akhlak tidak terpenuhinya butir soal yang kategori sedang sehingga dapat dikatakan bahwa soal ujian Akidah Akhlak tidak terdapat kriteria tingkat kesukaran soal yang baik.

3. Tingkat Kesukaran Butir Soal Ujian Fiqih

Soal ujian mata pelajaran Fiqih juga dalam bentuk pilihan ganda dengan jumlah soal 50 butir soal. Hasil analisis diperoleh bahwa jumlah soal yang memiliki kategori sangat mudah sebanyak 2 soal (4%), soal yang memiliki kategori mudah sebanyak 42 soal (84%), dan soal yang kategori sedang sebanyak 6 soal (12%). Sedangkan soal dalam kategori sukar dan sangat sukar tidak ditemukan.

Berdasarkan kriteria yang ditetapkan dalam penelitian ini bahwa butir soal yang dapat digunakan untuk alat tes adalah butir soal yang memiliki tingkat kesukaran sedang. Dengan demikian untuk soal ujian Fiqih hanya 6 butir soal yang memenuhi kriteria baik, yaitu sebagaimana tertera dalam tabel berikut:

Tabel 4

Daftar Soal Ujian Fiqih Yang Termasuk Kriteria Sedang

Nomor Nomor Soal B P Kategori 1 6 234 0.588 Sedang 2 18 228 0.573 Sedang 3 19 192 0.482 Sedang 4 23 169 0.425 Sedang 5 37 237 0.595 Sedang 6 49 217 0.545 Sedang

4. Tingkat Kesukaran Butir Soal Bahasa Arab

Jumlah soal ujian Bahasa Arab sebanyak 50 soal disajikan dalam bentuk piligan ganda. Hasil analisis tingkat kesukaran butir menunjukkan bahwa soal yang memiliki kategori mudah sebanyak 32 soal (64%) dan yang memiliki kategori sedang sebanyak 17 soal (34%) serta kategori kesukaran sukar sebanyak 1 soal (2%). Sedangkan butir soal yang kategori sangat mudah dan sangat sukar tidak ditemukan.

Berdasarkan data analisis tersebut maka butir soal ujian Bahasa Arab yang memenuhi kriteria tingkat kesukaran soal yang dapat digunakan adalah sebanyak 17 soal sebagaimana disajikan dalam tabel berikut:

Tabel 5

Daftar Soal Ujian Bahasa Arab Yang Termasuk Kriteria Sedang

Nomor Nomor

Soal B P Kategori

(14)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 2 6 233 0.585 Sedang 3 16 232 0.583 Sedang 4 18 228 0.573 Sedang 5 19 188 0.472 Sedang 6 26 227 0.570 Sedang 7 28 237 0.595 Sedang 8 30 230 0.578 Sedang 9 31 188 0.472 Sedang 10 32 222 0.558 Sedang 11 35 221 0.555 Sedang 12 36 223 0.560 Sedang 13 37 215 0.540 Sedang 14 41 231 0.580 Sedang 15 45 235 0.590 Sedang 16 49 214 0.538 Sedang 17 50 229 0.575 Sedang

5. Tingkat Kesukaran Butir Soal Sejarah Kebudayaan Islam

Berdasarkan hasil analisis tingkat kesukaran butir soal, bahwa dari 50 butir soal ujian Sejarah Kebudayaan Islam diperoleh 2 butir soal (4%) kategori sangat mudah dan 44 butir soal (88%) termasuk kategori mudah, serta 4 soal (8%) termasuk kategori sedang. Butir soal dalam kategori sukar dan sangat sukar tidak ditemukan.

Dengan demikian maka soal ujian Sejarah Kebudayaan Islam yang termasuk butir soal dilihat dari tingkat kesukaran hanya 4 soal yang memenuhi kriteria tingkat kesukaran soal yang baik yaitu nomor soal yang tertera dalam tabel berikut:

Tabel 6

Daftar Soal Ujian SKI Yang Termasuk Kriteria Sedang

Nomor Nomor Soal B P Kategori 1 18 228 0.573 Sedang 2 19 195 0.490 Sedang 3 23 180 0.452 Sedang 4 49 225 0.565 Sedang

B. Daya Pembeda Butir Soal Ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam

(15)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Guna menganalisis daya pembeda butir soal dalam penelitian ini dilakukan dengan cara menyusun tingkatan skor dari skor tertinggi sampai terendah berdasarkan hasil skor yang diperoleh peserta ujian, dan membagi 27% kelompok atas dan kelompok 27% kelompok bawah dari jumlah peserta ujian sebanyak 398 orang. Dengan pembagian tersebut diperoleh 107 peserta tes kelompok atas, dan 107 peserta tes kelompok bawah. Hasil analisis daya pembeda butir soal masing-masing mata pelajaran dijasikan sebagai berikut:

1. Daya Pembeda Butir Soal Ujian Qur’an Hadits

Berdasarkan hasil analisis daya pembeda butir soal ujian Qur’an Hadits diperoleh bahwa butir soal ujian Qur’an Hadits yang memiliki daya pembeda soal yang sangat baik hanya 1 soal (2%), dan yang memiliki daya pembeda soal yang baik sebanyak 10 soal (20%), dan yang memiliki daya pembeda soal cukup sebanyak 18 soal (36%), serta 21 soal (42%) memiliki daya pembeda soal yang tidak baik.

Dari sebaran data tentang daya pembeda tersebut maka soal yang memiliki kriteria daya pembeda sebesar minimum 0.30 merupakan soal yang memiliki daya pembeda yang baik.25

Berdasarkan kriteria tersebut maka untuk soal ujian Qur’an Hadits yang digunakan di Madrasah Ibdidaiyah tahun pelajaran 2010/2011 di Kota Palangka Raya terdapat 11 butir soal yang memiliki daya pembeda yang baik. Untuk lebih jelasnya dapat dilihat pada tabel berikut:

Tabel 7

Daftar Soal Ujian Qur’an Hadits Yang Memiliki Daya Pembeda Butir Soal Yang Baik

No. Nomor

Soal BA BB BA/NA BB/NB D Keterangan

1 12 88 56 0.82 0.52 0.30 Baik 2 13 92 60 0.86 0.56 0.30 Baik 3 14 94 59 0.88 0.55 0.33 Baik 4 16 93 48 0.87 0.45 0.42 Sangat Baik 5 19 60 23 0.56 0.21 0.35 Baik 6 24 98 60 0.92 0.56 0.36 Baik 7 29 98 57 0.92 0.53 0.38 Baik 8 31 83 50 0.78 0.47 0.31 Baik 9 35 80 44 0.75 0.41 0.34 Baik 10 41 91 56 0.85 0.52 0.33 Baik 11 45 82 45 0.77 0.42 0.35 Baik

(16)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Butir soal yang terdapat pada tabel 7 di atas merupakan butir soal yang memiliki daya pembeda soal yang baik, karena telah menunjukkan indeks daya pembeda sebesar ≥0,30. Daya pembeda soal yang baik juga dapat dilihat dan dibandingkan pada jumlah peserta yang menjawab benar antara kelompok atas (BA) dan kelompok bawah (BB). Misalnya soal nomor 12 kelompok atas yang benar menjawab sebanyak 88 orang dan kelompok bawah sebanyak 56 orang.

2. Daya Pembeda Butir Soal Ujian Akidah Akhlak

Hasil analisis daya pembeda butir soal ujian Akidah Akhlak diperoleh bahwa soal yang memiliki daya pembeda sangat baik sebanyak 3 soal (6%), dan soal yang daya bedanya baik tidak ditemukan, soal yang memiliki daya pembeda cukup sebanyak 7 soal (14%), serta soal yang daya pembedanya tidak baik sebanyak 40 soal (80%).

Berdasarkan sebaran data tentang daya pembeda butir soal ujian Akidah Akhlak yang digunakan sebagai ujian akhir madrasah ibtidaiyah di Kota Palangka Raya, hanya terdapat 3 butir soal yang memiliki kualifikasi daya pembeda butir soal yang baik. Ketiga soal tersebut adalah sebagai berikut:

Tabel 8

Daftar Soal Ujian Akidah Akhlak Yang Memiliki Daya Pembeda Butir Soal Yang Baik

No. Nomor

Soal BA BB BA/NA BB/NB D Keterangan

1 23 98 55 0.92 0.51 0.40 Sangat Baik

2 34 101 58 0.94 0.54 0.40 Sangat Baik

3 36 99 55 0.93 0.51 0.41 Sangat Baik

Dari tabel 8 di atas maka ketiga butir soal tersebut telah memenuhi kriteria minimal indeks daya pembeda butir soal yaitu sebesar 0,30. Hal ini dapat dibuktikan bahwa misalnya soal nomor 23 peserta kelompok atas lebih banyak menjawab benar dibandingkan dengan peserta kelompok bawah, begitu pula soal nomor 34 dan 36, peserta yang menjawab benar lebih banyak kelompok atas daripada peserta kelompok bawah sehingga menghasilkan indeks daya beda minimal 0.30.

3. Daya Pembeda Butir Soal Fiqih

Dari 50 soal ujian mata pelajaran Fiqih terdapat 2 soal (4%) yang memiliki daya pembeda cukup, daya pembeda soal kategori sangat baik dan baik tidak ditemukan, sedangkan soal yang daya pembedanya tidak baik sebanyak 48 soal (96%).

Berdasarkan analisis tentang daya pembeda butir soal ujian mata pelajaran Fiqih dari 50 soal yang diujikan ternyata tidak terdapat butir soal yang memenuhi kriteria minimal daya pembeda butir soal yang baik. Dengan demikian dapat dikatakan semua butir soal ujian mata pelajaran Fiqih yang digunakan di Madrasah Ibtidaiyah Kota

(17)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Palangka Raya tahun pelajaran 2010/2011 tidak memiliki daya pembeda soal yang baik. Artinya soal yang diujikan tidak dapat digunakan untuk membedakan kelompok peserta ujian yang memiliki kemampuan di atas dan kelompok peserta ujian yang memiliki kemampuan bawah.

4. Daya Pembeda Butir Soal Bahasa Arab

Berdasarkan hasil analisis daya pembeda butir soal ditemukan hanya 1 soal (2%) yang memiliki daya pembeda soal sangat baik, dan sisanya sebanyak 49 soal (98%) memiliki daya pembeda yang tidak baik.

Butir soal ujian Bahasa Arab berdasarkan sebaran hasil analisis tentang daya pembeda butir soal ternyata hanya ada 1 butir soal yang mmenuhi kriteria daya pembeda soal yang baik, yaitu soal nomor 1 dengan indeks daya beda sebesar = 0,44 kategori sangat baik. Sedangkan butir-butir soal yang lain tidak memiliki daya pembeda soal yang baik.

Dengan demikian maka soal ujian Bahasa Arab yang digunakan untuk ujian akhir Madrasah Ibtidaiyah di Kota Palangka Raya tahun pelajaran 2010/2011 belum memiliki daya pembeda soal yang baik. Artinya soal ujian tersebut belum dapat digunakan untuk membedakan peserta tes yang memiliki kemampuan tinggi dan peserta tes yang memiliki kemampuan rendah.

5. Daya Pembeda Butir Soal Sejarah Kebudayaan Islam

Hasil analisis mengenai daya pembeda butir soal ujian Sejarah Kebudayaan Islam ditemukan bahwa hanya ada 1 soal (2%) yang memiliki daya pembeda butir soal yang baik, kemudian 4 soal (8%) memiliki daya pembeda butir soal yang cukup, tidak ada soal yang memiliki kategori sangat baik daya pembedanya, serta ditemukan 45 soal (90%) memiliki daya pembeda butir soal tidak baik.

Berdasarkan analisis tersebut, maka soal ujian Sejarah Kebudayaan Islam yang memenuhi syarat atau memiliki daya pembeda soal yang baik hanya ada satu soal yaitu soal ujian nomor 21 dengan indeks daya beda sebesar = 0,31.

Dengan demikian soal ujian Fiqih di Madrasah Ibtidaiyah pada tahun pelajaran 2010/2011 belum memiliki daya pembeda butir soal yang baik.

C. Validitas Butir Soal Ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam

Guna menguji validitas butir soal ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam di Madrasah Ibtidaiyah peneliti menggunakan perhitungan statistik korelasi. Sehingga pengujian signifikansi korelasi dilakukan dengan membandingkan antara korelasi hitung (rXY) dengan r pada tabel. Hasil pengujian validitas

masing-masing soal ujian disajikan sebagai berikut:

1. Validitas Butir Soal Ujian Qur’an Hadits

Berdasarkan pengujian validitas butir soal ujian Qur’an Hadits diperoleh bahwa soal yang valid sebanyak 47 soal (94%) dan soal yang tidak valid sebanyak 3 soal (6%). Soal-soal yang valid tersebut adalah sebagai berikut:

(18)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Daftar Soal Ujian Qur’an Hadits Yang Valid

Nomor Nomor Soal

Indeks

Korelasi r Tabel Keterangan

1 2 0.223 0.098 Valid 2 4 0.231 0.098 Valid 3 5 0.121 0.098 Valid 4 6 0.108 0.098 Valid 5 7 0.250 0.098 Valid 6 8 0.259 0.098 Valid 7 9 0.273 0.098 Valid 8 10 0.260 0.098 Valid 9 11 0.288 0.098 Valid 10 12 0.265 0.098 Valid 11 13 0.254 0.098 Valid 12 14 0.256 0.098 Valid 13 15 0.147 0.098 Valid 14 16 0.337 0.098 Valid 15 17 0.212 0.098 Valid 16 18 0.219 0.098 Valid 17 19 0.244 0.098 Valid 18 20 0.196 0.098 Valid 19 21 0.265 0.098 Valid 20 22 0.152 0.098 Valid 21 23 0.175 0.098 Valid 22 24 0.319 0.098 Valid 23 25 0.259 0.098 Valid 24 26 0.175 0.098 Valid 25 27 0.152 0.098 Valid 26 28 0.172 0.098 Valid 27 29 0.323 0.098 Valid 28 30 0.243 0.098 Valid 29 31 0.271 0.098 Valid

(19)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 30 32 0.162 0.098 Valid 31 33 0.116 0.098 Valid 32 34 0.208 0.098 Valid 33 35 0.261 0.098 Valid 34 36 0.216 0.098 Valid 35 37 0.112 0.098 Valid 36 38 0.105 0.098 Valid 37 39 0.140 0.098 Valid 38 40 0.242 0.098 Valid 39 41 0.308 0.098 Valid 40 42 0.140 0.098 Valid 41 43 0.171 0.098 Valid 42 44 0.222 0.098 Valid 43 45 0.246 0.098 Valid 44 46 0.166 0.098 Valid 45 47 0.184 0.098 Valid 46 48 0.203 0.098 Valid 47 49 0.110 0.098 Valid

Butir-butir soal tersebut dikatakan valid karena besarnya indeks korelasi lebih besar dari nilai r korelasi pada tabel.

2. Validitas Butir Soal Ujian Akidah Akhlak

Melalui pengujian statistik korelasi product moment bahwa butir-butir soal ujian Akidah Akhlak yang valid sebanyak 29 soal (58%), dan soal yang tidak valid sebanyak 21 soal (42%). Butir soal Akidah Akhlak yang valid tersebut adalah sebagai berikut:

Tabel 10

Daftar Soal Ujian Akidah Akhlak Yang Valid

Nomor Nomor Soal

Indeks

(20)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 1 2 0.190 0.098 Valid 2 6 0.101 0.098 Valid 3 9 0.188 0.098 Valid 4 12 0.154 0.098 Valid 5 13 0.154 0.098 Valid 6 16 0.116 0.098 Valid 7 17 0.202 0.098 Valid 8 18 0.149 0.098 Valid 9 19 0.215 0.098 Valid 10 21 0.214 0.098 Valid 11 22 0.153 0.098 Valid 12 23 0.243 0.098 Valid 13 25 0.118 0.098 Valid 14 26 0.198 0.098 Valid 15 27 0.187 0.098 Valid 16 29 0.226 0.098 Valid 17 31 0.246 0.098 Valid 18 32 0.201 0.098 Valid 19 33 0.099 0.098 Valid 20 34 0.328 0.098 Valid 21 35 0.198 0.098 Valid 22 36 0.353 0.098 Valid 23 37 0.165 0.098 Valid 24 38 0.135 0.098 Valid 25 39 0.147 0.098 Valid 26 40 0.107 0.098 Valid 27 41 0.121 0.098 Valid 28 44 0.100 0.098 Valid 29 46 0.238 0.098 Valid

(21)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Berdasarkan pengujian bahwa butir soal ujian mata pelajaran Fiqih yang valid sebanyak 46 soal (92%) dan yang tidak valid sebanyak 4 soal (8%). Berikut disajikan soal-soal Fiqih yang valid dalam tabel di bawah ini.

Tabel 11

Daftar Soal Ujian Fiqih Yang Valid Nomor Nomor

Soal

Indeks

Korelasi r Tabel Keterangan

1 1 0.149 0.098 Valid 2 2 0.178 0.098 Valid 3 3 0.117 0.098 Valid 4 4 0.241 0.098 Valid 5 7 0.154 0.098 Valid 6 8 0.237 0.098 Valid 7 9 0.214 0.098 Valid 8 10 0.262 0.098 Valid 9 11 0.279 0.098 Valid 10 12 0.172 0.098 Valid 11 13 0.283 0.098 Valid 12 14 0.284 0.098 Valid 13 15 0.144 0.098 Valid 14 16 0.262 0.098 Valid 15 17 0.182 0.098 Valid 16 18 0.200 0.098 Valid 17 19 0.222 0.098 Valid 18 20 0.147 0.098 Valid 19 21 0.214 0.098 Valid 20 23 0.136 0.098 Valid 21 24 0.230 0.098 Valid 22 25 0.209 0.098 Valid 23 26 0.226 0.098 Valid 24 27 0.168 0.098 Valid 25 28 0.155 0.098 Valid 26 29 0.251 0.098 Valid

(22)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 27 30 0.214 0.098 Valid 28 31 0.252 0.098 Valid 29 32 0.151 0.098 Valid 30 33 0.129 0.098 Valid 31 34 0.125 0.098 Valid 32 35 0.206 0.098 Valid 33 36 0.226 0.098 Valid 34 37 0.165 0.098 Valid 35 39 0.103 0.098 Valid 36 40 0.207 0.098 Valid 37 41 0.294 0.098 Valid 38 42 0.173 0.098 Valid 39 43 0.102 0.098 Valid 40 44 0.197 0.098 Valid 41 45 0.190 0.098 Valid 42 46 0.152 0.098 Valid 43 47 0.174 0.098 Valid 44 48 0.180 0.098 Valid 45 49 0.114 0.098 Valid 46 50 0.129 0.098 Valid

4. Validitas Butir Soal Bahasa Arab

Butir soal ujian mata pelajaran Bahasa Arab yang valid adalah sebanyak 47 soal (94%) dan butir soal yang tidak valid sebanyak 3 soal (6%). Butir soal ujian Bahasa Arab yang valid dapat dilihat pada tabel berikut:

Tabel 12

Daftar Soal Ujian Bahasa Arab Yang Valid Nomor Nomor

Soal

Indeks

Korelasi r Tabel Keterangan

1 1 0.188 0.098 Valid

2 4 0.287 0.098 Valid

(23)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 4 6 0.106 0.098 Valid 5 7 0.199 0.098 Valid 6 8 0.185 0.098 Valid 7 9 0.168 0.098 Valid 8 10 0.226 0.098 Valid 9 11 0.235 0.098 Valid 10 12 0.129 0.098 Valid 11 4 0.287 0.098 Valid 12 5 0.131 0.098 Valid 13 13 0.205 0.098 Valid 14 14 0.181 0.098 Valid 15 15 0.177 0.098 Valid 16 16 0.263 0.098 Valid 17 17 0.166 0.098 Valid 18 18 0.232 0.098 Valid 19 19 0.199 0.098 Valid 20 20 0.230 0.098 Valid 21 21 0.179 0.098 Valid 22 23 0.129 0.098 Valid 23 24 0.236 0.098 Valid 24 25 0.188 0.098 Valid 25 26 0.224 0.098 Valid 26 27 0.226 0.098 Valid 27 28 0.166 0.098 Valid 28 29 0.259 0.098 Valid 29 30 0.286 0.098 Valid 30 31 0.241 0.098 Valid 31 32 0.288 0.098 Valid 32 33 0.168 0.098 Valid 33 34 0.260 0.098 Valid 34 35 0.159 0.098 Valid 35 36 0.150 0.098 Valid

(24)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 36 37 0.173 0.098 Valid 37 38 0.159 0.098 Valid 38 39 0.250 0.098 Valid 39 40 0.240 0.098 Valid 40 41 0.268 0.098 Valid 41 42 0.178 0.098 Valid 42 43 0.169 0.098 Valid 43 44 0.189 0.098 Valid 44 45 0.215 0.098 Valid 45 46 0.127 0.098 Valid 46 47 0.123 0.098 Valid 47 48 0.208 0.098 Valid

5. Validitas Butir Soal Sejarah Kebudayaan Islam

Butir soal Sejarah Kebudayaan Islam setelah diuji dengan korelasi product moment diperoleh bahwa butir soal yang valid adalah sebanyak 45 soal (90%) dan butir soal yang tidak valid sebanyak 5 soal (10%). Butir-butir soal Sejarah Kebudayaan Islam yang valid adalah sebagai berikut:

Tabel 12

Daftar Soal Ujian SKI Yang Valid Nomor Nomor

Soal

Indeks

Korelasi r Tabel Keterangan

1 1 0.137 0.098 Valid 2 2 0.206 0.098 Valid 3 3 0.163 0.098 Valid 4 4 0.203 0.098 Valid 5 7 0.195 0.098 Valid 6 8 0.271 0.098 Valid 7 9 0.250 0.098 Valid 8 10 0.306 0.098 Valid 9 11 0.328 0.098 Valid

(25)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 10 12 0.173 0.098 Valid 11 13 0.303 0.098 Valid 12 14 0.331 0.098 Valid 13 15 0.182 0.098 Valid 14 16 0.263 0.098 Valid 15 17 0.199 0.098 Valid 16 18 0.198 0.098 Valid 17 19 0.204 0.098 Valid 18 20 0.203 0.098 Valid 19 21 0.277 0.098 Valid 20 22 0.101 0.098 Valid 21 23 0.128 0.098 Valid 22 24 0.228 0.098 Valid 23 25 0.311 0.098 Valid 24 26 0.266 0.098 Valid 25 27 0.145 0.098 Valid 26 28 0.181 0.098 Valid 27 29 0.261 0.098 Valid 28 30 0.164 0.098 Valid 29 31 0.219 0.098 Valid 30 33 0.098 0.098 Valid 31 35 0.169 0.098 Valid 32 36 0.232 0.098 Valid 33 37 0.110 0.098 Valid 34 38 0.110 0.098 Valid 35 39 0.145 0.098 Valid 36 40 0.201 0.098 Valid 37 41 0.278 0.098 Valid 38 42 0.161 0.098 Valid 39 43 0.137 0.098 Valid 40 44 0.215 0.098 Valid 41 45 0.150 0.098 Valid

(26)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013

42 46 0.134 0.098 Valid

43 47 0.153 0.098 Valid

44 48 0.207 0.098 Valid

45 50 0.122 0.098 Valid

D. Reliabilitas Soal Ujian Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam

Guna menguji reliabilitas soal ujian mata pelajaran Qur’an Hadits, Akidah Akhlak, Fiqih, Bahasa Arab, dan Sejarah Kebudayaan Islam dalam penelitian ini menggunakan rumus KR-21. Rumus KR-21 ini digunakan karena sesuai dengan bentuk soal yang digunakan dalam ujian akhir madrasah ibtidaiyah yaitu pilihan ganda.

Hasil pengujian reliabilitas untuk masing-masing soal dapat dilihat sebagai berikut:

1. Relibilitas Soal Ujian Qur’an Hadits

Berdasarkan perhitungan data dengan menggunakan program Microsoft Excel diperoleh rata-rata skor total = 33,930, varians total = 21,567 dan Jumlah Butir = 50. Selanjutnya dimasukkan ke rumus KR-21 sebagai berikut:

𝑟11 = [ 50 50 − 1] [1 − 33,930(50 − 33,930) 50𝑥21,567 ] 𝑟11 = (1.020)(0,494) 𝑟11 = 0,504

Berdasarkan hasil perhitungan tersebut maka diperoleh r11 = 0,504

dibandingkan dengan r tabel = 0,098. Karena r hitung > r tabel maka soal ujian Qur’an Hadits di Madrasah Ibtidaiyah Kota Palangka Raya sudah reliabel.

2. Reliabilitas Soal Ujian Akidah Akhlak

Berdasarkan perhitungan bahwa untuk soal ujian Akidah Akhlak diperoleh rata-rata skor total = 41,327 dan varians total = 4,140, selanjutnya dimasukkan ke dalam rumus KR-21 untuk menentukan reliabilitas soal ujian Akidah Akhlak sebagai berikut: 𝑟11=[ 50 50 − 1] [1 − 41,327(50 − 41,327) 50𝑥4,140 ] 𝑟11 = (1,020)(−0,731) 𝑟11 = −0,746

Berdasarkan hasil perhitungan tersebut maka soal ujian Akidah Akhlak tidak reliabel. Karena nilai KR-21 sebesar -0,746 lebih kecil dari nilai r tabel = 0,098.

(27)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Berdasarkan perhitungan data bahwa soal ujian fiqih diperoleh rata-rata sebesar = 33,859 dan varians = 17,592 serta jumlah soal 50. Selanjutnya skor tersebut dimasukkan ke dalam rumus KR-21 sebagai berikut:

𝑟11 = [ 50 50 − 1] [1 − 33,859(50 − 33,859) 50𝑥 17,592 ] 𝑟11 = (1,020)(0,379) 𝑟11 = 0,386

Hasil perhitungan r11 = 0,386 tersebut selanjutnya dibandingkan dengan kriteria

reliabilitas yang telah ditetapkan yaitu 0,098, dengan demikian soal ujian fiqih sudah reliabel, karena r11 > r tabel.

4. Reliabilitas Soal Ujian Bahasa Arab

Berdasarkan perhitungan rata-rata skor total soal ujian Bahasa Arab diperoleh sebesar 30,799 dan varian total sebesar 20,761 serta jumlah soal 50. Selanjutnya skor tersebut dimasukkan ke dalam rumus KR-21 sebagai berikut:

𝑟11 = [ 50 50 − 1] [1 − 30,799(50 − 30,799) 50𝑥 20,761 ] 𝑟11 = (1,020)(0,430) 𝑟11 = 0,439

Hasil perhitungan tersebut selanjutnya dibandingkan dengan r tabel sebesar 0,098, maka soal ujian Bahasa Arab di MI Palangka Raya sudah reliabel.

5. Reliabilitas Soal Ujian Sejarah Kebudayaan Islam

Berdasarkan perhitungan rata-rata skor total soal ujian Bahasa Arab diperoleh sebesar 30,799 dan varian total sebesar 20,761 serta jumlah soal 50. Selanjutnya skor tersebut dimasukkan ke dalam rumus KR-21 sebagai berikut:

𝑟11 = [ 50 50 − 1] [1 − 33,61(50 − 33,61) 50𝑥 19,082 ] 𝑟11 = (1,020)(0,423) 𝑟11 = 0,431

Hasil perhitungan tersebut selanjutnya dibandingkan dengan r tabel sebesar 0,098, maka soal ujian Sejarah Kebudayaan Islam di MI Palangka Raya sudah reliabel.

KESIMPULAN

Berdasarkan hasil penelitian di atas, maka dapat disimpulkan bahwa:

1. Tingkat kesukaran soal ujian Qur’an Hadits yang memenuhi kriteria tingkat kesukaran butir soal yang baik adalah sebanyak 6 butir soal, yaitu soal nomor: 6, 18, 35, 36, 45 dan 49. Soal ujian Akidah Akhlak tidak memenuhi kriteria tingkat kesukaran butir soal yang baik. Soal ujian Fiqih terdapat 6 butir soal yang termasuk kriteria tingkat kesukaran butir soal yang baik yaitu nomor: 6, 18, 19, 23, 37, dan 49. Soal ujian Bahasa Arab terdapat 17 butir soal yang memenuhi kriteria tingkat kesukaran butir soal yang baik, yaitu nomor:

(28)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 5, 6, 16, 18, 19, 26, 28, 30, 31, 32, 35, 36, 37, 41, 45, 49, dan 50. Sedangkan soal ujian Sejarah Kebudayaan Islam yang memenuhi kriteria tingkat kesukaran butir soal yang baik adalah sebanyak 4 butir soal yaitu nomor: 18, 19, 23 dan 49.

2. Daya Pembeda soal ujian Qur’an Hadits yang memenuhi kriteria adalah sebanyak 11 butir soal yaitu soal nomor: 12, 13, 14, 16, 19, 24, 29, 31, 35, 41, dan 45. Daya pembeda soal ujian Akidah Akhlak yang memenuhi kriteria daya pembeda soal yang baik sebanyak 3 soal yaitu nomor: 23, 34, dan 36. Soal ujian Fiqih yang digunakan ujian akhir Madrasah Ibtidaiyah di Kota Palangka Raya tidak memiliki daya pembeda yang baik. Daya pembeda soal ujian Bahasa Arab hanya terdapat 1 butir soal yang memiliki daya pembeda baik yaitu soal nomor 1. Demikian pula dengan daya pembeda soal ujian SKI hanya terdapat 1 soal yang memiliki kriteria daya pembeda soal yang baik yaitu soal nomor 21.

3. Validitas butir soal ujian Qur’an Hadits dari 50 soal yang diujikan terdapat 47 butir soal yang valid dan 3 butir soal yang tidak valid. Soal ujian Akidah Akhlak dari 50 soal terdapat 29 butir soal yang valid dan 21 soal tidak valid. Validitas butir soal ujian Fiqih dari 50 soal yang diujikan terdapat 46 butir soal yang valid dan 4 soal tidak valid. Untuk soal ujian Bahasa Arab terdapat 47 butir soal yang valid dan 3 butir soal yang tidak valid. Sedangkan soal Sejarah Kebudayaan Islam ditemukan 45 butir soal yang valid dan 5 soal tidak valid.

4. Reliabilitas tes ujian akhir Madrasah Ibtidaiyah tahun pelajaran 2010/2011 di Kota Palangka Raya, untuk soal ujian Qur’an hadits diperoleh indeks korelasi sebesar 0,504 kategori reliabel. Soal ujian Akidah Akhlak diperoleh indeks korelasi sebesar -0,746 < dari rtabel=0,098 maka tidak reliabel. Soal ujian Fiqih diperoleh indeks korelasi sebesar

0,386 > rtabel = 0,098 kategori reliabel. Soal ujian Bahasa Arab diperoleh indeks korelasi

sebesar 0,439 > 0,098 kategori reliabel. Soal ujian Sejarah Kebudayaan Islam diperoleh indeks korelasi sebesar 0,431 > 0,098 kategori reliabel

DAFTAR PUSTAKA

Adi Suryanto, dkk, 2009, Evaluasi Pembelajaran di SD, Jakarta: Universitas Terbuka.

Allen, M.J. and Yen, W. 1979, Introduction to Measurement Theory. Monterey: Brooks/Cole Publishing Company.

Asmawi Zainul dan Noehi Nasution, 2001, Penilaian Hasil Belajar, Direktorat Jenderal Pendidikan Tinggi Departemen Pendidikan Nasional, Jakarta: PAU-PPAI-UT, Burhan Bungin, 2006, Metodologi Penelitian Kuantitatif Komunikasi, ekonomi, dan

Kebijakan Publik Serta Ilmu-Ilmu Sosial Lainnya, Jakarta:Kencana Prenada Media

Group.

Cronbach, L.J, 1984, Essentials of Psychologycal Testing, New York: Harper & Row, Publisher. Icn.

Djemari Mardapi, 2004, Tes Hasil Belajar, Universitas Negeri Yogyakarta.

Robert L Ebel, Essentials of Educational Measurement Third Edition, New Jersey: Prentice-Hall Inc, Englewood Cliffs, 1979

(29)

Jurnal Studi Agama dan Masyarakat Volume 7, Nomor 2, Desember 2013 Gito Supriadi, 2007, Analisis Butir Soal Ujian Semester Mata Pelajaran SKI di MAN

Yogyakarta.

Ngalim Purwanto, 2000, Prinsip-Prinsip dan Teknik Evaluasi Pengajaran, PT. Remaja Rosdakarya, Bandung.

Saifudin Azwar, 2005, Tes prestasi : Fungsi dan Pengembangan Pengukuran Prestasi

Belajar. Yogyakarta: Pustaka Pelajar Offset.

Suharsimi Arikunto, 1999, Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi), Bumi Aksara, Jakarta.

Sumarna Surapranata, 2005, Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes, Bandung: Remaja Rosdakarya.

Gambar

Tabel 1 : Kategori Tingkat Kesukaran
Tabel 2: Indeks Daya Pembeda Soal 14 Nilai D  Kategori  Keterangan  D ≥ 0,40  Sangat baik  Diterima  0,30 ≤ D ≤ 0,39  Baik  Perlu peningkatan  0,20 ≤ D ≤ 0,29  Cukup   Revisi

Referensi

Dokumen terkait

Subhan Makmun (Pengasuh Pondok Pesantyren As-Salafiyyah). Dalam acara pengajian tersebut KH. Subhan Makmun melakukan dakwah sesuai dengan tuntutan Islam dan mendorong

Dilihat dari kinerja bank secara keseluruhan yang diwakili oleh variabel “Kinerja” terdapat perbedaan yang signifikan antara kinerja perbankan syariah dibandingkan dengan

PEMBUATAN MEDIA ANIMASI JALANNYA SINAR PADA CERMIN LENSA DALAM OPTIKA GEOMETRI TINGKAT SEKOLAH MENENGAH ATAS MELALUI PROGRAM

Berdasarkan hasil sidik ragam perlakuan varietas berpengaruh nyata terhadap variabel pertambahan tinggi tanaman umur 15, 30, 45, 60 hst dan saat panen; umur berbunga, jumlah

(1) Berdasarkan SPdORD sebagaimana dimaksud dalam pasal 11 ayat 1 ditetapkan retribusi terutang dengan menerbitkan SKRD atau dokumen lain yang dipersamakan.. (2) Apabila

penelitian ini adalah untuk membuktikan bahwa dengan perlakuan perendaman dalam air dingin , perebusan atau pengukusan pada kayu karet dapat mengurangi kadar pati,

rahmatNya penulis dapat menyelesaikan skripsi ini dengan judul penelitian “ PENENTUAN UMUR SIMPAN DAN KARAKTERISTIK SIMPLISIA DAN SERBUK KUNYIT ( Curcuma domestica

Berdasarkan data hasil penelitian diketahui bahwa pemberian metil prednisolon injeksi pada penderita demam berdarah di Rumah Sakit Wijaya Kusuma Lumajang tidak