• Tidak ada hasil yang ditemukan

Landasan Teori

BAB I PENDAHULUAN

E. Landasan Teori

1. Pengertian Evaluasi dan Evaluasi Pendidikan

Evaluasi secara harfiah berarti evaluation (inggris); al-taqdiir (Arab); penilaian (Indonesia). Akar kata evaluasi yaitu value (Inggris);

al-pendidikan (educational evaluation; al-taqdiir al-tarbawi) yaitu dapat diartikan sebagai penilaian dalam (bidang) pendidikan atau penilaian mengenai hal-hal yang berkaitan dengan kegiatan pendidikan. Menurut istilah maka evaluasi pendidikan adalah kegiatan atau proses penentuan nilai pendidikan, sehingga dapat diketahui mutu atau hasil-hasilnya.4 2. Fungsi dan Tujuan Evaluasi Pendidikan

Secara umum, evaluasi sebagai suatu tindakan atau proses setidaknya mempunyai 3 fungsi pokok yaitu mengukur kemajuan, menunjang penyusunan rencana, dan memperbaiki atau melakukan penyempurnaan kembali.

Secara khusus evaluasi memiliki 3 fungsi yaitu dari segi psikologi, didaktik, dan administratif.

Secara psikologis dapat disoroti dari dua sisi yaitu dari peserta didik dan pendidik. Bagi peserta didik evaluasi pendidikan akan memberikan pedoman atau pegangan batin kepada mereka untuk mengenal kapasitas dan status dirinya masing-masing di tengah-tengah kelompok atau kelasnya. Bagi pendidik akan memberikan kepastian atau ketetapan hati kepada diri pendidik tersebut, sudah sejauh manakah kiranya usaha yang telah dilakukannya selama ini telah membawa hasil, sehingga ia secara psikologis memiliki pedoman atau pegangan batin yang pasti guna menentukan langkah-langkah apa saja yang dipandang perlu dilakukan selanjutnya.

4

Fungsi didaktik bagi peserta didik yaitu evaluasi pendidikan akan dapat memberikan dorongan kepada mereka untuk dapat meningkatkan prestasinya. Bagi pendidik setidaknya mempunyai lima fungsi yaitu memberi landasan untuk menilai hasil usaha (prestasi) yang telah dicapai oleh peserta didiknya., memberikan informasi yang sangat berguna untuk mengetahui posisi masing-masing peserta didik di tengah-tengah kelompoknya, memberikan bahan yang penting untuk memilih kemudian menentukan status peserta didik, memberikan pedoman untuk mencari dan menemukan jalan keluar bagi peserta didik yang memang memerlukannya, dan memberikan petunjuk tentang sudah sejauh manakah program pengajaran yang telah ditentukan telah dapat dicapai.

Adapun secara administratif evaluasi pendidikan setidak-tidaknya mempunyai tiga fungsi yaitu memberikan laporan, memberikan bahan-bahan keterangan (data), dan memberikan gambaran.

Tujuan evaluasi pendidikan yaitu secara umum untuk menghimpun bahan-bahan keterangan yang akan dijadikan sebagai bukti mengenai taraf perkembangan atau taraf kemajuan yang dialami oleh peserta didik setelah mengikuti proses pembelajaran dalam waktu tertentu dan untuk mengetahui efektifitas dari metode-metode pengajaran yang telah digunakan dalam proses pembelajaran dalam waktu tertentu.

Adapun tujuan evaluasi pendidikan secara khusus yaitu untuk merangsang kegiatan peserta didik dalam menempuh program pendidikan

dan ketidakberhasilan peserta didik dalam mengikuti program pendidikan, sehingga dapat dicari dan ditemukan jalan keluar atau cara-cara perbaikannya.5

3. Prinsip-prinsip Dasar Tes Hasil Belajar

Ada banyak prinsip dasar yang digunakan dalam membuat tes hasil belajar agar tes tersebut dapat mengukur tujuan intruksional khusus untuk mata pelajaran yang telah diajarkan atau mengukur kemampuan peserta didik yang diharapkan setelah mereka menyelesaikan unit pembelajaran. Prinsip-prinsip tersebut diantaranya yaitu tes hasil belajar harus dapat mengukur secara jelas hasil belajar (learning outcomes) yang telah ditetapkan sesuai dengan tujuan intruksional, butir-butir soal tes hasil belajar harus merupakan sampel yang representatif dari populasi bahan pelajaran yang telah diajarkan, sehingga dapat dianggap mewakili seluruh performance yang telah diperoleh selama peserta didik mengikuti suatu unit pembelajaran, bentuk soal harus bervariasi, butir soal harus didesain sesuai kebutuhan yang diinginkan, butir soal harus mempunyai reliabilitas yang diandalkan dan tes hasil belajar harus dapat dijadikan alat mencari informasi yang berguna untuk memperbaiki cara belajar siswa dan mengajar guru.6

4. Ciri-ciri Tes Hasil belajar Yang Baik

5

Ada lima ciri tes hasil belajar yang baik diantaranya yaitu validitas, reliabilitas, objektivitas,praktikabilitas, dan ekonomis.7

Sebuah tes dikatakan sudah valid jika tes tersebut dengan secara tepat, absah, shahih dan benar dapat mengukur apa yang seharusnya diukur. Suatu tes dapat dikatakan sudah memiliki reliabilitas jika skor-skor atau nilai-nilai yang diperoleh para peserta ujian untuk pekerjaan ujiannya adalah stabil, kapan saja, dimana saja, dan oleh siapa saja ujian itu dilaksanakan, diperiksa, dan dinilai.

Tes hasil belajar dikatakan objektif jika disusun dan dilaksanakan secara wajar apa adanya. Kemudian, tes dikatakan praktis jika tes tersebut dapat dilaksanakan dengan mudah karena tes tersebut bersifat sederhana tidak memerlukan peralatan yang banyak dan tes tersebut dilengkapi petunjuk mengenai cara pengerjaannya, kunci jawabannya, dan pedoman penilaiannya.

Tes dikatakan ekonomis jika pelaksanaan tes tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga yang banyak dan waktu yang lama.

Tes hasil belajar yang baik juga harus memiliki derajat kesukarean item, daya pembeda item, dan fungsi pengecoh yang baik. Selain itu, juga tercapainya kompetensi yang diharapkan.

Alat evaluasi dalam pendidikan di sekolah yaitu tes. Tes yang dilakukan di sekolah, khususnya di suatu kelas memiliki fungsi untuk mengukur kemampuan siswa dan untuk mengukur keberhasilan program pengajaran. Penilaian Ulangan Akhir Semester di SMA dilaksanakan pada akhir program selama satu semester yang disebut Ulangan Akhir Semester digunakan untuk mengukur tingkat penguasaan hasil belajar siswa. Bahan pertanyaan bersumber dari Standar Kompetensi dan Kompetensi Dasar tiap materi yang dituangkan dalam pertanyaan tes yang pada umumnya dibuat dalam bentuk obyektif (pilihan ganda) dan essay.

Pemanfaatan data hasil penilaian Ulangan Akhir Semester (UAS) sangat bermanfaat bagi Guru, Kepala Sekolah dan supervisor pendidikan dalam rangka memperbaiki pembinaan pendidikan di sekolah dalam hal perencanaan, pelaksanaan atau penyelenggaraan, dan dalam penilaian, pengawasan, atau penentuan proses hasil pendidikan.

Dari uraian di atas dapat disimpulkan bahwa Ulangan Akhir Semester yang merupakan salah satu bentuk alat evaluasi yang akan digunakan guna mengambil keputusan. Dari urutan yang logis ini dapat diketahui bahwa keputusan yang diambil akan tepat mengenai sasaran apabila didukung oleh alat evaluasi yang berupa butir soal Ulangan Akhir Semester yang memenuhi syarat validitas, reliabilitas, derajat kesukaran item, daya pembeda item, fungsi pengecoh dan kesesuaian dengan kompetensi. Untuk mengetahui bahwa butir soal Ulangan Akhir Semester

telah memenuhi syarat validitas, reliabilitas, derajat kesukaran item, daya pembeda item, fungsi pengecoh dan kesesuaian dengan kompetensi. 6. Evaluasi Hasil Belajar Pendidikan Agama Islam

Evaluasi Pendidikan Agama Islam adalah kegiatan atau proses penentuan nilai pendidikan agama Islam, sehingga dapat diketahui mutu atau hasil-hasilnya.

Fungsi, tujuan, prinsip-prinsip dasar tes hasil belajar, ciri-ciri-tes hasil belajar yang baik, dan analisis tesnya sama dengan teori-teori fungsi, tujuan, prinsip-prinsip dasar tes hasil belajar, ciri-ciri-tes hasil belajar yang baik, dan anilisis tes hasil belajar secara umum hanya disini lebih ditekankan pada Pendidikan Agama Islam.

7. Analisis Kualitas Butir Soal

Analisis kualitas butir soal yaitu salah satu kegiatan yang penting untuk dilaksanakan dalam rangka memperbaiki mutu suatu soal, baik mutu keseluruhan soal atau mutu tiap butir soal. Soal tes sebagai alat evaluasi diharapkan dapat memberikan nilai atau skor yang objektif dan akurat. Oleh karena itu perlu memperhatikan prinsip-prinsip dasar pembuatan soal dan perlu mengetahui ciri-ciri soal yang baik. Soal tes yang baik dapat dimasukkan dalam bank soal atau kumpulan soal sedangkan yang buruk sebaiknya tidak dipakai lagi. Analisis soal tes dilakukan untuk mengetahui baik buruknya suatu soal tes. Analisis soal tes yang dilakukan dalam penelitian ini meliputi analisis validitas, reliabilitas, derajat kesukaran

item, daya pembeda item, fungsi pengecoh dan kesesuaian dengan standar kompetensi serta kompetensi dasarnya.

Dari uraian mengenai kriteria evaluasi yang baik, kita dapat mengetahui bagaimanakah kualitas dari soal Ulangan Akhir Semester genap mata pelajaran Pendidikan Agama Islam kelas X yang diujikan di SMA Negeri 2 Kebumen Tahun Ajaran 2010-2011. Melalui analisis butir soal ini kita dapat mengidentifikasi butir-butir soal yang tidak baik, sehingga mendapatkan informasi yang dapat dipakai untuk memperbaiki soal-soal pada kesempatan berikutnya. Melalui analisis kualitas butir soal ini diharapkan guru semakin memahami bagaimana bentuk soal yang baik dan bagaimana butir soal yang baik sehingga guru semakin pandai menyusun soal dengan baik.

8. Uji Kualitas Butir Soal

Uji kualitas butir soal meliputi beberapa hal yaitu : a. Uji Validitas

Teknik pengujian yang dilakukan disini yaitu teknik pengujian validitas item hasil belajar. Yang dimaksud validitas item dari suatu tes yaitu ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian yang tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.8

8

Hubungan erat antara butir item dengan tes hasil belajar sangat erat, semakin banyak butir-butir item yang dapat dijawab dengan betul oleh testee, maka skor-skor total hasil tes tersebut akan semakin tinggi.

Sebutir item dapat dikatakan telah memiliki validitas yang tinggi atau dapat dinyatakan valid, jika skor-skor pada butir item memiliki kesesuaian dengan skor total. Hal itu juga dapat dikatakan ada korelasi positif yang signifikan antara skor item dengan skor totalnya. Skor total sebagai variabel terikat dan skor item berkedudukan sebagai variabel bebas. Dari hal tersebut, maka item-item yang ingin diketahui validitasnya kita dapat menggunakan teknik korelasi sebagai teknik analisisnya. Sebutir item dapat dikatakan valid jika mempunyai korelasi positif yang signifikan dengan skor totalnya.

Tahap selanjutnya yaitu menentukan jenis teknik korelasi yang dipandang tepat untuk digunakan dalam pengujian item tersebut. Dalam soal objektif maka kemungkinan jawaban soalnya yaitu benar dan salah. Setiap butir yang benar maka skornya 1 (satu) dan yang salah maka skornya 0 (nol). Hal itu biasanya disebut dengan data dikotomik. Skor total yang dimiliki oleh setiap testee yaitu penjumlahan skor dari setiap item.

Soal dikatakan valid jika memiliki indeks validitas lebih besar dari 0,30. Jika indeks validitas kurang dari 0,30 maka soal dikatakan bukan sebagai tes yang valid.9

Jika berdasarkan klasifikasi J.P.Guilford bahwa besarnya product moment 0,00-0,20 diinterpretasikan tingkat validitas tes adalah sangat lemah, 0,20-0,40 tingkat validitas tes adalah lemah atau rendah, 0,40-0,70 tingkat validitas tes adalah sedang atau cukup, 0,70-0,90 tingkat validitas tes adalah kuat atau tinggi, dan 0,70-0,90-1,00 tingkat validitas tes adalah sangat kuat atau sangat tinggi.10

b. Reliabilitas

Dalam rangka menentukan apakah soal Ulangan Akhir Semester genap mata pelajaran Pendidikan Agama Islam kelas X yang diujikan di SMA Negeri 2 Kebumen Tahun Ajaran 2010-2011 telah memiliki daya keajegan mengukur atau reliabilitas yang tinggi atau belum. Soal yang baik jika dilakukan beberapa kali pengujian maka hasilnya relatif sama.

Soal dikatakan memiliki reliabilitas yang tinggi jika koefisien reliabilitas tes yang sedang diuji reliabilitasnya sama dengan atau lebih dari 0,70. Apabila lebih kecil dari 0,70 berarti tes yang sedang

9

Saifudin Azwar. Metode Penelitian. (Yogyakarta: Pustaka Pelajar. 2004), Hlm. 179 10

diuji reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi (un-reliable).11

c. Derajat Kesukaran

Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat diketahui dari derajat kesukaran atau taraf kesulitan yang dimiliki oleh masing-masing butir item tersebut. Butir-butir item yang baik jika derajat kesukaran itemnya sedang.12

Angka indeks kesukaran item itu besarnya berkisar antara 0,00 sampai 0,30 artinya soal terlalu sukar, jika antara 0,30-0,70 berarti cukup atau sedang, dan jika lebih dari 0,70 maka diartikan soal terlalu mudah.13

d. Daya Pembeda Item

Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi (pandai) dengan testee yang berkemampuan rendah (bodoh) demikian rupa sehingga sebagian besar testee yang memiliki kemampuan tinggi untuk menjawab butir item tersebut lebih banyak yang menjawab betul, sementara testee yang memiliki kemampuan rendah untuk menjawab butir item tersebut sebagian besar tidak dapt menjawab item dengan betul.

11

Mengetahui daya pembeda item itu penting sekali, sebab salah satu dasar yang dipegangi untuk menyusun butir-butir item tes hasil belajar adalah adanya anggapan, bahwa kemampuan antara testee yang satu dengan testee yang lain itu berbeda-beda, dan bahwa butir-butir item tes hasil belajar itu haruslah mampu memberikan hasil tes yang mencerminkan adanya perbedaan-perbedaan kemampuan yang terdapat di kalangan testee tersebut.

Sejalan dengan pernyataan di atas maka kegiatan analisis terhadap daya pembeda item itu ditujukan untuk menjawab pertanyaan: ”Apakah testee yang kita anggap pandai jawabannya pada umumnya betul dan apakah testee yang kita anggap bodoh pada umumnya salah ?” Jika jawaban atas item tersebut ”ya ”, maka butir item yang bersangkutan dapat kita anggap sebagai butir item yang baik, dala arti bahwa butir item tersebut telah menunjukkan kemampuannya di dalam membedakan antara testee yang termasuk dalam kategori pandai dengan testee yang termasuk dalam kategori bodoh. Sebaliknya jika jawaban atas pertanyaan itu ”tidak” (yaitu diperoleh kenyataan bahwa testee yang kita anggap memiliki kemampuan yang tinggi justru lebih banyak yang menjawab salah terhadap butir item yang bersangkutan, sedangkan testee yang kita anggap sebagai testee yang berkemampuan rendah justru banyak yang menjawab butir item dengan betul) maka butir item yang bersangkutan dapat kita nyatakan sebagai butir item jelek, sebab hasil

yang dicapai dalam tes itu justru bertentangan atau berlawanan arah dengan tujuan tes itu sendiri.14

Angka indeks diskriminasi item jika kurang dari 0,20 maka soal termasuk poor sehingga butir item yang bersangkutan daya pembedanya sangat lemah (jelek) dan dianggap tidak memiliki daya pembeda yang baik. Jika angka indeks diskriminasi berkisar antara 0,20 sampai 0, 40 maka soal termasuk kategori satisfactory dimana butir item yang bersangkutan telah memiliki daya pembeda yang cukup. Jika angka indeks diskriminasi berkisar antara 0,40 sampai 0, 70 maka soal termasuk kategori good dimana butir item yang bersangkutan telah memiliki daya pembeda item yang baik. Skor indeks diskriminasi item berkisar antara 0,70 sampai 1,00 maka soal termasuk kategori excellent dimana butir item yang bersangkutan telah memiliki daya pembeda item yang baik sekali.Sedangkan jika indeks diskriminasi item yang negatif maka daya pembeda itemnya sangat jelek.15

e. Fungsi Pengecoh

Dalam multiple choice maka kita sering mendengar istilah option atau alternatif. Option atau alternatif tersebut jumlahnya antara tiga sampai lima buah dan ada kemungkinan jawaban yang terpasang didalam pilihan tersebut, salah satunya merupakan jawaban yang betul

sedangkan yang lain bertindak sebagai jawaban yang salah. Jawaban yang salah tersebut dikenal dengan istilah pengecoh atau distraktor.

Tujuan utama dari pemasangan pengecoh yaitu agar testee tertarik memilihnya, sehingga menjadikan testee terkecoh. Distraktor yang baik jika memiliki daya tarik luar biasa yang menyebabkan testee merasa benar jika memilihnya padahal kenyataannya salah. Distraktor dikatakan baik jika sekurang-kurangnya dipilih oleh 5% dari seluruh peserta tes.

f. Pencapaian Kompetensi

Untuk mengetahui apakah soal tersebut dapat mengukur kompetensi dasar dalam standar kompetensi yang diharapkan tercapai oleh siswa pada semester tersebut, maka dilakukan analisis validitas isi. Sebuah tes memiliki validitas isi jika tes tersebut mengukur indikator tertentu yang sejajar dengan kompetensi dasar yang diberikan. Alat tes yang dianggap layak serta dapat dipertanggungjawabkan validitas isinya apabila berdasarkan pada tabel kisi-kisi pembuatan soal. Adapun validitas isi sendiri merujuk pada kesesuaian antara butir-butir soal dengan indikatornya (standar kompetensi lulusan yang diharapkan tercapai oleh siswa). Pada dasarnya standar kompetensi lulusan terdapat pada tabel kisi-kisi sehingga tidak salah apabila dikatakan bahwa penyusunan butir-butir soal yang berdasarkan pada tabel kisi-kisi pembuatan soal dianggap layak dan dapat dipertanggungjawabkan validitas isinya. Sehingga

dapat dikatakan bahwa tes disusun sesuai dengan standar kompetensi dan kompetensi dasar yang ada di dalam kurikulum.

Analisis pencapaian kompetensi ini merupakan analisis secara kualitatif, yang dapat dilakukan dengan mencocokkan tiap butir soal dengan standar kompetensi yang ada dalam kurikulum Pendidikan Agama Islam. Apabila soal tersebut standar kompetensinya telah sesuai dengan kurikulum maka soal tersebut tergolong baik dan layak diujikan, apabila tidak sesuai dengan kurikulum sebaiknya jangan diujikan.

Adapun perlunya dilakukan analisis pencapaian kompetensi ini adalah untuk mengetahui apakah kisi-kisi penulisan soal Ulangan Akhir Semester genap mata pelajaran Pendidikan Agama Islam kelas X yang diujikan di SMA Negeri 2 Kebumen Tahun Ajaran 2010-2011 sesuai dengan kompetensi yang diharapkan tercapai.

F. Metode Penelitian

Dokumen terkait