• Tidak ada hasil yang ditemukan

BAB II LANDASAN TEORI

A. Kajian Teori

1. Teori-teori yang Mendukung

Evaluasi merupakan proses yang menentukan, apakah suatu tujuan yang telah disepakati dapat tercapai (Sukardi, 2008: 1). Evaluasi pembelajaran adalah inti pembahasan evaluasi yang kegiatannya dalam lingkup kelas atau proses belajar mengajar (Sukardi, 2008: 5). Evaluasi perlu dilakukan dalam rangka untuk mengendalikan mutu pendidikan (UU RI No 20 Tahun 2003 pasal 57 ayat 1), evaluasi hasil belajar peserta didik juga dilakukan untuk memantau kemajuan dan perbaikan hasil belajar peserta didik secara berkesinambungan (UU RI No 20 Tahun 2003 pasal 58 ayat 1). Berdasarkan definisi diatas dapat disimpulkan bahwa evaluasi sangat berguna bagi dunia pendidikan guna meningkatkan mutu pendidikan kita dengan melihat hasil belajar peserta didiknya.

Evaluasi berhubungan dengan penilaian, hal ini sesuai dengan pernyataan Gabel (1993) (dalam Majid, 2014: 38) bahwa evaluasi adalah proses pemberian penilaian terhadap suatu data atau hasil yang diperoleh melalui penilaian.

12

Groundlund (1984) (dalam Jihad & Haris, 2012: 54) menyatakan penilaian sebagai proses sistematik pengumpulan, penganalisisan dan penafsiran informasi untuk menentukan sejauh mana siswa dapat mencapai tujuan. Adapun tujuan dari evaluasi (Sukardi, 2008: 8) :

1) Menilai ketercapaian tujuan

Tujuan belajar, metode evaluasi, dan cara belajar siswa, ketiga aspek tersebut saling berkaitan. Cara evaluasi dapat menentukan cara belajar siswa, dan tujuan evaluasi akan menentukan metode evaluasi yang akan digunakan oleh guru.

2) Mengukur macam-macam aspek belajar yang bervariasi

Aspek belajar ada tiga macam yaitu kognitif, psikomotor, dan afektif. Semua aspek tersebut harus dievaluasi dalam porsi yang tepat.

3) Sebagai sarana untuk mengetahui apa yang siswa telah ketahui

Kebutuhan siswa harus diperhatikan seperti kekuatan, kelemahan, dan minat siswa, sehingga siswa mampu termotivasi untuk belajar berdasarkan pada minat dan kebutuhan mereka.

4) Memotivasi belajar siswa

Guru harus menguasai bermacam-macam teknik motivasi, agar guru dapat membangkitkan semangat siswa untuk tekun belajar secara kontinu.

13

5) Menyediakan informasi untuk tujuan bimbingan dan konseling

Guru dapat menyediakan informasi yang berkaitan dengan problem pribadi seperti data kemampuan, kualitas pribadi, adaptasi sosial, kemampuan membaca, dan skor hasil belajar, apabila informasi tersebut dibutuhkan untuk bimbingan dan konseling yang efektif. Infomasi tersebut juga diperlukan untuk bimbingan karier.

6) Menjadikan hasil evaluasi sebagai dasar perubahan kurikulum

Evaluasi merupakan salah satu bagian dari instruksional. Instruksional juga berkaitan erat dengan kurikulum, sebagai salah komponen penting dalam suatu kurikulum. Perubahan kurikulum akan berubah dengan tepat sesuai dengan hasil evaluasi dengan skop yang lebih luas.

b. Instrumen Penilaian

Penyusunan instrumen tes dimaksud untuk mengukur sejauh mana siswa mampu memahami materi suatu pokok bahasan yang telah disampaikan. Penyusunan instrumen dibagi menjadi (Jihad & Haris, 2012: 67):

1) Tes

Tes merupakan himpunan pertanyaan yang harus dijawab, dikerjakan, harus ditanggapi, atau tugas yang harus dilaksanakan oleh seseorang yang dites. Tes berguna untuk mengukur sejauh mana siswa mampu menguasai pelajaran yang disampaikan. Alat penilaian teknik tes, yaitu:

14 a) Tes tertulis

Tes tertulis merupakan tes yang harus dijawab oleh siswa secara tertulis.

b) Tes lisan

Tes lisan adalah suatu tes berupa pertanyaan yang diberikan kepada siswa secara tanya-jawab.

c) Tes perbuatan

Tes perbuatan adalah tugas yang berupa kegiatan praktek atau melakukan kegiatan guna mengukur keterampilan seseorang.

Adapun ciri-ciri butir soal yang baik sebagai alat ukur (Arikunto, 2012: 72-77):

i. Validitas

Suatu tes dikatakan valid apabila sesuai dengan keadaan senyatanya. Validitas adalah sebuah ketepatan.

ii. Reliabilitas

Suatu tes dapat dikatakan reliabel apabila memberikan hasil yang sama ketika diujikan berulang kali. Reliabilitas adalah sebuah ketetapan.

15 iii. Objektivitas

Sebuah tes dikatakan memiliki objektivitas apabila saat penilaiannya tidak ada faktor subjektif (terdapat unsur pribadi yang mempengaruhi dalam penilaian).

iv. Praktikabilitas

Sebuah tes dikatakan praktikabilitas apabila tes tersebut bersifat praktis, mudah pengadministrasiannya.

v. Ekonomis

Ekonomis dimaksudkan bahwa pelaksanaan sebuah tes sebaiknya tidak membutuhkan biaya yang mahal, memerlukan banyak tenaga, dan waktu yang lama.

2) Non tes

Penilaian non tes merupakan prosedur yang dilakukan untuk memperoleh informasi mengenai karakteristik minat, sifat, dan kepribadian. Penilaian non tes dapat dilakukan melalui:

a) Pengamatan

Pengamatan adalah alat penilaian yang dilakukan oleh guru berdasarkan pada pengamatan terhadap perilaku siswa, baik secara individu maupun kelompok, di dalam kelas maupun di luar kelas.

16 b) Skala sikap

Skala sikap merupakan alat penilaian yang digunakan untuk memperoleh informasi tentang sikap siswa melalui pengerjaan tugas tertulis yang bersifat mengukur daya nalar dan pendapat siswa.

c) Angket

Angket adalah alat penilaian yang menyajikan tugas-tugas dengan cara tertulis.

d) Catatan harian

Catatan harian adalah catatan berisi tentang perkembangan sikap siswa.

e) Daftar cek

Daftar cek adalah daftar yang digunakan untuk mengecek atau memeriksa apakah perilaku siswa sudah sesuai dengan yang diharapkan atau belum.

c. Tes Prestasi

Tes dalam pendidikan adalah alat atau metode penilaian yang sah, sistematis, dapat dipercaya, dan objektif untuk menentukan kecakapan, keterampilan, dan tingkat pengetahuan siswa terhadap bahan ajar, berupa sejumlah soal yang harus dikerjakan atau diselesaikan oleh siswa atau sekelompok siswa (Basuki & Hariyanto, 2014: 22). Majid (2014: 37) mengungkapkan tes adalah seperangkat alat yang berisi sejumlah pertanyaan yang harus dijawab oleh siswa untuk

17

mengukur tingkat pemahaman dan penguasaannya dalam sebuah materi yang dipersyaratkan dan sesuai dengan tujuan pembelajaran. Tes merupakan suatu alat pengumpul informasi, tes lebih bersifat resmi karena penuh dengan batasan, tes berfungsi untuk mengukur siswa dan keberhasilan program pembelajaran (Arikunto, 2012: 47). Berdasarkan ketiga pendapat tersebut dapat dilihat bahwa ketiganya mengungkapkan hal yang sama yaitu tes merupakan serangkaian alat pengukur yang berisi pertanyaan untuk mengukur kemampuan siswa dalam memahami dan menguasai suatu cakupan materi sesuai dengan tujuan pembelajaran. Tes juga merupakan alat pengukur yang bersifat resmi, sah, dapat dipercayai dan objektif.

Tes sebagai pengukur prestasi atau tes prestasi belajar bertujuan untuk mengukur prestasi untuk mengukur prestasi atau hasil belajar siswa (Azwar, 2015 a: 13). Gronlund (dalam Azwar, 2015 a: 18-22) mengemukakan tentang prinsip- prinsip pengukuran prestasi belajar sebagai berikut:

1) Tes prestasi harus mengukur hasil belajar yang telah dibatasi secara jelas sesuai dengan tujuan instruksional.

Prinsip ini merupakan langkah pertama yaitu menentukan pembatasan tujuan ukur.

18

2) Tes prestasi harus mengukur suatu sampel yang representatif dari hasil belajar dan dari materi yang dicakup oleh program instruksional atau pengajaran.

Sampel belajar maksudnya adalah perwujudan soal tes dalam bentuk aitem-aitem keseluruhan pertanyaan mengenai materi pelajaran. Suatu tes tidak mungkin memuat seluruh permasalahan dalam suatu materi pembelajaran, hal ini menyebabkan penyajian tes hanya terbatas pada sebagian dari keseluruhan pertanyaan. Sampel pertanyaan yang termuat harus representatif, maksudnya harus menanyakan semua bagian materi.

3) Tes prestasi harus berisi aitem-aitem dengan tipe yang paling cocok guna mengukur hasil belajar yang diinginkan.

Hasil belajar hendaknya diukur menggunakan aitem yang sesuai dengan tujuan pengukuran.

4) Tes prestasi dirancang sedemikian rupa agar sesuai dengan tujuan penggunaan hasilnya.

Hal ini berkaitan dengan fungsi evaluasi, untuk tes yang digunakan sebagai dasar penempatan, biasanya aitem tidak terlalu tinggi tingkat kesukarannya dan cakupannya tidak terlalu luas. Untuk tes sumatif guna mengukur kemajuan belajar, aitem harus mencakup bagian penting tertentu dari keseluruhan materi pelajaran. Tes sumatif yang mengacu pada kriteria penguasaan materi harus berisi aitem yang mengungkap seluruh bagian materi dengan tingkat kesukuran yang rendah. Sedangkan, tes sumatif untuk melihat

19

posisi relatif siswa dalam kelompok hendaknya terdiri dari aitem yang memiliki tingkat kesukaran yang bervariasi. Tes yang berfungsi untuk diagnostik akan berisi aitem dalam jumlah besar dari setiap materi pelajaran. Karena tes ini bertujuan untuk mendeteksi masalah kesukaran belajar maka tingkat kesukaran aitemnya dibuat rendah.

5) Realibilitas tes prestasi harus diusahakan setinggi mungkin ( = 1,00) dan hasil ukurnya harus ditafsirkan dengan hati-hati.

Reliabilitas hasil ukur merupakan salah satu ciri kualitas tes yang tidak dapat diabaikan. Sejauhmana pengukuran tersebut dapat dipercaya, dapat dilihat dari keajegan (reliabel) tes tersebut.

6) Tes prestasi belajar harus dapat digunakan untuk meningkatkan belajar para anak didik.

Manfaat inilah yang sebenarnya lebih penting dibanding menggunakan hasil tes prestasi hanya untuk mengisi rapor siswa. Tujuan utama dari pengukuran prestasi belajar, baik formatif maupun sumatif adalah untuk membantu siswa dalam belajar haruslah dikomunikasikan kepada para siswa. Tes pretasi merupakan jenis tes berdasarkan tujuanan penggunaannya. Tes prestasi adalah suatu tes baku yang digunakan untuk mengukur tingkat kemampuan seseorang dalam bidang studi tertentu (Basuki & Hariyanto, 2014: 30). Basuki dan Hariyanto (2014: 32-33) juga membagi tes berdasarkan keruntutan pelaksanaannya, yaitu tes formatif dan tes sumatif. Dalam penelitian

20

ini menggunakan soal UAS yang merupakan jenis tes sumatif sesuai dengan pernyataan dari Basuki dan Hariyanto (2014: 32-33) bahwa tes atau ulangan sumatif adalah suatu proses dari bagian final evaluasi untuk mengetahui apakah tujuan pembelajaran terpenuhi. Tes ini biasanya digunakan pada akhir semester atau akhir tahun pembelajaran. Tes sumatif identik dengan ulangan akhir semester dan ulangan kenaikan kelas (Basuki & Hariyanto, 2014: 32-33). Berdasarkan pernyataan tesebut dapat disimpulkan bahwa UAS merupakan tes yang digunakan untuk mengetahui ketercapaian tujuan pembelajaran pada akhir pada akhir semester.

d. Tes Pilihan Ganda

Aitem pilihan ganda termasuk dalam tipe aitem memilih alternatif, dengan tipe meminta siswa untuk memilih satu pilihan jawaban dari beberapa pilihan jawaban (Azwar, 2015 a: 73). Soal tes bentuk pilihan ganda dapat digunakan untuk mengukur hasil belajar yang lebih kompleks dan berkenaan dengan aspek ingatan, pengertian, aplikasi, analisis, sintesis, dan evaluasi (Arifin, 2009: 138). Tes pilihan ganda adalah suatu tes yang menyediakan 3 sampai 5 pilihan jawaban tetapi hanya satu pilihan yang paling benar (Jihad & Haris, 2012: 81). Djiwandono (2008:41) mengungkapkan tes pilihan ganda adalah jenis tes objektif yang masing-masing butir soalnya memiliki dua atau lebih pilihan jawaban. Berdasarkan definisi tersebut dapat diambil kesimpulan bahwa tes pilihan ganda

21

adalah sebuah tes yang menyediakan pilihan jawaban dan siswa memilih pilihan jawaban yang paling benar.

Tes pilihan ganda terdiri dari suatu keterangan atau pernyataan yang belum lengkap, siswa diminta untuk memilih salah satu jawaban untuk melengkapi keterangan atau pernyataan tersebut. Pilihan jawaban terdiri dari jawaban yang sebenarnya dan pengecoh-pengecoh (Basuki & Hariyanto, 2014: 43). Tes pilihan ganda dapat digunakan untuk menilai kemampuan mengingat dan memahami, serta mengenal kembali fakta-fakta, memahami hubungan antara dua hal atau lebih, dan mengaplikasikan prinsip-prinsip (Kunandar, 2014: 175).

Basuki dan Hariyanto (2014: 44-45) menyatakan beberapa hal yang harus diperhatikan dalam menyusun tes pilihan ganda, diantaranya: 1). Jaminlah bahwa setiap pertanyaan memiliki gagasan pokok yang jelas, 2). Pilihlah pilihan jawaban salah yang masuk akal, 3). Buatlah pilihan yang sama panjangnya, jangan ada yang terlalu panjang atau pendek, 4). Nyatakanlah secara jelas kepada siswa untuk memilih jawaban yang paling benar bukan alternatif jawaban yang benar.

Kunandar (2014: 201), menyatakan syarat tes tertulis pilihan ganda yang baik sebagai berikut:

1. Memiliki validitas yang tinggi, artinya mampu mengungkapkan hasil belajar secara tepat.

2. Memiliki reliabilitas yang tinggi, artinya mampu memberikan ketetapan pengukuran tentang kompetensi yang miliki siswa.

22

3. Tiap butir soal memiliki daya beda yang memadai, artinya tiap butir soal mampu membeda siswa prestasi atas dan siswa prestasi bawah.

4. Tingkat kesukaran tes kira-kira 30% soal mudah, 50% soal sedang, dan 20% soal sulit dari keseluruhan soal tes.

5. Mudah diadministrasi, artinya tes tersebut memiliki petunjuk bagaimana cara pelaksanaanya, pengerjaannya, dan pemeriksaannya.

e. Analisis Butir Soal

Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut (Arifin, 2009: 246). Analisis butir soal adalah cara untuk menguji kecocokan atau kesesuaian, tingkat kesukaran, dan perbedaan dari setiap soal yang diujikan kepada para siswa (Basuki & Hariyanto, 2014: 129). Item Analysis adalah analisis yang dilakukan terhadap item tes untuk menentukan tingkat kesukaran, daya pembeda, dan efektivitas pengecoh (distractor) (Uno & Koni, 2012: 156). Berdasarkan definisi yang telah diuraikan dapat disimpulkan bahwa analisis butir soal adalah cara yang digunakan untuk menguji validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh suatu soal.

23

Manfaat analisis butir soal adalah sebagai berikut (Basuki & Hariyanto, 2014: 130) :

1) Membantu para pengguna tes dalam evaluasi terhadap tes yang digunakan. 2) Mendukung penulis butir soal yang efektif.

3) Meningkatkan validitas dan realibilitas soal.

4) Memberikan masukan kepada peserta didik tentang kemampuannya.

5) Memberikan masukan pada guru tentang kesulitan-kesulitan peserta didiknya. 6) Memberikan masukan kepada guru tentang efektifitas pembelajaran.

7) Merevisi butir soal yang dinilai tingkat kesukarannya terlalu tinggi atau terlalu rendah, yang validitas dan reliabilitasnya rendah.

8) Meningkatkan keterampilan guru dalam menulis soal.

24

f. Standar Kompetensi dan Kompetensi Dasar

Standar Kompetensi (SK) dan Kompetensi Dasar (KD) mata pelajaran matematika kelas IV berdasarkan KTSP 2006, akan dipaparkan sebagai berikut.

Tabel 2.1 SK dan KD mata pelajaran matematika kelas IV berdasarkan KTSP 2006 Semester I SK KD Bilangan 1. Memahami dan menggunakan sifat-sifat operasi hitung bilangan dalam pemecahan masalah

1.1 Mengidentifikasi sifat-sifat operas hitung 1.2 Mengurutkan bilangan

1.3 Melakukan operasi perkalian dan pembagian 1.4 Melakukan operasi hitung campuran

1.5 Melakukan penaksiran dan pembulatan 1.6 Memecahkan masalah yang melibatkan uang 2. Memahami dan

menggunakan faktor dan keli-patan dalam

pemecahan masalah

2.1 Mendeskripsikan konsep faktor dan kelipatan 2.2 Menentukan kelipatan dan faktor bilangan

2.3 Menentukan kelipatan persekutuan terkecil (KPK) dan faktor persekutuan terbesar (FPB)

2.4 Menyelesaikan masalah yang berkaitan dengan KPK dan FPB

Geometri dan Pengukuran 3. Menggunakan pengukuran

sudut, panjang, dan berat dalam pemecahan masalah

3.1 Menentukan besar sudut dengan satuan tidak baku dan satuan derajat

3.2 Menentukan hubungan antar satuan waktu, antar satuan panjang, dan antar satuan berat

3.3 Menyelesaikan masalah yang berkaitan dengan satuan waktu, panjang dan berat

3.4 Menyelesaikan masalah yang berkaitan dengan satuan kuantitas

4. Menggunakan konsep keliling dan luas bangun datar sederhana dalam pemecahan masalah

4.1 Menentukan keliling dan luas jajargenjang dan segitiga

4.2 Menyelesaikan masalah yang berkaitan dengan keliling dan luas jajargenjang dan segitiga Semester II SK KD Bilangan 5. Menjumlahkan dan mengurangkan bilangan bulat

5.1 Mengurutkan bilangan bulat 5.2 Menjumlahkan bilangan bulat 5.3 Mengurangkan bilangan bulat 5.3 Melakukan operasi hitung campuran 6. Menggunakan pecahan

dalam pemecahan masalah

6.1 Menjelaskan arti pecahan dan urutannya 6.2 Menyederhanakan berbagai bentuk pecahan 6.3 Menjumlahkan pecahan

25

6.4 Mengurangkan pecahan

6.5 Menyelesaikan masalah yang berkaitan dengan pecahan

7. Menggunakan lambang bilangan Romawi

7.1 Mengenal lambang bilangan Romawi

7.2 Menyatakan bilangan cacah sebagai bilangan Romawi dan sebaliknya

Geometri dan Pengukuran 8. Memahami sifat bangun

ruang sederhana dan hubungan antar bangun datar

8.1 Menentukan sifat-sifat bangun ruang sederhana 8.2 Menentukan jaring-jaring balok dan kubus 8.3 Mengidentifikasi benda-benda dan bangun datar

simetris

8.4 Menentukan hasil pencerminan suatu bangun datar

(Sumber: Permendiknas No. 22 dan No. 23 tahun 2006 tentang Standar Isi dan Standar Kompetensi Lulusan untuk satuan pendidikan dasar dan menengah).

Berdasarkan tabel 2.1 SK dan KD mata pelajaran matematika kelas IV yang menggunakan KTSP dapat dilihat bahwa dalam setiap semester mengajarkan dua materi pokok yaitu bilangan; geometri dan pengukuran. Pada semester I materi bilangan membahas sifat operasi hitung; faktor dan kelipatan, sedangkan materi geometri dan pengukuran membahas pengukuran sudut, panjang, dan berat; konsep keliling dan luas bangun datar sederhana. Pada semester II materi bilangan membahas tentang bilangan bulat; pecahan; dan bilangan romawi, sedangkan materi geometri dan pengukuran membahas sifat bangun ruang sederhana dan hubungan antar bangun datar.

g. Validitas

Validitas berasal dari kata validity yang memiliki arti sejauhmana akurasi suatu tes dalam menjalankan fungsi pengukurannya (Azwar, 2015 b: 8). Validitas adalah relevansi, kecocokan, atau kesesuaian antara suatu tes dengan jenis kemampuan yang merupakan tujuan dari pengukuran (Djiwandono, 2008: 164). Validitas digunakan sejauh mana alat ukur mampu memenuhi tujuan alat ukur

26

tersebut (Siregar, 2013: 46). Suatu tes dikatakan valid apabila dapat memberikan informasi yang sesuai dan dapat digunakan untuk mencapai tujuan tertentu (Arifin, 2009: 247). Berdasarkan definisi yang telah diuraikan dapat disimpulkan bahwa validitas adalah suatu kecocokan, ketepatan suatu tes dengan tujuan yang ingin diukur.

Validitas dibagi dalam tiga jenis menurut konsep baru (Basuki & Hariyanto, 2014: 123-124

1) Validitas Isi

Validitas ini digunakan untuk mengukur kesesuaian antara soal dengan materi ajar dan tujuan yang ingin diukur (Jihad & Haris, 2012:179). Validtas ini mengukur kemampuan tes dengan ranah yang ingin diukur (Basuki & Hariyanto, 2014: 124). Validitas isi adalah bertujuan melihat tes evaluasi mengukur cakupan yang ingin diukur (Sukardi, 2008: 32). Validitas isi menunjukkan sejauhmana sebuah aitem dalam tes mencakup keseluruhan isi yang ingin diukur melalui tes tersebut (Azwar, 2015 a: 175). Berdasarkan beberapa pendapat tersebut dapat disimpulkan bahwa validitas isi adalah untuk melihat sejauhmana sebuah tes mencakup keseluruhan materi yang ingin diukur.

27 2) Validitas Kriteria

Validitas kriteria menggunakan tes lain yang menjadi kriteria sebagai bahan pembanding untuk melihat hubungan dengan tes akan dievaluasi (Endrayanto & Harumurti, 2014: 84). Validitas terkait kriteria didasarkan pada hubungan antara skor dalam suatu tes dengan kemampuan yang lainnya (Basuki & Hariyanto, 2014: 124). Dalam pengujian validitas terkait kriteria dapat dilihat melalui adanya hubungan skor tes dengan skor suatu kriteria (Azwar, 2015 a: 176). Berdasarkan pendapat tersebut dapat disimpulkan bahwa validitas kriteria melihat adanya hubungan tes yang akan diukur dengan tes yang digunakan sebagai pembanding (kriteria). 3) Validitas Konstrak

Validitas konstrak digunakan untuk menilai kemampuan tes dalam menafsirkan suatu ukuran dari sejumlah karakteristik (Basuki & Hariyanto, 2014: 124). Sebuah tes dikatakan memiliki validitas konstruk apabila setiap butir soal memiliki aspek berpikir (Arikunto, 2012: 83). Validitas konstruk berkenaan dengan sejauhmana suatu tes mampu mengobservasi dan mengukur suatu fungsi (Arifin, 2009: 257). Validitas konstrak adalah validitas yang menunjukkan sejauhmana suatu tes mengukur yang hendak diukur (Azwar, 2015 a: 175). Berdasarkan pendapat-pendapat tersebut dapat disimpulkan bahwa validitas konstruk hampir mirip dengan validitas isi, akan tetapi validitas kontruk lebih

28

banyak dikenal dalam tes psikologi karena mengukur gejala perilaku yang abstrak (Arifin, 2009: 257).

h. Reliabilitas

Reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen (Arifin, 2009: 258). Reliabilitas adalah indeks untuk mengetahui seberapa jauh hasil pengukuran suatu alat ukur dapat konsisten, apabila dilakukan pengukuran dua kali atau lebih (Siregar, 2013: 55). Relibilitas soal merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistenan suatu soal tes (Jihad & Haris, 2012: 180). Berdasarkan definisi tersebut dapat disimpulkan bahwa reliabilitas adalah analisis soal mengenai keajegan dan kekonsistenan hasil dari tes tersebut.

Relibilitas menurut Pearson (dalam Arifin, 2009: 259) terdiri dari tiga macam: 1) Koefisien Stabilitas

Reliabilitas jenis ini menggunakan teknik test dan retest, yaitu memberikan tes kepada sekelompok individu, kemudian diadakan kembali tes dengan kelompok yang sama diwaktu yang berbeda.

2) Koefisien Ekuivalen

Koefisien ekuivalen adalah jika mengorelasikan dua buah tes yang paralel pada kelompok dan waktu yang sama.

3) Koefisien Konsistensi Internal

Koefisien konsistensi internal adalah reliabilitas yang didapat dengan jalan mengorelasikan dua buah tes dari kelompok yang sama, tetapi

29

diambil butir-butir yang bernomor genap untuk tes yang pertama dan mengambil butir-butir yang bernomor ganjil untuk tes yang kedua.

Guilford (dalam Jihad & Haris, 2012: 181) menyatakan kriteria reliabilitas: Tabel 2.2 Kriteria Reliabilitas

Rentang Kriteria ≤ 0,20 Sangat rendah 0,20 < < 0,40 Rendah 0,40 < < 0,70 Sedang 0,70 < < 0,90 Tinggi 0,90 < ≤1,00 Sangat tinggi

(Sumber: Jihad & Haris, 2012: 181)

Berdasarkan kriteria reliabilitas pada tabel 2.2 menunjukkan bahwa kriteria dibagi menjadi lima, yaitu sangat rendah, rendah, sedang, tinggi dan sangat tinggi. i. Tingkat Kesukaran

Tingkat kesukaran item atau yang sering disebut sebagai indeks kesulitan item adalah angka yang menunjukan proporsi siswa yang menjawab betul dalam suatu soal tes yang dilakukan dengan menggunakan tes objektif (Sukardi, 2008: 136). Tingkat kesulitan tes biasanya ditunjukkan dengan persentase siswa yang memperoleh jawaban item benar. Tingkat kesukaran adalah pengukuran seberapa besar kesukaran suatu soal (Arifin, 2009: 266). Analisis tingkat kesulitan butir tes dimaksudkan untuk mengetahui seberapa sulit dan mudah suatu soal tes yang telah diselenggarakan, baik secara keseluruhan maupun masing-masing butir soal tersebut (Djiwandono, 2008: 219). Berdasarkan definisi yang telah diuraikan sebelumnya dapat disimpulkan bahwa tingkat kesulitan adalah untuk melihat sulit atau mudahnya suatu butir soal tes.

30

Pada analisis tingkat kesukaran soal pada umumnya dirumuskan dengan (Djiwandono, 2008: 218):

Keterangan:

p : tingkat kesulitan butir tes

Pada umumnya tingkat kesulitan dibedakan menjadi (Uno & Koni, 2012: 156):

Tabel 2.3 Kriteria Tingkat Kesukaran

Rentang Kriteria

0 – 0,30 Tergolong sukar 0,31 – 0,70 Tergolong sedang

0,71 – 1 Tergolong mudah

(Sumber: Uno & Koni, 2012: 156)

Berdasarkan tabel 2.3 kriteria tingkat kesukaran dibedakan menjadi tiga kriteria, yaitu sukar, sedang, dan mudah dengan rentang yang berbeda-beda. j. Daya Beda

Analisis daya pembeda dalam tes dimaksudkan untuk mengetahui kemampuan soal untuk membedakan antara siswa yang berprestasi tinggi dengan siswa berprestasi rendah (Uno & Koni, 2012: 157). Tingkat daya beda adalah kemampuan butir soal untuk membedakan siswa berpretasi tinggi dan siswa berprestasi rendah (Endrayanto & Harumurti, 2014: 256). Daya pembeda adalah kemampuan butir soal untuk membedakan siswa yang mampu dan kurang mampu dalam menjawab pertanyaan tes tersebut (Djiwandono, 2008: 220). Berdasarkan

31

definisi tersebut dapat disimpulkan bahwa daya beda adalah kemampuan butir soal tes untuk membedakan siswa berprestasi tinggi dengan siswa berprestasi rendah.

Penghitungan daya pembeda pada butir soal dapat dilakukan dengan rumus (Djiwandono, 2008: 221) :

Keterangan:

D : Daya pembeda (biasa dinotasikan DB)

: Kelompok siswa berprestasi tinggi (kadang dinotasikan BA) : Kelompok siswa berprestasi rendah (kadang dinotasikan BB)

: Setengah dari jumlah peserta tes kedua kelompok (kelompok atas dan kelompok bawah).

Berikut adalah tingkat daya pembeda (Djiwandono, 2008: 224):

Dokumen terkait