Analisis butir soal pilihan ganda ulangan akhir semester genap tahun pelajaran 2014/2015 mata pelajaran IPS kelas V SD di Kecamatan Depok.

(1)

Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD di Kecamatan Depok. Oleh :

Maria Stefani Mustida Nugraha (121134042)

Perencanaan yang baik dapat dinilai melalui evaluasi berupa analisis butir soal. Kecamatan Depok belum pernah melakukan analisis butir soal. Penelitian ini bertujuan untuk menganalisis butir soal pilihan ganda UAS genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di Kecamatan Depok ditilik dari 1) validitas, 2) reliabilitas soal, 3) tingkat kesukaran, 4) daya pembeda, dan 5) efektivitas pengecoh.

Penelitian ini merupakan penelitian kuantitatif deskriptif non experimental. Populasi penelitian ini adalah semua Sekolah Dasar (SD) Sekecamatan Depok yang mengimplementasikan KTSP, sedangkan sampel dalam penelitian ini adalah 27 SD di Kecamatan Depok. Teknik pengumpulan data dalam penelitian ini adalah dokumentasi dan wawancara. Instrumen penelitian menggunakan daftar check list dan pedoman wawancara. Teknik analisis data pada penelitian ini menggunakan 1) analisis kualitas ditilik dari validitas, 2) analisis kuantitatif meliputi a. reliabilitas soal, b. analisis butir soal, meliputi (1) tingkat kesukaran butir soal, dan (2) daya pembeda butir soal, dan efektivitas pengecoh bantuan software MicroCat Iteman versi 3.00.

Hasil penelitian menunjukkan bahwa 1) ditinjau dari validitas isi 100% valid, 2) reliabilitas soal koefisien Alpha 0,759, 3) tingkat kesukaran butir soal mudah 30%, sedang 50%, dan sukar 20%, dan 4) daya pembeda butir soal sangat baik 50%, cukup baik 16,67%, sedang 16,67%, dan buruk 16,67% dan 5) efektivitas pengecoh berfungsi 66,7%, dan tidak berfungsi 33,3%.

(2)

Year 2014/2015 Grade 5 Elementary School in District of Depok

By :

Maria Stefani Mustida Nugraha (121134042)

A proper planning can be rated through an items’ analysis. Depok had never conducted an items’ analysis before. This study is aimed to analyze the second semester final examination multiple-choice items in social science subject academic year 2014/2015 of 5th grade elementary school in Depok, judged from 1) validity, 2) items’ reliability, 3) level of difficulty, 4) distinguishing powers, and 5) detractor’s effectiveness.

This research is non experimental descriptive quantitative type. The study population is all elementary schools in Depok implementing KTSP, while the samples are 27 elementary schools in Depok. The data collection techniques used in this study are documentation and interviews. The research instruments used in this study are a check list and interview guides. Data analysis techniques used in this study are 1) quality analysis judged from the validity, 2) quantitative analysis, such as: a. items’ reliability, b. analysis of items including (1) the difficulty level of items, and (2) items’ distinguishing powers, and the detractor’s effectiveness, generated from Iteman MICROCAT software version 3.00.

The study’s results reveal that 1) in terms of the content validity, 100% valid, 2) items’ reliability Alpha coefficient is 0.759, 3) level of difficulty of items is 30% easy, 50% moderate, and 20% hard, 4) items’ distinguishing powers are 50% very good, 16.67% almost good, 16.67% moderate and 16.67% poor and 5) the detractor’s effectiveness are 66.7% function well, and 33.3% do not function well.

(3)

SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN IPS KELAS V SD DI KECAMATAN DEPOK

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Pendidikan Program Studi Pendidikan Guru Sekolah Dasar

Oleh:

Maria Stefani Mustida Nugraha

NIM: 121134042

PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA

(4)

i

SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN IPS KELAS V SD DI KECAMATAN DEPOK

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Pendidikan Program Studi Pendidikan Guru Sekolah Dasar

Oleh:

Maria Stefani Mustida Nugraha

NIM: 121134042

PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA

(5)

(6)

(7)

iv Karya tulis ilmiah ini kupersembahkan sebagai ucapan syukur dan

terima kasih kepada :

Tuhan Yesus Kristus sumber pengharapanku

Papah, Mamah, kakakku yang selalu mendukung setiap langkahku

Saudara dan teman-temanku yang selalu membantu dan menyemangatiku

(8)

v Iman Tanpa Perbuatan adalah Mati

Yak 2: 14-26

Semua Mimpimu akan Terwujud Asalkan Kamu Punya Keberanian untuk

Mengejarnya

Walt Disney

Bukan seberapa lama kita hidup, namun sebermanfaat apa hidup kita

(9)

(10)

(11)

viii

Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD di Kecamatan Depok.

Perencanaan yang baik dapat dinilai melalui evaluasi berupa analisis butir soal. Kecamatan Depok belum pernah melakukan analisis butir soal. Penelitian ini bertujuan untuk menganalisis butir soal pilihan ganda UAS genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di Kecamatan Depok ditilik dari 1) validitas, 2) reliabilitas soal, 3) tingkat kesukaran, 4) daya pembeda, dan 5) efektivitas pengecoh.

Penelitian ini merupakan penelitian kuantitatif deskriptif non experimental. Populasi penelitian ini adalah semua Sekolah Dasar (SD) Sekecamatan Depok yang mengimplementasikan KTSP, sedangkan sampel dalam penelitian ini adalah 27 SD di Kecamatan Depok. Teknik pengumpulan data dalam penelitian ini adalah dokumentasi dan wawancara. Instrumen penelitian menggunakan daftar check list dan pedoman wawancara. Teknik analisis data pada penelitian ini menggunakan 1) analisis kualitas ditilik dari validitas, 2) analisis kuantitatif meliputi a. reliabilitas soal, b. analisis butir soal, meliputi (1) tingkat kesukaran butir soal, dan (2) daya pembeda butir soal, dan efektivitas pengecoh bantuan software MicroCat Iteman versi 3.00.

Hasil penelitian menunjukkan bahwa 1) ditinjau dari validitas isi 100% valid, 2) reliabilitas soal koefisien Alpha 0,759, 3) tingkat kesukaran butir soal mudah 30%, sedang 50%, dan sukar 20%, dan 4) daya pembeda butir soal sangat baik 50%, cukup baik 16,67%, sedang 16,67%, dan buruk 16,67% dan 5) efektivitas pengecoh berfungsi 66,7%, dan tidak berfungsi 33,3%.

(12)

ix Multiple Choice Items Analysis of Social Subject Final Examination Academic

Year 2014/2015 Grade 5thElementary School in District of Depok

A proper planning can be rated through an items’ analysis. Depok had

never conducted an items’ analysis before. This study is aimed to analyze the

second semester final examination multiple-choice items in social science subject

academic year 2014/2015 of 5th grade elementary school in Depok, judged from

1) validity, 2) items’ reliability, 3) level of difficulty, 4) distinguishing powers, and

5) detractor’s effectiveness.

This research is non experimental descriptive quantitative type. The study

population is all elementary schools in Depok implementing KTSP, while the

samples are 27 elementary schools in Depok. The data collection techniques used

in this study are documentation and interviews. The research instruments used in

this study are a check list and interview guides. Data analysis techniques used in

this study are 1) quality analysis judged from the validity, 2) quantitative analysis,

such as: a. items’ reliability, b. analysis of items including (1) the difficulty level

of items, and (2) items’ distinguishing powers, and the detractor’s effectiveness,

generated from Iteman MICROCAT software version 3.00.

The study’s results reveal that 1) in terms of the content validity, 100%

valid, 2) items’ reliability Alpha coefficient is 0.759, 3) level of difficulty of items

is 30% easy, 50% moderate, and 20% hard, 4) items’ distinguishing powers are

50% very good, 16.67% almost good, 16.67% moderate and 16.67% poor and 5)

the detractor’s effectiveness are 66.7% function well, and 33.3% do not function

well.

(13)

x

Puji dan syukur kepada Tuhan Yang Maha Kuasa atas tuntunan, kasih, berkat dan rahmat-Nya, penulis dapat menyelesaikan skripsi dengan tepat waktu. Penulis menyusun skripsi dengan judul : “Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD di Kecamatan Depok”. Skripsi ini disusun untuk memenuhi salah satu syarat memperoleh gelar sarjana pada Fakultas Keguruan dan Ilmu Pendidikan khususnya Program Studi Pendidikan Guru Sekolah Dasar Universitas Sanata Dharma.

Penulis menyadari bahwa terselesainya skripsi ini tidak terlepas dari bimbingan, dorongan, dan dukungan yang telah diberikan oleh berbagai pihak. Oleh karena itu, penulis mengucapkan terimakasih yang sebesar-besarnya kepada: 1. Tuhan Yesus Kristus atas kasih dan karunia-Nya.

2. Rohandi, Ph.D. selaku Dekan Fakultas Keguruan dan Ilmu Pendidikan. 3. Christiyanti Aprinastuti, S.Si., M.Pd., selaku Ketua Program Studi PGSD. 4. Apri Damai Sagita Krissandi, S. S., M. Pd. selaku Wakil Ketua Program Studi

PGSD.

5. Maria Melani Ika Susanti, M.Pd. selaku dosen pembimbing I, yang telah memberikan arahan, bimbingan, kritik, ide, semangat, dorongan, dan pikiran yang penulis butuhkan untuk menyelesaikan penelitian.

6. Irine Kurniastuti, S. Psi., M. Psi. selaku dosen pembimbing II, yang telah memberikan arahan, bimbingan, kritik, ide, semangat, dorongan, dan pikiran yang penulis butuhkan untuk menyelesaikan penelitian.

7. Andri Anugrahana, S.Pd., M.Pd. selaku dosen penguji yang telah berkenan menguji saya.

(14)

(15)

xii

HALAMAN JUDUL………. i

HALAMAN PERSETUJUAN PEMBIMBING... ii

HALAMAN PENGESAHAN... iii

HALAMAN PERSEMBAHAN... iv

HALAMAN MOTTO... v

PERNYATAAN KEASLIAN KARYA... vi

LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS... vii

ABSTRAK... viii

ABSTRACT... ix

KATA PENGANTAR... x

DAFTAR ISI... xii

DAFTAR TABEL... xv

DAFTAR GAMBAR... xvii

DAFTAR LAMPIRAN SKRIPSI... xviii

BAB I PENDAHULUAN... 1

A. Latar Belakang Masalah... 1

B. Pembatasan Masalah... 7

C. Rumusan Masalah... 9

D. Tujuan Penelitian... 10

E. Manfaat Penelitian... 10

F. Definisi Operasional... 12

BAB II LANDASAN TEORI... 14

A. Kajian Pustaka... 14

1. Evaluasi... 14

2. Instrumen Penilaian... 15

3. Tes ... 16

(16)

xiii

6. Analisis Butir Soal... 23

7. Validitas………... 24

8. Reliabilitas……….………... 27

9. Tingkat Kesukaran... 29

10. Daya Pembeda... 32

11. Efektivitas Pengecoh... 34

12.Software MicroCat Itemanversi 3.00 ……….. 36

13. Ilmu Pengetahuan Sosial (IPS)………. 37

B. Hasil Penelitian yang Relevan... 39

C. Kerangka Berpikir... 44

D. Hipotesis Penelitian... 46

BAB III METODE PENELITIAN... 48

A. Jenis Penelitian... 48

B. Waktu dan Tempat Penelitian... 49

C. Populasi dan Sampel... 51

D. Variabel Penelitian... 53

E. Teknik Pengumpulan Data... 54

F. Instrumen Penelitian... 56

G. Teknik Analisis Data... 58

BAB IV HASIL PENELITIAN DAN PEMBAHASAN... 69

A. Deskripsi Penelitian... 69

B. Hasil Penelitian... 70

1. Hasil Analisis Validitas ....……… 70

2. Hasil Analisis Reliabilitas………. 74

3. Hasil Analisis Tingkat Kesukaran... 75

4. Hasil Analisis Daya Pembeda... 79

5. Hasil Analisis Efektivitas Pengecoh... 83

C. Pembahasan... 107

1. Validitas ………... 107

(17)

xiv

4. Daya Pembeda... 113

5. Efektivitas Pengecoh... 116

6. Tingkat Kesukaran, Daya Pembeda, dan Efektivitas Pengecoh dalam Butir Soal………...………….………... 117

BAB V PENUTUP... 120

A. Kesimpulan... 120

B. Keterbatasan Penelitian... 121

C. Saran... 122

DAFTAR REFERENSI... 123

(18)

xv

Tabel 2.1 Tingkat Reliabilitas Berdasarkan KoefisienAlpha…………... 28

Tabel 2.2 Kategori Tingkat Kesukaran………... 31

Tabel 2.3 Proporsi Tingkat Kesukaran………... 32

Tabel 2.4 Kategori Daya Pembeda………... 33

Tabel 2.5 SK dan KD Mata Pelajaran IPS Kelas V SD Semester Genap... 38

Tabel 3.1 Jadwal Penelitian ……… 49

Tabel 3.2 Populasi Penelitian………... 51

Tabel 3.3 Sampel Penelitian………... 53

Tabel 3.4 Daftar Centang (check list).………... 57

Tabel 3.5 Pedoman Wawancara ………... 58

Tabel 3.6 Output Itemanpada Alpha……….. 62

Tabel 3.7 Tingkat Reliabilitas Berdasarkan Koefisien Alpha………. 62

Tabel 3.8 Output Iteman padaProp. Correct……… 64

Tabel 3.9 Kategori Tingkat Kesukaran………... 64

Tabel 3.11 Output Itemanpada Point Biser……… 66

Tabel 3.12 Kategori Daya Pembeda Butir Soal………. 67

Tabel 3.13 Output Itemanpada Prop. Endorsing………... 68

Tabel 4.1 Hasil Analisis Validitas Isi………... 71

Tabel 4.2 Persentase Butir Soal Valid dan Butir Soal Tidak Valid………. 74

Tabel 4.3 Reliabilitas ditunjukkan oleh koefisienAlpha………. 75

Tabel 4.4 Kategori Tingkat Kesukaran Butir Soal……….. 76

Tabel 4.5 Hasil Analisis Tingkat Kesukaran Butir Soal UAS Genap Mata Pelajaran IPS Kelas V………... 76

Tabel 4.6 Persentase Jumlah Soal Berdasarkan Kategori Tingkat Kesukaran………... 77

(19)

xvi

Tabel 4.10 Persentase Jumlah Soal Berdasarkan Kategori Daya Pembeda Butir Soal………... 81 Tabel 4.11 Hasil Analisis Efektivitas Pengecoh Butir Soal UAS Genap

Mata Pelajaran IPS Kelas V………... 83 Tabel 4.12 Persentase Jumlah Butir Soal berdasarkan Keefektivan

Pengecoh………... 105 Tabel 4.13 Pembuktian Daya Pembeda Berdasarkan Jawaban Benar

Peserta didik Berprestasi Atas dan Peserta didik Berprestasi

Rendah ……… 114

(20)

xvii

Gambar 2.1 Literature Map Hasil Penelitian yang Relevan……….. 42 Gambar 2.2 Alur Kerangka Berpikir Analisis Butir Soal……….. 45 Gambar 4.1 Diagram Persentase Tingkat Kesukaran Butir Soal…………... 78 Gambar 4.2 Diagram Persentase Kategori Daya Pembeda Butir

Soal……...……….………... 82

Gambar 4.3 Diagram Persentase Jumlah Butir Soal

(21)

xviii

Lampiran 1 Surat Ijin Pelaksanaan Penelitian……….. 127

Lampiran 2 Surat Keterangan Telah Melaksanakan Penelitian ………... 128

Lampiran 3 Nama Mahasiswa………... 129

Lampiran 4 Paket Soal Pilihan Ganda UAS Genap Tahun Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD Di Kecamatan Depok……… 130

Lampiran 5 Kunci Jawaban Soal Pilihan Ganda UAS Genap Tahun Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD Di Kecamatan Depok………. 134

Lampiran 6 Lembar Jawaban Salah Satu Siswa Kelas V... 135

Lampirab 7 Daftar Centang (check list)……… 136

Lampiran 8 Hasil Wawancara………... 137

Lampiran 9 Tabel Analisis Kesesuaian Butir Soal dengan SK danKD ... 138

Lampiran 10 Tabel Rekapitulasi Hasil Penelitian………... 148

(22)

BAB I

PENDAHULUAN

Bab I pada penelitian ini membahas tentang enam sub bab, yaitu (A) latar

belakang masalah, (B) pembatasan masalah, (C) rumusan masalah, (D) tujuan

penelitian, (E) manfaat penelitian, dan (F) definisi operasional.

A. Latar Belakang Masalah

Pendidikan di era globalisasi ini menjadi salah satu aspek terpenting dalam

kehidupan manusia. Pendidikan merupakan usaha sadar dan terencana untuk

mewujudkan kegiatan belajar dan proses pembelajaran agar peserta didik secara aktif

dapat mengembangkan potensi dirinya untuk memiliki kekuatan spiritual keagamaan,

pengendalian diri, kepribadian, akhlak mulia, beserta keterampilan yang diperlukan

pada dirinya, masyarakat, bangsa, dan negara (Undang-undang No. 20 Tahun 2003

pasal 1 ayat 1). Pendidikan membuat seseorang dari tidak bisa menjadi bisa dan

mengembangkan potensi yang dimilikinya untuk mencapai tujuan. Tujuan pendidikan

nasional adalah mencerdaskan kehidupan bangsa, maka dalam hal ini pemerintah

mengusahakan dan menyelenggarakan suatu sistem pendidikan nasional mulai tingkat

dasar sampai perguruan tinggi. Untuk mencapai tujuan pendidikan seperti yang

diharapkan dalam tujuan pendidikan nasional, perlu adanya susunan perencanaan

(23)

Kunandar (2014: 3) berpendapat bahwa guru memiliki kewajiban untuk

menyusun suatu perencanaan pembelajaran sebelum dilaksanakannya suatu proses

kegiatan belajar mengajar. Beberapa hal yang harus disusun oleh guru pada tahap

perencanaan sebelum melaksanakan suatu kegiatan pembelajaran antara lain adalah

program tahunan, program semester, silabus, dan Rencana Pelaksanaan Pembelajaran

(RPP). Dengan perencanaan yang baik akan berpengaruh terhadap hasil belajar

peserta didik. Hasil belajar peserta didik dapat kita ketahui dari perolehan penilaian

melalui pemberian evaluasi.

Stark & Thomas (dalam Widoyoko, 2009: 4) berpendapat bahwa evaluasi

merupakan proses yang sistematis dan berkelanjutan mengumpulkan, menganalisis,

dan menyajikan informasi suatu program yang dapat digunakan sebagai dasar

membuat keputusan, menyusun kebijakan maupun menyusun program selanjutnya.

Evaluasi inilah yang merupakan suatu bagian terpenting dalam sistem pendidikan.

UU Nomor 20 tahun 2003 tentang Sistem Pendidikan Nasional, evaluasi diatur dalam

Bab XVI Pasal 58 ayat 1 merupakan sebuah proses pengumpulan data untuk

menentukan atau memantau kemajuan dan perbaikan hasil belajar siswa yang sudah

dicapai. Evaluasi ini merupakan salah satu kegiatan untuk mengadakan penilaian.

Kegiatan yang dilakukan oleh guru dalam melakukan penilaian, pengukuran, adalah

melalui evaluasi dengan memberikan tes kepada peserta didik.

Tes adalah salah satu cara untuk memperoleh penilaian. Basuki dan Hariyanto

(2014: 21) mengemukakan bahwa tes adalah suatu cara untuk melaksanakan

(24)

peserta didik. Kegiatan tes tersebut akan menghasilkan nilai atau prestasi yang

dicapai peserta didik dan menunjukkan kemampuan peserta didik dalam munguasai

materi pelajaran. Salah satu tes yang dilakukan di SD adalah tes pada UAS. Tujuan

dilaksanakannya UAS adalah untuk mengukur pemahaman peserta didik terhadap

materi yang telah diberikan selama satu semester. Soal yang dikerjakan peserta didik

pada saat UAS merupakan soal yang disusun oleh guru. Salah satu tipe yang dibuat

oleh guru pada UAS adalah tipe soal pilihan ganda. Penyusunan butir soal pilihan

ganda pada soal UAS harus memenuhi syarat tes pilihan ganda yang baik, sehingga

dapat menghasilkan butir soal yang dapat digunakan sebagai alat ukur keberhasilan

pembelajaran yang berkualitas.

Suatu butir soal dapat dikatakan baik apabila memenuhi syarat-syarat yang

telah ditentukan. Syarat tes pilihan ganda yang baik, menurut Kunandar (2014: 201)

yaitu suatu tes pilihan ganda harus memiliki validitas dan reliabilitas tinggi, selain itu

setiap butir soal memiliki daya pembeda yang baik, dan memiliki tingkat kesukaran

dengan proporsi 30% butir soal dengan kategori mudah, 50% butir soal kategori

sedang, dan 20% butir soal kategori sukar, serta tes pilihan ganda yang baik adalah

mudah diadministrasikan. Pendapat tersebut diperkuat oleh pendapat Djiwandono

(2008: 163) yang menyatakan bahwa syarat butir soal yang baik adalah memiliki

validitas dan reliabilitas yang tinggi. Sementara itu, Basuki dan Hariyanto (2014:

138) menambahkan bahwa syarat tes pilihan ganda yang baik yaitu butir soal harus

memiliki tingkat kesukaran, daya pembeda, dan efektivitas pengecoh. Kualitas butir

(25)

Kubiszyn dan Borich (dalam Endrayanto dan Harumurti, 2014: 259) analisis

butir soal bertujuan mengetahui atau memeriksa dan mengidentifiikasi butir-butir soal

yang kurang baik dan sudah baik dalam suatu tes menggunakan teknik tertentu

sehingga guru dapat melakukan perbaikan butir-butir soal yang kurang baik tersebut.

Analisis butir soal terdiri dari dua cara, yaitu dengan menggunakan analisis kualitatif

dan analisis kuantitatif. Pendapat ini diperkuat oleh Basuki dan Hariyanto (2014: 131)

yang berpendapat bahwa terdapat dua cara dalam melaksanakan proses analisis butir

soal yaitu dengan analisis kualitatif digunakan untuk menganalisis validitas soal

terutama validitas isi, sedangkan pada analisis kuantitatif meliputi reliabilitas, tingkat

kesukaran, daya pembeda, dan efektivitas pengecoh.

Analisis validitas soal bertujuan untuk mengetahui kesesuaian atau ketepatan

soal dengan apa yang ingin diukur. Arifin (2009: 247) menyatakan bahwa tes

dikatakan valid apabila dapat memberikan informasi yang sesuai dan dapat digunakan

untuk mencapai tujuan tertentu. Arikunto (2012: 82) berpendapat bahwa validitas

dibagi menjadi empat, yaitu validitas isi, validitas kontruksi, validitas “ada sekarang”

atau empiris, dan validitas prediksi.

Analisis reliabilitas soal bertujuan untuk mengetahui keajegan atau konsistensi

soal. Jihad & Haris (2012: 180) mengemukakan bahwa relibilitas soal merupakan

ukuran yang menyatakan tingkat keajegan atau kekonsistenan suatu soal tes. Arifin

(2009: 258) menjelaskan bahwa reliabilitas adalah tingkat atau derajat konsistensi

dari suatu instrumen. Tes yang dikatakan memiliki tingkat reliabilitas tinggi apabila

(26)

Analisis tingkat kesukaran butir soal dilakukan dengan tujuan untuk

mengetahui kategori butir soal yang memiliki tingkat kesukaran dengan kategori

mudah, sedang, dan sukar. Tingkat kesukaran menurut Arikunto (2012: 222)

mengatakan bahwa bilangan yang menunjukkan sukar/mudahnya sesuatu soal. Soal

yang terlalu mudah tidak membuat peserta didik berusaha lebih tinggi dalam

memecahkan soal tersebut, sedangkan soal yang terlalu sukar membuat peserta didik

menjadi putus asa untuk menyelesaikan soal tersebut.

Analisis daya pembeda butir soal bertujuan untuk mengetahui kemampuan

suatu soal dalam membedakan peserta didik yang telah memahami materi dengan

peserta didik yang belum memahami materi. Kusaeri dan Suprananto (2012: 175)

berpendapat bahwa daya pembeda adalah kemampuan butir soal untuk membedakan

peserta didik yang telah menguasai materi dan peserta didik yang belum menguasai

materi pelajaran. Berdasarkan pendapat tersebut maka dapat dipahami bahwa butir

soal yang memiliki daya pembeda yang baik adalah butir soal yang mampu

membedakan antara peserta didik yang telah memahami materi dengan peserta didik

yang belum memahami materi.

Analisis efektivitas pengecoh memiliki tujuan untuk mengetahui keberfungsian

pilihan jawaban selain kunci jawaban pada butir soal pilihan ganda. Pernyataan

tersebut diperkuat oleh pendapat Uno dan Koni (2012: 157) yang mengatakan bahwa

tujuan melaksanakan analisis pengecoh butir soal adalah untuk mengetahui

(27)

Guru sebagai tim penyusun soal perlu memperhatikan beberapa hal dalam

proses penyusunan butir soal. Butir soal yang disusun akan menghasilkan butir soal

yang baik dengan memperhatikan kelima analisis tersebut, sehingga mampu

mengukur kemampuan dan keberhasilan peserta didik dalam memahami materi yang

telah diajarkan.

Berdasarkan pertimbangan yang telah diuraikan sebelumnya, bahwa analisis

perlu dilakukan. Pada saat penyususnan soal guru harus memiliki keterampilan dalam

menganalisis butir soal. Peneliti sebagai calon guru ingin memiliki keterampilan

tersebut, sehingga dapat melakukan analisis butir soal guna untuk mengetahui

kemampuan peserta didik yang sesungguhnya. Perumusan kelima analisis tersebut,

membantu peneliti dalam memilih untuk menganalisis butir soal pada mata pelajaran

Ilmu Pengetahuan Sosial (IPS) khususnya pada kelas V.

Hasil wawancara dengan pihak Unit Pelaksana Teknis Daerah (UPTD),

beberapa kepala sekolah dan guru, selama ini belum ada penelitian butir soal pada

Ujian Akhir Semester (UAS) melalui tahap analisis yang meliputi vaiditas,

reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh. Oleh karena itu,

peneliti tertarik untuk melakukan penelitian di kelas V pada mata pelajaran IPS.

Susanto (2014: 6) mendefinisikan Ilmu Pengetahuan Sosial (IPS) merupakan

integrasi dari pengetahuan tentang manusia dalam masyarakat dan ilmu-ilmu sosial

seperti ilmu politik, ekonomi, sejarah, geografi, sosiologi, antropologi, dan

(28)

Kecamatan Depok merupakan salah satu Kecamatan di Kabupaten Sleman.

Kecamatan Depok memiliki beberapa SD favorit yang menjadikan sekolah di

Kecamatan Depok cukup diminati. Kecamatan Depok juga dikelilingi oleh

universitas seperti Universitas Sanata Dharma, UNY, UGM, dan lain sebagainya, hal

ini berdampak pada kesadaran orangtua terhadap pentingnya pendidikan dan cita-cita

anaknya.

Berdasarkan masalah yang telah diuraian sebelumnya, bahwa belum pernah

adanya penelitian mengenai analisis butir soal UAS, peneliti tertarik untuk

mengangkat masalah ini karena ingin mengetahui validitas, realiabilitas, tingkat

kesukaran, daya pembeda, dan efektivitas pengecoh pada setiap butir soal UAS.

Peneliti ingin mengetahui soal UAS yang telah dibuat sudah memenuhi criteria atau

belum, peneliti juga ingin belajar untuk menganalisis soal agar mampu membuat soal

yang lebih baik dikemudian hari. Ketertarikan ini yang membuat peneliti memilih

judul “Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun

Pelajaran 2014/2015 Mata Pelajaran IPS Kelas V SD di Kecamatan Depok.”

B. Pembatasan Masalah

Penelitian ini dibuat untuk menganalisis butir soal pilihan ganda Ulangan Akhir

Semester (UAS) genap tahun pelajaran 2014/2015 pada mata pelajaran IPS kelas V.

Adapun pembatasan masalah pada penelitian ini sebagai berikut:

1. Analisis butir soal pilihan ganda Ulangan Akhir Semester (UAS) genap

(29)

Kecamatan Depok ditilik dari validitas, reliabilitas, daya pembeda, tingkat

kesukaran, dan efektivitas pengecoh.

2. Analisis validitas dalam penelitian ini menganalisis validitas isi, dengan

cara menganalisis kesesuaian butir soal dengan Standar Kompetensi (SK)

dan Kompetensi Dasar (KD) pada KTSP. Analisis reliabilitas, tingkat

kesukaran, daya pembeda, dan efektivitas pengecoh dianalisis dengan

menggunakan software Micro Cat Iteman versi 3.00.

3. Penelitian dilakukan pada SD Negeri dan SD Swasta di Kecamatan Depok,

Sleman, kelas V Tahun Pelajaran 2014/2015 yang menggunakan Kurikulum

Tingkat Satuan Pendidikan (KTSP). Di Kecamatan Depok terdapat 49 SD

yang mengimplementasikan KTSP. Namun, dalam penelitian ini peneliti

melakukan penelitian pada 27 SD. Hal tersebut dikarenakan dari 49 SD yang

memberikan ijin hanyalah 27 sedangkan 18 SD tidak memberikan ijin untuk

digunakan sebagai tempat penelitian. Tidak hanya kesulitan dalam

memberikan ijin namun juga mengalami kendala, yaitu kurangnya

koordinasi antara kepala sekolah dengan guru yang menyebabkan dokumen

lembar jawab peserta didik sudah dibagikan sehingga tidak dapat

(30)

C. Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan di atas, maka untuk

mempermudah dalam pembahasan penelitian ini perlu disederhanakan dalam sebuah

rumusan masalah, yaitu

1. Bagaimanakah validitas butir soal pilihan ganda Ulangan Akhir Semester (UAS)

genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di Kecamatan

Depok?

2. Bagaimanakah reliabilitas butir soal pilihan ganda Ulangan Akhir Semester

(UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V SD di

Kecamatan Depok?

3. Bagaimanakah tingkat kesukaran butir soal pilihan ganda Ulangan Akhir

Semester (UAS) genap Tahun Pelajaran 2014/2015 mata pelajaran IPS kelas V

SD di Kecamatan Depok?

4. Bagaimanakah daya pembeda butir soal pilihan ganda Ulangan Akhir Semester

Kecamatan Depok?

5. Bagaimanakah efektivitas pengecoh butir soal pilihan ganda Ulangan Akhir

(31)

D. Tujuan Penelitian

Tujuan yang ingin dicapai peneliti dalam melakukan penelitian ini adalah :

1. Untuk mengetahui validitas butir soal pilihan ganda Ulangan Akhir Semester

Kecamatan Depok.

2. Untuk mengetahui reliabilitas butir soal pilihan ganda Ulangan Akhir Semester

Kecamatan Depok.

3. Untuk mengetahui tingkat kesukaran butir soal pilihan ganda Ulangan Akhir

SD di Kecamatan Depok.

4. Untuk mengetahui daya pembeda butir soal pilihan ganda Ulangan Akhir

5. Untuk mengetahui efektivitas pengecoh butir soal pilihan ganda Ulangan Akhir

E. Manfaat Penelitian

Manfaat penelitian ini adalah sebagai berikut :

1. Manfaat Teoritis

(32)

a. Memberikan informasi dan manfaat pada kualitas soal pilihan ganda

pada Ulangan Akhir Semester (UAS) genap tahun pelajaran 2014/2015

pada mata pelajaran Ilmu Pengetahuan Sosial (IPS) kelas V SD di

Kecamatan Depok.

b. Mengembangkan evaluasi pembelajaran khususnya dalam bidang mata

pelajaran IPS pada butir soal pilihan ganda UAS.

c. Sebagai referensi penelitian selanjutnya.

2. Manfaat Praktis

Secara praktis penelitian ini diharapkan dapat :

a. Bagi Peneliti

Peneliti dapat mengetahui kualitas soal dengan cara menganalisis butir

soal dan dapat menyusun soal dengan baik menurut standar penyusunan

soal.

b. Bagi Guru

Guru dapat lebih baik dalam meyusun soal dengan baik menurut standar

penyusunan soal.

c. Bagi UPT

Penelitian ini memberikan masukan terkait kebijakan evaluasi UAS

(33)

F. Definisi Operasional

Peneliti menyusun definisi operasional sebagai berikut :

1. Analisis Butir Soal

Analisis butir soal adalah suatu tahap untuk mendefinisikan sebuah butir soal

yang digunakan untuk melihat kualitas butir soal tersebut yang kurang

berkualitas dan sudah berkualitas baik.

2. Validitas

Validitas adalah kesesuaian atau kecocokan suatu tes dengan tujuan yang

ingin diukur.

3. Validitas Isi

Validitas isi adalah kesesuaian tes antara apa yang seharusnya diukur oleh

suatu tes dan seberapa cermat tes tersebut diukur dengan menggunakan alat

untuk mengukur kompetensi.

4. Reliabilitas

Reliabilitas merupakan ukuran yang menyatakan kekonsistenan alat atau

instrumen dalam menilai, apabila diujikan berulang kali pada objek yang sama

pada waktu yang berbeda hasilnya relatif sama.

5. Tingkat Kesukaran

Tingkat kesukaran butir soal adalah suatu cara yang digunakan untuk

mengetahui proporsi seberapa mudah atau sukar soal yang diujikan, serta

dapat digunakan untuk mengetahui kualitas soal tersebut mudah atau sukar

(34)

6. Daya Pembeda

Daya pembeda adalah kemampuan butir soal tes untuk membedakan siswa

berprestasi tinggi yang sudah menguasai materi yang diujikan dengan siswa

berprestasi rendah yang belum menguasai materi yang diujikan.

7. Efektivitas Pengecoh

Efektivitas pengecoh adalah pilihan jawaban pada soal pilihan ganda yang

mempunyai kemiripan dengan jawaban yang benar, sehingga dapat

mengecoh jawaban yang tidak sama dengan kunci jawaban yang benar.

8. Ulangan Akhir Semester (UAS)

Ulangan Akhir Semester (UAS) adalah tes yang digunakan untuk mengetahui

ketercapaian tujuan pembelajaran pada akhir pada akhir semester.

9. Tes Pilihan Ganda

Tes pilihan ganda merupakan soal yang sudah disediakan beberapa pilihan

jawaban yang diantara pilihan tersebut terdapat satu pilihan yang paling benar

dan jawaban yang lain sebagai pengecoh yang dapat memungkinkan peserta

didik memilih pengecoh tersebut jika tidak benar-benar menguasai materi

pembelajaran.

10. Ilmu Pengetahuan Sosial (IPS)

Ilmu Pengetahuan Sosial (IPS) adalah ilmu yang mempelajari tentang

manusia sebagai salah satu anggota di dalam masyarakat, ditinjau dari segi

(35)

BAB II

LANDASAN TEORI

Bab II pada penelitian ini membahas tentang empat sub bab yaitu (A) kajian

pustaka, (B) hasil penelitian yang relevan, (C) kerangka berpikir, dan (D) hipotesis.

A. Kajian Pustaka

1. Evaluasi

a. Pengertian Evaluasi

Sukardi (2008: 1) mengatakan bahwa evaluasi merupakan proses

yang menentukan, suatu tujuan yang telah disepakati sehingga dapat

tercapai. Harjanto (2008: 277) mengemukakan bahwa evaluasi pengajaran

adalah penilaian terhadap pertumbuhan dan kemajuan peserta didik ke arah

tujuan yang telah ditetapkan. Di sisi lain, Stark & Thomas (dalam

Widoyoko, 2009: 4) berpendapat bahwa evaluasi merupakan proses yang

sistematis dan berkelanjutan mengumpulkan, menganalisis, dan

menyajikan informasi suatu program yang dapat digunakan sebagai dasar

membuat keputusan, menyusun kebijakan maupun menyusun program

selanjutnya.

Pada uraian di atas, disimpulkan bahwa evaluasi adalah kegiatan

mengumpulkan informasi tentang suatu program yang sudah dilaksanakan

dan selanjutnya digunakan untuk mengukur sejauh mana tujuan telah

(36)

Evaluasi dalam kegiatan belajar memiliki peran yang penting. Evaluasi

berfungsi sebagai alat dalam mengukur sejauh mana keberhasilan dalam

proses belajar mengajar yang telah dilakukan guna memperbaiki dan

menentukan langkah selanjutnya dalam kegiatan belajar mengajar.

b. Tujuan Evaluasi

Widoyoko (2009: 6) mengemukakan bahwa evaluasi bertujuan untuk

mendapatkan informasi yang akurat dan obyektif mengenai suatu program.

Arifin (2009: 15) mengemukakan bahwa evaluasi memiliki beberapa tujuan

yaitu mengetahui tingkat pemahaman peserta didik, mengetahui tingkat

kemajuan dan kesesuaian hasil belajar peserta didik dengan kompetensi

yang telah ditentukan, mengetahui keunggulan dan kelemahan peserta

didik, dan menentukan kenaikan kelas. Kedua pendapat tersebut

menunjukkan bahwa evaluasi bertujuan untuk memperoleh informasi serta

untuk mengetahui kelebihan dan kekurangan peserta didik dalam proses

pembelajaran.

2. Instrumen Penilaian

Arikunto (2012: 40) berpendapat bahwa instrumen penilaian merupakan

suatu alat yang dapat digunakan untuk mempermudah seseorang dalam

melaksanakan tugas atau mencapai tujuan secara lebih berrguna dan tepat. Jihad

dan Haris (2012: 67) mengemukakan tujuan penyusunan instrumen penilaian

digunakan untuk mengetahui kemampuan peserta didik terhadap pengusaan suatu

(37)

Berdasarkan kedua pendapat tersebut mengenai definisi instrumen penilaian

dapat diketahui bahwa instrumen penilaian adalah alat yang digunakan untuk

mengukur dan menilai dalam rangka mengetahui kemampuan peserta didik.

Instrumen penilaian terdiri dari dua macam yaitu tes dan nontes.

Majid (2014: 38) berpendapat bahwa instrumen penilaian ada dua

macam, yaitu tes dan non tes. Jihad dan Haris (2012: 67) menambahkan bahwa

alat penilaian teknis tes meliputi tes tertulis, tes lisan, dan tes perbuatan.

Berdasarkan uraian mengenai instrumen penilaian, peneliti menyimpulkan bahwa

instrumen penilaian terdiri dari dua macam yaitu tes dan nontes. Sedangkan, pada

penelitian ini peneliti menganalisis instrumen penilaian berupa tes. Hal ini

dikarenakan soal UAS yang diujikan di Kecamatan Depok mata pelajaran IPS

merupakan soal ulangan yang berbentuk tes tertulis.

3. Tes

a. Pengertian tes

Sudjana (2010: 35) tes merupakan pertanyaan-pertanyaan yang

diberikan kepada peserta didik untuk mendapat jawaban dari peserta didik

dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tulisan), atau

dalam bentuk perbuatan (tes tindakan). Pada umumnya tes digunakan

untuk mengukur dan menilai hasil belajar peserta didik. Jihad dan Haris

(2012: 67) menyatakan bahwa tes adalah suatu cara yang digunakan untuk

mengadakan penilaian berbentuk suatu tugas yang harus dikerjakan baik

(38)

tentang tingkah laku atau prestasi peserta didik dan dapat dibandingkan

dengan standar penilaian yang ditetapkan. Arikunto (2012: 46) yang

menyatakan bahwa tes adalah sejumlah pertanyaan atau latihan yang

berfungsi mengukur keterampilan, pengetahuan, kemampuan atau bakat

yang dimiliki oleh individu atau kelompok.

Berdasarkan pendapat para ahli peneliti mengambil kesimpulan

bahwa tes merupakan pertanyaan-pertanyaan yang diajukan kepada peserta

didik dan harus dijawab oleh peserta didik baik secara lisan maupun tertulis

untuk menilai pengetahuan, sikap, maupun keterampilan. Tes yang dapat

diberikan kepada peserta didik bertujuan untuk mengetahui ketercapaian

kegiatan belajar mengajar.

b. Jenis-jenis Tes

Mardapi (2008: 68) mengatakan bahwa ditinjau dari tujuan tes yang

digunakan di lembaga pendidikan, tes dibagi menjadi empat macam, yaitu

tes penempatan, tes diagnostik, tes formatif, dan tes sumatif. Pendapat

senada dikemukakan oleh Gronlund dan Linn (dalam Purwanto, 2009: 67)

yang membagi tes hasil belajar menjadi empat macam, yaitu tes formatif,

tes sumatif, tes diagnostik, dan tes penempatan. Berdasarkan kedua

pendapat di atas, dapat ditarik kesimpulan bahwa tes dikategorikan ke

dalam empat jenis, yaitu tes penempatan, tes diagnostik, tes formatif, dan

(39)

1.) Tes Penempatan

Mardapi (2008: 68) menjelaskan bahwa tes penempatan

merupakan tes untuk mengetahui tingkat kemampuan awal peserta

didik. Tes penempatan dilaksanakan di awal tahun pelajaran baru.

Tujuan dari tes penempatan ini digunakan untuk menempatkan

peserta didik pada tingkat kemampuan yang sesuai dengan

kemampuannya.

2.) Tes Diagnostik

Arikunto (2012: 48) menyatakan bahwa tes diagnostik

merupakan tes yang digunakan untuk mengetahui

kelemahan-kelemahan peserta didik sehingga berdasarkan kelemahan-kelemahan tersebut

dapat dilakukan pemberian perlakuan yang tepat.

3.) Tes Formatif

Basuki dan Hariyanto (2014: 32) mengemukakan bahwa tes

formatif merupakan kegiatan tes yang dilakukan secara periodik

yang digunakan untuk mengukur pencapaian kompetensi peserta

didik setelah menyelesaikan satu Kompetensi Dasar (KD) atau

lebih. Tes formatif diberikan pada akhir setiap program, misalnya

ulangan harian.

4.) Tes Sumatif

Sudijono (2011: 72) mengatakan bahwa tes sumatif

(40)

program pengajaran selesai diberikan. Tes sumatif diberikan pada

akhir semester atau akhir tahun pelajaran. Tujuan dilaksanakannya

tes sumatif adalah untuk mengetahui hasil yang dicapai peserta

didik, yaitu seberapa jauh tujuan-tujuan pembelajaran dapat dicapai

oleh peserta didik dalam satu semester. Pendapat senada juga

disampaikan oleh Arikunto (2012: 53) yang menyatakan bahwa tes

sumatif dilaksanakan setelah berakhirnya sebuah program satu

semester pembelajaran yaitu, dengan melaksanakan ulangan umum

atau Ulangan Akhir Semester (UAS) yang dilaksanakan setiap akhir

semester.

Berdasarkan jenis tes yang sudah diuraikan di atas, peneliti dapat

menyimpulkan terdapat empat jenis tes yang disesuaikan dengan tujuannya

yaitu tes penempatan, tes diagnosis, tes formatif, dan tes sumatif. Jenis tes

yang sesuai dengan penelitian yang dilakukan adalah tes sumatif. Tes

sumatif adalah tes yang diberikan meliputi materi pembelajaran selama

satu semester dan digunakan untuk mengetahui seberapa jauh penguasaan

materi pembelajaran peserta didik yang dilaksanakan pada akhir semester

dalam bentuk Ulangan Akhir Semester (UAS).

4. Ulangan Akhir Semester (UAS)

Ulangan Akhir Semester (UAS) dilaksanakan setelah peserta didik

menempuh pembelajaran selama satu semester. Hal ini sesuai dengan pendapat

(41)

Akhir Semester (UAS) digunakan untuk mengetahui hasil atau kemampuan yang

dicapai peserta didik dalam program pembelajaran selama satu semester. Salah

satu mata pelajaran yang diujikan dalam Ulangan Akhir Semester (UAS) adalah

mata pelajaran Ilmu Pengetahuan Sosial (IPS).

5. Tes Pilihan Ganda

a. Pengertian Tes Pilihan Ganda

Djiwandono (2008: 41) mengungkapkan tes pilihan ganda adalah

jenis tes objektif yang masing-masing butir soalnya memiliki dua atau

lebih pilihan jawaban. Kunandar (2014: 183) berpendapat bahwa tes bentuk

pilihan ganda adalah suatu soal yang jawabannya harus dipilih dari

beberapa pilihan jawaban yang telah disediakan. Pendapat ini diperkuat

oleh Jihad dan Haris (2012: 81) yang menyatakan bahwa tes pilihan ganda

adalah tes yang memiliki tiga sampai lima pilihan jawaban namun hanya

ada satu jawaban yang tepat. Secara umum, pada setiap tes pilihan ganda

terdiri dari soal dan pilihan jawaban. Pilihan jawaban terdiri dari kunci

jawaban dan pengecoh. Kunci jawaban merupakan jawaban yang paling

benar, sedangakan pengecoh merupakan jawaban yang tidak benar, namun

memungkinkan seseorang untuk memilihnya jika tidak menguasai materi.

Berdasarkan uraian menurut para ahli mengenai tes pilihan ganda,

peneliti menyimpulkan bahwa tes pilihan ganda adalah soal yang sudah

disediakan beberapa pilihan jawaban yang diantara pilihan tersebut terdapat

(42)

yang dapat memungkinkan peserta didik memilih pengecoh tersebut jika

tidak benar-benar menguasai materi pembelajaran. Pada penelitian ini

diketahui bahwa setiap butir soal pilihan ganda UAS genap mata pelajaran

IPS kelas V SD memiliki empat pilihan jawaban yaitu a, b, c, dan d. Selain

memperhatikan mengenai keberfungsian setiap pengecoh pada

masing-masing butir soal pilihan ganda, hal lain yang perlu diketahui adalah syarat

tes pilihan ganda yang baik.

b. Syarat Tes Pilihan Ganda

Kunandar (2014: 201) memaparkan beberapa syarat tes pilihan ganda

yang baik sebagai berikut.

1) Memiliki validitas yang tinggi. Artinya suatu tes mampu

mengungkapkan hasil belajar peserta didik secara tepat, sehingga

mampu mengukur apa yang ingin diukur.

2) Memiliki reliabilitas yang tinggi. Artinya suatu tes mampu

memberikan gambaran hasil tes yang relatif sama dan konsisten

tentang kompetensi yang dimiliki peserta didik walaupun tes

dilakukan berulang kali.

3) Memiliki tingkat kesukaran yang sesuai dengan pedoman

proporsi tingkat kesukaran soal UAS yang telah ditentukan yaitu

30% soal mudah, 50% soal sedang, dan 20% soal sulit.

4) Setiap butir soal memiliki daya pembeda yang baik. Artinya

(43)

telah memahami materi yang diujikan dengan peserta didik yang

belum memahami materi.

5) Serta tes pilihan ganda yang baik adalah mudah

diadministrasikan.

Pendapat tersebut diperkuat oleh pendapat Djiwandono (2008: 163)

yang menyatakan bahwa syarat butir soal yang baik adalah memiliki

validitas dan reliabilitas yang tinggi. Sementara itu, Basuki dan Hariyanto

(2014: 138) menambahkan bahwa syarat tes pilihan ganda yang baik yaitu

butir soal harus memiliki tingkat kesukaran (difficulty index), daya

pembeda (discriminating power), dan efektivitas pengecoh (distractor).

c. Kelebihan dan Kelemahan Tes Pilihan Ganda

Menurut Widoyoko (2009: 52-59), kelebihan tes pilihan ganda

adalah waktu mengerjakan sangat minimal, penskoran dapat dilakukan

secara objektif, tipe butir soal dapat disusun sedemikian rupa sehingga

menuntut kemampuan peserta tes membedakan berbagai tingkat kebenaran

sekaligus. Kelebihan lain dalam tes pilihan ganda adalah pilihan yang

disediakan melebihi dua sehingga mengurangi keinginan peserta tes untuk

menebak, tingkat kesukaran butir soal dapat diatur dengan hanya

mengubah tingkat homogenitas alternatif jawaban, dan informasi yang

diberikan lebih banyak.

Meskipun banyak kelebihan, tes bentuk pilihan ganda ini juga

(44)

lebih sulit dalam penyusunan butir soal, serta pengaruh kebiasaan peserta

tes terhadap tes bentuk pilihan ganda terhadap hasil peserta.

6. Analisis Butir Soal

Arikunto (2012: 222) menyatakan bahwa analisis butir soal adalah kegiatan

yang bertujuan untuk mengadakan identifikasi terhadap soal-soal yang baik dan

kurang baik, sehingga dapat diperoleh informasi mengenai kekurangan sebuah

soal untuk dapat diadakan perbaikan. Sementara itu, Basuki & Hariyanto (2014:

129) analisis butir soal adalah cara untuk menguji kecocokan atau kesesuaian,

tingkat kesukaran, dan perbedaan kemampuan dari setiap soal yang diujikan

kepada para peserta didik. Kubiszyn dan Borich (dalam Endrayanto dan

Harumurti, 2014: 259), analisis butir soal bertujuan memeriksa dan

mengidentifiikasi butir-butir soal yang kurang baik dan sudah baik dalam suatu

tes menggunakan teknik tertentu sehingga guru dapat melakukan perbaikan

butir-butir soal yang kurang baik tersebut. Dari ketiga pendapat para ahli mengenai

analisis butir soal, peneliti menyimpulkan bahwa analisis butir tes adalah suatu

metode atau cara yang digunakan untuk mengetahui kesalahan atau kekeliruan

dalam penyusunan tes, sehingga diperoleh tes yang berkualitas baik.

Basuki dan Hariyanto (2014: 131) berpendapat bahwa dalam melakukan

proses analisis butir soal terdapat dua cara yaitu yang dapat dilakukan pada

proses analisis butir soal yaitu analisis kualitatif dan analisis kuantitatif. Pendapat

tersebut diperkuat oleh Kubiszyn dan Borich (dalam Endrayanto dan Harumurti,

(45)

analisis kualitatif untuk mencakup tujuan tes atau penilaian, serta berdasarkan

kesesuaian materi yang terdapat pada butir soal yang diujikan dengan materi

yang telah disampaikan. Analisis kualitatif digunakan untuk menganalisis

validitas soal terutama validitas isi, sedangkan pada analisis kuantitatif

digunakan untuk menganalisis reliabilitas, tingkat kesukaran, daya pembeda, dan

efektivitas pengecoh.

7. Validitas

a. Definisi Validitas

Siregar (2013 : 46) mengemukakan bahwa validitas menunjukkan

sejauh mana suatu alat ukur mampu mengukur sesuatu yang ingin diukur.

Uno dan Koni (2012 : 151) bahwa validitas tes merupakan hubungan antara

ketepatan terhadap sesuatu yang mesti diukur oleh suatu tes dan seberapa

cermat tes melakukan pengukurannya. Djiwandono (2008: 164) validitas

adalah relevansi, kecocokan, atau kesesuaian antara suatu tes dengan jenis

kemampuan yang merupakan tujuan dari pengukuran. Arifin (2009: 247)

suatu tes dikatakan valid apabila dapat memberikan informasi yang sesuai

dan dapat digunakan untuk mencapai tujuan tertentu. Berdasarkan definisi

yang telah diuraikan peneliti menyimpulkan bahwa validitas adalah

(46)

b. Jenis-jenis Validitas

Menurut Arikunto (2012: 82-84) validitas dibagi menjadi empat

bagian yaitu validitas isi, validitas kontruksi, validitas “ada sekarang” atau

empiris, dan validitas prediksi.

1) Validitas Isi

Arikunto (2012: 82) sebuah tes dikatakan memiliki validitas isi

apabila mengukur tujuan tertentu yang sejajar dengan materi atau isi

pelajaran yang diberikan. Suraprana (2009: 51) mengemukakan bahwa

validitas isi sering juga disebut dengan validitas kurikulum yang

artinya, suatu alat ukur dikatakan valid apabila sesuai dengan

kurikulum yang hendak diukur. Azwar (2015: 175) validitas isi

menunjukkan sejauhmana butir soal dalam tes mencakup keseluruhan

isi yang ingin diukur oleh tes tersebut. Pengujian validitas isi tidak

perlu menggunakan analisis statistik tetapi menggunakan analisis

rasional dengan membandingkan butir soal apakah sudah sesuai

dengan kriteria yang ditentukan. Tujuan dilakukan uji validitas isi

adalah untuk mengetahui kesesuaian antara materi yang ada pada butir

soal dengan materi yang ingin diukur.

2) Validitas Kontruksi

Arikunto (2012: 83) validitas kontruksi adalah validitas yang

digunakan untuk mengukur sejauh mana hasil pengukuran dianggap

(47)

psikologi adalah kualitas psikologis yang kita asumsikan ada, supaya

dapat menjelaskan beberapa aspek perilaku atau ciri-ciri tingkah laku.

Kontruksi psikologis ini tidak dapat diukur langsung. Misalnya

pengukuran kreativitas. Tes yang digunakan tidak dapat langsung

mengukur kreativitas, tetapi hanya mengukur indikator-indikator dari

kreativitas. Endrayanto dan Harumurti (2014: 285) mengatakan bahwa

cara yang dilakukan guru untuk mendapatkan validitas kontruksi

dengan menelaah tes hasil belajar peserta didik dengaan cara

mencocokan pada ranah kognitif yang hendak diungkap berdasarkan

KD dan indikator.

3) Validitas “ada sekarang” atau validitas empiris

Arikunto (2012: 83) sebuah tes dikatakan memiliki validitas

empiris jika hasilnya dengan pengalaman. Artinya dalam hal ini hasil

tes dibandingkan dengan hasil tes yang telah diketahui. Pendapat

tersebut diperkuat oleh Sudjana (2010: 15) yang menyatakan bahwa

suatu tes dinyatakan valid dari segi validitas kesamaan apabila tes

tersebut memiliki persamaan atau korelasi tinggi dengan tes sejenis

yang telah ada.

4) Validitas Prediksi

Arikunto (2012: 64) sebuah tes dikatakan memiliki validitas

prediksi apabila mempunyai kemampuan meramalkan yang akan

(48)

(2009: 54) yang berpendapat bahwa suatu tes dikatakan memiliki

validitas prediksi apabila tes tersebut memiliki kemampuan untuk

memprediksi sesuatu yang terjadi di masa yang akan datang.

Berdasarkan pendapat yang telah diuraikan, peneliti dapat mengambil

kesimpulan bahwa penelitian ini menganalisis butir soal untuk melihat tingkat

validitas isi dari setiap butir soal. Hal ini dikarenakan validitas isi berhubungan

dengan kesanggupan tes untuk mengukur isi yang seharusnya diukur. Secara

sederhana dapat dikatakan bahwa tes yang disusun tidak boleh keluar dari isi

materi pelajaran yang ada di dalam kurikulum. Dalam hal ini, peneliti meninjau

kesesuaian materi yang diajarkan berdasarkan SK-KD pada materi IPS semester

II dengan materi yang diujikan, dikarenakan peneliti tidak mempunyai kisi-kisi

materi IPS dari Kecamatan Depok.

8. Reliabilitas

Siregar (2013: 55) bahwa reliabilitas digunakan untuk mengetahui sejauh

mana hasil pengukuran tetap konsisten, dengan melakukan pengukuran berulang

dengan menggunakan alat ukur yang sama. Jihad dan Haris (2012: 180)

mengatakan bahwa reliabilitas soal merupakan ukuran yang menyangkut tingkat

keajegan atau kekonsistenan suatu soal tes. Arifin, (2009: 258) berpendapat

bahwa reliabilitas adalah tingkat konsistensi dari suatu instrumen. Tes dikatakan

reliabel jika selalu memberikan hal yang sama bila diteskan pada kelompok yang

(49)

instrumen tes dikatakan dapat dipercaya (reliable) jika memberikan hasil yang

tetap atau ajeg (konsisten) apabila diteskan berkali-kali.

Berdasarkan definisi yang telah diuraikan dapat disimpulkan bahwa

reliabilitas merupakan ukuran yang menyatakan kekonsistenan alat atau

instrumen dalam menilai, artinya ketepatan hasil manakala alat penilaian tersebut

diberikan berulang-ulang pada objek yang sama pada waktu yang berbeda.

Dengan kata lain, suatu tes dikatakan reliabel jika perolehan dari suatu tes selalu

sama walaupun diberikan atau diujikan berkali-kali dalam waktu yang berbeda.

Guilford, (dalam Jihad dan Haris, 2012: 187) menjelaskan bahwa tingkat

reliabilitas suatu soal dapat ditentukan dengan berpedoman pada koefisien Alpha

seperti pada tabel 2.1 berikut.

Tabel 2.1 Tingkat Reliabilitas berdasarkan Koefisien Alpha

Koefisien Tingkat Reliabilitas

0,90 <r11≤ 1,00 Sangat Tinggi

0,70 <r11≤ 0,90 Tinggi

0,40 <r11≤ 0,70 Sedang

0,20 <r11≤0,40 Rendah

r11≤0,20 Sangat Rendah

(Sumber : Guilford, (dalam Jihad dan Haris, 2012: 187))

Berdasarkan tabel 2.1 mengenai Tingkat Reliabilitas dapat terlihat bahwa

terdapat lima (5) koefisien pada tingkat reliabilitas yang berhubungan dengan

(50)

koefisien dengan rentang 0,90 < r11 ≤ 1,00 menunjukkan tingkat reliabilitas

sangat tinggi, koefisien dengan rentang 0,70 < r11 ≤ 0,90 menunjukkan tingkat

reliabilitas tinggi, koefisien dengan rentang 0,40 < r11 ≤ 0,70 menunjukkan

tingkat reliabilitas cukup, koefisien dengan rentang 0,20 < r11 ≤ 0,40

menunjukkan tingkat reliabilitas rendah, dan koefisien dengan rentang r11≤0,20

menunjukkan tingkat reliabilitas sangat rendah. r11 pada kriteria tingkat

reliabilitas di atas menunjukkan koefisien reliabilitas. Berdasarkan pedoman

tersebut, maka peneliti dapat mengetahui tingkat reliabilitas berdasarkan

koefisien.

9. Tingkat Kesukaran

Penyusunan sebuah tes, seorang guru harus memperhatikan aspek

penyusunan tes, sehingga tes yang disusun menghasilkan kualitas yang baik.

Salah satu ciri atau kriteria agar tes dapat dikatakan memiliki kualitas yang baik

adalah yang tidak terlalu mudah atau tidak terlalu sukar. Sukardi (2008: 136)

tingkat kesukaran item atau yang sering disebut sebagai indeks kesulitan item

adalah angka yang menunjukan proporsi peserta didik yang menjawab betul

dalam suatu soal tes yang dilakukan dengan menggunakan tes objektif. Arikunto

(2012: 222) mengatakan bahwa soal yang berkualitas baik adalah soal yang tidak

terlalu mudah atau tidak terlalu sukar. Hal tersebut diperkuat oleh Endrayanto

dan Harumurti (2014: 261) yang mengemukakan bahwa butir soal yang baik

adalah butir soal yang tidak terlalu mudah dan tidak terlalu sukar. Soal yang

(51)

memecahkan suatu soal dalam tes. Soal yang terlalu sukar juga akan membuat

peserta didik putus asa untuk mencoba lagi menyelesaikan soalnya.

Uno dan Koni (2012: 156) analisis tingkat kesukaran digunakan untuk

mengkaji soal yang mudah, sedang dan sukar, sehingga bisa menyeimbangkan

pembagian atau proporsi soal yang mudah, sedang, dan sukar. Pendapat senada

disampaikan oleh Kunandar (2014: 201) yang menyatakan bahwa proporsi

jumlah soal dengan kategori tingkat kesukaran butir soal UAS adalah 30% soal

kategori mudah, 50% soal kategori sedang, dan 20% soal dengan kategori sukar.

Berdasarkan uraian di atas peneliti dapat menarik kesimpulan bahwa

analisis tingkat kesukaran butir soal adalah suatu cara yang digunakan untuk

mengetahui proporsi seberapa mudah atau sukar soal yang diujikan, serta dapat

digunakan untuk mengetahui kualitas soal tersebut baik atau tidak untuk

diberikan kepada peserta didik. Peneliti berpedoman pada pendapat ahli

mengenai proporsi jumlah soal dengan kategori tingkat kesukaran butir soal UAS

adalah 30% soal kategori mudah, 50% soal kategori sedang, dan 20% soal

dengan kategori sukar.

Uno dan Koni (2012 : 157) pada tingkat kesukaran dapat dihitung

menggunakan rumus seperti berikut.

=

Keterangan :

(52)

B = banyaknya peserta didik yang menjawab soal dengan betul

T = total seluruh peserta tes

Berdasarkan hasil penghitungan tingkat kesukaran butir soal maka akan

diperoleh koefisien tingkat kesukaran butir soal. Berikut ini akan ditampilkan

sebuah tabel yang berisi pedoman dalam menentukan kategori suatu butir tes

berdasarkan koefisien tingkat kesukaran butir soal menurut Kusaeri dan

Suprananto (2012: 175).

Tabel 2.2 Kategori Tingkat Kesukaran

Koefisien Tingkat Kesukaran Kategori Keputusan

0,7 – 1,00 Mudah Ditolak/direvisi 0,3 – 0,69 Sedang Diterima 0,0 – 0,29 Sulit Ditolak/direvisi

(Sumber : Kusaeri dan Suprananto (2012: 175))

Berdasarkan tabel 2.2 mengenai kategori tingkat kesukaran dapat diketahui

bahwa terdapat tiga kategori tingkat kesukaran. Pada tabel tersebut dapat terlihat

bahwa tingkat kesukaran dengan koefisien 0,70 – 1,00 menunjukkan butir soal

memiliki kategori mudah, tingkat kesukaran dengan koefisien 0,30 – 0,69

menunjukkan butir soal memiliki kategori sedang, dan tingkat kesukaran dengan

koefisien 0,00 – 0,29 menunjukkan butir soal memiliki kategori sukar.

Perbaikan pada butir soal dengan tingkat kesukaran mudah, sedang, dan

sukar dilakukan apabila proporsi tingkat kesukaran pada butir soal UAS belum

sesuai dengan pembagian kategori tingkat kesukaran. Kunandar (2014: 201)

memaparkan proporsi tingkat kesukaran pada butir soal UAS seperti pada tabel

(53)

Tabel 2.3 Proporsi Tingkat Kesukaran Kategori Tingkat

Kesukaran Butir Soal

Persentase (%)

Mudah 30%

Sedang 50%

Sukar 20%

(Sumber : Kunandar (2014: 201))

Berdasarkan tabel 2.3 mengenai proporsi tingkat kesukaran pada suatu soal

UAS dapat diketahui bahwa tingkat kesukaran soal UAS dapat dikatakan baik

apabila memiliki proporsi kategori soal mudah sebesar 30%, kategori soal sedang

sebesar 50%, dan kategori soal sukar sebesar 20%. Oleh karena itu, perbaikan

pada butir soal dapat dilakukan apabila proporsi tingkat kesukaran dengan

kategori mudah, sedang, dan sukar belum sesuai dengan proporsi tingkat

kesukaran soal UAS seperti yang telah diuraikan sebelumnya.

10. Daya Pembeda

Arifin (2009: 273) mengemukakan bahwa daya pembeda adalah

pengukuran sejauh mana suatu butir soal mampu membedakan peserta didik

yang sudah menguasai kompetensi dengan peserta didik yang belum /kurang

menguasai kompetensi berdasarkan kriteria tertentu. Pendapat lain dikemukakan

olehh Uno dan Koni (2012: 157) berpendapat bahwa daya pembeda tes

digunakan untuk mengkaji kemampuan soal untuk membedakan antara peserta

didik yang mempunyai prestasi tinggi dan yang mempunyai prestasi rendah. Hal

tersebut diperkuat oleh Azwar (2015: 137) berpendapat bahwa butir soal dapat

dinyatakan memiliki daya pembeda baik apabila butir soal tersebut dapat dijawab

(54)

materi dan dijawab salah oleh semua atau sebagian besar peserta didik yang

belum memahami materi yang diujikan.

Berdasarkan pendapat di atas dapat ditarik kesimpulan bahwa daya

pembeda adalah kemampuan butir soal tes untuk membedakan siswa berprestasi

tinggi yang sudah menguasai materi yang diujikan dengan siswa berprestasi

rendah yang belum menguasai materi yang diujikan.

Berikut ini adalah rumus yang dapat digunakan untuk menghitung daya

pembeda butir soal Azwar, (2015: 138)

= −

Keterangan :

DB = daya pembeda

niT = banyak peserta didik dari Kelompok Tinggi yang menjawab benar

NT = banyak peserta didik dari Kelompok Tinggi

niR = banyak peserta didik dari Kelompok Rendah yang menjawab benar

NR = banyak peserta didik dari kelompok Rendah

Berikut ini adalah tabel 2.4 yang menunjukkan kategori daya pembeda

berdasarkan pendapat Kunandar, (2014: 241)

Tabel 2.4 Kategori Daya Pembeda

Koefisien Daya Pembeda (DB) Kategori

0,40 atau lebih Sangat baik

(butir soal dapat diterima)

0,30 – 0,39 Butir soal cukup baik

(butir soal dapat diterima dengan perbaikan) 0,20 – 0,29 Sedang

(butir soal perlu pembahasan lebih lanjut dan perlu diperbaiki)

0,19 ke bawah Butir soal buruk

(butir soal ditolak atau dibuang dan diganti dengan butir lain)

(55)

Dari tabel 2.4 tersebut dapat dilihat, bahwa apabila hasil perhitungan

terhadap daya pembeda menunjukkan bahwa soal dapat dikategorikan dengan

kriteria yang sangat baik apabila memiliki koefisien daya pembeda dengan hasil

perhitungan 0,40 atau lebih. Koefisien daya pembeda dengan rentang 0,30 – 0,39

menunjukkan kategori butir soal cukup baik. Koefisien daya pembeda dengan

rentang 0,20 – 0,29 menunjukkan kategori butir soal sedang. Koefisien daya

pembeda dengan rentang kurang dari 0,19 menunjukkan kategori butir soal jelek.

11. Efektivitas Pengecoh

Purwanto (2009: 108) mengemukakan bahwa pengecoh atau distractor

merupakan pilihan jawaban yang bukan merupakan kunci jawaban. Sudijono

(2011: 409) yang mengatakan bahwa pengecoh adalah jawaban-jawaban yang

salah, kecuali kunci jawaban soal tersebut. Hal ini sesuai dengan pendapat

Djiwandono (2008: 225) yang mengemukakan bahwa kemiripan pengecoh

dengan kunci jawaban harus diusahakan sedemikian rupa sehingga hanya dapat

dikenali kekurangtepatannya melalui pemahaman dan telaah yang mendalam.

Tes juga dapat dikatakan memiliki kualitas yang baik, apabila melalui

tahap analisis efektivitas pengecoh. Uno dan Koni (2012: 157) mengemukakan

bahwa analisis efektivitas pengecoh digunakan untuk menentukan apakah

pengecoh (distractor) sudah berfungsi sebagai pengecoh dengan baik atau tidak.

Pendapat senada dikemukakan oleh Endrayanto dan Harumurti (2014: 270) yang

mengatakan bahwa untuk dapat mengetahui apakan pengecoh berfungsi atau

(56)

Berdasarkan pendapat ahli di atas dapat ditarik kesimpulan bahwa

efektivitas pengecoh adalah pilihan jawaban pada soal pilihan ganda yang

mempunyai kemiripan dengan jawaban yang benar, sehingga dapat mengecoh

jawaban yang tidak sama dengan kunci jawaban yang benar. Pengecoh

digunakan untuk mengecoh peserta didik dalam memilih jawaban soal. Pengecoh

yang baik adalah yang mampu membuat peserta didik harus melakukan

pemahaman terhadap pertanyaan dan jawaban yang benar.

Basuki dan Hariyanto (2014: 144) yang mengemukakan bahwa pengecoh

dapat dikatakan berfungsi dengan baik apabila pengecoh tersebut minimal dipilih

oleh 5% peserta tes. Hal senada diungkapkan oleh Sudijono (2011: 411) yang

mengatakan bahwa pengecoh dapat berfungsi dengan baik apabila pengecoh

tersebut sekurang-kurangnya telah dipilih oleh 5% dari seluruh peserta tes. Dari

kedua pendapat di atas maka dapat ditarik kesimpulan bahwa pengecoh dapat

dikatakan berfungsi dengan baik apabila pengecoh tersebut telah dipilih oleh

peserta tes sekurang-kurangnya 5% dari keseluruhan peserta tes. Pengecoh yang

tidak berfungsi dengan baik direkomendasikan untuk direvisi. Peneliti dapat

mengambil kesimpulan bahwa analisis efektivitas pengecoh adalah pilihan

jawaban befungsi baik apabila telah dipilih 5% dari seluruh peserta tes.

Arifin (2009: 279) menuliskan efektivitas pengecoh dapat dihitung

(57)

=

( − )

( −1)

100%

Keterangan:

IP = indeks pengecoh

P = jumlah peserta didik yang memilih pengecoh N = jumlah peserta didik yang mengikuti tes

B = jumlah peserta didik yang menjawab soal dengan benar pada setiap soal.

n = jumlah alternatif jawaban 1 = bilangan tetap

12.Software MicroCat Iteman versi 3.00(Iteman)

Pada penelitian ini peneliti menggunakan Iteman versi 3.00. Iteman versi

3.00 merupakan suatu perangkat atau program untuk menganalisis kuantitatif

butir soal. Hal ini sesuai dengan pendapat Kusaeri dan Suprananto (2012: 178)

yang mengemukakan bahwa Item and Test Analysis (Iteman) merupakan

perangkat lunak atau program yang dibuat dengan menggunakan bahasa

pemrogaman komputer yang khusus digunakan untuk analisis statistik butir soal.

Pada penelitian ini peneliti akan menganalisis hasil pengolahan data program

Iteman meliputi reliabilitas, tingkat kesukaran, daya pembeda, dan efektivitas

pengecoh butir soal. Pada reliabilitas dapat dilihat pada koefisien nilai Alphadari

Output Iteman. Prop. Correct dimaknai sebagai tingkat kesukaran butir soal.

Prop. Correct adalah proporsi peserta didik yang mengerjakan soal atau tes

menjawab benar. Daya pembeda dalam software Itemandinyatakan dalam Point

Biser. Point Biser adalah indeks daya pembeda soal dan pilihan jawaban dengan