Analisis butir soal pilihan ganda ulangan akhir semester genap tahun pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok.

(1)

ANALISIS BUTIR SOAL PILIHAN GANDA ULANGAN AKHIR SEMESTER GENAP TAHUN PELAJARAN 2014/2015 MATA PELAJARAN

BAHASA INDONESIA KELAS IV SD DI KECAMATAN DEPOK

Oleh: Tina Yuniasari NIM: 121134130

Kualitas suatu tes dapat diketahui dengan cara melakukan analisis pada setiap butir soalnya. Di Kecamatan Depok sangat jarang dilakukan penelitian mengenai analisis butir soal. Dengan demikian, penelitian ini memiliki tujuan untuk mengetahui validitas isi, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh soal pilihan ganda Ulangan Akhir Semester (UAS) Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia Kelas IV SD di Kecamatan Depok.

Jenis penelitian ini adalah kuantitatif deskriptif. Data dalam penelitian ini dikumpulkan melalui dua metode, yaitu dokumentasi dan wawancara. Populasi dalam penelitian ini adalah 49 SD di Kecamatan Depok dan sampel pada penelitian ini adalah 28 SD di Kecamatan Depok. Instrumen yang digunakan berupa check list. Teknik analisis data menggunakan software Item and Test

Analysis (ITEMAN) versi 3.00.

Hasil penelitian menunjukkan bahwa butir soal UAS memiliki validitas yang sebagian besar valid dengan hasil persentase sebesar 96,7%, memiliki reliabilitas tinggi dengan koefisien reliabilitas sebesar 0,777, memiliki tingkat kesukaran dalam kategori sangat mudah dengan hasil sebesar 40%, memiliki daya beda dalam kategori bagus sekali dengan hasil sebesar 50%, dan memiliki efektivitas pengecoh yang berfungsi dengan baik dengan hasil 53,3%.

(2)

THE ANALYSIS OF MULTIPLE CHOICE ITEMS IN THE LAST SEMESTER’S FINAL TEST OF THE ACADEMIC YEAR 2014/2015 ON BAHASA INDONESIA SUBJECT GRADE 4 ELEMENTARY SCHOOL IN

DEPOK DISTRICT

By: Tina Yuniasari NIM: 121134130

The quality of a test can be detected by analyzing on each item from the questions. Depok district rarely uses an analysis of the test items. Therefore, the aim of this research was to know about the content validity, reliability, level of

difficulty, different power, and the effectiveness of the test’s humbug in a multiple choice test in the last semester’s final test of the academic year 2014/2015 on

Bahasa Indonesia subject grade 4 elementary school in Depok district.

The type of this research was descriptive quantitative. The techniques for gathering the data in this research were documentation and interview techniques. The population for this research was 49 Elementary Schools and the sample was 26 Elementary Schools in Depok district. The instrument which was used in this research is check list. The researcher used Item and Test Analysis (ITEMAN) software 3.00 version to analyze the data.

The result showed that the test items of last semester final test had a validity which largely valid with the percentage 96,7% and had a high reliability with reliability coefficient 0,777, had a level of difficulty in the category of very easy with the percentage 40%, had a level of different power in a good category with the percentage 50% and also had a level of test’s humbug which had a good function with the percentage 53,3%.

(3)

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Pendidikan Program Studi Pendidikan Guru Sekolah Dasar

Oleh: Tina Yuniasari

121134130

PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA

(4)

i

SKRIPSI

Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Pendidikan Program Studi Pendidikan Guru Sekolah Dasar

Oleh: Tina Yuniasari

121134130

PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR JURUSAN ILMU PENDIDIKAN

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS SANATA DHARMA

(5)

(6)

(7)

iv

HALAMAN PERSEMBAHAN

Karya ini dipersembahkan untuk:

 Allah SWT

 Kedua orang tua saya Jaeno dan Sunaryanti

 Kakak saya Dony Slamet Turyanto

 Teman-teman seperjuangan dan

teman-teman payung

 Sahabat-sahabat tercinta

(8)

v

MOTTO

“Maka sesungguhnya bersama kesulitan ada kemudahan. Sesungguhnya bersama

kesulitan ada kemudahan. Maka apabila engkau telah selesai (dari suatu urusan), tetaplah bekerja keras (untuk urusan yang lain). Dan hanya kepada Tuhanmulah engkau berharap.”

(QS. Al-Insyirah, 6-8)

Build your dreams, or someone else will hire you to build theirs

-Farrah Gray-

If a child can’t learn the way we teach, maybe we should teach the way they learn

-Ignacio Estrada-

Sesuatu yang belum dikerjakan seringkali tampak mustahil, kita baru yakin kalau

kita telah berhasil melakukannya dengan baik.

(9)

(10)

(11)

viii

ABSTRAK

Tina Yuniasari Universitas Sanata Dharma

2016

Kualitas suatu tes dapat diketahui dengan cara melakukan analisis pada setiap butir soalnya. Di Kecamatan Depok sangat jarang dilakukan penelitian mengenai analisis butir soal. Dengan demikian, penelitian ini memiliki tujuan untuk mengetahui validitas isi, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh soal pilihan ganda Ulangan Akhir Semester (UAS) Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia Kelas IV SD di Kecamatan Depok.

Jenis penelitian ini adalah kuantitatif deskriptif. Data dalam penelitian ini dikumpulkan melalui dua metode, yaitu dokumentasi dan wawancara. Populasi dalam penelitian ini adalah 49 SD di Kecamatan Depok dan sampel pada penelitian ini adalah 28 SD di Kecamatan Depok. Instrumen yang digunakan berupa check list. Teknik analisis data menggunakan software Item and Test

Analysis (ITEMAN) versi 3.00.

Hasil penelitian menunjukkan bahwa butir soal UAS memiliki validitas yang sebagian besar valid dengan hasil persentase sebesar 96,7%, memiliki reliabilitas tinggi dengan koefisien reliabilitas sebesar 0,777, memiliki tingkat kesukaran dalam kategori sangat mudah dengan hasil sebesar 40%, memiliki daya beda dalam kategori bagus sekali dengan hasil sebesar 50%, dan memiliki efektivitas pengecoh yang berfungsi dengan baik dengan hasil 53,3%.

(12)

ix ABSTRACT

THE ANALYSIS OF MULTIPLE CHOICE ITEMS IN THE LAST

SEMESTER’S FINAL TEST OF THE ACADEMIC YEAR 2014/2015 ON

BAHASA INDONESIA SUBJECT GRADE 4 ELEMENTARY SCHOOL IN DEPOK DISTRICT

Tina Yuniasari

Sanata Dharma University

2016

The quality of a test can be detected by analyzing on each item from the questions. Depok district rarely uses an analysis of the test items. Therefore, the aim of this research was to know about the content validity, reliability, level of

difficulty, different power, and the effectiveness of the test’s humbug in a multiple choice test in the last semester’s final test of the academic year 2014/2015 on

Bahasa Indonesia subject grade 4 elementary school in Depok district.

The type of this research was descriptive quantitative. The techniques for gathering the data in this research were documentation and interview techniques. The population for this research was 49 Elementary Schools and the sample was 26 Elementary Schools in Depok district. The instrument which was used in this research is check list. The researcher used Item and Test Analysis (ITEMAN) software 3.00 version to analyze the data.

The result showed that the test items of last semester final test had a validity which largely valid with the percentage 96,7% and had a high reliability with reliability coefficient 0,777, had a level of difficulty in the category of very easy with the percentage 40%, had a level of different power in a good category with

the percentage 50% and also had a level of test’s humbug which had a good

function with the percentage 53,3%.

(13)

x

KATA PENGANTAR

Puji syukur peneliti panjatkan ke hadirat Allah SWT. yang telah melimpahkan rahmat, hidayah, serta inayahNya kepada peneliti sehingga peneliti dapat menyelesaikan tugas skripsi yang berjudul “Analisis Butir Soal Pilihan Ganda Ulangan Akhir Semester Genap Tahun Pelajaran 2014/2015 Mata Pelajaran Bahasa Indonesia Kelas IV SD di Kecamatan Depok”. Skripsi ini disusun sebagai salah satu syarat memperoleh gelar Sarjana Pendidikan Guru Sekolah Dasar, Fakultas Keguruan dan Ilmu Pendidikan Universitas Sanata Dharma, Yogyakarta. Peneliti menyadari bahwa penulisan skripsi ini tidak akan berhasil tanpa bimbingan, arahan, dan bantuan dari berbagai pihak. Dengan demikian, peneliti ingin menyampaikan ucapan terimakasih yang sebesar-besarnya kepada:

1. Rohandi, Ph.D., Dekan Fakultas Keguruan dan Ilmu Pendidikan yang telah memberikan izin kepada peneliti untuk melakukan penelitian skripsi.

2. Christiyanti Aprinastuti, S.Si., M.Pd., Ketua Program Studi PGSD yang telah memberikan kesempatan dan dukungan peneliti untuk melakukan penelitian. 3. Apri Damai Sagita Krissandi, S.S., M.Pd., Wakil ketua program studi PGSD

yang telah memberikan dukungan kepada peneliti untuk segera menyelesaikan skripsi.

4. Maria Melani Ika Susanti, S.Pd., M.Pd., dosen pembimbing I yang telah memberikan bimbingan, arahan, waktu, tenaga, pikiran, dan kesabaran kepada peneliti untuk dapat menyelesaikan skripsi.

5. Irine Kurniastuti, S.Psi., M.Psi., dosen pembimbing II yang telah memberikan dorongan, bimbingan, arahan, waktu, tenaga, dan pikiran kepada peneliti untuk dapat menyelesaikan skripsi

6. Segenap dosen dan staf sekretariat Program Studi Pendidikan Guru Sekolah Dasar Universitas Sanata Darma.

(14)

(15)

(16)

xiii

C. Populasi dan Sampel ... 45

D. Variabel Penelitian ... 49

E. Teknik Pengumpulan Data ... 49

F. Instrumen Penelitian ... 50

G. Teknik Analisis Data ... 52

BAB IV HASIL PENELITIAN DAN PEMBAHASAN ... 59

A. Deskripsi Penelitian ... 59

B. Hasil Penelitian ... 60

1. Validitas Isi ... 60

2. Reliabilitas ... 69

3. Tingkat Kesukaran ... 71

4. Daya Beda ... 76

5. Efektifitas Pengecoh ... 82

C. Pembahasan ... 98

1. Validitas Isi ... 98

2. Reliabilitas ... 100

3. Tingkat Kesukaran ... 102

4. Daya Beda ... 103

5. Efektifitas Pengecoh ... 105

BAB V PENUTUP ... 108

A. Kesimpulan ... 108

B. Keterbatasan Penelitian ... 109

C. Saran ... 110

DAFTAR REFERENSI ... 111

LAMPIRAN ... 115

(17)

xiv

DAFTAR TABEL

Tabel 2.1 Kategori Korelasi Reliabilitas ... 26

Tabel 2.2 Tingkat Kesukaran dalam Tiga Kategori (1) ... 28

Tabel 2.3 Tingkat Kesukaran dalam Tiga Kategori (2) ... 28

Tabel 2.4 Tingkat Kesukaran dalam Lima Kategori ... 29

Tabel 2.5 Kategori Daya Beda (1) ... 30

Tabel 2.8 Standar Kompetensi dan Kompetensi Dasar ... 35

Tabel 3.1 Daftar Nama SD di Kecamatan Depok ... 45

Tabel 3.2 Daftar Nama SD yang Diteliti ... 48

Tabel 3.3 Instrumen Penelitian Check List ... 51

Tabel 4.1 Tabel Validitas Isi ... 61

Tabel 4.2 Hasil Persentase Validitas Isi ... 68

Tabel 4.3 Kategori Koefisien Reliabilitas ... 69

Tabel 4.4 Reliability Statistics ... 70

Tabel 4.5 Kategori Tingkat Kesukaran ... 71

Tabel 4.6 Hasil Tingkat Kesukaran ... 74

Tabel 4.7 Hasil Persentase Tingkat Kesukaran ... 75

Tabel 4.8 Kategori Daya Beda ... 77

Tabel 4.9 Indeks Daya Beda ... 80

Tabel 4.10 Hasil Persentase Daya Beda ... 81

Tabel 4.11 Hasil Efektivitas Pengecoh ... 83

(18)

xv

DAFTAR GAMBAR

Gambar 2.1. Literature Map ... 40

Gambar 3.1 Input Data ... 52

Gambar 3.2 Program ITEMAN ... 53

Gambar 3.3 Output ITEMAN ... 54

Gambar 3.4 Output ITEMAN Reliabilitas ... 55

Gambar 4.1 Pie Chart Validitas Isi ... 68

Gambar 4.2 Output ITEMAN Tingkat Kesukaran Nomor 11 ... 72

Gambar 4.3 Output ITEMAN Tingkat Kesukaran Nomor 14 ... 73

Gambar 4.4 Pie Chart Tingkat Kesukaran ... 76

Gambar 4.5 Output ITEMAN Tingkat Kesukaran dan Daya Beda ... 79

Gambar 4.6 Pie Chart Daya Beda ... 81

Gambar 4.7 Output ITEMAN Efektivitas Pengecoh Nomor 30 ... 95

(19)

xvi

DAFTAR LAMPIRAN

Lampiran 1. Surat izin melakukan penelitian ... 116

Lampiran 2. Surat keterangan melakukan penelitian ... 117

Lampiran 3. Daftar nama mahasiswa kelompok payung ... 118

Lampiran 4. Soal pilihan ganda UAS genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD ... 119

Lampiran 5. Kunci Jawaban UAS genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD ... 125

Lampiran 6. Lembar jawab siswa ... 126

Lampiran 7. Daftar check list ... 127

Lampiran 8. Kisi-kisi soal ... 128

Lampiran 9. Output ITEMAN ... 131

Lampiran 10. Rekapan hasil validitas isi, tingkat kesukaran, daya beda, dan efektivitas pengecoh ... 135

Lampiran 11. Data dan skor siswa dari kelompok atas ... 139

(20)

1

BAB I

PENDAHULUAN

A. Latar Belakang

Pendidikan merupakan investasi yang sangat baik dan juga berharga bagi masa depan semua orang. Pendidikan adalah usaha sadar

dan bertujuan untuk mengembangkan kualitas manusia (Djamarah, 2005: 22). Tercapainya suatu pendidikan dapat dilihat dari sistem evaluasinya.

Evaluasi sebagai tolok ukur sejauh mana, dalam hal apa, dan bagian mana tujuan pendidikan sudah tercapai. Evaluasi dalam pendidikan berdasarkan Undang-Undang tentang Sistem Pendidikan Nasional nomor 20 Tahun

2003 memiliki arti sebagai kegiatan pengendalian mutu pendidikan secara nasional sebagai bentuk akuntabilitas penyelenggara pendidikan kepada

pihak-pihak yang berkepentingan. Sanjaya (dalam Putra, 2013: 88) mengungkapkan bahwa evaluasi dalam pendidikan memiliki fungsi di

antaranya yaitu sebagai umpan balik bagi peserta didik, mengetahui proses ketercapaian peserta didik dalam menguasai tujuan yang telah ditentukan, memberikan informasi untuk mengembangkan program kurikulum, serta

sebagai umpan balik untuk semua pihak yang berkepentingan dengan pendidikan di sekolah.

Untuk memperoleh hasil dari evaluasi dalam pembelajaran, perlu adanya suatu instrumen penilaian yaitu salah satunya adalah tes. Untuk mengetahui kualitas suatu tes, perlu dilakukan analisis pada setiap butir

(21)

melakukan analisis butir soal, yaitu analisis tingkat kesukaran, analisis daya pembeda, analisis validitas, dan analisis reliabilitas. Menurut Azwar (2013: 141) dalam analisis butir soal perlu juga dianalisis efektivitas

distraktornya atau dapat disebut juga pengecoh, hal ini bertujuan untuk mengetahui berfungsi atau tidaknya pilihan jawaban yang tersedia.

Analisis pada umumnya dilakukan melalui dua cara, yaitu analisis kualitatif (qualitatif control) dan analisis kuantitatif (quantitatif control) (Surapranata, 2004: 1). Analisis kualitatif digunakan untuk menguji

validitas, sedangkan analisis kuantitatif digunakan untuk menguji reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh.

Berdasarkan hasil wawancara peneliti terhadap beberapa guru Sekolah Dasar (SD) di Kecamatan Depok, analisis butir soal sangat jarang dilakukan. Menurut Kepala SD Negeri Samirono, analisis butir soal

pernah dilaksanakan oleh mahasiswa Universitas Negeri Yogyakarta, namun pada sekitar 15 tahun yang lalu. Hasil wawancara dari salah satu pegawai UPTD juga serupa, beliau menyatakan bahwa jarang sekali

terdapat penelitian mengenai analisis butir soal di Kecamatan Depok dengan cara menguji validitas, reliabilitas, tingkat kesukaran, daya beda,

dan efektivitas pengecohnya, beliau menyatakan bahwa biasanya peneliti lain hanya menguji validitas dan reliabilitasnya saja dari soal Ulangan Akhir Semester (UAS). Hal tersebut menunjukkan bahwa penelitian

analisis butir soal dengan cara menguji validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh memang sangat jarang

(22)

Salah satu butir soal yang jarang dianalisis yaitu butir soal pada mata pelajaran Bahasa Indonesia. Bahasa Indonesia merupakan mata pelajaran yang memberikan pemahaman kepada guru dan peserta didik SD

dalam melaksanakan pembelajaran Bahasa Indonesia yang benar melalui membaca dan menulis (Zulela, 2012: 1). Untuk mencapai

kompetensi-kompetensi pada mata pelajaran Bahasa Indonesia, alangkah baiknya jika soal memiliki validitas yang sesuai, terkhusus validitas isinya karena suatu alat ukur dipandang valid apabila sesuai dengan isi kurikulum yang

hendak diukur (Mulyasa, 2009: 51). Selain itu, menurut pendapat Sudjana (2012: 17) soal yang baik juga harus memiliki koefisien reliabilitas yang

tinggi yang artinya soal memiliki keajegan atau ketetapan, sedangkan Purwanto (2009: 99) berpendapat bahwa soal diusahakan harus memiliki tingkat kesukaran yang sedang, memiliki daya beda positif dan setinggi

mungkin, serta memiliki efektivitas pengecoh yang berfungsi dengan baik. Pada semester genap kelas IV SD terdiri dari Standar Kompetensi 5 (mendengarkan), 6 (berbicara), 7 (membaca), dan 8 (menulis). Standar

Kompetensi 5 terdiri dari dua Kompetensi Dasar, Standar Kompetensi 6 terdiri dari dua Kompetensi Dasar, Standar Kompetensi 7 terdiri dari tiga

Kompetensi Dasar, dan Standar Kompetensi 8 terdiri dari tiga Kompetensi Dasar. Jadi, pada kelas IV semester genap terdiri dari empat Standar Kompetensi dan sepuluh Kompetensi Dasar.

Peneliti mengangkat masalah ini untuk mengetahui kualitas butir soal pilihan ganda melalui analisis butir soal dengan cara analisis kualitatif

(23)

mengetahui seberapa besar atau seberapa tinggi reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh soal. Alasan peneliti memilih soal pilihan ganda karena pada soal jenis tersebut bersifat

obyektif bukan subyektif, artinya dalam penilaian tidak ada pengaruh dari guru karena jawaban dalam soal pilihan ganda hanya ada satu dan bersifat

mutlak.

Peneliti melaksanakan analisis butir soal pilihan ganda ulangan akhir semester genap mata pelajaran Bahasa Indonesia kelas IV SD di

Kecamatan Depok, Sleman. Peneliti memilih melakukan penelitian di kelas IV pada mata pelajaran Bahasa Indonesia karena peneliti tertarik

untuk mengetahui seberapa baik kualitas soal pada mata pelajaran tersebut. Seiring dengan kemajuan teknologi dan informasi yang semakin canggih, peneliti ingin mengetahui seberapa besar dunia pendidikan mampu

mengembangkan dan meningkatkan salah satu budaya Indonesia yaitu Bahasa Indonesia pada anak-anak kelas IV SD.

Alasan peneliti memilih kelas IV karena menurut Piaget (Nuryanti,

2008: 21) pada usia kelas IV atau usia 7-11 tahun masuk dalam periode operasional konkret, mereka baru bisa menerima materi yang konkret dan

belum dapat menerima materi-materi yang masih abstrak. Namun, pada periode operasional konkret anak sudah mulai berpikir secara rasional. Hal tersebut membuat peneliti ingin meneliti lebih jauh lagi tentang

pemahaman mereka terhadap mata pelajaran Bahasa Indonesia karena pada umumnya mata pelajaran Bahasa Indonesia dijelaskan melalui

(24)

mana siswa kelas IV memahami mata pelajaran Bahasa Indonesia melalui jawaban dari soal ulangan akhir semester genap khususnya pada seluruh peserta didik di kecamatan Depok.

Kecamatan Depok memiliki beberapa keistimewaan, diantaranya adalah adanya berbagai obyek sarana pendidikan seperti SD, SMP/MTS,

SMA/SMK, dan Perguruan Tinggi. Salah satu Perguruan Tinggi yang ada di Kecamatan Depok adalah Universitas Sanata Dharma. Pada Kecamatan Depok terdiri dari tiga desa yaitu desa Caturtunggal, Condongcatur, dan

Maguwoharjo. Kecamatan Depok terdiri dari 9 Gugus Depan (Gudep). Selain itu, Kecamatan Depok terdiri dari 37 SD Negeri, dan 12 SD Swasta.

Dari 49 SD tersebut, 5 SD diantaranya pada saat ini telah menerapkan kurikulum 2013. SD yang menerapkan kurikulum 2013 adalah SD Negeri Nogopuro, SD Negeri Babarsari, SD Muhammadiyah Condongcatur, SD

Budi Mulia Dua Seturan, dan Budi Mulia Dua Pandansari. Dengan adanya penelitian ini diharapkan mampu memberikan tambahan wawasan dan pengetahuan untuk pihak-pihak yang terlibat seperti UPTD, sekolah, dan

guru.

B. Pembatasan Masalah

Penelitan ini dibatasi pada analisis butir soal yang meliputi

validitas isi, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh. Penelitian dilakukan pada 28 SD yang terdiri dari 24 SD Negeri dan 4 SD Swasta di Kecamatan Depok. Peneliti melaksanakan penelitian

(25)

penilaian dalam kurikulum tersebut masih terpisah-pisah atau lebih ke basis per mata pelajaran sehingga peneliti dapat melakukan analisis soal pada mata pelajaran Bahasa Indonesia kelas IV tahun pelajaran 2014/2015.

C. Rumusan Masalah

Rumusan masalah dalam penelitian ini adalah sebagai berikut:

1. Bagaimanakah validitas isi pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran

Bahasa Indonesia kelas IV SD di Kecamatan Depok?

2. Bagaimanakah reliabilitas pada butir soal pilihan ganda Ulangan

Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok?

3. Bagaimanakah tingkat kesukaran pada butir soal pilihan ganda

Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok?

4. Bagaimanakah daya beda pada butir soal pilihan ganda Ulangan Akhir

Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok?

(26)

D. Tujuan Penelitian

Penelitian ini memiliki tujuan sebagai berikut:

1. Mengetahui validitas isi pada butir soal pilihan ganda Ulangan Akhir

Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok.

2. Mengetahui reliabilitas pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok.

3. Mengetahui tingkat kesukaran pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran

Bahasa Indonesia kelas IV SD di Kecamatan Depok.

4. Mengetahui daya beda pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata pelajaran Bahasa

Indonesia kelas IV SD di Kecamatan Depok.

5. Mengetahui efektivitas pengecoh pada butir soal pilihan ganda Ulangan Akhir Semester genap Tahun Pelajaran 2014/2015 mata

pelajaran Bahasa Indonesia kelas IV SD di Kecamatan Depok.

E. Manfaat Penelitian

Manfaat pada penelitian ini adalah sebagai berikut: 1. Manfaat Teoritis

(27)

b. Dapat menambah pengetahuan dalam bidang pendidikan, terutama dalam bidang evaluasi pendidikan.

2. Manfaat Praktis

a. Bagi Guru

1) Guru mendapatkan informasi agar lebih baik dalam membuat

soal khususnya pada mata pelajaran Bahasa Indonesia.

2) Hasil dari penelitian ini dapat menjadi bahan pertimbangan bagi guru dalam membuat soal tes yang sesuai dengan

rencana pembelajaran dan silabus. b. Bagi Sekolah

1) Hasil penelitian dapat digunakan sebagai bahan pertimbangan pada perencanaan sekolah pada masa berikutnya.

2) Dapat digunakan sebagai perbaikan kualitas pendidikan di

sekolah. c. Bagi UPTD

Hasil dari penelititan ini dapat memberikan masukan tentang

kualitas butir soal ulangan akhir semester SD agar kualitas dapat ditingkatkan dan diperhatikan dengan lebih baik lagi.

d. Bagi Peneliti

1) Peneliti dapat menambah wawasan dan pengetahuan tentang kualitas soal-soal ulangan akhir semester SD khususnya pada

(28)

2) Peneliti mendapatkan pengalaman secara langsung untuk menganalisis soal-soal ulangan akhir semester SD khususnya pada mata pelajaran bahasa Indonesia yang dibuat oleh

Dinas Pendidikan.

F. Definisi Operasional

Beberapa istilah yang digunakan dalam penelitian ini adalah sebagai berikut:

1. Analisis Butir Soal

Analisis butir soal adalah pengkajian dari pertanyaan-pertanyaan

dalam instrumen yang digunakan untuk mengukur kemampuan dalam proses pembelajaran meliputi validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektvitas pengecoh.

2. Validitas Isi

Validitas isi adalah pengujian validitas terhadap kesesuaian antara

suatu alat ukur dengan isi atau materi yang telah diberikan dengan cara mencocokkan antara soal dengan kisi-kisi soal.

3. Reliabilitas

Reliabilitas adalah ketetapan hasil suatu tes yang dilaksanakan secara berkali-kali, diberikan pada kelompok yang sama dalam waktu yang

berbeda.

4. Tingkat Kesukaran

Tingkat kesukaran adalah pengukuran kesulitan suatu soal berupa

(29)

5. Daya Beda

Daya beda adalah daya untuk membedakan kelompok dengan pengetahuan yang tinggi dan kelompok dengan pengetahuan yang

rendah.

6. Efektivitas Pengecoh

Efektivitas pengecoh adalah penyebaran pilihan jawaban yang digunakan untuk menguji peserta didik dalam pemahaman materi. 7. Pilihan Ganda

Pilihan ganda adalah tipe tes yang terdiri dari sebuah pertanyaan atau pernyataan yang memiliki beberapa alternatif pilihan jawaban.

8. Mata Pelajaran Bahasa Indonesia

Mata pelajaran Bahasa Indonesia merupakan suatu mata pelajaran yang memberikan pengetahuan dan pemahaman pada siswa tentang

(30)

11

BAB II

KAJIAN PUSTAKA

A. Landasan Teori 1. Evaluasi

a. Pengertian Evaluasi

Putra (2013: 71) mengartikan evaluasi sebagai proses sistematis untuk menentukan atau membuat keputusan sampai sejauh

mana tujuan-tujuan pengajaran dicapai oleh peserta didik. Arifin (2009: 5) berpendapat bahwa evaluasi merupakan suatu proses yang dilakukan secara sistematis dan berkelanjutan, dalam arti terencana,

sesuai dengan prosedur dan prinsip serta dilakukan secara terus-menerus. Evaluasi dipandang sebagai suatu proses bukan hasil

(produk). Hasil yang diperoleh dari proses evaluasi yaitu kualitas tentang nilai dan arti.

Evaluasi adalah pemberian keputusan tentang nilai sesuatu

yang yang mungkin dilihat dari segi tujuan, gagasan, cara bekerja, pemecahan, metode, materi, dan lain-lain (Sudjana, 2012: 28). Dari

segi tersebut maka perlu adanya kriteria atau standar tertentu dalam evaluasi. Untuk mempermudah mengetahui tingkat kemampuan

evaluasi seseorang, item dalam suatu tes harus menyebutkan kriteria secara jelas.

Dari definisi di atas dapat disimpulkan bahwa evaluasi

(31)

memberikan keputusan dalam ketercapaian tujuan yang memiliki kriteria atau standar tertentu. Evaluasi menjadi tolok ukur sejauh mana, dalam hal apa, dan bagian mana tujuan pendidikan sudah

tercapai. Dengan demikian, evaluasi juga dapat dijadikan sebagai bahan perbaikan mutu dalam pendidikan.

b. Tujuan Evaluasi

Evaluasi merupakan peranan penting dalam pendidikan karena memiliki beberapa tujuan yang baik. Tujuan evaluasi menurut

pernyataan Arifin (2009: 6) adalah untuk menentukan kualitas sesuatu, terutama yang berkenaan dengan nilai dan arti. Nilai dan arti

dalam proses evaluasi harus ada pemberian pertimbangan. Pemberian pertimbangan tentang nilai dan arti harus berdasarkan keriteria. Kiteria yang digunakan dapat berasal dari apa yang dievaluasi

(internal) dan juga dapat berasal dari luar apa yang dievaluasi.

Putra (2013: 82) berpendapat bahwa tujuan evaluasi dalam bidang pendidikan ada dua. Tujuan evaluasi yang pertama adalah

untuk menghimpun berbagai keterangan yang akan dijadikan sebagai bukti perkembangan yang dialami oleh para peserta didik setelah

mereka mengikuti proses pembelajaran dalam jangka waktu tertentu. Tujuan yang kedua adalah untuk mengetahui tingkat efektivitas dari berbagai metode pembelajaran yang telah digunakan dalam proses

pembelajaran.

Sudjana (2012: 2) mengemukakan pendapatnya mengenai

(32)

tercapai atau tidaknya tujuan instruksional dalam hal perubahan tingkah laku peserta didik saja. Tujuan evaluasi juga dapat digunakan sebagai umpan balik bagi upaya memperbaiki proses belajar

mengajar.

Berdasarkan tiga definisi di atas, tujuan evaluasi adalah untuk

menghimpun bukti ketercapaian proses belajar peserta didik. Evaluasi juga bertujuan sebagai upaya perbaikan pada proses belajar mengajar untuk mengetahui atau menemukan faktor-faktor penyebab

keberhasilan dan ketidakberhasilan peserta didik dalam mengikuti program pendidikan. Dengan demikian, akan ditemukan jalan keluar

atau cara-cara perbaikan pada kegiatan pembelajaran. c. Fungsi Evaluasi

Pada dasarnya diadakannya evaluasi bukanlah semata-mata

hanya untuk formalitas saja, namun evaluasi memiliki beberapa fungsi yang sangat penting. Menurut pendapat Putra (2013: 84) evaluasi memiliki tiga fungsi pokok yaitu untuk mengukur kemajuan,

menunjang penyusunan rencana, dan memperbaiki atau melakukan penyempurnaan kembali. Sebelumnya telah dijelaskan bahwa evaluasi

merupakan suatu proses yang sistematis untuk mengukur atau memberikan keputusan dalam ketercapaian tujuan yang memiliki kriteria atau standar tertentu. Evaluasi yang dilakukan secara terus

menerus dapat membuat perkiraan ketercapaian tujuan yang telah dirumuskan pada waktu yang telah ditentukan. Oleh karena itu,

(33)

pengkajian ulang terhadap rencana yang telah disusun dan memperbaiki pelaksanaannya.

2. Instrumen Penelitian

1) Pengertian Instrumen Penelitian

Instrumen penelitian adalah suatu alat yang dapat digunakan untuk mempermudah seseorang dalam melaksanakan tugas atau mencapai tujuan secara lebih lebih efektif dan efisien (Arikunto, 2012:

40). Sugiyono (2014: 148) menjelaskan bahwa instrumen penelitian merupakan suatu alat yang digunakan untuk mengukur fenomena alam

maupun sosial yang diamati. Instrumen dalam penelitian dapat dibedakan menjadi dua macam, yaitu instrumen tes dan instrumen non tes (Widoyoko, 2012: 52).

Berdasarkan definisi-definisi di atas, dapat disimpulkan bahwa instrumen penelitian merupakan alat ukur yang digunakan untuk mengukur sesuatu yang akan diteliti.

2) Instrumen Tes 1) Pengertian Tes

Tes adalah sejumlah pertanyaan yang membutuhkan jawaban, atau sejumlah pernyataan yang harus diberikan

tanggapan dengan tujuan mengukur tingkat kemampuan seseorang atau mengungkap aspek tertentu dari orang yang dikenai tes (Mardapi, 2008: 67). Pengertian tes yang selanjutnya

(34)

prosedur yang dipergunakan dalam rangka pengukuran dan penilaian. Sedangkan menurut Azwar (1996: 2) tes merupakan sekumpulan pertanyaan yang harus dijawab dan/atau tugas yang

harus dikerjakan yang akan memberikan informasi mengenai aspek psikologis tertentu berdasarkan jawaban terhadap

pertanyaan-pertanyaan atau cara dan hasil subjek dalam melakukan tugas-tugas tersebut.

Dari definisi-definisi di atas dapat disimpulkan bahwa tes adalah

sejumlah pertanyaan atau penyataan yang memerlukan suatu jawaban yang digunakan sebagai pengukuran atau penilaian

dalam aspek tertentu. 2) Jenis Tes

Sudijono (2011: 68-72) menyatakan bahwa tes memiliki jenis

atau golongan yang tergantung dari segi mana atau dengan alasan apa penggolongan tes itu dilakukan. Berdasarkan fungsinya, jenis tes terdiri dari:

a) Tes Seleksi

Tes ini biasanya digunakan untuk memilih calon peserta

didik yang tergolong paling baik dari beberapa calon yang mengikuti tes.

b) Tes Awal

Tes awal digunakan untuk mengetahui sejauh manakah materi atau bahan pelajaran yang akan diajarkan telah dapat

(35)

c) Tes Akhir

Tes akhir dilaksanakan dengan tujuan untuk mengetahui sejauh mana materi pelajaran dapat dikuasai dengan baik oleh

para peserta didik. d) Tes Diagnostik

Tes ini digunakan untuk menentukan secara tepat, jenis kesukaran yang dihadapi oleh peserta didik dalam suatu mata pelajaran tertentu.

e) Tes Formatif

Tes formatif ini biasanya dilaksanakan di tengah-tengah

perjalanan program pengajaran, yaitu dilaksanakan pada setiap kali satuan pelajaran berakhir atau dapat diselesaikan. f) Tes Sumatif

Tes sumatif adalah tes hasil belajar yang dilaksanakan setelah sekumpulan satuan program pengajaran selesai diberikan. Salah satu contoh dari tes sumatif adalah Ulangan Akhir

Semester. Ulangan Akhir Semester (UAS) sering disebut juga ulangan umum yang dilakukan pada akhir semester dengan

bahan yang diujikan, meliputi materi standar, standar kompetensi, dan kompetesi dasar semester pertama (UAS pertama), serta materi standar, standar kompetensi, dan

(36)

3) Tipe Tes

Azwar (1996: 79-106) menyatakan bahwa tes terdiri dari 5 tipe. Tipe-tipe tes tersebut adalah:

a) Tipe Pilihan Ganda

Tes tipe pilihan ganda adalah tes yang terdiri dari sebuah

pertanyaan atau pernyataan yang memiliki beberapa alternatif pilihan jawaban. Kelebihan dari soal pilihan ganda menurut Hamzah (2014: 36) yaitu pemeriksaan dan pemberian skor

jauh lebih mudah dan cepat, hasil penilaian bersifat obyektif karena tidak dipengaruhi oleh subyektivitas penilai, ruang

lingkup materi yang diujikan luas dan menyeluruh, jawaban yang benar sudah tertentu dan pasti, pemeriksaan bisa diserahkan ke orang lain, analisis butir tes dapat dilakukan

dengan lebih mudah. b) Tipe Benar-Salah

Tes tipe benar-salah adalah tes yang berupa suatu pernyataan

mengenai materi ukur yang diujikan, yang memiliki dua alternatif jawaban yaitu benar dan salah.

c) Tipe Jawaban Pendek

Tes tipe jawaban pendek adalah tes yang berupa kalimat pernyataan yang harus dijawab secara singkat yang pada

umumnya tidak lebih dari satu atau dua kalimat pernyataan yang belum selesai sehingga peserta didik diminta untuk

(37)

d) Tipe Pasangan

Tes tipe pasangan adalah tes yang menuntut peserta didik untuk memilih di antara beberapa pilihan yang cocok untuk

dipasangkan dengan stimulus yang ada. e) Tipe Karangan (Esai)

Tes tipe karangan (esai) merupakan tes yang berbentuk suatu pertanyaan atau perintah yang menuntut peserta didik untuk memberikan jawaban yang terurai.

4) Ciri-ciri Tes yang Baik

Ciri-ciri tes yang baik menurut Purwanto (2009: 99) yaitu:

a) Tingkat Kesukaran

Dalam tes, tingkat kesukaran butir-butir soal diusahaan sedang. Jika butir soal terlalu mudah atau terlalu sukar bagi

dua atau lebih peserta maka skor tidak lagi dapat membedakan kemampuan para peserta sekiranya di antara mereka terdapat perbedaan kemampuan.

b) Daya Beda

Daya beda harus diusahakan positif dan setinggi mungkin.

Butir soal dengan daya beda positif dan tinggi berarti butir soal tersebut dapat membedakan dengan baik siswa kelompok atas dan bawah.

c) Efektivitas Pengecoh

Pengecoh dikatakan berfungsi efektif apabila paling tidak ada

(38)

3. Analisis Butir Soal

a. Pengertian Analisis Butir Soal

Sebagai alat ukur, suatu tes dapat dikatakan berhasil jika sesuai

dengan fungsi dan tujuannya. Untuk mengetahui berhasil atau tidaknya suatu tes, harus ditinjau dari kualitas butir soalnya. Kualitas

butir soal dapat diketahui melalui analisis. Analisis butir soal merupakan pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai (Sudjana:

2012: 135).

Kusaeri dan Suprananto (2012: 173) mengartikan analisis butir

soal sebagai proses penelaahan butir soal melalui informasi dari jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan. Arikunto (2012: 222) berpendapat bahwa analisis butir

soal merupakan pengidentifikasian soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis butir soal, dapat memperoleh informasi tentang kejelekan sebuah soal dan petunjuk untuk

mengadakan perbaikan.

Dari definisi-definisi di atas, dapat disimpulkan bahwa analisis butir

soal merupakan pengkajian dari pertanyaan-pertanyaan dalam instrumen yang digunakan untuk mengukur kemampuan dalam proses pembelajaran yang meliputi validitas, reliabilitas, tingkat kesukaran,

(39)

b. Cara Menganalisis Butir Soal

Analisis pada umumnya dilakukan melalui dua cara, yaitu (Surapranata, 2004: 1) :

1) Analisis Kualitatif

Analisis kualitatif menurut Mulyasa (2009: 1) sering juga

disebut sebagai validitas logis (logical validity) yaitu berupa penelaahan yang dimaksudkan untuk menganalisis soal ditinjau dari segi teknis, isi, dan editorial. Artinya, analisis ini meninjau

soal dari segi eksternalnya. Pada penelitian ini analisis dengan cara kualitatif digunakan untuk menguji validitas isi dari soal

bahwa soal tersebut sesuai atau tidak dengan isi atau materi yang telah diberikan.

2) Analisis Kuantitatif

Surapranata (2004: 10) menyatakan bahwa analisis soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik

internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas. Menurut

Azwar (1996: 141) dalam analisis butir soal perlu juga dianalisis efektivitas distraktornya atau dapat disebut juga pengecoh. Hal ini bertujuan untuk mengetahui berfungsi atau tidaknya pilihan

jawaban yang tersedia. Penyebaran (distribusi) jawaban atau efektivitas pengecoh menurut Kusaeri dan Suprananto (2012:

(40)

soal pada penelitian ini dengan menggunakan dua cara, yaitu cara kualiitatif untuk menentukan validitas isi, dan cara kuantitatif untuk menentukan reliabilitas, tingkat kesukaran, daya beda, dan

efektifitas pengecoh dari butir soal.

4. Validitas Isi

a. Pengertian Validitas

Validitas sangat erat kaitannya dengan pengukuran dalam

evaluasi. Azwar (1996: 173) mengemukakan bahwa validitas mempunyai arti sejauh mana ketepatan dan kecermatan suatu

instrumen pengukur (tes) dalam melakukan fungsi ukurnya. Suatu tes yang valid guna pengambilan suatu keputusan dapat saja tidak valid sama sekali guna pengambilan keputusan lain dan bagi kelompok lain.

Menurut Surapranata (2009: 50) validitas merupakan suatu konsep yang berkaitan dengan sejauhmana tes telah mengukur apa

yang seharusnya diukur. Validitas tes perlu ditentukan untuk mengetahui kualitas tes dalam kaitannya dengan mengukur hal yang seharusnya diukur. Oleh karena itu, validitas dapat digunakan dalam

memeriksa secara langsung seberapa jauh suatu alat telah berfungsi. Validitas menurut pendapat Sudjana (2012: 12) adalah ketetapan alat

(41)

Berdasarkan definisi-definisi di atas, dapat disimpulkan bahwa validitas adalah ketepatan suatu tes sesuai dengan tujuan dari diadakannya tes tersebut.

b. Bentuk-bentuk Validitas

Validitas terdiri dari empat bentuk, yaitu (Surapranata, 2004: 51):

1) Validitas Isi

Validitas isi (content validity) adalah pengujian validitas dilakukan atas isinya untuk memastikan apakah butir tes hasil

belajar (THB) mengukur secara tepat keadaan yang ingin diukur (Purwanto, 2009: 120). Contohnya soal pada mata pelajaran

Bahasa Indonesia dikatakan valid apabila hanya mengukur kemampuan bahasa, bukan mengukur kemampuan matematika. 2) Validitas Konstruk

Sudjana (2012: 14) menyatakan bahwa validitas konstruk (construct validity) berkenaan dengan kesanggupan alat penilaian untuk mengukur konsep kemampuan, minat, sikap dalam

berbagai bidang kajian yang terkandung dalam materi yang diukurnya. Contohnya dalam konsep mengenai hubungan sosial

jika dilihat dari pengalaman, indikator empirisnya adalah dapat bergaul dengan orang lain, dapat bekerja sama dengan siapa pun, dan lain-lain. Apabila hasil tes menunjukkan indikator-indikator

(42)

3) Validitas Prediksi

Memprediksi menurut pendapat Arikunto (2012, 84) artinya meramal, dengan meramal selalu mengenal hal yang akan datang

jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai

kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Contohnya tes penerimaan siswa baru pada SMP X berdasarkan hasil tes seleksi setelah peserta tes lulus SD.

Peserta tes yang memiliki nilai bagus di tes seleksi tersebut lalu diterima di SMP X diperkirakan akan berhasil ketika para peserta

tes masuk SMP tersebut. Apabila hal itu terjadi, maka tes seleksi tersebut dikatakan memiliki validitas prediksi yang bagus. Sebaliknya, apabila hasil belajar di SMP kurang baik maka tes

seleksi tersebut tidak memiliki validitas prediksi yang bagus. 4) Validitas Konkuren

Validitas konkuren (concurrent validity) menunjuk pada

hubungan antara tes skor dengan yang dicapai dengan keadaan sekarang (Mulyasa, 2009: 55). Sebuah tes dikatakan memiliki

validitas konkuren apabila hasilnya sesuai dengan pengalaman. Contohnya perbandingan antara ujian akhir nasional dan tugas memiliki korelasi tinggi atau rendah, apabila indeks korelasi

(43)

c. Validitas Isi 1) Pengertian

Validitas isi (content validity) adalah pengujian validitas

dilakukan atas isinya untuk memastikan apakah butir tes hasil belajar (THB) mengukur secara tepat keadaan yang ingin diukur

(Purwanto, 2009: 120). Sudjana (2012: 13) mengemukakan bahwa validitas isi berkenaan dengan kesanggupan alat penilaian dalam mengukur isi yang seharusnya. Artinya, tes tersebut

mampu mengungkapkan isi suatu konsep atau variabel yang hendak diukur. Sedangkan Kusaeri (2014: 54) menyatakan bahwa

validitas isi berkaitan dengan derajat kemampuan instrumen penilaian mengukur cakupan substansi yang ingin diukur. Jadi, kesimpulan dari definisi-definisi tersebut adalah bahwa validitas

isi merupakan pengujian validitas terhadap kesesuaian antara suatu alat ukur dengan isi atau materi yang telah diberikan dengan cara mencocokkan antara soal dengan kisi-kisi soal.

2) Kriteria Validitas Isi

Untuk pengujian validitas isi dapat dibantu dengan

menggunakan kisi-kisi instrumen, atau matrik pengembangan instrumen. Dalam kisi-kisi terdapat variabel yang diteliti, Indikator sebagai tolok ukur dan nomor butir (item) pertanyaan

atau pernyataan yang telah dijabarkan dari Indikator (Sugiyono: 2014: 182). Kusaeri (2014: 54) menyatakan bahwa validitas dapat

(44)

instrumen penilaian disesuaikan dengan kisi-kisi. Artinya, perlu adanya keselarasan antara item yang ada pada instrumen penilaian dengan kisi-kisi. Pendapat dari Purwanto (2009: 120) juga hampir

serupa yaitu butir-butir THB dinyatakan valid (logically valid) apabila setelah mencermati isi butir-butir yang ditulis telah

menunjukkan kesesuaian dengan kisi-kisi.

5. Reliabilitas

a. Pengertian Reliabilitas

Tidak semua pengukuran dalam evaluasi memiliki hasil yang

ajeg, pasti akan terdapat beberapa perbedaan. Oleh karena itu, untuk mengetahui kualitas dari tes salah satunya harus mengetahui nilai reliabilitasnya. Reliabilitas sendiri menurut Sudjana (2012: 16)

merupakan ketetapan atau keajegan alat tersebut dalam penilaian apa yang dinilainya. Artinya, kapanpun suatu alat penilaian digunakan akan memberikan hasil yang relatif sama.

Azwar (1996: 180) selain mengartikan reliabilitas sebagai keterpercayaan, keterandalan, keajegan, konsistensi, dan kestabilan,

reliabilitas juga memiliki arti sejauh mana hasil suatu pengukuran dapat dipercaya. Hasil ukur yang dapat dipercaya adalah hasil ukur yang memiliki hasil yang sama dalam beberapa kali pengukuran pada

kelompok yang sama. Jika perbedaan relatif besar, maka hasil pengukuran tersebut dinyatakan tidak dapat dipercaya. Reliabilitas

(45)

(Arifin, 2009: 258). Dalam pengertian tersebut, reliabilitas memiliki tujuan untuk mengetahui apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Jadi, kesimpulan dari

beberapa definisi tersebut adalah bahwa reliabilitas merupakan ketetapan hasil suatu tes yang dilaksanakan secara berkali-kali,

diberikan pada kelompok yang sama dalam waktu yang berbeda. b. Kriteria Reliabilitas

Basuki dan Hariyanto (2014: 119) membagi kategori korelasi

reliabilitas menjadi lima kelompok yaitu sebagai berikut: Tabel 2.1 Kategori Korelasi Reliabilitas

Korelasi Reliabilitas Kategori 0,00 ≤ r ≤ 0,19 Amat rendah 0,20 ≤ r ≤ 0,39 Rendah 0,40 ≤ r ≤ 0,69 Cukup 0,70 ≤ r ≤ 0,89 Tinggi 0,90 ≤ r ≤ 1,00 Amat tinggi

Sumber: Basuki dan Hariyanto (2014: 119)

Berpedoman dari tabel 2.1, korelasi reliabilitas dibagi menjadi

lima kategori yaitu korelasi amat rendah (angka di antara 0,00 ≤ r ≤ 0,19), korelasi rendah (angka di antara 0,20 ≤ r ≤ 0,39), korelasi

cukup (angka di antara 0,40 ≤ r ≤ 0,69), korelasi tinggi (angka di antara 0,70 ≤ r ≤ 0,89), dan korelasi amat tinggi (angka di antara 0,90 ≤ r ≤ 1,00). Menurut pendapat Arifin (2009: 258) suatu tes dapat

dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang

(46)

Hariyanto (2014: 119) karena memiliki lima kategori sehingga korelasi reliabilitas memiliki kategori yang lebih detail.

6. Tingkat Kesukaran

a. Pengertian Tingkat Kesukaran

Tingkat kesukaran adalah peluang menjawab benar suatu soal

pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks (Kusaeri & Suprananto, 2012: 174). Kunandar (2013:

240) menyatakan bahwa tingkat kesukaran soal adalah proporsi jumlah peserta tes yang menjawab benar, yaitu perbandingan jumlah

peserta tes yang menjawab benar dengan jumlah peserta tes seluruhnya. Menurut pendapat Arifin (2009: 266) tingkat kesukaran adalah pengukuran seberapa besar derajat kesukaran suatu soal. Dari

definisi-definisi tersebut dapat disimpulkan bahwa tingkat kesukaran memiliki arti pengukuran kesulitan suatu soal berupa tingkatan yang

dinyatakan dalam bentuk indeks atau bilangan. b. Rumus Tingkat Kesukaran

Berikut merupakan rumus tingkat kesukaran yang dikemukakan oleh

Arikunto (2012: 223):

Keterangan :

P = tingkat kesukaran

(47)

c. Kriteria Tingkat Kesukaran

Kriteria tingkat kesukaran berdasarkan pendapat Sudjana (2012: 137) terdiri dari tiga kategori, yaitu terdapat pada tabel di bawah ini:

Tabel 2.2 Tingkat Kesukaran dalam Tiga Ketegori (1)

Rentang Tingkat Kesukaran Kategori 1 - 0,30 Sukar 0,31 - 0,70 Sedang 0,71 - 1,00 Mudah

Sumber: Sudjana (2012: 137)

Dilihat dari tabel 2.2 dapat dijelaskan bahwa jika tingkat kesukaran

memiliki angka 1 - 0,30 maka soal memiliki kategori soal yang sukar, jika 0,31 - 0,70 maka soal berkategori sedang, dan jika 0,71 - 1,00

maka soal berkategori mudah. Kriteria tingkat kesukaran menurut Kusaeri (2014: 107) juga dikategorikan menjadi tiga, yaitu dapat dilihat pada tabel berikut ini:

Tabel 2.3 Tingkat Kesukaran dalam Tiga Ketegori (2)

Rentang Tingkat Kesukaran Kategori 0,7 - 1,0 Mudah 0,3 - 0,7 Sedang 0,00 - 0,03 Sulit

Sumber: Kusaeri (2014: 107)

Deskripsi dari tabel 2.3 yaitu jika range tingkat kesukaran 0,7 - 1,0

maka soal berkategori mudah, jika jika range tingkat kesukaran 0,3 - 0,7 maka maka soal berkategori sedang, dan jika range tingkat

(48)

Tabel 2.4 Tingkat Kesukaran dalam Lima Kategori

Rentang Tingkat Kesukaran Kategori 0,00 - 0,19 Sangat Sukar 0,20 - 0,39 Sukar 0,40 - 0,59 Sedang 0,60 - 0,79 Mudah 0,80 - 1,00 Sangat Mudah

Sumber: Purwanto (2009: 101)

Tabel 2.4 di atas memaparkan bahwa tingkat kesukaran dalam kategori sangat sukar memiliki indeks kesukaran antara 0,00 - 0,19,

tingkat kesukaran dalam kategori sukar memiliki indeks kesukaran antara 0,20 - 0,39, sedangkan tingkat kesukaran dalam kategori sedang

memiliki indeks kesukaran antara 0,40 - 0,59, tingkat kesukaran dalam kategori mudah memiliki indeks kesukaran antara 0,60 - 0,79,

sedangkan tingkat kesukaran dalam kategori sangat mudah memiliki indeks kesukaran antara 0,80-1,00. Kategori yang dipaparkan oleh Purwanto (2009: 101) menjadi acuan peneliti untuk menentukan

kriteria pada tngkat kesukaran, karena terdiri dari lima kategori yang artinya memiliki jumlah kategori lebih detail dibandingkan dengan

kategori dari para ahli lain yang telah disebutkan

7. Daya Beda

a. Pengertian Daya Beda

Arikunto (2012: 226) mengemukakan bahwa daya beda adalah

kemampuan suatu soal untuk membedakan antara peserta didik yang pandai (berkemampuan tinggi) dengan peserta didik bodoh (berkemampuan rendah). Daya beda adalah kemampuan butir soal

(49)

yang ditanyakan dan peserta didik yang belum menguasai materi yang diujikan (Kusaeri & Suprananto, 2012: 175). Daya beda adalah pengukuran sejauh mana suatu butir soal mampu membedakan peserta

didik yang sudah menguasai kompetensi dengan peserta didik yang kurang menguasai kompetensi berdasarkan kriteria tertentu (Arifin,

2009: 273).

Berdasarkan definisi-definisi di atas, dapat disimpulkan bahwa daya beda merupakan kemampuan suatu soal dalam membedakan antara

peserta didik yang memiliki pengetahuan tinggi dan pengetahuan yang rendah terhadap suatu materi.

b. Rumus Daya Beda

Rumus daya beda yang dikemukakan oleh Azwar (1996: 138) adalah sebagai berikut:

d

Keterangan:

NiT = banyaknya penjawab soal dengan benar dari kelompok tinggi

NT = banyaknya penjawab dari kelompok tinggi

NiR = banyaknya penjawab soal dengan benar dari kelompok rendah

NR = banyaknya penjawab dari kelompok rendah c. Kriteria Daya Beda

Daya beda memiliki empat kategori, yaitu sebagai berikut: Tabel 2.5 Kategori Daya Beda (1)

Indeks Daya Beda Kategori >0,40 Bagus Sekali 0,30-0,39 Lumayan Bagus 0,20-0,29 Belum Memuaskan

<0,20 Jelek

(50)

Tabel 2.5 memaparkan bahwa daya beda dengan kategori bagus sekali memiliki indeks lebih dari 0,40. Apabila indeks daya beda berkisar antara 0,30-0,39 maka daya beda pada butir soal

lumayan bagus tapi mungkin masih perlu peningkatan, apabila indeks daya beda berkisar antara 0,20-0,29 maka belum memuaskan dan

perlu diperbaiki, dan apabila indeks daya beda kurang dari 0,20 maka butir soal jelek dan harus dibuang. Kunandar (2013: 241) menyebutkan bahwa hasil penghitungan tingkat daya beda soal dapat

dikategorikan menjadi empat, yakni sebagai berikut: Tabel 2.6 Kategori Daya Beda (2)

Indeks Daya Beda Kategori 0,00 - 0,20 Jelek 0,21 - 0,40 Cukup 0,41 - 0,70 Baik 0,71 - 1,00 Baik Sekali

Sumber: Kunandar (2013: 241)

Tabel 2.6 menjelaskan bahwa daya beda dengan kategori jelek memiliki kisaran angka 0,00 - 0,20), cukup (kisaran angka 0,21 -

0,40), baik (kisaran angka 0,41 - 0,70), dan baik sekali (kisaran angka 0,71 - 1,00). Kategori daya beda menurut Kusaeri (2014: 109) juga terdiri dari empat kategori, yaitu dapat dilihat pada tabel di bawah ini:

Tabel 2.7 Kategori Daya Beda (3)

Indeks Daya Beda Kategori 0,40 - 1,00 Sangat Memuaskan 0,30 - 0,39 Memuaskan 0,20 - 0,29 Tidak Memuaskan 0,00 - 0,19 Sangat Tidak Memuaskan

Sumber: Kusaeri (2014: 109)

Berdasarkan tabel 2.7 di atas dapat dijelaskan bahwa daya beda

(51)

1,00, kategori memuaskan memiliki kisaran angka 0,30 - 0,39, kategori tidak memuaskan memiliki kisaran angka 0,20 - 0,29, dan kategori sangat tidak memuaskan memiliki kisaran angka 0,00 - 0,19.

Penelitian ini menggunakan acuan dari Ebel (dalam Azwar, 1996) yang memiliki empat kategori, alasan pemilihan kategori tersebut

karena lebih familiar.

8. Efektivitas Pengecoh

a. Pengertian Efektivitas Pengecoh

Pengecoh (distraktor) menurut pendapat Sudijono (2011:

409) adalah option atau alternatif yang berjumlah antara tiga sampai dengan lima buah, dan dari kemungkinan-kemungkinan jawaban yang terpasang pada setiap butir item itu salah satu diantaranya

adalah merupakan jawaban betul (kunci jawaban), sedangkan sisanya adalah merupakan jawaban salah. Arifin (2014: 241) mengartikan pengecoh jawaban sebagai pola yang dapat

menggambarkan bagaimana peserta tes menentukan pilihan jawaban terhadap kemungkinan-kemungkinan jawaban yang telah

dipasangkan pada setiap butir soal.

Azwar (1996: 137) menyatakan bahwa efektivitas pengecoh merupakan kemampuan soal dalam membedakan antara siswa yang

(52)

kemampuan rendah (diwakili oleh mereka yang termasuk dalam kelompok rendah).

Jadi, dari beberapa definisi di atas dapat disimpulkan bahwa

efektivitas pengecoh adalah penyebaran pilihan jawaban yang digunakan untuk menguji peserta didik dalam pemahaman materi.

b. Rumus Efektivitas Pengecoh

Berikut rumus efektivitas pengecoh yang dikemukakan oleh Arifin (2009: 279):

IP =

Keterangan:

IP = indeks pengecoh

P = jumlah peserta didik yang memilih pengecoh N = jumlah peserta didik yang ikut tes

B = jumlah peserta didik yang menjawab benar pada setiap soal

n = jumlah alternatif jawaban (opsi) 1 = bilangan tetap

c. Kriteria Efektivitas Pengecoh

Arikunto (2012: 234) memaparkan bahwa suatu pengecoh

dikatakan berfungsi dengan baik jika paling sedikit dipilih oleh 5% pengikut tes. Pendapat yang sama juga dikemukakan oleh Mulyasa (2009: 43) bahwa suatu pengecoh dapat dikatakan berfungsi dengan

baik jika paling sedikit dipilih oleh 5% peserta tes. Sedangkan menurut Kunandar (2013: 241) pengecoh dapat dikatakan berfungsi

(53)

9. Mata Pelajaran Bahasa Indonesia

a. Pengertian Bahasa

Bahasa adalah sistem tanda bunyi yang sudah disepakati untuk

dipergunakan oleh para anggota kelompok masyarakat tertentu di dalam bekerjasama, berkomunikasi, dan mengidentifikasi diri

(Kushartanti, 2005: 15). Bahasa menurut pendapat Walija (1996: 4) adalah komunikasi yang paling lengkap dan efektif untuk menyampaikan ide, pesan, maksud, perasaan, dan pendapat kepada

orang lain. Sementara Santoso (1990: 1) mengungkapkan bahwa bahasa memiliki arti rangkaian bunyi yang dihasilkan oleh alat ucap

manusia secara sadar.

Berdasarkan pedoman dari para ahli di atas dapat disimpulkan bahwa bahasa merupakan alat komunikasi yang sudah disepakati oleh

anggota kelompok tertentu dalam tujuan untuk menyampaikan maksud dari dalam diri seseorang.

b. Pengertian Mata Pelajaran Bahasa Indonesia

Mata Pelajaran Bahasa Indonesia merupakan mata pelajaran yang memberikan pemahaman kepada guru dan peserta didik SD dalam

melaksanakan pembelajaran Bahasa Indonesia yang benar melalui membaca dan menulis (Zulela, 2012: 1). Berdasarkan definisi tersebut, kesimpulan yang didapatkan oleh peneliti mengenai

(54)

siswa tentang Bahasa Indonesia yang baik dan benar melalui membaca dan menulis.

c. Standar kompetensi dan Kompetensi Dasar

Standar Kompetensi dan Kompetensi Dasar mata pelajaran Bahasa Indonesia kelas IV SD semester genap berdasarkan Standar Isi

terdapat pada tabel di bawah ini:

Tabel 2.8 Standar Kompetensi dan Kompetensi Dasar

Standar Kompetensi Kompetensi Dasar

6.1Berbalas pantun dengan lafal dan intonasi yang tepat

7.2 Membaca nyaring suatu pengumuman dengan lafal dan intonasi yang tepat

8.1Menyusun karangan tentang berbagai topik sederhana dengan memperhatikan penggunaan ejaan (huruf besar, tanda titik, tanda koma, dan lain-lain).

8.2 Menulis pengumuman dengan bahasa yang baik dan benar serta memperhatikan penggunaan ejaan 8.3 Membuat pantun anak yang menarik tentang

berbagai tema (persahabatan, ketekunan, kepatuhan, dan lain-lain) sesuai dengan ciri-ciri pantun

Tabel 2.8 memaparkan SK dan KD pada kelas IV SD

semester genap yang terdiri dari Standar Kompetensi 5 (mendengarkan), 6 (berbicara), 7 (membaca), dan 8 (menulis).

(55)

Kompetensi 7 terdiri dari tiga Kompetensi dasar, dan Standar Kompetensi 8 terdiri dari tiga Kompetensi Dasar. Jadi, pada kelas IV semester genap terdiri dari empat Standar Kompetensi dan sepuluh

Kompetensi Dasar.

B. Penelitian yang Relevan

Penelitian yang relevan dengan penelitian ini yaitu sebagai berikut:

Rofiqoh (2012) melakukan penelitian dengan judul “Analisis Butir Soal

Ulangan Madrasah Mata Pelajaran Fisika Menggunakan Taksonomi Bloom Ranah Kognitif Kelas XII”. Penelitian ini bertujuan untuk mengkategorikan

dan mengetahui prosentase tingkatan taksonomi Bloom ranah kognitif pada soal Ulangan Madrasah mata pelajaran fisika kelas XII MA Negeri Kendal tahun pelajaran 2010/2011 serta untuk mengetahui kualitas berdasarkan

analisis empiris yang meliputi validitas, reliabilitas, taraf kesukaran dan daya pembeda soal. Penelitian ini merupakan penelitian kualitatif deskriptif. Teknik

pengumpulan data berupa dokumentasi, wawancara dan tehnik korelasi. Hasil dari penelitian ini adalah validitas soal 40% digolongkan valid dan 60% tidak valid dengan besar r tabel 0,339 dan taraf kepercayaan 5%. Reliabilitas soal

digolongkan mempunyai reliabilitas tinggi yaitu 0,69 karena lebih besar dari r tabel. Untuk taraf kesukaran butir soal kriteria mudah 40 soal (100%). Daya

pembeda soal dengan kriteria jelek 25 soal (62,5%), kriteria cukup 10 soal (25%), kriteria baik 4 soal (10%) dan soal sangat jelek yang harus dibuang karena bernilai negatif 1 soal (2,5%). Dengan demikian, penelitian ini memiliki

(56)

penelitian, teknik pengumpulan data, dan tujuan yaitu menganalisis butir soal untuk mengetahui kualitas berdasarkan validitas, reliabilitas, taraf kesukaran dan daya pembeda soal.

Penelitian oleh Amalia dan Widayati (2012) dengan judul “Analisis

Butir Soal Tes Kedali Mutu Kelas XII SMA Mata Pelajaran Ekonomi Akuntansi di Kota Yogyakarta Tahun 2012”. Penelitian ini bertujuan

mengetahui kualitas butir soal Tes Kendali Mutu Kelas XII SMA mata pelajaran Ekonomi Akuntansi di Kota Yogyakarta Tahun 2012 baik soal seri A,

B, C, D, maupun E. Penelitian ini merupakan penelitian deskriptif dengan menggunakan pendekatan kuantitatif karena semua data atau informasi yang

diperoleh diwujudkan dalam bentuk angka-angka dan dianalisis dengan statistik menggunakan program Item and Test Analysis (ITEMAN). Teknik pengumpulan data dilakukan dengan menggunakan metode dokumentasi untuk

memperoleh data butir-butir soal, kunci jawaban, dan hasil tes siswa. Hasil penelitian menunjukkan bahwa butir soal sebagian besar valid dengan nilai 83%. Berdasarkan reliabilitas soal, soal tersebut memiliki koefisien reliabilitas

yang tinggi dengan koefisien rata-rata sebesar 0,806. Berdasarkan tingkat kesukaran, soal dengan tingkat kesukaran sedang dengan nilai rata-rata 59,5%.

Berdasarkan daya pembeda, soal dengan daya pembeda baik dengan nilai rata-rata 57,5%. Berdasarkan efektivitas penggunaan distractor, soal dengan

distractor yang berkualitas sangat baik dengan nilai rata-rata 45%. Penelitian

(57)

teknik pengumpulan data yang sama yaitu dengan metode dokumentasi untuk memperoleh data butir-butir soal, kunci jawaban, dan hasil tes siswa.

Dwipayani (2013) melakukan penelitian dengan judul “Analisis

Validitas dan Reliabilitas Butir Soal Ulangan Akhir Semester Bidang Studi Bahasa Indonesia Kelas X.D SMA N 1 Terhadap Pencapaian Kompetensi”.

Penelitian ini bertujuan mengetahui dan mendeskripsikan kualitas butir soal ulangan akhir semester ganjil bidang studi Bahasa Indonesia kelas X.D SMA N 1 Bangli berdasarkan uji validitas isi, tingkat kesukaran, analisis daya beda,

dan efektivitas opsion, mengetahui dan mendeskripsikan kualitas perangkat soal ulangan akhir semester ganjil bidang studi Bahasa Indonesia kelas X.D

SMA N 1 Bangli ditinjau dari analisis reliabilitas. Hasil penelitian menunjukkan bahwa validitas isi soal tidak valid atau tergolong rendah. Hasil tingkat kesukaran butir soal yang termasuk dalam kriteria soal sedang dengan

persentase sebesar 56%. Butir soal termasuk dalam kriteria daya beda jelek dengan persentase sebesar 40%. Analisis efektivitas opsi kunci butir soal yang berfungsi secara efektif dengan persentase sebesar 72%. Hasil uji reliabilitas

rata-rata persentase tingkat ketercapaian siswa yang menjawab benar pada soal sebesar 52% sedangkan rata-rata perentase tingkat ketercapaian siswa yang

menjawab salah sebesar 48%. Persamaan penelitian ini dengan penelitian yang dilakukan oleh peneliti adalah tentang analisis butir soal pada mata pelajaran bahasa Indonesia serta memiliki tujuan yang sama yaitu mengetahui kualitas

(58)

Karzuni (2011) melakukan penelitian dengan judul “Analisis Butir Soal

Ulangan Akhir Semester (UAS) Mata Pelajaran Bahasa Indonesia SMK Kelas X Semester Gasal Tahun Ajaran 2010/2011 (Studi Kasus di SMK Muhammadiyah Ungaran)”. Penelitian ini bertujuan untuk mengetahui

bagaimana kualitas butir soal ulangan akhir semester (TKM) mata pelajaran

Bahasa Indonesia bila ditinjau dari segi kesesuaian soal dengan kompetensi dasar pada kurikulum yang berlaku, penyebaran soal, validitas butir soal, daya beda soal, tingkat kesukaran soal, dan efektivitas distraktor soal. Jenis

penelitian ini termasuk jenis penelitian deskriptif. Teknik pengumpulan data pada penelitian ini menggunakan metode dokumentasi. Hasil dari penelitian ini

adalah validitas butir soal kelas X termasuk soal yang valid, daya beda soal kelas X termasuk dalam kriteria jelek, tingkat kesukaran untuk kelas X termasuk dalam kriteria mudah. Efektitivitas distraktor soal kelas X termasuk

dalam kriteria tidak efektif. Penelitian ini memiliki persamaan dengan penelitian yang dilakukan oleh peneliti yaitu menganalisis butir soal pada mata pelajaran Bahasa Indonesia. Tujuan, jenis penelitian, dan teknik pengumpulan

data juga memiliki persamaan yaitu jenis penelitian deskriptif dan teknik pengumpulan data dengan metode dokumentasi.

Literature Map dari penelitian yang relevan ini akan dipaparkan pada halaman

(59)

Gambar 2.1. Literature Map

Dari gambar 2.1 dapat dijelaskan bahwa penelitian yang relevan dengan penelitian ini terdiri dari empat judul penelitian. Penelitian tersebut

memiliki beberapa persamaan dengan penelitian yang dilakukan oleh peneliti yaitu tentang analisis butir soal dan tentang mata pelajaran yang sama yaitu

mata pelajaran Bahasa Indonesia. Penelitian yang memiliki persamaan

Mata Pelajaran Analisis Butir Soal

(60)

tentang analisis butir soal yaitu yang pertama berjudul Analisis Butir Soal Ulangan Madrasah Mata Pelajaran Fisika Menggunakan Taksonomi Bloom Ranah Kognitif Kelas XII dan Analisis Butir Soal Tes Kendali Mutu Kelas

XII SMA Mata Pelajaran Ekonomi Akuntansi di Kota Yogyakarta Tahun 2012.

Persamaan selanjutnya pada penelitian ini yaitu tentang mata pelajaran Bahasa Indonesia yang ada pada penelitian yang relevan dengan judul Analisis Validitas dan Reliabilitas Butir Soal Ulangan Akhir Semester Bidang

Studi Bahasa Indonesia Kelas X.D SMA N 1 Terhadap Pencapaian Kompetensi dan Analisis Soal-soal UKK Mata Pelajaran Bahasa Indonesia di

SMP Negeri Krian Tahun Ajaran 2010/2011. Persamaan-persamaan yang terdapat pada penelitian yang relevan dapat menjadikan sumber referensi dan juga evaluasi bagi peneliti untuk dapat mengembangkan penelitian yang lebih

baik.

C. Kerangka Berpikir

Dalam dunia pendidikan, kata “evaluasi” sering digunakan terutama

pada kegiatan atau proses belajar mengajar. Evaluasi memiliki kedudukan

yang sangat penting, karena dapat menjadi bahan acuan tentang berhasil atau tidaknya peserta didik dalam kegiatan pembelajaran. Evaluasi merupakan

(61)

tujuan pendidikan sudah tercapai. Dengan demikian, evaluasi juga dapat dijadikan sebagai bahan perbaikan mutu dalam pendidikan.

Untuk mengetahui kualitas suatu tes, perlu dilakukan analisis pada

setiap butir soalnya. Sudjana (2012: 149) menyatakan bahwa ada beberapa cara untuk melakukan analisis butir soal. Analisis butir soal dapat dilakukan

dengan cara analisis tingkat kesukaran, analisis daya beda, analisis validitas, dan analisis reliabilitas. Selain itu, Azwar (1996: 141) berpendapat bahwa dalam analisis butir soal perlu juga dianalisis efektivitas distraktornya atau

dapat disebut juga pengecoh. Hal ini bertujuan untuk mengetahui berfungsi atau tidaknya pilihan jawaban yang tersedia. Analisis pada umumnya

dilakukan melalui dua cara, yaitu analisis kualitatif (qualitatif control) dan analisis kuantitatif (quantitatif control) (Surapranata, 2004: 1). Pada penelitian ini analisis dengan cara kualitatif digunakan untuk menguji

validitas isi dari soal bahwa soal tersebut sesuai atau tidak dengan isi atau materi yang telah diberikan, sedangkan analisis kuantitatif pada penelitian ini digunakan untuk menguji reliabilitas, tingkat kesukaran, daya beda, dan

efektivitas pengecohnya.

D. Hipotesis

Hipotesis pada penelitian ini adalah sebagai berikut:

1. Validitas isi pada butir soal pilihan ganda Ulangan Akhir Semester genap