• Tidak ada hasil yang ditemukan

BAB II KAJIAN PUSTAKA

A. Landasan Teori

8. Validitas

a. Definisi Validitas

Sumanto (2014: 78) berpendapat bahwa validitas adalah tingkat dimana suatu instrumen mengukur apa yang seharusnya diukur. Selaras dengan pendapat di atas Azwar (2008: 5) menyatakan bahwa validitas mempunyai arti sejauh mana ketepatan dan kecermatan alat ukur dalam melakukan fungsi ukurnya. Sedangkan menurut Uno dan Koni (2012: 151) berpendapat bahwa validitas adalah hal yang berhubungan dengan ketepatan terhadap apa yang seharusnya diukur oleh suatu butir soal dan seberapa cermat soal tersebut melakukan pengukurannya.

Berdasarkan pendapat di atas peneliti dapat menyimpulkan bahwa validitas adalah sifat yang memiliki kesesuaian dengan kenyataan. Butir soal dapat dikatakan valid jika sesuai dengan isi materi yang terdapat pada Standar Kompetensi (SK) dan Kompetensi Dasar (KD). Apabila butir soal tidak sesuai dengan Standar Kompetensi (SK) dan Kompetensi Dasar (KD) maka butir soal dinyatakan tidak valid.

b. Jenis Validitas

Djiwandono (2008: 165) berpendapat bahwa validitas memiliki empat jenis yaitu, validitas isi, validitas konstruksi, validitas kesamaan, dan validitas prediksi.

1. Validitas Isi

Sumanto (2014: 78) berpendapat bahwa validitas isi adalah tingkat di mana suatu tes mengukur lingkup isi yang dimaksudkan. Validitas item bertitik tolak pada pertanyaan apakah item-item tes itu mewakili ukuran ruang lingkup isi yang yang dikehendaki. Pendapat tersebut senada dengan pendapat Arikunto (2012: 82) yang menyatakan bahwa validitas isi menunjukkan suatu kondisi butir soal yang disusun berdasarkan isi materi pelajaran yang diujikan. Berdasarkan penjelasan tersebut dapat diketahui pengujian validitas isi bukan melalui analisis statistika melainkan melalui analisis deskriptif dengan melihat kesesuaian antara soal dengan materi pembelajaran sesuai Standar Kompetensi (SK) dan Kompetensi Dasar (KD).

2. Validitas Konstruksi

Uno dan Koni (2012: 152) berpendapat bahwa validitas konstruksi menunjuk pada sejauh mana suatu instrumen mampu mengukur pengertian-pengertian yang terkandung dalam materi yang akan diukur. Arikunto (2012: 83) berpendapat bahwa validitas konstruksi menunjukkan kondisi alat penilaian yang disusun berdasarkan aspek minat, kemampuan, dan sikap siswa yang seharusnya diukur. Cara yang digunakan untuk menentukan adanya validitas konstruksi adalah dengan melihat adanya

kesesuaian antara hasil tes dengan tujuan atau ciri dan tingkah laku yang hendak diukur.

3. Validitas Kesamaan

Sudjana (2010: 15) yang menyatakan bahwa suatu tes dinyatakan valid dari segi validitas kesamaan apabila tes tersebut memiliki persamaan atau korelasi tinggi dengan tes sejenis yang telah ada. Sejalan dengan pendapat Uno dan Koni (2012: 152) berpendapat bahwa validitas kesamaan menunjuk kepada sejauh mana tes memiliki kesamaan dengan tes yang sudah ada atau sudah dibakukan. Kesamaan yang dimaksud meliputi kesamaan yang diukur, objek yang diukur, dan waktu yang diperlukan.

4. Validitas Prediksi

Suraprana (2009: 54) yang menyatakan bahwa suatu tes dikatakan memiliki validitas prediksi apabila tes tersebut memiliki kemampuan untuk memprediksi apa yang akan terjadi di masa yang akan datang. Senada dengan pendapat Arikunto (2012: 64) yang menyatakan bahwa validitas prediksi menunjukkan hubungan antara nilai atau skor yang diperoleh siswa pada suatu tes dengan keadaan yang akan terjadi di waktu yang akan datang.

Contoh penerapan validitas prediksi adalah seseorang mengikuti tes untuk melamar pekerjaan di sebuah kantor dan orang tersebut yang akan diterima itu tentu harus berdasarkan pada prediksi bahwa mereka yang diterima harus berhasil dalam

melaksanakan pekerjaannya di kantor. Misalkan tes tersebut mengukur aspek psikologis tertentu yang diperlukan dalam keberhasilan kerja. Jadi tes tersebut merupakan prediktor keberhasilan kerja. Tes tersebut dikatakan memiliki validitas prediksi yang tinggi apabila orang yang diterima dapat menjalankan tugas kerjanya dengan baik atau dapat dikatakan sesuai dengan prediksi.

Berdasarkan pendapat para ahli di atas dapat disimpulkan bahwa terdapat empat jenis validitas, yaitu validitas isi, validitas konstruksi, validitas kesamaan, dan validitas prediksi. Penelitian ini dibatasi menggunakan validitas isi. Dalam penelitian ini validitas isi digunakan untuk menganalisis kesesuaian antara soal dengan materi pembelajaran berdasarkan pada Standar Kompetensi (SK) dan Kompetensi Dasar (KD). Penelitian ini akan menganalisis soal UAS genap tahun pelajaran 2014/2015 mata pelajaran IPA kelas III SD berdasarkan SK dan KD.

9. Reliabilitas

Endrayanto dan Harimurti (2014: 271) berpendapat bahwa reliabilitas adalah tingkat konsistensi atau keajekan yang dihasilkan apabila suatu tes diujikan secara berulang pada individu atau kelompok. Senada dengan pendapat Arikunto (2012: 91) yang menyatakan bahwa suatu soal dapat dinyatakan baik ditinjau dari tingkat reliabilitas apabila soal tersebut menunjukkan hasil yang relatif sama pada beberapa kali pengujian.

Sedangkan menurut Basuki dan Hariyanto (2014: 99) berpendapat bahwa reliabilitas mengacu pada konsistensi dalam hasil pengujian.

Berdasarkan pendapat para ahli mengenai reliabilitas, peneliti dapat menyimpulkan bahwa suatu tes dapat dikatakan reliable apabila dapat memberikan hasil yang relatif sama pada saat diujikan berulang-ulang. Jihad dan Haris (2012: 181) berpendapat reliabilitas soal merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistenan suatu soal tes.

Tabel 2.2 Klasifikasi Tingkat Reliabilitas Koefisien Alpha Tingkat Reliabilitas

≤ 0,20 Sangat Rendah

0,21 - 0,40 Rendah 0,41 - 0,70 Sedang 0,71 - 0,90 Tinggi

0,91 - 1,00 Sangat Tinggi

Sumber: Jihad dan Haris (2012: 181)

Koefisien dengan rentang ≤ 0,20 menunjukkan tingkat reliabilitas sangat rendah, rentang 0,21–0,40 menunjukkan tingkat reliabilitas rendah, rentang 0,41–0,70 menunjukkan tingkat reliabilitas sedang, rentang 0,71–0,90 menunjukkan tingkat reliabilitas tinggi, rentang 0,91–1,00 menunjukkan tingkat reliabilitas sangat tinggi.

10. Tingkat Kesukaran

a. Definisi Tingkat Kesukaran

Miller (dalam Endrayanto dan Harumurti, 2014: 261) berpendapat bahwa tingkat kesukaran butir soal menunjukkan

persentase siswa yang menjawab butir soal dengan benar. Sedangkan, Arikunto (2012: 222) menjelaskan bahwa soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak memotivasi siswa untuk belajar, sedangkan soal yang terlalu sukar membuat siswa putus asa dalam menjawabnya. Sudjana (2010: 135) berpendapat bahwa dalam menyusun butir soal perlu memperhatikan proporsi jumlah soal sesuai dengan kategori tingkat kesukaran supaya tidak terjadi penumpukan atau dominasi pada salah satu ketegori.

Berdasarkan pendapat para ahli pada alinea sebelumnya, peneliti dapat menarik kesimpulan mengenai analisis tingkat kesukaran pada butir soal dilakukan untuk mengetahui tingkat kesukaran pada setiap butir soal. Kategori tingkat kesukaran butir soal menurut Jihad dan Haris (2012: 182)

Tabel 2.3 Klasifikasi Tingkat Kesukaran Butir Soal

No. Tingkat Kesukaran Kategori

1 0,00 – 0,30 Sukar

2 0,31 – 0,70 Sedang

3 0,71 – 1,00 Mudah

Sumber: Sudjana dalam Jihad dan Haris (2012: 182)

Pada koefisien 0,00 – 0,30 menunjukkan kategori sukar, pada koefisien 0,31 – 0,70 menunjukkan kategori sedang, dan pada koefisien 0,71 – 1,00 menunjukkan kategori mudah.

11. Daya Beda

a. Definisi Daya Beda

Djiwandono (2008: 220) berpendapat analisis daya beda adalah kemampuan butir soal dalam membedakan peserta tes yang mampu dan kurang mampu dalam menjawab pertanyaan tes atau mengerjakan soal tes dengan benar. Sedangkan menurut Kunandar (2014: 240) yang menyatakan bahwa daya pembeda soal adalah kemampuan suatu butir soal untuk membedakan antara siswa yang telah menguasai materi pembelajaran yang diujikan. Sejalan dengan pendapat di atas Azwar (2015: 137) berpendapat bahwa butir soal dapat dinyatakan memiliki daya pembeda baik apabila butir soal tersebut dapat dijawab dengan benar oleh semua atau sebagian besar siswa yang telah memahami materi dan dijawab salah oleh semua atau sebagian besar siswa yang belum memahami materi yang diujikan. Hal tersebut dapat diartikan sebagian besar jumlah siswa yang yang menjawab benar adalah siswa yang telah memahami materi pembelajaran dibandingkan dengan jumlah siswa yang belum memahami materi pembelajaran. Basuki dan Hariyanto (2014: 141) berpendapat mengenai koefisien daya beda kedalam tabel sebagai berikut.

Tabel 2.4 Klasifikasi Daya Beda

Daya Beda Kriteria

0,40 atau lebih Sangat Baik

0,30 – 0,39 Cukup Baik

0,20 – 0,29 Sedang

0,19 ke bawah Buruk

Koefisien daya beda lebih dari 0,40 dikategorikan sangat baik dan soal dapat diterima. Koefisien daya beda berada pada 0,30 – 0,39 dikategorikan cukup baik dan soal dapat diterima dengan perbaikan. Koefisien daya beda berada pada 0,20 – 0,29 dikategorikan sedang dan soal perlu diperbaiki. Koefisien daya beda berada pada 0,19 ke bawah dikategorikan buruk dan soal ditolak atau perlu digantikan dengan soal yang lain. Dalam analisis daya beda peneliti menggunakan ketentuan sesuai dengan pendapat ahli di atas.

12. Efektifitas Pengecoh

Soal tes pilihan ganda memiliki pilihan jawaban yang lebih dari satu dan hanya memiliki satu jawaban yang benar. Sudijono (2006: 409) berpendapat bahwa pengecoh adalah jawaban-jawaban yang salah, kecuali kunci jawaban soal tersebut. Senada dengan pendapat tersebut Purwanto (2010: 108) mengemukakan pendapat bahwa pengecoh atau distractor

merupakan pilihan jawaban selain kunci jawaban. Pengecoh digunakan untuk mengecoh siswa untuk memilih jawaban yang bukan merupakan kunci jawaban.

Analisis efektivitas pengecoh perlu dilakukan untuk mengetahui keberfungsian pengecoh dalam pilihan jawaban pada soal pilihan ganda. Uno dan Koni (2012: 180) berpendapat analisis efektifitas pengecoh dilakukan dengan menghitung peserta tes yang memilih tiap alternatif jawaban pada masing-masing soal. Basuki dan Hariyanto (2014: 144)

berpendapat bahwa pengecoh pada butir soal dapat dikatakan berfungsi jika dipilih oleh minimal 5% dari peserta tes.

Berdasarkan dari pendapat pada paragraph sebelumnya, peneliti dapat menarik kesimpulan bahwa analisis efektifitas pengecoh adalah suatu cara untuk mengetahui keberfungsian pengecoh pada butir soal apakah berfungsi dengan baik atau tidak. Pengecoh dikategorikan berfungsi dengan baik jika dipilih oleh minimal 5% dari peserta tes. Sedangkan pengecoh yang kurang berfungsi dengan baik disarankan untuk diperbaiki.

13. Software ITEMAN

ITEMAN adalah software yang khusus diciptakan untuk melakukan analisis statistik berupa butir soal. Sesuai dengan pendapat Kusaeri dan Suprananto (2012: 178) yang berpendapat bahwa item and test analysis (ITEMAN) merupakan perangkat lunak software yang dibuat dengan bahasa komputer yang khusus digunakan untuk analisis butir soal. Langkah menulis ITEMAN pada halaman berikutnya sebagai berikut.

a. Membuka File Data

1. Input data file pada notepad 020 o N 11 ABABACCACABCABCBBCBC 44444444444444444444 YYYYYYYYYYYYYYYYYYYY 01 ABABACCABBBCABCBBCBB 02 ABABCCCABABCACCABABC

03 ABABACCACABCABCBBCBC 04 ABACACCABCBAAACBBCBC 05 ABABCCCACABCBACBBCBC

2. Keterangan Pengisian File Data a) Baris Pertama

Kolom 1-3 : Jumalah butir soal terdapat 20 butir soal. Kolom 4 : Spasi (kosong)

Kolom 5 : Jawaban omit (kosong), ditulis 0 Kolom 6 : Spasi (kosong)

Kolom 7 : Soal yang belum dikerjakan atau terdapat dua jawaban ditulis N.

Kolom 8 : Spasi (kosong) Kolom 9 : Jumlah identitas

b) Baris Kedua : Daftar kunci jawaban soal.

c) Baris Ketiga : Daftar jumlah alternatif jawaban soal. d) Baris Keempat : “Y” butir soal yang dianalisis

e) Baris Kelima dan seterusnya : Berisi jawaban siswa

b. Menjalankan Program ITEMAN 1) Doubel klik program ITEMAN

2) Tulislah file data: ANALISIS.TXT, lalu tekan ENTER.

3) Ketik nama file hasil analisis: HASIL.TXT, lalu tekan ENTER. 4) Jika ingin memunculkan skor, kemudian tekan “Y”, lalu tekan

ENTER.

6) Analisis ITEMAN telah selesai.

c. Interpretasi Hasil Analisis

Hasil analisis menggunakan ITEMAN dapat dibedakan menjadi 3 bagian, yaitu statistik butir soal, analisis butir soal, dan skala statistik. Berikut ini adalah output dalam setiap butir yang dianalisis.

1) Seq. No : Nomor urut butir soal dalam file data. 2) Scale-Item : Nomor urut butir soal dan skala.

3) Prop.Correct : Proporsi siswa yang menjawab soal dengan benar (indeks tingkat kesukaran)

4) Biser : Indeks daya beda soal menggunakan koefisien korelasi biserial.

5) Point Biser : Indeks daya beda soal dan pilihan jawaban menggunakan koefisien point biserial. 6) Prop. Endorsing : Proporsi alternatif jawaban yang dijawab

oleh peserta tes.

Berikut akan dijelaskan skala statistik tes dari output ITEMAN.

1) N of Item : jumlah butir soal dalam tes yang dianalisis 2) N of Examines : jumlah peserta tes

3) Mean : skor atau rerata peserta tes

4) Variance : variasi dari distribusi peserta tes yang memberikan gambaran tentang sebaran skor peserta tes

5) Std. Dev : devisi standar dari distribusi skor tes (akar

dari varians)

6) Skew : kemiringan distribusi skor peserta tes yang memberikan gambarab tentang bentuk distribusi skor peserta tes

7) Kurtoris : puncak distribusi skor yang

menggambarkan kelandaian distribusi skor disbanding dengan distribusi normal

8) Minimum : skor terendah peserta tes

9) Maximum : skor tertinggi peserta tes

10) Median : skor tengah dimana 50% berada pada atau

lebih rendah dari skor tersebut

11) Alpha : koefisien reabilitas alpha untuk tes atau skala tersebut yang merupakan indeks homogenitas tes atau skala

12) Sem : kesalahan pengukuran standar untuk setiap tes atau skala

13) Mean P : rerata tingkat kesukaran semua butir soal

dalam tes secara klasikal dihitung dengan cara mencari rata-rata proporsi peserta tes yang menjawab benar untuk semua butir soal dalam tes

14)Mean item tot : nilai rata-rata indek daya beda dari semua soal dalam tes yang diperoleh dengan menghitung nilai rata-

rata point biserial dari semua soal dalam tes.

B. Penelitian Yang Relevan

Pada bagian ini akan dijabarkan beberapa hasil penelitian yang relevan.

1. Bagus pada tahun 2013 melakukan penelitian tentang analisis butir soal tes ujian akhir semester IPS di Kabupaten Gianyar, Bali. Kelas VII semester 1 tahun ajaran 2011/2012. Penelitian tersebut meneliti tentang analisis butir soal IPS buatan MGMP Kabupaten Gianyar, Bali. Analisis tersebut dilakukan untuk mengetahui kualitas butir soal mata pelajaran IPS yang dibuat oleh MGMP Kabupaten Gianyar, Bali yang ditinjau dari relevansi antara kisi-kisi, SK dan KD mata pelajaran, dengan butir soal dari 60 butir soal terdapat 56 (93%) butir soal relevan dan 4 butir soal (7%) tidak relevan dengan indikator soal. Validitas isi sangat tinggi (0,933). Validitas didapatkan 53 butir soal (88%) valid dan 7 butir soal (8%) tidak valid. Reabilitas didapatkan r11 = 0,860. Taraf kesukaran

adalah 23% butir soal kategori soal mudah, 62 % butir sedang, dan 15 % butir sukar. Daya beda, 82 % diterima, daya beda kurang baik 13 % dan yang buruk harus dibuang 34,5%. Efektivitas pengecoh 85% memiliki pengecoh yang berfungsi dan 15% tidak berfungsi. Validitas isi tes dan butir soal, reliabilitas, daya beda dan efektifitas pengecoh. Relevansi penelitian ini dapat dilihat dari analisis validitas isi bersasarkan SK dan KD.

2. Sumarsih pada tahun 2012 melakukan penelitian analisis kualitas butir soal Ulangan Tengah Semester genap mata pelajaran Bahasa Indonesia siswa kelas 3 MI Negeri Jejeran, Bantul, Yogyakarta tahun pelajaran

2011/2012. Penelitian ini merupakan penelitian kuantitatif karena data penelitian berupa angka-angka dan analisis menggunakan statistik, dengan mengambil latar MI Negeri Jejeran, Bantul, Yogyakarta. Pengumpulan data dengan cara observasi, wawancara, dan dokumentasi. Analisis data dengan program Microcat Model Iteman versi 3.00 dan Anates versi 4.0.5 yang memiliki hasil memiliki25 soal pilihan ganda dan 16 soal Essay yang valid, reliabilitas soal pilihan ganda sebesar 0,88 berarti reliabilitasnya tinggi, sedangkan soal essay reliabilitasnya sebesar 0,81 berarti reliabilitasnya tinggi, derajat kesukaran item butir tes pilihan ganda dan essayterlalu mudah, daya pembeda item yang diterima sebanyak 27 butir, fungsi pengecohnya yaitu sebanyak 30 dari 50 pengecoh berfungsi dengan baik, soal tersebut belum mampu mengukur semua kompetensi yang harus dicapai siswa pada semester genap,karena kisi-kisi pembuatan soal dikerjakan setelah soal diujikan. Kualitas soalnya tergolong kurang baik, karena yang memiliki kriteria validitas, reliabilitas, derajat kesukaran item, daya pembeda item, dan fungsi pengecoh yang baik hanya berjumlah 12atau 29,27 %. Relevansi penelitian ini dapat dilihat dari teknik analisis data yang menganalisis butir soal dengan menggunakan software Iteman MicroCat versi 3.00. 3. Murbangun pada tahun 2008 melakukan penelitian tentang pengaruh

Validitas dan Reliabilitas Butir Soal Ujian Ahir Semester Mata Pelajaran Kimia Terhadap Pencapaian Kompetensi. Penelitian tersebut bersifat ex post facto yang berarti data dikumpulkan setelah semua peristiwa yang diperhatikan telah terjadi. Penelitian ini bertujuan untuk mengetahui

kualitas butir soal pada bidang studi kimia. Penelitian ini memiliki hasil reliabilitas yang tinggi dengan koefisien reliabilitas 0,78. Diketahui bahwa dari 35 soal terdapat 30 soal valid, memiliki daya pembeda cukup, tingkat kesukaran belum proporsional. Nilai rata-rata ketuntasan sebesar 66,14. Relevansi penelitian ini dapat dilihat dari teknik analisis validitas dan reliabilitas soal.

Berdasarkan pada uraian dari ketiga hasil penelitian yang relevan dengan penelitian ini dapat diketahui kesamaan dan perbedaan dari penelitian penelitian terdahulu dengan penelitian ini.

Persamaan dari penelitian ini dengan ketiga penelitian terdahulu yaitu, terletak pada aspek analisis butir soal meliputi analisis validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektifitas pengecoh. Sedangkan perbedaan dari penelitian ini dengan penelitian yang terdahulu adalah jenjang sekolah dan tempat pelaksanaan penelitian. Penelitian ini akan menganalisis butir soal UAS genap tahun pelajaran 2014/2015 mata pelajaran IPA kelas III SD di Kecamatan Depok, Kabupaten Sleman, Yogyakarta. Penelitian yang relevan secara lebih ringkas dapat dilihat dari gambar 2.1 sebagai berikut.

Gambar 2.1 Literature Map Hasil Penelitian yang Relevan

Berdasarkan gambar di atas ketiga penelitian terdahulu relevan dengan penelitian yang dilakukan oleh peneliti karena, sama-sama meneliti analisis butir soal pada analisis validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas pengecoh.

Dokumen terkait