ANALISIS KUALITAS SOAL-SOAL TRY OUT UJIAN NASIONAL
MATA PELAJARAN IPA SMP DI KABUPATEN BANJARNEGARA
skripsi
disusun sebagai salah satu syarat
untuk memperoleh gelar Sarjana Pendidikan Biologi
Oleh
Arrynda Ratnaningsih
4401406522
JURUSAN BIOLOGI
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI SEMARANG
▸ Baca selengkapnya: soal try out kelas 6 erlangga
(2)PERNYATAAN KEASLIAN SKRIPSI
Saya menyatakan dengan sebenar-benarnya bahwa skripsi saya yang
berjudul “Analisis Kualitas Soal-Soal Try Out Ujian Nasional Mata Pelajaran IPA
SMP di Kabupaten Banjarnegara” disusun berdasarkan hasil penelitian saya
dengan arahan dosen pembimbing. Sumber atau kutipan yang berasal atau dikutip
dari karya yang diterbitkan telah disebutkan dalam teks dan dicantumkan dalam
daftar pustaka di bagian akhir skripsi ini. Skripsi ini belum pernah diajukan untuk
memperoleh gelar dalam program sejenis di perguruan tinggi manapun.
Semarang, Oktober 2012
Arrynda Ratnaningsih
PENGESAHAN
Skripsi yang berjudul :
“ANALISIS KUALITAS SOAL-SOAL TRY OUT UJIAN NASIONAL MATA PELAJARAN IPA SMP DI KABUPATEN BANJARNEGARA”
disusun oleh :
nama : Arrynda Ratnaningsih NIM : 4401406522
telah dipertahankan dihadapan sidang Panitia Ujian Skripsi FMIPA Unnes pada tanggal 5 Oktober 2012.
Panitia :
Ketua Sekretaris
Prof. Dr. Wiyanto, M.Si Andin Irsadi, S.Pd., M.Si NIP. 19631012 198803 1001 NIP. 19740310 200003 1001
Penguji Utama
Parmin, S. Pd., M. Pd NIP. 19790123 200604 1003
Anggota Penguji/ Anggota Penguji
Pembimbing Utama Pembimbing Pendamping
ABSTRAK
Ratnaningsih. Arrynda. 2012. Analisis Kualitas Soal-Soal Try Out Ujian Nasional (UN) Mata Pelajaran IPA SMP di Kabupaten Banjarnegara. Ir. Tuti Widianti, M. Biomed dan Drs. Krispinus Kedati Pukan, M. Si.
Evaluasi merupakan bagian yang tidak dapat dipisahkan dari proses pembelajaran. Evaluasi bertujuan untuk mengetahui, memperbaiki serta meningkatkan kualitas proses pembelajaran yang telah dilakukan. Analisis soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes. Analisis soal menggunakan Iteman lebih cepat dan efektif, karena dalam satu kali menganalisis akan didapat beberapa hal, antara lain: validitas dan reliabilitas soal. Tujuan yang hendak dicapai dalam penelitian ini adalah untuk mengetahui kualitas soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara tahun 2011 sampai dengan tahun 2012. Penelitian ini dilakukan di kabupaten Banjarnegara tahun ajaran 2011/2012. Sekolah yang digunakan untuk penelitian adalah 9 SMP dari 91 SMP di Kabupaten Banjarnegara. Pengambilan sampel dilakukan secara acak. Subyek dari penelitian ini adalah siswa kelas IX. Data diperoleh dengan metode dokumentasi dan wawancara. Hasil analisis data menunjukkan bahwa persentase tingkat kesukaran soal adalah: sukar 12,5%; sedang 77,5%; mudah 10%. Daya beda 0% baik sekali; 27,5% baik; 60% cukup; 12,5% jelek dan 0% sangat jelek, 100% efektifitas pengecoh berfungsi dan reliabilitas tinggi. Berdasarkan hasil analisis dan pembahasan dapat disimpulkan bahwa soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara dengan menggunakkan program Iteman memiliki tingkat kesukaran sedang, daya beda cukup, efektifias berfungsi serta reliabilitas dengan kategori tinggi.
Kata kunci: Analisis soal, Iteman, Try out UN mata pelajaran IPA SMP
KATA PENGANTAR
Segala puji penulis panjatkan kehadirat Allah SWT atas limpahan
rahmat, taufik, hidayah dan inayahNya sehingga penulis dapat menyelesaikan
skripsi dengan judul “Analisis Kualitas Soal-Soal Try Out Ujian Nasional Mata
Pelajaran IPA SMP di Kabupaten Banjarnegara” tanpa satu halangan apapun.
Penulis menyadari bahwa dalam penyusunan skripsi ini tidak lepas dari
peran serta berbagai pihak. Oleh karena itu dalam kesempatan ini penulis
mengucapkan terima kasih dan penghargaan yang sebesar-besarnya kepada:
1. Rektor Universitas Negeri Semarang yang telah memberikan kesempatan
kepada penulis untuk menyelesaikan studi di Universitas Negeri Semarang.
2. Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam UNNES yang telah
memberikan kemudahan pelayanan administrasi dalam penyusunan skripsi.
3. Ketua Jurusan Biologi FMIPA UNNES yang telah memberikan kemudahan
dan kelancararn dalam penyusunan skripsi.
4. Ir. Tuti Widianti, M. Biomed., selaku dosen pembimbing utama yang penuh
kesabaran membimbing dan memberikan motivasi, pengarahan dan
saran-saran dalam penyusunan skripsi ini.
5. Drs. Krispinus Kedati Pukan, M. Si, selaku dosen pembimbing pendamping
yang penuh kesabaran membimbing dan memberikan motivasi, pengarahan
dan saran-saran dalam penyusunan skripsi ini.
6. Parmin, S. Pd., M. Pd, selaku dosen penguji yang penuh kesabaran
membimbing dan memberikan motivasi, pengarahan dan saran-saran dalam
penyusunan skripsi ini.
7. Seluruh dosen Jurusan Biologi yang telah membekali ilmu pengetahuan
kepada penulis selama menuntut ilmu di Universitas Negeri Semarang.
8. Kepala sekolah SMP Negeri dan Swasta yang terpilih sebagai sampel di
Kabupaten Banjarnegara yang telah berkenan memberikan ijin kepada penulis
9. Guru IPA di SMP Negeri dan Swasta yang terpilih sebagai sampel di
Kabupaten Banjarnegara yang telah memberikan bantuan dan bekerja sama
dalam penelitian ini.
10. Ibu dan bapak atas doa, motivasi, cinta dan kasing sayang yang diberikan.
11. Kakak, adik atas doa, dukungan dan semangat yang diberikan.
12. Ikhwandi, Endah, Dwik, serta teman-teman biologi kelas C angkatan 2006
(Fourabiota) yang selalu memberiakan semangat dalam penulisan ini.
13. Teman-teman kos Darmada yang telah membantu dalam penulisan skripsi ini.
14. Semua pihak dan instansi terkait yang telah membantu selama
dilaksanakannya penelitian sampai selesai penulisan skripsi ini.
Penulis berharap semoga skripsi ini bermanfaat bagi semua pihak yang
membutuhkan.
Semarang, Oktober 2012
`
Penulis
DAFTAR ISI
Halaman
HALAMAN JUDUL ... i
PERNYATAAN KEASLIAN SKRIPSI ... ii
PENGESAHAN ... iii
ABSTRAK ... iv
KATA PENGANTAR ... v
DAFTAR ISI ... vii
DAFTAR TABEL ... ix
DAFTAR GAMBAR ... xi
DAFTAR LAMPIRAN ... xii
BAB I PENDAHULUAN A. Latar Belakang ... 1
B. Permasalahan ... 5
C. Penegasan Istilah ... 5
D. Tujuan Penelitian ... 5
E. Manfaat Penelitian ... 6
BAB II TINJAUAN PUSTAKA DAN KERANGKA BERFIKIR A. Tinjauan Pustaka ... 7
B. Kerangka Berfikir ... 27
BAB III METODE PENELITIAN A. Lokasi dan Obyek Penelitian ... 28
B. Rancangan Penelitian ... 28
C. Prosedur Penelitian ... 29
D. Metode Pengumpulan Data ... 30
E. Metode Analisis Data ... 30
BAB IV HASIL PENELITIAN DAN PEMBAHASAN A. Hasil Penelitian ... 36
BABV SIMPULAN DAN SARAN
A. Simpulan ... 55
B. Saran ... 55
DAFTAR PUSTAKA ... 56
LAMPIRAN ... 59
DAFTAR TABEL
Tabel Halaman
1 Data hasil try out dan UN SMP di Kabupaten Banjarnegara
Tahun pelajaran 2010/2012 ... 3
2 Daftar 9 SMP di Kabupaten Banjarnegara yang soal try out
mata pelajaran IPA di analisis ... 28
3 Hasil analisis tingkat kesukaran 9 sekolah sampel soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara tahun
ajaran 2011/2012 ... 37
4 Hasil analisis tingkat kesukaran soal try out UN mata pelajaran IPA pada setiap sekolah di Kabupaten Banjarnegara tahun
ajaran 2011/2012 ... 37
5 Hasil analisis daya beda 9 sekolah sampel soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara tahun
ajaran 2011/2012 ... 39
6 Hasil analisis daya beda soal try out UN mata pelajaran IPA pada setiap sekolah di Kabupaten Banjarnegara tahun ajaran
2011/2012 ... 40
7 Hasil analisis efektifitas pengecoh 9 sekolah sampel soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara
tahun ajaran 2011/2012 ... 41
8 Hasil analisis efektifitas pengecoh soal try out UN mata pelajaran IPA pada setiap sekolah di Kabupaten Banjarnegara
tahun ajaran 2011/2012 ... 42
9 Hasil analisis reliabilitas 9 sekolah sampel soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara tahun
ajaran 2011/2012 ... 43
10 Hasil analisis reliabilitas soal try out mata pelajaran IPA pada setiap sekolah di Kabupaten Banjarnegara tahun ajaran
2011/2012 ... 44
DAFTAR GAMBAR
Gambar Halaman
1 Tampilan lembar kerja Notepad ... 31
2 Tampilan data yang diinput dalam Notepad ... 31
3 Tampilan pertanyaan yang muncul dilayar komputer ... 32
4 Tampilan hasil statistik butir soal ... 33
5 Tampilan hasil statistik tes ... 34
6 Tampilan hasil skor pilihan ganda ... 34
7 Tampilan rata-rata persentase tingkat kesukaran soal sangat sukar, sukar, sedang, mudah dan sangat mudah ... 38
8 Tampilan rata-rata persentase daya beda soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara tahun ajaran 2011/2012 ... 41
9 Tampilan rata-rata persentase efektifitas pengecoh pada soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara tahun ajaran 2011/2012 ... 43
10 Tampilan nilai reliabilitas pada soal try out UN mata pelajaran IPA SMP di Kabupaten Banjarnegara tahun ajaran 2011/2012 ... 45
DAFTAR LAMPIRAN
Lampiran Halaman
1 Daftar kode SMP di Kabupaten Banjarnegara yang soal try out
mata pelajaran IPA dianalisis ... 60
2 Soal try out Ujian Nasional mata pelajaran IPA SMP di
Kabupaten Banjarnegara ... 61
3 Hasil analisis Iteman berupa statistik butir soal dan tes 9
sekolah sampel ... 66
4 Hasil analisis Iteman berupa skor pada 9 sekolah sampel ... 73
5 Hasil analisis soal try out UN mata pelajaran IPA di Kabupaten
Banjarnegara tahun ajaran 2011/2011 ... 88
6 Hasil analisis soal try out tiap sekolah sampel ... 90 7 Hasil wawancara dengan ketua MGMP IPA, guru mata
pelajaran IPA, dan peserta try out UN mata pelajaran IPA di
Kabupaten Banjarnegara ... 109
8 Surat penetapan dosen pembimbing ... 112
9 Surat ijin penelitian dari fakultas MIPA untuk Bakesbangpolinmas, Bappeda, dan Dinas Pendidikan Pemuda
dan Olah raga Kabupaten Banjarnegara ... 113
10 Surat ijin penelitian dari Bakesbangpolinmas, Bappeda dan Dinas Pendidikan, Pemuda dan Olah Raga Kabupaten
Banjarnegara ... 116
11 Surat keterangan penelitian dari seluruh sekolah sampel ... 119
BAB I
PENDAHULUAN
A.Latar Belakang
Evaluasi merupakan bagian yang tidak dapat dipisahkan dari proses
pembelajaran. Evaluasi bertujuan untuk mengetahui, memperbaiki serta
meningkatkan kualitas proses pembelajaran yang dilakukan. Demikian halnya
dengan mata pelajaran Ilmu Pengetahuan Alam (IPA). Evaluasi hasil
pembelajaran tersebut nantinya akan memberikan gambaran tentang tingkat
keberhasilan pembelajaran yang dilakukan, antara lain dalam hal pencapaian
terhadap ketuntasan belajar siswa. Oleh karena itu, sebagai guru maupun calon
guru, perlu memahami cara mengukur kualitas soal untuk suatu mata pelajaran
termasuk mata pelajaran IPA SMP.
Penilaian pembelajaran IPA SMP harus dipandang dan digunakan
sebagai cara atau teknik untuk menilai proses dan hasil belajar, karena dengan
adanya penilaian akan menghasilkan informasi penting yang bermanfaat untuk
menilai pencapaian sekaligus untuk memperbaiki program pembelajaran. Alasan
lain adalah karena pembelajaran IPA SMP termasuk mata pelajaran yang diujikan
dalam ujian nasional (UN), sehingga harus benar-benar mendapat perhatian yang
serius. Menyongsong UN,sekolah biasanya memprogramkan try out sebagai tahap
persiapan. Meskipun hanya sebagai latihan, soal-soal try out harus dibuat sebaik
mungkin, karena baik buruknya soal akan mempengaruhi perolehan hasil belajar
siswa. Hasil try out diharapkan dapat memberikan gambaran tentang kesiapan
siswa menghadapi UN.
Peserta ujian dinyatakan lulus UN apabila nilai rata-rata dari semua NA
(Nilai Akhir) mencapai paling rendah 5,5 dan nilai setiap mata pelajaran paling
rendah 4,0. Peraturan menteri pendidikan RI No 45 Tahun 2010 pasal 6
menerangkan bahwa nilai akhir (NA) diperoleh dari gabungan antara nilai sekolah
dari mata pelajaran yang diujinasionalkan dan nilai ujian nasional, dengan
pembobotan 40% untuk nilai sekolah dari mata pelajaran yang diujinasionalkan
2
mempersiapkan diri sebaik mungkin dalam menghadapi UN. Pihak sekolah dan
dinas pendidikan menyikapi hal ini dengan melakukan try out bagi siswa untuk
mengukur tingkat kesiapan siswa. Program try out tidak hanya dilakukan sekali,
melainkan disesuaikan dengan kemampuan dan kebutuhan sekolah.
Try out tingkat Kabupaten di Banjarnegara dilakukan 1-2 bulan sebelum UN, dimana try out diberikan 1 kali untuk tingkat kabupaten dan 5 kali untuk
tingkat sekolah, dengan pembuatan soal yang dilakukan oleh Musyawarah Guru
Mata Pelajaran (MGMP) di bawah koordinasi Musyawarah Kerja Kepala Sekolah
(MKKS). Soal try out di Kabupaten Banjarnegara disusun berdasarkan SKL
(Standar Kompetensi Kelulusan) dengan sebaran soal sulit 25%, sedang 50% dan
mudah 25%, selain itu juga dibuat oleh guru-guru yang kompeten di bidangnya
sehingga soal tersebut bisa dikatakan layak atau berkualitas sebagai soal try out.
Distribusi soal try out untuk Kabupaten Banjarnegara melalui korda (koordinasi
daerah) masing-masing (Ali Masruri, 6 Oktober 2010, wawancara). Soal UN
maupun soal try out berjumlah 40 soal dimana ada 20 soal fisika dan 20 soal
biologi.
Berdasarkan fakta yang ditemukan peneliti tahun 2011 pada 9 sekolah
yang dijadikan sampel rata-rata kelulusan try out yang mencapai 71,55% pada 1
sekolah, sedangkan 8 sekolah yang lain di bawah 71,55%. Namun pada hasil
kelulusan UN diatas 71,55% ada 6 sekolah, sedangkan yang dibawah 71,55% ada
Tabel 1. Data komparasi hasil try out dengan UN SMP di Kabupaten Banjarnegara Tahun Pelajaran 2010/2011.
No Nama Sekolah Hasil try
out Tahun 2010/2011
Hasil UN Tahun 2010/2011
∆ (selisih hasil UN dengan try
out)
Hasil Akhir UN
tahun 2010/2011
1. SMP N 1 Bawang 66% 94% 28% 100%
2. SMP N 2 Bawang 43% 75% 32% 100%
3. SMP N 1 Purwonegoro 54% 88% 34% 100%
4. SMP N 1 Mandiraja 79% 94% 15% 100%
5. SMP N 1 Rakit 58% 93% 35% 100%
6. SMP Taman Siswa 25% 25% 0% 89%
7. SMP Muhammadiyah
Banjarnegara
48% 100% 52% 100%
8. SMP Cokroaminoto Banjarnegara
0% 13% 13% 75%
9. SMP PGRI Purworejo Klampok
21% 62% 41% 100%
Rata-rata prosentase kelulusan
43,78% 71,55% 27,78% 96%
Berdasarkan data tersebut perlu dilakukan analisis lebih lanjut terhadap soal-soal
try out di kabupaten Banjarnegara untuk mendapatkan informasi tentang soal yang mampu menggambarkan kemampuan siswa. Informasi yang diperoleh dari
analisis nantinya akan di gunakan sebagai bahan acuan dalam pembuatan soal try
out tahun berikutnya, apakah soal try out akan dibuat lagi tanpa melihat dan mempertimbangkan kualitas soal yang sudah ada, atau memperbaiki kualitas soal
sebelumnya.
Dalam melakukan analisis soal tes dapat dilakukan dengan menggunakan
program analisis yang sudah dipercaya kemampuan analisisnya, antara lain
program Iteman. Iteman merupakan program komputer yang digunakan untuk
4
untuk dunia pendidikan program ini cukup terkenal. Program ini termasuk satu
paket program dalam MicroCAT yang dikembangkan mulai tahun 1982.
(Retnowati 2009).
Analisis terhadap butir soal pilihan ganda dapat dilakukan menggunakan
program komputer yaitu program Iteman. Berdasarkan observasi yang dilakukan,
diketahui bahwa kebanyakan peneliti baik dari kalangan guru maupun mahasiswa
cenderung melakukan analisis item secara terpisah-pisah. Sebagai contoh untuk
analisis tingkat kesukaran maupun daya beda, masing-masing dianalisis secara
terpisah sehingga menyita waktu. Analisis soal dengan menggunakan program
Iteman dapat menghemat waktu dan efektif, karena dalam satu kali kegiatan
menganalisis akan didapatkan beberapa hal, antara lain: jumlah soal yang
dianalisis, jumlah siswa, rata-rata jawaban benar, standar deviasi, skor minimum
dan maksimum siswa, reliabilitas skor, tingkat kesukaran maupun daya beda.
Hasil penelitian Afiyana (2010) yaitu analisis kualitas soal latihan ujian
mata pelajaran IPA di Kabupaten Batang, menunjukkan kualitas soal dalam
kategori kurang baik. Karena soal didominasi oleh tingkat kesukaran soal yang
tinggi. Penelitian Arrizqi (2009) mengenai analisis UAS Biologi Kelas XI di
Kabupaten Tegal pada soal pilihan ganda menunjukkan rata-rata persentase
tingkat kesukaran mudah 29%, sedang 44%, dan sulit 26% ; reliabilitas sebesar
0,467 ; daya beda soal 80% ; efektifitas pengecoh sebanyak 49% kurang
berfungsi.
Menurut Arifin (2009), analisis kualitas soal tes merupakan suatu tahap
yang harus ditempuh untuk mengetahui derajat kualitas suatu tes. Dalam penilaian
hasil belajar, tes diharapkan dapat menggambarkan perilaku peserta didik dan
menghasilkan nilai yang objektif serta akurat. Jika tes yang digunakan guru
kurang baik, maka hasil yang diperoleh tentunya kurang baik. Hal ini dapat
merugikan peserta didik itu sendiri. Tes hendaknya disusun sesuai dengan prinsip
dan prosedur penyusunan tes yang standar. Setelah digunakan perlu diketahui
apakah tes tersebut berkualitas baik atau kurang baik sehingga harus dilakukan
Kondisi demikian menggugah peneliti yang kemudian menjadi
pertimbangan sebagai bahan yang melatarbelakangi penyusunan skripsi yang
berjudul “Analisis Kualitas Soal-Soal Try Out Ujian Nasional Mata Pelajaran IPA
SMP di Kabupaten Banjarnegara”.
B.Permasalahan
Berdasarkan latar belakang di atas, permasalahan yang akan diungkap
dalam penelitian ini adalah Bagaimanakah kualitas soal-soal try out ujian nasional
mata pelajaran IPA SMP di Kabupaten Banjarnegara tahun pelajaran 2011/2012?.
C.Penegasan Istilah
1. Analisis soal
Analisis butir soal adalah identifikasi terhadap kualitas butir-butir soal
dilihat dari segi validitas, reliabilitas, daya pembeda, tingkat kesukaran dan pola
jawaban soal. Sebuah soal dikatakan baik atau berkualitas apabila memenuhi
persyaratan, yaitu valid, reliabel, tingkat kesukaran sedang dan daya beda soal
yang baik (Sudijono 1995). Dalam penelitian ini peneliti menggunakan program
Iteman versi 3.00 untuk menganalisis dan membatasi hanya soal yang berbentuk pilihan ganda (multiple choice) yang akan dianalisis kualitasnya sesuai dengan
teori tes klasik. Hal ini karena soal bentuk pilihan ganda (multiple choice) selalu
digunakan untuk try out.
2. Kualitas soal try out UN
Kualitas soal try out yang dimaksud dalam penelitian ini adalah
identifikasi kualitas butir-butir soal ditinjau dari segi validitas, reliabilitas, daya
beda, tingkat kesukaran dan efektifitas distrakor.
3. Program Iteman
Iteman merupakan program komputer yang digunakan untuk menganalisis
butir soal secara klasik. Program ini termasuk satu paket dalam MicroCAT yang
dikembangkan oleh Assesment System Corporation sejak tahun 1982 (Retnowati
2009). Progarm Iteman yang digunakan dalam penelitian kali ini adalah versi
6
D.Tujuan Penelitian
Tujuan yang hendak dicapai dalam penelitian ini adalah untuk mengetahui
kualitas soal try out mata pelajaran Ilmu Pengetahuan Alam (IPA) Sekolah
Menengah Pertama di kabupaten Banjarnegara tahun pelajaran 2011/2012.
E.Manfaat Penelitian
Hasil penelitian ini diharapkan memiliki manfaat sebagai berikut:
1. Manfaat teoritis
a. Hasil analisis dalam penelitian ini dapat dijadikan masukan yang berharga
saat melakukan evaluasi.
b. Dapat menjadi acuan bagi para peneliti lain untuk melakukan penelitian
sejenis atau melanjutkan penelitian tersebut secara intensif dan mendalam.
2. Manfaat praktis
a. Dapat menjadi masukan bagi Dinas Pendidikan, Pemuda dan Olahraga
Kabupaten Banjarnegara sebagai bahan untuk menentukan kebijakan dan
langkah-langkah yang dipandang efektif dibidang pendidikan, terutama
yang berhubungan dengan evaluasi.
b. Bagi guru, terutama penyusun soal try out UN, hasil penelitian ini dapat
dijadikan sebagai bahan pertimbangan untuk memperbaiki kualitas soal.
BAB II
TINJAUAN PUSTAKA DAN KERANGKA BERFIKIR
A.Tinjaun Pustaka
1. Penilaian dalam Pembelajaran
Penilaian dan pembelajaran merupakan dua kesatuan yang tak
terpisahkan. Oleh karena itu, penilaian menjadi bagian yang sangat penting untuk
merefleksi input maupun output dalam pembelajaran suatu sekolah. Penilaian
pembelajaran di sekolah meliputi banyak segi yang secara garis besar dapat dilihat
dari calon siswa, lulusan dan proses pendidikan secara menyeluruh (Hayat 2006).
Lebih lanjut Hayat (2006) menjelaskan bahwa, pembelajaran dan penilaian
merupakan sebuah siklus, dimana keberadaan suatu aspek akan mempengaruhi
aspek yang lainnya. Pembelajaran yang dilakukan akan tercermin dalam penilaian
yang merupakan bagian dari proses evaluasi yang dilakukan. Proses pembelajaran
yang baik akan menghasilkan penilaian yang baik pula.
Pada dasarnya upaya peningkatan kualitas pendidikan memerlukan upaya
peningkatan pembelajaran, karena muara dari berbagai program pendidikan
adalah pada terlaksananya program pembelajaran yang berkualitas. Upaya
peningkatan program pembelajaran memerlukan informasi hasil evaluasi
program-program pembelajaran sebelumnya. Untuk dapat menyusun program
pembelajaran yang lebih baik, evaluasi program pembelajaran sebelumnya
merupakan acuan yang tidak dapat ditinggalkan. Hasil dari evaluasi program
pembelajaran akan memberikan informasi secara optimal untuk perbaikan
program pembelajaran. Menurut Widoyoko (2010), evaluasi terhadap program
pembelajaran yang disusun dan dilaksanakan guru sebaiknya menjangkau
penilaian terhadap: 1) Desain pembelajaran yang meliputi kompetensi yang
dikembangkan, strategi pembelajaran yang dipilih dan isi program, 2)
Implementasi program pembelajaran atau kualitas pembelajaran, serta 3) Hasil
8
2. Pentingnya Penilaian Kualitas Soal
Penilaian adalah suatu proses pengumpulan, dan penafsiran informasi
secara sistematik untuk menentukan seberapa jauh tujuan telah tercapai
(Mustaqimah 2002, dalam Muna 2006). Menilai dapat dilakukan dari banyak segi,
salah satunya adalah dari segi hasil belajar siswa. Alat ukur hasil belajar siswa
dapat berupa soal. Dalam hal ini, soal tersebut harus valid dan realibel, untuk itu
perlu adanya analisis soal tes.
Tujuan penilaian menurut Hamalik (2003) tidak hanya memberikan dasar
pemberian angka atau skor atas hasil belajar siswa. Program penilaian hasil
belajar siswa bertujuan untuk:
a. Memberikan informasi tentang kemajuan siswa dalam rangka mencapai tujuan
belajar sehubungan dengan kegiatan yang telah dilakukannya.
b. Memberikan informasi yang dapat digunakan untuk membina kegiatan belajar
lebih lanjut baik terhadap individu siswa maupun terhadap kelompok.
c. Memberikan informasi yang dapat digunakan oleh guru dan siswa untuk
mengetahui tingkat kemampuan siswa, menetapkan kesulitannya dan untuk
menetapkan kegiatan remedial.
d. Mendorong motivasi belajar siswa dengan cara mengenal kemajuan sendiri dan
merangsangnya untuk melakukan usaha perbaikan.
e. Memberikan informasi tentang semua aspek kemajuan siswa, dan pada
gilirannya setiap guru dapat membantu pertumbuhannya secara efektif menjadi
anggota masyarakat dan pribadi yang bulat.
f. Memberikan bimbingan yang tepat untuk memilih sekolah atau jabatan yang
sesuai dengan kecakapan, minat dan kesanggupannya.
Sistem penilaian yang baik akan mendorong peningkatan kualitas
pembelajaran. Tenaga pendidik harus benar-benar memahami sistem penilaian
yang akan digunakan untuk menilai hasil belajar peserta didik agar dapat
menggambarkan kemampuan peserta didik yang telah dicapai. Kualitas
pembelajaran yang baik, selain didukung oleh tenaga pendidik yang berkualitas
juga didukung oleh penilaian pembelajaran yang berkualitas pula (Miller &
Evaluasi merupakan bagian yang terpenting dalam pembelajaran, yang
dilakukan oleh seorang guru untuk mengetahui tingkat pengetahuan awal,
kecakapan siswa dan program pengajaran. Evalusi ini dapat dilakukan awal
pembelajaran untuk mengetahui sejauh mana tingkat pengetahuan siswa, dan
evaluasi akhir dari proses pembelajaran, yaitu untuk mendapat gambaran
kecakapan penyerapan dari suatu penyajian yang telah dilaksanakan dari akhir
pelajaran. Evaluasi yang diberikan pada siswa bukan hanya sekedar pelengkap
dari proses pembelajaran, akan tetapi merupakan suatu pengukuran dari suatu
proses yang harus dipersiapkan oleh guru sebelum pembelajaran berlangsung, dan
evaluasi yang diberikan kepada siswa tidak terlepas dari pengembangan
kompetensi dasar yang dijabarkan dalam bentuk indikator-indikator (Yamin
2007). Guru melakukan penilaian berdasarkan pada indikator yang dikembangan
dari kemampuan dasar sesuai materi pembelajaran yang diajarkan.
Berdasarkan keterangan diatas, setelah materi pembelajaran disiapkan
guru hendaknya segera membuat soal yang berhubungan dengan isi pelajaran
yang telah diajarkan. Soal-soal tersebut tidak boleh melenceng dari indikator yang
telah ditetapkan. Guru harus memikirkan butir-butir soal dari indikator-indikator
tersebut. Soal-soal tersebut diacak sebelum diberikan kepada siswa. Soal tersebut
akan menjadi alat ukur atau evaluasi belajar dari materi pembelajaran setelah
dipelajari.
Menurut Dasna (2009), try out sebagai salah satu upaya mengukur
kemampuan siswa sudah ada pada jalur yang tepat karena kegiatan itu dapat
memberikan gambaran tentang kompetensi yang telah dicapai/dikuasai oleh siswa,
dan memberikan pengalaman kepada siswa mengerjakan tes sebagaimana yang
akan dilakukan pada UN. Bila try out yang dilakukan menggunakan soal-soal
model UN maka hasil yang diperoleh akan menjadi bahan perenungan bagi siswa
dan sekolah untuk optimalisasi upaya dan usaha agar mencapai hasil yang optimal
pada saatnya.
UN merupakan salah satu cara untuk mengetahui sejauh mana tujuan
yang telah tercapai dalam pembelajaran. Hasilnya akan menggambarkan apakah
10
Menteri Pendidikan Nasional RI No 46 tahun 2010 menerangkan bahwa mata
pelajaran yang diikut sertakan dalam UN Tahun 2010/2011 meliputi Bahasa
Indonesia, Matematika, Bahasa Inggris, dan IPA.
3. Alat Penilaian
Alat penilaian terdiri dari dua bentuk, yaitu tes maupun non tes (Arikunto
2002):
a. Non tes, yaitu alat penilaian yang digunakan untuk mendapatkan informasi dari
sumber. Yang tergolong dalam bentuk non tes adalah sebagai berikut:
1. Skala bertingkat (rating scale)
Skala menggambarkan suatu nilai yang berbentuk angka terhadap suatu
hasil pertimbangan.
2. Kuesioner
Kuesioner juga sering dikenal sebagai angket. Kuesioner adalah daftar
pertanyaan yang harus diisi oleh orang yang akan diukur.
3. Daftar yang cocok (chek list)
Daftar yang cocok adalah deretan pertanyaan dimana responden yang
dievaluasi membutuhkan tanda cocok (√) ditempat yang sudah disediakan. 4. Wawancara
Wawancara adalah suatu metode atau cara yang digunakan untuk
mendapatkan jawaban dari responden dengan tanya-jawab sepihak.
Dikatakan sepihak karena dalam wawancara ini responden tidak diberi
kesempatan sama sekali untuk mengajukan pertanyaan. Pertanyaan hanya
diajukan oleh obyek evaluasi.
5. Pengamatan (observation)
Pengamatan adalah suatu teknik yang dilakukan dengan cara mengadakan
pengamatan secara teliti serta pengamatan secara sistematis.
6. Riwayat hidup
Riwayat hidup adalah gambaran tentang keadaan seseorang selama dalam
evaluasi akan dapat menarik suatu kesimpulan. Tentang kepribadian,
kebiasaan, dan sifat dari obyek yang dinilai.
b. Tehnik Tes
1) Pengertian tes
Adanya perbedaan individual akan menentukan berhasil tidaknya suatu
individu dalam menjalankan tugas dan kewajibannya. Dalam hal ini
berakibat pula akan adanya prestasi kerja maupun belajar. Senada dengan
adanya perbedaan individu itu, maka perlu diciptakan alat untuk
mendiagnosis atau mengukur keadaan individu, dan alat ukur tersebut
adalah tes.
Secara harfiah kata “tes” berasal dari bahasa perancis kuno yaitu
“testum” yang berarti piring untuk menyisihkan logam-logam mulia
{maksudnya adalah dengan menggunakan piring logam akan diperoleh
jenis-jenis logam mulia yang nilanya sangat tinggi (Sudijono 1995)}.
Menurut Arikunto (2002) tes merupakan alat atau prosedur yang digunakan
untuk mengetahui atau mengukur sesuatu dalam suasana tertentu. Dalam hal
ini mengunakan cara-cara dan aturan-aturan yang sudah ditentukan.
Sedangkan pengertian tes menurut Thoha (1996) sebagai alat pengukuran
berupa pertanyaan, perintah dan petunjuk yang ditujukan kepada testee
untuk mendapatkan respon yang sesuai dengan petunjuk tersebut. Selain itu,
menurut Daryanto (2001) tes juga diartikan sebagai serentetan pertanyaan
atau latihan yang digunakan untuk mengukur tingkat pengetahuan
intelegensi dan kemampuan atau bakat yang dimilki oleh individu atau
kelompok.
Terdapat beberapa istilah yang memerlukan penjelasan sehubungan
dengan uraian diatas yaitu testing. testee, dan tester. Testing berarti waktu saat dilakukannya tes atau peristiwa saat berlangsungnya penalaian dan
12
2) Macam tes
Banyak cara yang dilakukan untuk mengukur prestasi belajar siswa jika
ditinjau dari penyiapan alat tes yang digunakan. Oleh sebab itu, pengukuran
tes prestasi belajar dapat dibagi mejadi 2 tipe yitu:
a) Pengukuran yang mengunakan tes buatan guru
Bentuk tes yang dibuat oleh guru bisa sangat bervariasi misalnya
tes tertulis, tes lisan, tes kinerja dan sikap. Pengukurannya lebih
menekankan untuk mendapatkan informasi proses pembelajaran siswa
dari hari ke hari. Tes buatan guru didasarkan pada isi dan tujuan khusus
untuk kelas atau sekolah ditempat guru itu mengajar. Dalam hal ini
dikembangkan oleh guru dengan sedikit ataupun tanpa bantuan dari luar.
Selain itu biasanya menggunakan item-item soal yang belum pernah di
try-outkan, dianalisis atau direvisi sebelum menjadi bagian dari tes tersebut.
b) Pengukuran yang menggunkan tes standar
Menurut Lababa (2008) tes standar adalah tes dimana soal-soalnya
sudah mengalami proses analisis baik secara kualitatif maupun secara
kuantitatif. Langkah-langkah yang harus dilakukan untuk membuat tes
standar adalah 1) menentukan tujuan tes, 2) menentukan acuan yang akan
dipakai oleh tes (kriteria atau norma), 3) membuat kisi-kisi, 4) memilih
soal-soal dari kumpulan soal yang sudah sesuai dengan kisi-kisinya.
Apabila soal yang diambil merupakan soal baru, maka soal-soal tersebut
harus melalui tahap telaah secara kualitatif, revisi, ujicoba, analisis hasil
ujicoba sehingga diperoleh soal yang baik dari segi kualitatif maupun
kuantitatif.
Pada tes standar, soal dan penskorannya harus lebih objektif dan
mudah dilakukan sehingga pada umumnya hanya menggunakan satu
jenis penilaian saja yaitu tes tertulis, khususnya bentuk soal pilihan
ganda. Hal ini disebabkan tes standar digunakan untuk keperluan yang
pendidikan berikutnya, tes untuk melihat daya serap siswa, tes
pemantauan mutu siswa, dan sebagainya.
Bentuk tes standar telah mengalami standarisasi, yakni proses
validasi dan reliabilitas, sehingga tes tersebut benar-benar valid dan
reliable untuk suatu tujuan dan bagi kelompok tertentu. Pada tes standar,
soal dan penskorannya harus lebih objektif dan mudah dilakukan.
Dengan demikian, tes standar adalah tes dimana soal-soalnya sudah
mengalami proses analisis baik secara kaulitatif maupun kuantitatif.
3) Fungsi tes
Menutur Hidayat (2008) secara umum ada dua macam fungsi tes
yaitu:
a) Sebagai alat pengukuran terhadap peserta didik. Dalam hal ini tes
berfungsi mengukur tingkat perkembangan atau kemajuan yang telah
dicapai oleh peserta didik setelah mereka menempuh proses belajar
dalam jangka waktu tertentu.
b) Sebagai alat pengukur keberhasilan program pengajaran. Sebab melalui
tes tersebut akan dapat diketahui sudah seberapa jauh program
pengajaran yang telah ditentukan dapat dicapai.
4) Kualitas tes yang baik
Tujuan utama analisis soal adalah untuk mendapatkan informasi
tentang karakteristik setiap butir soal, baik secara kualitatif maupun
kuantitatif. Hasil suatu analisis soal dapat digunakan untuk mengetahui
apakah soal akan berfungsi dengan baik atau tidak.
Pada dasarnya cara yang ditempuh dalam analisis soal adalah melalui
telaah (analisis kualitatif) dan analisis berdasarkan data hasil uji coba
(analisis kuantitatif) yang meliputi validitas, reliabilitas, daya beda, tingkat
kesukaran dan efektifitas distraktor. Analisis secara kualitatif terhadap butir
soal pada dasarnya adalah penelaahan butir soal ditinjau dari segi kaidah
penulisan soal yaitu (1) isi atau materi; (2) konstruksi; dan (3) bahasa. Soal
yang baik harus memenuhi ketiga kaidah penulisan soal tersebut. Kaidah
14
a) Soal sesuai dengan indikator.
b) Harus memenuhi kaidah-kaidah penulisan soal, misalnya untuk soal
pilihan ganda, pokok soal juga memberikan petunjuk kearah yang benar;
pilihan jawaban harus homogen dan logis.
c) Soal menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.
d) Bahasa soal jelas dan komunikatif.
Analisis soal secara kualitatif dilakukan sebelum suatu soal diujikan.
Analisis ini belum memberikan gambaran tentang karakteristik psikometri
soal. Oleh karena itu, untuk membuktikan bahwa soal-soal itu sudah baik
perlu diuji cobakan terhadap sejumlah siswa. Jawaban siswa terhadap
soal-soal itu dijadikan dasar untuk analisis kuantitatif. Ada 2 macam
karakteristik soal yang ditinjau dalam analisis kuantitatif yaitu tingkat
kesukaran dan daya beda. Tingkat kesukaran adalah proporsi jumlah peserta
tes yang menjawab benar dengan jumlah peserta seluruhnya. Daya pembeda
adalah kemampuan suatu soal untuk membedakan antara siswa yang mampu
dengan siswa yang kurang mampu.
4. Kriteria alat ukur
Suatu tes dapat dikatakan sebagai alat pengukur yang baik jika
memenuhi kriteria berikut ini, antara lain:
a. Validitas
Valid sering diartikan sebagai kesahihan. Suatu alat ukur disebut valid
bilamana alat ukur tersebut memiliki isi yang layak mengukur objek yang
harus diukur dan sesuai dengan kriteria tertentu. Dalam hal ini ada kesesuaian
antara alat ukur dengan fungsi pengukuran dan sarana pengukuran.
Menurut Ridlo (2005), valid merupakan kualitas yang menunjukan
hubungan antara suatu pengukuran dengan tujuan belajar. Sedangkan menurut
Supriyadi (2005) validitas tes mempunyai arti bahwa tes harus mengukur apa
yang semestinya harus di ukur. Suatu instrument dikatakan valid apabila
mampu mengukur apa yang seharusnya diukur. Validitas dapat dibagi menjadi
4 macam yaitu validitas isi, validitas konstruksi, validitas ramalan dan validitas
1) Validitas isi ( content validity)
Sebuah tes dikatakan memiliki validitas isi jika mengukur tujuan khusus
tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh
karena materi yang diajarkan tertera dalam kurikulum maka validitas isi ini
sering disebut validitas kurikuler.
2) Validitas konstruksi (construct validity)
Sebuah tes dikatakan memiliki validitas konstruksi jika butir-butir soal
tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam
tujuan instruksional khusus.
3) Validitas “ada sekarang” (concurrent validity)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes
dikatakan memiliki empiris jika hasilnya sesuai dengan pengalaman. Jika
ada istilah “sesuai” tentu ada 2 hal yang dipasangkan. Dalam hal ini hasil
tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai
hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah
ada (ada sekarang, concurrent). Dalam membandingkan hasil sebuah tes
maka diperlukan suatu kriterium atau alat banding. Maka hasil tes
merupakan suatu yang dibandingkan.
4) Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dan meramal selalu mengenai hal yang
akan datang. Sebuah tes dikatakan memiliki validitas prediksi apabila
mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada
masa yang akan datang.
b. Reliabilitas
Reliabel berarti dapat dipercaya. Reliabilitas (keandalan) adalah ketetapan
atau ketelitian suatu alat evaluasi. Suatu tes atau alat evaluasi dikatakan andal
jika ia dapat dipercaya, konsisten atau stabil dan produktif (Arifin 2009). Tes
reliabel dapat tidak valid, tetapi tes yang valid biasanya reliabel. Diantara hal
yang mempengaruhi hasil tes adalah banyaknya soal dalam tes dan kualitas
butir soal. Semakin panjang tes biasanya makin relibel. Cara mencari
16
1) Metode parallel (equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya
berbeda. Dalam menggunakan metode tes paralel ini pengetes harus
menyiapkan dua buah tes, dan masing-masing dicobakan pada kelompok
siswa yang sama.
2) Metode tes ulang (test-retest method)
Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu
seri tes tetapi dicobakan dua kali, kemudian hasil dari kedua kali tes tersebut
dihitung korelasinya.
3) Metode belah dua (split-half method)
Dalam metode ini item atau butir soal dibelah menjadi dua. Ada dua cara
membelah butir soal yaitu, membelah atas item-item genap dan item-item
ganjil yang selanjutnya disebut belahan ganjil-genap, dan membelah atas
item-item awal dan item-item akhir yaitu separo jumlah pada nomor-nomor
awal dan separo pada nomor-nomor akhir yang selanjutnya disebut belahan
awal-akhir.
Nilai dari reliabilitas diberi lambang r yang dapat dicari besarnya dengan
menggunakan rumus K-R. 20 atau Spearman-Brown. Menurut Arikunto
(2002) harga r yang diperoleh dikonsultasikan dengan r tabel product
moment dengan taraf signifikan 5%. Jika harga r hitung > r tabel, maka soal tersebut reliabel. Klasifikasi reliabilitas soal adalah sebagai berikut:
0,800 < r ≤ 1,000 : sangat tinggi 0,600 < r ≤ 0,800 : tinggi 0,400 < r ≤ 0,600 : cukup 0,200 < r ≤ 0,400 : rendah 0,000 < r ≤ 0,200 : sangat rendah c. Tingkat kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah dan tidak terlalu
sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi
siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi
karena diluar jangkauannya. Ada beberapa alasan untuk menyatakan tingkat
kesukaran soal. Bisa saja tingkat kesukaran soal ditentukan oleh kedalaman
soal dan kompleksitas.
Dalam hal ini, bermutu tidaknya butir soal-soal tes hasil belajar dapat
diketahui dari derajat kesukaran soal yang dimilki oleh masing-masing butir
soal tersebut. Butir-butir soal tes belajar dapat dikatakan sebagai butir soal
yang baik, jika butir soal tersebut tidak terlalu mudah juga tidak terlalu sulit.
Dengan kata lain, taraf kesukaran soal tersebut adalah sedang / cukup. Angka
yang dapat memberi petunjuk mengenai tingkat kesukaran soal itu dikenal
dengan istilah “Difficulty indek”, dalam evaluasi belajar umumnya
dilambangkan huruf P (propotion). Besarnya tingkat kesukaran antara 0,00
sampai dengan 1,0. Menurut Arikunto (2002) klasifikasi indeks kesukaran
adalah sebagai berikut:
Soal dengan P antara 0,00 sampai 0,30 adalah soal sukar
Soal dengan P antara 0,30 sampai 0,70 adalah soal sedang
Soal dengan P antara 0,70 sampai 1,00 adalah soal mudah
d. Daya pembeda
Menurut Arikunto (2002) Daya pembeda soal adalah kemampuan soal
untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan
siswa yang bodoh (berkemampuan rendah). Angka yang menunjukan besarnya
daya pembeda disebut indeks diskriminasi (D). Seperti halnya indeks
kesukaran, indeks diskriminasi ini berkisar antara 0,00 sampai 1,00. Hanya
bedanya, indeks kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks
diskriminasi ada tanda negatif. Tanda negatif pada indeks diskriminasi
digunakan jika sesuatu soal “terbalik” menunjukkan kualitas testee. Yaitu anak
pandai disebut bodoh dan anak bodoh disebut pandai.
-1,00 0,00 1,00
daya pembeda daya pembeda daya pembeda tinggi
18
Dengan menggunakan program Iteman dapat menggambarkan tingkat
kemampuan soal dalam membedakan antara peserta didik yang sudah
memahami materi yang diujikan dengan peserta didik yang belum atau tidak
memahami materi yang diujikan. Menurut Arikunto (2007) klasifikasi daya
pembeda soal adalah sebagai berikut:
D = 0,00 - 0,20 daya pembeda soal adalah jelek
D = 0,21 – 0,40 daya pembeda soal adalah cukup
D = 0,41 – 0,70 daya pembeda soal adalah baik
D = 0,71 – 1,00 daya pembeda soal adalah baik sekali
D = negatif daya pembeda soal adalah sangat jelek
e. Efektifitas distraktor
Option atau alternatif jawaban dalam soal jumlahnya berkisar antara 3
sampai 5 option. Selain itu juga terdapat kemungkinan satu jawaban benar dari
ke lima alternatif jawaban tersebut. Sedangkan sisanya merupakan jawaban
yang salah. Jawaban yang salah itulah yang biasa dikenal dengan istilah
distraktor atau pengecoh.
Menganalisis fungsi distraktor sering dikenal dengan istilah lain yaitu
menganalisis dengan pola penyebaran jawaban soal. Adapun yang dianalisis
dengan pola penyebaran soal adalah suatu pola yang menggambarkan
bagaimana testee menentukan pilihan jawabannya terhadap kemungkinan
jawaban yang telah dipasangkan pada setiap butir soal.
Menurut Daryanto (2001) yang dimaksud pola jawaban soal adalah
distribusi peserta tes dalam hal menentukan jawaban pada soal bentuk pilihan
ganda. Dari pola jawaban soal dapat ditentukan apakah pengecoh (distraktor)
dapat berfungsi sebagai pengecoh yang baik atau tidak. Pengecoh yang tidak
dipilih sama sekali oleh peserta tes, berarti pengecoh tersebut buruk.
Sebaliknya, pengecoh dapat dikatakan baik jika pengecoh tersebut mempunyai
daya tarik yang besar bagi peserta tes yang kurang memahami konsep atau
kurang menguasai bahan untuk dipilih sebagai jawaban soal. Suatu pengecoh
(distraktor) dapat dikatakan berfungsi baik jika paling sedikit dipilih 5%
5. Pengembangan Soal Higher Order of Thinking Skill (HOTS)
Higher Order of Thinking Skill (HOTS) atau keterampilan berfikir tinggi, dibagi menjadi empat kelompok yaitu pemecahan masalah, membuat keputusan,
berpikir kritis dan berpikir kreatif. Dalam pembentukan sistem konseptual IPA
proses berpikir tingkat tinggi yang biasa digunakan adalah berpikir kritis. Belajar
berpikir kritis tidak langsung seperti belajar tentang materi, tetapi belajar
bagaimana cara berpikir kritis dalam penggunaanya untuk memecahkan masalah
saling berkaitan satu sama lain. Keterampilan berpikir siswa dapat dilatihkan
melalui kegiatan dimana siswa diberikan suatu masalah dalam hal ini masalah
berbentuk soal yang bervariasi (Prayugo 2012).
Untuk mengembangkan soal HOTS, diperlukan pemahaman terlebih
dahulu tentang HOTS dan cara mengembangkan soal HOTS.
a. Higher Order of Thinking Skill (HOTS)
Higher Order of Thinking Skill (HOTS) atau ketrampilan berfikir tingkat tinggi dibagi menjadi empat kelompok yaitu pemecahan masalah, membuat
keputusan, berfikir kritis dan berfikir kreatif.
Menurut Devi (2012) penilaian adalah proses pengumpulan dan
pengolahan informasi. Dalam pendidikan, penilaian berarti proses
pengumpulan dan pengolahan informasi untuk menentukan pencapaian hasil
belajar peserta didik. Untuk melaksanakan penilaian, guru memerlukan
instrumen penilaian dalam bentuk soal-soal, baik untuk menguji aspek kognitif,
afektif, maupun psikomotor.
Instrumen penilaian yang digunakan guru untuk menguji hasil belajar
peserta didik pada aspek kognitif biasanya diambil dari berbagai buku atau
kumpulan soal-soal ujian. Soal dapat berupa uraian atau pilihan ganda.
Kenyataan di lapangan, soal-soal cenderung lebih banyak menguji aspek
ingatan. Banyak buku yang menyajikan materi dengan mengajak peserta didik
belajar aktif, sajian konsep sangat sistematis, tetapi sering diakhiri soal evaluasi
yang kurang melatih keterampilan berpikir tingkat tinggi peserta didik. Peserta
didik tingkat SMP/MTs harus mulai dilatih berpikir tingkat tinggi sesuai
20
dengan cara melatihkan soal-soal yang sifatnya mengajak siswa berpikir dalam
level analisis, sintetis dan evaluasi.
Untuk menguji keterampilan berpikir peserta didik, soal-soal untuk
menilai hasil belajar IPA dirancang sedemikian rupa sehingga peserta didik
menjawab soal melalui proses berpikir yang sesuai dengan kata kerja
operasional dalam taksonomi Bloom, baik pada soal kognitif, afektif maupun
psikomotorik. Di dalam pembelajaran IPA dinyatakan bahwa IPA bukan hanya
penguasaan kumpulan pengetahuan yang berupa fakta-fakta, konsep-konsep,
atau prinsip-prinsip saja tetapi juga merupakan suatu proses penemuan (BSNP
2006, dalam Devi), berarti peserta didik harus selalu diajak untuk belajar IPA
menggunakan proses berpikir untuk menemukan konsep-konsep IPA.
b. Pengembangan soal HOTS
Pengembangan soal HOTS memerlukan berbagai kriteria baik dari segi
bentuk soalnya maupun konten materi subyeknya. Teknik penulisan soal-soal
HOTS baik yang berbentuk pilihan ganda atau uraian secara umum sama
dengan penulisan soal tingkat rendah, tetapi ada beberapa ciri yang
membedakannya.
Ada beberapa cara yang dapat dijadikan pedoman oleh para penulis soal
untuk menulis butir soal yang menuntut berpikir tingkat tinggi, yakni materi
yang akan ditanyakan diukur dengan perilaku sesuai dengan ranah kognitif
Bloom pada level analisis, sintesis dan evaluasi, setiap pertanyaan diberikan
dasar pertanyaan (stimulus) dan soal mengukur kemampuan berpikir kritis.
Agar butir soal yang ditulis dapat menuntut berpikir tingkat tinggi, maka
setiap butir soal selalu diberikan dasar pertanyaan (stimulus) yang berbentuk
sumber/bahan bacaan seperti: teks bacaan, paragrap, teks drama, penggalan
novel/cerita/dongeng, puisi, kasus, gambar, grafik, foto, rumus, tabel, daftar
kata/symbol, contoh, peta, film, atau suara yang direkam.
Keterampilan-keterampilan di dalam HOTS di dalam taksonomi Bloom
termasuk tiga level tertinggi yaitu analisis, sintesis dan evaluasi. Untuk peserta
didik tingkat menengah tidak semua keterampilan dapat dilatihkan melalui
berpikir peserta didik SMP/MTs dan mengkreasikan menjadi soal yang
mendorong peserta didik berpikir.
6. Kaidah Penulisan Soal Pilihan Ganda
Menulis soal pilihan ganda sangat diperlukan ketelitian dan keterampilan.
Hal yang paling sulit dilakukan dalam menulis soal dalam bentuk pilihan ganda
adalah menentukan pengecohnya. Pengecoh yang baik adalah pengecoh yang
tingkat kerumitan atau tingkat kesederhanaan, serta panjang pendeknya relatif
sama dengan kunci jawaban. Oleh karena itu, untuk memudahkan dalam
penulisan soal bentuk pilihan ganda, maka dalam penulisannya perlu mengikuti
langkah-langkah berikut, langkah pertama adalah menuliskan pokok soalnya,
langkah kedua menuliskan kunci jawabannya, langkah ketiga menuliskan
pengecohnya (BNSP 2010).
Kaidah penulisan soal pilihan ganda menurut BNSP (2010) adalah
sebagai berikut:
a. Materi
1) Soal harus sesuai dengan indikator.
2) Pengecoh harus berfungsi.
3) Setiap soal harus mempunyai satu jawaban yang benar.
b. Konstruksi
1) Pokok soal harus dirumuskan dengan jelas dan tegas.
2) Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan
yang diperlukan saja.
3) Pokok soal jangan memberi petunjuk ke arah jawaban yang benar.
4) Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda.
5) Pilihan jawaban harus homogen dan logis ditinjau dari segi materi.
6) Panjang rumusan pilihan jawaban harus relatif sama.
7) Pilihan jawaban jangan mengandung pernyataan “Semua pilihan jawaban
di atas salah" atau "Semua pilihan jawaban di atas benar".
8) Pilihan jawaban yang berbentuk angka atau waktu harus disusun
22
9) Gambar, grafik, tabel, diagram, wacana, dan sejenisnya yang terdapat pada
soal harus jelas dan berfungsi.
10)Rumusan pokok soal tidak menggunakan ungkapan atau kata yang
bermakna tidak pasti.
11)Butir soal jangan bergantung pada jawaban soal sebelumnya.
c. Bahasa/Budaya
1) Setiap soal harus menggunakan bahasa yang sesuai dengan kaidah bahasa
Indonesia.
2) Bahasa yang digunakan harus komunikatif, sehingga pernyataannya mudah
dimengerti warga belajar/peserta didik.
3) Pilihan jawaban jangan yang mengulang kata/frase yang bukan merupakan
satu kesatuan pengertian.
Mengacu pada uraian diatas, jelas bahwa try out merupakan langkah awal
yang ikut memberi andil menentukan kesuksesan UN. Selain untuk meningkatkan
menambah bekal siswa dalam menghadapi ujian nasional, dari try out tersebut
juga dapat mengetahui kesiapan siswa menghadapi UN. Penyusunan soal tentunya
harus benar-benar diperhatikan, supaya dapat memberikan kontribusi yang baik
dalam mengukur kemampuan siswa. Berdasarkan kaidah penyusunan soal
tersebut, diharapkan soal-soal yang disusun benar-benar mampu mengukur
kompetensi siswa serta dapat dijadikan bekal dalam menghadapi Ujian Nasional.
Oleh karena itu, soal-soal UN, selain harus mengikuti kaidah penyusunan
soal, tentunya juga harus disusun oleh orang-orang yang memiliki kemampuan
dalam menyusun soal, seperti unsur-unsur dosen dari perguruan tinggi, guru mata
pelajaran, anggota BSNP (ahli-ahli di bidang psikometri, evaluasi pendidikan,
kurikulum, dan manajemen pendidikan yang memiliki wawasan, pengalaman, dan
komitmen untuk peningkatan mutu pendidikan) dan pakar penilai pendidikan.
Dengan tujuan dapat meningkatkan kualitas pendidikan secara nasional dan dapat
mengetahui kemampuan para siswa secara nasional sesuai dengan mata pelajaran
yang diujikan (Andriani 2012). Mengacu pada pendapat bahwa kredibilitas
penafsiran peneliti lebih penting dari pada validitas (Burns 1999). Berdasarkan
tersebut dikerjakan oleh orang-orang yang profesional. Kualitas soal tidak cukup
dilihat dari segi validitasnnya saja, namun perlu dilihat dari segi reliabilitasnya.
Oleh karena itu, untuk mengetahui kualitas suatu soal, perlu diketahui validitas
dan reliabilitasnya.
7. Program Iteman
Program Iteman dikembangkan oleh Assesment System Corporation
mulai tahun 1982. Program ini dipergunakan untuk (Hayat 1999):
a. Menganalisis data file (format ASCII)/ notepad melalui manual entri data.
b. Menskor dan menganalisis data soal berbentuk pilihan ganda untuk 30.000
siswa dan 250 butir soal.
c. Memberikan informasi tentang validitas butir dan reliabelitas tes.
Item And Test Analysis (Iteman) merupakan perangkat lunak yang dibuat melalui bahasa pemprograman komputer dan diciptakan khusus untuk analisis
statistik butir soal dan tes. Program ini dibuat dengan pendekatan analisis butir
soal secara klasikal yang berguna untuk menentukan kualitas butir soal dan tes
berdasarkan data empiris hasil uji coba (Hayat 1999).
Analisis butir soal secara klasikal adalah proses penelaahan butir soal
melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal
yang bersangkutan dengan menggunakan teori tes klasik (Dikmenum 2000).
Adapun yang termasuk teori tes modern antara lain adalah model Rasch, Bigspet
dan SPSS. Digunakan program Iteman didasarkan pada prinsip kemudahan dan
kepraktisan jika dibandingkan dengan program modern.
Hasil dari analisis soal mencakup informasi mengenai tingkat kesukaran
soal, daya pembeda soal, dan statistika sebaran jawaban. Selain menghasilkan
statistik butir soal, juga menghasilkan statistik tes yang meliputi reliabilitas tes,
kesalahan pengukuran, dan distraktor skor. Program ini juga memberikan output
skor untuk setiap peserta tes. Seluruh data yang akan dijadikan sebagai input
dalam analisis berada dalam satu file. Program Iteman mampu menganalisis
24
karakter maksimal dalam satu file data adalah 255 karakter termasuk identitas
responden.
Menurut Hayat (1999), hasil analisis Iteman berupa dua file yaitu file
skor dan file statistik.
1. File skor
Program Iteman juga memberikan hasil skor untuk setiap peserta tes
yang menunjukan jumlah benar dari seluruh jawaban. Baris pertama dari output
menunjukan jumlah karakter untuk identitas peserta tes jumlah skala, dan nama
file input. Kemudian hasil skala diberikan secara berurutan sesuai denga urutan
peserta tes dalam file data.
2. File statistik
Statistik hasil analisis dapat dibedakan kedalam 2 bagian yaitu statistik
butir soal dan statistik tes.
a. Seq. No adalah nomor urut butir soal dalam file data.
b. Scala-Item adalah nomor urut butir soal dalam skala (tes/subtes).
c. Prop. Correct adalah proporsi siswa (peserta tes) yang menjawab benar butir soal. Nilai ekstrim (mendekati nol atau satu) menunjukan bahwa butir soal
tersebut terlalu sukar atau terlalu mudah untuk peserta tes. Indeks ini disebut
juga indeks tingkat kesukaran soal secara klasikal.
d. Biser adalah daya pembeda soal dengan menggunakan koefiensi korelasi beserial. Nilai positif menujukkan bahwa peserta tes yang menjawab benar
butir soal, mempunyai skor yang relatif tinggi dalam tes/skala tersebut.
Sebaliknya, nilai negatif menunjukan bahwa peserta tes yang menjawab benar
butir soal, memperoleh skala yang relatif rendah dalam tes/skala tersebut.
Untuk statistik pilihan jawaban (alternatif) korelasi biserial negatif sangat tidak
dikehendaki untuk kunci jawaban dan sangat dikehendaki untuk pilihan
jawaban yang lain (pengecoh).
e. Point-biser adalah juga indeks daya pembeda soal dan pilihan jawaban (alternatif) dengan menggunakan koefisiensi korelasi point-biserial.
Penafsirannya sama dengan statistik biserial. Statistik pilihan jawaban
Perbedaannya adalah bahwa statistik pilihan jawaban dihitung secara terpisah.
Untuk setiap pilihan jawaban dan didasarkan ada dipilh tidaknya alternatif
tersebut, bukan pada benarnya jawaban. Tanda bintang yang muncul disebelah
kanan hasil analisis menunjukan kunci jawaban.
Program Iteman memberikan hasil analisis statistik berikut untuk
tes/skala.
1) N of items adalah jumlah butir soal dalam tes/skala yang ikut dianalisis. Untuk tes/skala yang terdiri dari butir-butir soal dikotomi, hal ini merupakan
jumlah total butir soal dalam tes/skala.
2) N of Examines adalah jumlah peserta tes yang digunakan dalam analisis. 3) Mean adalah skor atau rata-rata skor peserta tes.
4) Variance adalah varian dari distribusi skor peserta tes yang memberikan gambaran tentang sebaran skor peserta tes.
5) Std. Dev adalah devisiasi standar dari distribusi skor peserta tes. Devisiasi standar merupakan akar dari variance.
6) Skew adalah kemiringan distribusi skor peserta tes yang memberikan gambaran tentang bentuk distribusi skor peserta tes. Kemiringan negatif
menunjukan bahwa sebagian besar skor berada pada bagian bawah (skor
rendah) dari distribusi skor. Kemiringan nol menunjukan bahwa skor
berdistribusi secara simetris di sekitar skor rata-rata (mean).
7) Kurtosis adalah puncak distribusi skor yang menggambarkan kelaindaian distribusi skor dibanding dengan distribusi normal. Nilai positif menunjukan
distribusi yang lebih lancip (memuncak) dan nilai negatif menunjukan
distribusi yang lebih landai (merata). Kurtosis untuk distribusi normal
adalah nol (0).
8) Minimum adalah skor terendah peserta tes dalam tes atau skala tersebut. 9) Maximum adalah skor tertinggi pada peserta tes atau skala tersebut.
10)Median adalah skor tengah dimana 50% berada pada atau lebih rendah dari skor tersebut.
26
0.0 sampai 1.0. Koefisien alpha hanya cocok digunakan pada tes yang
bukan mengukur kecepatan dan yang hanya mengukur satu dimensi.
Semakin tinggi koefisien alpha menandakan semakin realibel suatu soal.
12)SEM adalah kesalahan pengukuran standar untuk setiap tes atau skala. SEM merupakan estimit dari devisiasi standar kesalahan pengukuran dalam skor
tes.
13)Mean P adalah rata-rata tingkat kesukaran semua butir soal dalam tes secara klasikal dihitung dengan mencari rata-rata proporsi peseta tes yang
menjawab benar untuk semua butir soal dalam tes atau skala.
14)Mean Item-Tot adalah nilai rata-rata indeks daya pembeda yang diperoleh dengan menghitung nilai rata-rata korelasi biserial dari semua butir soal data
tes atau skala.
15)Mean-Biserial adalah juga nilai rata-rata indeks daya pembeda yang diperoleh dengan menghitung nilai rata-rata korelasi biserial dari semua
butir soal data tes atau skala.
Kelebihan analisis butir soal secara klasikal adalah mudah, dapat
dilaksanakan sehari-hari dengan cepat menggunakan komputer, murah, sederhana,
familiar dan dapat menggunakan data dari beberapa peserta didik maupun dengan
sampel kecil (Millman dan Greene 1993, dalam Dikmenum 2000). Berdasarkan
keterangan tersebut, program Iteman merupakan alat analisis soal yang sangat
praktis. Hanya dengan memasukkan data kedalam program Iteman tersebut, maka
banyak sekali hasil yang dapat diketahui. Dengan menggunakan program Iteman,
akan kita ketahui apakah soal-soal try out yang telah disusun oleh guru-guru yang
B.Kerangka Berfikir
Dengan dilakukan analisis terhadap kualitas soal try out, diharapkan
dapat diperoleh informasi yang memberikan gambaran tentang kualitas soal try
out di Banjarnegara. Memperhatikan uraian pada landasan teori, maka dapa disusun kerangka berfikir seperti gambar 1.
Rata-rata prosentase kelulusan try out tahun pelajaran 2010/2011 Kabupaten Banjarnegara mencapai 43,78 %. ( ∑ % kelulusan : ∑ sekolah = 394 : 9 = 43,78%).
Rata-rata prosentase kelulusan UN tahun pelajaran 2010/2011 Kabupaten
Banjarnegara mencapai 71,55 %. ( ∑ % kelulusan : ∑ sekolah = 644 : 9 = 71,55%).
Prosentase kelulusan try out lebih kecil, diduga disebabkan oleh tingkat kesulitan
soal lebih tinggi dari UN
Dokumentasi lembar jawaban soal try out dari 9 SMP se-kabupaten Banjarnegara tahun ajaran 2011/2012
Analisis soal try out di 9 sekolah menggunakan Program Iteman
Pembahasan hasil analisis soal try out
BAB III
METODE PENELITIAN
A.Lokasi Penelitian dan Obyek Penelitian
1. Penelitian dilakukan di 9 SMP yang diambil secara acak dari 91 SMP yang ada
di kabupaten Banjarnegara. Nama-nama 9 SMP yang dijadikan sampel tertera
pada tabel 2.
Tabel 2. Daftar 9 SMP di kabupaten Banjarnegara yang soal try out mata pelajaran IPA di analisis.
2. Obyek dari penelitian adalah soal dan hasil try out di 9 SMP kabupaten
Banjarnegara yang digunakan sebagai sampel. Sedangkan subyek dari penelitian
ini yaitu siswa kelas IX.
B.Rancangan Penelitian
Penelitian ini merupakan jenis penilitian deskriptif kuantitatif. Penelitian
deskriptif adalah suatu penelitian yang di gunakan untuk menggambarkan atau
menganalisis suatu statistik hasil penelitian, tetapi tidak digunakan untuk
membuat kesimpulan yang lebih luas (Sugiyono 2004). Data yang digunakan
No. Nama Sekolah
1. SMP N 1 Bawang
2. SMP N 2 Bawang
3. SMP N 1 Purwonegoro
4. SMP N 1 Mandiraja
5. SMP N 1 Rakit
6. SMP Taman Siswa
7. SMP Muhammadiyah Banjarnegara
8. SMP Cokroaminoto Banjarnegara
adalah data kuantitatif yaitu hasil pengamatan atas suatu hal yang bisa dinyatakan
dalam bentuk angka baik melalui perhitungan dengan rumus maupun dengan
program komputer. Sehingga dapat disimpulkan bahwa penelitian deskriptif
kuantitatif adalah penelitian yang bertujuan menggambarkan peristiwa yang
terjadi dengan menggunakan data statistik.
C.Prosedur Penelitian
Penelitian ini terdiri dari dua tahap, yaitu tahap persiapan dan
pelaksanaan.
1. Persiapan penelitian
Pada tahap awal penelitian dilakukan hal-hal sebagai berikut:
a. Meminta ijin penelitian dan mencari informasi tentang SMP di Dinas
Pendidikan, Pemuda dan Olahraga kabupaten Banjarnegara.
b. Melakukan observasi awal di Dinas Pendidikan, Pemuda dan Olahraga
kabupaten Banjarnegara untuk memperoleh data SMP di kabupaten
Banjarnegara.
c. Mencari data tentang pelaksanaan try out dari ketua MGMP IPA kabupaten
Banjarnegara.
d. Mengumpulkan nama dan jumlah siswa kelas IX, lembar soal, kunci
jawaban dan lembar jawab try out untuk dilakukan analisis.
2. Pelaksanaan penelitian
Pengambilan data penelitian dilakukan di 9 sekolah pada tahun pelajaran
2011/2012 setelah pelaksanaan try out. Data yang diperlukan seperti lembar soal,
kunci jawaban dan lembar jawab dari 9 sekolah diambil seluruhnya dengan cara
meminjam dan memfotocopy kepada guru yang bersangkutan. Setelah
mendapatkan data try out, peneliti melakukan pengolahan terhadap data tersebut,
yaitu:
a. Penghitungan validitas, reliabilitas, daya beda soal, tingkat kesukaran soal, dan
efektifitas distraktor dengan menggunakan program Iteman.
b. Menjalankan program Iteman.
30
d. Membahas atau menelaah soal-soal yang menurut penghitungan menunjukkan
kualitas yang kurang baik.
D.Metode Pengumpulan Data
Untuk memperoleh data yang diperlukan dalam pelaksanaan penelitian
ini peneliti menggunakan metode dokumentasi. Metode dokumentasi yang di
maksud yaitu dengan cara meminjam dan memfotocopy soal, kunci jawaban dan
lembar jawaban siswa.
E.Metode Analisis Data
Salah satu tujuan dilakukannya analisis soal adalah untuk mengadakan
identifikasi soal-soal yang baik, kurang baik, dan soal yang jelek, dengan
ketentuan yaitu:
a. Apakah suatu soal dapat diterima karena didukung oleh data statistik yang
memadai.
b. Tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi
sebagai soal yang baik.
Pada penelitian ini, peneliti menggunakan program komputer berupa
program Iteman. Program iteman didasarkan pada teori tes klasik. Data yang
diperoleh nantinya akan digunakan untuk analisis soal secara kuantitatif. Pada
penelitian ini dianalisis validitas, reliabilitas, daya beda, tingkat kesukaran dan
efektifitas distraktor. Sebelum mengunakan program Iteman, harus terlebih dahulu
membaca petunjuk pengoperasionalnnya secara seksama. Sebagai contoh, tahap
awal adalah membuat file data (control file) yang diberisi 5 komponen utama,
yaitu:
1. Baris pertama adalah baris pengontrol yang mendeskripsikan data.
2. Baris kedua adalah daftar kunci jawaban setiap butir soal.
3. Baris ketiga adalah banyaknya pilihan jawaban setiap butir soal.
4. Baris keempat adalah daftar butir soal yang dianalisis {jika butir yang akan
dianalaisis diberi tanda Y (yes), jika tidak ikut dalam analisis diberi tanda N
(no)}.
Langkah untuk menjalankan aplikasi ITEMAN, adalah sebagai berikut:
a. Tekan Power pada CPU komputer atau padaLaptop.
b. Tunggu beberapa saat, hingga dilayar terlihat area kerja Desktop Windows.
Peneliti menggunakan Windows 7.
c. Klik tombol Start pada baris taskbar.
d. Arahkan pada pilihan All Programs Accessories Notepad.
e. Di layar akan terlihat lembar kerja Notepad (gambar 1).
Gambar 1. Tampilan lembar kerja Notepad
f. Input data ke dalam lembar kerja Notepad (gambar 2)
32
Keterangan:
1) 005 adalah jumlah butir soal (maks 250 butir)
2) o (omit) adalah jawaban kosong
3) N adalah butir soal yang belum dikerjakan (Not respon)
4) 06 adalah jumlah siswa (maks 80)
5) DCABB adalah kunci jawaban soal nomor 1 sampai nomor 5
6) 44444 adalah jumlah pilihan jawaban (A, B, C, dan D)
7) yyyyy adalah Y=Yes untuk butir soal yang dianalisis. Ketik nnnnn untuk
butir soal yang tidak dianalisis (n adalah N=No)
8) o1 adalah nomor peserta tes, BADCC adalah jawaban peserta tes, dan
seterusnya.
g. Menyimpan file dari Notepad. File harus satu folder dengan progarm Iteman
agar memudahkan menganalisisnya.
h. Klik program Iteman mengisi pertanyaan yang muncul dilayar
komputer (gambar 3).
Gambar 3. Pertanyaan yang muncul di layar komputer.
Keterangan:
1) Enter the name of the input file: ketik nama file yang akan dianalisis,
misalnya CONTOH-1.TXT lalu tekan ENTER
2) Enter the name of the output file: ketik nama file output (hasil) yang
3) Do you want the score written to a file?: ketik Y bila dikehendaki hasil
analisis direkam, ketik N bila hasil analisis tidak direkam.
4) Bila diketik Y maka akan muncul Enter the name of the score file: ketik
nama file untuk hasil skor, misal SKOR-1.TXT lalu tekan ENTER.
Dalam waktu beberapa detik, akan muncul hasil analisis soal. Hasil
analisis dari program Iteman ada 2 yaitu statistik butir soal (gambar 4) dan
statistik tes (gambar 5).
34
Gambar 5. Hasil statistik tes.
Hasil skor untuk setiap siswa dari Iteman:
Gambar 6. Hasil skor untuk setip siswa.
Hasil korelasi point-biserial ( ) dan korelasi biserial berasal dari
Keterangan :
γpbi = koefisien korelasi biseral
Mp = rerata skor dari subyek yang menjawab betul item yang dicari
validitasnya
Mt = rerata skor total
St = standar deviasi skor total
p = proporsi subyek yang menjawab betul item tersebut
( )
q = proporsi siswa yang menjawab salah (q = 1 – p)
Menurut Ebel dan Frisbie (1991), dalam Dikmenum (2000), butir soal
dikatakan baik bila : > 0,40 untuk butir soal sangat baik; 0,30-0,39 untuk soal
baik, tetapi perlu perbaikan; 0,20-0,29 untuk soal dengan catatan, biasanya
diperlukan perbaikan; < 0,19 untuk soal jelek, dibuang, atau diperbaiki melalui
revisi. Adapun tingkat kesukaran butir soal memiliki skala 0-1. Semakin
mendekati 1 soal tergolong mudah dan mendekati 0 soal tergolong sukar.