DAFTAR ISI DAFTAR ISI ... ii PENDAHULUAN ... 1 A. Latar Belakang ... 1 B. Tujuan ... 4 C. Ruang Lingkup ... 5 D. Manfaat ... 5 LANDASAN TEORI ... 6
A. Pembelajaran Matematika SD/MI ... 6
B. Pengukuran, Penilaian, dan Evaluasi Hasil Belajar ... 11
C. Tes ... 15
D. Ragam Bentuk Soal ... 18
E. Teori Respons Butir pada Data Dikotomi ... 24
F. Teori Respons Butir pada Data Politomi ... 25
G. Kecocokan Model ... 29
H. Variabel yang Diukur ... 31
I. Strategi Asesmen ... 33 J. Siklus Asesmen ... 34 METODOLOGI PENELITIAN ... 35 A. Target Populasi ... 35 B. Sampel ... 35 C. Instrumen Penelitian ... 35
D. Strategi Pengumpulan Data ... 37
E. Kerangka Kerja Pengembangan Instrumen ... 37
F. Pelaksanaan Kegiatan Survei ... 39
KEMAMPUAN MATEMATIKA SISWA DAN KARAKTER BUTIR ... 44
A. Kemampuan Matematika Siswa ... 44
B. Siswa DIY dan Kaltim Terhadap Benchmark Internasional ... 46
C. Karakter butir soal INAP nasional dibandingkan dengan soal internasional ... 48
D. Contoh butir-butir soal INAP yang setara dengan soal internasional .... 51
KESIMPULAN DAN SARAN ... 130
A. Kesimpulan ... 130
B. Saran ... 131
BAB I PENDAHULUAN
A. Latar Belakang
Mutu sumber daya manusia merupakan faktor yang sangat menentukan bagi kemajuan dan kemakmuran suatu bangsa. Pengalaman di banyak negara menunjukkan, mutu sumber daya manusia yang baik lebih penting daripada sumber daya alam yang melimpah. Mutu sumber daya manusia yang baik hanya dapat diwujudkan dengan pendidikan yang baik dan bermutu. Oleh karena itu, upaya peningkatan mutu pendidikan merupakan hal yang tidak dapat ditawar dalam rangka meningkatkan mutu SDM bangsa Indonesia yang siap dan mampu bersaing dalam pergaulan dan pasar kerja global saat ini.
Kenyataan di lapangan menunjukkan bahwa permasalahan pendidikan dalam rangka meningkatkan mutu pendidikan memperlihatkan berbagai kendala yang meng-hambat tercapainya tujuan pendidikan seperti diamanatkan dalam Undang-undang Nomor 20 Tahun 2003 tentang Sistem Pendidikan Nasional. Rendahnya mutu pendidikan ini dapat terlihat dari berbagai indikator mikro, seperti: hasil studi Trends in International Mathematic and Science Study (TIMSS), yang bertujuan mengetahui perkembangan matematika dan sains peserta didik usia 13 tahun (SMP/MTs kelas VIII) belum menunjukkan prestasi yang memuaskan. Peserta didik Indonesia dalam kemampuan matematika pada tahun 1999 hanya mampu menempati peringkat 34 dari 38 negara, kemampuan dalam bidang sains berada di urutan ke 32. Pada tahun 2003 kemampuan matematika peserta didik Indonesia berada pada peringkat 35 dari 46 negara, sedangkan untuk kemampuan dalam bidang sains berada di urutan ke 37. Selanjutnya, pada tahun 2007 prestasi Indonesia tidak menunjukkan peningkatan yang signifikan, yaitu kemampuan matematika berada pada peringkat 36 dari 48 negara dan kemampuan sains berada pada peringkat 35.
Keprihatinan yang sama dapat dilihat dalam laporan studi Programme for International Student Assessment (PISA). Pada tahun 2000 prestasi literasi membaca (reading literacy) bagi peserta didik Indonesia usia 15 tahun berada
pada peringkat 39 dari 41 negara, prestasi literasi matematika (mathematical literacy) berada pada peringkat 39, dan prestasi literasi sains (scientific literacy) berada pada peringkat 38. Pada tahun 2003, untuk literasi membaca peserta didik Indonesia berada di peringkat 39 dari 40 negara peserta, literasi matematika berada di peringkat 38, dan untuk literasi sains berada pada peringkat 38. Pada tahun 2006 prestasi literasi membaca peserta didik Indonesia berada pada peringkat 48 dari 56 negara, literasi matematika berada pada peringkat 50 dari 57 negara, dan literasi sains berada pada peringkat 50 dari 57 negara.
Hasil studi PIRLS (Progress in International Reading Literacy Study) tahun 2006 dalam bidang membaca pada anak-anak kelas IV sekolah dasar di seluruh dunia di bawah koordinasi The International Association for the Evaluation of Educational Achievement (IEA) yang diikuti 45 negara/negara bagian, baik berasal dari negara maju maupun dari negara berkembang, memperlihatkan bahwa peserta didik Indonesia berada pada peringkat ke 41.
Secara nasional, mutu prestasi peserta didik kelas IX SMP/MTs, kelas XII SMA/MA berdasarkan ujian nasional (UN) masih sangat bervariasi dilihat dari rata-rata nasional setiap mata pelajaran. Hasil UN baik pada tahun 2006, 2007, maupun 2008 menunjukkan rentang nilai terendah dan tertinggi masih di atas 9 dari skala 10; yang menunjukkan bahwa perbedaan peserta didik kemampuan terendah dan kemampuan tertinggi masih terlampau jauh.
Standar deviasi hasil UN dari tahun ke tahun pun menunjukkan peningkatan yang berarti keragaman nilai semakin bervariasi. Sebagai contoh mata pelajaran matematika; pada tahun 2006 untuk jenjang SMP/MTs standar deviasi meningkat dari 1,10 menjadi 1,61 di tahun 2008, dan untuk jenjang SMA/MA, standar deviasi meningkat dari 0,90 di tahun 2006 menjadi 1,58 di tahun 2008. Keberagaman ini menunjukkan lebarnya penyebaran kemampuan matematika peserta didik di tahun 2008 dibandingkan tahun 2006. Rerata nilai matematika dan bahasa Indonesia di tingkat SMP/MTs-pun menunjukkan trend penurunan.
menyeluruh dari permasalahan yang dihadapi, sehingga kebijakan yang diambil dapat sinkron dengan permasalahan yang ada dan dapat menjawab pertanyaan yang sering muncul sehubungan dengan rendahnya mutu pendidikan di Indonesia. Hasil pemantauan mutu yang dilakukan secara periodik dan sistematik ini juga dapat mendiagnosa sehat tidaknya sistem pendidikan yang sedang berlaku, baik di tingkat nasional maupun provinsi/kabupaten/ kota. Selama ini di Indonesia belum ada mekanisme yang terlembaga yang memantau mutu secara periodik dan sistematik.
Di negara maju sistem pemantauan mutu sudah berjalan dengan baik dan terlembaga, seperti di Amerika (NAEP), juga di negara berkembang telah terbukti bahwa asesmen yang terlembaga dan dilaksanakan secara profesional sangat berguna untuk menyusun kebijakan dalam rangka meningkatkan mutu, seperti di Chili. Berdasarkan kenyataan ini, mengembangkan sistem pemantauan melalui asesmen secara nasional yang terlembaga bagi Indonesia sangatlah penting, mengingat Indonesia sangat besar dan heterogen dilihat dari berbagai aspek.
Dengan adanya sistem pemantauan terlembaga yang dilakukan secara periodik dan sistematik, dapat dikembangkan kebijakan yang tepat sesuai hasil diagnosa pemantauan ini, kemudian dapat dibuat laporan secara berkala, mana yang berhasil dan mana yang tidak berhasil sebagai akuntabilitas kepada publik. Dalam arti pendidikan diarahkan kepada sistem yang transparan, akuntabel, dan demokratis.
Sehubungan dengan hal tersebut, Pusat Penilaian Pendidikan, Balitbang Kemdik-nas membentuk sistem pemantauan mutu yang terlembaga di tingkat provinsi dan kabupaten/kota. Pemantauan mutu dilakukan melalui survei yang disebut Indonesian National Assessment Program (INAP). Survei ini bersifat “longitudinal” untuk memantau mutu pendidikan secara nasional pada satuan pendidikan SD/MI (kelas I – VI), SMP/MTs (kelas VII – IX), dan SMA/MA (kelas X – XII). Berdasarkan survei longitudinal ini diperoleh data tentang mutu pendidikan yang valid, tidak hanya menggambarkan pencapaian kemampuan peserta didik, tetapi juga faktor-faktor yang mempengaruhinya. Pada
implementasinya, survei INAP dilakukan bertahap dengan membidik target kelas yang berbeda di setiap tahunnya hingga satu kurun siklus pelaksanaan.
Diharapkan melalui INAP, berbagai pihak yang terlibat dalam pengambilan keputusan mengenai pendidikan, antara lain Kementerian Pendidikan Nasional, Kementerian Agama, Bappenas, Kementerian Keuangan, Pemerintah Daerah, Dinas Pendidikan Kabupaten/Kota, DPR/DPRD, Perguruan Tinggi, dan Lembaga Swadaya Masyarakat akan memperoleh informasi secara berkala, sistematis, dan ilmiah.
Permasalahan yang dapat dirumuskan dari uraian tersebut adalah: (1) belum adanya sistem pemantauan yang terlembaga di Indonesia. Kalaupun ada, sifatnya adalah adhoc; (2) kurangnya kemampuan Provinsi, Kabupaten/Kota untuk melakukan survei dalam rangka memantau mutu pendidikan, (3) belum adanya informasi secara berkala dan terbuka kepada masyarakat luas mengenai perkembangan mutu pendidikan, baik di tingkat Provinsi, maupun Kabupaten/ Kota, terlebih lagi dalam hubungannya dengan kebijakan yang sudah diambil (transparansi dan akuntabilitas), dan (4) belum disusunnya pengambilan kebijakan yang berdasarkan hasil analisis terhadap data atau informasi yang diperoleh dari hasil pemantauan mutu.
B. Tujuan
Tujuan INAP adalah melakukan pemantauan mutu pendidikan untuk: 1. Membentuk sistem pemantauan mutu pendidikan di tingkat Provinsi dan
Kabupaten/Kota yang terlembaga.
2. Meningkatkan kemampuan provinsi, kabupaten/kota untuk melakukan survei dalam rangka memantau mutu pendidikan.
3. Membandingkan tingkat keberhasilan program pendidikan (prestasi) di tingkat Provinsi dan Kabupaten/Kota
4. Mengidentifikasi domain konten dan kognitif yang belum dikuasai/lemah. 5. Mengidentifikasi variabel latar belakang peserta didik, guru, dan sekolah yang
6. Memantau tingkat ketercapaian pembelajaran dari waktu ke waktu secara periodik dan sistematik.
7. Menyusun laporan tingkat ketercapaian pembelajaran pada tingkat Provinsi dan Kabupaten/Kota.
C. Ruang Lingkup
Ruang lingkup survei ini meliputi:
1. Objek survei ini adalah peserta didik kelas IV SD/MI Negeri dan Swasta di 2 Provinsi INAP (Kalimantan Timur dan Daerah Istimewa Yogyakarta) 2. Kemampuan yang diukur adalah kemampuan matematika, membaca, dan IPA. 3. Faktor-faktor yang mempengaruhi kemampuan peserta didik baik dari latar
belakang peserta didik, guru, maupun sekolah dijaring melalui angket yang diberikan kepada peserta didik, guru, dan kepala sekolah.
D. Manfaat
Manfaat dari hasil analisis terhadap data atau informasi INAP adalah: 1. Orang tua dapat mengetahui ketercapaian prestasi peserta didik serta
faktor-faktor yang mempengaruhinya.
2. Guru dapat memanfaatkan informasi untuk perbaikan proses pembelajaran. 3. Kepala sekolah dapat memanfaatkan informasi untuk merencanakan dan
memperbaiki program manajemen sekolah, termasuk kegiatan pembelajaran. 4. Pemerintah (Pusat, Provinsi dan Kabupaten/Kota), Kemdiknas (Dikdasmen,
PMPTK, LPMP), Kementerian Agama, Bappenas, Kementerian Keuangan, Dinas Pendidikan Kabupaten/Kota, Parlemen, Perguruan Tinggi, Pengembang Kurikulum, dan lain-lain akan dapat memanfaatkan informasi dari INAP yang tersedia secara berkala, sistematis, dan ilmiah.
5. Masyarakat secara luas dapat memperoleh informasi secara berkala dan terbuka mengenai perkembangan mutu pendidikan baik di tingkat Nasional maupun Provinsi, atau Kabupaten/Kota, terlebih lagi dalam hubungannya dengan kebijakan yang sudah diambil (transparansi dan akuntabilitas).
BAB II
LANDASAN TEORI
A. Pembelajaran Matematika SD/MI
Matematika merupakan ilmu universal yang mendasari perkembangan teknologi modern, mempunyai peran penting dalam berbagai disiplin ilmu dan memajukan daya pikir manusia. Matematika yang diajarkan di jenjang persekolahan disebut matematika sekolah. Matematika sekolah atau School Mathematics adalah unsur atau bagian dari matematika yang dipilih berdasarkan dan berorientasi kepada kepentingan kependidikan dan perkembangan IPTEK (R.Soedjadi, 2000:3).
Perkembangan pesat di bidang teknologi informasi dan komunikasi dewasa ini dilandasi oleh perkembangan matematika di bidang teori bilangan, aljabar, analisis, teori peluang, dan matematika diskrit. Untuk menguasai dan mencipta teknologi di masa depan diperlukan penguasaan matematika yang kuat sejak dini. Tujuan diberikannya matematika di sekolah menurut Moch. Masykur dan Abdul Halim (2007:36) adalah untuk mempersiapkan siswa agar bisa menghadapi perubahan kehidupan dan dunia yang selalu berkembang dan sarat perubahan, melalui latihan bertindak atas dasar kemampuan berpikir logis, analitis, sistematis, kritis, dan kreatif, serta kemampuan bekerjasama. Kompetensi tersebut diperlukan agar siswa dapat memiliki kemampuan memperoleh, mengelola, dan memanfaatkan informasi untuk bertahan hidup pada keadaan yang selalu berubah, tidak pasti, dan kompetitif.
Pembelajaran matematika adalah proses pemberian pengalaman belajar kepada siswa melalui serangkaian kegiatan yang terencana sehingga siswa memperoleh kompetensi tentang bahan matematika yang dipelajari. Tujuan umum pembelajaran matematika di sekolah adalah penataan nalar, pembentukan sikap siswa dan keterampilan dalam penerapan ilmu matematika. Mata pelajaran Matematika pada satuan pendidikan SD/MI
meliputi aspek-aspek sebagai berikut: (1) Bilangan, (2) Geometri dan pengukuran, dan (3) Pengolahan data.
Kurikulum yang diterapkan dalam pembelajaran matematika di sekolah mulai tahun pelajaran 2006/2007 adalah Kurikulum Tingkat Satuan Pendidikan (KTSP). Berdasarkan Peraturan Pemerintah Republik Indonesia Nomor 19 Tahun 2005 tentang Standar Nasional Pendidikan Bab 1 Pasal 1, KTSP adalah kurikulum operasional yang disusun oleh dan dilaksanakan di masing-masing satuan pendidikan. KTSP dibuat berdasarkan Standar Isi (SI) dan Standar Kompetensi Lulusan (SKL). Penyusunan kurikulum pada tingkat satuan pendidikan dasar dan menengah berpedoman pada panduan yang disusun oleh Badan Standar Nasional Pendidikan (BSNP).
KTSP memberi keleluasaan kepada sekolah untuk mengembangkan kurikulum sesuai dengan satuan pendidikan, potensi daerah/karakteristik daerah, sosial budaya masyarakat setempat, dan peserta didik. Guru diberi otonomi dalam menjabarkan kurikulum dan siswa sebagai subjek dalam proses belajar mengajar. Guru leluasa memilih bahan ajar yang sesuai dengan kondisi sekolah dan kemampuan peserta didiknya. Selain itu, siswa diharapkan dapat mengembangkan potensinya sesuai dengan kemampuan, kebutuhan, dan minatnya. Selain itu, implementasi KTSP diharapkan dapat memenuhi standarisasi evaluasi belajar siswa.
Berikut standar kompetensi dan kompetensi dasar pada jenjang SD/MI yang menjadi arah dan landasan untuk mengembangkan materi pokok, kegiatan pembelajaran, dan indikator pencapaian kompetensi untuk penilaian.
Kelas I, Semester 1
Standar Kompetensi Kompetensi Dasar Bilangan
1. Melakukan penjumlahan dan pengurangan bilangan sampai 20
1.1 Membilang banyak benda 1.2 Mengurutkan banyak benda
1.3 Melakukan penjumlahan dan pengurangan bilangan sampai 20
1.4 Menyelesaikan masalah yang berkaitan dengan penjumlahan dan pengurangan sampai 20
Geometri dan Pengukuran
2. Menggunakan pengukuran waktu dan panjang
2.1 Menentukan waktu (pagi, siang, malam), hari, dan jam (secara bulat)
2.2 Menentukan lama suatu kejadian berlangsung 2.3 Mengenal panjang suatu benda melalui kalimat sehari-hari (pendek, panjang) dan
membandingkannya
2.4 Menyelesaikan masalah yang berkaitan dengan waktu dan panjang
3. Mengenal beberapa bangun ruang
3.1 Mengelompokkan berbagai bangun ruang sederhana (balok, prisma, tabung, bola, dan kerucut) 3.2 Menentukan urutan benda-benda ruang yang sejenis menurut besarnya
Kelas I, Semester 2
Standar kompetensi Kompetensi Dasar Bilangan
4. Melakukan penjumlahan dan pengurangan bilangan sampai dua angka dalam pemecahan masalah
4.1 Membilang banyak benda 4.2 Mengurutkan banyak benda
4.3 Menentukan nilai tempat puluhan dan satuan 4.4 Melakukan penjumlahan dan pengurangan bilangan dua angka
4.5 Menggunakan sifat operasi pertukaran dan pengelompokan
4.6 Menyelesaikan masalah yang melibatkan penjumlahan dan pengurangan bilangan dua angka
Geometri dan Pengukuran
5. Menggunakan pengukuran berat
5.1 Membandingkan berat benda (ringan, berat) 5.2 Menyelesaikan masalah yang berkaitan dengan berat benda
6. Mengenal bangun datar sederhana
6.1 Mengenal segitiga, segi empat, dan lingkaran 6.2 Mengelompokkan bangun datar menurut bentuknya
Kelas II, Semester 1
Standar kompetensi Kompetensi Dasar Bilangan
1. Melakukan penjumlahan dan pengurangan bilangan sampai 500
1.1 Membandingkan bilangan sampai 500 1.2 Mengurutkan bilangan sampai 500
1.3 Menentukan nilai tempat ratusan, puluhan, dan satuan
1.4 Melakukan penjumlahan dan pengurangan bilangan sampai 500
Geometri dan Pengukuran
2. Menggunakan
pengukuran waktu, panjang dan berat dalam pemecahan masalah
2.1 Menggunakan alat ukur waktu dengan satuan jam
2.2 Menggunakan alat ukur panjang tidak baku dan baku (cm, m) yang sering digunakan
2.3 Menggunakan alat ukur berat
2.4 Menyelesaikan masalah yang berkaitan dengan berat benda
Kelas II, Semester 2
Standar Kompetensi Kompetensi Dasar Bilangan
3. Melakukan perkalian dan pembagian bilangan sampai dua angka
3.1 Melakukan perkalian bilangan yang hasilnya bilangan dua angka
3.2 Melakukan pembagian bilangan dua angka 3.3 Melakukan operasi hitung campuran
Geometri dan Pengukuran
4. Mengenal unsur-unsur bangun datar sederhana
4.1 Mengelompokkan bangun datar 4.2 Mengenal sisi-sisi bangun datar 4.3 Mengenal sudut-sudut bangun datar
Kelas III, Semester 1
Standar Kompetensi Kompetensi Dasar Bilangan
1. Melakukan operasi hitung bilangan sampai tiga angka
1.1 Menentukan letak bilangan pada garis bilangan
1.2 Melakukan penjumlahan dan pengurangan tiga angka
1.3 Melakukan perkalian yang hasilnya bilangan tiga angka dan pembagian bilangan tiga angka 1.4 Melakukan operasi hitung campuran
1.5 Memecahkan masalah perhitungan termasuk yang berkaitan dengan uang
Geometri dan Pengukuran
2. Menggunakan pengu-kuran waktu, panjang dan berat dalam pemecahan masalah
2.1 Memilih alat ukur sesuai dengan fungsinya (meteran, timbangan, atau jam)
2.2 Menggunakan alat ukur dalam pemecahan masalah
2.3 Mengenal hubungan antar satuan waktu, antar satuan panjang, dan antar satuan berat
Kelas III, Semester 2
Standar Kompetensi Kompetensi Dasar Bilangan
3. Memahami pecahan sederhana dan penggu-naannya dalam pemecahan masalah
3.1 Mengenal pecahan sederhana 3.2 Membandingkan pecahan sederhana 3.3 Memecahkan masalah yang berkaitan dengan pecahan sederhana
Geometri dan Pengukuran
4. Memahami unsur dan sifat-sifat bangun datar sederhana
4.1 Mengidentifikasi berbagai bangun datar sederhana menurut sifat atau unsurnya 4.2 Mengidentikasi berbagai jenis dan besar sudut
5. Menghitung keliling, luas persegi dan persegi panjang, serta penggunaannya dalam pemecahan masalah
5.1 Menghitung keliling persegi dan persegi panjang
5.2 Menghitung luas persegi dan persegi panjang
5.3 Menyelesaikan masalah yang berkaitan dengan keliling, luas persegi dan persegi panjang
Kelas IV, Semester 1
Standar Kompetensi Kompetensi Dasar Bilangan
1. Memahami dan menggu-nakan sifat-sifat operasi hitung bilangan dalam pemecahan masalah
1.1 Mengidentifikasi sifat-sifat operasi hitung 1.2 Mengurutkan bilangan
1.3 Melakukan operasi perkalian dan pembagian 1.4 Melakukan operasi hitung campuran
1.5 Melakukan penaksiran dan pembulatan 1.6 Memecahkan masalah yang melibatkan uang 2. Memahami dan
menggu-nakan faktor dan keli-patan dalam pemecahan masalah
2.1 Mendeskripsikan konsep faktor dan kelipatan 2.2 Menentukan kelipatan dan faktor bilangan 2.3 Menentukan kelipatan persekutuan terkecil (KPK) dan faktor persekutuan terbesar (FPB) 2.4 Menyelesaikan masalah yang berkaitan dengan KPK dan FPB
Geometri dan Pengukuran
3. Menggunakan
pengukuran sudut, panjang, dan berat dalam pemecahan masalah
3.1 Menentukan besar sudut dengan satuan tidak baku dan satuan derajat
3.2 Menentukan hubungan antar satuan waktu, antar satuan panjang, dan antar satuan berat 3.3 Menyelesaikan masalah yang berkaitan dengan satuan waktu, panjang dan berat 3.4 Menyelesaikan masalah yang berkaitan dengan satuan kuantitas
4. Menggunakan konsep keliling dan luas bangun datar sederhana dalam
4.1 Menentukan keliling dan luas jajargenjang dan segitiga
Kelas IV, Semester 2
Standar Kompetensi Kompetensi Dasar Bilangan
5. Menjumlahkan dan mengurangkan bilangan bulat
5.1 Mengurutkan bilangan bulat 5.2 Menjumlahkan bilangan bulat 5.3 Mengurangkan bilangan bulat 5.3 Melakukan operasi hitung campuran 6. Menggunakan pecahan
dalam pemecahan masalah
6.1 Menjelaskan arti pecahan dan urutannya 6.2 Menyederhanakan berbagai bentuk pecahan 6.3 Menjumlahkan pecahan
6.4 Mengurangkan pecahan
6.5 Menyelesaikan masalah yang berkaitan dengan pecahan
7. Menggunakan lambang bilangan Romawi
7.1 Mengenal lambang bilangan Romawi 7.2 Menyatakan bilangan cacah sebagai bilangan Romawi dan sebaliknya
Geometri dan Pengukuran
8. Memahami sifat bangun ruang sederhana dan
hubungan antar bangun datar
8.1 Menentukan sifat-sifat bangun ruang sederhana
8.2 Menentukan jaring-jaring balok dan kubus 8.3 Mengidentifikasi benda-benda dan bangun datar simetris
8.4 Menentukan hasil pencerminan suatu bangun datar
B. Pengukuran, Penilaian, dan Evaluasi Hasil Belajar
Pengukuran merupakan suatu kegiatan yang dilakukan untuk mengukur dalam arti memberi angka terhadap sesuatu yang disebut objek pengukuran (Djaali & Pudji Muljono, 2008:2). Pengukuran adalah proses pemberian angka atau usaha memperoleh deskripsi numerik dari suatu tingkatan di mana seorang siswa telah mencapai karakteristik tertentu. Pengukuran bersifat kuantitatif. Berdasarkan berbagai pendapat tersebut, pengukuran dapat diartikan sebagai kegiatan yang dilakukan untuk mengukur sesuatu, sedangkan mengukur adalah membandingkan sesuatu dengan atau atas dasar ukuran tertentu. Pengukuran hasil belajar dilakukan dengan menggunakan tes. Berdasarkan standarisasinya, tes yang digunakan untuk mengukur hasil belajar ada dua yaitu tes baku dan tes buatan guru (Djaali & Pudji Muljono, 2008:4).
Adapun terkait penilaian, menurut Suharsimi Arikunto (2010:3), menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian merupakan suatu tindakan atau proses menentukan nilai sesuatu objek (Djaali & Pudji Muljono, 2008:2). Penilaian bersifat kualitatif. Berdasarkan Peraturan Pemerintah Republik Indonesia Nomor 19 Tahun 2005 tentang Standar Nasional Pendidikan bab 1 pasal 1, penilaian adalah proses pengumpulan dan pengolahan informasi untuk mengukur pencapaian hasil belajar peserta didik. Sedangkan penilaian hasil belajar adalah proses pemberian nilai terhadap hasil-hasil belajar yang dicapai siswa dengan kriteria tertentu (Nana Sudjana, 1989:3). Berdasarkan pengertian tersebut, penilaian berarti menilai sesuatu. Menilai mengandung arti mengambil keputusan terhadap sesuatu dengan ukuran baik atau buruk, sehat atau sakit dan sebagainya. Penilaian dilaksanakan secara sistematis dan berkesinambungan untuk memperoleh, menganalisis, dan menafsirkan proses dan hasil belajar siswa. Selain itu, untuk pengambilan keputusan dalam menentukan keberhasilan mencapai kompetensi yang telah ditentukan. Penilaian hasil belajar oleh satuan pendidikan bertujuan menilai pencapaian standar kompetensi lulusan untuk semua mata pelajaran yang dilakukan dalam bentuk ujian sekolah/ madrasah. Sedangkan penilaian hasil belajar oleh pemerintah bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu yang dilakukan dalam bentuk ujian nasional.
Tentang pengertian evaluasi, menurut Norman E. Gronlund & Robert L. Linn (1990: 5), evaluasi merupakan suatu proses sistematis dalam mengumpulkan, menganalisis, dan menginterpretasikan informasi untuk menentukan besarnya tujuan pembelajaran yang dicapai siswa. Evaluasi dapat juga diartikan sebagai proses menilai sesuatu berdasarkan kriteria atau tujuan yang telah ditetapkan, yang selanjutnya diikuti dengan pengambilan keputusan atas objek yang dievaluasi. Evaluasi hasil belajar digunakan untuk menunjukkan sampai di mana tingkat kemampuan dan keberhasilan siswa dalam pencapaian tujuan- tujuan kurikuler.
Berdasarkan pengertian pengukuran, penilaian, dan evaluasi di atas, maka jelas bahwa pengukuran, penilaian dan evaluasi saling berkaitan, namun berbeda dan pelaksanaannya. Pengukuran adalah langkah awal dari kegiatan evaluasi. Penilaian tidak dapat terjadi tanpa pengukuran. Untuk dapat menentukan nilai dari sesuatu yang sedang dinilai, dilakukan pengukuran. Kegiatan mengukur dan menilai itulah yang disebut dengan evaluasi.
Dalam sistem pendidikan nasional, rumusan tujuan pendidikan, baik tujuan kurikuler maupun tujuan instruksional, menggunakan klasifikasi hasil belajar dari Benyamin Bloom yang secara garis besar membaginya menjadi tiga ranah, yakni ranah kognitif, ranah afektif dan ranah psikomotorik. (Nana Sudjana,1989:22). Ketiga ranah tersebut menjadi objek penilaian hasil belajar. Diantara ketiga ranah tersebut, ranah kognitiflah yang paling banyak dinilai oleh para guru di sekolah karena berkaitan dengan kemampuan para siswa dalam menguasai materi pelajaran.
Menurut Anas Sudijono (1998:50), Bloom membagi tingkat kemampuan atau tipe hasil belajar yang termasuk aspek kognitif menjadi enam, yaitu pengetahuan (knowledge), pemahaman (comprehension), aplikasi (application), analisis (analysis), sintesis (syntesis), dan evaluasi (evaluation), namun telah direvisi oleh Lorin W. Anderson dan David R.Krathwohl (2001) menjadi mengingat (remember), memahami (understand), menerapkan (apply), menganalisis (analyze), menilai (evaluate), menciptakan (create). Perbaikan Lorin W. Anderson and David R.Krathwohl memadukan jenis pengetahuan yang akan dipelajari dan proses yang digunakan untuk belajar (proses kognitif). Pengetahuan terbagi dalam pengetahuan faktual (factual knowledge), pengetahuan konseptual (conceptual knowledge), pengetahuan prosedural (procedural knowledge), dan pengetahuan meta kognitif (meta-cognitive knowledge).
Tabel 1. Aspek Kognitif dalam Taksonomi Bloom yang Direvisi Oleh Lorin W. Anderson dan David R. Krathwohl (2001)
Aspek kognitif Keterangan
1. Mengingat (remember)
Memunculkan kembali pengetahuan relevan dari kenangan jangka panjang
(long-term memory). 1.1 Mengenali
(recognizing)
Menemukan pengetahuan di kenangan jangka panjang (long-term memory) yang konsisiten dengan bahan yang diberi. Contohnya pada soal benar-salah dan soal pilihan ganda.
1.2 Memunculkan kembali (recalling)
Memunculkan kembali pengetahuan relevan dari kenangan jangka panjang (long-term memory).
2. Memahami (understand)
Membangun konsep dari pesan instruksional, termasuk lisan, tertulis, komunikasi grafik. 2.1 Menterjemahkan
(interpreting)
Menguraikan dengan kata-kata sendiri dari satu bentuk gambaran atau representasi.
2.2 Mencontohkan (exemplifying)
Menemukan contoh khusus atau gambaran dari konsep atau prinsip
2.3 Menggolongkan (classifying)
Mengetahui bahwa sesuatu mempunyai kategori.
2.4 Meringkas (summarizing)
Mengintisarikan tema umum atau poin utama.
2.5 Menunjukkan (inferring)
Menarik kesimpulan logis dari informasi yang diberi.
2.6 Membandingkan (comparing)
Mengetahui korespondensi antara dua gagasan, objek dan sejenisnya.
2.7 Menerangkan (explaining)
Membangun hubungan sebab-akibat dari sebuah sistem.
3. Menerapkan (apply) Menggunakan prosedur di dalam situasi tertentu. 4. Menganalisis
(analyze)
Membagi materi ke dalam bagian-bagian unsur pokoknya dan menentukan bagaimana bagian-bagian tersebut berhubungan satu sama lain seperti sampai kepada maksud keseluruhan. 4.1 Membedakan
(differentiating)
Membedakan bahan yang diberikan, bagian-bagian yang relevan dari yang tidak relevan, bagian-bagian yang penting dari yang tidak penting.
4.2 Menyelenggara-kan (organizing)
Menentukan bagaimana elemen sesuai atau berfungsi dalam struktur.
4.3 Mengaitkan (attributing)
Menentukan sudut pandang, prasangka, nilai atau maksud yang mendasari materi yang diberikan.
5. Menilai (evaluate) Membuat keputusan berdasarkan kriteria atau ukuran tertentu.
5.1 Memeriksa (checking)
Mengetahui ketidakkonsistenan atau kekeliruan dalam proses atau produk yang mempunyai konsistensi mendalam, mengetahui keefektifan prosedur saat dilaksanakan.
5.2 Mengomentari (critiquing)
Mengetahui ketidakkonsistenan antara produk dan kriteria eksternal, memutuskan apakah produk mempunyai ketetapan eksternal, mengetahui kepatutan prosedur untuk masalah yang diberikan.
6. Menciptakan (create) Penyatuan bagian-bagian ke dalam suatu bentuk yang menyeluruh.
6.1 Menghasilkan (generating)
Menghasilkan hipotesis alternatif yang berdasarkan kriteria.
6.2 Merencanakan (planning)
Memikirkan prosedur untuk menyelesaikan beberapa tugas.
6.3 Menghasilkan (producing)
Menciptakan produk.
C. Tes
Tes pada umumnya digunakan untuk menilai dan mengukur hasil belajar siswa, terutama hasil belajar kognitif berkenaan dengan penguasaan bahan pengajaran sesuai dengan tujuan pendidikan dan pengajaran. Menurut Nana Sudjana (1989:35), tes sebagai alat penilaian adalah pertanyaan-pertanyaan yang diberikan kepada siswa untuk mendapat jawaban dari siswa dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tulisan), atau dalam bentuk perbuatan (tes tindakan). Sedangkan menurut Ngalim Purwanto (1984:33), yang dimaksud tes hasil belajar (achievement tes) ialah tes yang dipergunakan untuk menilai hasil-hasil pelajaran yang telah diberikan oleh guru kepada siswa-siswanya, dalam jangka waktu tertentu. Pendapat lain menyatakan bahwa tes hasil belajar dapat didefinisikan sebagai alat atau prosedur
sistematik untuk mengukur hasil belajar siswa (Cece Rakhmat dan Didi Suherdi, 1998/1999:67).
Suatu kemajuan program pendidikan dibuktikan dengan peningkatan hasil yang diperoleh yang dapat dilihat dari hasil tes belajar. Meskipun fungsi utama dari tes hasil belajar adalah mengukur prestasi belajar siswa, bukan berarti tes hasil belajar semata-mata untuk memberikan angka di rapor. Umpan balik dari diadakannya tes hasil belajar adalah nilai. Anggapan yang salah adalah jika siswa beranggapan bahwa nilai menjadi tujuan utama dalam belajar, yang terkadang dicapai dengan cara apapun. Dengan demikian, tes tersebut akan memberikan hasil yang tidak sesuai dengan apa yang hendak diukur. Tes hasil belajar diharapkan mampu menjadi motivator siswa dalam belajar. Bentuk soal yang biasa dipakai dalam tes adalah soal pilihan ganda dan soal uraian.
Keunggulan soal pilihan ganda yaitu dapat diskor dengan mudah, cepat, serta objektif dan mencakup ruang lingkup materi yang luas dalam suatu tes. Soal pilihan ganda menuntut peserta tes untuk memberikan jawaban atas pertanyaan atau pernyataan yang tercantum dalam pokok soal atau stem yang disertai dengan sejumlah kemungkinan jawaban. Pilihan jawaban terdiri atas jawaban yang benar yang disebut kunci jawaban, serta kemungkinan jawaban salah yang dinamakan pengecoh (distractor). Tugas peserta tes adalah memilih salah satu diantara jawaban yang tersedia, yang benar atau yang paling benar. Menurut Sumarna Surapranata (2004:133), bentuk soal pilihan ganda dibedakan menjadi dua macam yaitu bentuk soal dengan pokok soal (stem) pertanyaan dan bentuk soal dengan pokok soal (stem) pernyataan. Pada soal pilihan ganda berbentuk pertanyaan, stem disajikan dengan tanda tanya dan langsung ke arah permasalahan, sedangkan pada soal pilihan ganda berbentuk pernyataan, stem disajikan dengan empat buah titik di akhir kalimat yang terdapat pada stem atau dengan tiga buah titik (di awal kalimat atau di tengah kalimat).
hasil belajar adalah soal yang bertipe uraian atau essay. Pada dasarnya tes uraian adalah pertanyaan yang menuntut siswa menjawab dalam bentuk menguraikan, menjelaskan, mendiskusikan, membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai dengan tuntutan pertanyaan dengan menggunakan kata-kata dan bahasa sendiri. Maka dalam tes uraian dituntut kemampuan siswa untuk menggeneralisasikan gagasannya melalui bahasan tulisan (Nana Sujana, 1992:35). Tipe essay test lebih bersifat power test. Pada tes ini hasil penilainnya relatif tergantung penilainya. Karena itu tes uraian ini subjektif. Tujuan utama tes berbentuk uraian adalah agar siswa dapat menunjukkan proses jawaban secara terperinci, tidak hanya hasil, misalnya membuktikan dan menghitung. Selain itu, tes uraian bisa digunakan untuk melatih ingatan dan kreativitas siswa dalam mengolah suatu jawaban.
Kelebihan dari tes tertulis adalah: (a) Menyusunnya mudah, (b) Siswa bebas menjawab, (c) Siswa dilatih megemukakan pendapat, (d) Mudah disiapkan dan disusun, (e) Siswa tidak mudah berspekulasi, (f) Mendorong siswa untuk dapat mengemukakan pendapat dan serta menyusun dalam kalimat yang baik, (g) Ekonomis, karena menggunakan kertas yang sedikit. Adapun kelemahan tes uraian adalah: (a) Kadar validitas dan reliabilitas rendah, (b) Scope yang dinilai sempit, (c) Pemeriksaan yang sulit dan subjektif, (d) Hanya dapat diperiksa oleh penyusun tes atau pihak lain yang menguasai bidang yang sama, (e) Jawabannya heterogen, sehingga menyulitkan tester, (f) Baik-buruk tulisan, panjang pendek, tidak sama jawaban menimbulkan penskoran kurang objektif, dan (g) Adanya salah pengertian dalam memahami soal tes.
Adapun cara mengatasi kelemahan tes uraian dapat dilakukan dengan cara: (a) Hendaknya penulis soal menentukan batasan jawab yang diharapkan agar jawaban tes tidak terlalu beraneka ragam, (b) Bahasa yang digunakan hendaknya seefisien mungkin, ringkas, tepat dan langsung pada permasalahan sehingga mudah dipahami oleh siswa, (c) Jika soal diambil dari buku, sebaiknya redaksinya dirubah menurut redaksi penulis soal, (d) Dalam pemeriksaan sebaiknya dilakukan pernomor soal bukan perorangan, (e) Untuk
mengurangi subyektivitas, ada baiknya jika hasil pemeriksaan yang telah kita lakukan, kembali kita periksa untuk yang kedua kalinya setelah beberapa waktu tertentu, (f) Sebelum soal-soal tes diujikan, kita membuat dulu kunci jawaban atau penyelesaiannya, atau paling tidak pokok-pokok jawabannya. Dalam mata pelajaran matematika dapat dibuat perkiraan skor atau nilai tertentu untuk setiap tahap penyelesaian yang diberikan oleh siswa. Langkah ini dimaksudkan agar setiap siswa mendapat nilai yang sesuai dengan langkah-langkah pengerjaannya yang benar.
Terkait dengan penyusunan tes uraian agar diperoleh soal-soal yang berkualitas, perlu diperhatikan beberapa hal berikut ini:
a. Hendaknya tes meliputi ide-ide pokok bahan yang akan diteskan. b. Soal tidak sama persis dengan contoh yang ada pada catatan.
c. Pada waktu menyusun soal, hendaknya juga dibuatkan kunci jawaban. d. Pertanyaan menggunakan kata tanya yang bervariasi.
e. Hendaknya rumus yang digunakan dalam menjawab soal jelas dan mudah dipahami.
f. Hendaknya ditegaskan model jawaban yang dikehendaki oleh pembuat, untuk itu harus spesifik dan tidak terlalu umum.
D. Ragam Bentuk Soal
Soal adalah serangkaian tugas yang harus dikerjakan atau dijawab oleh peserta didik, suatu soal terdiri atas sejumlah butir soal. Ciri khusus soal ialah selalu mempunyai jawaban benar atau salah. Pekerjaan atau jawaban peserta didik tersebut setelah diperiksa benar-salahnya akan menghasilkan skor yang selanjutnya dengan cara tertentu diubah menjadi nilai. Soal dibagi menjadi dua bentuk, yaitu soal bentuk uraian dan soal bentuk objektif. Kedua bentuk soal memiliki kelebihan disamping kekurangan.
Pemilihan bentuk soal yang tepat ditentukan oleh tujuan ujian, jumlah peserta ujian, waktu yang tersedia untuk memeriksa lembar jawaban, cakupan materi, dan karakteristik mata pelajaran yang diujikan (Djemari Mardapi, 2008:
1. Soal Bentuk Uraian
Instrumen penilaian hasil belajar bentuk soal adalah instrumen untuk merekam hasil belajar peserta didik. Hasil belajar merupakan manifestasi tujuan belajar dalam bentuk kompetensi belajar. Oleh karenanya hasil belajar peserta didik berupa kompetensi hasil belajar, yang berisi dua hal:
a. kompetensi aspek kognitif, afektif, dan/atau psikomotor;
b. materi kimia dalam bentuk pengetahuan faktual, konseptual, prosedural, dan/atau meta kognitif.
Pada soal bentuk uraian, butir soal berbentuk kalimat dan peserta didik harus menjawab dalam bentuk kalimat pula. Atas dasar hal ini, peserta didik harus memiliki kemampuan menulis kalimat dengan cara dan bahasa ilmiah yang benar. Pada soal bentuk objektif, butir soal berupa pertanyaan atau pernyataan dan diikuti dengan sejumlah alternatif jawaban. Peserta didik menjawab butir soal dengan memilih alternatif jawaban yang sudah disediakan
Soal bentuk uraian terdiri atas butir-butir soal uraian. Butir soal uraian yang dimaksud di sini adalah butir soal yang mengandung pertanyaan yang jawabannya harus dilakukan dengan cara mengekspresikan pikiran peserta didik. Pada butir soal bentuk uraian tidak tersedia alternatif jawaban. Dalam menjawab butir soal uraian peserta didik dituntut untuk menguraikan jawabannya dengan kata-kata sendiri dan cara sendiri. Jawaban dari peserta didik selalu berbeda dalam hal bentuk, cara, dan gaya bahasanya.
Soal uraian disebut soal non objektif, karena penilaian yang dilakukan terhadap hasil ujian dengan soal bentuk ini cenderung dipengaruhi subjektivitas dari penilai (unsur pribadi penilai). Bentuk soal ini menuntut kemampuan peserta didik untuk menyampai-kan, memilih, menyusun, dan memadukan gagasan atau ide yang telah dimilikinya dengan menggunakan kata-katanya sendiri.
Soal bentuk uraian memiliki kelebihan dibandingkan soal bentuk objektif, baik dalam cara penyusunannya maupun pelaksanaannya. Keunggulan bentuk soal ini dapat mengukur tingkat berpikir dari yang rendah sampai yang tinggi, yaitu
mulai dari aspek kognitif mengingat sampai mengevaluasi. Kelebihan lainnya adalah:
a. cara menyusunnya lebih mudah daripada soal objektif,
b. mengukur hasil belajar kompleks, yang tidak dapat diukur dengan soal objektif,
c. peserta didik tidak dapat menebak jawaban.
Namun disamping kelebihan yang dimilikinya, soal uraian juga memiliki berbagai kekurangan, diantaranya:
a. untuk koreksi diperlukan waktu lama, b. materi yang dicakup sangat terbatas, c. subjektivitas tinggi,
d. reliabilitas rendah
Untuk mengurangi subjektivitas yang tinggi, ada beberapa cara yang dapat ditempuh, yaitu:
a. jawaban tiap soal tidak dituntut terlalu panjang, sehingga dapat mencakup materi yang banyak,
b. tidak melihat nama peserta ujian,
c. memeriksa tiap butir soal dalam waktu bersamaan atau sesuai nomor soal, sehingga jika penilai kelelahan dalam mengoreksi dapat berhenti di nomor soal yang sama. Hal ini dilakukan karena suasana hati penilai sangat berpengaruh dalam menilai, dan
d. menyiapkan pedoman penskoran dalam bentuk “tabel penskoran” atau “marking scheme” untuk setiap butir soal uraian yang berupa tahap-tahap perhitungan, sedangkan jika jawaban soal bersifat argumentatif, maka harus ditetapkan kata kunci yang harus ada dalam jawaban.
Soal uraian dibagi menjadi tipe uraian terbatas dan uraian bebas. Pada tipe soal uraian terbatas, jawaban peserta didik dibatasi rambu-rambu yang ditentukan dalam butir soal uraian tersebut. Jawaban peserta didik bersifat memusat
(konvergen). Ragam soal ini ada tiga yaitu ragam soal uraian melengkapi (isian), ragam soal uraian jawaban singkat, dan ragam soal uraian terbatas sederhana.
Pada tipe soal uraian bebas, peserta didik bebas menjawab soal dengan cara dan sistematika sendiri. Jawaban peserta didik terhadap soal tersebut bersifat menyebar (divergen). Ragam butir soal ini ada dua, yaitu ragam soal uraian bebas sederhana dan ragam soal uraian bebas ekspresif.
Pemberian skor soal uraian melengkapi dan jawaban singkat, cara menskornya sederhana. Skor tiap butir soal untuk jawaban benar adalah 1 (satu) dan skor tiap butir soal untuk jawaban salah adalah 0 (nol). Pemberian skor soal uraian terbatas sederhana, soal uraian bebas sederhana dan uraian bebas ekspresif, perlu dibuat cara penskorannya dengan suatu tabel penskoran atau marking scheme. Setiap langkah yang dijawab benar diberi skor, sehingga penskoran menjadi lebih objektif.
Dalam menyusun soal bentuk uraian, ada beberapa hal yang harus diperhatikan, diantaranya:
a. Materi soal uraian merupakan materi yang tidak cocok diukur dengan soal objektif.
b. Setiap butir soal menggunakan petunjuk dan rumusan yang jelas dan mudah dipahami sehingga tidak menimbulkan kebimbangan pada peserta didik.
c. Jangan memberikan kesempatan kepada peserta didik untuk memilih beberapa butir soal dari soal yang diberikan.
d. Butir soal uraian mengarah pada aspek kognitif yang tinggi (C2 ke atas).
2. Soal Bentuk Objektif
Soal bentuk objektif terdiri atas sejumlah butir soal. Butir soal objektif adalah butir soal yang mengandung pertanyaan atau pernyataan yang alternatif jawabannya telah disediakan. Peserta didik diminta memilih salah satu alternatif jawaban yang benar.
Bentuk soal objektif yang sering digunakan adalah bentuk pilihan ganda, benar salah, menjodohkan, dan uraian objektif. Soal uraian objektif sering digunakan pada bidang sains (IPA) dan teknologi atau bidang sosial yang
jawabannya sudah pasti dan hanya satu jawaban yang benar. Sedangkan soal uraian non objektif (esai) sering digunakan pada bidang ilmu sosial, yaitu jika jawabannya luas dan tidak hanya satu jawaban yang benar, tergantung argumen-tasi peserta ujian. Bentuk soal objektif pilihan ganda dan benar salah sangat tepat digunakan bila jumlah peserta ujian banyak, waktu koreksi singkat, dan cakupan materi yang diujikan banyak.
Bentuk soal uraian objektif sering digunakan pada mata pelajaran yang batasnya jelas, seperti mata pelajaran fisika, kimia, biologi, atau IPA terpadu, matematika, dan teknik. Soal pada ujian bentuk ini jawabannya hanya satu, mulai dari memilih rumus yang tepat, memasukkan angka dalam rumus, menghitung hasil, dan menafsirkan hasilnya. Soal uraian objektif penskorannya juga jelas dan rinci.
Secara umum soal berbentuk objektif memiliki beberapa kelebihan, yaitu: a. cara mengoreksi jawaban mudah, cepat, dan dapat dilakukan oleh siapapun, b. materi pokok kimia yang dicakup luas,
c. objektivitas tinggi.
Sedangkan kekurangan soal objektif antara lain: a. cara menyusunnya sukar dan lama,
b. hanya sesuai untuk mengukur hasil belajar pada aspek kognitif tingkat rendah (mengingat),
c. ada kemungkinan peserta didik menebak jawaban.
Soal objektif dibagi menjadi tipe objektif benar-salah, objektif menjodohkan, dan objektif pilihan ganda. Jawaban soal objektif dapat diskor dengan mudah dan bersifat objektif. Umumnya dipakai dasar, bila jawaban butir soal benar skor adalah 1, sedangkan bila jawaban butir soal salah, skor adalah 0.
Soal objektif bentuk pilihan ganda dapat digunakan untuk mengukur hasil belajar dari dimensi proses kognitif sederhana sampai dengan yang kompleks dan berkenaan dengan aspek mengingat, mengerti, mengaplikasi, menganalisis,
pokok soal dan alternatif pilihan jawaban. Pokok soal disebut juga stem, yang dapat berbentuk pertanyaan atau pernyataan yang belum sempurna. Pilihan jawaban dapat berbentuk perkataan, bilangan, atau kalimat, dan disebut juga option.
Kelebihan soal bentuk pilihan ganda adalah lembar jawaban dapat diperiksa dengan komputer, sehingga objektivitas penskoran dapat dijamin. Namun membuat soal pilihan ganda yang baik tidak mudah, perlu tahapan validasi kualitatif dan kuantitatif yang harus ditempuh agar benar-benar diperoleh soal dengan kualitas yang baik, valid, dan reliabel.
Soal berbentuk pilihan ganda memiliki kelebihan, diantaranya: a. cara penilaian dapat dilakukan dengan mudah, cepat, objektif,
b. kemungkinan peserta didik menjawab dengan menebak dapat dikurangi, untuk option sebanyak 5 kemungkinan menebak adalah 20% dan option sebanyak 4 kemungkinan menebak adalah 25%,
c. dapat digunakan untuk meneliti kemampuan peserta didik dalam menginter-pretasi, memilih, dan menemukan pendapat,
d. dapat digunakan berulang-ulang, dan
e. sangat cocok untuk menilai kemampuan peserta didik dalam mengaplikasikan prinsip-prinsip.
Disamping kelebihan, soal berbentuk pilihan ganda memiliki kekurangan, yaitu:
a. kebanyakan hanya digunakan untuk menilai ingatan, b. sukar menyusun soal yang benar-benar baik,
c. memerlukan waktu dan tenaga yang banyak untuk menyusunnya.
Dalam menyusun soal pilihan ganda,, ada beberapa hal yang harus diperhatikan, diantaranya:
a. Berilah petunjuk mengerjakan soal yang jelas.
b. Jangan memasukkan materi yang`tidak relevan dengan apa yang sudah dipelajari peserta didik.
c. Pernyataan pada pokok soal (stem) seharusnya merumuskan persoalan yang jelas dan berarti.
d. Pernyataan dan alternatif jawaban (option) hendaknya merupakan kesatuan kalimat yang tidak terputus.
e. Option hendaknya homogen dalam hal materi dan panjangnya, urutan bilangan dari besar ke kecil atau sebaliknya.
f. Panjang option pada suatu soal hendaknya lebih pendek daripada stem-nya. g. Usahakan agar stem dan option tidak mudah diasosiasikan.
h. Dalam penyusunannya, pola kemungkinan jawaban yang benar hendaknya jangan sistematis.
i. Harus diyakini bahwa hanya ada satu jawaban yang benar.
E. Teori Respons Butir pada Data Dikotomi
Pada analisis butir dengan teori respons butir ada asumsi yang harus dipenuhi untuk analisis ini yakni independensi lokal dan unidimensi. Pada teori ini, pendekatan probabilistik untuk menyatakan hubungan antara kemampuan peserta dengan harapan menjawab benar. Hubungan ini dinyatakan dengan model logistik dengan parameter indeks kesukaran, indeks daya beda butir dan indeks tebakan semu (pseudoguessing).
Pada model logistik tiga parameter dapat dinyatakan sebagai berikut (Hambleton, & Swaminathan, 1985 : 49; Hambleton, Swaminathan, & Rogers, 1991: 17; Baker, 2001 ). ) ( i P = ci + (1-ci) ) ( ) ( 1 i i i i b Da b Da e e ……...…… (1)
dengan
tingkat kemampuan peserta tes, Pi() probabilitas peserta tes yang memiliki kemampuan dapat menjawab butir i dengan benar, a indeks daya i pembeda, b indeks kesukaran butir ke-i,i c indeks tebakan semu butir ke-i, e i bilangan natural yang nilainya mendekati 2,718, n banyaknya butir dalam tes, danModel 2 parameter dan model 3 parameter merupakan kasus khusus dari persamaan 1. Model 2 parameter merupakan kasus khusus dari model 3 parameter, yakni ketika c=0. Model 1 parameter merupakan kasus khusus model 1 parameter, yakni ketika a=1.
Fungsi informasi butir (item information functions) merupakan suatu metode untuk menjelaskan kekuatan suatu butir pada perangkat soal dan menyatakan kekuatan atau sumbangan butir soal dalam mengungkap kemampuan laten (latent trait) yang diukur dengan tes tersebut (Hulin, C.L., Drasgow, F. & Parsons, C.K. ,1983). Secara matematis, fungsi informasi butir didefinisikan sebagai berikut. Ii () =
) ( ) ( ) ( 2 ' i i i Q P P ………...… (2)dengan i merupakan 1,2,3,…,n, Ii () fungsi informasi butir ke-i, Pi () peluang peserta dengan kemampuan menjawab benar butir i, P'i () turunan fungsi Pi () terhadap , Qi () peluang peserta dengan kemampuan menjawab salah butir i.
Fungsi informasi tes merupakan jumlah dari fungsi informasi butir-butir tes tersebut (Hambleton & Swaminathan, 1985: 94; De Gruijter, D.M. & van der Kamp, L.J.T., 2005). Berkaitan dengan hal ini, nilai fungsi informasi perangkat tes akan tinggi jika butir-butir penyusun tes mempunyai fungsi informasi yang tinggi pula. Fungsi informasi perangkat tes (I()) secara matematis dapat didefinisikan sebagai berikut.
I () =
n i i I 1 ) ( ………...…….. (3)F. Teori Respons Butir pada Data Politomi
Selain model respons butir dikotomi, ada model lain yang dapat digunakan untuk menskor respons peserta terhadap suatu butir tes, yakni model politomi. Model-model politomi pada teori respons butir antara lain nominal resons model (NRM), rating scale model (RSM), partial credit model (PCM),
graded respons model (GRM) dan generalized partial credit model (GPCM) (Van der Linden & Hambleton, 1997).
Model respons butir politomous dapat dikategorikan menjadi model respons butir nominal dan ordinal, tergantung pada asumsi karakteristik tentang data. Model respons butir nominal dapat diterapkan pada butir yang mempunyai alternatif jawaan yang tidak terurut (ordered) dan adanya berbagai tingkat kemampuan yang diukur. Pada model respons ordinal terjadi pada butir yang dapat diskor ke dalam banyaknya kategori tertentu yang tersusun dalam jawaban. Skala Likert diskor berdasarkan pedoman penskoran kategori respons terurut, yang merupakan penskoran ordinal. Butir-butir tes matematika dapat diskor menggunakan sistem parsial kredit, langkah-langkah menuju jawaban benar dihargai sebagai penskoran ordinal. Model penskoran yang pang sering dipakai ahli yakni GRM, PCM, dan GPCM.
1. Graded Respons Model (GRM)
Respons peserta terhadap butir j dengan model GRM dikategorikan menjadi m+1 skor kategori terurut, k=0,1,2,...,m dengan m merupakan banyaknya langkah dalam menyelesaikan dengan benar butir j, dan indeks kesukaran dalam setiap langkah juga terurut. Hubungan parameter butir dan kemampuan peserta dalam GRM untuk kasus homogen (aj sama dalam setiap langkah) dapat dinyatakan oleh Muraki & Bock (1997:7) sebagai berikut.
Pjk()Pjk*()Pj*k1() ...(4) )] ( exp[ 1 )] ( exp[ ) ( jk j jk j jk b Da b Da P ...(5) Dengan Pj*0()1 dan Pj* m1()=0 aj : indeks daya beda butir j
: kemampuan peserta,) ( jk
P : probabilitas peserta berkemampuan
yang memperoleh skor kategori k pada butir j) (
*
jk
P : probabilitas peserta berkemampuan
yang memperoleh skor kategori k atau lebih pada butir jD : faktor skala
2. Partial Credit Model (PCM)
PCM merupakan perluasan dari model Rasch, dengan asumsi setiap butir mempunyai daya beda yang sama. PCM mempunyai kemiripan dengan GRM pada butir yang diskor dalam kategori berjenjang, namun indeks kesukaran dalam setiap langkah tidak perlu terurut, suatu langkah dapat lebih sukar dibandingkan langkah berikutnya.
Bentuk umum PCM menurut Muraki & Bock (1997:16) sebagai berikut.
k v jv m h k v jv jk b b P 0 0 0 ) ( exp ) ( exp ) ( , k=0,1,2,...,m Dengan ) ( jkP = probabilitas peserta berkemampuan
memperoleh skor kategori k pada butir j,
: kemampuan peserta,m+1 : banyaknya kategori butir j, bjk : indeks kesukaran kategori k butir j
0 ) ( 0
k h jh b dan
h h jh h h jh b b 1 0 ) ( ) ( ……….(6)Skor kategori pada PCM menunjukkan banyaknya langkah untuk menyelesaikan dengan benar butir tersebut. Skor kategori yang lebih tinggi menunjukkan kemampuan yang lebih besar daripada skor kategori yang lebih rendah.
Pada PCM, jika suatu butir memiliki dua kategori, maka persamaan 5 menjadi persamaan model Rasch. Sebagai akibat dari hal ini, PCM dapat diterapkan pada butir politomus dan dikotomus.
3. Generalized Partial Credit Model (GPCM)
GPCM menurut Muraki (1997) merupakan bentuk umum dari PCM, yang dinyatakan dalam bentuk matematis, yang disebut sebagai fungsi respons kategori butir sebagai berikut.
e v jr m e h v jr jh Z Z P i 0 0 0 ) ( exp ) ( exp ) ( , k=0,1,2,...,mj ...(7) dan Zjh(
)=Daj(
-bjh)=Daj(
-bj+dh), bj0=0 ...(8) DenganPjk(
) : probabilitas peserta berkemampuan
memperoleh skor kategori k pada butir j,
: kemampuan peserta, aj : indeks daya beda butir j,bjh : indeks kesukaran kategori k butir j,
bj : indeks kesukaran lokasi butir j (parameter butir lokasi) dk : parameter kategori k,
mj+1 : banyaknya kategori butir j, dan D : faktor skala (D=1.7)
Parameter bjh oleh Master dimamai dengan parameter tahap butir. Parameter ini merupakan titik potong antara kurva Pjk(
) dengan Pjk-1(
). Kedua kurva hanya berpotongan di satu titik pada skala
.Jika
= bjk, maka Pjk(
) = Pjk-1(
) Jika
> bjk, maka Pjk(
) > Pjk-1(
)Jika
< bjk, maka Pjk(
) < Pjk-1(
), K=1,2,3,...,mjG. Kecocokan Model
Kemampuan peserta tes sebanyak N dinyatakan dengan yang merupakan skaa kontinu. Metode expected a posteriori (EAP) digunakan sebagai estimator untuk setiap kemampuan peserta. Menurut Du Toit (2003) estimasi EAP merupakan rerata dari distribusi posterior dari dengan diberikan pola respons terobservasi xi. Skor EAP didekati dengan titik quadrature (quadrature point) Xf dan bobot A(Xf) yakni
F f l f f F f f l f f lX
A
X
L
X
A
X
L
X
1 1)
(
)
(
)
(
)
(
...(9)Dengan Ll(Xf) merupakan probabilitas dari pola respons xi. Standar deviasi posterior dari skor EAP didekati dengan
PSD(l) =
F f l f f F f f l l f f X A X L X A X L X 1 1 2 ) ( ) ( ) ( ) ( ) ( ...(10)Setelah semua skor EAP peserta tes dikelompokkan pada suatu interval yang telah di perdeterminasikan H interval pada skala kontinu, frekuensi terobservasi dari respons kategori ke-k pada butir j dalam interval h yakni rhjk dan banyaknya peserta tes yang mengerjakan butir j dalam h interval yakni Nhj dihitung. Skala kemampan yang telah diestimasi diskalakan sehingga varians dari distribusi sampel sama pada distribusi laten dari estimasi MML parameter butir yang selalu diset berdistribusi normal N(0,1). H dengan mj+1 tabel kontingensi
untuk setiap butir ke-j. Untuk setiap interval, dihitung rerata interval
h dan nilai fungsi respons yang cocok Pjk(h). Statistik 2perbandingan likelihood untuk setiap butir dihitung dengan
j j H h hj jk h hjk m k hjk j P N r r G 1 0 2 ) ( ln 2 ...(11)Dengan Hj merupakan banyaknya interval setelah interval dengan nilai frekuensi kurang dari 5 digabung dengan interval terdekat. Derajat kebebasan sama dengan banyaknya interval Hj dikalikan dengan mj. Statistik uji 2 perbandingan likelihood untuk tes keseluruhan merupakan jumlahan dari statistik uji 2 secara terpisah. Derajat kebebasan ini juga merupakan jumlahan dari derajat kebebasan dari tiap butir. Uji kecocokan ini digunakan untuk mengevaluasi kecocokan model pada data respons yang sama ketika model tersarang pada parameter-parameternya.
Untuk mengetahui perbandingan model, menurut Thissen et. al. (1993: 72) dan Camilli dan Shepard (1994 : 76) dapat digunakan dengan metode perbandingan likelihood dalam teori respons butir (IRT-LR). Langkah-langkah untuk melakukan perbandingan likelihood sebagai berikut.
Misalkan L* merupakan nilai fungsi likelihood L. Ada dua model yang akan diperbandingkan, model C, yaitu model kompak (compact) dan model A, yaitu model yang ditingkatkan (augmented). Model C merupakan model yang lebih sederhana. Kemudian dirumuskan hipotesis :
Ho : = SetC ( SetC memuat N parameter) …...…..……….. (12) Ha : = SetA ( SetA memuat N+M parameter) ……...…… (13)
dianggap memiliki set parameter yang benar. Model C memiliki M parameter lebih sedikit dibandingkan dengan model A. Perbandingan likekihood (Likelihood Ratio, LR) untuk dua model dinyatakan dengan persamaan :
LR = ) ( * ) ( A C L L ………...…………. (14) dengan: * ) (C
L : nilai fungsi likelihood model C
* ) ( A
L ] : nilai fungsi likelihood model A.
Kemudian ditransformasikan dengan logaritma natural :
2 ) ( M = -2 ln(LR) =[-2 lnL*(C)]-[-2lnL*( A)] ………...………(15) dengan: * ) (C
L : nilai fungsi likelihood model C
* ) ( A
L ] : nilai fungsi likelihood model A.
Agar lebih mudah, G(C) = [-2 lnL*(C)] dan G(A) =[-2lnL*( A)], sehingga rasio/perbandingan logaritma likelihood menjadi
2 ) ( M
= -2ln(LR) = G( C) – G(A) ………..……(16)
Persamaan 16 tersebut berdistribusi khi-kuadrat dengan M derajat kebebasan.
H. Variabel yang Diukur
Variabel yang diukur dalam survei INAP terdiri dari pengetahuan (knowledge), keterampilan (skill), serta latar belakang peserta didik, guru, dan sekolah.
1. Pengetahuan dan Keterampilan
Pengetahuan yang diukur berupa materi yang terdapat dalam kurikulum (curriculum focused) dan materi yang bersifat lintas kurikulum (cross-curricular elements) dengan penekanan pada pemahaman konsep dan kemampuan untuk menggu-nakannya dalam kehidupan pada berbagai situasi.
a. Literasi membaca (reading literacy), meliputi: (1) kemampuan membaca (perfor-mative), (2) kemampuan menggunakan bahasa untuk memenuhi kebutuhan hidup sehari-hari (functional), (3) kemampuan mengakses pengetahuan dengan bahasanya (informational), dan (4) kemampuan mentransformasi pengetahuan serta mengeva-luasi (epistemic).
a. Literasi matematika (mathematical literacy), meliputi: (1) kemampuan mengetahui fakta dan prosedur matematika (knowing), (2) kemampuan menggunakan konsep matematika untuk menjawab permasalahan matematis sederhana (using), (3) dan kemampuan bernalar untuk memecahkan masalah yang membutuhkan pemikiran matematis (reasoning).
b. Literasi sains (scientific literacy), mencakup kemampuan: 1) menggunakan pengeta-huan atau konsep-konsep sains secara bermakna, 2) mengidentifikasi masalah, 3) menganalisis dan mengevaluasi data atau peristiwa; 4) merancang penyelidikan; 5) menggunakan dan memanipulasi alat, bahan atau prosedur; serta 6) memecahkan masalah dalam rangka memahami fakta-fakta tentang alam dan perubahan yang terjadi dalam kehidupan.
2. Latar Belakang Peserta Didik, Guru, dan Sekolah a. Latar Belakang Peserta Didik
Berdasarkan penggalian latar belakang peserta didik akan dicari informasi mengenai: demografi peserta didik, latar belakang status sosial dan ekonomi, tingkat motivasi dan minat peserta didik, partisipasi lingkungan peserta didik terhadap pendidikan, kebiasaan belajar peserta didik, persepsi peserta didik terhadap bidang studi yang diujikan, serta ekspektasi (harapan) peserta didik terhadap hasil pembelajaran.
b. Latar Belakang Guru
Setiap guru yang mengajar peserta didik yang menjadi sampel pada INAP akan diberikan angket yang mengukur aspek-aspek: demografi guru, pengalaman mengajar, latar belakang pendidikan dan pelatihan, alokasi waktu guru dalam
mengajar, opini dan persepsi guru terhadap sekolah dan peserta didik, serta kesiapan guru mengajarkan materi yang diujikan.
c. Latar Belakang Sekolah
Aspek yang diukur yang berkaitan dengan latar belakang sekolah meliputi: demografi sekolah, jumlah peserta didik dan guru, latar belakang pendidikan semua guru, status semua guru (tetap atau honorer), kebijakan sekolah dalam penerimaan peserta didik, sumber dana sekolah dan pengalokasiannya, kebijakan pembelajaran di sekolah (penentuan mata pelajaran, buku yang digunakan), dan variabel-variabel lain yang berhubungan dengan pengelolaan sekolah.
I. Strategi Asesmen
Strategi asesmen yang ditempuh dalam INAP adalah dengan cara survei yang menggunakan metodologi, prosedur, dan mekanisme yang diadaptasi dari beberapa survei Internasional yang telah dilakukan, antara lain Programme for International Students Assessment (PISA) oleh Organization for Economics Cooperation Development (OECD), Trends in International Mathematics and Science Study (TIMSS), dan Programme for International Reading Literacy Study
Tabel 4. SK dan KD IPA Kelas IV SD/MI Berdasarkan Standar Isi
Semester Jumlah SK Nomor SK Perincian KD Jumlah KD
1 6 1 4 17 2 4 3 2 4 2 5 2 6 3 2 5 1 2 14 2 4 3 2 4 3 5 3
(PIRLS) oleh International Evaluation Assessment (IEA), National Assessment of Educational Progress (NAEP).
Setiap rangkaian survei INAP diawali dengan pengembangan kerangka kerja, pengembangan instrumen yang dilaksanakan dengan memenuhi kaidah psikometrik, pemilihan sampel sekolah, pengumpulan data, pengolahan data, serta pelaporan. Di setiap tahapan, pelaksanaan dilaksanakan dengan mematuhi rambu-rambu yang diadaptasi dari prosedur kerja survei internasional.
Pusat Penilaian Pendidikan (Puspendik) adalah institusi yang mengkoor-dinir semua kegiatan INAP. Dalam pelaksanaannya Puspendik dibantu oleh Dinas Pendidikan terkait dan juga bekerjasama dengan Institusi Perguruan Tinggi di Indonesia.
J. Siklus Asesmen
Survei INAP merupakan survei tahunan yang target keseluruhannya adalah memantau pencapaian hasil pendidikan dari kelas I hingga kelas XII. Tahun 2012, kemampuan yang diukur dalam survei INAP adalah penguasaan domain konten dan kognitif kelas IV, serta latar belakang peserta didik, guru, dan sekolah yang menentukan keberhasilan peserta didik. Diharapkan dalam jangka waktu enam tahun, survei INAP telah mencapai satu siklus penuh dari kelas I hingga kelas XII.
BAB III
METODOLOGI PENELITIAN
A. Target Populasi
Populasi dari survei INAP adalah seluruh peserta didik kelas IV SD/MI di Provinsi Kalimantan Timur dan Daerah Istimewa Yogyakarta. Di setiap jenjang sekolah, target populasi INAP mencakup sekolah Negeri dan Swasta; sekolah baik, sedang dan kurang berdasar hasil UN SD.
B. Sampel
Teknik sampling yang digunakan adalah multi-stages stratified probability proportional to size sampling. Di setiap provinsi sekolah yang menjadi target populasi diklasifikasikan berdasar tiga jenis strata (stratified): (1) jenis sekolah (SD/MI), (2) status sekolah (Negeri dan Swasta), dan (3) mutu sekolah (baik, sedang, kurang). Kriteria sekolah berdasarkan nilai rata-rata sekolah pada soal-soal linking Nasional UN SD.
Di setiap Provinsi, ditentukan sekolah-sekolah yang memenuhi kriteria, yaitu lokasi terjangkau, jumlah peserta didik terdaftar memadai untuk pengam-bilan data (>7 peserta didik per sekolah), serta mencakup minimal 95% total populasi peserta didik di Provinsi tersebut. Sekolah dikelompokkan berdasarkan setiap strata dan diurutkan berdasarkan jumlah peserta didik terdaftar di masing-masing sekolah. Sebanyak 100 sekolah Provinsi terpilih sebagai sampel utama studi INAP 2012 dan setiap sekolah sampel utama disiapkan 2 sekolah cadangan.
C. Instrumen Penelitian
Instrumen yang digunakan dalam survei ini terdiri atas tes dan angket. Tes digunakan untuk mengukur prestasi peserta didik dan angket digunakan untuk mendapatkan informasi tentang variabel-variabel yang mempengaruhi prestasi peserta didik, yang meliputi variabel peserta didik, guru, sekolah, dan proses belajar-mengajar. Setiap peserta didik akan menempuh tes Matematika, Bahasa Indonesia, dan IPA.
Berdasarkan jenis mata pelajaran yang diujikan, terdapat dua macam buku tes, yaitu: (1) buku tes Matematika dan membaca, dan (2) buku tes Ilmu Pengetahuan Alam (IPA). Masing-masing buku tes terdiri atas 8 buku tes, sehingga jumlah buku tes keseluruhan adalah 16 buku tes. Antarbuku tes tersebut terdapat soal yang sama (anchor item) yang bertujuan untuk menyetarakan kemampuan peserta didik dalam satu skala, meskipun menempuh buku tes yang berbeda.
Buku tes INAP didesain dengan mengikuti matriks pemetaan soal. Untuk setiap jenjang sekolah, soal-soal dari setiap mata pelajaran dikelompokkan dalam 8 cluster soal. Setiap buku tes terdiri atas 4 cluster soal yang berasal dari mata pelajaran yang berbeda. Pengaturan cluster dalam setiap buku tes dapat dilihat dalam Tabel 5 dan Tabel 6.
Tabel 5.
Pemetaan Cluster Soal dalam Setiap Buku Tes Matematika dan Membaca
BUKU 1 BIN INT 1 (1-13) BIN CLUSTER 1 (14-27) MAT INT 1 (28-37) MAT CLUSTER 1 (38-52)
BUKU 2 MAT CLUSTER 2 (1-14) MAT INT 2 (15-25) BIN CLUSTER 2 (26-38) BIN INT 2 (39-49) BUKU 3 BIN CLUSTER 3
(1-13) BIN CLUSTER 2 (14-26) MAT CLUSTER 3 (27-40) MAT CLUSTER 2 (41-54)
BUKU 4 MAT INT 1 (1-10) MAT CLUSTER 3 (11-24) BIN INT 1 (25-37) BIN CLUSTER 3 (38-50)
BUKU 5 BIN INT 2 (1-11) BIN CLUSTER 4 (12-25) MAT INT 2 (26-36) MAT CLUSTER 4 (37-50)
BUKU 6 MAT CLUSTER 4 (1-14) MAT CLUSTER 5 (15-28) BIN CLUSTER 4 (29-42) BIN CLUSTER 5 (43-54)
BUKU 7 BIN CLUSTER 5 (1-12) BIN INT 1 (13-25) MAT CLUSTER 5 (26-39) MAT INT 1 (40-49) BUKU 8 MAT CLUSTER
6 (1-13) MAT INT 2 (14-24) BIN CLUSTER 6 (25-37) BIN INT 2 (38-48) BUKU 9 BIN CLUSTER 1
(1-14) BIN CLUSTER 6 (15-27) MAT CLUSTER 1 (28-42) MAT CLUSTER 6 (43-55)