ANALISIS SOAL MATEMATIKA BERPIKIR KRITIS DENGAN GRADE RESPONSE MODEL
Lukman Jakfar Shodiq
Pendidikan Matematika STKIP PGRI Lumajang e-mail: [email protected]
Abstrak: Penelitian ini bertujuan untuk menganalisis soal matematika berpikir kritis dengan konten bilangan, aljabar, geometri, data dan peluang untuk siswa SMP kelas VIII. Paket tes terdiri dari 10 butir soal uraian untuk mengukur kecakapan berpikir kritis analisis, interpretasi, evaluasi, inference, dan regulasi diri yang sudah melalui proses validitas item kepada pakar. Kriteria penskoran berdasarkan langkah IDEALS (Identify, Define, Enumerate, Analyze, List, Self-Correct) dengan respon tes berupa politomus ordinal skor 0 sampai 5. Teknik analisis data yang digunakan yaitu analisis deskriptif kualitatif dengan pendekatan Grade Response Model (GRM). Proses pengambilan data dilakukan melalui uji lapangan (field test) dengan subjek penelitian 50 siswa kelas VIII SMPN 1 Lumajang. Dari hasil analisis diperoleh suatu kesimpulan bahwa hasil estimasi parameter guessing untuk semua butir soal adalah 0 (nol). Item soal memenuhi kriteria parameter daya beda dengan kriteria baik dan parameter indeks kesukaran 𝛽-global pada selang -3 sampai 3 skala logit dengan kriteria soal sedang dan sukar. Kriteria sukar berada pada soal dengan aspek kritis interpretasi topik pecahan dan regulasi diri topik pengukuran geometris. Total Information Curve (TIC) untuk kalibrasi dengan GRM menghasilkan tes cukup akurat untuk menaksir peserta dengan kemampuan berpikir kritis rata-rata dan tinggi. Berdasarkan hasil penelitian ini diharapkan guru mampu meningkatkan kemampuan interpretasi matematis dan regulasi diri pada peserta didik serta penekanan kemampuan dasar topik pecahan dan geometri pada jenjang SMP dengan mengembangkan soal berpikir kritis dan menganalisa soal tersebut dengan GRM atau menggunakan soal yang telah dikembangkan peneliti yang memiliki efek potensial berpikir kritis rata-rata dan tinggi.
Kata Kunci: Soal, Berpikir Kritis, Grade Response Model.
PENDAHULUAN
Pada tahun 2019, Programme for International Student Assessment (PISA) telah mengeluarkan hasil pengukuran matematika siswa berusia 15 tahun yang dilakukan berbasis komputer pada tahun 2018. Skor matematika Indonesia mengalami tren penurunan dengan angka 379 di bawah rerata negara anggota yaitu 489 dan di bawah skor tahun 2015 yaitu 386 (Tohir, 2019). Sebagai pembanding, Cina dan Singapura menempati peringkat tinggi dengan skor 591 dan 569. Dari laporan PISA diketahui bahwa rendahnya kualitas guru dan disparitas mutu pendidikan di Indonesia
diduga menjadi penyebab utama. Selain itu, kurang berambisinya sebagian besar peserta mempengaruhi semangat siswa untuk belajar menjadi salah satu faktor yang mempengaruhi (OECD, 2018).
Perubahan kurikulum di Indonesia sangat sejalan dengan PISA (Pratiwi, 2019).
Misalnya pada buku siswa matematika kelas VII Kurikulum 2013 sudah disisipkan soal berbasis PISA, namun buku siswa masih perlu ada perbaikan untuk memunculkan kecakapan critical thinking dan problem solving siswa (Shodiq, 2015). Keterampilan khusus yang perlu diberdayakan dalam kegiatan belajar, seperti keterampilan
berpikir kritis, pemecahan masalah, metakognisi (Zubaidah, 2016). Oleh karena itu, guru harus mampu mengembangkan dan menganalisis soal yang berorientasi pada keterampilan berpikir kritis sebagai upaya meningkatkan salah satu skill peserta didik abad 21. Facione dalam (Shodiq, 2016) terdapat enam langkah membangun berpikir kritis dalam memecahkan masalah yang disingkat dengan IDEALS yaitu: I (Identify), D (Define), E (Enumerate), A (Analyze), L (List), S (Self-Correct).
Facione (2013:5) menyatakan bahwa sebagai kemampuan kognitif aspek-aspek berpikir kritis adalah sebagai berikut, yaitu:
(a) Interpretasi, adalah memahami dan mengekspresikan makna atau signifikan dari berbagai macam pengalaman, situasi, data, kejadian-kejadian, penilaian, kebiasaan atau adat, kepercayaan-kepercayaan, aturan- aturan, prosedur atau kriteria-kriteria. (b) mengidentifikasi hubungan-hubungan inferensional yang dimaksud dan aktual diantara pernyataan-pernyataan, pertanyaan- pertanyaan, konsep-konsep, deskripsi- deskripsi. (c) Evaluasi, adalah menaksir kredibilitas pernyataan-pernyataan atau representasi-representasi yang merupakan laporan-laporan atau deskripsi-deskripsi dari persepsi, pengalaman, penilaian, opini dan menaksir kekuatan logis dari hubungan- hubungan inferensional atau dimaksud diantara pernyataan-pernyataan, deskripsi- deskripsi, pertanyaan-pertanyaan atau bentuk-bentuk representasi lainnya. (d) Inference, mengidentifikasi dan memperoleh unsur-unsur yang masuk akal, membuat dugaan-dugaan dan hipotesis, dan menyimpulkan konsekuensikonsekuensi dari data. (e) Penjelasan, mampu menyatakan
hasil-hasil dari penjelasan seseorang, mempresentasikan penalaran seseorang dalam bentuk argumen-argumen yang kuat.
(f) Regulasi diri, berarti secara sadar diri memantau kegiatan-kegiatan kognitif seseorang, unsur-unsur yang digunakan dalam kegiatan-kegiatan tersebut dan hasil- hasil yang diperoleh, terutama dengan menerapkan kecakapan-kecakapan di dalam analisis dan evaluasi untuk penelitian penilaian inferensial sendiri dengan memandang pada pertanyaan, konfirmasi, validitas atau mengoreksi baik penalarannya atau hasil-hasilnya.
Sumarna Supranata (2009:1) mengemukakan bahwa analisis kualitas soal dilakukan untuk mengetahui berfungsi tidaknya sebuah soal. Sedangkan menurut Daryanto (2008:179), analisis butir soal adalah kegiatan yang dilakukan untuk mengkalisifikasikan soal-soal baik, kurang baik, soal jelek dan memperoleh petunjuk memperbaikinya. Menurut Nitko (dalam Wahidmurni, 2010:117), kegiatan analisis kualitas soal merupakan kegiatan yang harus dilakukan pendidik untuk meningkatkan mutu soal yang ditulis. Berdasarkan beberapa pendapat ahli di atas, analisis kualitas butir soal bertujuan mengkaji dan mengidentifikasi setiap butir soal dan menggunakan hasil uji untuk memperbaiki kualitas butir soal. Analis soal penting karena soal yang berkualitas akan memiliki efek potensial bagi peserta didik.
Ada dua tipe soal yang umum dilakukan, yaitu soal pilihan ganda dan soal uraian. Keunggulan soal bentuk pilihan ganda di antaranya adalah dapat mengukur kemampuan/perilaku secara objektif, sedangkan untuk soal uraian diantaranya
adalah dapat mengukur kemampuan mengorganisasikan gagasan dan menyatakan jawabannya menurut kata-kata atau kalimat sendiri. Kelemahan soal bentuk pilihan ganda diantaranya adalah sulit menyusun pengecohnya, sedangkan untuk soal uraian diantaranya adalah sulit menyusun pedoman penskorannya Depdiknas (2008:5).
Salah satu bentuk tes yang familiar digunakan oleh pendidik pada level sekolah menengah adalah tes berbentuk pilihan berganda dengan penskoran dikotomi.
Bentuk penskoran dikotomi memiliki skor yang ekstrim dimana jawaban yang benar diberi skor 1 dan jawaban yang salah diberi 0 (Bond & Fox, 2007; DeMars, 2010).
Kelebihan penskoran dikotomi ini adalah memberi kemudahan bagi pendidik dalam pemeriksaan dan penskoran tes, namun kurang memberi kesempatan bagi pendidik untuk mendiagnosis kesalahan konsep yang dilakukan oleh peserta didik (Isgiyanto, 2011). Kelemahan ini dapat diminimalisir dengan mengembangkan penskoran politomus. Sehingga dapat disimpulkan soal uraian lebih tepat digunakan dalam soal berpikir kritis karena dapat mengukur kemampuan mengorganisasikan, untuk pedoman penskoran peneliti menggunakan kriteria berpikir kritis dari Facione karena kriteria tersebut berupa langkah-langkah membangun berpikir kritis yang mudah dikonstruksi menjadi penskoran politomus.
Analisis Item Respon atau IRT (Item Response Theory), atau LTM (Latent Trait Model) adalah salah satu pendekatan modern untuk memodelkan hubungan antara kemampuan peserta uji yang dianggap laten dengan distribusi jawaban pada soal yang merupakan sesuatu yang teramati. Model ini
dimanfaatkan untuk menggambarkan kualitas item (butir) soal dilihat dari kemampuan pengerja soal (Made Tirta, 2015). Model analisis IRT yang biasanya digunakan untuk menganalisis butir data berbentuk politomus diantaranya Nominal Respons Model (NRM), Rating Scale Model (RSM), Partial Credit Model (PCM), Graded Respon Model (GRM) dan Generalized Partial Credit Model (GPCM) (Retnawati, 2014). Setiap model memiliki karakteristik khas sendiri yang membedakan satu dengan yang lainnya. Salah satu model yang dapat memberikan informasi maksimal dari parameter butir adalah model GRM.
Model GRM memungkinkan diterapkan pada tes yang pilihan jawabannya memiliki gradasi.
GRM (Grade Response Model) adalah model untuk item dengan respon politomus (lebih dari dua kriteria, misalnya:
sangat setuju, setuju, netral, kurang setuju, tidak setuju, sangat tidak setuju, dan lain- lain). Dalam penelitian ini jawaban soal menggunakan penskoran berupa data politomus ordinal dengan skor berjenjang 0, 1, 2, 3, 4, dan 5 sehingga model GRM yang paling sesuai. Software analisa yang dapat digunakan diantaranya AnBuso, ANATES, ANAJOHN, Multilog, Parscale, dan MPLUS. Menurut Wahyu Widhiarso (2013) prosedur analisis model Graded Response (GRM) dengan menggunakan software Multilog, Parscale, dan MPLUS menghasilkan estimasi parameter yang sama. Parscale merupakan program yang mudah digunakan sehingga peneliti memilih menggunkan software tersebut.
Ada beberapa penelitian terkait analisa soal dengan GRM. Setyowati (2019)
menyimpulkan “Students with very low levels of critical thinking skills were only able to complete the indicators of interpretiton in solving mathematical problems on system of linear equations in two variabels”. Mujahid (2018) menyimpulkan Analisis kemampuan berpikir kritis matematik siswa ditinjau dari kemampuan awal dengan menggunakan Graded Response Model (GRM) diketahui bahwa kemampuan awal tinggi, sedang dan rendah menunjukkan kemampuan berpikir krtis matematik sama yaitu pada tahap rata- rata antara 1,00 sampai -1,00.
Unsur pembeda penelitian ini ialah peneliti fokus pada penelitian soal matematika konten bilangan, aljabar, geometri, data dan peluang untuk siswa SMP kelas VIII yang terdiri dari 10 butir soal uraian untuk mengukur kecakapan berpikir kritis analisis, interpretasi, evaluasi, inference, dan regulasi diri. Kriteria penskoran politomus berdasarkan langkah IDEALS (Identify, Define, Enumerate, Analyze, List, Self-Correct) dengan respon tes berupa politomus ordinal skor 0 sampai 5 dengan model GRM menggunakan software Parscale.
METODE
Penelitian ini bertujuan menganalisis soal melalui proses komputasi analisis data menggunakan aplikasi Parscale 4 dengan pendekatan Grade Response Model. Hasil komputasi berupa parameter guessing, daya
beda, indeks kesukaran dan beberapa grafik sehingga analisis data menggunakan metode analisis deskriptif yaitu suatu metode untuk menggambarkan keadaan objek yang diteliti sekaligus mendeskripsikan aspek-aspek yang dijadikan pusat perhatian dalam penelitian (Zulkardi: 2015).
Subjek penelitian adalah 50 siswa berasal dari SMP N 1 Lumajang dengan pengumpulan data berupa 10 soal uraian matematika dengan 5 indikator soal berpikir kritis interpretasi, analisis, evaluasi, inference dan regulasi diri yang dikemukakan oleh Facione. Indikator berpikir kritis ini juga sejalan dengan pendapat Ennis (1985) yaitu: a) memberikan
penjelasan sederhana, b)
membangunketerampilan dasar, c) menyimpulkan, d) memberi penjelasan lanjut, dan e) mengatur strategi dan teknik.
Konten soal ialah Bilangan, Aljabar, Geometri, Data dan Peluang dengan kriteria penskoran dilakukan berdasarkan langkah berpikir kritis Facione (IDEALS) dengan skor bertingkat (graded) sesuai tabel 1.
Dalam (Manfaat & Anasha, 2013) GRM adalah salah satu model IRT untuk data politomus. GRM digunakan dengan tujuan untuk menampilkan estimasi parameter butir dan kemampuan siswa. Dalam proses pengolahan data, proses komputasi dilakukan dengan program software PARSCALE. Persamaan GRM yang digunakan dalam PARSCALE ialah Samejima’s Graded Response Model:
dimana
Tabel 1. Kriteri Penskoran berdasarkan IDEALS
IDEALS Alur menjawab Penalaran (Analisis)
(Skor 0) Tidak menjawab, atau jawaban salah.
I – Identify the problem Ditanya (Skor 1) Memahami pokok permasalahan D – Define the context Diketahui (Skor 2) Memahami informasi penting E – Enumerate the choices
A – Analyze options
Jawaban &
Alternatif solusi
(Skor 3) Bisa mengolah info penting tapi ada kesalahan (Skor 4) Bisa mengolah info, memilih alternatif solusi dan tidak melakukan kesalahan
L – List reasons explicitly S – Self correct
Re-cek jawaban (Skor 5) Bisa mengolah info dan alternatif solusi, tidak melakukan kesalahan serta melakukan evaluasi diri.
HASIL DAN PEMBAHASAN
Salah satu programming yang bisa menganalisa respon siswa yang berupa data politomus dengan pendekatan Grade Response Model ialah Parscale. Penerapan Parscale 4 relatif mudah dengan langkah awal membuat data input berupa file.DAT yang berisi nomor soal dan skor siwa pada setiap nomor soal. Jawaban siswa dibagi menjadi 5 kriteria yaitu 0, 1, 2, 3, 4 dan 5 sehingga model GRM merupakan model yang sangat tepat. Berikut ini peneliti sajikan hasil analisa dari pendekatan GRM dengan aplikasi Parscale 4 untuk menganalisis 10 soal matematika berpikir kritis.
Programming GRM
Data hasil jawaban siswa pada paket soal dianalisis dengan pendekatan Grade Response Model (GRM dengan menggunakan software PARSCALE 4. Tahap awal dalam
melakukan analisis dengan PARSCALE ialah dengan cara membuat file input yang berupa file.DAT dengan konten berupa kolom nomor item dan selanjutnya kolom skor respon siswa. Gambar 2 menyajikan gambar input, file programming dan luaran (output) hasil pengolahan data jawaban siswa. Pada file PAKET1.DAT gambar 2 merupakan data input dengan konten nomor soal dan jawaban siswa. Konten tersebut dikonstruk melalui aplikasi notepad dan peletakan nomer soal dan jawaban harus sesuai dengan definisi pada draft programming GRM pada Parscale.
Data pada file PAKET1.DAT selanjutnya ditulis pada skrip programming seperti pada gambar 1. Pada baris file, DFNAME ditulis PAKET1.DAT sebagai data input dan selanjutnya software PARSCALE akan menyimpan data tersebut dalam bentuk format .PAR dan .SCO.
Gambar 1. Draf Programming
Gambar 2. File Input dan Output PARSCALE
Pada baris input, NIDW merupakan banyak kolom untuk nomer item soal pada file input, NTOTAL merupakan banyak soal item test, NTEST artinya banyak tes yang dilakukan serta LENGTH merupakan banyak kolom jawaban siswa. (4A1, 10X, 10A1) merupakan skrip pada file input yang artinya 4 kolom pertama untuk nomor soal, 10 kolom berikutnya sebagai spasi dan 10 kolom berikutnya merupakan kolom jawaban siswa. NCAT = 5 memiliki makna bahwa skor siswa ada sebanyak 5 macam yaitu skor 1, 2, 3, 4, dan 5 sedangkan untuk Newton = 5 maksudnya adalah maksimum iterasi dari GAUSS-NEWTON yang digunakan dalam programming.
Hasil estimasi parameter item pada gambar 3 dideskripsikan bahwa item soal
memiliki daya beda dan tingkat kesukaran yang bervariasi. Nomor soal dapat dilihat pada kolom ITEM, estimasi parameter daya beda (𝛼) pada kolom SLOPE dan estimasi parameter tingkat kesukaran (𝛽) pada kolom LOCATION. Pada gambar tersebut juga dapat dilihat kolom GUESSING atau penebakan. Hasil estimasi parameter guessing untuk semua butir soal adalah 0 (nol), sejalan dengan hasil penelitian Manfaat (2018) yang menyatakan pada butir soal uraian tidak memungkinkan memuat parameter penebakan. Item yang memenuhi kriteria, yaitu parameter 𝛼 nilainya > 0,25 pada skala logit dan parameter 𝛽-global dan 𝛽 nilainya pada selang -3 sampai 3 skala logit.
Gambar 3. Estimasi Parameter Item
Analisis Luaran GRM
Luaran dari analisa GRM pada PARSCALE berupa plot estimasi kemampuan siswa pada setiap item soal yang merupakan grafik kemampuan siswa dibanding dengan peluang menjawab.
Setelah skrip berhasil disusun dengan benar maka akan dihasilkan data output berupa file PH0, PH1, PH2, dan PH3 serta plt untuk hasil plot. Gambar 4 merupakan hasil yang diperoleh dari analisa data pendekatan GRM dengan Parscale.
Gambar 4. Summary Statistic dari Jawaban Siswa
Pada analisa dengan pendekatan GRM ini, data input yang digunakan ialah 50 jawaban siswa. Pada kolom total menunjukkan bahwa semua siswa berpartisipasi dan pada kolom kategori merupakan kolom skor siswa yang menggambarkan banyak siswa yang menjawab dengan skor 1, 2, 3, 4, dan 5.
Sebagai contoh pada soal nomor 1 ada 10 siswa yang berhasil menjawab dengan skor
5 dengan perhitungan sebesar 20% dari jumlah peserta tes.
Kurva karakteristik hasil pengolahan data dari Graded Respons Model pada gambar 5 terdapat label 1, 2, 3, 4, dan 5 yang merupakan kurva dari masing-masing skor. Pada sumbu axis terdapat sumbu kemampuan siswa yang digambarkan dari rentang – 3 sampai 3 yang merupakan rentang kemampuan berpikir kritis.
Gambar 5. Kurva Karakteristik Item 1 dan 2
Sedangkan pada sumbu vertikal terdapat sumbu peluang. Berdasarkan dua sumbu tersebut dapat dideskripsikan bahwa pada kurva karakteristik item 1 diperlukan kemampuan yang semakin tinggi untuk mencapai skor 5 (kurva warna biru).
Semakin besar kemampuan siswa maka semakin tinggi peluang siswa itu menjawab dengan skor 5. Skor 5 mampu dicapai oleh siswa dengan kemampuan antara -1 sampai 3. Sedangkan skor 1, hanya membutuhkan kemampuan dari -3 hingga 1 saja. Skor 2 dicapai paling banyak oleh siswa dengan kemampuan – 0,5. Skor 3 (kurva warna merah muda) mampu dicapai maksimal
dengan peluang menjawab benar 0,6 oleh siswa dengan kemampuan sekitar 0,25.
Sedangkan untuk memperoleh skor 4 (kurva warna hijau), hanya mampu dijawab oleh siswa dengan kemampuan antara – 1 sampai 2,5 dengan peluang tertinggi 0,15.
Pada soal nomor 2, semakin rendah kemampuan siswa maka semakin besar peluang untuk memperoleh skor 1.
Kemampuan yang diperlukan ialah antara -3 sampai 3. Begitu juga untuk memperoleh skor 5, semakin besar kemampuan kritis yang dimiliki siswa, maka semakin besar peluang menjawab benar. Kemampuan siswa yang dapat memperoleh skor 5 adalah
0 0.2 0.4 0.6 0.8 1.0
-3 -2 -1 0 1 2 3
1
2 3
4 5
A bility
Probability
Item Characteristic Curve: 0001 Graded R esponse Model (Logistic Metric)
0 0.2 0.4 0.6 0.8 1.0
-3 -2 -1 0 1 2 3
1
2 3 4 5
A bility
Probability
Item Characteristic Curve: 0002 Graded R esponse Model (Logistic Metric)
kisaran dari kemampuan -1 hingga 3. Pada kemampuan 0,5 siswa mampu meraih skor 2, serta pada skor 3, dapat diraih dengan kemampuan 1,5. Selain itu diperlukan kemampuan 2 untuk mendapat skor 4.
Apabila dibandingkan dengan soal nomor 1, grafik pada soal nomor 2 ini lebih bergeser kekanan, yang menandakan bahwa soal nomor 2 lebih memerlukan kemampuan yang lebih tinggi dibanding soal nomor 1, atau dengan kata lain soal nomor 2 lebih sulit dari nomor 1.
Kurva informasi soal nomor 2 ditunukkan pada gambar 6 yang menggambarkan bahwa soal nomor 2 sudah berdistribusi normal. Kemampuan yang diperlukan antara -2 sampai 3. Pada baris
informasi terdapat skala 0 sampai 7 namun untuk perolehan maksimum pada soal nomer 2 ialah 1.
Kurva informasi total (TIC) ditunjukkan pada gambar 7 yaitu untuk kalibrasi dengan GRM menghasilkan tes cukup akurat untuk menaksir peserta dengan kemampuan -1,6 sampai 2. Tes memberikan informasi paling tinggi pada nilai theta sekitar 0,4. Dari kedua kurva dapat dijelaskan bahwa tes yang diadministrasikan akurat untuk mengukur peserta tes dengan kemampuan berpikir kritis rata-rata dan tinggi. Garis tanpa putus menunjukkan besarnya nilai informasi dan garis putus- putus menunjukkan besarnya kesalahan baku.
Gambar 6. Kurva Informasi Item 2
Gambar 7. Kurva Informasi Total Soal
Pada tabel 2 menjelaskan bahwa rentang tingkat kesulitan paket soal bergerak antara -0,607 sampai 1,337 yang artinya
paket soal dalam kategori baik. β1, β2, …, β5
merupakan penyesuaian parameter butir dalam GRM dapat dilakukan dengan cara
-3 -2 -1 0 1 2 3
0 1 2 3 4 5 6 7
S cale S cor e
Information
Item Information Curve: 0002
-3 -2 -1 0 1 2 3
0 5 10 15 20
S cale S cor e
Information
Test 1; Name: SCALE1
0 0.27 0.55 0.82 1.10 1.37
Standard Error
mengurangi parameter β dengan setiap parameter kategori. Pada item no. 0001 gambar 3.
β1 = β – Category Parameter 1 =0,058 – 0,957= -0,899 β 2 = β – Category Parameter 2 =0,058 – 0,428= -0,370, dst.
Estimasi parameter tingkat kesukaran butir menggambarkan angka semakin ke kanan semakin besar yang artinya diperlukan kemampuan yang semakin tinggi untuk mencapai kategori nilai yang semakin tinggi. Misal pada soal no. 1 untuk mencapai nilai 2 memerlukan
kemampuan -0.899 (rata-rata), untuk mencapai nilai 3 memerlukan kemampuan - 0.37 (rata-rata), untuk mencapai nilai 4 memerlukan kemampuan 0.632 (rata-rata) dan untuk mencapai nilai 5 memerlukan kemampuan 0.87 (rata-rata). Hal ini sejalan dengan pendapat Arikunto (2009: 207) yang menyatakan indeks kesukaran adalah bilangan yang menunjukkan sukar dan mudahnya suatu soal. Jika seluruh peserta menjawab salah suatu soal, maka soal tersebut sangat sukar. Artinya, semakin sukar soal, semakin tinggi kemampuan yang dibutuhkan.
Tabel 2. Daya Beda dan Tingkat Kesulitan Item Aspek Berpikir
Kritis
No. Soal/ Topik Daya Beda (𝜶)
Tingkat Kesulitan (𝜷)
Tahap Kesulitan
𝜷𝟏 𝜷𝟐 𝜷𝟑 𝜷𝟒
Analisis Interpretasi Evaluasi Regulasi diri Evaluasi Analisis Interpretasi Regulasi diri Inference Inference
1. Bilangan Bulat 1.618 0,058 -0.899 -0.37 0.632 0.87
2. Pecahan 1.090 1,244 0.287 0.816 1.818 2.056
3. Perbandingan 1.555 -0,316 -1.273 -0.744 0.258 0.496
4. Relasi dan fungsi 0.762 0,211 -0.746 -0.217 0.785 1.023 5. Ekspresi dan operasi 2.799 0,890 -0.067 0.462 1.464 1.702 6. Pertidaksamaan 1.573 -0,607 -1.564 -1.035 -0.033 0.205 7. Bentuk Geometris 0.451 0,201 -0.756 -0.227 0.775 1.013 8. Pengukuran Geometris 0.562 1,337 0.38 0.909 1.911 2.149
9. Peluang 0.815 0,241 -0.716 -0.187 0.815 1.053
10. Interpretasi data 0.646 0,454 -0.503 0.026 1.028 1.266 Keterangan:
𝛼 : nilai estimasi parameter daya beda 𝛽 : nilai estimasi parameter tingkat kesukaran
𝛽1 : nilai estimasi parameter tingkat kesukaran untuk mencapai nilai 2 𝛽2 : nilai estimasi parameter tingkat kesukaran untuk mencapai nilai 3 𝛽3 : nilai estimasi parameter tingkat kesukaran untuk mencapai nilai 4 𝛽4 : nilai estimasi parameter tingkat kesukaran untuk mencapai nilai 5
Soal paling sulit berada pada soal dengan aspek kritis regulasi diri dan konten pengukuran geometris. Sejalan dengan hasil penelitian Nursyam (2012) tentang pemahaman Geometri siswa SMP di Kota Ternate menyimpulkan 49,48% siswa memperoleh kualifikasi gagal, 43,29% siswa memperoleh kualifikasi kurang, dan 7,44%
siswa memperoleh kualifikasi cukup. Selain itu, Soleha (2019) dalam penelitiannya menyimpulkan siswa kesulitan dalam melakukan prosedur matematik yang benar karena tidak melakukan pemeriksaan kembali (regulasi diri) pada jawaban yang ditulis. Dapat disimpulkan bahwa kemampuan geometri siswa SMP masih
rendah dan masih banyak siswa yang tidak melakukan pengecekan kembali terhadap solusi matematika yang telah didapat.
Sedangkan item soal paling mudah berada pada soal dengan aspek kritis analisis pada topik pertidaksamaan.
Dalam aspek berpikir kritis pada soal tes tidak nampak adanya pola bahwa aspek analisis lebih mudah daripada aspek interpretasi dan begitu juga untuk aspek evaluasi, inference dan regulasi diri. Hal ini dimungkinkan karena topik dari soal yang berbeda. Peneliti menduga ada kemungkinan akan terlihat pola tingkat kesulitan dari masing-masing aspek berpikir kritis apabila soal yang dikembangkan merupakan satu topik, misal paket soal bilangan, aljabar atau geometri saja dengan mempertimbangkan setiap soal memiliki masing-masing satu aspek berpikir kritis. Berbeda halnya dengan tingkatan Taksonomi Bloom ranah kognitif yang telah direvisi Krathwohl dan Anderson (2001: 66-88) yakni remember, understand, apply, analyze, evaluate, dan create. Pada tingkatan Taksonomi Bloom ini, berlaku pelevelan dimana level terendah ialah remember dan level tertinggi ialah create.
KESIMPULAN DAN SARAN
Hasil analisis 10 soal uraian matematika berpikir kritis menggunakan pendekatan teori modern Grade Response Model diperoleh suatu kesimpulan bahwa hasil estimasi parameter guessing untuk semua butir soal adalah 0 (nol). Item soal memenuhi kriteria parameter daya beda 𝛼 >
0,25 pada skala logit dengan kriteria baik dan parameter indeks kesukaran 𝛽-global pada selang -3 sampai 3 skala logit dengan kriteria soal sedang dan sukar. Kriteria sukar
berada pada soal dengan aspek kritis interpretasi topik pecahan dan regulasi diri topik pengukuran geometris. Total Information Curve (TIC) untuk kalibrasi dengan GRM menghasilkan tes cukup akurat untuk menaksir peserta dengan kemampuan -1,6 sampai 2 (rata-rata dan tinggi). Dalam aspek berpikir kritis pada soal tes tidak nampak adanya pola bahwa aspek analisis lebih mudah daripada aspek interpretasi dan begitu juga untuk aspek evaluasi, inference dan regulasi diri. Hal ini dimungkinkan karena topik dari soal yang di analisis berbeda-beda. Ada kemungkinan akan terlihat pola tingkat kesulitan dari masing- masing aspek apabila soal yang dikembangkan merupakan satu topik, misal paket soal bilangan, aljabar atau geometri.
Dalam penggunaan aplikasi Parscale sangat memerlukan ketelitian dank e akuratan list program, sehingga saat ini sangat diperlukan pengembangan aplikasi analisis data berbasis web yang mudah digunakan. Selain itu diperlukan penelitian lanjutan mengenai analisis soal konten tertentu untuk melihat apakah aspek berpikir kritis memiliki tingkatan.
DAFTAR RUJUKAN
Anderson, L.W., dan Krathwohl, D.R.,2001. A Taxonomy for Learning. Teaching, and Assesing: A Revision of Bloom’s Taxonomy of Educational Objectives. New York:
Addison Wesley Longman, Inc.
Bond, T. G., & Fox, C. M. (2007). Applying the rasch model: fundamental measurement in the human sciences.(2nd Ed.). Mahwah:
Lawrence Erlbaum Associates, Publishers.
Brennan, R.L & Kolen. (2004). Test Equating, Scaling, and Linking. New York: Springer.
Daryanto, Evaluasi Pendidikan. Rineka Cipta, Jakarta, 2008, hal 179
DeMars, C.E. (2010). Item response theory.
New York: Oxford University Press, Inc Facione, P. A.(2013). Critical Thinking: What It
Is and Why It Counts.California: Measured Reasons and The California Academic Press.
Isgiyanto, Awal. (2011). Diagnosis Kesalahan Siswa Berbasis Penskoran Politomus Model Partial Credit Pada Matematika.
Jurnal Penelitian dan Evaluasi Pendidikan Tahun 15, Nomor 2
Made Tirta, I. (2015). PENGEMBANGAN ANALISIS RESPON ITEM INTERAKTIF ONLINE MENGGUNAKAN R UNTUK RESPON.
Manfaat, B., & Anasha, Z. Z. (2013). SISWA DENGAN MENGGUNAKAN GRADED RESPONSE MODELS ( GRM ).
(November), 978–979.
Mujahid, Nurhakimah (2018) Analisis
Kemampuan Berpikir Kritis Matematika Siswa SMA Negeri 5 Wajo. Diploma thesis, UNIVERSITAS NEGERI MAKASSAR.
OECD. (2018). Indonesia What 15-year-old students in Indonesia know and can do Figure 1 . Snapshot of performance in reading , mathematics and science. 1–10.
Pratiwi, I. (2019). EFEK PROGRAM PISA TERHADAP KURIKULUM DI INDONESIA. 4, 51–71.
Retnawati, Heri. (2014). Teori Respons Butir dan Penerapannya. Untuk Peneliti, Praktisi Pengukuran dan Pengujian, Mahasiswa Pascasarjana. Yogyakarta: Parama Publishing
Setyowati, Desi (2019) ANALISIS TINGKAT KEMAMPUAN BERPIKIR KRITIS SISWA DALAM MENYELESAIKAN MASALAH MATEMATIKA
MENGGUNAKAN GRADED RESPONSE MODEL (GRM).
Undergraduate (S1) thesis, University of Muhammadiyah Malang.
Shodiq, L. J. (2015). Analisis Soal Buku Siswa Matematika Kelas 7 Kurikulum 2013 Menggunakan TIMSS 2015 Mathematics Frameworks. 1073–1078.
Shodiq, L. J. (2016). PENGEMBANGAN PAKET SOAL BERDASARKAN TIMSS 2015 MATHEMATICS FRAMEWORK UNTUK MENGUKUR KEMAMPUAN BERPIKIR KRITIS SISWA SMP KELAS VIII.
Sumarna Surapranata, Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes. PT.
Remaja Rosdakarya, Bandung, 2009, hal 1 Tohir, M. (2019). Hasil PISA Indonesia Tahun
2018 Turun Dibanding Tahun 2015. 2018–
2019.
Wahidmurni, dkk, Evaluasi Pembelajaran:
Kompetensi dan Praktik, (Yogyakarta:
Nuha Litera, 2010), hlm. 117.
Zubaidah, S. (2016). KETERAMPILAN ABAD KE-21 : KETERAMPILAN YANG DIAJARKAN. (2), 1–17.
Zulva Munayati, Zulkardi, Budi
Santoso.2015.Kajian Soal Buku Teks Kelas X Kurikulum 2013 Mengunakan
Frameworks PISA.ejournal Universitas Sriwijaya.