HASIL PENELITIAN DAN PEMBAHASAN

Batas Sangat Layak Skor

Produk akhir penelitian peng embangan komik IPA berbasis karakter dengan

tema “Sengsara Membawa Nikmat” dengan materi bahaya zat aditif dan psikotropika terhadap pernapasan dan kesehatan manusia untuk meningkatkan motivasi peserta didik kelas VIII SMP. Kualitas produk komik IPA didasarkan pada penilaian 2 orang ahli, 2 orang pendidik, dan 2 orang teman sejawat sebagai peer reviewer. Penilaian dilakukan dengan mengisi instrumen berupa check list yang berisi kriteria kualitas komik dari aspek media dan materi yang dijabarkan menjadi 7 kriteria. Hasil pengisian instrumen tersebut diperoleh data kuantitatif berupa skor nilai untuk kemudian dianalisis dan dikonversi menjadi tingkat kualitas produk dengan mengacu pada kriteria kategori penialian ideal untuk menentukan kualitas komik. Skor akhir yang diperoleh dari gabungan aspek media dan materi adalah 189. Skor tersebut dinyatakan dengan persentase keidealan sebesar 96,86%, dengan kategori kelayakan sangat baik (SB). Selain penilaian kelayakan komik juga dilakukan penilaian tentang motivasi dan karakter peserta didik sebelum dan sesudah dilakukan penelitian menggunakan media pembelajaran komik IPA.

142 angket dan lembar observasi. Penilaian dalam bentuk angket menggunakan skala 4 yakni selalu, sering, jarang, dan tidak pernah. Perhitungan menggunakan Gain diperoleh rata-rata Gain untuk motivasi belajar adalah sebesar 0,48 sedangkan untuk karakter sebesar 0,54.

Berdasarkan hasil tersebut dapat disimpulkan bahwa terjadi peningkatan karakter dan motivasi dengan kategori sedang. Hal ini dikarenakan keadaan motivasi belajar dan karakter peserta didik sudah dalam kategori cukup baik. Sedangkan hasil setelah penggunaan komik IPA berbasis karakter memberikan dampak kenaikan menjadi baik untuk variabel motivasi belajar dan sangat baik untuk variabel karakter peserta didik. Jadi dapat disimpulkan bahwa kenaikan yang terjadi tidak terlalu tinggi atau bisa dikatakan sedang.

Hasil uji normalitas motivasi m e n unjukkan P-value uji normalitas untuk data motivasi belajar sebelum dan sesudah penggunaan komik IPA lebih besar dari α (0,05) yaitu 0,200 dan 0,121 maka kesimpulan statistika yang diambil adalah H0 diterima, artinya dapat dikatakan bahwa kedua data berasal dari populasi yang menyebar normal. Dengan demikian, uji- t berpasangan dapat diterapkan untuk variabel motivasi belajar peserta didik.

Hasil uji normalitas karakter peserta menunjukkan p-value uji normalitas untuk data karakter sebelum dan sesudah penggunaan komik IPA lebih besar dari 0,05 yaitu 0,200 dan 0,200 maka kesimpulan statistika yang diambil adalah H0 diterima, artinya dapat dikatakan bahwa kedua data berasal dari populasi yang menyebar normal. Dengan demikian, uji-t berpasangan dapat diterapkan untuk variabel karakter peserta didik. Berdasarkan hal tersebut maka data bisa dilanjutkan ke uji t atau uji parametrik lainnya karena data yang dihasilkan terdistribusi normal.

Analisis data menggunakan uji-t berpasangan (paired t-test) menunjukkan p-value dari uji-t berpasangan di atas adalah 0,000, yaitu lebih kecil dari 0,05 baik untuk karakter maupun motivasi belajar. Dengan demikian, kesimpulan statistika yang kita ambil adalah H0 ditolak. Hal ini berarti bahwa:

1. selisih karakter sebelum dan sesudah pembelajaran menggunakan komik IPA berbasis motivasi belajar peserta didik adalah tidak sama dengan nol. Atau dengan kata lain terjadi perubahan motivasi belajar dari peserta didik yang signifikan antara sebelum dan sesudah penggunaan komik IPA.

2. selisih karakter sebelum dan sesudah pembelajaran menggunakan komik IPA berbasis karakter peserta didik adalah tidak sama dengan nol. Atau dengan kata

143 Dengan demikian komik IPA yang dikembangkan terbukti efektif meningkatkan motivasi belajar dan karakter peserta didik pada tingkat kepercayaan sebesar 95%.

Penilaian motivasi dan karakter peserta didik yang dilakukan dengan lembar observasi menghasilkan data dikotomis. Lembar observasi dibuat bentuk check list ya dan tidak dengan skor 1 atau 0. Hasilnya menunjukkan adanya kenaikan skor. Dengan demikian dapat disimpulkan bahwa terjadi perubahan berupa peningkatan motivasi dan karakter peserta didik pada setiap pembelajaran IPA dengan menggunakan media komik.

Hasil penilaian observasi mendukung data pada penilaian angket peserta didik tentang motivasi belajar dan karakter. Pada hasil uji-t berdasarkan data angket disimpulkan bahwa terjadi perubahan motivasi belajar dan perubahan karakter yang signifikan. Hasil uji-t tersebut didukung oleh hasil perhitungan dengan Gain dan persentase penilaian observasi motivasi belajar dan karakter pada setiap pertemuan selama penelitian yang menunjukkan kenaikan.

SIMPULAN

Hasil yang diperoleh sebagai temuan di lapangan berdasarkan uji coba lapangan dari penelitian anak payung kedua adalah sebagai berikut.

1. Media pembelajaran komik IPA yang dibutuhkan oleh sekolah mempunyai karakteristik yaitu berbasis pendidikan karakter dan berisi materi IPA yang merupakan perpaduan dari beberapa standar kompetensi dan kompetensi dasar. 2. Kelayakan media komik IPA yang telah dikembangkan berdasarkan

penilaian ahli media, ahli materi, pendidik, dan teman sejawat adalah “sangat baik”_.

3. Berdasarkan uji coba lapangan menunjukkan ada peningkatan motivasi belajar dan karakter pada peserta didik sebelum dan sesudah menggunakan media komik IPA. Berdasarkan hasil tersebut maka dapat disimpulkan bahwa media komik IPA yang dikembangkan layak untuk digunakan sebagai media pembelajaran IPA.

144 DAFTAR PUSTAKA

Alessi, S.M.& Trollip, S.R. (2004). Multimedia for learning: methods and development (3thed.). Massachutes: Ally & Bacon A Pearson Education Company.

Anonim b. (2011). Komik pendidikan (online), tersedia dalam http://romisatriowahono.net/2006/10/29/komik-pendidikan.Diambil pada 13 Desember 2011.

Baharudin & Nur Wahyuni. (2010). Teori belajar dan pembelajaran. Jakarta: ARRuzzmedia.

Bambang Warsita. (2008). Teknologi pembelajaran; Landasan & Aplikasinya. Jakarta: Rineka Cipta.

Doni Koesoma, A. (2010). Pendidikan karakter. Strategi mendidik anak di zaman global. Jakarta: Gramedia.

Indiria Maharsi. (2011). Komik dunia kreatif tanpa batas. Yogyakarta: Kata Buku.

Nurul Zuriah. (2008). Pendidikan moral & budi pekerti dalam perspektif perubahan. Jakarta: Bumi Aksara.

Suprayekti. (2008). Penerapan model pembelajaran interaktif pada mata pelajaran IPA di SD. Jurnal Teknodik Nomor 1, Volume XII.

Trianto. (2010). Model pembelajaran terpadu, konsep, strategi, dan implementasinya dalam Kurikulum Tingkat Satuan Pendidikan (KTSP). Jakarta: PT Bumi Aksara.

145 Dadan Rosana, Sukardiyono

Universitas Negeri Yogyakarta email: [email protected]

Abstrak

Kebijakan pemerintah yang menyerahkan sepenuhnya kelulusan siswa berdasarkan hasil ujian yang dilaksanakan pada sekolah masing-masing, membawa implikasi pada sistem penerimaan mahasiswa baru di Perguruan Tinggi Negeri (PTN). Sistem ujian SNMPTN yang menggunakan portofolio nilai raport sekolah dan piagam prestasi dianggap kurang adil karena penerapan standar soal yang berbeda untuk setiap sekolah di Indonesia. Perbedaan ini terlihat dari adanya variasi tingkat kesukaran soal yang tidak pernah disetarakan antara satu sekolah dengan sekolah lainnya. Variasi kualitas soal ini semakin mencolok ketika berbeda daerah dan wilayah, misalnya di Indonesia Barat dan Indonesia Timur, sekolah di wilayah perkotaan dan sekolah diwilayah pedesaan apalagi pedalaman, sekolah swasta dan negeri, sekolah unggulan dan sekolah tertinggal. Karena dalam kurikulum telah disertai silabus dan indikator pencapaian Standar Kompetensi / Kompetensi inti (SK/KI), Kompetensi Dasar (KD) dan Standar Kompetensi Lulusan (SKL), maka seharusnya ada standar kulitas soal tertentu yang harus diberikan pada siswa untuk mengukur pencapaian kompetensinya. Seharusnya kualitas terutama tingkat kesukaran soal yang digunakan di sekolah tersebut sama atau setara. Penyetaraan skor adalah suatu prosedur empiris yang diperlukan untuk mentransformasi skor suatu perangkat tes ke skor perangkat tes yang lain. Karena merupakan prosedur empiris maka penyetaraan skor didasarkan pada data skor tes (Weiss, 1983). Paket-paket soal yang digunakan secara empiris disetarakan skornya dengan menggunakan metode Test Score Equating, yang input datanya adalah dari hasil analisis butir soal menggunakan program Quest.

Metode yang digunakan dalam penelitian terdiri dari penyiapan proses penyetaraan vertikal memakai common-item nonequivalent groups design, penentuan koefisien penyetaraan dengan Program STUIRT, dan dalam penyetaraan kualitas tes digunakan Program WinGen2. Keakuratan metode penyetaraan diukur dengan (a) Root Mean Square Difference (RMSD) antara parameter hasil estimasi dan parameter hasil bangkitan; dan (b) Root Mean Square Error (RMSE) antara parameter butir hasil estimasi dan parameter sejatinya.

Kata kunci: Standarisasi Kualitas Tes, Equating, Seleksi Masuk PTN PENDAHULUAN

Salah satu pola penerimaan mahasiswa baru program sarjana pada perguruan tinggi dilakukan melalui Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN). SNMPTN dilakukan oleh masing-masing PTN menggunakan sistem nasional terpadu berdasarkan hasil penelusuran prestasi sekolah dan prestasi akademik siswa baik dalam bentuk rapor maupun portofolio akademik yang lain. Penerimaan mahasiswa baru harus memenuhi prinsip adil, akuntabel, transparan, dan tidak diskriminatif dengan tidak membedakan jenis kelamin, agama, suku, ras, kedudukan sosial, dan tingkat kemampuan ekonomi calon mahasiswa serta tetap memperhatikan potensi calon mahasiswa dan kekhususan perguruan tinggi. Perguruan tinggi sebagai penyelenggara pendidikan

146 setelah pendidikan menengah menerima calon mahasiswa yang berprestasi akademik tinggi dan diprediksi akan berhasil menyelesaikan studi di perguruan tinggi berdasarkan prestasi akademik. Siswa yang berprestasi tinggi dan secara konsisten menunjukkan prestasinya tersebut layak mendapatkan kesempatan untuk menjadi calon mahasiswa melalui SNMPTN.

Dalam kerangka integrasi pendidikan menengah dengan pendidikan tinggi, sekolah diberi peran dalam proses seleksi SNMPTN dengan asumsi bahwa sekolah sebagai satuan pendidikan dan guru sebagai pendidik selalu menjunjung tinggi kehormatan dan kejujuran sebagai bagian dari prinsip pendidikan berkarakter. Dengan demikian, sekolah berkewajiban mengisi Pangkalan Data Sekolah dan Siswa (PDSS) dengan lengkap dan benar, serta mendorong dan mendukung siswa dalam proses pendaftaran.

Namu demikian, pada kenyataannya sistem ujian SNMPTN yang menggunakan portofolio nilai raport sekolah dan piagam prestasi dianggap kurang adil karena penerapan standar soal yang berbeda untuk setiap sekolah di Indonesia. Perbedaan ini terlihat dari adanya variasi tingkat kesukaran soal yang tidak pernah disetarakan antara satu sekolah dengan sekolah lainnya. Variasi kualitas soal ini semakin mencolok ketika berbeda daerah dan wilayah, misalnya di Indonesia Barat dan Indonesia Timur, sekolah di wilayah perkotaan dan sekolah diwilayah pedesaan apalagi pedalaman, sekolah swasta dan negeri, sekolah unggulan dan sekolah tertinggal. Karena dalam kurikulum telah disertai silabus dan indikator pencapaian Standar Kompetensi / Kompetensi inti (SK/KI), Kompetensi Dasar (KD) dan Standar Kompetensi Lulusan (SKL), maka seharusnya ada standar kulitas soal tertentu yang harus diberikan pada siswa untuk mengukur pencapaian kompetensinya. Seharusnya kualitas terutama tingkat kesukaran soal yang digunakan di sekolah tersebut sama atau setara. Penyetaraan skor adalah suatu prosedur empiris yang diperlukan untuk mentransformasi skor suatu perangkat tes ke skor perangkat tes yang lain. Karena merupakan prosedur empiris maka penyetaraan skor didasarkan pada data skor tes (Weiss, 1983). Paket-paket soal yang digunakan secara empiris disetarakan skornya dengan menggunakan metode Test Score Equating, yang input datanya adalah dari hasil analisis butir soal menggunakan program Quest.

METODE

147 Pada kebanyakan program tes dalam skala besar, penyusunan tes-tes yang setara merupakan kegiatan yang sangat penting. Hal ini harus dilakukan untuk penanganan yang cepat apabila terjadi kebocoran tes dan untuk membandingkan hasil tes peserta yang menggunakan tes-tes yang berbeda tersebut. Kegiatan ini dapat dilakukan dengan menggunakan teori responsi butir (item response theory). Ada tiga asumsi yang harus dipenuhi dalam teori responsi butir, yaitu: 1) unidimensi, 2) independensi lokal, dan 3) invariansi. Langkah-langkah melakukan kegiatan penyetaraan tes berdasarkan teori responsi butir, yaitu: 1) mengestimasi parameter, 2) mengestimasi skala teori responsi butir dengan transformasi linear, dan 3) menyamakan sekor. Sedangkan rancangan penyetaraan tes yang digunakan menurut teori responsi butir ada tiga, yaitu: 1) rancangan kelompok tunggal, 2) rancangan kelompok equivalen, dan 3) rancangan tes jangkar. Metode-metode yang saat ini dikembangkan untuk melakukan penyetaraan tes menurut teori responsi butir adalah: 1) metode regresi, 2) metode rerata dan sigma (mean and sigma method), 3) metode tegar rerata dan sigma (robust mean and sigma method), dan 4) metode kurva karakteristik.

Menurut Hambleton, Swaminathan, & Roger (1991), pada teori tes klasik dikenal dua metode, yaitu penyetaraan linear (linear equating) dan pe-nyetaraan ekuipersentil (equipercentile equating). Penyetaraan linear akan menghubungkan skor konversi dengan skor asalnya melalui suatu fungsi linear. Prinsip dasar metode ini adalah distribusi skor pada dua perangkat tes sama dalam hal rerata dan simpangan baku. Angoff (1971) menyatakan bahwa definisi untuk penyetaraan linear adalah skor dua perangkat tes menjadi ekuivalen jika ada hubungan yang setara dengan standar skor deviasinya. Penyetaraan skor yang menggunakan metode linear memungkinkan adanya tingkat kesulitan relatif bervariasi pada skor di antara beberapa perangkat tes tersebut. Pada penyetaraan linear diperlukan kesamaan distribusi probabilitas antara skor X dan skor Y. Jika skor X dan skor Y memilki rerata dan simpangan baku yang berbeda, maka distribusi probabilitas yang sama dari kedua skor tersebut dapat digunakan untuk mentransformasi nilai dari satu distribusi probabilitas ke distribusi probabilitas berikutnya.

HASIL DAN PEMBAHASAN

Penilaian hasil belajar oleh pendidik dilakukan secara berkesinambungan untuk memantau proses, kemajuan, dan perbaikan hasil dalam bentuk ulangan harian, ujian tengah semester, ujian akhir semester, dan ujian kenaikan kelas. Penilaian hasil belajar oleh pendidik digunakan untuk menilai pencapaian kompetensi peserta didik; bahan

148 penyusunan laporan hasil belajar; dan memperbaiki proses pembelajaran. Penilaian hasil belajar oleh satuan pendidikan bertujuan menilai pencapaian standar kompetensi lulusan untuk semua mata pelajaran. Penilaian hasil belajar oleh pemerintah dalam bentuk ujian nasional bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan dan teknologi. Ujian nasional dilakukan secara objektif, berkeadilan, dan akuntabel.

Permasalahan yang kemudian muncul berkaitan dengan hal ini adalah belum adanya kesetaraan kualitas assessment yang digunakan untuk penilaian di sekolah (semester 3 (tiga) sampai dengan 5 (lima) untuk tingkat SLTP/SLTA/SMK), sehingga belum dapat menjamin rasa keadilan karena perbedaan kualitas tes yang diberikan. Hal ini sangat mendesak untuk dicarikan solusinya, karena nilai sekolah digunakan juga dalam sistem penerimaan mahasiswa baru (SNMPTN) jalur undangan. Karena itulah diperlukan penyataraan kualitas tes agar terstandar dan memenuhi rasa keadilan. Salah satu cara yang dapat dilakukan adalah dengan mengintegrasikan teori respon butir pada system penilaian sekolah melalui equating.

Guru dapat mengembangkan tes sendiri untuk digunakan di kelasnya sendiri (teacher- made test) atau guru dapat menggunakan tes standar (standardized test). Tes terstandarisasi dikembangkan dengan upaya untuk sejauh mungkin mengikuti prosedur dan memenuhi persyaratan secara ketat. Tes standar adalah tes yang berdasarkan kepada standar-standar yang telah ditentukan : standar teknis dan parktis, serta telah diuji kelayakannya oleh para ahli. Sementara tes buatan guru hanya berlaku untuk menilai dan membandingkan siswa di kelasnya sendiri sementara tes standar dapat digunakan untuk menilai dan membandingkan kemamuan siswa lintas kelas dan lintas sekolah. Dalam pengembangan tes terstandarisasi, ciri-ciri pokok dan persyaratan tes yang baik dikaji secara sadar dan terencana dan diusahakan pemenuhannya. Semua itu dilakukan untk memperoleh tes yang baik mutunya, sesuai dengan tujuan penuyusunan memiliki tingkat reliabilitas yang tinggi dan dapat digunakan secara praktis. Tes terstandar biasanya dilengkapi dengan sebuah pedoman yang berisi keterangan-keterangan, petunjuk- petunjuk yang menjelaskan tentang pelaksanaan.

Karena perangkat tes berbeda antar sekolah, maka diperlukan pengadministrasian lebih dari satu perangkat tes, perbedaan nilai antar peserta tes yang mendapat tes berbeda tidak dapat langsung disimpulkan adanya perbedaan kemampuan antarmereka, karena tingkat kesukaran perangkat yang digunakan akan mempengaruhi perbedaan tersebut. Untuk menanggulangi masalah tersebut, para ahli educational measurement mengembangkan metode statistik yang disebut equating (penyetaraan). Metode ini adalah metode ilmiah yang digunakan untuk menyetarakan nilai dari skor mentah satu

149 menggunakan beberapa perangkat tes yang berbeda dan mengukur hal yang sama, perlu dilakukan penyetaraan dari perangkat-perangkat tes yang digunakan tersebut, karena dengan penyetaraan tersebut dapat dijamin keadilan bagi peserta tes.

Aplikasi teori responsi butir dalam kegiatan penyetaraan tes harus memenuhi dua asumsi dasar yaitu unidimensi dan independensi lokal (Kollen dan Brennan, 2004). Sedangkan langkah-langkah melakukan kegiatan penyetaraan tes menurut teori responsi butir adalah: 1) melakukan estimasi parameter butir dan parameter kemampuan; 2) mengestimasi skala teori responsi butir dengan menggunakan transformasi linear; dan 3) menyamakan sekor, jika menggunakan sekor jawaban yang benar maka dilakukan konversi ke skala jawaban benar dan kemudian ke skala sekor. Oleh karena kegiatan penyetaraan tes memiliki prosedur yang empiris, maka kegiatan ini memerlukan rancangan tertentu yang harus diperhatikan.

Penyetaraan dilakukan dengan cara mengkonversikan satu paket ke paket yang lain, dari paket yang mengukur kemampuan yang sama. Penyetaraan perangkat tes merupakan pembuatan sejumlah keputusan dari sekor yang diperoleh dari sebuah paket untuk disesuaikan ke bentuk yang berbeda tingkat kesukarannya. Jika ada paket X lebih sukar dari paket Y, maka penyetaraan paket X ke Y menghasilkan nilai paket X lebih tinggi atau berharga jika disetarakan ke paket Y (Crocker dan Algina, 1986). Ada tiga dasar dalam merancang data untuk diambil atau dianalisis dalam melakukan penyetaraan tes (Kolen & Brennan, 2004), yaitu: 1) desain data yang dikumpulkan dari dua kelompok yang dites pada paket berbeda dengan kisi-kisi sama, dimana pembagian kedua paket tersebut secara acak atau random; 2) untuk proses penyetaraan, salah satu kelompok tes diberikan paket A setelah itu dites kembali dengan paket B, dan satu kelompok lagi diberikan dulu paket B kemudian mengerjakan kembali paket A; dan 3) perbedaan instrumen tes yang diberikan kepada peserta ujian yang berbeda pula. Namun dalam kedua paket tersebut terdapat tes jangkar (anchor test) yang diberikan kepada seluruh peserta tes. Tes jangkar itulah yang dijadikan patokan untuk melakukan penyetaraan. Peserta tes dalam hal ini tidak perlu dibagi secara acak atau random walaupun pembagian dengan random juga tidak akan mempengaruhi model ini.

Proses penyetaraan dari beberapa perangkat tes (equating) dapat dilakukan dengan dua cara, yaitu penyetaraan secara horizontal dan penyetaraan secara vertikal. Proses penyetaraan yang diperoleh dari dua perangkat tes yang berbeda tetapi mengukur hal yang sama dinamakan penyetaraan horizontal. Adapun proses penyetaraan dari dua kelompok peserta tes yang berbeda dalam jenjang/tingkat pendidikannya, namun diberi

150 perangkat soal yang sama dinamakan penyetaraan vertikal (Crocker & Algina, 1986). Pada dasarnya penyetaraan (equating) bertujuan untuk menyetarakan sekor dengan cara membandingkan sekor yang diperoleh dari mengerjakan perangkat tes yang satu dengan sekor yang diperoleh dari mengerjakan perangkat tes lainnya yang dilakukan melalui proses penyetaraan sekor pada kedua perangkat tes tersebut (Hambleton & Swaminthan, 1991). Menurut Zhu (1998), sekor-sekor pada tes A dan tes B dapat disetarakan jika memenuhi empat syarat, yaitu: 1) mengukur kemampuan atau karakteristik yang sama. Sehingga tes-tes yang disusun dari kisi-kisi yang berbeda tidak dapat disetarakan; 2) setelah penyetaraan, distribusi frekuensi sekor pada tes A harus sama seperti distribusi frekuensi sekor pada tes B, sehingga sekor pada tes A dan tes B dapat saling dipertukarkan setelah penyetaraan; 3) penyetaraan tes harus bebas dari data atau pekerjaan peserta tes dalam proses penyetaraan, dan konversi yang berasal dari penyetaraan harus berlaku bagi semua situasi yang serupa; dan 4) transformasinya harus sama tanpa memperhatikan tes mana yang digunakan sebagai dasar atau referensi konversi, artinya interpretasi sekor harus sama baik penyetaraan dari tes A ke tes B atau dari tes B ke tes A.

Lord (1980) mengemukakan gagasan atau ide penyetaraan dalam beberapa implikasi, yaitu: 1) pengukuran tes dengan sifat yang berbeda tidak dapat disetarakan; 2) sekor mentah pada tes yang konsisten tidak sama, tidak dapat dilakukan proses penyetaraan; 3) sekor mentah pada tes dengan kesukaran yang bervariasi tidak dapat disetarakan karena tes tidak akan konsisten sama pada tingkat kesukaran yang sama; 4) kekeliruan atau kesalahan sekor pada tes atau paket A dan B tidak dapat disetarakan kecuali jika kedua tes tersebut benar-benar paralel; dan 5) tes yang sempurna reliabilitasnya dapat dilakukan penyetaraan.

Metode penyetaraan tes yang pertama adalah metode regresi. Penentuan konstanta konversi a dan b menggunakan metode regresi dilakukan dengan memperhatikan respons peserta tes pada kedua perangkat tes X dan Y. Estimasi parameter butir dan parameter kemampuan peserta memenuhi persamaan regresi linier sebagai berikut:

y = ax + b + e (1)

dengan a = rxy Sy/Sx dan b = ŷ – ax Keterangan:

y : estimasi kemampuan atau estimasi parameter butir pada perangkat tes Y x : estimasi kemampuan atau estimasi parameter butir pada perangkat tes X rxy : koefisien korelasi antara X dan Y

151 Penggunaan metode ini bersifat tidak timbal balik (asimetris) sehingga kurang memadai untuk penentuan konstanta konversi apalagi mengingat bahwa penyetaraan dua perangkat tes atau lebih sangat memerlukan syarat invariansi dan timbal balik dari perangkat tes yang disetarakan.

Metode penyetaraan tes yang kedua adalah metode rerata sigma. Pada metode ini,

penentuan konstanta konversi α dan β menurut metode rerata dan sigma dilakukan

dengan memperhatikan nilai estimasi parameter tingkat kesukaran butir tes pada kedua perangkat tes yaitu bx dan by. Menurut Hambleton & Swaminathan (1985: 26), hubungan antara estimasi parameter butir tes atau parameter kemampuan peserta pada kedua

Dalam dokumen Staff Site Universitas Negeri Yogyakarta (Halaman 151-171)