• Tidak ada hasil yang ditemukan

KEAKURATAN HASIL ANALISIS BUTIR BERDASARKAN TEORI TES KLASIK DITINJAU DARI UKURAN SAMPEL

Khotimah Marjiastuti1, Sri Wahyuni2, Nuril Huda3

1Penelitian dan Evaluasi Pendidikan, Universitas Negeri Yogyakarta, Yogyakarta 2Penelitian dan Evaluasi Pendidikan, Universitas Negeri Yogyakarta, Yogyakarta, Indonesia 3Penelitian dan Evaluasi Pendidikan, Universitas Negeri Yogyakarta, Yogyakarta, Indonesia

khotimahmarjiastuti@ymail.com1

ABSTRAK

Penelitian ini bertujuan untuk: (1) mendeskripsikan hasil analisis butir ditinjau dari ukuran sampel, dan (2) mengestimasi kesalahan pengukuran (SEM) berdasarkan Teori Tes Klasik ditinjau dari ukuran sampel.

Sumber data yang digunakan adalah lembar jawab siswa pada Soal Uji Coba Ujian Nasional SMA mata pelajaran Ekonomi tahun 2015 di Kabupaten Banjarnegara. Ukuran sampel yang digunakan dalam penelitian ini adalah 100, 200, dan 400 lembar jawab. Teknik analisis data yang digunakan adalah analisis parameter butir soal dan estimasi kesalahan pengukuran berdasarkan Teori Tes Klasik ditinjau dari ukuran sampel. Metode estimasi kesalahan pengukuran yang digunakan adalah Metode Compound Binomial.

Simpulan yang diperoleh dalam penelitian ini: (1) berdasarkan Teori Tes Klasik, analisis butri soal akan lebih akurat jika menggunakan ukuran sampel 400 dengan jumlah butir yang baik sebanyak 13 (32,5%), dan (2) hasil estimasi SEM yang paling kecil diperoleh jika menggunakan ukuran sampel 200 sebesar 1,036.

Kata kunci: analisis butir, teori tes klasik, ukuran sampel

ABSTRACT

This research aims to: (1) describe the items analysis reviewed by sample size; and (2) estimate the stabdar error measurement (SEM) based on Classical Test Theory reviewed by sample size.

The data source was based on studentsโ€™ responses of Economics National Examination Trial

of Senior High School in the academic year of 2015 in Kabupaten Banjarnegara. Sampel size

was used in this research are 100, 200, and 400 studentsโ€™ responses. The data analysis

technique was used in this research are item parameter analysis and estimation of standard error measurement based on Classical Test Thepry reviewed by sample size. the estimation method of standarad error measuremen was done by Compound Binomial Method.

The results of this research based on Classical Test Theory are: (1) the item analysis was be

accurate when using sample size 400 studentsโ€™ responses, there are 13 (32.5%) good items; and (2) the estimation of SEM was be smallest when using sample size 200 students responses, 1.036.

Keywords : item analysis, classical test theory, sample size

1. PENDAHULUAN

Ada dua jenis instrumen yang biasanya digunakan dalam dunia pendidikan, yaitu instrumen tes dan nontes. Penggunaan instrumen tersebut disesuaikan dengan ranah yang hendak diukur. Instrumen tes berupa sejumlah butir pertanyaan yang dapat berupa soal obyektif dan/atau soal subyektif. Instrumen nontes antara lain 1) kuesioner/angket; 2) wawancara; 3) daftar cocok (check list); 4) Pengamatan/observasi; 5) portofolio; 6) jurnal,

instrumen yang baik pula. Alat ukur yang baik adalah alat ukur yang memenuhi persyaratan dan mampu menghasilkan informasi yang mengandung kesalahan sekecil mungkin (Kana Hidayati:thn).

Dalam pembuatan soal guru harus memahami dan memiliki kemampuan dalam membuat soal yang memiliki karakteristik baik agar dapat mengurangi kesalahan dalam pengukuran. Karakteristik soal yang baik dapat dilihat melalui validitas, reliabilitas, tingkat kesukaran, daya beda, dan keberfungsian distraktor. Selain itu, guru juga harus dapat menganalisis kesalahan baku pengukuran dari soal yang telah dibuat. Namun, pada kenyataannya guru belum memiliki kemampuan yang baik dalam membuat soal. Hal ini sesuai dengan pernyataan yang disampaikan oleh tim dari Pusat Penilaian Pendidikan Balitbang Kemendikbud Deni Hadiana saat sosialisasi kaidah penyusunan soal ujian bagi para guru di Aula Dinas Pendidikan Provinsi Lampung pada hari Rabu tanggal 9 Oktober 2013. Deni Hadiana menyampaikan bahwa seorang tenaga pendidik idealnya memiliki kecakapan dalam membuat soal sebagai alat evaluasi pembelajaran, namun fakta umum di lapangan menunjukan hal sebaliknya, kemampuan membuat soal oleh para guru masih di bawah standar. (Lampung Post, 10 Oktober 2013). Analisis terhadap butir soal yang telah dibuat bertujuan agar guru dapat mengevaluasi soal yang telah dibuat.

Dalam kegiatan pengukuran seringkali terdapat kesalahan pengukuran. Kesalahan pengukuran dibagi menjadi dua yaitu kesalahan acak (random error) dan kesalahan sistematik (systematic error). Viswanathan (2005:98-99):

Random error is any type of error that is inconsistent or does not repeat in the same magnitude or direction exceptby change. Systematic error is any error that has a consistent effect. Sytematic error results from consistent but inaccurate responses. Kesalahan acak adalah setiap jenis kesalahan yang tidak konsisten atau tidak terulang dalam jarak atau arah yang sama kecuali dengan perubahan. Kesalahan sistematik adalah kesalahan yang memiliki efek yang konsisten. Hasil kesalahan sistematik dari respons konsisten tapi tidak akurat.

Standard Error of Measurement (SEM) dalam bahasa Indonesia adalah kesalahan baku pengukuran. Menurut Crocker dan Algina (2008: 128) the standard error of measurement is definied as ๐œŽ๐ธ = ๐œŽ๐‘‹ โˆš1 โˆ’ ๐œŒ๐‘‹๐‘‹โ€ฒ and may be considered as the average standard deviation of examineesโ€™ individual error distributions for a large number of repeated testings. Artinya, kesalahan baku pengukuran didefinisikan sebagai ๐œŽ๐ธ = ๐œŽ๐‘‹ โˆš1 โˆ’ ๐œŒ๐‘‹๐‘‹โ€ฒ dan dapat dianggap sebagai rata-rata standar deviasi dari distribusi kesalahan individu peserta ujian untuk tes berulang dalam jumlah besar. Selanjutnya, Miller (2008: 93) standard error of measurement is a quantitative expression of the magnitude of error in a test score based on the test reliability. Pendapat Miller tersebut diartikan bahwa kesalahan baku pengukuran adalah ekspresi kuantitatif dari besarnya kesalahan dalam skor tes berdasarkan pada reliabilitas tes.

Kesalahan baku pengukuran memiliki hubungan yang erat dengan kegiatan pengukuran atau hasil pengukuran dan kemampuan/pemahaman masing-masing peserta didik pada studi yang mereka pelajari. Pada teori tes klasik telah dijelaskan tentang nilai observasi (X) merupakan hasil penjumlahan antara nilai sebenarnya (T) dan kesalahan baku dalam pengukuran (E). Sehingga dapat disimpulkan bahwa, kesalahan baku dalam pengukuran merupakan penyimpangan yang terjadi antara skor yang tampak dan skor yang sebenarnya.

Soal uji coba UN di Banjarnegara tahun 2015 dibuat oleh Musyawarah Guru Mata Pelajaran (MGMP) Ekonomi SMA. Selama ini soal uji coba UN yang dibuat tidak dianalisis kualitas butirnya. Jadi, guru mengacu pada nilai yang diperoleh oleh masing-masing siswa

dan rata-rata nilai tiap mata pelajaran pada tahun yang bersangkutan untuk mengetahui keberhasilan belajar siswa.

Dalam menganalisis butir soal ada dua teori yang dapat diikuti oleh para guru, yaitu teori tes klasik dan teori respon butir. Kedua teori tersebut tidak menyaratkan ukuran sampel secara pasti (Crocker L & Algina J., 1986:322). Penelitian ini bertujuan untuk mendeskripsikan keakuratan hasil analisis butir dan mengestimasi kesalahan pengukuran (SEM) berdasarkan Teori Tes Klasik ditinjau dari ukuran sampel.

2. METODE PENELITIAN

Jenis penelitian ini adalah penelitian ex post facto. Penelitian dilakukan di Kabupaten Banjarnegara, dengan obyek penelitian lembar jawab siswa pada Soal Uji Coba Ujian Nasional SMA mata pelajaran Ekonomi tahun 2015, yang dibuat oleh Tim MGMP Ekonomi Banjaranegara. Ukuran sampel yang digunakan dalam penelitian ini adalah 100, 200, dan 400 lembar jawab. Teknik pengambilan data yang digunakan dalam penelitian ini adalah dokumentasi. Teknik analisis data yang digunakan adalah analilis parameter butir soal dan kesalahan pengukuran berdasarkan Teori Tes Klasik ditinjau dari ukuran sampel. Metode estimasi kesalahan pengukuran yang digunakan adalah Metode Compound Binomial.

3. HASIL DAN PEMBAHASAN

5.1. Hasil Penelitian

Berikut ini hasil analisis butir dengan parameter yang baik dan nilai SEM dari masing- masing ukuran sampel.

Tabel 1. Hasil analisis butir dan SEM

Ukuran Sampel 100 200 400 TK Baik 27 24 27 Tidak Baik 13 16 13 DB Baik 9 17 21 Tidak Baik 31 23 19 ED Baik 19 21 22 Tidak Baik 21 19 18 Kesimpulan 5 7 13 Reliabilitas 0,462 0,684 0,709 SEM 1,137 1,036 1,071 Keterangan: TK : Tingkat Kesukaran DB : Daya Beda ED : Efektivitas Distraktor SEM : Kesalahan Pengukuran

Hasil analisis butir soal pada Tabel 1 dilakukan dengan menggunakan program Iteman diperoleh bahwa pada ukuran sampel 100 terdapat 5 butir baik dan nilai reliabilitas 0,462. Selanjutnya, untuk ukuran sampel 200 diperoleh 7 butir baik dan reliabilitas 0,684, pada ukuran sampel 400 diperoleh 13 butir baik dan reliabilitas 0,709. Hasil estimasi SEM dengan menggunakan Metode Compound Binomial diperoleh 1,137 pada ukuran sampel 100, 1,036

5.2. Pembahahasan

Hasil analaisis butir berdasarkan Teori Tes Klasik yang dilakukan dengan program Iteman menunjukkan bahwa dari 40 butir soal yang dianalisis ditinjau dari ukuran sampelnya, diperoleh hasil yang bervariasi. Untuk ukuran sampel 100 diperoleh 27 butir yang memiliki tingkat kesukaran baik, 9 butir memiliki daya beda baik, dan 19 butir memiliki efektivitas distraktor baik. selanjutnya, ukuran sampel 200 diperoleh 24 butir yang memiliki tingkat kesukaran baik, 17 butir memiliki daya beda baik, dan 21 butir memiliki efektivitas distraktor baik. pada ukuran sampel 400, butir yang memiliki tingkat kesukaran baik berjumlah 27 butir, dan 21 memiliki daya beda baik, serta 22 butir dengan distraktor baik. kesimpulan butir soal yang memiliki tingkat kesukaran baik, daya beda baik, dan efektivitas distraktor baik yang diperoleh dari ukuran sampel 100, 200, dan 400 berturut-turut adalah 5 butir, 7 butir, 13 butir.

Selanjutnya, hasil analisis Iteman yang diperoleh adalah koefisien reliabilitas. Secara berurutan nilai koefisien reliabilitas yang diperoleh dari ukuran sampel 100, 200, dan 400 adalah 0,462, 0,684, dan 0,709. Nilai estimasi SEM dengan menggunakan metode Compound Binomial adalah ukuran sampel 100 diperoleh SEM 1,137, ukuran sampel 200 diperoleh SEM 1,036, dan ukuran sampel 400 diperoleh SEM 1,071.

Dalam Teori Tes Klasik suatu instrumen dikatakan baik jika memiliki nilai koefisien reliabilitas yang tinggi dan harga SEM kecil. Berdasarkan hasil analisis diketahui bahwa ukuran sampel yang memiliki jumlah butir baik banyak, koefisien reliabilitas tinggi, dengan nilai SEM kecil adalah ukuran sampel 400. Dengan demikian dapat disimpulkan bahwa berdasarkan Teori Tes Klasik semakin banyakukuran sampel yang digunakan maka analisis butir soal akan lebih akurat. Jika dilihat dari perangkat soal yang digunakan, diketahui bahwa soal Uji Coba Ujian Nasional SMA mata pelajaran Ekonomi tahun 2015, yang dibuat oleh Tim MGMP Ekonomi Banjaranegara masih dalam kategori perangkat soal yang kurang baik. Hal ini dapat dilihat bahwa dari 40 butir soal hanya ada 13 butir yang baik. Salah satu hal yang menyebabkan perangkat tersebut kurang baik karena Tim MGMP Ekonomi Banjarnegara tidak melakukan uji coba sebelum perangkat tersebut digunakan.

6. SIMPULAN

Berdasarkan hasil penelitian dan pembahasan diperoleh simpulan sebagai berikut: 4.1 Berdasarkan Teori Tes Klasik analisis butri soal akan lebih akurat jika menggunakan

ukuran sampel 400 dengan jumlah butir yang baik sebanyak 13 (32,5%).

4.2 Hasil estimasi SEM yang paling kecil diperoleh jika menggunakan ukuran sampel 200 sebesar 1,036.

7. DAFTAR PUSTAKA

Crocker L & Algina J.1986. Introduction to Classical and Modern test Tyheory. New York: CBS college publishing.

Kana Hidayati. Keakuratan Hasil Analisis Butir Menurut Teori Tes Klasik dan Teori Respon Butir Ditinjau dari Ukuran Sampel.

Kemampuan Guru Membuat Soal Rendah. (10 Oktober 2013). Lampung Post, hlm.19. Miller, P. W. (2008). Measurement and teaching. Muster: Partric W. Miller & Association. Viswanathan, M. (2005). Measurement error and research design. Newbury Park: SAGE

STUDI GENERALIZABILITAS MULTIFACET PADA INSTRUMEN PENILAIAN MENULIS KARANGAN

Garis besar

Dokumen terkait