• Tidak ada hasil yang ditemukan

1. Makalah Instrumen Tes Hasil Belajar

N/A
N/A
Protected

Academic year: 2021

Membagikan "1. Makalah Instrumen Tes Hasil Belajar"

Copied!
39
0
0

Teks penuh

(1)

MAKALAH INSTRUMEN TES HASIL BELAJAR

Disusun untuk memenuhi tugas mata kuliah

Evaluasi dalam Pembelajaran Matematika

Yang diampu oleh dosen Dra. Ratnaningsih, M.Si

Oleh :

ARIF OKTAFIANTO (3136159241)

LOURENSIUS (3136159236)

YULISAR (3136159248)

PROGRAM PASCA SARJANA PENDIDIKAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS NEGERI JAKARTA 2016

(2)

KATA PENGANTAR

Rasa syukur kami panjatkan ke hadirat Allah SWT yang telah melimpahkan rahmat dan karunia-Nya sehingga makalah ini dapat diselesaikan.

Penyusunan makalah ini disesuaikan berkaitan dengan Instrumen tes hasil belajar dari sumber-sumber yang didapat, sehingga mudah dipahami.

Dalam penyusunan makalah ini tidak lepas dari sumbangsih berupa pemikiran-pemikiran/ gagasan dari teman-teman untuk menyempurnakan isi makalah ini. Semoga makalah ini sangat bermanfaat bagi pembaca terutama bagi teman-teman

mahasiswa dalam mata kuliah Evaluasi dalam Pembelajaran Matematika.

Jakarta, Maret 2016

(3)

DAFTAR ISI

HALAMAN JUDUL ………...……… i

KATA PENGANTAR ………...………… ii

DAFTAR ISI ………...… iii

BAB I PENDAHULUAN A. Latar belakang ………...… 4 B. Rumusan Masalah ………...… 4 C. Tujuan Masalah ………...… 5 D. Manfaat ………...… 5 BAB II PEMBAHASAN A. Pengertian Tes Hasil Belajar ...……... 6

B. Bentuk Tes Hasil Belajar ...7

C. Ciri-ciri Tes yang Baik ... 14

D. Penyusunan Kisi- Kisi Instrumen Tes Hasil Belajar Dan Proses Validasi Instrumen ... 16

E. Analisis Butir Soal ... 24

(4)

BAB 1 PENDAHULUAN

A. Latar belakang

Setiap kegiatan belajar harus diketahui sejauh mana proses belajar tersebut telah memberikan kemampuan bagi siswa. Salah satu cara untuk melihat peningkatan kemampuan tersebut adalah dengan melakukan tes hasil belajar. Tes hasil belajar merupakan salah satu bentuk yang digunakan untuk mengukur perkembangan belajar siswa setelah mengikuti proses pembelajaran.

Sebagai pendidik yang professional, maka sebaiknya mengetahui penyusunan dan pengembangan tes hasil belajar yang baik dan benar sehingga tes dapat berfungsi dengan sebaik-baiknya. Dalam menyusun dan mengembangkan tes hasil belajar matematika terdapat hal-hal yang harus diperhatikan sehingga pendidik dapat mengukur tujuan instruksional khusus pada pembelajaran matematika dan memberikan informasi mengenai keberhasilan belajar siswa.

Dalam makalah ini akan dibahas mengenai bentuk tes hasil belajar, penyusunan kisi-kisi instrumen tes hasil belajar dan proses validasi instrumen, serta analisis butir instrumen tes hasil belajar dengan itemen. Oleh karena itu, kita sebagai pendidik bisa melakukan evaluasi pembelajaran dengan menyusun tes yang valid dan bisa mengukur kemampuan peserta didik.

B. Rumusan Masalah

Dari uraian latar belakang diatas, permasalahan yang ingin dicari solusinya adalah adalah sebagai berikut:

1. Apa saja bentuk tes hasil belajar?

2. Bagaimana penyusunan kisi-kisi instrumen tes hasil belajar?

3. Bagaimana proses validasi instrumen?

4. Bagaimana analisis butir instrumen tes hasil belajar dengan itemen?

(5)

C. Tujuan Masalah

Tujuan dari penulisan makalah ini adalah sebagai berikut: 1. Mengetahui bentuk tes hasil belajar

2. Mengetahui penyusunan kisi-kisi instrumen tes hasil belajar 3. Mengetahui proses validasi instrumen

4. Mengetahui analisis butir instrumen tes hasil belajar dengan itemen

D. Manfaat

Manfaat yang ingin dicapai dari penulisan makalah ini adalah bagi mahasiswa dapat dijadikan panduan dalam mengikuti mata kuliah Evaluasi dalam Pembelajaran Matematika dan yang ingin menyusun atau mengembangkan instrumen tes hasil belajar.

BAB II PEMBAHASAN

(6)

A. Pengertian Tes Hasil Belajar

Kata tes berasal dari bahasa Prancis kuno yang berarti piring untuk menyisihkan logam-logam mulia, yang dimaksud disini adalah dengan menggunakan alat berupa piring akan dapat diperoleh jenis-jenis logam mulia yang bernilai tinggi. Dalam perkembangannya dan seiirng kemujuan zaman tes berarti ujian atau percobaan. Ada beberapa istilah yang memerlukan penjelasan sehubungan dengan uraian diatas yaitu tes, testing, tester dan testee, yang masing-masing mempunyai pengertian berbeda namun erat kaitannya dengan tes. Subino (1987: 79).

1. Tes adalah alat atau prosedur yang dipergunakan dalam rangka

pengukuran dan penilaian,

2. Testing berarti saat dilaksanakannya pengukuran dan penilaian atau

saat pengambilan tes

3. Tester artinya orang yang melaksanakan tes atau orang yang diserahi

untuk melaksanakan pengambilan tes terhadap para responden 4. Testee adalah pihak yang sedang dikenai tes.

Ada beberapa pendapat dari beberapa ahli tentang pengertian tes, menurut Anne Anastasi dalam karya tulisnya yang berjudul Psychological Testing, yang dimaksud dengan tes adalah alat pengukur yang mempunyai standar yang obyektif sehingga dapat digunakan secara meluas, serta dapat digunakan sebagai cara untuk mengukur dan membandingkan keadaan pskis atau tingklah laku individu. Menurut Lee J. Cronbach dalam bukunya berjudul Essential of Psychological Testing, tes merupakan suatu perosedur yang sistematis untuk membandingkan tingkah laku dua orang atau lebih. Sedangkan menurut Goodenough, tes adalah suatu tugas atau serangkaian tugas yang diberikan kepada individu atau kelompok, yang dimaksud untuk membandingkan kecakapan satu sama lain.

Dari pengertian dari para ahli tersebut dalam dunia pendidikan dapat disimpulkan bahwa pengertian tes adalah cara yang digunakan atau prosedur yang ditempuh dalam rangka pengukuran dan penilaian di bidang pendidikan, yang memberikan tugas dan serangkaian tugas yang diberikan

(7)

oleh guru sehingga dapat dihasilkan nilai yang melambangkan tingkah laku atau prestasi peserta didik.

Suatu tes akan berisiskan pertanyaan-pertanyaan dan atau soal-soal yang harus dijawab dan atau dipecahkan oleh individu yang dites (testee), maka disebut tes hasil belajar (achievement test). Tes hasil belajar biasanya terdiri dari sejumlah butir soal yang memiliki tingkat kesukaran tertentu (ada yang mudah, sedang, dan sukar). Tes tersebut harus dapat dikerjakan oleh siswa dalam waktu yang sudah ditentukan. Oleh karena itu, tes hasil belajar merupakan power test. Maksudnya adalah mengukur kemampuan siswa dalam menjawab pertanyaan atau permasalahan.

B. Bentuk Tes Hasil Belajar

Tes merupakan serangkaian soal yang harus dijawab oleh siswa. Dalam hal ini, tes hasil belajar dapat digolongkan kedalam beberapa kategori sebagai berikut:

1. Berdasarkan bentuk pelaksanaanya, yaitu: a. Tes lisan

Tes lisan dilakukan dengan pembicaraan atau wawancara tatap muka antara guru dan murid.

b. Tes tulisan

Tes tertulis dalam pelaksanaannya lebih menekankan pada penggunaan kertas dan pencil sebagai instrumen utamanya, sehingga tes mengerjakan soal atau jawaban ujian pada kertas ujian secara tertulis, baik dengan tulisan tangan maupun menggunakan komputer.

c. Tes tindakan atau perbuatan. Tes perbuatan mengacu pada proses penampilan seseorang dalam melakukan sesuatu unit kerja. Tes perbuatan mengutamakan pelaksanaan perbuatan peserta didik.

(8)

a. Tes Essay (uraian)

Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat bermanfaat untuk mengembangkan kemampuan dalam menjelaskan atau mengungkapkan suatu pendapat dalam bahasa sendiri.

Subino, (1987:94) menyatakan bahwa berdasarkan tingkat kebebasan jawaban yang dimungkinkan dalam tes bentuk uraian, butir-butir soal dalam ini dapat dibedakan atas butir-butir soal yang menuntut jawaban bebas. Butir-butir soal dengan jawaban terikat cenderung akan membatasi, baik isi maupun bentuk jawaban; sedangkan butir soal dengan jawaban bebas cenderung tidak membatasi, baik isi maupun jawaban.

Kebaikan atau keuntungan penggunaan tes uraian antara lain: 1) Dapat mengukur hasil belajar yang kompleks, yang tidak dapat diukur dengan tes atau cara yang lain.

2) Dapat mengukur perpaduan dan aplikasi tentang keterampilan berpikir dan keterampilan memecahkan masalah.

3) Mudah disusun (dibuat)

Keburukan atau kelemahan penggunaan tes bentuk uraian antara lain:

1) Memiliki keterbatasan akibat tidak konsistensinya penyekoran. 2) Memerlukan banyak waktu untuk menilai jawaban.

3) Sampling yang diukur terbatas.

Saran dan petunjuk untuk menyusun pertanyaan essay, antara lain: 1) Hendaknya tes ini digunakan untuk mengukur hasil belajar yang tidak dapat diukur tes objektif.

2) Rumuskan pertanyaan sehingga dapat mengukur tingkah laku dengan tepat sesuai dengan hasil belajar.

(9)

interprestasi yang bermacam-macam.

Petunjuk untuk menyekor pertanyaan essay, adalah: 1) Siapkan outline jawaban

2) Gunakan cara/metode menyekor yang lebih tepat a) Point method

b) Rating method

3) Nilailah semua jawaban untuk satu pertanyaan sebelum dilanjutkan ke pertanyaan berikutnya.

b. Tes Objektif

Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif jawabannya. Tes ini terdiri dari berbagai macam bentuk, antara lain ;

1. Tes objektif bentuk benar-salah (true-false test) 2. Tes objektif bentuk menjodohkan (matching test) 3. Tes objektif bentuk jawaban singkat (short answer)

4. Tes objektif bentuk pilihan ganda (multipel choice item test)

1) Tes objektif benar-salah (true-false test)

Tes obyektif bentuk True-false merupakan salah satu bentuk tes obyektif dimana butir-butir soal yang diajukan dalam test hasil belajar berupa pernyataan (pernyataan dimana ada yang benar dan ada yang salah).

Keunggulan tes obyektif bentuk benar-salah (true-false test) a) Mudah dalam menyusun/pembuatannya mudah

b) Dapat digunakan berulang kali

c) Tidak terlalu banyak memakan lembaran kertas/tempat karena biasanya pertanyaan-pertanyaannya singkat saja

d) Mampu mencakup bahan pelajaran yang luas e) Bagi testee, cara mengerjakannya mudah f) Bagi tester, cara mengkoreksinya juga mudah

(10)

Kelemahan tes obyektif bentuk benar-salah (true-false test) a) Mudah ditebak dan diduga

b) Membuka peluang bagi testee untuk berspekulasi dalam memberikan jawaban

c) Sifatnya terbatas, dalam arti bahwa tes tersebut hanya dapat mengungkap daya ingat dan pengenalan kembali, jadi lebih bersifat hafalan

d) Umumnya tes obyektif jenis ini reliabilitasnya rendah, kecuali apabila butir-butir soalnya dibuat dalam jumlah yang banyak sekali

e) Dapat terjadi bahwa butir-butir soal tes objektif ini tidak dapat dijawab dengan dua kemungkinan saja, yaitu betul atau salah

2). Tes Menjodohkan (Matching Test):

Sering dikenal dengan istilah tes menjodohkan, tes mencari pasangan, tes menyesuaikan, tes mencocokkan dan tes mempertandingkan. Matching test terdiri atas satu seri pertanyaan dan satu seri jawaban. Masing-masing pertanyaan mempunyai jawabnya yang tercantum dalam seri jawaban.

Keunggulan tes obyektif bentuk menjodohkan (Matching Test):  Pembuatannya mudah

 Dapat dinilai dengan mudah, cepat, dan obyektif

 Apabila tes ini dibuat dengan baik, maka faktor menebak praktis dapat dhilangkan

Kelemahan tes obyektif bentuk menjodohkan (Matching Test):  Cenderung lebih banyak mengungkap aspek hafalan atau daya

ingat saja

 Karena mudah disusun, maka tes ini kadang dijadikan pelarian bagi pengajar, yaitu digunakan apabila pengajar tidak sempat lagi untuk membuat tes bentuk lain

 Tes jenis ini kurang baik untuk mengevaluasi pengertian dan kemampuan membuat tafsiran (interpretasi)

(11)

3). Tes Jawaban Singkat (Short Answer) Keuntungan tes jawaban singkat antara lain:

 Lebih mudah disusun, karena hasil belajar yang diukur relatif sederhana

 Siswa diminta hanya memberi jawaban Keterbatasan tes jawaban singkat antara lain:

 Tidak cocok untuk mengukur hasil belajar yang kompleks

4). Tes Pilihan Berganda (multipel choice item test)

Multiple choice test terdiri atas suatu pertanyaan atau keterangan tentang suatu pengertian yang belum lengkap, dan untuk melengkapinya harus memilih satu dari beberapa kemungkinan jawaban yang telah disediakan. Atau dengan kata lain, multiple choice test terdiri atas bagian keterangan (stem) dan bagian kemungkinan jawaban atau alternative (option). Kemungkinan jawaban terdiri atas satu jawaban yang benar (sebagai kunci jawaban) dan beberapa pengecoh (distractor), Arikunto (2006:168). Contoh soal multiple Choice item, sebagai berikut:

a) Model melengkapi empat/lima pilihan b) Model melengkapi berganda

Contoh:

Tulislah: A. Bila (1), (2), dan (3) betul B. Bila (1) dan (3) betul C. Bila (2) dan (4) betul

D. Bila hanya (4) yang betul

E. Bila semuanya betul

c) Model analisis hubungan antar hal Contoh:

(12)

A. Jika pernyataan betul, alasan betul, dan keduanya menunjukkan hubungan sebab-akibat

B. Jika pernyataan betul, alasan betul, tetapi keduanya tidak menunjukkan hubungan sebab-akibat

C. Jika pernyataan betul dan alasan salah D. Jika pernyataan salah dan alasan betul E. Jika pernyataan salah dan alasan sala Keunggulan tes Pilihan Ganda:

 Sifatnya lebih representatif dalam hal mencakup atau mewakili materi yang telah diajarkan kepada peserta didik

 Memungkinkan bagi tester untuk bertindak lebih obyektif  Lebih mudah dan cepat dalam mengoreksi

 Memberi kemungkinan orang lain untuk ditugasi/dimintai bantuan mengoreksi hasil tes tersebut

 Butir soal pada tes obyektif jauh lebih mudah dianalisis  Sangat tepat untuk ujian yang peserta banyak sedangkan

hasilnya harus segera seperti ujian akhir nasional maupun ujian sekolah.

Kelemahan tes bentuk Pilihan Ganda:

 Menyusun butir tes obyektif tidak semudah menyusun tes uraian  Umumnya kurang dapat mengukur proses berpikir yang lebih

tinggi atau mendalam

 Terbuka bagi testee untuk bermain spekulasi

3. Dilihat dari sudut waktu kapan dan untuk apa tes itu dilakukan, yaitu:

a. Tes awal (pretest),

b. Tes akhir (posttest),

4. Dari segi fungsi tes di sekolah, tes dibedakan menjadi : a. Tes Formatif

(13)

Tes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan belajar selama proses pembelajaran berlangsung. Tes ini diberikan dalam tiap satuan unit pembelajaran. Manfaat tes formatif bagi peserta didik adalah :

Untuk mengetahui apakah peserta didik sudah menguasai materi dalam tiap unit pembelajaran. Merupakan penguatan bagi peserta didik.

Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif peserta didik mengetahui kelemahan-kelemahan yang dimilikinya. Peserta didik dapat mengetahui bagian dari bahan yang mana yang belum dikuasainya.

b. Tes Summatif

Tes sumatif diberikan dengan maksud untuk mengetahui penguasaan atau pencapaian peserta didik dalam bidang tertentu. Tes sumatif dilaksanakan pada tengah atau akhir semester.

c. Tes Penempatan

Tes penempatan adalah tes yang diberikan dalam rangka menentukan jurusan yang akan dimasuki peserta didik atau kelompok mana yang paling baik ditempati atau dimasuki peserta didik dalam belajar.

d. Tes Diagnostik

Tes diagnostik adalah tes yang digunakan untuk mendiagosis penyebab kesulitan yang dihadapi seseorang baik dari segi intelektual, emosi, fisik dan lain-lain yang mengganggu kegiatan belajarnya.

(14)

Menurut arikonto (2006:42), Sebuah tes yang dapat dikatakan baik sebagai alat pengukur harus memilki persyaratan tes, yaitu memiliki: 1. Validitas

Sebuah tes disebut valid apabila tes tersebut dapat tepat mengukur apa yang hendak diukur. Contoh, untuk mengukur partisipasi siswa dalam proses belajar mengajar, bukan diukur melalui nilai yang diperoleh pada waktu ulangan, tetapi dilihat melalui: kehadiran, terpusatnya perhatian pada pelajaran, ketepatan menjawab pertanyaan-pertanyaan yang diajukan oleh guru dalam arti relevan pada permasalahannya.

2. Reliabilitas

Berasal dari kata asal reliable yang artinya dapat dipercaya. Tes dapat dikatakan dapat dipercaya jika memberikan hasil yang tetap apabila diteskan berkali-kali. Sebuah tes dikatakan reliabel apabila hasil-hasil tes tersebut menunjukan ketetapan. Jika dihubungkan dengan validitas, maka: Validitas adalah ketepatan dan reliabilitas adalah ketetapan.

3. Objektivitas

Sebuah dikatakan memiliki objektivitas apabila dalam melaksanakan tes itu tidak ada faktor subjektif yang mempengaruhi. hal ini terutama terjadi pada sistem scoringnya. Apabila dikaitkan dengan reliabilitas maka objektivitas menekankan ketetapan pada sistem scoringnya, sedangkan reliabilitas menekankan ketetapan dalam hasil tes.

4. Praktikabilitas

Sebuah tes dikatakan memiliki praktibilitas yang tinggi apabila tes tersebut bersifat praktis dan mudah pengadministrasiannya. tes yang baik adalah yang mudah dilaksanakan, mudah pemeriksaannya, dan dilengkapi dengan petunjuk-petunjuk yang jelas.

(15)

Yang dimaksud ekonomis disini ialah bahwa pelaksanaan tes tersebut tidak membutuhkan ongkos atau biaya yang mahal, tenaga yang banyak, dan waktu yang lama.

D. Penyusunan Kisi- Kisi Instrumen Tes Hasil Belajar Dan Dan Proses Validasi Instrumen

(16)

Ada berbagai pendapat mengenai validitas untuk instrumen yang digunakan pengukuran, baik di bidang pendidikan maupun psikologi. W.James Popham (1995) mengatakan bahwa dua pertanyaan penting sesuai dengan pembuatan tes antara lain 1. Apa yang harus tes (dinilai ) dalam hal ini meliputi cognitive, psikomotorik, dan afektif. Cognitif berdasarkan taksonomi Bloom terdiri dari: pengetahuan, pemahaman, aplikasi, analisis dan sintesis, 2. Bagaimana melakukan tes tersebut dalam hal ini meliputi bentuk tes yang jawabanya dapat berupa pilihan berganda, menjodohkan, benar–salah, uraian dan jawaban singkat serta bentuk portofolio yang valid sehingga dapat memberikan informasi yang sesuai dengan proses belajar- mengajar di kelas.

Validitas itu dapat dikelompokkan menjadi tiga tipe, yaitu: (1) validitas kriteria (criterion-related), (2) validitas isi, dan (3) validitas konstruk (Nunnally, 1978, Allen & Yen, 1979, Fernandes, 1984, Woolfolk & McCane, 1984, Kerlinger, 1986, dan Lawrence, 1994). Validitas ini dapat diketahui melalui fakta keberadaaan validitas. Sumber fakta validitas dapat dikelompokkan menjadi isi tes, proses respons, struktur internal, hubungan dengan variabel lain, dan konsekuensi dari pelaksanaan tes. Keberadaan validitas dari suatu perangkat tes ini dapat diketahui melalui analisis isi tes dan analisis empiris dari skor tes data respons butir. Validitas berdasarkan kriteria dibedakan menjadi dua, yaitu validitas prediktif dan validitas konkuren. Dalam analisis validitas prediktif, performansi yang hendak diprediksikan disebut dengan kriteria. Besar kecilnya harga estimasi validitas prediktif suatu instrument digambarkan dengan koefisien korelasi antara prediktor dengan kriteria tersebut. Validitas isi suatu instrumen adalah sejauhmana butir-butir dalam instrumen itu mewakili komponen-komponen dalam keseluruhan kawasan isi objek yang hendak diukur dan sejauh mana butir-butir itu mencerminkan ciri perilaku yang hendak diukur (Nunnally, 1978; Fernandes, 1984). Validitas isi itu keterwakilan pertanyaan terhadap kemampuan khusus yang harus diukur. Berdasarkan hal ini, dapat disimpulkan bahwa validitas isi terkait dengan analisis rasional terhadap

(17)

domain yang hendak diukur untuk mengetahui keterwakilan instrumen dengan kemampuan yang hendak diukur. Validitas konstruk adalah validitas yang menunjukkan sejauh mana instrumen mengungkap suatu kemampuan atau konstruk teoretis tertentu yang hendak diukurnya (Nunnally, 1978, Fernandes, 1984). Prosedur validasi konstruk diawali dari suatu identifikasi dan batasan mengenai variabel yang hendak diukur dan dinyatakan dalam bentuk konstruk logis berdasarkan teori mengenai variabel tersebut. Dari teori ini ditarik suatu konskuensi praktis mengenai hasil pengukuran pada kondisi tertentu, dan konskuensi inilah yang akan diuji. Apabila hasilnya sesuai dengan harapan maka instrumen itu dianggap memiliki validitas konstruk yang baik. Pada tes prestasi belajar, validitas merupakan syarat yang sangat diperlukan dalam pengembangan tes. Menurut pendapat Sireci yang didukung Lissitz & Samuelsen (2007), validasi tes yang dipergunakan dalam dunia pendidikan sebaiknya melibatkan analisis isi tes dan analisis empiris dari skor tes dan data respons terhadap butir oleh peserta tes. Analisis isi tes terkait dengan validitas isi yang selanjutnya diperlukan juga analisis empiris untuk mengetahui validitas konstruk. Kedua analisis ini dimaksudkan agar tes di dunia pendidikan memenuhi syarat tes yang standar.

Membuktikan Validitas Isi

Validitas isi ditentukan menggunakan kesepakatan ahli. Kesepakatan ahli bidang studi atau sering disebut dengan domain yang diukur menentukan tingkatan validitas isi (content related). Hal ini dikarenakan instrumen pengukuran, misalnya berupa tes atau angket dibuktikan valid jika ahli (expert) meyakini bahwa istrumen tersebut mengukur penguasaan kemampuan yang didefinisikan dalam domain ataupun juga konstruk psikologi yang diukur. Untuk mengetahui kesepakatan ini, dapat digunakan indeks validitas, diantaranya dengan indeks yang diusulkan oleh Aiken (1980; 1985). Indeks validitas butir yang diusulkan Aiken ini dirumuskan sebagai berikut:

(18)

V

S = skor yang ditetapkan oleh validator n= Banyaknya Validator

c = Banyakya kategori yang dipilih validator

dengan V adalah indeks validitas butir; s skor yang ditetapkan setiap rater dikurangi skor terendah dalam kategori yang dipakai (s = r – lo, dengan r =

skor kategori pilihan rater dan lo skor terendah dalam kategori

penyekoran); n banyaknya rater; dan c banyaknya kategori yang dapat dipilih rater. Berdasarkan pendapat tersebut, V merupakan indeks kesepakatan rater terhadap kesesuaian butir (atau sesuai tidaknya butir) dengan indikator yang ingin diukur menggunakan butir tersebut. Jika diterapkan untuk instrument pengukuran, menurut seorang rater maka n dapat digantidengan m (banyaknya butir dalam satu instrumen). Indeks V ini nilainya berkisar diantara 0-1.Contoh membuktikan validitas isi dari instrumenyang disajikan pada contoh berikut.

Contoh

Pada pengembangan instrumen pengukuran, misalnya tes, dikembangkan kisi-kisi dahulu dan butir perangkatnya, minimal memuat indikator, bentuk instrumen/tes, kemudian butir soal, dan penskorannya (pada kasus ini penskoran tidak dituliskan karena perlu tempat yang cukup banyak). Kemudian kisi-kisi berikut butir instrumen diberikan kepada ahli untuk divalidasi, dengan memberikan masukan terkait butir- butir instrumen sekaligus mengisi kesesuaian butir dengan indikator. Contoh pengembangan instrument sebagai berikut :

(19)

u

1 Menentukan hasil akar dari bilangan berpangkat serta pembagian bilangan berpangkat PG Bentuk .3 625 25 1 Dapat disederhanakan menjadi …. A. 54/3 B. 52/3 C. 51/3 D. 52/3 E. 54/3 Saran : 3 2 2 3 4 3 4 2 3 4 2 3 5 5 5 5 1 5 5 1 625 . 25 1        2 2 2 2 2 5 ‘ 2 Menentukan hasil dari pemangkatan bilangan berpangkat serta pembagian bilangan berpangkat PG Bentuk 2 / 3 2 / 3 3 / 1 :2 . 4 1        a a dapat disederhanakan menjadi …. A. 4a1/6 B. 2a1/6 C. 4a1/2 D. 4a1/6 E. 2a Saran : = 2a 2 2 2 2 2 5’

Contoh format penilaian oleh ahli untuk mengetahui kesesuaian butir Format Penilaian Ahli untuk mengetahui kesesuaian butir

(20)

No Skor Validasi Keterangan 1 2 3 4 5 Tidak Valid Kurang valid Cukup Valid Valid Sangat Valid 1 2 3 4 5 6 7 8 9 10

Contoh hasil tabulasi dari 3 validator untuk soal diatas No

Butir

Validator 1 Validator 2 Validator 3

1 3 2 3 2 4 3 3 3 4 3 5 4 5 3 3 5 4 4 3 6 3 4 4 7 4 5 4 8 4 4 4 9 3 4 4 10 4 4 3

Contoh Hasil Menghitung Indeks Kesepakatan Ahli pada soal diatas No

Butir Validator 1 Validator2 Validator3 S1 S2 S3 ∑S V

1 3 2 3 2 1 2 5 0.42 2 4 3 3 3 2 2 7 0.58 3 4 3 5 3 2 4 9 0.75 4 5 3 3 4 2 2 8 0.67 5 4 4 3 3 3 2 8 0.67 6 3 4 4 2 3 3 8 0.67 7 4 5 4 3 4 3 10 0.83 8 4 4 4 3 3 3 9 0.75 9 3 4 4 2 3 3 8 0.67 10 4 4 3 3 3 2 8 0.67

Secara rinci penyusunan kisi-kisi Instrumen Tes dan Non Tes adalah sebagai berikut :

(21)

1. Kisi-kisi Instrumen /Tes

Setelah tujuan tes ditetapkan, kegiatan berikuimya adalah menyusun kisi-kisi tes. Kisi-kisi-kisi ini padadasarnya merupakan tabel matrik yang berisi spesifikasi soal yang akan ditulis. Kisi-kisi berisi tentang tujuan, standar kompetensi, kompetensi dasar, materi pokok, dan penilaian yang berisi bentuk dan jenis tagihan. Standar kompetenssi dijabarkan menjadi kompetensi dasar, kompetensi dasar dipecah menjadi beberapa iindikator, dan dari indikator inilah dibuat butir-butir instrumen.

Ada tiga langkah yang harus dipenuhi untuk menulis kisi-kisi, yaitu: 1) memilih standar kompetensi dasar, (2) memilih kompetensi dasar, (3) menulis indikator, dan (4) menentukan bentuk tes. Secara garis besar, ada dua bentuk tes yang banyak digunakan oleh guru, yaitu bentuk obyektif dan bentuk uraian atau nonobyektif. Sudah barang tentu, masing-masing bentuk tes memiliki kelebihan dan kekurangan.

2. Kisi-kisi Instrumen nontes

Penyusunan instrumen nontes didahului dengan penentuan definisi konseptual, kemudian dijabarkan lagi kedefinisi operasional. Dari definisi operasional ini kemudian dijabarkan menjadi beberapa indikator yang selanjutnya dijabarkan menjadi butir-butir instrumen. Seperti yang telah dijelaskan di muka, instrumen nontes ini dibedakan menjadi dua, yaitu skala, angket, dan inventori. 7

Skala digunakan untuk mengukur konstruk atau konsep psikologis seperti: sikap, minat, motivasi, pendapat, dan trait lainnya, sedangkan angket digunakan untuk mengukur fakta, atau yang dianggap fakta seperti: pendidikan terakhir, jumlah anggota, penghasilan setiap bulan, dll. Sementara itu, inventori digunakan untuk mengungkap kepemilikan benda nyata, seperti: jumlah kursi, jumlah meja, dll. Secara ringkas, hubungan antara tujuan, metode dan instrumen yang digunakan pada Tabel berikut.

Tujuan untuk

mengungkap: Metode Instrumen yg digunakan

(22)

ketrampilan mendalam penilaian, catatan, peneliti sendiri

- potensi termasuk di dalamnya unjuk kerja

tes, perintah mengerjakan soal tes, lembar perintah dilengkapi dg lembar observasi/ lembar penilaian - afektif: motivasi, sikap,

minat , kesukaan, dll

wawancara, survei pedoman wawancara, skala - data pribadi, data nyata wawancara, survei angket, inventori,

- data yang lalu, data

sekunder dokumentasi daftar dokumen

Tabel di atas menjelaskan bahwa metode dan instrumen yang digunakan harus mengacu pada tujuan pengukuran. Hal ini penting agar tidak terjadi kesalahan pengukuran.

Di muka telah dijelaskan pengertian dan jenis validitas dan reliabilitas instrumen. Secara ringkas cara memvalidasi dan mengestimasi reliabilitas instrumen dapat dilihat pada instrumen berikut.

Jenis Validitas Cara Memvalidasi Keterangan

Validitas isi: validitas kurikulum, validitas tampang

- menggunakan kisi-kisi - konsultasi keahlinya

-tanpa menggunakan teknik statistik

Validitas kriteria terkait atau validitas empirik: validitas prediktif, validitas konkuren

-mengkorelasikan dengan data di masa datang

Korelasi product moment

Validitas konstruk: validitas faktor

-mengkorelasikan skor butir dengan total

- analisis faktor - product moment -analisis butir

Jenis Reliabilitas Prosedur Teknik yang dipakai

Internal Consistency: 1. data ordinal 2. data nominal

1 dan 2, tes satu kali, kemudian dianalisis atau diestimasi reliabilitasnya

1. Koef. Alpha 2. KR 20, KR 21 3. Spearman Brown

(23)

3 tes sekali, kemudian skor dibelah dua dan diestimasi

Stabilitas Tes dua kali dengan soal sama, kemudian hasilnya dikorelasikan.

Product moment dan korelasi intra kelas

Ekivalen Beri tes dua kali dengan soal yang berbeda kemudian dikorelasikan

Product moment dan korelasi intra kelas

Tabel di atas menunjukkan bahwa untuk mengestimasi validitas dan reliabilitas instrumen diiperlukan kerja yang sangat hati-hati, Harus diupayakan agar proses dan estimasi ini dilaksanakan dengan sebaik-baiknya

E. ANALISIS BUTIR SOAL

Tes adalah suatu pernyataan, tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut pendidikan dan psikologi. Setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar. Tes dapat

(24)

diklasifikasikan menurut bentuk, tipe dan ragamnya (Asmawi Zainul, dkk :1997). Pengukuran adalah pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal atau obyek tertentu menurut aturan atau formulasi yang jelas. Karakteristik dari pengukuran adalah penggunaan angka atau skala tertentu dan menggunakan aturan atau formula tertentu (Asmawi Zainul, dkk :1997). Penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakan instrumen tes atau non tes.

Dengan kata lain, penilaian adalah pemberian nilai terhadap kualitas sesuatu. Keterkaitan antara tes, pengukuran dan penilaian adalah penilaian hasil belajar baru dapat dilakukan dengan baik dan benar bila menggunakan informasi yang diperoleh melalui pengukuran hasil belajar yang menggunakan tes sebagai alat ukurnya. Kegunaan tes, pengukuran dan penilaian dalam pendidikan antara lain adalah untuk seleksi, penempatan, diagnosa, remedial, umpan balik, memotivasi dan membimbing, perbaikan kurikulum, program pendidikan serta pengembangan ilmu.

Perencanaan dalam pengujian sangat penting karena tes baru akan berarti bila terdiri dari butir-butir soal yang menguji tujuan yang penting dan mewakili ranah pengetahuan, kemampuan dan keterampilan secara representatif. Ada enam hal yang perlu dipertimbangkan dalam perencanaan tes yaitu: pengambilan sampel dan pemilihan butir soal, tipe

tes yang akan digunakan, aspek yang akan diuji, format butir soal, jumlah butir soal dan distribusi tingkat kesukaran butir soal (Asmawi Zainul, dkk

(25)

Kelemahan butir soal tidak terletak pada bentuk atau tipe butir soal, tetapi lebih banyak ditentukan oleh butir soal yang dikonstruksi dengan baik atau tidak baik. Butir soal obyektif akan sama baiknya dengan butir soal uraian untuk mengukur keberhasilan belajar yang dikonstruksi secara baik. Bahkan dalam beberapa hal butir soal uraian jauh lebih besar resikonya daripada butir soal obyektif. Hal ini disebabkan mutu butir soal uraian tidak hanya terletak pada kemampuan siswa untuk menjawab soal tersebut, tetapi lebih banyak ditentukan oleh kemampuan dan obyektifitas pembuat soal dalam memberikan skor pada hasil tes tersebut. Butir soal obyektif dapat dianalisa secara lebih akurat dan bertanggung jawab sehingga dapat diketahui kelemahannya secara tepat. Butir soal tes obyektif dapat digunakan berulang-ulang, asalkan tidak dalam perangkat

tes yang sama.

Oleh karena itu ada manfaat atau kegunaan analisis butir soal, kemudian direvisi sehingga butir soal yang kurang baik konstruksinya dapat diperbaiki. Akhirnya akan diperoleh butir soal yang telah teruji dan secara akurat mengukur hasil belajar yang ingin diukur.

Ada beberapa alasan mengapa diperlukan analisis butir soal. Menurut (Asmawi Zainul, dkk :1997) alasan tersebut antara lain :

1. Untuk mengetahui kekuatan dan kelemahan butir tes, sehingga dapat dilakukan seleksi dan revisi butir soal.

2. Untuk menyediakan informasi tentang spesifikasi butir soal secara lengkap, sehingga akan lebih memudahkan bagi pembuat soal dalam menyusun perangkat soal yang akan memenuhi kebutuhan ujian dalam bidang dan tingkat tertentu.

3. Untuk segera dapat mengetahui masalah yang terkandung dalam butir soal, seperti: kemenduaan butir soal, kesalahan meletakkan kunci jawaban, soal yang terlalu sukar dan terlalu mudah, atau soal yang mempunyai daya beda rendah. Masalah ini bila diketahui dengan segera akan memungkinkan bagi pembuat soal untuk mengambil keputusan apakah butir soal yang bermasalah itu akan digugurkan atau direvisi guna menentukan nilai peserta didik.

(26)

4. Untuk dijadikan alat guna menilai butir soal yang akan disimpan dalam kumpulan soal. e. Untuk memperoleh informasi tentang butir soal sehingga memungkinkan untuk menyusun beberapa perangkat soal yang paralel. Penyusunan perangkat seperti ini sangat bermanfaat bila akan melakukan ujian ulang atau mengukur kemampuan beberapa kelompok peserta tes dalam waktu yang berbeda.

PEMBAHASAN

1. Deskripsi Analisis Butir Soal

Penilaian terhadap butir soal pada dasarnya merupakan analisis butir soal, dan selama ini pada umumnya para ahli pengukuran mengatakan bahwa analisis butir soal maksudnya adalah penilaian terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat mempengaruhi kualitas butir soal. Pendekatan untuk menganalisis butir soal yang berkembang saat ini terdiri dari dua pendekatan yaitu pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masing-masing memiliki kelebihan dan kekurangan. Namun keduanya masih sering digunakan dalam analisis butir soal. Analisis butir soal dengan pendekatan klasik diantaranya dapat dilakukan menggunakan Program Iteman.

Dengan melihat beberapa persyaratan yang harus dipenuhi, penyusunan tes dituntut untuk mengikuti pedoman penyusunan tes dan melakukan ujicoba. Kemudian berdasarkan hasil ujicoba, respon peserta dianalisis menggunakan Program Iteman untuk mendapatkan karakteristik butir soal. Data hasil analisis dengan Program Iteman dianalisis kembali menggunakan instrumen penilaian butir soal yang memenuhi syarat sebagai alat ukur yang baik. Suryabrata (1999) menyatakan bahwa analisis butir soal mencakup telaah soal atau analisis kualitatif dan analisis terhadap data empirik hasil ujicoba atau analisis kuantitatif.

(27)

Analisis butir soal secara kualitatif menekankan penilaian dari ketiga segi yaitu materi, konstruksi, dan bahasa. Namun demikian dalam pembahasan ini dikhususkan untuk menjelaskan analisis butir soal secara kuantitatif. Analisis ini dilakukan berdasarkan data yang diperoleh secara empiris melalui ujicoba dari suatu perangkat tes. Analisis kuantitatif sering disebut dengan analisis item yang menghasilkan karakteristik atau parameter butir dan tes, yaitu: tingkat kesukaran, daya beda dan distribusi jawaban dan kunci setiap butir, serta reliabilitas dan kesalahan pengukuran (SEM) dalam tes. Telah disinggung di depan bahwa analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang lebih atau sedang dan soal yang tidak baik. Dengan analisis soal dapat diperoleh informasi tentang kekurangan sebuah soal tes dan “petunjuk” untuk mengadakan perbaikan.

Dalam tes dan pengukuran, dikenal beberapa karakteristik butir soal. Untuk tes hasil belajar pada umumnya dipertimbangkan tiga karakteristik butir soal, yaitu : tingkat kesukaran, daya beda dan distribusi jawaban atau berfungsi tidaknya pilihan jawaban (distraktor). Ketiga karakteristik butir soal ini secara bersama-sama akan menentukan mutu butir soal. Bila salah satu dari ketiga karakteristik ini tidak memenuhi persyaratan maka mutu butir soal akan turun

.

2. Analisis Butir Soal dengan Langkah Kerja Program Iteman

Micro Computer Adaptive Test (MicroCat) menyediakan program Item analisis (Iteman) versi 3.50A, yaitu program analisis butir soal

dengan komputer, yang edisi kelimanya dipublikasikan mulai tahun 1993. a). Langkah-langkah Kerja Program Iteman

Program ini hanya dapat menganalisis butir soal ragam pilihan ganda. Analisis butir soal dengan program ini relatif mudah, yang penting diperlukan ketelitian dalam memasukkan data (data entry), karena kesalahan memasukkan data akan berakibat tidak tepat hasil analisisnya. Langkah-langkah untuk memasukkan data (dengan file baru) adalah sebagai berikut:

(28)

1) Klik Star, pilih Program, pilih Accessories, pilih dan klik Notepad; 2) Simpan dengan klik file, pilih dan klik Save as, lalu tulis nama file

data, misalnya : IPA-1 (jangan lupa, paling banyak 8 huruf/angka); 3) Pemasukan akan lebih cepat jika dilakukan oleh dua orang, seorang

membaca jawaban siswa dan seorang menuliskan. Agar tidak keliru antara jawaban b dan d, maka pembacaannya: a untuk a, be untuk b, ce untuk c, del untuk d, dan e untuk e;

4) Jika dilakukan sendiri, letakkan jari tengah tangan kiri pada huruf A dan jari telunjuk pada huruf D; jari telunjuk tangan kanan pada huruf C dan jari tengah pada huruf B pada keyboard (papan ketik). Mata melihat jawaban peserta tes, hasilnya akan lebih cepat;

5) Agar data tidak hilang saat listrik mati, maka sebentar-sebentar disimpan dengan klik File dan klik Save; dan

(29)

Contoh: File Data

Jumlah soal = 35 butir; jumlah option = 4 buah; jumlah estee = 30 orang Nomor Testee : 3 angka (ditambah satu tempat kosong, menjadi 4 karakter)

035 O N 04 CACDABDACACDACADACADCDCCABACADBBABD 44444444444444444444444444444444444 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 001 CACDOAOACOBCACAOBCOACDBCACOCDDBBOBO 002 CACDAADACACCACADACAACDCCABACADBBABD 003 CACDAADACACCADADACAACDCCABACCDBBABC 004 CACDCADACACCADACACADODCCADACDDBBABA 005 CACDAADACACCACADACAACDCCABACADBBABD 006 CACDAADACBAOBCAAACODCAAAABAOODBABAB 007 CACDAADACBCDACADACCDCDCCADACDDBBACD 008 DACCADDACBCBACAAACAACDCCABACBDBBDAD 009 CACDDADCACCAACBDACADCDCCABACADBBABB 010 CACDAADACACBACABACADCDCCABACDDBBABA 011 CACDAADACACCACADACADCDCCABACADBBABD 012 CACDAADACACDACADACAACDCCABACACBBABD 013 CADDAADACACCACADACADCDCCABACDDBBABD 014 CCADAADDACADDBACBBBDCDCAADACBDBBCBD 015 CABDAADACACDACADACADCDCCABACDDBBABD 016 CAADOADDABBDACADABBDBDCCCBACDBAACCB 017 CACDAADACACCACADACADCDCCABACADBBABD 018 CACDAADACACDACADACADCDCCABACADBBCAD 019 CACCBADACACCACACACADCDCOADACBDBBBCA 020 CAADAABDCBABDBADDAADBACCADACDCDABCD 021 CACCAADACACDACABACADCDCCABADDDBAABD 022 CACDAADACACCACBDACBDCDCCADADDDBBACB 023 COCDABDACOOOOBAOOOOOAOCBAOOCADBBDOD 024 CACDAADACACCACADACADCDCCABACADBBABD 025 CACDABDACOBBACAAACAABACAADACDCBCABD 026 CAABAADACDBBADDDAABCCAAAADACADBBDAB 027 CACDAADACACDACADACADCDCCADACADBBABD 028 CACDAADACACBACABACADODCCABACDABBABO 029 CACDAADACACDACADACADCDCCABACBDBBDCA 030 CACDBCDACABDABADDCADCDCCABACADBBABD Gambar 1. Tampilan File Data Analisis Butir Soal dengan Iteman

Jumlah angka dan tempat kosong sebelum menuliskan jawaban siswa Jumlah soal

Kunci jawaban soal

Jumlah option

Nomor urut siswa

Siswa tidak menjawab, Tulis O

Jawaban siswa

Setelah menulis huruf terakhir, Ingat …… jangan di enter

(30)

b). Analisis Data

1) Buka Program Iteman, dengan klik Star, pilih Program, pilih dan klik Iteman.

2) Isi nama file data, pada Enter the name of the input file: D:\IPA-1.txt lalu tekan enter.

3) Isikan nama file hasil, pada Enter the name of the output file: D:\IPA-1.has

4) lalu tekan enter.

5) Lalu muncul pertanyaan Do you want the scores written to a file? ( Y / N ). 6) maka tulislah Y dan tekan enter.

7) Isikan nama file skor, pada Enter the name of the score file: D:\IPA-1.skr 8) Lalu tekan enter, lalu enter terus sampai selesai.

9) Tampilannya seperti terlihat pada gambar berikut.

MicroCat (tm) Testing System

Copyright © 1982,1984, 1986, 1988 by Assessment Systems Corporation Beta-Test version – Univ. of Pittsburgh

Item and Test Analysis Program -- ITEMAN (tm) Version 3.00 Enter the name of the input file: D:\IPA-1.txt

Enter the name of the output file: D:\IPA-1.has Do you want the scores written to a file? ( Y / N ):Y Enter the name of score file: D:\IPA-1.skr

Do you have a Key Exceptions File?: No

Do you want to write statistics to an external file?: No ** Item Analysis is Complete **

Gambar 2. Tampilan analisis butir soal dengan Iteman

c). Hasil Analisis Butir Soal

Buka hasil analisis pada program MsWord dengan cara: 1) klik Star, pilih Program, pilih dan klik Microsoft Word

2) klik File, klik Open, dan cari file hasil pada drive D, dengan Files of Type: All Files

3) Contoh file hasil analisis seperti pada halaman berikut.

Nama file data Nama file hasil Ditulis Y karena minta file skor

Nama file skor Analisis selesai

(31)

MicroCAT (tm) Testing System Page 1 Copyright(c) 1982, 1984, 1986, 1988, 1993 by Assessment Systems Corporation

Item and Test Analysis Program -- ITEMAN (tm) Version 3.50 Item analysis for data from file D:\IPA-1.TXT

Date: 12-15-05 Time: 7:04 pm

******************** ANALYSIS SUMMARY INFORMATION ********************

Data (Input) File: D:\IPA-1.TXT Analysis Output File: D:\IPA-1.HAS Score Output File: D:\IPA-1.SKR Exceptions File: NONE

Statistics Output File: NONE

Scale Definition Codes: DICHOT = Dichotomous MPOINT = Multipoint/Survey

Scale: 0

---Type of Scale DICHOT N of Items 35 N of Examinees 30

***** CONFIGURATION INFORMATION ***** Type of Correlations: Point-Biserial

Correction for Spuriousness: NO Ability Grouping: YES Subgroup Analysis: NO

Express Endorsements As: PROPORTIONS Score Group Interval Width: 1

Item Statistics Alternative Statistics ---

---Seq. Scale Prop. Disc. Point Prop. Endorsing Point

No. -Item Correct Index Biser. Alt. Total Low High Biser. Key - -- - -- -- - - 1 0-1 .97 .00 .05 A .00 .00 .00 B .00 .00 .00 C .97 1.00 1.00 .05 * D .03 .00 .00 -.05 Other .00 .00 .00 2 0-2 .93 .25 .42 A .93 .75 1.00 .42 *

Cek dulu, apakah jumlah soal dan jumlah peserta tes, sudah benar?

Taraf Sukar Soal (p)

Daya Beda Soal (D)

(32)

B .00 .00 .00 C .03 .13 .00 -.28 D .00 .00 .00 Other .03 .00 .00 -.31 6 0-6 .07 -.25 -.31 A .87 .75 1.00 .20 ? B .07 .25 .00 -.31 *

CHECK THE KEY C .03 .00 .00 .11 B was specified, A works better D .03 .00 .00 -.05 Other .00 .00 .00

(33)

d). Menafsirkan Hasil Analisis Butir Soal

Beberapa tokoh evaluasi, yaitu: Sumadi Suryabrata, (1987); Dali S. Naga, (1992); Suharsimi Arikunto, (1993); dan Saifuddin Azwar, (1996); telah menetapkan suatu kriteria mutu soal, yang satu dengan lainnya relatif sama, yaitu seperti berikut.

Tabel 1. Kriteria Kualitas Butir Soal

Kriteria Indeks Klasifikasi

Prop Corect (Taraf Sukar Soal atau p)

0,000 - 0,250 Sukar 0,251 - 0,750 Sedang 0,751 - 1,000 Mudah Point Biserial (Daya beda atau

D)

D  0,199 Sangat Rendah 0,200 - 0,299 Rendah

0,300 - 0,399 Sedang D  0,400 Tinggi Prop Endorsing Proporsi

jawaban

0,000 - 0,010 Kurang 0,011 - 0,050 Cukup 0,051 - 1,000 Baik Alpha (Reliabilitas soal)

0,000 - 0,400 Rendah 0,401 - 0,700 Sedang 0,701 - 1,000 Tinggi

Untuk memudahkan memilah-milah butir soal mana yang perlu direvisi atau didrop dianjurkan untuk menggunakan kriteria berikut

Tabel 2. Kriteria Kualitas Soal untuk Kepentingan Pemilahan Butir

Kriteria Indeks Klasifikasi Penafsiran

Tingkat kesukaran ( p )

0,000 - 0,099 Sangat Sukar Dibuang / perlu revisi total 0,100 - 0,299 Sukar Perlu direvisi

0,300 - 0,700 Sedang Baik

0,701 - 0,900 Mudah Perlu direvisi 0,901 - 1,000 Sangat

Mudah

Dibuang / perlu direvisi total

Daya beda ( D )

D  0,199 Sangat

Rendah Dibuang / perlu direvisi total 0,200 - 0,299 Rendah Perlu direvisi

0,300 - 0,399 Sedang Sedikit atau tanpa revisi D  0,400 Tinggi Bagus Sekali

Proporsi jawaban

0,000 - 0,010 Kurang Dibuang / perlu direvisi

0,011 - 0,050 Cukup Baik

(34)

Reliabilitas soal

0,000 - 0,400 Rendah Kurang baik 0,401 - 0,700 Sedang Cukup 0,701 - 1,000 Tinggi Baik

Dari hasil analisis butir soal di atas, dengan jumlah soal 35 butir dan sampel 30 orang, penafsiran terhadap beberapa soal tersebut antara lain seperti berikut. Soal nomor 1, kunci jawabannya C, penafsirannya:

- Tingkat kesukaran butir soal (Prop.Corrrect) = 0,97 ; artinya butir soal ini ‘sangat mudah’ (p>0,90) karena 97 % dari peserta tes menjawab benar soal ini.

- Daya bedanya (Biserial) = 0,05 ; artinya ‘butir soal ini mempunyai daya beda yang ‘sangat rendah’ (D>0,20).

- Option (alternatif jawaban) A dan B tidak berfungsi sebagai pengecoh (distraktor), maka alternatif jawaban A dan B perlu diperbaiki. Sesuai kriteria pengecoh yang ‘baik’ jika dipilih oleh 0,011 - 0,050 (1,1% - 5%). Soal nomor 2, kunci jawabannya A, penafsirannya:

- Tingkat kesukaran butir soal (Prop.Corrrect) ini = 0,93 ; artinya butir soal ini ‘sangat mudah’ (p>0,90) karena dari 93% peserta tes, menjawab benar soal ini.

- Daya bedanya (Biserial) = 0,42 ; artinya ‘butir soal ini mempunyai daya beda yang ‘tinggi’ ( D>0,40 ).

- Option (alternatif jawaban) B dan D belum berfungsi sebagai pengecoh (distraktor), karena tidak ada satu testee-pun yang memilihnya.

Soal nomor 6, kunci jawabannya B, penafsirannya:

- Analisis butir soal ini ada informasi ‘Check The Key, B was specified, A

works better, artinya kunci jawaban A bekerja lebih baik daripada kunci

jawaban yang telah ditentukan, yaitu B. Butir soal ini perlu dicek kembali, terbukti daya beda butir soal ini menunjukkan angka -0,31 (daya beda ‘sangat rendah’ karena D<0,20). Ini artinya, pada siswa pandai tidak dapat menjawab benar soal ini, tetapi siswa kurang pandai dapat menjawab benar (karena kebetulan saja).

- Tingkat kesukaran butir soal ini = 0,07 ; artinya butir soal ini ‘sangat sukar’ (p>0,10) karena kurang dari 10% dari peserta tes menjawab benar soal ini.

- Option (alternatif jawaban) semua berfungsi sebagai pengecoh (distraktor), karena semua alternatif jawaban soal ini ada memilih.

(35)

E). Resume Hasil Analisis, Sebaran Skor dan Penentuan Nilai There were 30 examinees in the data file. Scale Statistics

N of Items 35  Jumlah soal

N of Examinees 30  Jumlah peserta tes Mean 26.700  Rerata skor

Variance 33.543

Std. Dev. 5.792  Standar Deviasi Skew -0.689

Kurtosis -0.946

Minimum 15.000  Skor terendah Maximum 33.000  Skor tertinggi Median 29.000

Alpha 0.874  Reliabilitas soal SEM 2.058

Mean P 0.763  Taraf sukar soal Mean Item-Tot. 0.424

Mean Biserial 0.627  Daya beda soal Max Score (Low) 23

N (Low Group) 8 Min Score (High) 32 N (High Group) 9

SCALE # 0 Score Distribution Table Number Freq- Cum

Correct uency Freq PR PCT --- --- --- ---- ----

. . . No examinees below this score . . . 14 0 0 1 0 | 15 1 1 3 3 +### 16 0 1 3 0 | 17 3 4 13 10 |########## 18 1 5 17 3 |### 19 2 7 23 7 |####### 20 0 7 23 0 + 21 0 7 23 0 | 22 0 7 23 0 | 23 1 8 27 3 |### 24 1 9 30 3 |### 25 1 10 33 3 +### 26 2 12 40 7 |####### 27 1 13 43 3 |###

(36)

28 1 14 47 3 |### 29 3 17 57 10 |########## 30 3 20 67 10 +########## 31 1 21 70 3 |### 32 5 26 87 17 |################# 33 4 30 99 13 |############# 34 0 30 99 0 | 35 0 30 99 0 + |----+----+----+----+----+ 5 10 15 20 25 Percentage of Examinees

(37)

Scores for examinees from file D:\IPA-1.TXT 001 19.00 002 32.00 003 29.00 004 26.00 005 32.00 006 19.00 007 29.00 008 25.00 009 27.00 010 30.00 011 33.00 012 32.00 013 31.00 014 18.00 015 32.00 016 17.00 017 33.00 018 32.00 019 24.00 020 15.00 021 29.00 022 26.00 023 17.00 024 33.00 025 23.00 026 17.00 027 33.00 028 28.00 029 30.00 030 30.00

Skor di atas kita ubah menjadi nilai skala 10 dengan program MsExcel

Langkah menghitung skor Iteman dengan Program MsExcel 1. Blok semua nomor peserta dengan skornya;

2. Copy dan paste di Excel;

3. Klik data, pilih text to columns, klik fixed width; 4. Klik next, next, dan finish; dan

(38)

DAFTAR PUSTAKA

1. Allen, M.J. & Yen, W.M. 1979. Introduction to measurement theory. Monterey, CA: Brooks/Cole Publishing Company.

2. Arikunto, Suharsimi, 2006. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

3. Asmawi Zainul dan Noehi Nasoetion. 1997. Penilaian Hasil Belajar. Pusat Antar Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan Dan kebudayaan.

4. Dali S. Naga. 1992. Pengantar Teori Sekor Pada Pengukuran Pendidikan. Jakarta: Besbats.

5. Departemen Pendidikan Dan Kebudayaan. 1997. Manual Item And Test

Analysis (Iteman). Badan Penelitian dan Pengembangan Pendidikan dan

Kebudayaan: Pusat Penelitian dan Pengembangan Sistem Pengujian. 6. Hamid Hasan, S dan Asmawi Zainul. 1991. Evaluasi Hasil Belajar.

Jakarta: Depdikbud.

7. Maria, 2014. http://mariatulannisa.blogspot.co.id/2014/02/makalah-tes-hasil-belajar-objektif.html. diakses pada 24 Maret 2016.

8. Nunnally, J.C. 1978. Psychometric theory. New York: McGraw Hill Book Company.

(39)

10. Saifuddin Azwar. 1996. Tes Prestasi. Yogyakarta: Pustaka Pelajar.

11. Subino, 1987. Konstruksi Dan Analisi Tes Suatu Pengantar Kepada Teori

Tes Dan Pengukuran. Jakarta: Depdikbud.

12. Suharsimi Arikunto. 2009. Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.

13. Sumadi Suryabrata. 1987. Pengembangan Tes Hasil Belajar. Jakarta: Rajawali.

14. Suryabrata, S. 1999. Pengembangan Alat Ukur Psikologis. Direktorat jenderal Pendidikan Tinggi: Departemen Pendidikan dan Kebudayaan.

Gambar

Tabel   di   atas   menjelaskan   bahwa   metode   dan   instrumen   yang digunakan harus mengacu pada tujuan pengukuran
Tabel   di   atas   menunjukkan   bahwa   untuk   mengestimasi   validitas dan reliabilitas instrumen diiperlukan kerja yang sangat hati-hati, Harus diupayakan   agar   proses   dan   estimasi   ini   dilaksanakan   dengan    sebaik-baiknya
Tabel 2. Kriteria Kualitas Soal untuk Kepentingan Pemilahan Butir

Referensi

Dokumen terkait

PENGEMBANGAN INSTRUMEN PENILAIAN PERFORMANCE UNTUK MENGUKUR HASIL BELAJAR

Hasil penelitian ini menyimpulkan bahwa: 1) Spesifikasi instrumen penilaian hasil belajar meliputi pen'.laian proses dan produk karya seni lukis anak di SD berbentuk

PENGEMBANGAN INSTRUMEN TES HASIL BELAJAR KETERAMPILAN DASAR BERMAIN BULUTANGKIS Universitas Pendidikan Indonesia | \.upi.edu perpustakaan.upi.edu. Keterangan :P1 =Reflex

Dan evaluasi dapat dinyatakan sebagai suatu proses pengambilan keputusan dengan menggunakan informasi yang diperoleh melalui asesmen dan pengukuran hasil belajar, baik

(da beberapa prinsip dasar yang perlu dicermati di dalam menyusun tes hasil belajar agar tes tersebut dapat mengukur tujuan instruksional khusus untuk mata pelajaran yang

Sedangkan jika kualitas instrumen penelitian yang digunakan tidak baik, dalam arti mempunyai validitas dan reliabilitas yang rendah, maka data yang diperoleh juga

Hasil penelitian dan pengembanagn yaitu: (1) instrumen penilaian hasil belajar fisika SMA kelas X, (2) kualitas instrumen yang diperoleh dari hasil validasi yaitu

Sedangkan jika kualitas instrumen penelitian yang digunakan tidak baik, dalam arti mempunyai validitas dan reliabilitas yang rendah, maka data yang diperoleh juga tidak valid atau tidak