• Tidak ada hasil yang ditemukan

BAB II LANDASAN TEORI

A. Kajian Pustaka

2. Kontruksi Tes Hasil Belajar

Kontruksi tes hasil belajar meliputi tiga pokok bahasan yaitu validitas, reabilitas, dan karakteristik butir soal. Ketiganya memiliki peran penting dalam pembuatan tes hasil belajar. Pembahasan ketiga pokok bahasan dalam kontruksi tes hasil belajar tersebut yaitu:

a. Validitas

Sugiyono (2015: 172) mengungkapkan instrumen yang valid berarti alat ukur yang digunakan untuk mendapatkan data (mengukur) itu valid. Valid berarti instrumen tersebut dapat digunakan untuk mengukur apa yang seharusnya diukur. Validitas menurut Standard (dalam Mardapi, 2008: 16) merupakan dukungan bukti dan teori terhadap penafsiran skor tes sesuai dengan tujuan penggunaan tes penafsiran skor tes tercantum pada tujuan penggunaan tes, bukan tes itu sendiri. Apabila skor tes digunakan ditafsirkan lebih dari satu makna, setiap penafsiran atau pemaknaan harus divalidasi. Gronlund (dalam Sukardi, 2009: 30) mengatakan bahwa validitas adalah ketepatan interpretasi yang dihasilkan dari skor tes atau instrumen evaluasi. Berdasarkan uraian diatas dapat disimpulkan bahwa validitas adalah alat ukur yang digunakan untuk mengukur suatu tes sesuai dengan penggunaan dan tujuan tes yang seharusnya diukur.

Menurut Arikunto (2012: 80), secara garis besar validitas dibedakan menjadi dua macam yaitu validitas logis dan validitas empiris.

1. Validitas Logis

Validitas logis adalah kondisi sebuah instrumen evaluasi yang memenuhi persyaratan valid berdasarkan hasil penalaran. Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu: validitas isi (content validity) dan validitas konstrak (construct validity). Validitas isi bagi sebuah instrumen

menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi.

2. Validitas Empiris

Istilah “validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi harus dibuktikan melalui pengalaman.

Validitas empiris dibagai menjadi empat yaitu: (1) validitas isi, (2) validitas konstrak, (3) validitas “ada sekarang”, dan (4) validitas prediksi. Validitas isi dan validitas konstrak dicapai melalui penyusunan berdasarkan ketentuan atau teori, sedangkan validitas “ada sekarang” dan validitas prediksi dicapai atau diketahui sesudah dibuktikan melalui pengalaman.

a. Validitas isi

Validitas isi adalah validitas yang mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Materi yang diajarkan tertera dalam kurikulum maka validitas isi ini sering disebut validitas kulikuler.

Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi kurikulum.

b. Validitas konstrak

Validitas konstrak adalah kemampuan butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam Tujuan Intruksional Khusus (TIK) atau yang lebih dikenal dengan indikator.

Kontruksi dalam pengertian ini adalah rekaan psikologis, yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan suatu cara tertentu “merinci” isi jiwa atau beberapa aspek yang tertuang dalam taksonomi Bloom yaitu, mengingat, memahami, menerapkan, menganalisis, mengevaluasi, dan mencipta. Validitas konstrak dapat diketahui dengan cara merinci dan memasangkan setiap butir soal dengan setiap aspek dalam Tujuan Intruksional Khusus (TIK).

c. Validitas “ada sekarang”(concurrent validity)

Validitas “ada sekarang” lebih dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Istilah “sesuai” tentu ada dua hal yang dipasangkan yaitu hasil tes dipasangkan dengan pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang,

kriterium atau alat banding. Maka, hasil tes merupakan sesuatu yang dibandingkan.

d. Validitas prediksi (predictive validity)

Validitas prediksi adalah kemampuan sebuah instrumen untuk meramalkan apa yang akan terjadi pada masa yang akan datang. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya lebih rendah, maka tes masuk yang dimaksud tidak memiliki validitas prediksi.

b. Reliabilitas

Menurut Arifin, Zaenal (2009: 254) mengemukakan bahwa reliabilitas adalah tingkat atau derajat konsistensi dari suatu instrumen. Reliabilitas tes berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetepkan. Suatu tes dapat dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Menurut Purwanto (2009: 153) keandalan (reliability) berasal dari kata rely yang artinya percaya dan reliabel yang artinya dapat dipercaya. Keterpercayaan berhubungan dengan ketetapan dan konsistensi. Tes Hasil Belajar dikatakan dapat dipercaya apabila memberikan hasil pengukuran hasil belajar yang relatif tetap secara konsisten. Masidjo (1995: 209) menjelaskan bahwa reliabilitas

adalah taraf kemampuan tes mampu menunjukkan konsistensi hasil pengukurannya yang diperlihatkan dalam taraf ketetapan dan ketelitian hasil. Berdasarkan pernyataan di atas dapat disimpulkan bahwa reliabilitas adalah konsistensi suatu tes yang akan memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu dan kesempatan yang berbeda.

Sukardi (2009: 160) mengemukakan berdasarkan cara-cara melakukan pengujian tingkat reliabilitas instrumen, ada dua reliabilitas, yaitu (1) reliabilitas eksternal atau

external reliability dan (2) reliabilitas internal atau internal realibility

1. Reliabilitas Eksternal (Eksternal Reliability) a. Metode bentuk paralel (equivalent method)

Metode parallel dilakukan dengan cara menyusun dua instrumen yang hampir sama (equivalent). Kemudian diujicobakan kepada dua kelompok responden yang sama (responden mengerjakan dua kali). Misalnya tes Bahasa Inggris Seri A yang akan dicari reliabilitasnya dan tes Seri B diujikan kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien dari dua hasil tes inilah yang menunjukkan koefisien reliabilitas tes Seri A. Apabila rhitung lebih besar atau sama dengan rtabel dikatakan ada korelasi yang signifikan, instrument dianggap reliabel. Sebaliknya apabila rhitung lebih kecil dari rtabel dikatakan tidak ada korelasi yang signifikan, instrumen dianggap tidak reliabel. Kelemahan metode ini adalah membutuhkan waktu dan biaya

yang lebih karena harus menyusun dua instrumen dan harus mencoba dua kali tes.

b. Metode tes berulang (test-retest method)

Metode tes berulang dilakukan untuk menghindari penyusunan instrumen dua kali. Dengan menggunakan metode ini kita hanya menyusun satu perangkat instrumen. Instrumen tersebut diberikan kepada responden untuk diujicobakan, kemudian hasilnya dicatat. Pada kesempatan yang lain instrumen tersebut diberikan pada kelompok responden yang sama untuk dikerjakan lagi dan hasil yang kedua juga dicatat. Kemudian kedua hasil tersebut dikorelasikan.

2. Reliabilitas Internal (Internal Reability) a. Instrumen skor diskrit

Instrumen skor diskrit, nominal atau pilah adalah instrumen atau skor jawaban hanya dua, yaitu 1 (satu) dan 0 (nol). Hal yang perlu ditegaskan untuk menghindari kesalahan karena yang dibagi dua kelompok adalah jumlah responden. Oleh karena itu, untuk memudahkan dalam membagi menjadi dua kelompok jumlah butir instrumen harus genap, jangan ganjil karena akan menyulitkan dalam pengelompokan. Kelemahan metode ini adalah membutuhkan waktu dan biaya yang lebih karena harus menyusun dua instrumen dan harus tersedia waktu yang lama untuk mencoba dua kali tes.

b. Instrumen skor non diskrit

Instrumen skor non diskrit adalah instrumen pengukuran yang dalam sistem skoringnya bukan 1 dan 0 (satu dan nol), tetapi bersifat gradual, yaitu ada penjenjangan skor, mulai dari skor tertinggi sampai skor terendah. Hal ini biasanya terdapat pada instrumen tes bentuk uraian dan pilihan ganda, dan instrumen non tes bentuk angket dengan skala likert dan skala lanjutan (rating

scale).

c. Karakteristik Butir Soal

1. Daya Pembeda

Menurut Masidjo (1995: 196) daya beda adalah taraf sampai dimana jumlah jawaban benar dari siswa yang tergolong kelompok atas berbeda dari siswa yang tergolong kelompok bawah untuk suatu item. Suwarto (2013: 108) mengemukakan bahwa daya pembeda suatu butir tes berfungsi untuk menentukan dapat atau tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada pada kelompok itu. Tujuan dari pengujian daya pembeda untuk membedakan antara peserta tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah. Daya pembeda menurut Sudjana (2009: 141) dapat mengkaji butir-butir soal dengan tujuan untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong memiliki prestasi tinggi dengan siswa yang tergolong memiliki prestasi

rendah. Soal tes yang diberikan kepada anak yang mampu, hasilnya menunjukkan prestasi yang tinggi dan bila diberikan kepada siswa yang lemah, hasilnya rendah. Tes dikatakan tidak memiliki daya pembeda apabila tes tersebut, apabila diujikan kepada anak berprestasi tinggi, hasilnya rendah, tetapi bila diberikan kepada anak yang lemah, hasilnya lebih tinggi. Tes yang tidak memiliki daya pembeda, tidak akan menghasilkan gambaran hasil yang sesuai dengan kemampuan siswa yang sebenarnya. Berdasarkan ketiga teori diatas dapat disimpulkan bahwa daya pembeda adalah kemampuan suatu tes untuk membedakan siswa yang mempunyai kemampuan tinggi dan siswa yang memiliki kemampuan rendah.

Cara menghitung daya pembeda adalah dengan menggunakan tabel atau kriteria dari Rose dan Stanley seperti dalam analisis tingkat kesukaran soal. Butir soal yang tidak memiliki daya pembeda diduga terlalu mudah atau terlalu sukar sehingga perlu diperbaiki atau diganti dengan pertanyaan lain (Sudjana, 2009: 144).

2. Tingkat kesukaran

Arikunto (2009: 207) berpendapat bahwa tingkat kesukaran adalah bilangan yang menunjukkan sukar dan mudahnya soal. Semakin tinggi tingkat kesukaran butir soal maka soal semakin mudah. Soal yang baik adalah soal yang tidak terlalu mudah atau terlalu sukar. Tingkat kesukaran soal hendaknya memiliki

keseimbangan yang yang proporsional yaitu soal-soal yang termasuk mudah, sedang, dan sukar (Sulistyorini, 2009: 173).

Sudjana (2009: 135) memaparkan bahwa tingkat kesukaran soal dipandang dari kesanggupan atau kemampuan siswa dalam menjawabnya, bukan dilihat dari sudut guru sebagai pembuat soal. Persoalan yang penting dalam melakukan analisis tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal yang termasuk mudah, sedang, dan sukar. Perbandingan antara soal mudah-sedang-sukar bisa dibuat 3-4-3. Artinya, 30% soal kategori mudah, 40% soal kategori sedang, dan 30% soal kategori sukar. Perbandingan lain yang sejenis dengan proporsi diatas misalnya 3-5-3. Artinya, 30% soal kategori mudah, 50% kategori sedang, dan 20% soal kategori sukar.

Berdasarkan pendapat tiga ahli diatas dapat disimpulkan bahwa tingkat kesukaran soal adalah bilangan-bilangan yang menunjukkan sukar dan mudahnya soal. Soal yang baik harus memenuhi kriteria mudah, sedang dan sukar, bukan dilihat dari guru yang membuatnya tetapi dilihat saat melakukan analisis tingkat kesukaran siswa.

3. Analisis pengecoh

Pengecoh adalah pilihan yang bukan merupakan kunci jawaban. Misalnya, pada soal objektif pilihan ganda dengan empat pilihan a, b, c, d dan kunci jawabannya adalah c maka a, b, d merupakan pengecoh (Purwanto, 2009: 75).

Arikunto (2012: 233) mengemukakan bahwa pengecoh dapat berfungsi dengan baik apabila pengecoh tersebut mempunyai daya tarik yang besar bagi peserta tes yang kurang memahami materi. Berdasarkan pendapat para ahli diatas dapat disimpulkan bahwa pengecoh adalah pilihan jawaban yang bukan merupakan kunci jawaban yang berfungsi sebagai penyesat jawaban.

Dokumen terkait