• Tidak ada hasil yang ditemukan

BAB II KAJIAN TEORI KAJIAN TEORI

K. Langkah-Langkah Pengembangan Tes Hasil Belajar

Menurut Suryabrata (2005: 68), prosedur pengembangan memaparkan langkah-langkah pengembangan tes hasil belajar. Pengembangan instrumen penilaian menurut Suryabrata ada sepuluh langkah, yaitu:

1. Pengembangan Spesifikasi Tes

Spesifikasi tes yang akan dibuat harus menyeluruh, lengkap dan spesifik menunjuk kepada karakteristik tes. Untuk tes hasil belajar, minimal harus spesifik mengenai hal-hal berikut (a) wilayah yang akan dikenai pengukuran, (b) subjek yang akan dites, (c) tujuan testing, (d) materi tes, (e) tipe soal yang akan digunakan, (f) jumlah soal untuk keseluruhan tes dan untuk masing-masing bagian, (g) taraf kesukaran soal dan distribusinya, (h) kisi-kisi tes, (i) cara perakitan, dan (j) rancangan penugasan pada peneliti soal.

2. Penulisan Soal

Penulisan soal merupakan hal yang lazim dilakukan pada tes psikologis. Tes yang baik haruslah terdiri dari soal-soal yang disusun dengan baik. Menulis soal membutuhkan kemampuan-kemampuan khusus, yang harus dikembangkan sampai pada taraf yang memadai. Kemampuan-kemampuan khusus tersebut yaitu (1) penugasan akan mata pengetahuan yang dites, (2) kesadaran akan tata nilai, (4) kemampuan membahas gagasan, (5) penugasan akan teknik penulisan soal, dan (6) kesadaran akan kekuatan dan kelemahan dalam menulis

soal. Kemampuan menulis soal yang baik akan berkembang melalui pengalaman menulis soal.

3. Penelaah Soal

Setelah penulisan soal selesai maka langkah selanjutnya adalah menguji kualitas soal tersebut. Pengujian secara teoritis ini disebut juga penelaahan soal. Untuk menelaah soal ini diperlukan beberapa keahlian, diantaranya: (a) keahlian dalam bidang studi yang diuji, (b) keahlian dalam bidang pengukuran, dan (c) keahlian dalam pembahasan gagasan. Penelaahan soal merupakan evaluasi terhadap soal-soal yang ditelaah oleh ahli. Evaluasi tersebut dilihat dari tiga bidang, yaitu (a) dari segi bidang studi yang diuji, b) dari segi format dan pertimbangan teknis penulisan soal, (c) dari segi penerjemahan gagasan ke dalam bahasa. Penelaahan ini menuntut penguasaan materi bidang studi dan kejelian melihat kesesuaian cakupan antara kumpulan soal dengan spesifikasi tes, dan kejelasan akan konsep dasar.

4. Perakitan Soal (untuk Tujuan Uji Coba)

Setelah soal-soal ditelaah, selanjutnya soal-soal digolongkan ke dalam tiga kategori, yaitu (a) soal-soal yang dianggap baik, maka soal diterima. (b) soal-soal yang dianggap tidak baik, maka soal di tolak, dan (c) soal-soal yang kurang baik, setelah direvisi lalu dapat diterima. Soal-soal yang langsung diterima maupun dengan revisi, merupakan kumpulan soal yang perlu ditata dengan cara tertentu. Hasil perakitan soal ini adalah tes yang secara teori baik dan siap diuji-cobakan untuk

mengetahui apakah tes yang secara teori baik juga baik secara empiris atau tidak.

5. Uji Coba Tes

Langkah berikut setelah perakitan soal yaitu pengumpulan data empiris yang dilakukan melalui uji coba ini sebagai dasar untuk memperbaiki soal dan memilih soal terbaik untuk disusun menjadi tes dalam bentuk akhir sesuai dengan tujuan pengembangan tes.

6. Analisis Butir Soal

Untuk memberi gambaran yang lebih jelas, biasanya karakteristik soal itu dikuantifikasikan ke dalam indeks-indeks statistik. Ada beberapa teknis dan indeks yang digunakan, yaitu taraf kesukaran soal, daya pembeda soal (indeks diskriminasi), dan teknik analisis konfensional, yaitu sebagia berikut.

a. Taraf kesukaran soal

Taraf kesukaran soal yaitu banyaknya soal untuk masing-masing taraf kesukaran, berapa rata-rata taraf kesukaran yang diinginkan. Taraf kesukaran pada tes disusun berdasarkan tujuan tes. Misalnya, tes yang diujikan bertujuan untuk membedakan taraf kemampuan peserta didik dari yang rendah sampai yang tinggi. Oleh karena itu, sebaran taraf kesukaran soal yang disusun lebih luas, agar peserta didik yang pandai tertantang (karena ada soal yang sukar) dan peserta didik yang bodoh masih ada kesempatan untuk mengerjakan (karena ada soal yang mudah).

Indeks kesukaran soal yang paling banyak digunakan adalah taraf kesukaran p, yaitu proporsi banyaknya jawaban benar terhadap semua jawaban (biasanya dalam persen). Rumus indeks kesukaran soal yaitu sebagai berikut.

P = B / T

Keterangan:

P = Indeks kesukaran soal

B = banyaknya subjek yang menjawab benar T = banyaknya subjek yang mengerjakan soal

Indeks kesukaran soal P ini terdapat banyak kelemahan, yaitu a) P sebenarnya ukuran kemudahan soal, semakin tinggi P maka soal semakin mudah begitu sebaliknya semakin rendah P maka soal semakin sukar, dan b) P tidak berhubungan secara linear dengan skala kesukaran soal, namun P sangat berguna untuk memperkirakan rata-rata skor tes, maka P harus dihitung.

d. Daya pembeda soal

Daya pembeda soal diukur dari kesesuaian soal dengan keseluruhan tes untuk mengukur kemampuan peserta didik. Teknik yang sering digunakan untuk mengukur daya pembeda yaitu korelasi antara skor pada soal tertentu, yang merupakan data continue benar dan salah, atau 1 dan 0. Rumus korelasi biserial yaitu sebagai berikut.

rbis =

x

atau

rbis =

x

atau

rbis =

x

Keterangan:

Xb = rata-rata skor kriteria subjek yang memilih jawaban benar Xs = rata-rata skor kriteria subjek yang memilih jawaban salah St = simpangan baku skor kriteria semua subjek

p = proporsi subjek yang menjawab benar terhadap semua subjek

y = ordinat dalam kurva normal yang membagi menjadi p dan – p

q = 1 – p.

Bagian yang ensensial pada rumus diatas adalah perbedaan antara kedua rata-rata dalam perbandingan dengan simpangan baku. Semakin besar perbedaan kedua rata-rata maka semakin tinggi korelasi biserial, berarti semakin tinggi daya pembeda soal.

7. Seleksi dan Perakitan Soal

Setelah statistik soal selesai dihitung maka tahap selanjutnya adalah seleksi soal, yaitu memilih soal-soal yang akan digunakan untuk tes pada tahap terakhir. Menurut model klasik pemilihan soal ini bisa menggunakan dua parameter, yaitu taraf kesukaran (p) dan indeks diskriminatif (rbis). Selain dua parameter tersebut bisa juga menggunakan prosedur yang lain, yaitu sebagai berikut.

Pengembangan tes menggunakan metode analisis soal yang didasarka pada sebagian dari subjek uji coba. Misalnya, kelompok atas (27% tertinggi) dan kelompok bawah (27% terendah) dan kelompok tengah atau sedang (46%) tidak dianalisis. Dalam metode 27% teratas dan 27% terbawah, dibuat perbandingan antara kelompok atas dan kelompok bawah dalam berbagai kemungkinan jawaban.

b. Galat Baku Indeks Diskriminasi

Indeks diskriminasi soal dipengaruhi oleh variasi sampel. Oleh karena itu, sangat penting pengembangan tes mengetahui besarnya fluktuasi agar dapat menentukan besarnya sampel yang diperlukan, agar diperoleh stabilitas sampel dalam kaitan dengan indeks diskriminasi itu. Rumus galat baku koefisien biserial yaitu sebagai berikut.

SErbis

Keterangan:

SErbis = galat baku (standard error of measurement) rbis p = proporsijawaban benar terhadap semua jawaban y = ordinat yang memisahkan distribusi normal menjadi p

dan 1 – p

rbis = koefisien korelasi biserial N = besarnya sampel

Interpretasi galat baku pengukuran koefisien korelasi biserial ini sama dengan interpretasi galat baku pada pengukuran

yang lain. Jadi, jika digunakan taraf alpha = 0,05, maka rbis adalah 95 dari setiap 100 kejadian.

8. Pencetakan Tes

Setelah soal diseleksi berdasarkan hasil analisis butir soal kemudiaan disusun berdasarkan pertimbangan-pertimbangan tertentu, maka pengembangan tes secara substantive telah selesai. Yang perlu dilakukan selanjutnya adalah mencetak tes dengan cara yang baik dan menjamin kualitasnya.

9. Administrasi Tes Bentuk Akhir

Setelah data hasil tes masuk, pengolahan data serta interpretasi hasil pengolahan itu juga perlu dibakukan. Kesulitan yang sering menginterpretasikan skor hasil tes adalah beragamnya skala yang digunakan untuk menyatakan hasil tes tersebut.

Langkah pertama untuk menerjemahkan skor yaitu mendefinisikannya ke dalam skala tertentu, proses ini penskalaan. Langkah kedua yaitu penyediaan norma untuk acuan interpretasi. Proses ini disebut penormaan tes.

10.Penyusunan Skala dan Norma a. Penyusunan skala

Dalam penyusunan skala terdapat beberapa metode, yaitu: 1) Skala skor mentah

Skala skor mentah adalah skala yang tidak mempunyai makna intern dan tidak dapat diinterpretasikan tanpa bantuan data pendukung.

2) Skala persentase penguasaan

Skor yang dilaporkan dalam skala persentase penguasaan ini merupakan pendapat absolut (tidak relatif), bahwa subjek menguasai sekian persen dari bahan belajar yang sedang dipersoalkan.

3) Skala jenjang presentil

Skala jenjang persentil adalah salah satu skala yang sangat luas penggunaannya. Banyak hasil tes yang diselenggarakan dalam skala besar, dilaporkan dalam skala jenjang presentil ini. Skala jenjang persentil menunjukan berapa persen individu-individu dari kelompok tertentu yang mempunyai skor di bawah titik tengah setiap skor atau interval skor.

6) Skor baku

Dalam menghitung simpangan baku bisa menggunakan rumus sebagai berikut.

Sb = Sbz + Xb Keterangan: Sb = skor baku

Sbz = simpangan baku ayng diinginkan Xb = rata-rata yang diinginkan

b. Penyusunan norma

Pedoaman umum dalam penyusunan norma yaitu sebagai berikut. 1) Karakteristik yang diukur oleh tes hendaknya memungkinkan

penentuan urutan pengambilan tes dari rendah ke tinggi.

2) Tes yang digunakan harus mencerminkan definisi operasional karakteristik yang dipersoalkan.

3) Sebaran skor yang dihasilkan oleh tes, dari yang terendah sampai ke yang tinggi, hendaknya mengevaluasi karakteristik psikologis yang sama.

4) Kelompok yang digunakan sebagai dasar penyusunan statistik deskriptif harus sesuai dengan tesnya dan tujuan tes.

5) Data hendaknya tersedia untuk kelompok-kelompok yang relevan.

Dari paparan di atas dapat diketahui bahwa terdapat 10 langkah pengembangan instrumen penilaian, yaitu pengembangan spesifikasi tes, penulisan soal, penelahaan soal, perakitan soal, uji coba tes, analisis butir soal, seleksi dan perakitan soal, pencetakan tes, administrasi tes bentuk akhir, penyusutan skala dan norma.

Dokumen terkait