• Tidak ada hasil yang ditemukan

Staff Site Universitas Negeri Yogyakarta

N/A
N/A
Protected

Academic year: 2017

Membagikan "Staff Site Universitas Negeri Yogyakarta"

Copied!
24
0
0

Teks penuh

(1)

Pekanbaru, 14 November 2013

______________________________________

PENILAIAN HASIL PEMBELAJARAN

Oleh: Prof. Djemari Mardapi, Ph.D*)

(2)

A. Prinsip Dasar Penilaian dan Evaluasi

Penilaian atau asesmen merupakan rangkaian kegiatan dalam melaksanakan pembelajaran di pendidikan dasar dan menengah, dan pendidikan tinggi. Kegiatan pendidik atau dosen dalam melaksanakan pembelajaran melalui tiga tahapan, yaitu persiapan, pelaksanaan, dan penilaian. Untuk melaksanakan kegiatan tersebut dengan baik, pendidik harus memiliki kompetensi merancang proses pembelajaran, melaksanakan proses pembelajaran, dan menilai proses dan hasil pembelajaran.

Ada empat istilah yang sering digunakan berkaitan dengan kegiatan penilaian yaitu pengukuran, pengujian, penilaian, dan evaluasi. Pertama adalah pengukuran, yaitu penetapan angka terhadap suatu objek atau gejala dengan cara yang sistematik (Allen & Yen, 1979). Akurasi penetapan angka ini ditentukan oleh kualitas instrumen dan cara menggunakan instrumen ini, yang kemungkinan memiliki kesalahan pengukuran (Johnson & Johnson: 2, 2003). Kesalaan pengukuran ini bisa disebabkan oleh alat ukur, objek yang diukur, subjek yang mengukur, dan lingkungan pengukuran. Kesalahan ini ada yang bersifat acak dan ada yang sistematik. Kesalahan yang bersifat acak ini dapat diestimasi dengan menggunakan beberapa asumsi, sedang kesalahan yang sistematik sulit diestimasi besarnya, hanya arahnya yang kemungkinan dapat diduga.

(3)

Keempat adalah evaluasi, yaitu merupakan salah satu rangkaian kegiatan dalam meningkatkan kualitas, kinerja, atau produktivitas suatu lembaga dalam melaksanakan programnya. Kagiatan evaluasi sering menggunakan judgment

terhadap hasil suatu penilaian. Bila hasilnya bagus terus dan bila tidak baik berhenti, atau walau hasilnya kurang baik program terus dilaksanakan dengan melakukan perbaikan-perbaikan, karena termasuk program prioritas utama.

Melalui evaluasi akan diperoleh informasi tentang apa yang telah dicapai dan mana yang belum, dan selanjutnya informasi ini digunakan untuk perbaikan suatu program. Menurut Tyler (1950), evaluasi adalah proses penentuan sejauh mana tujuan pendidikan telah tercapai. Evaluasi menurut Griffin & Nix (1991) adalah judgment

terhadap nilai hasil pengukuran atau implikasi dari hasil pengukuran. Tyler menekankan pada pencapaian tujuan suatu program, sedang Griffin & Nix lebih menekankan pada penggunaan hasil penilaian. Kegiatan penilaian dan evaluasi memerlukan data hasil pengukuran

Alat ukur yang sering digunakan untuk mengumpulkan data bisa berupa tes dan nontes. Tes yang baik harus mewakili domain yang diukur dan mengukur tingkat berfikir yang tepat. Domain yang diukur ini adalah bahan ajar yang dapat dilihat pada silabus mata pelajaran. Informasi yang akurat berasal dari sejumlah pengukuran, yaitu yang dilaksanakan sepanjang semester. Bentuknya bisa berupa tugas, ulangan mingguan, dan ulangan pertengahan dan ulangan akhir semester. Dengan demikian pencapaian belajar peserta didik pada suatu bidang studi dapat diketahui.

Alat ukur yang digunakan harus diusahakan agar memberikan data yang sahih (valid) dan andal (reliable) Sahih berkaitan dengan sampel bahan ajar yang diujikan, karena waktu untuk ujian sangat terbatas, khususnya ujian pertengahan semester dan akhir semester. Andal berkaitan dengan kesalahan pengukuran, yang sering dinyatakan dengan koefisien keandalan.

(4)

atau kuesioner. Hasil penilaian ketiga ranah tersebut akan memberikan informasi tentang kompetensi peserta didik. Informasi ini diperlukan untuk merancang program perbaikan atau remedi

B. Hasil Pembelajaran

Hasil Pembelajaran yang diharapkan dari peserta didik disebut standar kompetensi lulusan. Standar kompetensi ini mencakup tiga aspek, yaitu aspek kognitif, aspek psikomotor, dan aspek afektif. Aspek atau ranah kognitif berkaitan dengan kemampuan berpikir, dan menurut Anderson dan Krathwohl (2001) ada enam kategori dimensi proses kognitif, yaitu pengingatan, pemahaman, aplikasi, analisis, evaluasi, dan kreasi. Pengingatan adalah menghapal pengetahuan yang relevan dalam memori jangka panjang. Pada tingkat pemahaman mahasiswa membangun makna dari pesan pembelajaran melalui lisan, tertulis, dan/atau komunikasi grafik. Aplikasi adalah menerapkan pengetahuan atau menggunakan suatu prosedur dalam suatu situasi baru. Analisis adalah menguraikan materi ke dalam beberapa bagian dan menentukan bagaimana masing-masing bagian berhubungan satu dengan lainnya, dan terhadap keseluruhan struktur. Evaluasi adalah kegiatan membuat judgment berdasarkan suatu kriteria atau standar. Terakhir, kreasi adalah kegiatan menyatukan semua elemen untuk membentuk suatu yang koheren dan menjadi suatu atau menyusun elemen-elemen menjadi bentuk pola yang baru atau struktur yang baru.

Kemampuan berpikir peserta didik menurut Marzano dan Kendall (1996) berdasarkan tingkatannya adalah memahami dan menerapkan konsep yang ada dalam suatu mata pelajaran. Kategori yang rendah adalah memahami sedang yang tinggi adalah menerapkan dalam berbagai situasi. Untuk mencapai kemampuan yang lebih tinggi, peserta didik harus melalui tingkat berpikir di bawahnya terlebih dahulu.

(5)

mencakup keputusan bahwa tiap orang hanya memiliki satu suara dalam suatu pemilihan. Pengetahuan deklaratif terbatas pada paham akan suatu konsep.

Pengetahuan prosedural menuntut peserta didik mampu menerapkan konsep-konsep yang ada dalam suatu mata pelajaran. Pengetahuan tingkat ini menuntut tingkat berpikir peserta didik yang lebih tinggi dibanding pengetahuan deklaratif. Oleh karena itu dalam mengembangkan sistem pengujian, pengetahuan deklaratif dan pengetahuan prosedural harus tampak.

Menurut Kratwohl (1964) proses internalisasi ranah afektif melalui lima tingkatan, yaitu penerimaan, pemberian respon, penilaian, pengorganisasian, dan karakterisasi. Penilaian pencapaian kompetensi pada ranah ini ditempuh melalui pengmatan sehari-hari. Perubahan pada ranah ini tidak bisa cepat, tetapi melalui proses panjang. Untuk itu pendidik harus menyusun rencana pembelajaran pada aspek afektif ini, kemudian dilakukan pengamatan yang hasilnya digunakan untuk perbaikan.

Berkenaan dengan ranah afektif, kompetensi yang ingin dicapai meliputi tingkatan pemberian respon (responding), apresiasi (appreciating), penilaian (valuing), dan internalisasi (internalization). Pengalaman belajar yang relevan dengan berbagai jenis tingkatan afektif tersebut antara lain: berlatih memberikan respon atau reaksi terhadap nilai-nilai yang dihadapkan kepadanya, berlatih menikmati atau menerima nilai, norma, serta objek yang mempunyai nilai etika dan estetika; berlatih menilai ditinjau dari segi baik buruk, adil tidak adil, indah tidak indah terhadap objek studi; berlatih menerapkan/mempraktekkan nilai, norma, etika dan estetika dalam perilaku kehidupan sehari-hari. Secara kongkrit, pengalaman belajar yang perlu dilakukan agar peserta didik mencapai berbagai tingkatan kompetensi afektif tersebut antara lain dengan mengamati dan menirukan perilaku contoh/model/panutan, mendatangi objek studi yang dapat memupuk pertumbuhan nilai, berbuat atau berpartisipasi aktif sesuai dengan tuntunan nilai yang dipelajari.

(6)

dengan demonstrasi yang dilakukan pendidik. Peserta didik pada kegiatan demonstrasi adalah memperhatikan sembil menirukan gerak. Ada peserta didik yang mampu belajar sampai tingkat tinggi, tetapi ada yang tidak, tergantung pada bakat peserta didik.

Berkenaan dengan ranah psikomotorik, kompetensi yang dicapai meliputi tingkatan gerakan awal, semi rutin, gerakan rutin. Untuk mencapai kompetensi tersebut, pengalaman belajar yang perlu dilakukan antara lain: pada tingkatan penguasaan gerakan awal, peserta didik perlu berlatih menggerakkan sebagian anggota badan, pada tingkatan gerakan semi rutin, peserta didik berlatih, mencoba, atau menirukan gerakan yang melibatkan seluruh anggota badan. Pada tingkatan gerakan rutin peserta didik melakukan gerakan secara menyeluruh dengan sempurna sampai pada tingkatan otomatis. Pengalaman belajar yang umum dilakukan untuk mencapai ketiga tingkatan tersebut adalah berlatih dengan frekuensi tinggi dan intensif (drill), menirukan, mensimulasikan, mendemonstrasikan gerakan yang ingin dikuasai. Misalnya, peserta didik sekolah penerbang mensimulasikan cara menerbangkan pesawat dengan menggunakan simulator pesawat.

C. Kualitas Instrumen

Kualitas instrumen alat ukur dapat dilihat pada bukti kesahihan (validity), dan besarnya koefisien keandalan (reliability). Ada tiga kesahihan alat ukur, yaitu kesahihan konstruk, kesahihan isi, dan kesahihan terkait kriteria. Bukti kesahihan konstrak alat ukur dilihat dari teori yang digunakan dan dimensi yang diukur. Pada umumnya dimensi yang diukur adalah satu. Bukti kesahihan isi dilihat dari kesesuaian antara materi yang diujikan dan yang diajarkan, yaitu yang terdapat pada kurikulum Kesahihan terkait kriteria merupakan hubungan antara prediktor dan kriteria. Prediktor pada suatu sistem pengujian adalah tes masuk, sedang kriterianya adalah keberhasilan belajar atau keberhasilan kerja.

(7)

yang dapat digunakan untuk mencari besarnya koefisien keandalan Perbedaan formula disebabkan asumsi yang digunakan berbeda. Oleh karena itu sebelum menghitung koefisein keandalan alat ukur, diteliti dulu asumsi yang digunakan.

Alat ukur yang komparabel adalah yang hasil pengukurannya dapat dibandingkan antar tempat dan waktu. Komparabel bisa dicapai apabila digunakan kisi-kisi sama, tujuan sama, dan skala yang sama. Apabila diperoleh skala yang sama, maka hasil pengukuran tiap peserta didik dapat dibandingkan. Prinsip ini diterapkan dengan menggunakan bank soal. Butir-butir yang ada dalam bank soal telah dikalibraasi, yaitu telah memiliki parameter butir. Parameter butir berupa tingkat kesulitan dan daya beda butir.

Alat ukur yagn digunakan harus feasible, yaitu dapat diterapkan di satuan pendidikan. Penerapan alat ukur dilihat dari relatif efisiensi suatu alat ukur. Relatif efisiensi dilihat dari informasi yang diperoleh. Apabila jumlah butir dua alat ukur yang mengukur hal yang sama, maka yang dipilih adalah yang lebih sedikit jumlah butirnya tepati infromasinya sama dengan jumlah butir yang banyak. Oleh karena itu dalam mengembangkan sistem penilaian perlu ditelaah kemungkinan penggunaan instrument di satuan pendidikan.

D. Acuan Norma dan Kriteria

Ada dua acuan yang digunakan untuk menafsirkan hasil tes, yaitu acuan norma dan kriteria. Kedua acuan ini menggunakan asumsi yang berbeda. Penafsiran hasil tes kedua acuan ini berbeda sehingga menghasilkan informasi yang berbeda maknanya. Pemilihan acuan yang tepat ditentukan oleh karakteristik bidang studi dan kurikulum yang digunakan

(8)

Acuan kriteria berasumsi bahwa hampir semua orang bisa belajar apa saja namun waktunya yang berbeda. Konsekuensi acuan ini adalah adanya program remedi dan program pengayaan, bagi yang belum mencapai kriteria harus belajar lagi melalui program remedyi, sedang yang telah mencapai kriteria mengikuti program pengayaan. Penafsiran sekor hasil tes selalu dibandingkan dengan kriteria yang telah ditetapkan lebih dahulu. Hasil tes dinilai lulus atau tidak. Lulus berarti bisa melakukan, tidak lulus berarti belum bisa melakukan. Acuan ini digunakan pada kurikulum berbasis kompetensi, karena jelas apa yang akan diukur.

Asesmen hasil pembelajaran peserta didik dilakukan oleh pendidik untuk memantau proses dan hasil pembelajaran peseerta didik, yang selanjutnya digunakan untuk menyusun program perbaikan atau remedi. Asessmen kategori ini termasuk pada asesmen formatif. Menurut Cowie dan Bell (1999), asesmen formatif adalah proses yang digunakan oleh pendidik dan peserta didik untuk mengetahui dan merespon pencapaian belajar peserta didik dengan tujuan untuk menguatkan selama aktivitas belajar berlangsung. Jadi wewenang dosen adalah melakukan asesmen selama pembelajaran berlangung dengan tujuan untuk memperbaiki proses pembelajaran agar tujuan pembelajaran atau standar kompetensi tercapai.

Menurut Clarke (2005), asesmen formatif terdiri atas empat elemen dasar, yaitu: (1) tujuan pembelajaran, (2) pertanyaan yang efektif, (3) evaluasi peer-diri, (4) umpan balik yang efektif. Keempat elemen ini terjadi selama pembelajaran berlangsung, agar tujuan atau kompetensi yang ingin dicapai dapat dicapai peserta didik. Dosen atau pendidik dalam melaksanakan proses pembelajaran harus memperhatikan bagaimana peserta didik belajar. Hal ini berarti bahwa pendidik harus selalu mencari strategi mengajar yang memudahkan peserta didik belajar. Proses ini berlangsung selama kegiatan belajar mengajar, yaitu yang merupakan kegiatan asesmen formatif.

(9)

tes ini sebenarnya bukan untuk menentukan keberhasilan belajar semata, tetapi untuk mengetahui keberhasilan proses pembelajaran.

Tes sumatif diberikan di akhir suatu pelajaran, atau akhir jenjang pendidikan. Menurut Griffin dan Nix (1991: 269), asesmen sumatif adalah asesmen penentuan final yang umumnya tidak berkaitan dengan penyempurnaan pembelajaran. Sebagai contoh adalah grade yang diberikan atas unjuk kerja peserta didik oleh penguji eksternal untuk pengakuan. Asesmen sumatif menggunakan tes sumatif yang hasilnya digunakan untuk menentukan keberhasilan belajar peserta didik untuk mata pelajaran tertentu atau semua mata pelajaran. Tingkat keberhasilan ini dinyatakan dengan sekor atau nilai, pemberian sertifikat, dan sejenisnya. Tingkat kesukaran soal pada tes sumatif bervariasi, sedang materinya harus mewakili bahan yang diajarkan. Hasil tes bisa ditafsirkan sebagai keberhasilan belajar, keberhasilan mengajar, serta keduanya.

E. Metode Penilaian

Metode penilaian adalah cara yang dapat dilakukan untuk menunjukkan tingkat pencapaian belajar peserta didik. Metode penilaian yang dapat digunakan adalah sebagai berikut.

1. Kuis: Waktu ujian singkat kurang lebih 15 menit dan hanya menanyakan hal-hal yang prinsip saja dan bentuknya berupa isian singkat. Biasanya dilakukan sebelum pelajaran dimulai untuk mengetahui penguasaan pelajaran yang lalu secara singkat. Kuiz bisa juga dilakukan di akhir pelajaran untuk mengetahui pemahaman peserta didik, dan bila ada yang belum dikuasai dijelaskan kembali secara singkat. .

(10)

3. Ulangan harian: Ulangan harian dilakukan secara periodik misalnya empat minggu sekali. Bentuk soal yang digunakan sebaiknya bentuk uraian objektif atau yang nonobjektif. Tingkat berpikir yang terlibat sebaiknya mencakup pemahaman, aplikasi, dan analisis.

4. Tugas individu: Tugas ini dapat diberikan setiap minggu dengan bentuk soal uraian objektif atau nonobjektif. Tingkat berpikir yang terlibat sebaiknya aplikasi, analisis, bila mungkin sampai pada evaluasi.

5. Tugas kelompok: Tugas ini digunakan untuk menilai kemampuan kerja kelompok. Bentuk soal yang digunakan adalah uraian dengan tingkat berpikir yang tinggi yaitu aplikasi sampai evaluasi. Bila mungkin peserta didik diminta untuk menggunakan data sungguhan atau melakukan pengamatan terhadap suatu gejala, atau merencanakan sesuatu

projek. Kerja Projek pada umumnya menggunakan data sungguhan dari lapangan.

6. Ujian mid semester: Bentuk soal yang dipakai dapat berupa campuran pilihan ganda dan uraian, atau semuanya bentuk uraian. Materi yang diujikan berdasar kisi-kisi soal. Tingkat berpikir yang terlibat mulai dari pemahaman sampai pada evalusi.

7. Ujian semester: Bentuk soal yang dipakai dapat berupa campuran pilihan ganda dan uraian, atau semuanya bentuk uraian. Materi yang diujikan berdasar pada kisi-kisi soal, dan tingkat berpikir yang terlibat mulai dari pemahaman sampai pada evaluasi.

Tingkat berpikir yang telibat dalam sistem ujian mencakup pengetahuan deklaratif dan pengetahuan prosedural. Deklaratip berisi tentang konsep, prinsip, dan fakta-fakta, sedang prosedural mencakup proses, strategi, aplikasi, dan ketrampilan.

F. Bentuk Tes

(11)

oleh subjektivitas pemberi skor. Dengan kata lain dapat dikatakan bahwa tes yang objektif adalah yang sistem penskorannya objektif, sedang tes yang nonobjektif sistem penskorannya dipengaruhi oleh subjektivitas pemberi skor.

Ada beberapa bentuk soal ujian yang dapat digunakan, seperti berikut ini. 1. Pertanyaan lisan di kelas: pertanyaan lisan di kelas pada

umumnya ditujukan pada kelompok, namun bisa individu dan dilakukan pada saat pembelajaran di kelas berlangsung atau bisa juga di awal pelajaran untuk materi pelajaran yang lalu, atau di akhir pelajaran untuk materi pelajaran hari itu. Peserta didik yang dipilih untuk ditanya harus mewakili karakterisik kemampuan individu di kelas. Bila ada konsep yang belum diketahui sebagian besar peserta didik, maka pendidik harus menjelaskan kembali dan bisa disertai dengan pemberian tugas. Pertanyaan lisan dilakukan dengan menggunakan teknik bertanya yang baik agar semua peserta didik berpikir.

2. Pilihan ganda: bentuk ini bisa mencakup banyak materi pelajaran, penskorannya objektif, dan bisa dikoreksi denga komputer. Namun membuat butir soal pilihan ganda yang berkualitas cukup sulit, dan kelemahan lain adalah peluang kerja sama antar peserta tes sangat besar. Oleh karena itu, bentuk ini dipakai untuk ujian yang melibatkan banyak peserta didik dan waktu untuk koreksi sedikit. Penggunaan bentuk ini menuntut agar pengawas ujian harus teliti daalam melakukan pengawasan saat ujian berlangsung. Tingkat berpikir yang diukur bisa tinggi tergantung pada kemampuan pembuat soal.

(12)

berbeda asal memiliki latar belakang pendidikan sesuai dengan mata ujian. Tingkat berpikir yang diukur bisa sampai pada tingkat yang tinggi.

4. Uraian nonobjektif / uraianbebas: bentuk ini cocok untuk mengukur kemmapuan berpikir divergence. Walau hasil penskoran cenderung subjektif, namun bila disediakan pedoman penskoran, sehingga hasilnya diharapkan dapat lebih objektif. Tingkat berpikir yang diukur bisa tinggi, namun cakupa nmateri yang diujikan terbatas.

5. Jawab singkat atau isian singkat: bentuk ini cocok digunakan untuk mengetahui tingkat pengetahuan dan pemahaman peserta didik. Jumlah materi yang diuji bisa banyak, namun tingkat berpikir yang diukur cenderung rendah.

6. Menjodohkan: bentuk ini cocok untuk mengatahui tentang fakta, konsep. Cakupan materi bisa banyak, namun tingkat berpikir yang terlibat cenderung rendah.

7. Unjuk kerja: bentuk ini cocok untuk mengukur kemampuan seseorang dalam melakukan tugas tertentu, seperti praktek di laboratorium. Peserta tes diminta untuk mendemonstrasikan kemampuan dalam bidang tertentu.

8. Portfolio: bentuk ini cocok untuk mengetahui perkembangan unjuk kerja peserta didik, dengan menilai kumpulan karya-karya, atau tugas-tugas yang dikerjakan peserta didik. Portfolio berarti kumpulan karya atu tugas-tugas yang dikerjakan peserta didik. Karya-karya ini dipilih kemudian dinilai, sehingga dapat dilihat perkembangan kemampuan peserta didiik.Cara ini bisa dilakukan dengan baik bila jumlah peserta didik yang dinilai tidak banyak.

G. Kesahihan dan Keandalan Tes

Suatu tes yang baik harus memiliki bukti kesahihan dan keandalan, hasilnya dapat dibandingkan, dan ekonomis. Kesahihan tes dapat dikategorikan menjadi tiga, yaitu kesahihan isi, konstruk, dan kriteria. Kesahihan isi dilihat dari bahan yang diujikan, kesahihan konstruk dilihat dari definisi atau teori yang diukur, dan kesahihan kreteria dilihat dari daya prediksinya.

(13)

sebelum tes digunakan. Kesahihan konstruk diperoleh dari hasil analisis faktor, yaitu jumlah faktor yang diukur suatu tes. Bukti kesahihan konstruk diperoleh dari hasil penggunaan tes, yaitu data empirik. Kesahihan prediktif juga memerlukan data empirik untuk dapat menghitung besarnya daya prediksi.

Keandalan suatu tes memberikan informasi tentang besarnya kesalahan pengukuran. Kehandalan suatu tes dapat dikategorikan menjadi tiga, yaitu konsisten internal, stabilitas, dan antar penilai. Besarnya indeks konsistensi internal diperoleh dari data hasil uji coba atau data hasil tes. Untuk mencari indeks ini cukup dilakukan satu kali tes. Indeks stabilitas merupakan tingkat kestabilan hasil pengukuran yang dilakukan paling tidak dua kali untuk orang yang sama dalam waktu yang berbeda, dengan asumsi tidak ada efek tes. Keandalan antar penilai diperoleh dari besarnya korelasi hasil pensekoran dari dua orang terhadap lembar jawaban tes yang sama. Besarnya indeks keandalan ini adalah 0 sampai 1,0 dan yang dapat diterima minimum 0,70.

Indek keandalan digunakan untuk menghitung besarnya kesalahan pengukuran. Kesalahan pengukuran ini ada dua, yaitu acak dan sistematik. Acak berarti kesalahan karena kondisi yang diukur dan yang mengukur bervariasi dan pemilihan bahan yang diujikan, sedang yang sistematik karena alat ukurnya atau cara pensekoran yang cenderung murah atau mahal untuk semua peserta didik.

Besarnya kesalahan pengukuran dapat dihitung dengan formula berikut ini:

Se = Sx √ (1- ρxx’ )

Se adalah besarnya kesalahan pengukuran, Sx adalah simpangan baku sekor, dan ρxx’ adalah indeks keandalan tes. Formula di atas menunjukkan bahwa

(14)

Se = 4 √ (1- 0,70 ) = 2,20, jadi bila si Ali mendapat skor 7,0 dan Budi mendapat skor 5,0 Skor Ali sebenarnya adalah 7,0 ± 2,2 = 4,8 sampai dengan 9,8, sedang skor Budi sebenarnya adalah 5,0 ± 2,20 = 2,80 sampai dengan 7,20, untuk interval kepercacyaan 68 %. Berdasarkan rentang skor sebenanrya, maka dapat disismpulkan bahwa kemampuan Ali dan Budi tidak berbeda, perbedaan yang ada karena keaslahan pengukuran.

H. Pembuatan Tes

Ada sepuluh langkah yang harus ditempuh dalam mengembangkan tes hasil belajar atau prestasi belajar, yaitu: (1) menyusun spesifikasi tes, (2) menulis soal tes, (3) mentelaah soal tes, (4) melakukan ujicoba tes, (5) menganalisis butir soal, (6) memperbaiki tes, (7) merakit tes, ( 8) melaksanakan tes, (9) menafsirkan hasil tes., (10) melaporkan hasil tes.

1. Menyusun Spesifikasi Tes

Langkah awal dalam mengembangkan tes adalah menetapkan spesifiksi tes, yaitu yang berisi tentang uraian yang menunjukkan keseluruhan karakteristik yang harus dimiliki suatu tes. Spesifikasi yang jelas akan mempermudah dalam menulis soal, dan siapa saja yang menulis soal akan menghasilkan tingkat kesulitan yang relatif sama. Penyusunan spesifikasi tes mencakup kegiatan berikut ini: (a) menentukan tujuan tes, (b) menyusun kisi-kisi tes, (c) memilih bentuk tes, (d) menentukan panjang tes, dan (e) menulis tes.

Ditinjau dari tujuannya ada empat macam tes yang banyak digunakan di lembaga pendidikan, yaitu: (a) Tes penempatan, (b) Tes diagnostik, (c) Tes formatif, (d) Tes sumatif.

a. Menentukan Tujuan Tes

(15)

Apakah seseorang perlu matrikulasi, tambahan pelajaran atau tidak, ditentukan dari hasil tes ini.

Tes diagnostik berguna untuk mengetahui kesulitan belajar yang dihadapi mahasiswa, termasuk kesalahan pemahaman konsep. Tes ini dilakukan apabila diperoleh informasi bahwa sebagian besar mahasiswa gagal dalam mengikuti proses pembelajaran matakuliah tertentu. Hasil tes ini memberikan informasi tentang konsep-konsep yang belum dipahami dan yang telah dipahami. Oleh karena itu tes ini berisi materi yang dirasa sulit oleh mahasiswa, namun tingkat kesulitan tes ini cenderung rendah.

Tes formatif bertujuan untuk memperoleh masukan tentang tingkat keberhasilan pelaksanaan proses pembelajaran. Masukan ini berguna untuk memperbaiki strategi mengajar. Tes ini dilakukan secara periodik sepanjang semester. Materi tes dipilih berdasarkan kompetensi tiap pokok bahasan atau subpokok bahasan.

Tes sumatif diberikan di akhir suatu pelajaran, atau akhir semester. Hasilnya untuk menentukan keberhasilan belajar mahasiswa untuk mata kuliah tertentu. Tingkat keberhasilan ini dinyatakan dengan skor atau nilai, pemberian sertifikat, dan sejenisnya. Tingkat kesukaran soal pada tes sumatif bervariasi, sedang materinya harus mewakili bahan yang diajarkan. Hasil tes bisa ditafsirkan sebagai keberhasilan belajar, keberhasilan mengajar, serta keduanya.

b. Menyusun Kisi-Kisi

Kisi-kisi merupakan tabel matrik yang berisi spesifikasi soal-soal yang akan dibuat. Kisi-kisi ini merupakan acuan bagi penulis soal, sehingga siapapun yang menulis soal akan menghasilkan soal yang isi dan tingkat kesulitannya relatif sama. Matrik kisi-kisi soal terdiri dari dua jalur, yaitu kolom dan baris. Kolom menyatakan tujuan pelajaran, pokok dan subpokok bahasan, uraian materi, dan indikator, sedang baris menyatakan tujuan akan yang akan diukur atau diujikan.

Ada tiga langkah dalam mengembangkan kisi-kisi tes, yaitu: 1) menulis standar kompetensi dan kompeteni dasar

2) membuat daftar pokok bahasan dan subpokok bahasan yang akan diujikan 3) menentukan indikator

(16)

Sumber utama standar kompetensi dan kompetensi dasar adalah adalah silabus matakuliah. Pemilihan kompetensi dasar yang akan diujikan berdasarkan pada tingkat kepentingan, yaitu: konsep dasar, konsep yang berkelanjutan, dan yang mengandung nilai aplikasi yang tinggi. Kompetensi dasar yang ingin dicapai disertai informasi tentang pokok dan subpokok bahasan yang diuraikan dalam bentuk indikator. Pada saat menentukan indikator-indikator yang dapat diukur digunakan buku teks sebagai bahan acuan. Hal ini dimaksudkan untuk mengurangi penyimpangan-penyimpangan dalam memilih bahan agar memenuhi persyaratan kesahihan isi.

Jumlah soal yang digunakan tergantung pada waktu yang tersedia untuk tes dan materi yang akan diujikan. Pemilihan materi tes pada umumnya dilakukan dengan melakukan pemilihan sampel, materi yang banyak dan komplek dipilih lebih banyak dibanding dengan materi yang mudah dan sederhana.

c. Menentukan Bentuk Tes

Bentuk tes yang objektif yang sering digunakan adalah bentuk pilihan ganda, benar salah, menjodohkan, dan uraian objektif Tes uraian yang objektif digunakan pada bidang sain dan teknologi atau bidang sosial yang jawaban soalnya sudah pasti, dan hanya satu jawaban yang benar. Tes uraian nonobjektif digunakan untuk mengukur kemampuan divergence peserta didik, yaiu kemampuan berpikir divergence, yaitu yang jawabannya berdasarkan penalaran dan argumentasi peserta didik

Pemilihan bentuk tes yang tepat ditentukan oleh tujuan tes, jumlah peserta tes, waktu yang tersedia untuk memeriksa lembar jawaban tes, cakupan materi tes, dan karakteristik matakuliah yang diujikan. Bentuk tes pilihan ganda dan bentuk tes benar salah sangat tepat digunakan bila jumlah peserta tes banyak, waktu koreksi singkat, dan cakupan materi yang diujikan banyak. Kelebihan tes objektif bentuk pilihan adalah lembar jawaban dapat diperiksa dengan komputer, sehingga objektivitas penskoran dapat dijamin. Namun membuat tes objektif yang baik tidak mudah.

(17)

sebagainya. Soal pada tes ini jawabannya hanya satu, mulai dari memilih rumus yang tepat, memasukkan angka dalam rumus, menghitung hasil, dan menafssrkan hasilnya. Pada tes bentuk uraian objektif ini, sistem penskoran dapat dibuat dengan jelas dan rinci.

1) Tes Lisan di Kelas

Pertanyaan lisan dapat digunakan untuk mengetahui taraf serap mahasiswa untuk masalah yang berkaitan dengan kognitif. Pertanyaan lisan yang diajukan ke kelas harus jelas, dan semua mahasiswa harus diberi kesempatan yang sama. Dalam melakukan pertanyaan di kelas prinsipnya adalah: mengajukan pertanyaan, memberi waktu untuk berpikir, kemudian menunjuk mahasiswa untuk menjawab pertanyaan. Baik benar atau salah jawaban mahasiswa, jawaban tersebut ditawarkan lagi ke kelas untuk mengaktifkan kelas.Tingkat berpikir untuk pertanyaan lisan di kelas cenderung rendah, seperti pengetahuan dan pemahaman.

2) Tes Bentuk Benar Salah

Tes bentuk tes benar salah terdiri dari suatu pernyataan yang harus dijawab benar atau salah. Bentuk tes ini singkat sehingga bisa mencakup banyak materi yang akan diujikan. Keunggulan yang lain, tes ini relatif mudah membuatnya dan mudah dalam penskorannya. Kelemahan dari tes ini adalah kecenderungan pada pertanyaan hapalan dan pemahaman saja dan peluang dugaan besar. Rasional penggunaan tes ini adalah ( Ebel, 1979):

a) Esensi pencapaian tujuan pendidikan dapat dinyatakan dalam bentuk pengetahuan verbal.

b) Semua bentuk pengetahuan verbal dapat dinyatakan dengan proposisi. c) Suatu proposisi adalah suatu pernyataan yang dapat dinyatakan benar atau

salah.

d) Tingkat pengetahuan seseorang dalam bidang tertentu dapat dilihat dari respons terhadap suatu proposisi.

(18)

Bentuk tes menjodohkan terdiri dari sejumlah premis dan sejumlah respons. Bentuk tes ini sering digunakan untuk mengukur pengetahuan tentang fakta seperti arti suatu istilah, simbol kimia, dan sejenisnya. Oleh karena itu bentuk tes ini cenderung mengukur tentang hapalan dan pemahaman saja. Pedoman untuk membuat tes bentuk menjodohkan adalah:

a) Pernyataan atau premis harus homogen. b) Pernyataan dan respons singkat.

c) Jumlah respons lebih banyak dari pernyataan. d) Pernyataan dan respons diurutkan menurut alpabet. e) Jawaban dapat digunakan lebih dari satu kali.

4) Bentuk Pilihan Ganda

Pedoman utama dalam pembuatan butir soal bentuk pilihan ganda (Ebel, 1977) adalah:

a) Pokok soal harus jelas.

b) Pilihan jawaban homogen dalam arti isi. c) Panjang kalimat pilihan jawaban relatif sama. d) Tidak ada petunjuk jawaban benar.

e) Hindari mengggunakan pilhan jawaban: semua benar atau semua salah. f) Pilihan jawaban angka diurutkan.

g) Semua pilihan jawaban logis. h) Jangan menggunakan negatif ganda.

i) Kalimat yang digunakan sesuai dengan tingkat perkembangan peserta tes.

j) Bahasa Indonesia yang digunakan baku.

k) Letak pilihan jawaban benar ditentukan secara acak.

5) Bentuk Uraian Objektif

(19)

prosedur atau langkah-langkah tertentu.Setiap langkah ada skornya. Objektif di sini dalam arti apabila diperiksa oleh beberapa dosen dalam bidang studi tersebut hasil penskorannya akan sama. Pertanyaan pada bentuk soal ini di antaranya adalah : hitunglah, tafsirkan, buat kesimpulan dan sebagainya.

6) Bentuk Uraian Non-objektif

Bentuk tes ini dikatakan non-objektif karena penilaian yang dilakukan cenderung dipengaruhi subjektivitas dari penilai.Bentuk tes ini menuntut kemampuan mahasiswa untuk menyampaikan, memilih, menyusun, dan memadukan gagasan atau ide yang telah dimilikinya dengan menggunakan kata-katanya sendiri.Keunggulan bentuk tes ini dapat mengukur tingkat berpikir dari yang rendah sampai yang tinggi, yaitu mulai dari hapalan sampai dengan evaluasi. Namun demikian, sebaiknya hindarkan pertanyaan yang mengungkap hafalan seperti dengan pertanyaan yang dimulai dengan kata : apa, siapa, di mana.

Bentuk tes uraian non objektif relatif mudah membuatnya. Kelemahan dari bentuk tes ini adalah : (1) materi yang diujikan terbatas, (2) penskoran sering dipengaruhi oleh subjektivitas penilai, (3) memerlukan waktu yang lama untuk memeriksa lembar jawaban, dan (4) cakupan materi yang diujikan sangat terbatas, (4) dan adanya efek bluffing. Untuk menghindari kelemahan tersebut cara yang ditempuh adalah : (1) jawaban tiap soal tidak panjang, sehingga bisa mencakup materi yang banyak, (2) tidak melihat nama peserta ujian, (3) memeriksa tiap butir secara keseluruhan tanpa istirahat, dan (4) menyiapkan pedoman penskoran.

Langkah membuat tes ini adalah sebagai berikut. a) Menulis soal berdasarkan kisi-kisi pada indikator. b) Mengedit pertanyaan:

(1) Apakah pertanyaan mudah dimengerti ? (2) Apakah data yang digunakan benar ? (3) Apa tata letak keseluruhan baik ?

(4) Apakah pemberian bobot skor sudah tepat ? (5) Apakah kunci jawaban sudah benar ?

(20)

Kaidah penulisan soal bentuk uraian non-objektif :

(1) Gunakan kata-kata : mengapa, uraikan, jelaskan, bandingkan, tafsirkan, hitunglah, buktikan.

(2) Hindari penggunakan pertanyaan: siapa, apa, bila. (3) Menggunakan bahasa Indonesia yang baku.

(4) Hindari penggunaan kata-kata yang dapat ditafsirkan ganda. (5) Buat petunjuk mengerjakan soal.

(6) Buat kunci jawaban. (7) Buat pedoman penskoran.

Penskoran bentuk tes ini bisa dilakukan secara analitik atau global.Analitik berarti penskoran dilakukan bertahap sesuai kunci jawaban, sedang yang global dibaca secara keseluruhan untuk mengetahui ide pokok dari jawaban soal kemudian diberi skor.

7) Bentuk Jawaban Singkat

Bentuk jawaban singkat ditandai dengan adanya tempat kosong yang disediakan bagi pengambil tes untuk menuliskan jawabannya sesuai dengan petunjuk.Ada tiga jenis soal bentuk ini, yaitu : jenis pertanyaan, jenis melengkapi atau isian, dan jenis identifikasi atau asosiasi. Kaidah-kaidah utama penyusunan soal bentuk ini adalah sebagai berikut.

(a) Soal harus sesuai dengan indikator. (b) Jawaban yang benar hanya satu.

(c) Rumusan kalimat soal harus komunikatif.

(d) Butir soal menggunakan Bahasa Indonesia yang baik dan benar. (e) Tidak menggunakan bahasa lokal.

9) Unjuk Kerja/Performans

(21)

untuk perbaikan proses pembelajaran sehingga kemampuan mahasiswa mencapai pada tingkat yang diinginkan. .

Bentuk tes ini digunakan untuk mengukur status mahasiswa berdasarkan hasil kerja dari suatu tugas. Pertanyaan pada tes unjuk kerja berdasarkan pada tuntutan dari masyarakat dan lembaga lain yang terkait dengan kompetensiu yang harus dimiliki mahasiswa. Jadi pertanyaan butir soal cenderung pada tingkat aplikasi suatu prinsip atau konsep pada situasi yang baru. .Permasalahan yang diujikan sedapat mungkin sama dengan masalah yang ada di kehidupan nyata. Inilah yang menjadi ciri utama perbedaan antara tes unjuk kerja dengan bentuk yang konvensional.

10) Portfolio

Portfolio adalah kumpulan pekerjaan seseorang (Popham, 1999), dalam bidang pendidikan berarti kumpulan dari tugas-tugas mahasiswa. Portfolio cocok digunakan untuk penilaian di kelas, tetapi tidak cocok untuk penilaian dengan skala yang luas (Marzano & Kendall, 1996).Penilaian dengan portfolio memerlukan kemampuan membaca yang baik. Hal yang penting pada penilaian portfolio adalah mampu mengukur kemampuan membaca dan menulis yang lebih luas, mahasiswa menilai kemajuannya sendiri, hasilnya dibandingkan dengan hasil yang lalu.

Penilaian porfolio pada dasarnya adalah menilai karya-karya individu untuk suatu mata pelajaran tertentu. Jadi semua tugas yang dikerjakan mahasiswa dikumpulkan di akhir satu unit program pembelajaran, misalnya satu semester. Kemudian dilakukan diskusi antara mahasiswa dan dosen untuk menentukan skornya. Prinsip penilaian portfolio adalah mahasiswa dapat melakukan penilaian sendiri kemudian hasilnya di bahas. Bentuk ujiannya cenderung bentuk uraian, dan tugas-tugas rumah. Karya yang dinilai meliputi hasil ujian, tugas-tugas mengarang atau mengerjakan soal. Jadi portfolio adalah suatu metode pengukuran dengan melibatkan mahasiswa untuk menilai kemajuannya pada suatu bidang studi

Beberapa hal yang perlu diperhatikan dalam melakukan penilaian portfolio adalah sebagai berikut.

(22)

b) Menentukan contoh pekerjaan mana yang harus dikumpulkan. c) Mengumpulkan dan menyimpan sampel karya.

d) Menentukan kriteria untuk menilai portfolio.

e) Meminta mahasiswa untuk menilai secara terus menerus hasil portfolionya. f) Merencanakan pertemuan dengan mahasiswa yang dinilai.

Penilaian dengan portfolio memiliki karakteristik tertentu, sehingga penggunaannya juga harus sesuai dengan tujuan dan substansi yang diukur. Mata pelajaran yang memiliki banyak tugas dan jumlah mahasiswa yang tidak banyak, penilaian dengan cara portfolio lebih cocok.

I. Pengembangan Indikator Pencapaian

Indikator adalah gejala, perbuatan, atau respons peserta didik. Indikator menggunakan kata kerja operasional yang dapat diukur dan cakupan materinya sudah terbatas. Kata kerja operasional yang digunakan pada indikator di antaranya menghitung, mengidentifikasi, menafsirkan, membandingkan, membedakan, merangkum, menyimpulkan, dan sejenisnya.

Indikator juga digunakan untuk mengembangkan instrumen nontes, seperti pengukuran minat, sikap, motivasi, dan sejenisnya. Misalnya kita ingin mengukur minat seseorang mempelajari bidang studi bahasa Inggeris, maka terlebih dahulu didefinisikan secara operasional apa itu minat. Definisi ini selanjutnya diuraikan menjadi sejumlah indikator untuk menyatakan ciri-ciri orang berminat dan tidak berminat dalam bentuk pernyataan atau pertanyaan. Misalnya ciri-ciri ini orang yang berminat adalah catatan pelajaran lengkap, selalu hadir di kelas, sering mengajukan pertanyaan, dan sebagainya.

J. Penskoran

(23)

diberi skor 2. Jadi tiap tahap dinilai secara berurutan, nbila formula yang digunakan salah, walau hasiol akahir benar, dinyatakana tidak dapat skor.

Menggunakan teori tes klasik, skor sesorang dihitung berdasarklan jumlah item yang dijawab benar, khususnya untuk tes bentuk pilihan. Untuk tes bentuk uraian, apabila tingkat kesulitan tiap item tidak sama maka diberi pembobotan. Umumnya untuk pokok bahasan yang bahannya banyak dberi lebih banyak item, namun bisa juga dilihat dari tingkat kesulitan item atau kompleksitas item, item soal tersebut diberi bobot lebihg banyak,

_______________________________________________________________

DAFTAR BACAAN

Allen, Mary, J., & Yen, Wendy, J (1979). Introduction to measurement theory.

California: Brooks/Cole Publishing Company.

Andersen, L. W., & Krathwohl. (2001). A Taxonomy for learning, teaching and assessment. Boston: Longman.

Astin, W. Alexander.(1993). Assessment for exelence. Phonix: The Oryx Press. Berk, R. A. (1986, Ed). Performance assessment. Baltimore: The John Hopkins

University Press.

Brennan, Robert. L. (ed). (2006). Educational measurement. Westport, USA: Preager Publisher

Cowie, B, and Bell, B. (1999). A model of formative assessment in science education’, Assessment in Education, 6, 1, 101-16.

Djemari Mardapi,(1997). Ragam bentuk evaluasi. Bahan Semiloka LP3 UGM. Yogyakarta

(24)

Griffin, Patrix.,& Nix, Peter. (1991). Educational assessment dan reporting. Sydney: Harcout Brace Javanovich, Publisher.

Johnson, D. W., & Johnson, R. T. (2002). Meaningful assessment. Boston:: Allen & Bacon.

Popham, W. J. (1996). Classroom assessment. Boston: Allyn and Bacon.

Referensi

Dokumen terkait

(2) Mahasiswa memperoleh bekal kemampuan menganalisis praktik berbahasa secara pragmatik1.

Ketuntasan Belajar : adalah Tingkat/Batas Standar Kompetensi Yang Harus Dicapai oleh Siswa per mata pelajaran. Nilai ketuntasan belajar maksimum

Standar Kompetensi Kurikulum Berbasis Kompetensi Penyelengaraan Proses Belajar Mengajar Evaluasi Sertifikasi Pengembangan Standar Kompetensi Pengembangan Kurikulum Berbasis

Mata kuliah ini memberikan konsep dan praktik mengenai kompetensi: standar proses pendidikan, tujuan dan standar kompetensi pembelajaran, mengajar dan pembelajaran,

Mata kuliah ini mengembangkan kompetensi mengenai pembelajaran IPA terintegrasi dalam hal mengembangkan perangkat pembelajaran IPA terintegrasi berupa peta kompetensi, silabus,

Mata kuliah ini mengembangkan kompetensi mengenai pembelajaran IPA terintegrasi dalam hal mengembangkan perangkat pembelajaran IPA terintegrasi berupa peta kompetensi, silabus,

Matakuliah ini bersifat wajib tempuh bagi mahasiswa program Studi Manajemen Pendidikan, berbobot 2 SKS. Bahasan yang dikaji terdiri: 1) Pengertian dan landasan

Kompetensi pembelajaran terdiri dari standar kompetensi, kompetensi dasar yang kemudian dijabarkan ke dalam indicator dan