Konsep Pengembangan Instrumen Kinerja
Tidak ada cara yang sempurna dalam sistem penilaian kinerja, seperti telah dikatakan pada bab sebelumnya, tetapi ada tiga hal yang menentukan kesuksesan penilaian tersebut, yaitu komitmen terhadap tujuan penilaian, analisis pekerjaan, dan pengukuran (Moorhead dan Griffin, 1992: 429). Analisis hasil penilaian digunakan untuk mengetahui sejauh mana sistem penilaian berhasil dengan baik. Analisis pekerjaan dapat digunakan untuk menentukan kriteria atau standar kinerja yang akan diukur. Pengukuran dipakai untuk memperoleh data numerik tentang kinerja.
Tingkat keberhasilan pengukuran ditentukan oleh alat ukur (instrumen), metode, dan kemampuan manusia dalam menggunakan alat-alat ukur. Instrumen baku mengurangi kemungkinan terjadinya kesalahan pengukuran dan menjamin kualitas hasil pengukuran.
Pengembangan instrumen penilaian kinerja dimaksudkan untuk mendapatkan instrumen baku, yaitu instrumen yang dikembangkan secara empiris melalui beberapa pengujian. Tes baku adalah tes yang disusun para ahli, selalu diujicoba, dianalisis dan direvisi, termasuk petunjuk administrasi dan teknik penskoran (Ebel dan Prisbie, 1991:
286). Maka, proses pembakuan adalah pembuatan, pengujian, revisi, dan penyusunan pedoman administrasi dan penskoran.
Secara umum, tujuan pembakuan instrumen kinerja tidak berbeda dengan pembakuan tes prestasi (standardized achievement test), yaitu untuk mendapatkan instrumen yang reliabel, valid dan mudah penggunaannya (praktis). Secara khusus proses pembakuan tes
BAB 5
Konsep dan Langkah-Langkah
merupakan upaya untuk mencapai tingkat keakuratan tes dalam mengungkap kemampuan peserta tes, dengan cara meminimalkan pengaruh faktor-faktor yang tidak relevan dengan tujuan tes.
Pembakuan dilakukan dengan memperbaiki isi tes, pengadminitrasian dan penskoran, hingga didapatkan tingkat keakuratan tes yang signifikan.
Pengembangan instrumen dikaji oleh banyak tokoh, dan di sini akan dipaparkan tiga teori pengembangan instrumen yang digagas oleh Borich, Gronlund, dan Lambert.
1. Teori Borich
Borich (1977: 59) menyatakan bahwa untuk pengembangan sebuah sistem penilaian (instrumen) guru yang valid dilakukan melalui empat tahap, yaitu:
(1) mengidentifikasi filosofi yang mendasari atau meta teori sebagai petunjuk pengembangan proses,
(2) menyeleksi atau menyusun teori dasar berlandaskan filosofi tersebut yang mendeskripsikan hubungan antara perilaku guru dan out came (siswa),
(3) merencanakan model prototive yang menggabungkan teori-teori yang terseleksi untuk membentuk sebuah gambaran urutan perilaku spesifik, dan
(4) menguji validasi dengan mencoba dan merevisi satu atau lebih sistem penilaian tersebut.
Langkah-langkah penyusunan instrumen yang dikemukakan Borich ini menekankan pengembangan konstruk daripada metode pengukurannya. Konstruk merupakan hubungan definisi dan susunan spesifikasi yang dikembangkan dari teori-teori sebagai dasarnya.
2. Teori Gronlund
(Gronlund, 1993: 115) menyatakan bahwa pengukuran kinerja meliputi metode, prosedur dan teknik pengambilan data. Pengukuran kinerja akan efektif bila menggunakan pendekatan yang sistematik dengan memperhatikan langkah-langkah berikut:
(1) mengkhususkan hasil-hasil kinerja yang akan di ukur;
(2) memilih fokus dari penilaian (prosedurnya atau hasilnya);
(3) memilih tingkat realisme;
(4) memilih situasi kinerja;
(5) memilih metode, menyelidiki, merekam dan memberi skor
Langkah-langkah ini memberi petunjuk perihal bagaimana mengembangkan instrumen kinerja. Langkah pertama di atas menentukan pilihan atas kompetensi atau bentuk intruksional yang ditetapkan dalam perencanaan pembelajaran. Hasil-hasil kinerja biasanya dinyatakan dalam bentuk kata kerja (tindakan) atau tujuan intruksional (ilustratif). Tabel berikut menunjukkan bagaimana Gronlund memberi contoh kata kerja (tindakan) dan tujuan instruksional yang ilustratif.
Tabel 5.1 Contoh Kata Kerja dan Tujuan Instruksional untuk Hasil Belajar
3. Teori Lambert Clark
Lambert (1979: 23) mengemukakan tujuh elemen kunci dalam penilaian kinerja:
(1) analisis pekerjaan, (2) deskripsi pekerjaan, (3) seleksi wilayah penilaian, (4) penentuan standar kinerja, (5) mengulas penilaian kinerja, (6) bimbingan dan perencanaan tindakan, pelatihan, dan (7) mengulas ulang penilaian kinerja yang dilakukan.
Kata Kerja
(tindakan) Tujuan Instruksional
(ilustratif)
Mengidentifikasi Mengenali bagian-bagian mesin
Memilih alat-alat laboratorium dengan benar Memisahkan bahan Praktikum sesuai sifatnya.
Menunjukkan bagian-bagian yang berputar
Menemukan bagian-bagian yang mengalami kerusakan Membuat sebuah
produk Menentukan ukuran bahan Menyusun langkah kerja Merakit komponen Mencampur bahan Membentuk tampilan Mendeskripsikan Menyebut ciri ciri khusus
Menuliskan ukuran bahan Membandingkan berat benda kerja Melukiskan bentuk benda kerja Menjelaskan fungsi alat
Seleksi wilayah penilaian merupakan upaya untuk menspesifikasikan hasil-hasil kinerja yang akan diukur, dan memilih fokus dari penilaian (prosedur atau hasilnya), sedangkan penentuan standar kinerja dilakukan, antara lain, dengan meningkatkan realisme dan memilih situasi kerja.
Langkah-langkah Pengembangan Instrument
Berdasarkan teori-teori di atas, penyusunan tes kinerja guru praktik ini dilakukan melalui langkah-langkah sebagai berikut: (1) menentukan tujuan, (2) melakukan analisis pekerjaan, (3) menentukan fokus penilaian, (4) mengidentifikasi dan menyusun teori guna menentukan spesifikasi dan standar kinerja, (5) menentukan situasi kinerja, (6) menentukan metode dan teknik observasi, (7) penentukan kriteria kinerja, (8) menentukan proporsi dan menyusun butir, (9 menentukan ciri-ciri statistik skor butir, (10) melakukan validasi instrumen, dan (11) mengembangkan panduan administrasi dan petunjuk penggunaan.
1. Menentukan Tujuan
Tujuan pokok penilaian kinerja adalah menghasilkan informasi yang akurat mengenai kinerja anggota organisasi (Arnold dan Feldman, 1986: 306). Kebanyakan organisasi menggunakan penilaian kinerja untuk mengukur dan mengevaluasi kinerja individu dan memberikan penghargaan, berdasarkan hasil evaluasi tersebut. Individu dinilai mampu atau tidak mampu, efektif atau tidak efektif, bisa dipromosikan atau tidak bisa dipromosikan, berdasarkan informasi yang diperoleh dengan penilaian kinerja.
Doglas Mcgregor (dalam (Timpe, ed., 1992: 388)), menyatakan penilaian kinerja dirancang untuk tujuan-tujuan berikut: (1) untuk mendukung kenaikan gaji, promosi, pemindahan, dan kadang-kadang penurunan pangkat atau pemecatan, (2) untuk memberi tahu karyawan bagaimana hasil kinerjanya, dan menyarankan perubahan-perubahan yang diperlukan dalam perilaku, sikap, keterampilan atau pengetahuan kerja, (3) digunakan sebagai dasar bagi bimbingan dan penyuluhan individu oleh pengawas.
Penilaian kinerja guru dikembangkan dengan tujuan untuk mengetahui keterampilan guru dalam mengajar, mempromosikan
guru, menempatkan guru, dan mengembangkan dasar-dasar pelatihan guna meningkatkan kompetensi guru. Penilaian kinerja guru juga digunakan untuk sertifikasi guru. Apabila dikaitkan dengan guru praktik, pembuatan penilaian kinerja guru dilakukan dengan tujuan untuk mengetahui sejauh mana guru praktik melaksanakan tugas pembelajaran, dari perencanaan, persiapan, pelaksanaan dan tugas manajemen terutama pengadministrasian sarana praktik.
Penilaian kinerja dalam evaluasi praktik pengalaman lapangan calon guru ditujukan untuk menjaring informasi tentang tingkat penguasaan mahasiswa dalam hal berikut: (1) keterampilan dasar mengajar; (2) keterampilan dan kecermatan mengobservasi setting sekolah, dan pelaksanaan pembelajaran; (3) keterampilan merencanakan pembelajaran dan persiapan mengajar; (4) keterampilan melaksanakan kegiatan belajar mengajar; (5) keterampilan memberikan bimbingan belajar; (6) keterampilan administrasi guru bidang studi; (7) keterampilan melaksanakan tugas kurikuler dan ekstrakurikuler; (8) kedisiplinan dan tanggung jawab dan melaksanakan tugas-tugas sebagai calon guru; (9) sikap terhadap siswa, guru pamong dan dosen pembimbing; dan (10) penampilan sebagai pendidik (PPGSM, 1997: 39).
2. Analisis Jabatan (Job Analysis)
Analisis jabatan atau analisis pekerjaan merupakan langkah awal dalam sebuah sistem penilaian kinerja. Metode analisis jabatan mengarah pada metode identifikasi elemen-elemen penting dari sebuah posisi khusus. Setiap elemen biasanya diklasifikasikan dan dimasukkan sebagai kategori utama persyaratan performa kerja (kinerja). Hasil dari analisis jabatan lalu dideskripsikan sebagai deskripsi kerja. Analisis jabatan guru praktik dilakukan dengan menelaah tugas-tugas guru khususnya yang terkait dengan pembelajaran praktik, baik di bengkel maupun di laboratorium.
3. Menentukan Fokus Penilaian
Penilaian kinerja dapat difokuskan pada prosedur dan atau hasil (Gronlund, 1993: 118). Penilaian difokuskan pada hasil ketika: (1) tidak ada hasil yang dapat dievaluasi, (2) prosedurnya dapat diamati secara langsung, (3) prosedur yang benar dapat menjamin tercapainya sukses, dan (4) analisis langkah prosedur dapat membantu menghasilkan
Fokus penilaian dipusatkan pada hasil ketika: (1) prosedur yang berbeda dapat menghasilkan produk yang baik dan sama, (2) langkah-langkah prosedur telah dikuasai, dan (3) produknya memiliki mutu yang dapat diidentifikasi dan dinilai. Penilaian kinerja guru praktik difokuskan pada proses, sedangkan penilaian efektivitas pembelajaran guru difokuskan pada hasil pembelajarannya.
4. Menentukan Spesifikasi dan Standar Kinerja
Tujuan khusus penilaian kinerja harus diidentifikasi dan dirumuskan dalam deskripsi yang jelas sesuai penampilan tertentu. Penggunaan kata kerja seperti mengidentifikasi, menyusun, memperagakan, memasang dan sinonimnya akan memfokuskan faktor-faktor khusus yang sangat penting dalam kinerja. Karena tidak mungkin untuk terfokus pada semua keadaan kinerja, digunakan daftar kinerja yang relevan dan signifikan terhadap hasil kinerja tertentu untuk meningkatkan keakuratan observasi dan penilaian. Pengembangan spesifikasi terutama menyangkut penentuan bahan tes atau isi tes dan akan menentukan indikator yang akan diungkap. Spesifikasi dapat dikembangkan dari definisi operasional atau defiisi konseptual variabel. Dari kajian yang dikembangkan dalam bab sebelumnya definisi operasional Kinerja guru praktik bidang keahlian teknik adalah kumpulan total dari perilaku guru dalam mengajar praktik yang menunjukkan tingkat keefektifan penggunaan prosedur kerja mulai tahap perencanaan pembelajaran, dan tahap pelaksanaan pembelajaran dan hasil belajar siswa.
Dari definisi diatas maka Alat PenilaianKinerja Guru Praktik (APKG-Praktik ) dapat dibuat dalam bentuk 4 instrumen, yaitu:
(1) APKG-Praktik I tentang perencanaan pembelajaran praktik dengan dimensi-dimensinya sebagai berikut: (a) Pemilihan topik dan penentuan tujuan; (b) Analisis keterampilan dan Pengorganisasian materi bahan pembelajaran; (c) pemilihan dan penentuan gambar, alat, material; (d) Penentuan skenario dan strategi pembelajaran;(e) Penentuan keselamatan kerja;
(f) Rancangan pengelolaan kelas; dan (g) Rancangan evaluasi proses dan hasil pembelajaran.
(2) APKG-Praktik II tentang Persiapan Pembelajaran Praktik. Dimensi persiapan pembelajaran meliputi: (a) persiapan alat dan mesin,
(b) persiapan bahan atau material, (c) persiapan pendukung praktik,(d) persiapan keselamatan kerja.
(3) APKG-Praktik III tentang proses pelaksanaan pembelajaran praktik. APKG-Praktik III memiliki Dimensi sebagai berikut: (a) pembukaan pembelajaran siswa (c) demontrasi-presentasi, (d) Peniruan atau pelaksanaan praktik siswa, (e) penutupan pembelajaran dan (e) Evaluasi pembelajaran praktik.
(4) APKG-Praktik IV tentang Pengadministrasian Sarana dan Hasil Praktik. Dimensi pengadministrasian sarana dan hasil praktik meliputi: (a) Pengadministrasian Mesin, (b) Pengadministrasian bahan, (c) Pengadministrasian Dokumen pembelajaran Praktik, (d) Pengadministrasian hasil praktik.
5. Menentukan Situasi Kinerja
Penilaian kinerja sebagai penampilan dalam rangkaian pembelajaran berupa tes penampilan dalam situasi nyata dan tidak nyata (Gronlund, 1993: 114). Walaupun kita tidak dapat mengharapkan situasi yang alami kita dapat menilai guru dalam tingkat realisme situasi tertentu.
Pemililihan tingkat realisme untuk situasi tertentu memperhitungkan faktor-faktor (1) aturan objektif intruksional; (2) rangkaian instruksi dengan subjek tertentu yang menunjukkan bahwa hal tersebut dapat mengukur penerapan tes tertulis sebelum penampilan dicoba;
(3) pembatas yang mengganggu seperti waktu, biaya, persediaan peralatan, dan kesulitan dalam mengelola dan memberi nilai; dan (4) jenis pekerjaan itu sendiri dapat membatasi tingkat realisme dalam situasi tes.
Menurut Gronlund (1993: 120), penilaian kinerja dapat digolongkan menjadi lima bentuk, yaitu (1) kinerja tertulis, (2) tes identifikasi, (3) tes kinerja berstruktur, (4) kinerja pura-pura, dan (5) contoh kerja.
Kinerja tertulis berasal dari tes lisan tradisional yang menekankan penerapan ilmu pengetahuan dan keahlian dalam suasana tidak nyata. Tes identifikasi merupakan variasi dari situasi tes dengan tingkatan beragam tingkat realisme. Tes kinerja berstruktur memberikan penilaian di bawah standar, kondisi terkontrol. Situasi kinerja diatur sedemikian rupa sehingga mengharuskan setiap orang untuk merespons tugas yang sama. Susunan tes kinerja berstruktur mengikuti pola yang sama dari tes kemajuan, tetapi ditambahkan
beberapa kerumitan. Situasi tes sering kali dikontrol dan distandarkan.
Pengontrolan dan standardisasi ini membutuhkan banyak waktu dan sering sulit dinilai. Sebaiknya, situasi tes ditingkatkan agar menjadi standar bagi semua orang. Kinerja berpura-pura (simulasi) adalah usaha untuk mencocokkan kinerja tersebut dengan situasi yang nyata, baik secara keseluruhan maupun sebagian. Penilaian kinerja melalui contoh pekerjaan nyata mengharuskan siswa tampil dalam situasi sesungguhnya yang mewakili penampilan total yang diukur. Penampilan dalam bentuk yang standar digunakan sebagai bukti kemampuan mengerjakan sesuatu, termasuk semua langkah pekerjaan sebenarnya.
6. Metode dan Teknik Observasi
Banyak metode dan teknik yang dapat digunakan untuk melakukan observasi dalam rangka penilaian kinerja. Dalam tulisan ini akan disajikan metode dan teknik-teknik yang disarikan dari tulisan Gronlund, kemudian sebagai pembanding disajikan ringkasan dari tulisan Moorhead dan Griffin.
(1) Pendekatan Gronlund
Menurut Gronlund, (1993: 124). Penilaian kinerja biasanya menggunakan satu atau lebih metode dan teknik-teknik berikut:
observasi yang sistematik, menandai jawaban (cheklist), skala cabang, skala produk, dan portofolio.
Observasi dalam situasi alami merupakan salah satu metode penilaian kinerja. Observasi sistematik biasanya disertai dengan catatan yang bersifat anekdot, yaitu catatan singkat tentang beberapa kejadian tertentu termasuk tingkah laku yang sudah diamati, dengan setting dan penjelasan yang terpisah dari kejadian itu. Menandai jawaban (cheklist), atau daftar-daftar digunakan untuk mengevaluasi serangkaian prosedur atau dimensi yang dapat diukur dengan tepat. Daftar-daftar mengarahkan perhatian ke elemen-elemen yang diobservasi dan memberikan makna penting dari penilaian (pencatatan). Penilai atau pengamat hanya memeriksa apakah setiap tindakan diambil atau tidak, kemudian memberi tanda cek (√) atau memilih “ya” atau “tidak” .
Contoh: Berilah tanda V pada indicator kinerja yang muncul pada saat Observasi dilakukan:
1 Guru menguraikan operasi kerja dengan mengacu pada gambar 2 Guru menguraikan operasi kerja dengan alur dan tahapan yang jelas 3 Guru memberi penekanan pada konsep dan langkah-langkah penting 4 Guru menguraikan operasi kerja dengan tuntas dari awal hingga akhir
Skala Cabang
Skala cabang, sama seperti daftar-daftar, digunakan untuk menilai prosedur atau hasil. Bedanya, skala cabang memungkinkan untuk menilai tingkatan. Skala cabang dibuat berdasarkan tindakan yang dilakukan, kualitas umum dari kinerja, atau kalimat deskriptif yang menyatakan tingkatan kinerja dan tindakan yang diterima. Skala cabang mengarahkan perhatian ke dimensi-dimensi yang diamati dan memberikan format yang tepat untuk mencatat penilaian. Ruang komentar dapat ditambahkan di bawah setiap butir.
Rencana Proyek
1 2 3 4 5
Rencananya terlalu umum
Rencananya benar tapi kurang rinci
Rencananyan benar, rinci dan lengkap
Skala Cabang Prosedur
5 4 3 2 1 (a) Menyiapkan rencana yg terinci untuk proyeknya 5 4 3 2 1 (b) Menentukan jumlah bahan yg diperlukan 5 4 3 2 1 (c ) Memilih alat yang tepat
Ket : 5 paling baik, 4 diatas rata-rata, 3 rata-rata, 2 dibawah rata-rata, 1 sangat buruk.
Skala Cabang Hasil
5 4 3 2 1 (a) Produknya tampil dalam susunan yang rapi 5 4 3 2 1 (b) Bagian-gaian berhubungan dengan tepat 5 4 3 2 1 (c ) Bahan-bahan digunakan secara efisien
Skala Produk
Skala produk terdiri dari contoh-contoh seri produk yang mewakili berbagai tingkat kualitas. Tingkatan kualitas produk dapat diberi nomor-nomor, khususnya produk yang karakteristiknya rumit. Nomor yang diberikan digunakan sebagai indikasi tingkat kinerja siswa tersebut.
Portofolio
Portofolio merupakan catatan kualitatif tentang hal-hal penting yang mengindikasikan kualitas kinerja yang dinilai. Berbeda dengan catatan anekdot yang sifatnya singkat, portofolio dapat berupa catatan-catan uraian kerja yang lebih luas. Koleksi karya siswa (gambar dan tulisan) dapat digunakan secara komprehensif untuk menilai kinerja siswa.
(2) Pendekatan Moorhead dan Griffin
Moorhead dan Griffin (1992 :436-443), membagi teknik penilaian kinerja menjadi tiga kategori, yaitu: evaluasi kinerja individu, evaluasi komparatif dan evaluasi multiple-rater comparative.
Evaluasi kinerja individu menggunakan teknik-teknik : Graphic Rating Scales, Checklist, Behaviorally Anchor Rating Scales (BARS), Forced Choice, Management By Objectives. Evaluasi komparatif memakai Ranking, Forced Distribution, Paired Comparison. Multiple-rater comparative evaluation menggunakan teknik objective judgement quotient (OJQ) method.
1). Grafik Skala Cabang (Rating Scale)
Grafik skala cabang merupakan salah satu skala cabang yang paling sederhana untuk menilai kinerja. Grafik ini dapat menggunakan satu
Skala Produk sulit dijelaskan biasanya digunakan untuk menilai karya seni.
Skala produk mengunakan contoh-contoh produk yang bernilai atau berkualitas lalu di beri skor dan dijadikan model
Produk seni yang dinilai dicocokan dengan model lalu diberi skor sesui dengan skor model yang sama atau kualitasnya mendekati.
atau banyak ukuran. Penilainya melingkari titik pada skala yang paling tepat untuk menggambarkan tingkat kinerja orang yang dinilai.
Contohnya seperti di bawah ini:
Skala
Nama Guru Sangat Buruk Sedang Baik Sangat Buruk Baik ...
...
Skala
Dimensi Sangat Buruk Sedang Baik Sangat Kinerja Buruk Baik
Kuantitas
Kualitas Kerja tim
2). Grafik Skala Perilaku Menonjol (BARS)
Behaviorally Anchored Rating Scales (BARS) memadukan grafik skala cabang dan pernyataan tentang perilaku orang yang dinilai.
Pernyataan-pernyataan ini diwakili poin-poin dalam skala. BARS dibuat oleh orang yang mengetahui pekerjaan yang dinilai, dan penggunaan BARS relatif mudah. Contohnya sebagai berikut:
a. Kemampuan Kerja
Tidak
tampak Ada jarak antara pengetahuan dan keterampilan
Pengetahun dan keteram-pilannya memuaskan
Pengetahuan dan keteram-pilannya bagus
Pengetahuan dan keterampilan luar biasa
Sangat menguasai seluruh cakupan pekerjaannya
b. Kemampuan untuk Membuat Rencana
Tidak
tampak Mengandalkan orang lain untuk menemukan masalah
Membuat rencana sesaat sebelum melakukan pekerjaan
Perencana
yang cermat Dapat membuat rencana melampaui syarat minimal
Dapat membuat rencana induk
3). Pilihan Paksaan (Forced Choice)
Instrumen ini berisikan daftar pernyataan tentang perilaku yang akan dinilai. Pernyataan-pernyataan ini dikelompokkan dalam bentuk kiraan (rating) sehingga tampak mirip. Penilai harus memilih satu pernyataan dalam satu kelompok pernyataan yang paling tepat untuk mendeskripsikan kinerja orang yang dinilai. Adakalanya, penilai diminta memilih pernyataan yang paling tidak tepat untuk menggambarkan kinerja orang yang dinilai.
4). MBO (Management By Objectives)
MBO digunakan untuk menilai hasil pekerjaan, atau kinerja dalam arti hasil (bukan proses). MBO terdiri dari dua langkah, yaitu menentukan tujuan (goal setting) dan menilai kinerja (performance review). Dalam menentukan tujuan, setiap individu berdiskusi dengan supervisornya untuk menentukan rencana kinerja periode mendatang dan membuat kesepakatan tentang tujuan-tujuan pekerjaan selama satu periode itu. Oleh karena dimaksudkan untuk memotivasi, tujuan-tujuan ini harus jelas, spesifik, dan dipahami oleh si individu.
Untuk merumuskan tujuan yang spesifik, diperlukan (1) identifikasi kriteria pengukuran yang dapat mengukur pencapaian tujuan, dan (2) penentuan tenggat (deadline) dan batas-batas sementara untuk mengukur perkembangan kinerja.
Dalam menilai kinerja, si individu dan supervisornya bertemu untuk membicarakan perkembangan pencapaian tujuan-tujuan si individu.
Perkembangan ini dinilai berdasarkan tujuan-tujuan yang telah ditentukan sebelumnya dalam langkah penentuan tujuan. Penilaian ini dilakukan dengan merujuk pada hasil-hasil kinerja yang konkret, bukan pada aktivitas-aktivitas si individu dan bukan pula pada perasaan supervisornya (Arnold dan Feldman, 1986: 322).
5). Ranking
Ranking adalah menilai seluruh individu yang memiliki klasifikasi pekerjaan yang sama, dengan mengurutkan hasil-hasil penilaian dari yang terbaik sampai yang terburuk. Kriteria penilaiannya biasanya tunggal, sehingga ranking mereduksi banyak perilaku yang sangat kompleks jadi satu saja. Jika jumlah individu tidak terlalu banyak, ranking mudah dilakukan; tetapi sebaliknya, sulit dilaksanakan pada individu yang jumlahnya banyak sekali.
6). Forced Distribution
Teknik ini mengharuskan penilai menempatkan orang-orang yang dinilainya ke dalam kategori-kategori berdasarkan tingkat kinerja mereka. Setiap kategori diberi persentase atau proporsi, misalnya sangat rendah = 10%, rendah = 20%, sedang = 40%, tinggi = 20%, dan sangat tinggi = 10%; atau rendah = 1/3, sedang = 1/3, dan tinggi
=1/3.
Kategori
Sangat Rendah Sedang Tinggi Sangat Rendah Tinggi Distribusi 10% 20% 40% 20% 10%
5). Paired Comparison
Di sini penilai membandingkan sebuah kriteria kinerja dari dua individu dalam satu waktu. Dengan mengidentifikasi individu yang kinerjanya lebih baik pada setiap pasangan, si penilai dapat menyusun daftar hasil penilaian dalam suatu ranking.
6). Objective Judgement Quotient (OJQ) method
Dalam teknik atau metode ini, individu-individu yang akan dinilai turut berperan untuk menyusun kriteria penilaian. Lalu, mereka memilih beberapa orang (biasanya 5-8 orang), termasuk supervisor mereka, untuk menilai mereka. Berikut ini salah satu contohnya.
Kriteria: Kemampuan untuk Memecahkan Masalah
a. Darmono --- --- --- --- --- Sujarwo Jauh Sedikit Sama Sedikit Jauh
lebih baik lebih baik lebih baik lebih baik
b. Baik --- --- --- --- --- Darmono Jauh Sedikit Sama Sedikit Jauh
lebih baik lebih baik lebih baik lebih baik
c. Bambang --- --- --- --- --- Sedang Jauh Sedikit Sama Sedikit Jauh
lebih baik lebih baik lebih baik lebih baik
Teknik yang sering digunakan dalam mengukuran kinerja, kata Donnelly, Gibson, dan Ivancevich (1995: 464), adalah Graphic Rating Scales (GRS) dan Behavior Anchored Rating Scales (BARS).
Grafik skala penilaian merupakan teknik yang paling tua dan banyak digunakan. Skala penilaian bergantung bagaimana kriteria didefinisikan, bagaimana seseorang menginterprestasikan perilaku dalam angka-angka tanggapan yang bakal ditulis. BARS merupakan sebuah konstruk yang dibuat berdasarkan kejadian kritis dari salah satu bagian (cakupan) penting pada kinerja yang diidentifikasi. BARS digunakan sebagai kriteria untuk membedakan level-level kinerja.
7. Menentukan Skala dan Kriteria Kinerja
Penentuan skala penilaian dimaksudkan untuk memberikan angka perolehan kepada individu. Pemberian angka penilaian dilakukan dengan mengikuti petunjuk tentang penilaian individu terhadap apa yang hendak diukur. Bila jenis skala yang digunakan untuk mengembangkan instrumen kinerja guru praktik adalah skala cabang. Skala cabang sama seperti checklist dimana memberikan tujuan yang sama dalam menilai prosedur dan produknya. Pendekatan kriteria dalam mengukur efektivitas kinerja harus di identifikasi dari masing masing pekerjaan dimana sistem penilaian kinerja dilakukan.
Donally (1984) menyatakan pendekatan kriteria dalam mengukur efektifitas kinerja harus diidentifikasi dari masing-masing pekerjaan dimana sistem penilaian kinerja dilaksanakan. Sedangkan menurut Amold Hugh (1986) kriteria kinerja yang baik: (1) dapat diukur secara reliable, (2) bisa membedakan individu sesuai kinerjanya, (3) menjadi acuan yang mempengaruhi aksi pemegang jabatan, (4) diterima oleh individu yang kinerjanya diuji.
Ke tujuh kriteria tersebut menentukan kualitas instrumen penilaian kinerja dan dapat digunakan untuk menguji hasil pengembangan instrumen.
8. Menentukan dan Menyusun Proporsi Butir
Butir-butir tes dibuat berdasarkan indikator dan deskriptor yang dikembangkan pada penentuan kisi-kisi dan spesifikasi yang hendak diukur. Jumlah butir soal yang dikembangkan tergantung pada bobot dan banyaknya indicator setiap variable. Guna menghidari kejenuhan responden jumlah butir yang dikembangkan untuk setiap variable disarankan berkisar antara 3 (tiga) sampai dengan 5 (lima) butir Soal.
9. Menentukan Skor Butir
Penskoran dilakukan untuk memperoleh objektivitas penilaian, terutama penilaian yang dilakukan oleh beberapa orang (Brown, 1983). Skor diberikan pada hasil ujian untuk menyajikan informasi tentang besaran atau dimensi yang akan diukur (Naga, 1992: 435).
Ada dua jenis penskoran yang biasa digunakan untuk instrumen evaluasi, yaitu penskoran analitik dan penskoran holistik. Pemberian skor secara analitik adalah melakukan pemberian skor pada
tiap-Menurut Popham (1995: 147), kriteria untuk tes kinerja semaksimal mungkin harus memenuhi syarat-syarat berikut:
(1) dapat digeneralisasi (generalizability), (2) sesuai dengan kondisi nyata (authenticity), (3) mengukur lebih dari satu keluaran atau memiliki fokus ganda (multiple foci), (4) dapat diajarkan (teachability), (5) objektif (fairness), (6) dapat diimplementasikan secara realistis (feasibility), dan (7) dapat diskor atau evaluasi secara akurat (scorability).
tiap elemen hasil pekerjaan siswa, sedangkan pemberian skor secara holistik adalah pemberian skor yang memerlukan pertimbangan dari pemberi skor (Nitko, 1983: 151). Dalam penskoran holistik, penilai tidak menganalisis bagian-bagian dari pekerjaan siswa, tambah Nitko, sehingga pemberian skor secara holistik merupakan pemberian skor secara global. Penyekoran instrument penilaian kinerja Guru praktik secara lengkap akan di bahas pada nagian laian buku ini.
10. Melaksanakan Validasi Instrumen
Dalam penilaian guru menurut Borich (1977: 60), validasi komponen pengembangan penilaian guru meliputi (1) validasi tujuan dan meta teori atau validasi filosofi, (2) validasi sistem penilaian, (3) validasi model penilaian, dan (4) validasi proses penilaian di lapangan. Validasi filosofi meliputi langkah-langkah: mengidentifikasi sumber-sumber internal, eksternal dan kontektual yang berpengaruh, menentukan tingkat pengaruh dari setiap sumber, memberi bobot setiap sumber sesuai dengan tingkat penting dan tidaknya, dan menyusun sebuah konstruk sebagai filosofi dasar pembelajaran yang efektif.
Validasi sistem dilakukan dengan langkah-langkah (1) mencari sumber literatur untuk menentukan hubungan yang signifikan antara perilaku guru dan keluaran (pupil outcome), (2) memilih perilaku dan keterampilan yang akan diangkat, (3) menyusun perilaku dan keterampilan dalam bentuk hubungan antara variabel yang logis, dan (4) mengetes validasi hipotesa dan hubungan antarvariabel.
Validasi model meliputi langkah-langkah sebagai berikut: (1) menyusun urutan perilaku pembelajaran dan keterampilan, konstruk sebuah taksonomi atau hirarki perilaku dan keterampilan; (2) mengembangkan profil guru secara invidual dari kompetensi yang akan dicapai; (3) merencanakan sumber-sumber instruksional dan pengalaman pelatihan yang relevan dengan profil.
Validasi proses penilaian berisikan tindakan-tindakan (1) memilih bagian–bagian perilaku dan keterampilan untuk dicoba, (2) menyeleksi bagian yang berhubungan dari sumber-sumber instruksional dan pengalaman pelatihan, (3) mengendalikan tes bagian, dan (4) mengetes efesiensi dan efektivitas dari sub sistem untuk melakukan revisi.
11. Reliabilitas Instrumen
Reliabilitas atau keandalan adalah kejituan atau ketepatan instrumen pengukur alias akurasi (Kerlinger, 1993: 710). Istilah reliabilitas sering disamakan dengan consistency, stability, atau dependability, yang pada prinsipnya menunjukkan sejauh mana pengukuran dapat memberi hasil yang relatif tidak berbeda bila dilakukan pengukuran kembali terhadap subyek yang sama (Azwar, 1986: 6). Perkiraan keterandalan test-retest, yaitu hubungan antara hasil tes yang diadakan pada satu waktu dengan tes yang sama beberapa waktu kemudian, digunakan sebagai acuan dalam menentukan reliabilitas.
Hal penting yang harus diperhatikan dalam menilai perkiraan kestabilan kinerja adalah lamanya waktu penilaian. Bila periode waktu penilaian terlalu pendek, seseorang dapat memperoleh nilai keterandalan yang tinggi karena dia masih ingat betul butir-butir soal yang telah dibuat sebelumnya. Sebaliknya, jika terlalu lama, hasilnya bisa rendah apabila terjadi perubahan kinerja. Konsistensi internal pada perkiraan keterandalan dipertimbangkan dengan menjawab pertanyaan apakah semua bagian dari total penilaian menilai hal yang sama. Pendekatan operasional yang paling umum untuk perkiraan kosistensi internal pada suatu penilaian melibatkan hubungan antarbagian dari penilaian total.
12. Pengadministrasian Instrumen
Pengadministrasian (dan penskoran) instrumen menjadi kunci untuk menjaga integritas penilaian (Cohen dan Wollack dalam Brennan, 2006:
355). Pengadministrasian instrumen berkenaan dengan pelaksanaan pemakaian instrumen, dan pengadministrasian yang sesuai dengan petunjuk-petunjuk instrumen memungkinkan penskoran dan penafsiran skor secara tepat. Pengadministrasian yang buruk, terlebih-lebih bila instrumen dipakai oleh banyak orang di banyak tempat dan pada waktu yang berlainan, akan mempengaruhi skor (validitas) dan, akibatnya, penafsiran skornya menjadi kurang tepat.
Oleh karena itu, pengadministrasian instrumen harus diperhatikan secara serius, apalagi perkembangan teknologi yang pesat turut mempengaruhinya.
Dalam pengadministrasian instrumen, terdapat empat hal pokok, yaitu (1) cara mempresentasikan instrumen, (2) format butir instrumen, (3) keleluasaan peserta tes untuk mengerjakan tes secara cepat, dan (4)
petunjuk yang tertulis dalam lembar instrumen (Brennan, 2006: 356).
Instrumen, dalam hal ini pedoman penilaian kinerja guru praktik, dipresentasikan kepada penilai secara tertulis pada lembar kertas.
Namun, instrumen lain, misalnya tes, dapat dipresentasikan secara lisan atau audio dengan komputer. Format butir item berupa pilihan (selected response) dan uraian (constructed response), dan pedoman penilaian kinerja guru praktik dikategorikan ke dalam format pilihan.
Keleluasaan peserta tes bergantung pada cara mempresentasikan instrumen. Jika presentasinya dilakukan secara lisan, si peserta kurang leluasa dalam mengerjakan tes. Namun, bila presentasinya dilakukan secara tertulis, si peserta leluasa untuk mengerjakannya karena dia dapat berkali-kali melihat seluruh butir tes. Dalam kasus pedoman penilaian kinerja guru praktik, penilai dapat secara leluasa dan cepat menilai guru, tetapi kecepatan penilaiannya juga bergantung proses perencanaan, persiapan, dan pelaksanaan pembelajaran praktik, serta pengadministrasian sarana praktik yang dilakukan oleh guru.
Akan halnya petunjuk yang tertulis pada lembar instrumen, kelengkapan dan kemudahan bahasanya menentukan keberhasilan pengadministrasian instrumen. Dengan membaca petunjuk penilaian yang lengkap, penilai bisa melakukan penilaian dengan benar dan tepat, tanpa perlu meminta penjelasan lagi kepada penyusun instrumen. Demikian pula, petunjuk penilaian yang ditulis dengan kata-kata yang mudah dipahami dan kalimat-kalimat yang tertata, jelas, dan ringkas memudahkan penilai melaksanakan tugasnya.
Selain itu, petunjuk instrumen juga menyertakan alokasi waktu penilaian dan syarat-syarat tempat pelaksanaan penilaian agar kinerja guru menjadi optimal dan penilaiannya berjalan dengan baik.