PENGEMBANGAN INSTRUMEN PENILAIAN OTENTIK:
VALIDITAS TEORITIS DAN KEPRAKTISAN
Oleh:
Siti Nurul H.1, Wahyu Budi Sabtiawan2, Hasan Subekti3
1,2,3Jurusan Ilmu Pengetahuan Alam, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas
Negeri Surabaya
Abstrak
Tujuan penelitian adalah melihat validitas penilaian otentik yang telah dikembangkan baik teoritis maupun empiris. Subyek penelitian ini adalah penilaian otentik yang telah dikembangkan. Penelitian yang telah dilakukan menggunakan desain penelitian R & D (Research and Development). Instrumen penilaian yang dikembangkan adalah rubrik penilaian project report dan presentasi. Penilaian yang telah dikambangkan diuji kelayakannya berdasarkan validitas teoritis dan empirisnya. Validitas teoritis diukur berdasarkan perspektif dari pakar, sedangkan kepraktisan dievaluasi berdasarkan pendapat mahasiswa terhadap penerapan penilaian tersebut. Hasil yang ditunjukkan penelitian ini adalah instrumen yang telah dikembangkan layak untuk diterapkan berdasarkan hasil validasi kepada pakar dan respon mahasiswa. Penilaian yang telah dikembangkan berada pada kategori “sangat baik” dan “baik”. Setiap item penilaian memperoleh skor 3 dan 4. Analisis kepraktisan yang digambarkan melalui hasil uji coba terbatas dan respon mahasiswa, menunjukkan bahwa mahasiswa memberikan respon positif terhadap penerapan penilaian tersebut, meskipun ada beberapa bagian dari rubrik penilaian perlu untuk direvisi lebih lanjut.
Kata Kunci: Penilaian otentik, validitas teoritis, validitas empiris. Abstract
The purpose of research is to evaluate the validity of authentic assessment that has been developed both theoretically and empirically. The subjects of this study is authentic assessments that have been developed. Research that has been conducted using research design R & D (Research and Development). Assessment instrument developed is an assessment rubric project report and presentation. Dikambangkan assessment that has been tested for feasibility based on theoretical and empirical validity. Validity measured by the theoretical perspectives of experts, while practicality is evaluated based on student opinion on the application of such assessments. The results of this study demonstrated is an instrument that has been developed feasible to implement based on the results of validation to the expert and student response. Ratings have been developed that are in the category of "very good" and "good". Each item ratings obtained a score of 3 and 4. Analysis of practicality which is illustrated by the results of limited testing and student responses, showed that students responded positively to the implementation of the assessment, although there are some parts of the assessment rubric needs to be revised further.
Keywords: Authentic assessment, theoretical validity, empirical validity.
© 2016 Universitas Negeri Surabaya
2Alamat Korespondensi:
Jurusan IPA FMIPA Universitas Negeri Surabaya Gedung C12 Kampus Ketintang
E-mail: [email protected]
ISSN: 2527-7537
JPPIPA, Vol.1 No.1 2016
Jurnal Penelitian Pendidikan IPA
http://journal.unesa.ac.id/index.php/jppipa
PENDAHULUAN
Peraturan Presiden Republik Indonesia Nomor 8 Tahun 2012 tentang Kerangka Kualifikasi Nasional Indonesia (KKNI) pasal 1 ayat 2 yang berbunyi capaian pembelajaran adalah kemampuan yang diperoleh melalui internalisasi pengetahuan, sikap, keterampilan, kompetensi, dan akumulasi pengalaman kerja. Aspek-aspek yang masih perlu peningkatan secara signifikan adalah keterampilan, kompetensi, dan akumulasi pengalaman kerja.
Boud dalam Gulikers, Bastiaens, Kirschner dan Kester (2006) menjelaskan bahwa masih banyak lulusan yang mengalami kesulitan jika sudah dihadapkan pada situasi nyata di lapangan. Hal ini mengindikasikan adanya gap antara apa dinilai pengajar dengan kompetensi yang dibutuhkan oleh pembelajar ketika berada pada situasi nyata di lapangan. Hal ini dikarenakan asesmen umumnya masih dipandang sebagai “assessment of learning”. Dengan kata lain, asesmen hanya digunakan untuk mengukur hasil dari pembelajaran, sehingga pendidik akan cenderung untuk menggunakan asesmen tradisional. Menurut Herrington dan Herrington (2006) menyatakan bahwa asesmen tradisional (paper-pencil test) cenderung mengukur prestasi belajar mahasiswa berdasarkan item-item pertanyaan yang hanya mempunyai satu jawaban benar. Akan tetapi, asesmen seharusnya berada pada posisi “assessment for learning” dimana asesmen tidak hanya untuk mengukur hasil pembelajaran tetapi juga dapat digunakan untuk meningkatkan kualitas pembelajaran (Gibbs & Simpson, 2004). Cohen (1987), Steffe dan Gale (1995) dalam Vos (2015), dan Biggs (1996) telah mengungkap bahwa ketika penilain digunakan untuk aktivitas pengajaran dan mengukur kemampuan pembelajar, pembelajar akan lebih terlibat pada pembelajaran, mempunya kinerja yang lebih baik, dan keterampilan berfikir yang lebih tinggi.
Penggunaan asesmen tradisional juga terjadi ditingkat perguruan tinggi. Menurut Reeves dalam Herrington, Reeves, dan Oliver (2010), hal ini terjadi karena dua alasan. Alasan pertama dikarenakan oleh pengajar kurang mendapatkan pelatihan mengenai penggunaan strategi asesmen yang berbeda, sehingga pengajar cenderung untuk menggunakan asesmen tradisional untuk menilai hasil belajar mahasiswa. Alasan kedua dikarenakan oleh kebijakan yang diterapkan di perguruan tinggi tersebut, sehingga kebijakan tersebut mampu membatasi inovasi pengajar yang ingin mengembangkan asesmen yang dapat meningkatkan pembelajaran.
Terdapat sebuah asesmen alternatif yang mampu menjembatani gap di atas yaitu Authentic Assessment. Asesmen ini merupakan metode
asesmen yang menuntut mahasiswa untuk mengintegrasikan antara pengetahuan, keterampilan, dan sikap belajar mereka seperti yang dibutuhkan seorang profesional di dunia kerja (Gulikers dkk., 2006). Hal yang terpenting dari asesmen ini adalah karakteristik yang terkandung di dalamnya karena melalui karakteristik asesmen ini dapat dibentuk sebuah pembelajaran yang otentik.
Karakteristik tersebut antara lain task, physical context, social context, assessment result or form, and criteria (Gulikers, Bastiaens, & Kirschner, 2004). Task merupakan tugas otentik yang melibatkan mahasiswa dalam aktivitas seperti pada situasi nyata dalam dunia kerja. Physical context berhubungan dengan aspek fisik seperti tempat dan waktu yang dibutuhkan dalam menyelesaikan tugas seperti seorang profesioal. Social context merupakan aspek sosial yang juga harus terpenuhi dalam penerapan authentic assessment, misalnya dalam dunia kerja seorang profesional akan berkerja dalam tim. Assessment result or form berhubungan dengan bentuk asesmen yang digunakan, dalam hal ini adalah perfomance asessment. Criteria merupakan aspek-aspek yang harus dipenuhi oleh mahasiswa selama menyelesaikan tugas, misalnya aspek-aspek dalam rubrik penilaian.
Berdasarkan penjelasan mengenai karakteristik dari authentic assessment, salah satu keterampilan yang dapat dikembangkang melalui pembelajaran yang terbentuk berdasarkan karakteristik penialaian ini adalah keterampilan memecahkan masalah. Keterampilan ini merupakan representasi dari aspek yang mampu menjembatani gap tersebut, sehingga mahasiswa dapat mencapai level successful performance. Dengan demikian, penelitian yang akan diusulkan adalah pengembangan penilaian otentik untuk menuntut mahasiswa mempresentasikan keterampilan pemecahan masalah mereka melalui proyek penyusunan bahan ajar. Peneliti akan menguji kelayakan penilaian otentik yang telah dikembangkan berdasarkan tingkat validitas teoritis dan empirisnya.
METODE
Subyek penelitian ini adalah penilaian otentik yang telah dikembangkan. Penilaian ini terdiri dari beberapa instrumen penilaian antara lain, rubrik penilaian laporan praktikum, rubric penilaian presentasi, rubrik psikomotor praktikan, dan rubrik untuk lembar observasi sikap mahasiswa. Kelayakan dari penilaian otentik akan ditentukan berdasarkan validitas teoritis dan empirisnya. Validitas teoritis diukur berdasarkan perspektif dari pakar asesmen, sedangkan validitas empiris
dievaluasi berdasarkan kepraktisannya yang direpresentasikan dari pendapat mahasiswa terhadap penerapan penilaian tersebut. Data yang diperoleh akan dianalisis secara deskriptif kualitatif, dengan rincian berikut ini.
Analisis Validitas Teoritis
Hasil validasi dari ahli dihitung secara komulatif, kemudian ditentukan nilai rata-ratanya. Tingkat validitas instrumen kemudian ditentukan menggunakan skor yang hasil perhitungan tersebut. Setelah itu, skor dikategorikan menggunakan kriteria yang dirujuk dari Ratuman dan Laurens (2006).
Analisis Validitas Empiris
Validitas empiris akan dievaluasi berdasarkan opini mahasiswa. Dengan kata lain, pada tahap analisis ini akan dilakukan penarikan kesimpulan yang didasarkan atas uji coba terbatas dan respon mahasiswa berdasarkan hasil wawancara. Teknik yang digunakan pada wawancara adalah semi-structured interview, dimana interviewee akan dibagi menjadi tiga kelopok. Kelompok pertama adalah mahasiswa memiliki tingkat keterampilan pemecahan masalah yang tinggi. Kelompok kedua
adalah mahasiswa dengan tingkat keterampilan pemecahan masalah sedang. Kelompok ketiga adalah mahasiswa dengan tingkat keterampilan pemecahan masalah rendah. Wawancara digunakan untuk mengumpulkan informasi tentang respon mahasiswa terhadap penilaian yang dikembangkan. Selama wawancara diasumsikan bahwa mahasiswa menjawab dengan jujur dan tanggung jawab.
HASIL DAN PEMBAHASAN Validasi Teoritis
Validasi instrumen dilakukan oleh dua ahli yang merupakan dosen pengampu mata kuliah asesmen di Prodi S1-Pendidikan IPA. Hasil validasi disajikan berikut ini.
Validasi keotentikan penilaian
Tingkat keotentikan penilaian dilihat berdasarkan lima aspek, yaitu task, physical context, social context, dan critera
Tabel 1. Hasil Validasi mengenai Keotentikan Penilaian
Aspek Skor Kriteria
V1 V2
Task: Mahasiswa diberikan tugas otentik. 4 4 Sangat baik
Physical context: Pembelajaran dilakukan di Laboratorium. 4 4 Sangat baik Social context: Mahasiswa dituntut mengerjakan tugas dalam tim. 4 4 Sangat baik Assessment result/form: Penilaian dititikberatkan pada
kinerja mahasiswa.
4 4 Sangat baik
Criteria: Kriteria penilaian telah dideskripsikan dengan rubrik 4 4 Sangat baik Ket: V1=Validator 1; V2=Validator 2
Berdasarkan hasil validasi pada Tabel 1 dapat dikatakan bahwa penilaian yang telah dikembangkan merupakan penilaian otentik karena sudah memenuhi lima kriteria keotentikan (Gulikers dkk., 2004) meliputi task, physical conext, social context, assessment result/form, dan criteria.
Validasi Rubrik Penilaian
Validasi rubrik penilaian ini meliputi validasi untuk rubrik penilaian sikap, laporan praktikum, presentasi, dan psikomotor untuk praktikan. Hasil validasi untuk semua rubrik tersebut disajikan pada Tabel 2.
Tabel 2. Hasil Validasi Rubrik Penilaian
Rubrik Aspek Skor Rata-rata Level
V1 V2
Penilaian Sikap Kriteria penilaian sesuai dengan
tujuan pembelajaran. 4 4
Sangat Baik Kriteria penilaian sesuai dengan
aspek sikap yang dipilih. 4 4
Sangat Baik Rubrik yang dikembangkan
membantu penilai untuk menentukan level pencapaian mahasiswa.
4 4 Sangat
Kriteria untuk level pencapaian tidak ambigu.
4 4 Sangat
Baik
Bahasa yang digunakan komprehensif.
3 3 Baik
Laporan Praktikum Kriteria penilaian sesuai
dengan tujuan pembelajaran. 4 4
Sangat Baik Komponen penilaian memenuhi
semua aspek yang dibutuhkan oleh laporan praktikum.
4 4 Sangat
Baik Rubrik yang dikembangkan
membantu penilai untuk menentukan level pencapaian mahasiswa.
4 4 Sangat
Baik Kriteria untuk level pencapaian
tidak ambigu.
3 3 Baik
Bahasa yang digunakan komprehensif.
3 4 Sangat
Baik Presentasi Kriteria penilaian sesuai dengan
tujuan pembelajaran. 4 4
Sangat Baik Komponen penilaian memenuhi
semua aspek yang dibutuhkan oleh rubrik presentasi.
4 4 Sangat
Baik Rubrik yang dikembangkan
membantu penilai untuk menentukan level pencapaian mahasiswa.
4 4 Sangat
Baik Kriteria untuk level pencapaian
tidak ambigu.
3 3 Baik
Bahasa yang digunakan komprehensif.
4 4 Sangat
Baik Psikomotor untuk
Praktikan
Kriteria penilaian sesuai dengan tujuan pembelajaran.
4 4 Sangat
Baik Komponen penilaian memenuhi
semua aspek yang dibutuhkan oleh rubrik psikomotor untuk praktikan.
4 4 Sangat
Baik Rubrik yang dikembangkan
membantu penilai untuk menentukan level pencapaian mahasiswa.
4 4 Sangat
Baik Kriteria untuk level pencapaian
tidak ambigu.
3 3 Baik
Bahasa yang digunakan komprehensif.
3 3 Baik
Ket: V1=Validator 1; V2=Validator 2
Berdasarkan data yang disajikan pada Tabel 2, rubrik-rubrik yang telah dikembangkan adalah valid dan dapat diterapkan dengan tingkat pencapaian validasi sangat baik dan baik Meskipun
demikian, ada masukan dari validator yang tuliskan pada Tabel 3.
Tabel 3. Masukan dari Validator
Sebelum Validasi Setelah Validasi
Pada rubrik sikap (lembar observasi sikap) istilah
tim. Sebaiknya ditentukan secara konsisten penggunaan istilahnya.
Validasi Empiris
Setelah instrumen dikatakan valid, maka perlu dilakukan evaluasi mengenai kepraktisan instrumen. Terdapat beberapa cara untuk mengevaluasi kepraktisan sebuah instrumen.
Salah satunya adalah melakukan evaluasi melalui respon mahasiswa. Hasil respon mahasiswa yang diperoleh dari hasil wawancara disajikan pada Tabel 4.
Tabel 4. Respon Mahasiswa
Pertanyaan Respon Mahasiswa
Mahasiswa 1 Mahasiswa 2 Mahasiswa 3
Bagaimana menurut Anda penilaian yang diterapkan dalam pembelajaran ini?
Penilaian yang diterapkan sesuai dengan apa yang ingin dicapai pada pembelajaran... penilaian yang diterapkan menggabungkan antara penilaian pengetahuan, sikap, dan keterampilan...
Penilaiannya sudah bagus... Kriteria penilaian jelas dan semua aspek dinilai
Setiap aspek dinilai dan bisa dipertanggungjawabka n karena kriterianya sudah jelas... Jelaskan efek positif dan neg atif menggunakan penilaian ini!
Efek positifnya adalah penilaian menjadi jelas. Efek negatifnya tidak ada
Efek positif: Lebih mudah mencapai target. Efek negatif: terlalu detail, sehingga nilai mahasiswa bisa cenderung kecil.
Efek positif: Nilai yang diperoleh presisi. Efek negatif: tidak ada
Bagaimana menurut Anda, jika penilaian ini diterapkan pada pembelajaran ke depan?
Perlu untuk diterapkan ke depannya dan masih ada kriteria yang perlu direvisi yaitu kriteria penyajian hasil praktikum pada rubrik untuk laporan praktikum
Sangat setuju jika diterapkan ke
depannya.
... penilaian seperti ini
bisa membuat
mahasiswa lebih termotivasi karena semua aspek dihargai dan diperhitungkan.
Berdasarkan respon mahasiswa yang disajikan pada Tabel 4 penilaian yang dikembangkan memenuhi aspek kepraktisan dimana mahasiswa yang bertindak sebagai interviewee memberikan respon positif terhadap semua pertanyaan yang diajukan kepada mereka.
Terdapat beberapa dari pernyataan mahasiswa yang perlu diperhatikan yaitu perlu adanya revisi kriteria pada rubrik untuk laporan praktikum, setuju untuk diterapkan, dan penilaian yang telah dikembangkan menghargai dan memperhitungkan integrase penilaian aspek pengetahuan, sikap, dan keterampilan.
SIMPULAN DAN SARAN Simpulan
Instrumen penilaian yang dikembangkan telah memenuhi unsur otentik dan layak untuk diterapkan berdasarkan hasil validasi pakar (valid dengan revisi). Berdasarkan validasi empiris yang dievalusi melalui respon mahasiswa menunjukkan bahwa mahasiswa memandang instrumen penilaian ini perlu diterapkan kedepannya, meskipun ada beberapa bagian dari rubrik penilaian perlu untuk direvisi lebih lanjut.
Saran
Hal yang perlu diperhatikan pada instrumen penilaian yang telah dikembangkan adalah kriteria pada masing-masing aspek dari setiap rubrik. Dengan demikian, Saran dari peneliti adalah pengguna harus lebih memperhatikan kriteria dari aspek ke-5 (penyajian hasil praktikum) pada rubrik laporan praktikum dan aspek ke-3 (visualisasi) pada rubrik presentasi karena masih kurang operasional. Selain itu, perlu dilakukan evaluasi reliabilitas dari instrumen yang dikembangkan, sehingga terpenuhi aspek valid dan reliabel.
DAFTARPUSTAKA
Biggs, J. B. 1996. Enhancing Teaching Through
Constructive Alignment. Higher
Education, 32, 347-364.
Cohen, S. A. 1987. Instructional Alignment: Searching for Magic Bullet. Educational
Research, 16(8), 16-20.
Gibbs, G., & Simpson, C. 2004. Condition under which assessment supports students’ learning. Learning and Teaching in Higher Education, Issue 1.
Gulikers, J.T.M., Bastiaens, T.J., Kirschner, P.A. 2004. A five-dimensional framework for authentic assessment. Educational Technology Research and Development, Vol. 52 No. 3, pp. 67- 86.
Gulikers, J.T.M., Bastiaens, T.J., Kirschener, P.A.,
& Kester, L. 2006. Relations between student perceptions of assessment authenticity, study approaches and learning outcome. Studies in Educational Evaluation, Vol. 32, pp. 381–400.
Herrington, A., & Herrington, J. 2006. What is an authentic learning environment?. In T. Herrington and J. Herrington (Ed). Authentic learning environment in higher education, 48-60. Hersey, USA: Information Science Publishing.
Herrington, J. & Herrington, A. 1998. Authentic assessment and multimedia: How university students respond to a model of authentic assessment. Higher Education Research & Development, Vol. 17 No. 3, pp. 305-322.
Herrington, J., Reeves, T.C., & Oliver, R. 2010. A guide to authentic e-learning. UK: Routledge.
Peraturan Presiden Republik Indonesia Nomor 8 Tahun 2012 tentang Kerangka Kualifikasi Nasional Indonesia (KKNI) pasal 1 ayat 2.
Vos, L. 2015. Simulation Games in Business and Marketing Education: How Educators Assess Student Learning for Simulations. The International Journal of Management Education, 13, 57-74.