• Tidak ada hasil yang ditemukan

A.Kajian Pustaka 1. Evaluasi a. Pengertian Evaluasi

Pengertian evaluasi seringkali diartikan sama dengan pengukuran dan penilaian, padahal ketiganya memiliki arti yang berbeda, namun saling berkaitan satu sama lain. Arikunto (2010) mengemukakan bahwa mengukur adalah membandingkan sesuatu dengan suatu ukuran, sedangkan menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Adapun evaluasi meliputi kedua langkah tersebut, yaitu mengukur dan menilai. Pengukuran lebih bersifat kuantitatif, sedangkan penilaian bersifat kualitatif. Untuk evaluasi tidak hanya menyangkut gambaran secara kuantitatif, tetapi juga secara kualitatif.

Menurut pengertian bahasa kata evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian (tetapi dilakukan pengukuran terlebih dahulu). Sedangkan menurut pengertian istilah evaluasi merupakan kegiatan yang terencana untuk mengetahui keadaan suatu objek dengan menggunakan instrumen dan hasilnya dibandingkan dengan tolak ukur untuk memperoleh kesimpulan (Arikunto, 2010).

Sejalan dengan pendapat-pendapat yang dijelaskan di atas, Tyler (dalam Arikunto, 2010) mengemukakan bahwa evaluasi merupakan sebuah proses pengumpulan data untuk menentukan sejauh mana, dalam hal apa, dan bagian mana tujuan pendidikan sudah tercapai. Cronbanch dan Stufflebeam (dalam Arikunto, 2010) menambahkan bahwa proses evaluasi bukan sekedar mengukur sejauh mana tujuan tercapai, tetapi digunakan untuk membuat keputusan. Dari pengertian-pengertian tersebut, evaluasi dapat diartikan sebagai suatu kegiatan yang dilakukan untuk mengetahui keberhasilan suatu proses pendidikan.

perpustakaan.uns.ac.id digilib.uns.ac.id

b. Pentingnya Evaluasi

Kegiatan evaluasi merupakan salah satu kegiatan yang penting dalam pendidikan, khususnya dalam kegiatan belajar mengajar. Dengan evaluasi kita akan mengetahui kelebihan dan kekurangan yang ada pada kegiatan pembelajaran yang telah dilakukan, sehingga kita bisa melakukan perbaikan. Ada tiga alasan utama mengapa dalam kegiatan pendidikan selalu memerlukan evaluasi, yaitu:

1) Untuk mengetahui apakah tujuan pendidikan sudah tercapai dengan baik dan untuk memperbaiki serta mengarahkan pelaksanaan proses belajar mengajar.

2) Kegiatan mengevaluasi terhadap hasil belajar merupakan salah satu ciri dari pendidik profesional.

3) Bila dilihat dari pendekatan kelembagaan, kegiatan pendidikan merupakan kegiatan manajemen, yang meliputi kegiatan: planning, programming, organizing, actuating, controlling, dan evaluating.

c. Fungsi Evaluasi

Pendidikan merupakan salah satu aspek penting untuk kemajuan bangsa. Tetapi, pendidikan tanpa perkembangan (khususnya dalam hal prestasi belajar siswa dan umumnya dalam segala aspek pendidikan) tidak akan memberikan kontribusi yang besar bagi kemajuan bangsa. Kegiatan evaluasi akan memberikan gambaran tentang kemampuan dan kesulitan yang dihadapi siswa selama kegiatan pembelajaran, selain itu informasi tentang tingkat keberhasilan program pendidikan pun bisa diketahui. Fungsi evaluasi dalam pendidikan dan pengajaran dapat dikelompokkan menjadi empat fungsi sebagai berikut.

1) Untuk mengetahui kemajuan, perkembangan, serta keberhasilan siswa setelah mengalami atau melakukan kegiatan belajar selama jangka waktu tertentu. Hasil evaluasi tersebut, selanjutnya digunakan untuk menentukan lulus tidaknya seorang siswa dari suatu lembaga pendidikan tertentu.

8 2) Untuk keperluan Bimbingan Konseling (BK). Hasil-hasil evaluasi yang

telah dilaksanakan oleh guru terhadap siswanya dapat dijadikan sumber informasi atau data bagi pelayanan BK oleh para konselor sekolah atau guru pembimbing lainnya.

3) Untuk mengetahui tingkat keberhasilan program pengajaran. Pengajaran sebagai suatu sistem terdiri dari beberapa komponen yang saling berkaitan satu sama lain. Komponen-komponen yang dimaksud antara lain: tujuan, materi pengajaran, metode dan kegiatan belajar mengajar, alat dan sumber pembelajaran, prosedur, serta alat evaluasi.

4) Untuk keperluan pengembangan dan perbaikan kurikulum sekolah.

Pendidikan itu terdiri dari berbagai komponen, diantaranya: guru, peserta didik, sekolah, orang tua, dan masyarakat. Oleh karena itu, untuk lebih jelasnya, fungsi evaluasi pendidikan bagi komponen tersebut dapat dirinci sebagai berikut.

1). Fungsi evaluasi pendidikan bagi guru

a) Mengetahui kemajuan belajar peserta didik.

b) Mengetahui kedudukan masing-masing individu peserta didik dalam kelompoknya.

c) Mengetahui kelemahan-kelemahan cara belajar mengajar dalam Proses Belajar Mengajar (PBM).

d) Memperbaiki PBM.

e) Menentukan kelulusan peserta didik. 2). Fungsi evaluasi pendidikan bagi peserta didik

a) Mengetahui kemampuan dan hasil belajar. b) Memperbaiki cara belajar.

c) Menumbuhkan motivasi dalam belajar. 3). Fungsi evaluasi pendidikan bagi sekolah

a) Mengukur mutu hasil pendidikan.

b) Mengetahui kemajuan dan kemunduran sekolah. c) Membuat keputusan kepada peserta didik. d) Mengadakan perbaikan kurikulum.

perpustakaan.uns.ac.id digilib.uns.ac.id

4). Fungsi evaluasi pendidikan bagi orang tua a) Mengetahui hasil belajar anaknya.

b) Meningkatkan pengawasan dan bimbingan serta bantuan kepada anaknya dalam usaha belajar.

c) Mengarahkan pemilihan jurusan, atau jenis sekolah pendidikan lanjutan bagi anaknya.

5). Fungsi evaluasi pendidikan bagi masyarakat dan pemakai jasa pendidikan a) Mengetahui kemajuan sekolah.

b) Ikut mengadakan kritik dan saran perbaikan bagi kurikulum pendidikan pada sekolah tersebut.

c) Lebih meningkatkan partisipasi masyarakat dalam usahanya membantu lembaga pendidikan.

d. Tujuan Evaluasi

Sesuai dengan fungsi evaluasi yang dijelaskan di atas, evaluasi mempunyai empat tujuan sebagai berikut.

1) Mendeskripsikan kecakapan belajar siswa, sehingga dapat diketahui kelebihan dan kekurangannya dalam berbagai bidang studi/mata pelajaran yang dbutirpuhnya.

2) Mengetahui keberhasilan proses pendidikan dan pengajaran di sekolah yakni seberapa jauh keefektifannya dalam mengubah tingkah laku para siswa ke arah tujuan yang diharapkan.

3) Menentukan tindak lanjut hasil penelitian, yakni melakukan perbaikan dan penyempurnaan dalam hal program pendidikan dan pengajaran serta strategi pelaksanaannya.

4) Memberikan pertanggungjawaban dari pihak sekolah kepada pihak-pihak yang berkepentingan. Pihak yang dimaksud meliputi: pemerintah, masyarakat, dan para orang tua siswa.

Dalam hal kurikulum, evaluasi pendidikan memiliki tujuan untuk melakukan penilaian total terhadap pelaksanaan kurikulum pada suatu lembaga pendidikan, mencari faktor penghambat dan pendukung terhadap pelaksanaan commit to user

10 kurikulum. Dengan melakukan evaluasi kurikulum, keberhasilan secara operasional suatu lembaga pendidikan dapat diukur, sehingga dapat dilakukan penilaian terhadap efektivitas kelembagaan pendidikan.

e. Ruang Lingkup Evaluasi

Stufflebeam (dalam Thoha, 2001) membagi evaluasi pendidikan menjadi empat ruang lingkup, yaitu:

1) Evaluasi masukan (input) adalah evaluasi yang berkaitan dengan kualitas masukan yang berupa calon peserta didik, baik menyangkut faktor kemampuan intelektualnya maupun aspek kepribadian yang bersifat nonintelektif.

2) Evaluasi proses. Merupakan evaluasi yang sasarannya adalah proses belajar mengajar, termasuk faktor instrumentalnya, seperti: evaluasi terhadap kemampuan guru dalam mengajar, kesesuaian metode yang digunakan oleh guru, evaluasi kurikulum, evaluasi terhadap media pendidikan, dan kelembagaan pendidikan.

3) Evaluasi produk (output) adalah penilaian pendidikan yang sasarannya hasil akhir suatu proses pendidikan, yaitu peserta didik.

4) Evaluasi konteks. Merupakan evaluasi yang berkaitan dengan masalah-masalah kompleks yang melibatkan hal-hal di luar proses pendidikan tetapi ia secara langsung mempengaruhi proses maupun hasil pendidikan.

2. Taksonomi Tujuan Pendidikan Menurut Bloom

Hasil belajar adalah kemampuan-kemampuan yang dimiliki siswa setelah ia menerima pengalaman belajarnya. Untuk mengevaluasi hasil belajar siswa yang diharapkan, diperlukan tujuan yang bersifat operasional yaitu tujuan berupa tingkah laku yang dapat dikerjakan dan diukur. Tujuan berkaitan dengan sifat secara operasional dan tujuan pembelajaran khusus.

Benyamin Bloom mengklasifikasikan kemampuan hasil belajar ke dalam tiga kategori sebagai berikut.

perpustakaan.uns.ac.id digilib.uns.ac.id

a. Ranah kognitif, meliputi kemampuan menyatakan kembali konsep atau prinsip yang telah dipelajari dan kemampuan intelektual.

b. Ranah afektif, berkenaan dengan sikap dan nilai yang terdiri atas aspek penerimaan, tanggapan, penilaian, pengelolaan, dan penghayatan (karakterisasi).

c. Ranah psikomotorik, mencakup kemampuan yang berupa keterampilan fisik (motorik) yang terdiri dari gerakan refleks, keterampilan gerakan dasar, kemampuan perseptual, ketepatan, keterampilan kompleks, serta ekspresif dan interperatif.

Taksonomi tujuan pembelajaran dalam kawasan kognitif menurut Bloom terdiri atas enam tingkatan yaitu pengetahuan, pemahaman, penerapan, analisis, evaluasi dan mencipta. Keenam jenis taksonomi tersebut diuraikan satu per satu sebagai berikut.

a. Pengetahuan

Pengetahuan adalah kemampuan yang paling rendah tetapi paling dasar dalam kawasan kognitif. Kemampuan untuk mengetahui adalah kemampuan untuk mengenal atau mengingat kembali sesuatu objek, ide, prosedur, prinsip atau teori yang pernah dbutirukan dalam pengalaman tanpa memanipulasikannya dalam bentuk atau simbol lain. Kemampuan mengetahui sedikit lebih rendah dibawah kemampuan memahami, karena itu orang yang mengetahui belum tentu memahami atau mengerti apa yang diketahuinya.

b. Pemahaman

Pemahaman adalah kemampuan untuk memahami segala pengetahuan yang diajarkan seperti kemampuan mengungkapkan dengan struktur kalimat lain, membandingkan, menafsirkan, dan sebagainya. Kemampuan memahami dapat juga disebut dengan istilah “mengerti”.

Kemampuan-kemampuan yang tergolong dalam taksonomi ini, mulai dari yang terendah sampai yang tertinggi ialah:

1) Translasi, yaitu kemampuan untuk mengubah simbol tertentu menjadi simbol lain tanpa perubahan makna. commit to user

12 2) Interpretasi, yaitu kemampuan untuk menjelaskan makna yang terdapat di

dalam simbol, baik simbol verbal maupun nonverbal.

3) Ekstrapolasi, yaitu kemampuan untuk melihat kecenderungan atau arah atau kelanjutan dari suatu temuan.

c. Penerapan

Penerapan ialah kemampuan untuk menggunakan konsep, prinsip, prosedur atau teori tertentu pada situasi tertentu. Seseorang menguasai kemampuan ini jika ia dapat memberi contoh, menggunakan, mengklasifikasikan, memanfaatkan, menyelesaikan, dan mengidentifikasikan mana yang sama. d. Analisis

Analisis adalah usaha memilah suatu integritas menjadi unsur-unsur atau bagian-bagian sehinggga jelas susunannya. Secara rinci Bloom mengemukakan tiga jenis kemampuan analisis, yaitu: Menganalisis unsur, Menganalisis hubungan, dan Menganalisis prinsip-prinsip organisasi.

e. Evaluasi

Evaluasi merupakan kemampuan bila seseorang dapat melakukan penilaian terhadap suatu situasi, nilai-nilai, atau ide-ide. Evaluasi ialah kemampuan untuk mengambil keputusan, menyatakan pendapat atau memberi penilaian berdasarkan kriteria-kriteria tertentu baik kualitatif maupun kuantitatif. f. Mencipta

Mencipta merupakan kemampuan tertinggi yaitu bila seseorang dapat menggabungkan beberapa unsur menjadi suatu bentuk kesatuan. Ada tiga macam proses kognitif yang tergolong dalam kategori ini, yaitu: membuat (generating), merencanakan (planning), dan memproduksi (producing).

Taksonomi tujuan pengajaran pada kawasan afektif dikategorikan dalam lima jenis kategori yang menurut W. Gulo (2002) yaitu: penerimaan, tanggapan, penilaian, pengelolaan, dan penghayatan (karakterisasi).

a. Penerimaan, meliputi penerimaan secara pasif terhadap suatu masalah, situasi, gejala, nilai, dan keyakinan. Contoh kata kerja operasional yang biasa

perpustakaan.uns.ac.id digilib.uns.ac.id

digunakan untuk mengukur aspek penerimaan adalah memilih, mengikuti, meminati, memberi, dan sebagainya.

b. Tanggapan, berkenaan dengan jawaban dan kesenangan menanggapi atau merealisasikan sesuatu yang sesuai dengan nilai-nilai yang dianut masyarakat. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek tanggapan adalah mengajukan, melaporkan, menampilkan, mendukung, dan sebagainya.

c. Penilaian, berkenaan dengan nilai dan kepercayaan terhadap gejala atau stimulus tertentu. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek penilaian adalah meyakini, mengusulkan, menekankan, meyakinkan, dan sebagainya.

d. Pengelolaan, meliputi konseptualisasi nilai-nilai menjadi suatu sistem nilai. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek pengelolaan adalah mempertahankan, mengubah, memadukan, membentuk pendapat, dan sebagainya.

e. Penghayatan (karakterisasi), keterpaduan semua sistem nilai yang telah dimiliki seseorang yang mempengaruhi pola kepribadian dan tingkah lakunya. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek penghayatan adalah mendengarkan, memecahkan, mempengaruhi, dan sebagainya. Selain ranah kognitif dan ranah afektif, ranah psikomotorik termasuk ke dalam taksonomi tujuan pembelajaran menurut Bloom, seperti yang telah dijelaskan sebelumnya.

Taksonomi pembelajaran terhadap ranah psikomotorik secara garis besar dibedakan ke dalam empat tahap, yaitu:

a. Meniru merupakan kemampuan untuk melakukan sesuatu sesuai dengan contoh yang diamatinya walaupun belum mengerti makna atau hakikat dari keterampilanitu. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek ini adalah mengkonstruksi, menggabungkan, mengatur, menyesuaikan, dan sebagainya.

14 b. Memanipulasi merupakan kemampuan dalam melakukan suatu tindakan

seperti yang diajarkan, dalam arti mampu memilih yang diperlukan. Kata kerja yang sering digunakan dalam mengukur aspek ini adalah menempatkan, membuat, memanipulasi, merancang, dan sebagainya.

c. Pengalamiahan merupakan suatu penampilan tindakan dimana hal-hal yang diajarkan (sebagai contoh) telah menjadi suatu kebiasaan dan gerakan-gerakan yang ditampilkan lebih meyakinkan. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek ini diantaranya adalah memutar, memindahkan, menarik, mendorong, dan sebagainya.

d. Artikulasi merupakan suatu tahap dimana seseorang dapat melakukan suatu keterampilan yang lebih komplek terutama yang berhubungan dengan gerakan interpretatif. Contoh kata kerja operasional yang biasa digunakan untuk mengukur aspek ini adalah menggunakan, mensketsa, menimbang, menjeniskan, dan sebagainya.

3. Kata Kerja Operasional Hasil belajar Kognitif, Afektif, dan Psikomotor a. Ranah Kognitif

Ranah kognitif meliputi kemampuan menyatakan kembali konsep atau prinsip yang telah dipelajari dan kemampuan intelektual (knowledge). Sebagian besar tujuan instruksional berada dalam ranah kognitif. Kemudian Bloom membagi ranah kognitif kedalam enam jenjang kemampuan secara hierarkis, yaitu:

1) Recall of Data (Mengingat/C1)

Merupakan kemampuan menyatakan kembali fakta, konsep, prinsip, prosedur atau istilah yang telah dipelajari tanpa harus memahami atau dapat menggunakannya. Tingkatan ini merupakan tingkatan yang paling rendah namun menjadi prasyarat bagi tingkatan selanjutnya. Kemampuan yang dimiliki hanya kemampuan menangkap informasi kemudian menyatakan kembali informasi tersebut tanpa harus memahaminya. Contoh kata kerja yang digunakan, yaitu menyebutkan, mendefinisikan, menggambarkan, dll.

perpustakaan.uns.ac.id digilib.uns.ac.id

2) Comprehension (Memahami/C2)

Merupakan salah satu jenjang kemampuan dalam proses berpikir dimana siswa dituntut untuk memahami yang berarti mengetahui tentang sesuatu hal dan dapat melihatnya dari beberapa segi. Pada tingkatan ini, selain hapal siswa juga harus memahami makna yang terkandung misalnya dapat menjelaskan suatu gejala, dapat menginterpretasikan grafik, bagan atau diagram serta dapat menjelaskan konsep atau prinsip dengan kata-kata sendiri. Contoh kata kerja yang digunakan, yaitu menyajikan, menginterpretasikan, menjelaskan, dll.

3) Application (Menerapkan/C3)

Merupakan kemampuan berpikir lebih tinggi daripada pemahaman. Jenjang penerapan merupakan kemampuan menggunakan prinsip, teori, hukum, aturan, maupun metode yang dipelajari pada situasi baru atau pada situasi kongkrit. Contoh kata kerja yang digunakan, yaitu mengaplikasikan, menghitung, menunjukkan, dll.

4) Analysis (Menganalisis/C4)

Merupakan kemampuan untuk menganalisis atau merinci suatu situasi, atau pengetahuan menurut komponen yang lebih kecil atau lebih terurai dan memahami hubungan diantara bagian yang satu dengan yang lain. Contoh kata kerja yang dipakai, yaitu menganalisis, membandingkan, mengklasifikasikan. dll.

5) Evaluation (Mengevaluasi/C5)

Merupakan kemampuan untuk membuat pertimbangan (penilaian) terhadap suatu situasi, nilai-nilai atau ide-ide. Kemampuan ini merupakan kemampuan yang dapat melakukan penilaian terhadap situasi, nilai-nilai atau ide-ide. Evaluasi adalah pemberian keputusan tentang nilai sesuatu yang mungkin dilihat dari segi tujuan, gagasan, cara kerja, materi dan kriteria tertentu. Untuk dapat membuat suatu penilaian, seseorang harus memahami, dapat menerapkan, menganalisis terlebih dahulu. Contoh kata kerja yang digunakan yaitu menilai, menafsirkan, menaksir, memutuskan, dll.

16 6) Create (Mencipta/C6)

Merupakan kemampuan untuk menggabungkan beberapa unsur menjadi suatu bentuk kesatuan. Kemampuan ini adalah kemampuan tertinggi dari kemampuan lainnya. Untuk dapat mencipta, seseorang harus memahami, dapat menerapkan, menganalisis serta mengevaluasi terlebih dahulu. Contoh kata kerja yang digunakan, yaitu: membuat, merencanakan, memproduksi, dll

b. Ranah Afektif

Ranah afektif berkenaan dengan sikap, apresiasi, dan motivasi siswa dalam kegiatan belajar mengajar. Kartwohl & Bloom membagi ranah afektif menjadi lima aspek, yaitu:

1) Receiving (Penerimaan)

Merupakan tingkat afektif yang terendah, meliputi penerimaan secara pasif terhadap suatu masalah, situasi, gejala, nilai dan keyakinan. Misalnya mendengarkan dengan seksama penjelasan guru energi dan panas.

2) Responding (Jawaban)

Merupakan bagian afektif yang meliputi keinginan dan kesenangan menanggapi atau merealisasikan sesuatu sesuai dengan nilai-nilai yang dianut masyarakat. Misalnya menyerahkan laporan praktikum/tugas tepat waktu. 3) Valuing (Penilaian)

Mengacu pada nilai dan kepercayaan terhadap gejala atau stimulus tertentu. Misalnya menunjukkan rasa tanggung jawab terhadap alat-alat laboratorium yang dipakai waktu praktikum dan bersikap jujur dalam kegiatan pembelajaran.

4) Organization (Organisasi)

Meliputi konseptualisasi nilai-nilai menjadi satu sistem nilai. Sikap-sikap yang membuat lebih konsisten dapat menimbulkan konflik-konflik internal dan membentuk suatu sistem nilai internal. Sikap yang ditunjukkan misalnya mampu menimbang akibat positif dan negatifnya tentang kemajuan sains terhadap kehidupan umat manusia.

perpustakaan.uns.ac.id digilib.uns.ac.id

5) Characterization (Karakteristik)

Merupakan keterpaduan semua sistem nilai yang telah dimiliki seseorang yang mempengaruhi pola kepribadian dan tingkah lakunya. Misalnya bersedia mengubah pendapat jika ditunjukkan bukti-bukti yang tidak mendukung pendapatnya.

c. Ranah Psikomotor

Ranah psikomotor tampak dalam bentuk keterampilan manual fisik (skills) dan kemampuan bertindak individu. Harrow (dalam Arikunto, 2010) mengembangkan ranah psikomotor dengan enam jenjang, yaitu:

1) Gerakan refleks, gerakan yang tidak disadari.

2) Keterampilan gerakan-gerakan dasar, yaitu gerakan yang menuntut kepada keterampilan yang sifatnya kompleks.

3) Kemampuan perseptual, termasuk membedakan visual, auditif, motoris. 4) Kemampuan dalam bidang fisik, misalnya kekuatan, keharmonisan dan

ketepatan.

5) Gerakan-gerakan (skills), mulai dari keterampilan sederhana sampai kompleks.

6) Kemampuan yang berkenaan dengan komunikasi, seperti gerakan ekspresif & interpretatif.

4. Analisis Butir Soal

Hal-hal yang perlu diperhatikan dalam melakukan analisis butir soal adalah sifat dari instrumen soal tersebut. Sebagai contoh pada saat menganalisis sebuah instrumen soal pilihan ganda berbeda dengan pada saat menganalisis soal uraian yaitu soal berbobot yang memiliki rentang skor tiap butir soal. Pada soal pilihan ganda dapat dilakukan analisis validitas, reliabilitas, tingkat kesukaran, daya beda, dan efektivitas distraktor, sedangkan pada soal uraian tidak dilakukan analisis efektivitas distraktor. Selain itu, Analisis reliabilitas soal uraian tidak mungkin menggunakan formula KR-20 atau KR-21 seperti pada soal pilihan ganda, melainkan akan lebih tepat jika formula yang digunakan adalah formula commit to user

18 Alpha (Azwar, 2012; Linn & Groundlund, 2000; Widoyoko, 2010). Keterangan lebih detail akan dijelaskan sebagai berikut.

a. Validitas

Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan atau kebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti sejauh mana ketepatan alat ukur dalam melakukan fungsi ukurnya. Sebuah instrumen yang valid akan menghasilkan data yang tepat seperti yang diinginkan. Sebagai contoh, jika kita ingin mengetahui berat maka alat ukur yang tepat adalah timbangan/neraca bukan meteran atau alat yang lain. Dengan kata lain, sifat valid memberikan pengertian bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang diinginkan.

Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek dan mengendalikannya. Berbeda halnya jika kita akan melakukan pengukuran dalam dunia pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada pengukuran berat ataupun panjang. Untuk mengetahui alat ukur prestasi belajar apakah valid atau tidak maka perlu dipelajari dengan hati -hati.

Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak berlaku secara umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran yang baik (valid) untuk suatu tujuan tertentu yang sepesifik tetapi tidak valid untuk tujuan yang lain atau bahkan untuk tujuan yang sama pada kelompok yang lain.

Linn & Groundlund (2000) mengemukakan hakikat validitas tes dan asesmen sebagai berikut.

1) Validitas menyatakan ketepatan interpretasi hasil bukan pada prosedurnya. 2) Validitas merupakan persoalan yang berkaitan dengan derajat (tingkatan),

sebagai konsekuensinya kita harus menghindari pemikiran hasil asesmen sebagai valid atau tidak valid. Oleh karena validitas adalah persoalan derajad maka sebuah instrumen dapat dikategorikan mempunyai derajad validitas tinggi, sedang, dan rendah.

perpustakaan.uns.ac.id digilib.uns.ac.id

3) Validitas selalu bersifat khusus untuk penggunaan atau interpretasi tertentu. Tidak ada asesmen yang valid untuk semua tujuan. Sebagai contoh, hasil tes aritmatika mungkin mempunyai tingkat validitas yang tinggi untuk kemampuan hitung, validitas yang rendah untuk alasan-alasan aritmatika, dan mempunyai derajat validitas sedang untuk memprediksi kesuksesan prestasi matematika yang akan datang.

4) Validitas merupakan kesatuan konsep. Hakikat konsep validitas dipandang sebagai sebuah kesatuan konsep berdasark an berbagai macam bagian dari fakta.

5) Validitas melibatkan sebuah keputusan evaliatif yang menyeluruh.

Formula untuk menentukan besarnya validitas secara matematis dirumuskan sebagai berikut (Gregory, 2007).

Content Validity (CV) = D A + B+ C + D

Formula content validity di atas memerlukan 2 orang ahli/panelis untuk memeriksa kecocokan antara indikator dengan butir-butir instrumen, dalam bentuk menilai relevan (skor 3-4) atau kurang relevan (skor 1-2) masing-masing indikator butir bila dicocokkan dengan butir-butirnya. Dari formula di atas, A adalah jumlah butir yang kurang relevan menurut kedua ahli/panelis, B adalah jumlah butir yang relevan menurut ahli 1 dan yang kurang relevan menurut ahli 2, C adalah jumlah butir yang kurang relevan menurut ahli 1 dan yang relevan menurut ahli 2, dan D adalah jumlah butir yang relevan menurut kedua ahli/panelis. Hal yang diperhatikan ahli/panelis dalam menentukan kriteria butir adalah kesesuaian dengan indikator butir, konstruk butir dan tata bahasa. Dengan demikian, content validity dirumuskan untuk menghitung validitas keseluruhan instrumen. Kriteria yang digunakan adalah jika CV > 0,700, maka instrumen tersebut dinyatakan valid. Jika CV < 0,700 maka perlu merevisi butir-butir yang dinyatakan kurang relevan oleh ahli/panelis.

20

b. Reliabilitas

Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi

Dokumen terkait