Pengembangan Tes Hasil Belajar

BAB II LANDASAN TEORI

4. Pengembangan Tes Hasil Belajar

Dalam program penilaian pendidikan di sekolah pentestingan lebih dominan digunakan oleh guru untuk mengukur hasil belajar siswa. Menurut (Mudjio, 1995: 3) tes memiliki kegunaan-kegunaan tertentu yang mungkin sulit dicapai oleh teknik-teknik lainnya. Tuckman mengatakan kegunaan-kegunaan itu sebagai berikut :

a. Untuk mendukung obyektivitas pengamatan yang dilakukan guru. b. Untuk menimbulkan perilaku di bawah kondisi yang relatif terkontrol. c. Untuk mengukur sampel kemampuan individu (siswa).

d. Untuk memperoleh kemampuan-kemampuan dan mengukur hasil yang sesuai dengan tujuan dan tolok ukurnya.

e. Untuk mengungkapkan perilaku yang tidak kelihatan.

f. Untuk mendeteksi karakteristik dan komponen-komponen perilaku. g. Untuk meramalkan perilaku yang akan datang.

h. Untuk menyediakan data sebagai umpan balik dan membuat keputusan.

Di sekolah seringkali digunakan tes buatan guru yang disebut teacher made test. Tes yang dibuat oleh guru terutama untuk menilai kemajuan siswa dalam pencapaian hal yang dipelajari. Sebelum menuliskan sebuah tes menurut Depdiknas(2008 :9) ada beberapa langkah yang harus disiapkan oleh setiap guru agar menghasilkan suatu tes yang handal dan sahih, yaitu : (1)menentukan tujuan tes, (2) memperhatikan standar kompetensi (SK) dan kompetensi dasar (KD), (3) menentukan jenis alat ukurnya, (4) menyusun kisi-kisinya dan menulis butir soal beserta pedoman penskorannya. Berikut ini adalah penjelasan dari langkah-langkah tersebut :

a. Menentukan tujuan penilaian.

Tujuan penilaian sangat penting karena setiap tujuan memiliki penekanan yang berbeda-beda. Misalnya untuk tujuan tes prestasi belajar, diagnostik, atau seleksi.

commit to user

Kompetensi merupakan acuan/target utama yang harus dipenuhi atau yang harus diukur melalui setiap kompetensi dasar yang ada atau melalui gabungan kompetensi dasar.

c. Menentukan jenis alat ukurnya.

Menentukan jenis alat ukur disini adalah, jenis alat ukur apa yang sebaiknya digunakan apakah alat ukur yang berupa tes ataukah non tes. Penggunaan materi dilakukan sebagai pendukung kompetensi dasar. Syaratnya adalah materi yang diujikan harus mempertimbangkan urgensi (wajib dikuasai peserta didik), kontinuitas (merupakan materi lanjutan), relevansi (bermanfaat terhadap mata pelajaran yang lain), dan keterpakaian dalam kehidupan sehari-hari tinggi (UKRK). Setelah menentukan jenis tes apa yang digunakan maka kemudian ditentukanlah bentuk tes yang sebaiknya digunakan.

Menurut Djemari Mardapi (2008 : 69) “ Bentuk tes yang digunakan di lembaga pendidikan dapat dikategorikan menjadi dua jenis, yaitu tes objektif dan tes non objektif . Objektif dapat dilihat dari system penskorannya, siapapun tester yang memeriksa lembar jawaban akan menghasilkan skor yang sama. Sedangkan tes non objektif adalah tes yang system penskorannya dipengaruhi subjektifitas pembuat skor. Menurut Djemari Mardapi (2008 : 73) “Bentuk tes ini menuntut kemampuan peserta didik untuk menyampaikan, memilih, dan memadukan gagasan atau ide yang telah dimilikinya dengan menggunakan kata- katanya sendiri “.

Tes objektif ada bermacam-macam jenisnya, yaitu menjodohkan benar-salah, dan pilihan ganda. Tes pilihan ganda sering digunakan pada mata pelajaran eksak. Menurut Djemari Mardapi (2008 : 70) “Soal pada tes ini jawabannya hanya satu, mulai dari memilih rumus yang tepat, memasukkan angka dalam rumus, menghitung hasil dan menafsirkan hasilnya”.

Tes pilihan ganda merupakan salah satu jenis tes obyektif. Tes jenis pilihan ganda menghadapkan kepada siswa sejumlah alternatif jawaban, umumnya antara 3 sampai 5 alternatif untuk setiap soal. Siswa diharuskan memilih salah satu dari beberapa alternatif jawaban tersebut yang dianggap benar berdasarkan suatu dasar pemikiran tertentu. Ada beberapa istilah yang

commit to user

seringkali terdapat dalam tes jenis ini antara lain stem, options, key, dan distractors.

Stem adalah bagian pokok dari soal yang merumuskan isi soal. Stem bisa berbentuk pertanyaan, perintah maupun kalimat tidak sempurna. Alternatif-alternatif jawaban yang menyertainya dinamakan options atau kalau diterjemahkan secara langsung pilihan-pilihan. Alternatif yang benar dinamakan key ataau kunci, sedangkan alternatif-alternatif lainnya yang bertujuan mempersulit proses pencapaian jawaban yang benar dinamakan distractors, atau kalau secara langsung diterjemahkan penganggu-pengganggu/ pengecoh (Slameto, 2001: 59).

Tes pilihan ganda dikatakan baik apabila murid-murid yang menguasai bahan pelajaran dapat menunjukkan secara jelas jawaban mana yang benar dan dapat memlihnya. Sebaliknya murid-murid yang tidak menguasai bahan-bahannya akan mendapat kesulitan untuk mengidentifikasi jawaban yang benar. Hal ini disebabkan berfungsinya distactor pada item tersebut. Distractor tersebut cukup dapat menarik perhatian untuk dijadikan pilihan yang benar (Moh Kasiram, 1984: 24).

Tes pilihan ganda saat ini banyak dipakai dan dikembangkan untuk ujian sekolah terutama pada ulangan harian maupun akhir semester dan ujian akhir sekolah serta ujian masuk perguruan tinggi. Tes pilihan ganda dianggap mempunyai tingkat validitas dan reliabilitas yang tinggi, selain itu tes ini juga bersifat fleksibel . T Raka Joni (Mudjio, 1995: 2) menyatakan bahwa jenis tes bentuk multiple choice merupakan bentuk tes yang sangat fleksibel. Demikian fleksibelnya sehingga batas kemungkinan pemakaiannya itu adalah ditentukan oleh daya pikir dan cipta penyusunnya (Mudjio, 1995: 3).

Adapun untuk mengolah skor dalam tes bentuk pilihan ganda digunakan 2 macam rumus :

1) Dengan denda

commit to user

Keterangan :

S = skor yang diperoleh (Raw Score) R = jawaban yang betul

W = jawaban yang salah O = banyaknya option

1 = bilangan tetap 2) Tanpa denda

S = R

Keterangan :

S = skor yang diperoleh (Raw Score) R = jawaban yang betul

Pada pengembangan instrumen tes ini, skor penilaian siswa adalah tanpa denda.

Kaidah penulisan soal bentuk pilihan ganda seperti yang dikemukakan oleh Sumarna Surapranata (2005: 243-244) meliputi enam belas hal sebagai berikut

1) Materi soal yang disajikan minimal mencerminkan jabaran substansi materi yang terkandung dalam Standar Kompetensi dan Kompetensi Dasar.

2) Pengecoh harus berfungsi.

3) Setiap soal harus mempunyai satu jawaban yang benar atau paling benar.

4) Pokok soal harus dirumuskan secara jelas dan tegas.

5) Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang diperlukan.

6) Pokok soal jangan memberi petunjuk kearah jawaban benar.

7) Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda.

8) Pilihan jawaban harus homogen dan logis ditinjau dari segi materi. 9) Panjang rumusan pilihan jawaban harus relatif sama.

10)Pilihan jawaban yang berbentuk angka atau waktu harus disusun berdasarkan urutan besar kecilnya nilai angka tersebut atau kronologis waktunya.

11)Gambar, grafik, tabel, diagram dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi.

12)Butir soal jangan bergantung pada jawaban soal sebelumnya. 13)Pilihan jawaban jangan mengulang kata atau frase yang bukan

commit to user

14)Menggunakan bahasa yang komunikatif sehingga mudah dimengerti.

15)Setiap soal harus menggunakan bahasa yag sesuai dengan kaidah bahasa Indonesia.

16)Jangan menggunakan bahasa daerah setempat jika soal akan digunakan untuk daerah lain atau nasional.

Sebuah tes dikatakan baik sebagai alat pengukur harus memenuhi persyaratan tes, yaitu memiliki :1) validitas, 2) reliabilitas, 3) obyektivitas, 4) praktikabilitas, 5) ekonomis (Suharsimi Arikunto, 1995:56). Keterangan dari masing-masing ciri akan diberikan dengan lebih terperinci sebagai berikut: 1). Validitas

Sebuah tes disebut valid apabila tes itu dapat tepat mengukur apa yang hendak diukur. Ada beberapa macam validitas yaitu validitas logis (logical validity), validitas ramalan (predictive validity), dan validitas kesejajaran (concurrent validity).

2). Reliabilitas

Tes dikatakan dapat dipercaya (reliabel) jika memberikan hasil yang tetap apabila diteskan berkali-kali. sebuah tes dikatakan reliable apabila hasil-hasi tes tersebut menunujukkan ketetapan. Jika kepada para siswa diberikan tes yang sama pada waktu yang berlainan, maka setiap siswa akan tetap berada pada urutan (rangking) yang sama dalam kelompoknya.

3). Objektivitas

Sebuah tes dikatakan memiliki objektivitas apabila dalam melaksanakan tes itu tidak ada faktor subyektivitas yang mempengaruhi. apabiladikaitka dengan reiliabilitas, maka objektivitas menekankan ketetapan (consistency) dalam scoring sedangkan reliabilitas menekankan tetetapan dalam hasil tes.

4). Praktikabilitas

Sebuah tes dikatakan memiliki praktikabilitas tinggi apabila tes tersebut bersifat praktis, tes yang praktis adalah tes yang sebagai berikut :

commit to user

a) Mudah dilaksanakan, misalnya tidak menuntut peralatan yang banyak dan memberi kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap mudah oleh siswa.

b) Mudah pemeriksaannya, artinya tes itu dilengkapi dengan kunci jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif, pemeriksaan akan lebih mudah dialkukan jika dikerjakan oleh siswa dalam lembar jawaban.

c) Dilengkapi dengan petunjuk-petunjuk yang jelas sehingga dapat diberikan oleh orang lain.

5). Ekonomis

Ekonomis yang dimaksudkan disini ialah pelaksanaan tes tersebut tidak membutuhkan biaya yang mahal, tenaga yang banyak dan waktu yang lama.(Suharsimi Arikunto, 1995:56-61)

Secara umum ada beberapa prinsip dasar yang perlu dicermati dalam menyusun tes hasil belajar agar tes tersebut dapat mengukur tujuan instruksional khusus untuk mata pelajaran yang telah diajarkan atau mengukur kemampuan dan keterampilan peserta didik yang diharapkan, setelah mereka menyelesaikan suatu unit pengajaran tertentu, yaitu :

1) Tes hasil belajar harus dapat mengukur secara jelas hasil belajar (learning outcomes) yang telah ditetapkan sesuai dengan tujuan instruksional.

2) Butir-butir soal tes harus merupakan sampel yang representatif dari populasi bahan pelajaran yang telah diajarkan.

3) Bentuk soal yang dikeluarkan dalam tes hasil belajar harus dibuat bervariasi.

4) Tes hasil belajar harus didesain sesuai dengan kegunaannya untuk memperoleh hasil yang diinginkan.

5) Tes hasil belajar harus memiliki reliabilitas yang dapat diandalkan.

6) Tes hasil belajar disamping harus dapat dijadikan alat pengukur keberhasilan belajar siswa, juga harus dapat dijadikan alat untuk mencari informasi yang berguna untuk memperbaiki cara belajar siswa dan cara mengajar guru itu sendiri. (Anas Sudijono, 2005: 97-98 )

commit to user

Langkah awal dalam perencanaan pengembangan tes adalah menetapkan spesifikasi tes yaitu suatu uraian yang menunjukkan keseluruhan kualitas dan ciri-ciri yang harus dimiliki oleh tes yang akan dikembangkan (Sumadi,1987:5). Kegiatan merencanakan spesifikasi tes merupakan proses pengambilan keputusan. Keputusan yang diambil berupa keputusan yang berdasarkan pertimbangan berbagai hal. Berikut beberapa pertimbangan yang perlu diperhatikan dalam merencanakan spesifikasi tes menurut Sumadi Suryabrata (1987:5) :

1) Menentukan tujuan-tujuan umum serta persyaratan tes

2) Menyusun “blue print” atau kisi-kisi tes yang memuat secara khusus ruang lingkup serta tekanan tes dan bagian-bagiannya.

3) Memilih tipe-tipe soal

4) Menentukan taraf kesukaran soal dan distribusinya

5) Menentukan banyaknya soal untuk seluruh tes dan untuk masing-masing bagiannya

6) Menentukan cara mengkompilasikan soal-soal dalam bentuk akhirnya, dan 7) Menyiapkan penulisan soal (item writing) dan penelaahan soal (item

review).

Jika sebuah instrumen tes sudah memenuhi kaidah – kaidah seperti diatas, maka untuk melihat kevalidan sebuah tes maka tes tersebut perlu diujikan untuk bisa melihat apakah tes tersebut baku atau tidak. Kriteria yang harus terpenuhi dari sebuah tes baku adalah sebagai berikut :

1) Taraf kesukaran

Tingkat kesukaran adalah angka yang menunjukan proporsi siswa yang menjawab betul suatu soal (Slameto,2001). Makin besar tingkat kesukaran berarti soal itu makin mudah demikian juga sebaliknya yaitu makin rendah tingkat kesukaran berarti soal itu makin sukar. Menurut Suharsimi Arikunto (2001 : 207), “Soal yang baik adalah soal yang tidak terlalu mudah dan tidak teralu sulit”. Oleh karena itu, dapat dinyatakan bahwa soal yang baik adalah soal dengan taraf kesukaran yang sedang.

commit to user

Untuk menentukan taraf kesukaran dari tiap-tiap item soal digunakan rumus :

Keterangan :

P : indeks kesukaran

B : banyaknya siswa yang menjawab soal betul Js : jumlah seluruh siswa peserta tes

Taraf kesukaran soal dapat ditentukan berdasarkan hasil perhitungan indeks kesukaran dengan ketentuannya sebagai berikut : a) Soal sukar jika : 0,00 ≤ P < 0,30

b)Soal sedang jika : 0,30 ≤ P _0,70 c) Soal mudah jika : 0,70 _P_1,00 (Allen & Yen, 1979 : 121)

Menurut Elvin & Surantoro (2010 :185) tingkat kesukaran yang berada di sekitar 0,5 dianggap yang terbaik, asumsi yang digunakan yaitu bahwa soal yang terlalu mudah atau cenderung mudah lebih tepat digunakan untuk tes diagnostik. Sedangkan soal yang terlalu sulit atau cenderung sulit lebih tepat digunakan untuk tes seleksi. Oleh karena itu, untuk keperluan tes yang mengukur hasil belajar (kompetensi) siswa tertentu akan dianggap baik bila termasuk dalam interval sedang.

2) Daya Beda

Daya beda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi dengan testee yang kemampuannya rendah demikian rupa sehingga sebagian besar testee yang memiliki kemampuan yang tinggi untuk menjawab butir item tersebut lebih banyak menjawab butir item tersebut lebih banyak yang menjawab betul, sementara testee yang kemampuannya rendah untuk menjwab butir item tersebut sebagian besar tidak dapat menjawab item dengan betul (Anas sudijono, 2001). Untuk menghitung

commit to user

daya pembeda setiap soal, dapat digunakan rumusan menurut Azwar (2007 :138) sebagai berikut :

Keterangan :

niT : Jumlah peserta tes yang menjawab benar dari kelompok tinggi NT : Jumlah peserta tes kelompok atas

niR :Jumlah peserta tes yang menjawab benar dari kelompok rendah NR : Jumlah peserta tes kelompok rendah

D : Daya Pembeda, rumus daya pembeda

Daya pembeda soal (nilai D) diklasifikasikan sebagi berikut menurut Djemari (2005 :5) :

a) D < 0,1 : ditolak b) 0,1 D 0,3 : direvisi c) D > 0,3 : diterima 3)Efisiensi Pengecoh (Distraktor)

Pada tes pilihan ganda terdapat beberapa pilihan jawaban, dan hanya ada satu pilihan jawaban yang benar. Penyebaran pilihan jawaban dijadikan dasar dalam penelaahan soal. Hal ini dimaksudkan untuk mengetahui berfungsi tidaknya jawaban yang tersedia. Pilihan jawaban selain kunci jawaban disebut pengecoh (distraktor). Menurut Elvin & Surantoro (2010 :186) “Efektifitas pengecoh merupakan seberapa baik pilihan jawaban yang salah dapat mengecoh peserta tes yang memang tidak mengetahui kunci jawaban yang tersedia “.Oleh karena itu semakin banyak peserta tes yang memilih pengecoh maka semakin baik pula pengecoh menjalankan tugasnya.

Menurut Azwar (2007 :142) efektifitas distraktor dapat dilihat dari dua criteria, yaitu; 1) distraktor dipilih oleh peserta tes dari kelompok rendah, dan 2) pemilih distraktor tersebar relative proporsional pada masing-masing distraktor yang ada. Sedangkan menurut Suharsimi (2001 : 211) soal pilihan jawaban (pengecoh) dapat dikatakan berfungsi apabila

commit to user

pengecoh: 1) paling tidak dipilih oleh 5 % peserta tes atau siswa , 2) lebih banyak dipilih oleh kelompok siswa yang yang belum paham materi. 4)Reliabilitas

Reliabilitas suatu tes adalah kemampuan suatu tes untuk memberikan hasil yang relatif ajeg atau tetap bila digunakan pada waktu atau tempat yang berlainan. Untuk menghitung reliabilitas digunakan rumus yang dikemukakan oleh Kuder dan Richardson (rumus K-R 20) sebagai berikut: 2 11 2 n S Σpq n 1 S r _       _      Keterangan :

r11 : reliabilitas tes secara keseluruhan

p : proporsi subyek yang menjawab item dengan benar

q : proporsi subyek yang menjawab item dengan salah (q = 1-p) Σpq : jumlah hasil perkalian antara p dan q

n : banyaknya item

S : standar deviasi dari tes

Hasil perhitungan tingkat reliabilitas tersebut kemudian dikonsultasikan dengan tabel r product moment. Apabila harga rhitung > rtabel

, maka dapat ditarik kesimpulan bahwa instrumen tes reliabel. Selain itu, terdapat beberapa kriteria nilai reliabilitas sebagai berikut :

1. 0,800 ≤ r11≤ 1,00 : sangat tinggi 2. 0,600 ≤ r11 < 0,800 : tinggi 3. 0,400 ≤ r11 < 0,600 : cukup 4. 0,200 ≤ r11 < 0,400 : rendah 5. 0,000 ≤ r11 < 0,200 : sangat rendah (Slameto, 2001:215) d. Menyusun Kisi-kisi tes.

Menurut Depdiknas (2008 :15) “kisi-kisi(test blue print atau table of specification) merupakan deskripsi kompetensi dan materi yang akan diujikan. Tujuan penyusunan kisi-kisi adalah untuk menentukan ruang lingkup dan

commit to user

tekanan tes yang setepat-tepatnya, sehingga dapat menjadi petunjuk dalam menulis soal”. Kisi-kisi ini perlu dibuat terlebih dahulu agar seandainya soal ini dibuat oleh siapa pun dapat memiliki bobot yang sama, meskipun dibuat oleh orang yang berbeda.

Menurut Depdiknas (2008:15) kisi-kisi yang baik harus memenuhi beberapa persyaratan berikut ini:

1). Kisi-kisi harus dapat mewakili isi silabus /kurikulum atau materi yang telah diajarkan secara tepat dan proporsional.

2). Komponen-komponennya diuraikan secara jelas dan mudah dipahami. 3). Materi yang hendak ditanyakan dapat dibuatkan soalnya.

Dalam pembuatan kisi-kisi diawali dengan penjabaran Standar Kompetensi (SK) dan Kompetensi Dasar (KD) menjadi indicator. Menurut Depdiknas (2008 : 15) “Indikator dalam kisi-kisi merupakan pedoman dalam merumuskan soal yang dikehendaki”. Untuk merumuskan indikator dengan tepat, para tutor/guru harus memperhatikan isi kolom dalam kisi-kisi yaitu : materi yang akan diujikan, hasil belajar/pengalaman belajar/indikator pembelajaran, dan kompetensi dasar. Indikator yang baik adalah indikator yang dirumuskan secara singkat dan jelas. Menurut Depdiknas(2008:15-16) syarat indikator yang baik adalah :

1). Menggunakan kata kerja operasional (perilaku khusus) yang tepat,

2). Menggunakan satu kata kerja operasional untuk soal objektif, dan satu atau lebih kata kerja operasional untuk soal uraian/ tes perbuatan,

3). Dapat dibuatkan soal atau pengecohnya (untuk soal objektif).

B. Kajian Penelitian yang Relevan

Dalam dokumen PENGEMBANGAN INSTRUMEN TES FORMATIF FISIKA KELAS XI SEMESTER GASAL PROGRAM AKSELERASI (Halaman 61-71)