1
Oleh: Rufi’i INDEKS
KESUKARAN INDEKS DAYA
BEDA
VALIDITAS KISI-KISI SOAL
RUBRIK
2
TUJUAN PENDIDIKAN NASIONAL
Nilai dan Sikap
(Affective)
C6 Evaluasi
(evaluation)
C5 Sintesis (synthesis)
C4 Analisis
(analysis)
C3 Penerapan
(application)
C2 Pemahaman
(comprehension)
C1 Ingatan
(knowledge)
A5 Menjadikan pola hidup
(characterization)
A4 Mengatur diri
(organization)
A3 Menghargai
(valuing)
A2 Menanggapi
(responding)
A1 Menerima
(receiving)
P5 Naturalisasi
(naturalization)
P4 Perangkaian (articulation)
P3 Ketepatan
(precision)
P2 Penggunaan
(manipulation)
P1 Peniruan
(imitation)
Terbuka Terbatas Benar-Salah Menjodohkan Pilihan Ganda
URAIAN
OBJEKTIF
T E S
3 4
PERBANDINGAN ANTARA
TES OBJEKTIF DENGAN TES URAIAN
Tes Objektif
Tes Uraian
Taksonomi yang diukur
Jumlah sampel materi
Penyusunan pertanyaan
Baik untuk mengukur C1, C2, C3, dan C4.
Kurang tepat untuk mengukur C5 dan C6 Dapat menanyakan lebih banyak sampel materi/bahan sehingga benar-benar mewakili bahan yang dipelajari Menyusun pertanyaan yang baik, sukar dan memerlukan waktu
Kurang baik untuk mengukur C1.
Baik untuk mengukur C2, C3, C4, C5, dan C6 Hanya dapat menanyakan beberapa pertanyaan sehingga kurang mewakili materi yang pernah diajarkan
5
PERBANDINGAN BUTIR PERTANYAAN
BENTUK OBJEKTIF DENGAN URAIAN
Pertanyaan Objektif
Pertanyaan Uraian
Pengolahan
Faktor-faktor yang mengganggu hasil pengolahan
Pengaruh terhadap murid
Pengolahan objektif, sederhana dan ketepatannya tinggi Hasil kemampuan murid dapat terganggu oleh kemampuan membaca dan terkesan
Mendorong murid untuk banyak mengingat, membuat interpretasi dan analisa ide orang lain
Pengolahan sangat subjektif, sukar, dan ketepatannya kurang Hasil kemampuan murid dapat terganggu oleh kemampuan menulis dan mendongeng
Mendorong murid untuk mengorganisir, menghubungkan, menyatakan idenya sendiri
6
Kisi – Kisi Objektif
N O.
POKOK BAHASAN
DAN SUB POKOK BAHASAN
JENJANG KEMAMPUAN DAN TINGKAT KESUKARAN BUTIR SOAL
PERSENTASE 100
7
Kisi – Kisi Tes Uraian
NO. POKOK BAHASAN & SUB POKOK
BAHASAN
JUMLAH SOAL PROSES BERPIKIR MAKSIMAL
JUMLAH BUTIR SOAL
PERSENTASE 100
KISI-KISI SOAL INDES KESUKARAN INDEKS DAYA BEDA
RELIABILITAS
VALIDITAS 8
1.
Saripati permasalahan harus ditempatkan pada
pokok soal
(Stem)
2.
Hindari pengulangan kata-kata yang sama
dalam pilihan
3.
Hindari rumusan kata yang berlebihan
4.
Bila pokok soal merupakan pernyataan yang
belum lengkap, maka kata yang melengkapi
harus diletakkan pada ujung pernyataan, bukan
di tengah-tengah kalimat
9
6.
Hindari kata-kata teknis, ilmiah atau istilah
yang aneh atau mentereng
7.
Semua pilihan jawaban harus homogen dan
dimungkinkan sebagai jawaban yang benar
8.
Hindari keadaan dimana jawaban yang benar
selalu ditulis lebih panjang dari jawaban
yang salah
9.
Hindari adanya petunjuk / indikator pada
jawaban yang benar
10. Hindari menggunakan pilihan yang berbunyi
“semua yang di atas benar” atau “tidak satu
pun yang di atas benar”
10
11. Gunakan tiga atau lebih alternatif pilihan
12. Pokok soal diusahakan tidak menggunakan
ungkapan atau kata-kata yang bermakna
tidak tentu
13. Pokok soal sedapat mungkin dalam
pernyataan atau pertanyaan positif
PERTANYAAN:
Hitunglah nilai X dari persamaan: X (X-5) = 4X-14
Contoh Pedoman Penilaian
NO. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
ASPEK / KONSEP YANG DINILAI X (X-5) = 4X - 14
X . X - 5 . X = 4X - 14 (KONSEP DISTRIBUTIF) X2- 5X = 4X - 14 (KONSEP KOMUTATIF)
X2- 5X - 4X = 4X - 4X - 14 (KONSEP ADITIF)
X2- 9X = -14
X2- 9X + 14 = 0
a. X1,2= atau b. (x - 7) (x - 2) = 0
X1,2=
X1,2= X - 7 = 0
X - 2 = 0 X1 = = 7
X1 - 7 = 0 X2 = = 2 X2 - 2 = 0
Skor Maksimum
SKOR 1 1 1 1 1 1 1 1 1 1 10 -b + b2- 4ac
2a 9 + 81 - 56
2 9 + 25
2 9 + 25 2 9 - 5
2
}
}
11 12
PERSIAPAN PEMERIKSAAN HASIL UJIAN
Tujuan:
•
Menyeragamkan persepsi semua
pemeriksa, khususnya terhadap
Pedoman Penilaian
•
Memeriksa Kesesuaian Pedoman
13
PERSIAPAN PEMERIKSAAN
HASIL UJIAN
Prosedur :
1. Memperbanyak pedoman penilaian sebanyak pemeriksa
2. Menelaah Pedoman Penilaian
3. Mengambil 5 sampel jawaban peserta ujian
4. Memperbanyak sampel tersebut sebanyak jumlah
pemeriksa
5. Semua pemeriksa memeriksa jawaban peserta (sampel)
mulai dengan butir No.1 berurut hingga nomor terakhir
6. Mengidentifikasikan apakah Pedoman Penilaian sudah
sesuai dengan kemampuan mahasiswa. Pedoman Penilaian
bila perlu harus diperbaiki agar sesuai dengan kemampuan
mahasiswa
14
MEMERIKSA LEMBAR
JAWABAN PESERTA
1. Periksa nomor demi nomor untuk setiap mahasiswa
(bukan memeriksa semua nomor untuk setiap
mahasiswa)
2. Sewaktu-waktu secara acak ketua pemeriksa
meminta hasil pemeriksaan anggota untuk mencek
apakah pemeriksa sudah konsisten memeriksa
sesuai dengan Pedoman Penilaian dan kesepakatan
panitia
3. Lembar jawaban diperiksa oleh minimal 2 orang
pemeriksa
4. Bilamana ditemukan perbedaan pemeriksaan
(skoring) yang sangat mencolok, pemeriksa harus
bertemu dan menentukan hasil penilaian
PEDOMAN PEMBERIAN NILAI
Untuk Butir Soal Uraian Terbuka
Jumlah rerata:
Persentase skor =
Jumlah skor rerata yang dicapai
jumlah skor maksimum
x 100
Skor
Pemeriksa1 Pemeriksa II Rerata Skor
Maksimum
Bobot
Kriteria
1.
Materi
2. Organisasi 3. Proses:3.1. Penyelesaian jawaban - Ketelitian - Konsisten - Keaslian 3.2. Argumentasi
- Ketelitian - Konsisten - Keaslian Jumlah Skor Maksimum
1 1/4
1/8 1/8 1/8 1/8 1/8 1/8
24 6
3 3 3 3 3 3 48
15
ANALISIS BUTIR SOAL
PILIHAN
C
D
0
B
A
KELOMPOK
Atas
Bawah
0
3
6
2
3
2
1
3
0
0
17
INDEKS TINGKAT KESUKARAN
KATEGORI BUTIR SOAL
PERSENTASE YANG
MENJAWAB BENAR
< 30 %
(30 - 40) %
(41 - 84) %
(85 - 90) %
> 90 %
Sangat sukar
Sukar
Sedang
Mudah
Sangat mudah
INDEKS DAYA PEMBEDA
KATEGORI BUTIR SOAL
INDEKS DAYA PEMBEDA
> 0,40
0,20 - 0,39
< 0,19
Baik
Cukup
Sedang
Kognitif
Tingkat Kata kerja
1
Mengenal/
Mengetahui
Mengidentifikasi, memilih, menyebutkan,
membuat daftar
2
Memahami
Membedakan, menjelaskan, menyimpulkan,
merangkumkan, memperkirakan,
3
Menerapkan
Mengitung, mengembangkan, menggunakan,
memodifikasi, mentransfer
4
Menganalisis
Membuat diagram, membedakan,
menghubungkan, menjabarkan
5
Mensintesis
Menciptakan, mendesain, memformulasikan,
membuat prediksi
6
Mengevaluasi
Mengkritik, menilai, membandingkan,
mengevaluasi,
18
Motorik
Tingkat Motorik
Kata kerja1 Meniru (menirukan sesuai dengan contoh
visual)
Mengulangi, mengikuti, memegang, menggambar, mengucapkan, dsb.
2 Memanipulasi (melakukan tindakan tanpa
bantuan visual)
Contoh kata kerja sama dengan kemempuan meniru
3 Mempunyai ketepatan gerakan (precision) Ada tambahan kata sifat yang menunjukkan tuntutan kemahiran seperti : dengan tepat, dengan lancar, tanpa kesalahan, dsb.
4
Mampu melakukan serangkaian gerakan dengan akurat, benar dan tepat waktu (mengartikulasi)
Ada tambahan kata sifat yang menunjukkan tuntutan tingkat artikulasi seperti : selaras, terkoordinasi, stabil, lancar, dsb.
5 Mampu melakukan serangkaian gerakan
dengan otomatis (naturalisasi)
Ada tambahan kata sifat yang menunjukkan tuntutan tingkat otomatisasi seperti : dengan otomatis, dengan sempurna, dengan lancar, dsb.
19
Afektif
Tingkat
Tujuan pembelajaran untuk…Pengenalan (receiving)
mengenal, bersedia menerima dan
memperhatikan berbagai stimulus
Pemberian Respon (responding)
berbuat sesuatu sebagai reaksi terhadap
suatu gagasan, benda atau sistem nilai, lebih
dari sekedar pengenalan
Penghargaan thd Nilai (valuing)
menghargai terhadap sesuatu nilai dan
secara konsisten berperilaku sesuai dengan
sesuatu nilai
Pengorganisasian (organization)
mengorganisasikan berbagai nilai yang
dipilihnya ke dalam satu sistem nilai
Pengamalan (characterization)
mengamalkan, mampu mengintegrasikan
nilai-nilai ke dalam suatu filsafat hidup dan
perilakunya
Syarat utama :
mampu mengukur
perubahan (kompetensi) sesuai
dengan tujuan yang telah
dirancangkan
.
harus
jelas
MUDAH di koreksi dan MUDAH
dan ADIL dalam pemberian skor.
21
Bagaimanakah soal ujian yang baik?
dilakukan dengan tes tertulis.
soal dan jawaban yang diberikan
kepada siswa dalam bentuk tulisan.
jawaban soal tidak selalu dalam
bentuk menulis jawaban tetapi dapat
juga dalam bentuk lain (memberi
tanda, mewarnai, menggambar dan
lain sebagainya)
22
Penilaian Tertulis
Tertulis tipe objektif
Benar-salah
Isian singkat
Pilihan ganda
Menjodohkan
23
Instrumen Tertulis
Tertulis tipe subjektif
•
Pengerjaan soal
•
Latihan (exercise)
•
Membaca
pemahaman
•
Esai berstruktur
•
Esai bebas
Tes tertulis bentuk uraian adalah alat penilaian
yang menuntut siswa untuk mengingat,
memahami, dan mengorganisasikan
gagasannya, dengan cara mengekspresikan
gagasan tersebut dalam bentuk uraian tertulis
dengan menggunakan kata-katanya sendiri.
Tes ini dapat menilai berbagai jenis
kemampuan, misalnya
mengemukakan pendapat, berpikir
logis, dan menyimpulkan.
24
Collection of one’s work
merupakan suatu koleksi pribadi hasil
pekerjaan seseorang (bersifat individual)
yang menggambarkan (merefleksi) taraf
pencapaian, kegiatan belajar, kekuatan, dan
pekerjaan terbaiknya.
Ciri dari koleksi ini dinamis, selalu
bertumbuh dan berubah
Umum dipakai pada penilaian diri (self
assesment)
suhardjono 2011 25
Portofolio
subjek yang ingin dinilai diminta untuk
menilai dirinya sendiri berkaitan dengan,
status, proses dan tingkat pencapaian
kompetensi yang dipelajarinya dalam mata
pelajaran tertentu.
dapat digunakan dalam berbagai aspek
penilaian, kognitif, afektif dan psikomotor.
26
Penilaian Diri
(
self assessment
)
Skor Kriteria
5
Penjelasan tentang simpangan baku sangat jelas, sangat rinci. Penjelasan itu, adalah: suatu nilai yang menunjukkan tingkat variasi suatu kelompok data. Simpangan baku merupakan ukuran dispersi yang sangat penting dan banyak dipergunakan dalam statistika. Simpangan baku untuk data sampel disebut s, sedangkan simpangan baku untuk populasi disebut σ. Jadi s merupakan statistik dan σ merupakan parameter.
4 Penjelasan tentang simpangan baku jelas, rinci.
3 Penjelasan tentang simpangan baku cukup jelas, cukup rinci.
2 Penjelasan tentang simpangan baku kurang jelas, kurang rinci.
1 Penjelasan tentang simpangan baku tidak jelas
0 Penjelasan tentang simpangan baku salah
Mengapa kita memerlukan simpangan baku?
KISI-KISI SOAL INDES KESUKARAN INDEKS DAYA BEDA
RELIABILITAS
VALIDITAS 28
INDEKS TINGKAT KESUKARAN
PERSENTASE YANG
MENJAWAB BENAR
KATEGORI BUTIR SOAL
< 0,30
0,31 - 0,70
0,71 – 1,00
Sukar
Sedang
Mudah
JS
B
P
P= Indeks Kesukaran
B= Banyaknya siswa yang menjawab
soal itu dengan betul
JS= Jumlah seluruh siswa peserta tes
KISI-KISI SOAL INDES KESUKARAN INDEKS DAYA BEDA
29
INDEKS DAYA BEDA
INDEKS DAYA
PEMBEDA
KATEGORI BUTIR SOAL
0,71 - 1,00
0,41 - 0,70
0,21 - 0,40
0,00 - 0,20
Baik sekali
Baik
P
JA : banyaknya peserta kelompok atas
JB : banyaknya peserta kelompok bawah
BA: banyaknya peserta kelompok atas yang
menjawab soal itu dengan benar
BB: banyaknya peserta kelompok bawah
yang menjawab soal itu dengan benar
KISI-KISI SOAL INDES KESUKARAN INDEKS DAYA BEDA
RELIABILITAS
Daya beda ditentukan untuk menilai seberapa
jauh suatu butir dapat membedakan skor tes
yang dari peserta tes yang tinggi dan rendah.
Indeks daya beda dianalisis dengan
menggunakan rumus Whitney dan Saber
(dalam Mehrens dan Lehmans, 1984:198)
Indeks kesukaran ditentukan dengan
menggunakan rumus Whitney dan Saber
(dalam Mehrens dan Lehmans, 1984:198)
31
INSTRUMEN YANG BAIK
VALID
Mengukur apa yg hendak diukur
VALIDITAS Yg telah ada
Membandingkan Program yg ada Konsultasi Ahli
VALIDITAS
EKSTERNAL
Fakta-fakta Empiris
Yg telah terbukti DibandingkanDengan standar yang telah terjadi
RELIABEL
Stability
Equivalent
Gabungan di atas
Test-Retest Kelompok sama Waktu berbeda Test Beda Waktu sama
Jenis
Validitas Penjelasan Cara mengukurnya
Validitas isi
Mengukur seberapa tepat item-item bisa mewakili keseluruhan item (substansi) dari yang diukur
Penilaian ahli (experts)
V. kriteria
Concurrent
Predictive
Mengukur seberapa tepat tesmengestimasi suatu kriteria
Mengukur seberapa tepat tes memprediksi suatu kriteria
Pilih kriteria dan korelasikan skor tes dengan skor kriteria saat itu
Pilih kriteria dan korelasikan skor tes dengan skor kriteria saat yang akan datang
Validitas konstruk
Mengukur seberapa tepat tes mengukur variabel (teori) yang melandasi konstruk
Mengukur (asses) landasan teoritis konstruk yang menjadi dasar pembuatan tes dan korelasikan skornya dengan skor tes
32
KISI-KISI SOAL INDES KESUKARAN INDEKS DAYA BEDA
Validitas isi bertujuan untuk mengestimasi dengan
analisis rasional, untuk mengetahui sejauh mana
butir-butir tes mencakup atau mencerminkan keseluruhan
kawasan isi objek yang hendak diukur (Allen dan Yen,
1979; Tuckman, 1975).
Koefisien korelasi antara skor butir dan skor total
peserta dihitung dengan korelasi Product-Moment
(Allen dan Yen, 1979)
Noresp Butir ke-i Skor peserta
1 2 3 4
1 21 22 22 22 87 2 16 18 17 16 67 3 14 15 14 10 53 4 22 23 24 24 93 5 15 19 16 17 67 6 16 18 16 17 67 7 21 20 19 20 80 8 18 19 17 19 73 9 20 21 20 19 80 10 19 18 18 18 73 11 21 22 23 21 87 12 12 12 11 12 47 13 15 16 15 14 60 14 22 21 22 22 87 15 13 14 13 13 53 16 17 19 19 18 73 17 21 20 19 20 80 18 21 22 22 22 87 19 22 21 22 22 87 20 19 18 18 18 73
Noresp Butir ke-i Skor peserta
1 2 3 4
21 14 13 13 13 53 22 13 14 13 13 53 23 19 21 22 18 80 24 23 24 23 23 93 25 13 14 13 13 53 26 12 11 13 11 47 27 17 16 21 19 73 28 14 17 17 19 67 29 11 14 11 11 47 30 21 23 21 22 87 31 16 15 15 14 60 32 13 12 14 14 53 33 9 14 10 14 47 34 19 17 15 16 67 35 11 12 10 14 47 36 13 17 14 16 60 37 14 19 16 18 67 38 19 19 17 18 73 39 17 14 19 17 67 40 19 16 17 21 73
Noresp
Butir ke-i
Skor
peserta
1
2
3
4
1
22
23
24
24
93
2
23
24
23
23
93
3
21
22
22
22
87
4
21
22
23
21
87
5
22
21
22
22
87
6
21
22
22
22
87
7
22
21
22
22
87
8
21
23
21
22
87
9
21
20
19
20
80
10
20
21
20
19
80
11
21
20
19
20
80
Total skor
Noresp
Butir ke-i
Skor
Total skor
butir
135
145
135
138
Nomor
butir
∑H
∑L
DK
DB
Koef.
korelasi
Simpulan
1
235
135 0,5584 0,6494
0,956
Valid
2
239
145 0,4965 0,6573
0,944
Valid
3
237
135 0,4935 0,6623
0,965
Valid
4
237
138 0,5032 0,6429
0,954
Valid
min)
(
Skormaks
skor
N
0,30 ≤DB≤ 0,70 valid
DB<0,30 atau DB>0,70 gugur
KISI-KISI SOAL INDES KESUKARAN INDEKS DAYA BEDA
RELIABILITAS VALIDITAS
TIPE-TIPE
RELIABILITAS YG DIUKUR METODE
KOEFISIEN RELIABILITAS
DINYATAKAN SEBAGAI TEST – RETEST
(STABILITY)
Berikan tes yang sama pada kelompok yang sama pada waktu berbeda
rtest1 – test2
PARALLEL
FORM (EQUIVALENCE)
Berikan 2 bentuk tes yg berbeda dari tes yg sama pada kelompok yang sama
rform1 – form2
INTER – RATER (AGREEMENT)
Berikan 2 penilai yang sama & tentukan jumlah kecocokan keduanya
persentase kecocokan
INTERNAL
CONSISTENCY CONSISTENCY
Korelasikan performan tiap item dengan keseluruhan performan siswa
•Cronbach’s alpha
• Kuder-Richardson
39
KISI-KISI SOAL INDES KESUKARAN INDEKS DAYA BEDA
RELIABILITAS VALIDITAS
Uji reliabilitas tes ditentukan dengan dengan
koefisien reliabilitas Alpha-Cronbach
TINGKATAN DOMAIN Cara penilaian
Tulis Objektif
Tulis
Sobjektif Lisan Ujukkerja Produk
Portofolio Portofolio Tingkah
laku
Kognitif
VI Evaluasi -- vv -- vv -- vv vv
V. Sintesis -- vv -- vv -- vv vv
IV. Analisis -- vv -- vv -- vv vv
III. Aplikasi -- vv vv vv vv vv vv
II. Pemahaman vv vv vv vv vv vv vv
I. Pengetahuan vv vv vv vv vv vv vv
Afektif
V. Karakterisasi -- -- -- -- -- vv
--IV. Organisasi -- -- -- vv -- vv
--III. Acuan nilai -- -- -- vv vv vv vv
II. Responsi -- -- -- vv vv vv vv
I. Penerimaan -- -- -- vv vv vv vv
Motorik
VI Gerakan indah dan kreatif -- -- -- vv vv --
--V. Gerakan terampil -- -- -- vv vv --
--IV. Gerakan kemampuan fisik -- -- -- vv vv --
--III. Gerakan persepsi -- -- -- vv vv vv
--II. Gerakan dasar -- -- -- vv vv vv
--I. Gerakan refleks -- -- -- vv vv vv vv