Validitas dan
Reliabilitas
Validitas
Reliabilitas
Validitas Internal (internal validity)
Validitas Eksternal (external validity)
Validitas Isi (content validity)
Validitas Konstruk (construct validity)
Reliabilitas Eksternal (external reliability)
Reliabilitas Internal (internal reliability)
Metode bentuk paralel (equivalent method) Metode tes berulang (test-retest method)
Instrumen skor diskrit
Instrumen skor non diskrit
• Instrumen dikatakan valid apabila instrumen tersebut dapat mengukur apa yang diukur dengan tepat.
• Validitas berkaitan dengan “ketepatan” dengan alat ukur.
• Instrumen yang valid akan menghasilkan data yang valid.
Validitas Instrumen
1. Validitas isi (content validity)
• validitas ini merupakan syarat yang
harus dipenuhi oleh instrumen yang berbentuk tes untuk mengukur hasil belajar. Uji validitas isi sering dijela skan melalui validitas tampang dan validitas logis (Djemari Mardapi)
2. Validitas konstruk (construct validity)
• Validitas konstruk mengacu pada seja uh mana suatu instrumen mengukur k onsep dari suatu teori, yaitu yang menj adi dasar penyusunan instrumen
Validitas Internal
Internal validitas dapat pula disebut sebagai
validitas logis yang berarti penalaran atau
rasional
Reliabilitas instrumen merupakan syarat untuk menguji validit as instrumen.Oleh karena itu instrumen yang valid dapat dipa stikan reliabel, namun Pengujian reliabilitas instrumen perlu d ilakukan
Reliabilitas Instrumen
1. Reliabilitas Eksternal (External Reliability)
a. Metode bentuk paralel (equivalent method)
Metode paralel dilakukan dengan cara menyusun dua instrumen yang hamp ir sama, kemudian diuji cobakan pada sekelompok siswa yang samapula.
b. Metode tes berulang (test-retest method)
Metode ini dilakukan untuk menghindari penyusunan instrumen dua kali. Ins trumen yang diuji coba cukup 1 instrumen dengan kelompok siswa yang sa
ma Reliabilitas Instrumen
Berdasarkan cara-cara melakukan pengujian tin gkat realiabilitas instrumen, secara garis besar ada dua jenis reliabilitas yaitu reliabilitas ekstern al dan reliabilitas internal:
2. Reliabilitas Internal (Internal Reliability)
a. Instrumen skor diskrit
Instrumen skor diskrit, nominal, atau pilah adalah instrumen skor jawaban/ pil ihan responhya hanya ada dua yaitu 1(satu) dan 0 (nol).
b. Instrumenskor non diskrit
Instrumenskor non diskrit adalah instrument pengukuran yang dalam
sistem penskorannya tidak menggunakan 1 dan 0 (satu dan nol), tetapi
bersifat gradual, yaitu ada penjenjangan skor, mulai dari skor tertingi
sampai skor terendah
a. tingkat kesukaran b. daya pembeda
c. berfungsinya pengecoh
01.
Tes
konsistensi internal (daya beda angket)
02.
Angket
Analisis Butir Instrumen
Tingkat Kesukaran Butir Soal
• Tingkat kesukaran butir soal adalah proporsi banyakn ya peserta yang menjawab benar butir soal tersebut t erhadap seluruh peserta tes
N
P = B
0 . 1 P
0 .
0
• Makin besar nilai P, butir soal semakin mudah
• Makin kecil nilai P, butir soal semakin sukar
• Rentangan nilai P adalah:
Tingkat Kesukaran Butir Soal
Sebuah butir mempunyai tingkat kesu karan baik, dalam arti dapat memberik an distribusi yang menyebar, jika tidak terlalu sukar dan tidak terlalu mudah
Tidak ada uji signifikansi untuk tingkat kesulitan
Pada instrumen untuk variabel terikat dituntut mempunyai tingkat kesukaran
yang memadai dalam rangka untuk m embuat variansi yang besar pada vari
abel terikat
Tingkat Kesukaran Butir Soal
7 . 0 P
3 .
0
• Untuk memperoleh skor yang menyebar , nilai P harus makin mendekati 0,5
• Biasanya kriterianya adalah sebagai beri
kut:
N
P = B
• Butir 1: P = 1.0
• Butir 2: P = 0.0
• Butir 3: P = 0.5
• Butir 4: P = 0.5
• Butir 5: P = 0.5
• Butir 6: P = 0.625
Contoh Mencari P
Daya Beda Butir Soal
Suatu butir soal mempunyai daya pe mbeda baik jika kelompok siswa pand
ai menjawab benar butir soal lebih ba nyak daripada kelompok siswa tidak p
andai
Daya beda suatu butir soal dapat dipa kai untuk membedakan siswa yang pa
ndai dan tidak pandai
Sebagai tolok ukur pandai atau tidak p andai adalah skor total dari sekumpul
an butir yang dianalisis
• Tidak ada uji signifikansi untuk daya pembeda
• Rentangan daya beda adalah -1.0 ≤ D ≤ 1.0
• Butir soal mempunyai daya pembeda baik jika D ≥ 0.30.
• Ada beberapa cara untuk mengukur daya pem beda
Daya Beda Butir Soal
Daya Beda Butir Soal
Cara Pertama:
N b B b N a
B a
D = −
p x 1
p x Y
1 Y Y
r pbis
D − −
=
= Cara Kedua:
Cara Ketiga:
dengan 2
n Y n
Y 2
Y
−
=
=
= −
) z ( f
p x Y
1 Y Y
r bis
D
2 z 2
2 1 e )
z (
f −
=
Cara keempat: dengan korelasi biserial (biserial correlation)
z dihitung dari p x , dengan p x merupakan luas daerah pada kurva normal, dihitun g dari kanan
Asumsi: X dan Y mempunyai distribusi normal bivariat.
The distribution of Y among examinees who have the same (fixed) value of X is a normal distribution.
Daya Beda Butir Soal
Notes: Cara kedua dan ketiga disebut korelasi biserial titik (point biserial correlation). Rumus ketiga adalah turunan dari rumus ke dua.
Pada ITEMAN, untuk mencari daya beda, digunakan korelasi bi
serial titik dan korelasi biserial. Bisa juga dengan SPSS.
Contoh Mencari Daya Beda dengan Rumus Pertama
• Butir 1: D = 0.0
• Butir 2: D = 0.0
• Butir 3: D = 1.0
• Butir 4: D = -1.0
• Butir 5: D = 0.5
• Butir 6: D = 0.75
• Butir 7: D = 0.0
N b B b N a
B a
D = −
Dalam hal ini: Aa, Bb, Cc, dan Dd merupakan
kelompok atas dan Ee, Ff, Gg, dan Hh merup
akan kelompok bawah
Contoh Mencari Daya Beda dengan
Rumus Kedua untuk Butir Ketiga
( 7 1 5 798 375 ) 1 0 0 5 5 1 1 798 625 0 . 903
D .
. .
. .
. = =
= − −
Contoh Mencari Daya Beda dengan
Rumus Ketiga untuk Butir Ketiga
Contoh Mencari Daya Beda dengan Rumus Keempat untuk Butir Ketiga
( )( ) 1 . 13
D 0 . 3989 5 . 0 798
. 1
375 .
5
7 =
= −
=
= −
) z ( f
p x Y
1 Y Y
r bis
D
p
x= 0.5; z = 0; f(z) = 0.3989
Pengecoh disebut berfungsi jika a. dipilih oleh sebagian siswa b. siswa kelompok pandai memil
ih lebih sedikit daripada siswa kelompok tidak pandai
Berfungsinya Pengecoh
Butir Soal
Suatu butir soal mempunyai pengecoh y ang baik jika banyaknya siswa yang me milih pengecoh tersebut sekurang-kuran gnya 2,5% (atau 5%) dan siswa kelomp ok pandai memilih lebih sedikit daripada siswa kelompok tidak pandai
%
) 100
1 /(
)
( x
IP N B n P −
= −
Berfungsinya Pengecoh Butir Soal
• Ada yang mengatakan bahwa pada suatu butir soal, pengecoh harus dipilih secara merata oleh peserta tes
• Indeks Pengecoh (IP) dirumuskan sebagai berikut:
dengan:
P = banyaknya peserta tes yang memilih pengecoh tertentu N = banyaknya seluruh peserta tes
B = banyaknya peserta tes yang menjawab benar butir soal yang bersangkutan
n = banyaknya alternatif jawaban
Dalam suatu angket, semua butir harus ko heren, mempunyai ar ah yang sama, tidak ada butir-butir yang b
erlawanan arah
Ini berarti, semua butir dalam suatu an gket harus saling kon sisten satu sama lain
Hal yang demikian ini menunjukkan bahwa semua butir mempun yai dimensi yang
sama
Yang dianggap seba gai arah adalah skor total dari sejumlah bu
tir yang dianalisis
Diperlukan indeks ko nsistensi internal (ya ng oleh sementara or
ang disebut validitas butir, tetapi ini bukan
validitas angket)
1 2 3 4 5
Konsistensi Internal Butir Angket
Ukuran konsistensi in ternal suatu butir ang ket adalah korelasi rX
Yantara skor butir an gket dengan skor tot
al
Tidak ada uji signifik ansi untuk ukuran ko
nsistensi internal
Pada umumnya, suat u butir angket disebu t mempunyai konsist ensi internal yang bai
k jika rXY≥ 0.30
Pada tes, konsistensi internal suatu butir s oal berfungsi sebagai
daya pembeda
6 7 8 9
Konsistensi Internal Butir Angket
Ini berarti, butir 1 dapat dipakai
Contoh Mencari
Konsistensi Internal Butir 1
Ini berarti, butir 2 tidak dapat dipakai
Contoh Mencari
Konsistensi Internal Butir 2
Instrumen disebut valid apabila mengukur apa yang
seharusnya diukur
Ada tiga jenis validitas:validitas isi, validitas berdasar kriteria,
dan validitas konstruks
Validitas
Instrumen
Untuk melihat validitas isi suatu instrumen, diperlukan seorang atau lebih validator
Tugas pokok validator adalah melakukan penilaian konten (content analysis) terhadap instrumen, antara lain:
1. mencocokkan kisi-kisi dengan definisi konseptual/oper asional variabel dan
2. melakukan penelaahan terhadap butir-butir instrumen
Validitas Instrumen
• Apakah variabel telah didefinisikan dengan be nar?
• Apakah kisi-kisi telah sesuai dengan definisi v ariabel?
• Apakah diperlukan revisi pada kisi-kisi?
• Jika diperlukan revisi, pada bagian mana?
Contoh Pertanyaan Kepada Validator Mengenai
Kesesuaian Kisi-kisi Dengan Definisi Variabel
• Segi Materi (Substansi)
(1) Materi sudah dipelajari oleh siswa (2) Butir soal sesuai dengan indikator (3) Antar butir tidak saling tergantung
• Segi Konstruksi
(1) Pokok soal dirumuskan dengan singkat dan jelas
(2) Pokok soal bebas dari pernyataan yang dapat menimbulkan penafsira n ganda
(3) Butir soal tidak tergantung kepada jawaban butir soal yang lain (4) Pengecohnya sudah disusun dengan baik
• Segi Bahasa
(1) Soal menggunakan bahasa Indonesia yang baik dan benar (2) Soal menggunakan bahasa yang komunikatif
(3) Soal tidak menggunakan bahasa yang berlaku setempat
Contoh Penelaahan Butir-butir Instrumen
Contoh Pertanyaan Kepada Validator Mengenai Penelaahan Butir Tes Dengan Kisi-kisi
Berilah tanda check pada kolom yang sesuai, jika butir soal telah
memenuhi kriteria penelaahan
Reliabilitas Instrumen
• Secara teoretik, konsep reliabilitas dikembangkan dari teori-teori p ada teori tes klasik.
• Asumsi pada teori tes klasik:
Reliabilitas Instrumen
• Dari asumsi-asumsi teori tes klasik tersebut di atas dapat dibuktikan berlakunya
formula berikut:
Instrumen disebut rel iabel jika menghasilk an skor yang konsist
en
Instrumen disebut rel iabel jika menghasilk an skor dengan kesal
ahan yang kecil
Ada berbagai macam cara untuk mengesti masi koefisien reliabil
itas, misalnya rumus Cronbach alpha atau rumus Kuder-Richard
son (KR)
Jika koefisien reliabili tas disebut r11 maka
tidak dilakukan uji si gnifikansi untuk r11,
tetapi ditentukan nilai ambang batas
tertentu untuk r11
Biasanya digunakan nilai 0.70 sebagai ambang batas. Jadi,
suatu instrumen dikatakan reliabel
jika r11≥ 0.70