PENGUKURAN TES PSIKOLOGI :
TEKNIK DAN METODOLOGI
RELIABILITAS DAN VALIDITAS
Tugas
1. Cari dan jelaskan reliabilitas dan validitas masing-masing tes psikologi berikut:
a. Wechsler-Bellevue Intelligence Scale
b. Edward’s Personal Preference Schedule
c. RMIB
d. Forer Sentence Completion Test
2. Jelaskan perbedaan kuesioner tes kepribadian dan
kuesioner Asperger Syndrome dengan kuesioner no 2 3. Cari dan jelaskan perbedaannya dengan tes-tes
Pengantar
• Seperti diketahui, tes-tes psikologi sangat banyak
• Pembuatan tes psikologi ???
• Apa benar bisa mengukur apa yg ingin diukur krn kaitannya dengan mental sso??
RELIABILITAS : KONSEP DASAR
• Definisi : merujuk pada kekonsistenan nilai yang
diperoleh oleh orang yang sama ketika diberikan tes yang sama namun pada waktu yang berbeda.
• Konsep yg mendasari reliabilitas ialah:
penghitungan eror pd st nilai ttt
• Eror yang dimaksud disini adalah : perbedaan antara kemampuan yg sebenarnya yg dimiliki oleh sso
• Pada tes psikologi, eror yg dimaksud bukan
merupakan kesalahan test taker atau kesalahan yg disengaja ketika proses pengerjaan tes,
• Namun merupakan ketidaktepatan dalam proses
pembuatan alat tes, seperti faktor2 X yg tdk terukur atau tdk tdeteksi pd pembentukan tes yg mengukur st pl.
• OKI, setelah membuat tes, kita harus mengukur
• Bahasa statistiknya, bila mlkk reliabilitas tes maka akan didapatkan perkiraan total variance atau variasi total dari nilai tes, yg disebut error variance
• Dengan memiliki tes yg minim eror maka tes tsb semakin reliabel.
• Misal : kita ingin mengukur fluktuasi mood. Maka bila nilai skor tesnya turun naik =
relibilitas = baik/buruk????
• Krn day-by-day changes in scores on a test would be relevant to the purpose of the test =
• Jadi, kondisi apapun yg tdk relevan dgn tujuan tes dibuat dpt menyebabkan error variance
• Sehingga, stp tester hrs mengusahakan kondisi tes yg seragam = lingkungannya, instruksi,
The Correlational Coefficient
• Ialah : derajat kekonsistenan dari dua nilai yg independent
• Simbol : r = relationship atau korelasi
• Korelasi ada 3 :
- Korelasi positif = kenaikan nilai di var X diikuti kenaikan var Y
- Korelasi negatif = reversal scores from one var to the other.
Pengukuran Korelasi
• Pearson Product-Moment Correlational Coefficient (PPMCC)
• Hasil dari PPMCC adl :
1. Posisi indv dlm kelomp (SS = standarad score) 2. Jumlah penyimpangan indiv = apk diatas mean or
dibawah mean kelp
• Statistical Significance
• Korelasi yg dihasilkan signifikan atau tidak?
• Untuk melihat itu digunakan level signifikansi = yi resiko kesalahan yang akan digunakan u/ menarik kesimpulan dari data yg ada
• Bila kita menyebutkan bhw korelasi signifikan di level .05 maksudnya adl probabilitas
kesalahannya adl 5 dari 100, begitu seterusnya
How reliable is reliable???
• Seberapa tinggi koefisien reliabilitas dikatakan memiliki reliabilitas yang tinggi?
BERBAGAI TIPE RELIABILITAS
1. Metode Tes-retest
• Ialah : metode yg digunakan u/ m’cari reliabilitas
dgn cara mengulang tes yg sama pada dua kesempatan yg berbeda
• Error variance yg diperoleh berasal dr fluktuasi
performance indiv di sesi 1 dan 2
• Selain itu eror dpt disebabkan keadaan indv ketika melakukan tes, spt sakit, cemas,
khawatir, dll
• Evaluasi test-retest
- Kelebihan : simpel dan straightforward
- Kekurangan : interval pendek = recall their
BERBAGAI TIPE RELIABILITAS
2. Alternate-Form Reliability
• Salah satu metode mendapatkan reliabilitas tes dgn memberikan tes yg bentuknya setara pada kesempatan yg berbeda namun pada
indv yang sama
3. Split-Half Reliability
• Internal consistency : apakah belahan 1 dan belahan 2 itemnya konsisten = content
sampling
• Yang dilihat adalah item-itemnya konsisten apa tdk
4. Kuder-Richardson Reliability dan Coefficient Alpha
• Single administration of single form
• Yang ditekankan adalah inter item consistency = yi konsistensi jawaban terhadap item
• Eror variance nya didpt dari : 1. Content sampling
Sumber error dalam metode asesmen
reliabilitas
Sumber eror Contoh Metode How assessed
Time sampling Tes yg sama diberikan pada 2 wkt yg berbeda
Tes-retest Korelasi ant 2 skor yg didapat pada 2 kesempatan tsb. Item sampling Item-item yg
berbeda yg
digunakan untuk mengukur 1 pl
Alternate forms or parallel forms
Korelasi antara bentuk tes yg mirip yg memiliki item2 yg berbeda
Internal consistency
Item2 yg konsisten pada tes yg sama
Split half, KR20, dan alpha cronbach
Observer differences
Catatan yg berbeda dari msg2 observer
VALIDITAS : KONSEP DASAR
• Ialah : apakah tes mengukur apa yang ingin
diukur dan seberapa jauh dpt mengukur apa yg ingin diukur tsb
• Jd jangan tll percaya dengan judul dari tes, biasanya hiperbola
• So, kl ingin buat alat tes yang baik jg harus
• Lebih lanjut lagi, validitas tes tdk dpt
dilaporkan sbg “tinggi” atau “rendah” tp apk
isi tes tsb mengukur apa yg ingin diukur
• Misal : tes informal “ingin mengetahui
kemampuan berhitung anak usia 5 thn”. Isi tes
= kebanyakan soal2 yg kaitannya dgn geometrik = TES TDK VALID
• Fundamentally, all procedures for determining test validity are concerned with relationship
between performance on the test and other independently observable facts about the
METODE MENDAPATKAN
VALIDITAS TES
1. Content-Description Procedures
• Melibatkan pemeriksaan sistematis terhadap isi tes
u/ melihat apk tes tsb m’cover contoh perilaku yg
akan diukur
• Caranya :
- Menggunakan subject-matter expert
- Item2 yg didapat dr expert dispesifikkan = topiknya, tujuan instruksional tes
• Content-validity jangan disamakan dgn face validity
• Krn face validity bukan fokus pd cara2
2. Construct-Identification Procedures
• Construct-validity berfokus pd peran teori2 psikologi. Hal ini dilakukan untuk menyusun definisi operasional tingkah laku yg akan
diukur dlm tes
• Contoh konstrak adl aptitude, scholastic,
3. Criterion-Prediction Procedures
• Prosedur ini mengindikasikan keefektifan tes dalam memprediksi kinerja individu di masa yad
• Jd sering disebut : predictive validity
• Misal : tes bakat = apk tes tersebut dpt
meramalkan performance kita di masa yad.
• Contoh lain : tes yg diberikan u/ job