KARAKTERISTIK PSIKOMETRI SUBTES WORTAUSWAHL
(WA) PADA INTELLIGENZ STRUKTUR TEST (IST)
SKRIPSI
Diajukan untuk memenuhi persyaratan
Ujian Sarjana Psikologi
Oleh:
DERMIKA SIRAIT
071301050
FAKULTAS PSIKOLOGI
SKRIPSI
KARAKTERISTIK PSIKOMETRI SUBTES WORTAUSWAHL
(WA) PADA INTELLIGENZ STRUCTURE TEST (IST)
Dipersiapkan dan disusun oleh :
DERMIKA SIRAIT
071301050
Telah dipertahankan di depan Dewan Penguji
Pada tanggal 4 Maret 2011
Mengesahkan,
Dekan Fakultas Psikologi
Prof. Dr. Dra. Irmawati, Psikolog, M.Si.
NIP. 195301311980032001
Tim Penguji
1. Lili Garliah, M.Si. Penguji I/Pembimbing
NIP. 196006041986032002
2. Ika Sari Dewi, S.Spi, Psikolog Penguji II
NIP. 197809102005012001
3. Rahmi Putri Rangkuti, M. Psi. Penguji III
LEMBAR PERNYATAAN
Saya yang bertanda tangan di bawah ini menyatakan dengan sesungguhnya
bahwa skripsi saya yang berjudul :
Karakteristik Psikometri Subtes Wortauswahl (WA)
Pada Intelligenz Struktur Test (IST)
adalah hasil karya sendiri dan belum pernah diajukan untuk memperoleh gelar
kasarjanaan di suatu perguruan tinggi manapun.
Adapun bagian-bagian tertentu dalam penulisan skripsi ini saya kutip dari
hasil karya orang lain yang telah dituliskan sumbernya secara jelas sesuai dengan
norma, kaidah, dan etika penulisan ilmiah.
Apabila di kemudian hari ditemukan adanya kecurangan di dalam skripsi
ini, saya bersedia menerima sanksi dari Fakultas Psikologi Universitas Sumatera
Utara sesuai dengan peraturan yang berlaku.
Medan, Februari 2011
DERMIKA SIRAIT
Karakteristik Psikometri Subtes Wortauswahl (WA)
Pada Intelligenz Struktur Test (IST)
Dermika Sirait dan Lili Garliah
ABSTRAK
Tes psikologi dibangun oleh sekumpulan aitem yang telah dirancang sedemikian rupa, baik itu berbentuk pertanyaan atau pernyataan mengenai sesuatu hal yang hendak diukur atau diungkap (Azwar, 2007). Oleh karena itu, kualitas sebuah alat tes sangat ditentukan oleh kualitas aitem-aitem pembangunnya. Suatu tes psikologi yang baik secara psikometri merupakan syarat mendasar untuk mencapai tujuan tes itu sendiri. Oleh karena itu adalah sangat penting untuk melakukan analisa karakteristik psikometri pada setiap alat tes psikologi yang digunakan. Tujuan dari penelitian ini adalah untuk menganalisis karakteristik psikometri subtes Wortauswahl (WA) pada Intelegenz Struktur Test (IST) yang digunakan di P3M Fakultas Psikologi Universitas Sumatera Utara, yang mencakup analisis indeks kesulitan aitem, indeks daya diskriminasi aitem, analisis efektivitas distraktor, analisis reliabilitas serta analisis validitas konstrak subtes WA.
Metode pengumpulan data yang digunakan dalam penelitian ini adalah metode dokumentasi, yaitu dengan menggunakan data yang didokumentasikan oleh Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) Fakultas Psikologi Universitas Sumatera Utara, berupa respon jawaban subjek terhadap subtes
Wortauswahl (WA) yang berjumlah total 2011 orang.
Secara keseluruhan, dengan menggunakan pendekatan teori skor murni klasik diperoleh bahwa dari total 20 aitem subtes WA, tidak ada satu pun yang memiliki taraf kesulitan tinggi, 16 aitem mampu membedakan antara individu yang memiliki dan yang tidak memiliki trait yang diukur, serta 17 aitem memiliki distraktor yang berfungsi secara efektif. Selain itu juga diperoleh indeks reliabilitas subtes WA α = 0.650, dimana indeks ini menunjukkan bahwa subtes tersebut sudah tidak reliabel. Validitas konstruk subtes WA juga dapat dilihat dengan mengkorelasikan skor subtes WA dengan 8 subtes WA lainnya, yang menghasilkan nilai korelasi maing-masing r(WA,SE) = 0.552, r(WA,AN) = 0.579, r(WA,GE) = 0.524, r(WA,RA) = 0.548, r(WA,ZR) = 0.546, r(WA,FA) = 0.379, r(WA,WU) = 0.384, r(WA,ME) = 0.540. Nilai korelasi ini menunjukkan bahwa subtes WA sudah konvergen dengan delapan subtes lainnya. Itu artinya WA sudah tidak valid mengukur konstrak yang dimaksud pada awalnya. Hasil akhirnya menunjukkan bahwa secara keseluruhan aitem-aitem subtes WA memerlukan revisi untuk dapat dipergunakan secara memuaskan sesuai dengan tujuannya.
Psychometric Characteristic of Wortauswahl (WA) Subtest in Intelligenz Struktur Test (IST)
Dermika Sirait and Lili Garliah
ABSTRACT
Psychology test consist of a group of item which have been designed in such a manner, in form of questions or statements about something that will be measured (Azwar, 2007). Therefore, the quality of a psychology test determined by it’s items constructor’s quality. A psychology test that good in psychometric is a basic condition to reach the purpose of its test instrument. That’s why that it is so important to analyzing the psychometric properties for each psychology test that be used. The aim of this study was to analyze the psychometric properties of
Wortauswahl (WA) Subtest in Intelligenz Struktur Test (IST) that have been being
used in Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) faculty of Psychology, University of North Sumatera, include item difficulty index, item discrimination index, effectivity of distractor, instrument reliability and construct validity of Wortauswahl (WA) Subtest in Intelligenz Struktur Test (IST).
This study uses documentation method. The data was the score of
Wortauswahl (WA) subtest from the documentation of Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) faculty of Psychology, University of North
Sumatera, namely the respon of subjects to Wortauswahl (WA) subtest. The data was collected from 2011 subjects.
Overall, using classical true score test theory approach we found that from total 20 items of Wortauswahl (WA) subtest, None of items that has high level of difficulty. 16 items pass of selection of item discrimination index, it’s mean that 16 items can discriminate between people who have and doesn’t have the trait measured. 17 items have effective distractor. Beside it, we found that
Wortauswahl (WA) subtest has reliability index α = 0.650. It’s mean that WA subtest have not reliable. Construct validity of Wortauswahl (WA) subtest also can be seen in way correlate WA score subject with eight others. The value of correlation index indicate the construct validity of Wortauswahl (WA) subtest. They are r(WA,SE) =0.552, r(WA,AN) = 0.579, r(WA,GE) = 0.524, r(WA,RA) = 0.548, r(WA,ZR) = 0.546, r(WA,FA) = 0.379, r(WA,WU) = 0.384, and r(WA,ME) = 0.540. The correlation index show that WA subtest have not valid to measure the aimed trait. The final result show that overall items of Wortauswahl (WA) subtest need to be revised so that can be used well according to early purpose of the test.
KATA PENGANTAR
Segala puji syukur dan hormat bagi Tuhan Yesus Kristus, Sang
Juruselamat yang telah memberikan kekuatan dan menyertai saya selama dalam
mengerjakan skripsi ini, sehingga saya dapat menyelesaikan skripsi ini tepat
waktu. Tanpa penyertaanMu ya Tuhanku, saya tidak berarti apa-apa dan tidak
akan sanggup berbuat apa-apa. Terimakasih ya Tuhanku, telah mempercayakan
studi di Psikologi ini, dan biarlah apa yang kukerjakan selama ini menjadi
persembahan yang teridah dihadapanMu.
Adapun judul skripsi ini adalah “Karakteristik Psikometri Subtes
Wortauswahl (WA) pada Intelligenz Struktur Test (IST)”. Skripsi ini disusun
dalam rangka memenuhi salah satu syarat untuk mencapai gelar Sarjana Psikologi
Fakultas Psikologi Universitas Sumatera Utara, Medan. Selama dalam
penyelesaian skripsi ini, penulis banyak mendapat bimbingan dan dukungan, baik
material dan moral, dan tanpa bimbingan dan dukungan tersebut, penulis
menyadari sangat sulit dalam menyelesaikan penuliksan skripsi ini.
Ppenghargaan dan ucapan terimakasih yang terdalam penulis ucapkan
kepada orang-orang yang Tuhan percayakan mengisi hidupku. Terimakasih yang
sedalam-dalamnya kepada:
1. Prof. Dr. Dra. Irmawati, Psikolog, M.Si. selaku dekan Fakultas
Psikologi Universitas Sumatera Utara.
2. Kedua orangtuaku tercinta yang kubanggakan dan kuhormati, sumber
kalian lah satu alasan yang membuatku semangat dalam mengerjakan
studi ini, semua yang kukerjakan selama ini tidak lain dan tidak bukan
hanyalah untuk membahagiakan kalian. Aku ingin membahagiakan
kalian dan membuat kalian tersenyum.
3. Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) Fakultas
Psikologi Universitas Sumatera Utara, atas kesempatan dan
kepercayaan yang diberikan kepada saya untuk mengadakan penelitian
di lingkungan institusinya, terutama untuk Bapak Ari Widiyanta,
S.Psi., M.Si., Psikolog selaku ketua P3M atas izinnya untuk membantu
dalam penelitian ini.
4. Ibu Lili Garliah,M.Si.,psikolog dosen pembimbing skripsi saya yang
begitu baik dan sabar membimbing saya. Terimakasih Ibuku untuk
semua hal yang telah ibu berikan selama membimbing saya
menyelesaikan skripsi ini. Terimakasih untuk saran, kesabaran, waktu,
”ketajaman” ibu, komentar, dukungan dan perhatian yang ibu curahkan
untuk saya Ibu.
5. Untuk Ibu Ika Sari Dewi, S.Spi, Psikolog, selaku dosen penguji
penulis. Terima kasih banyak ya Ibu atas kesediaan Ibu membimbing
dan menguji saya.
6. Untuk Ka Rahmi Putri Rangkuti, selaku dosen penguji penulis.
Terima kasih banyak juga ya Ka atas kesediaan Kakak membimbing
7. Untuk Ibu Etty Rahmawati, M.Si yang telah banyak membimbing dan
membantu dalam penyelelesaian skripsi ini. Terimakasih Ibu buat
semuanya.
8. Teman-teman seperjuangan, Kak Rena, Kiki, Princen dan Fitri Susanti
yang telah banyak membantu dan berdiskusi demi penyelesaian
penelitian paying ini, terimakasih juga buat kebersamaan kita selama
ini.
9. Kak Arliza Lubis, selaku dosen pembimbing akademik sekaligus
orangtua bagi saya selama kuliah di Fakultas Psikologi USU. Terima
kasih atas segala bimbingan dan semangat yang Ibu berikan kepada
saya.
10.Abangku Ojak Sirait, yang telah banyak membantu saya dalam studi,
terutama dalam hal materi dan dukungan moral, terimakasih Abangku,
semoga aku bisa membalas kebaikanmu Bang.
11.Abangku Marusaha, Tongam, Parlin dan juga Kakak ku Lamria serta
Adikku tercinta Frengky. Terimakasih buat dukungan dan doa-doa
kalian, aku menyayangi kalian semua.
12.B’Jhon Nerton yang memberikan dukungan dan semangat padaku,
terimakasih buat dukungan dan cintamu Bang.
13.Untuk teman-teman ku yang kusayangi dan yang banyak memberikan
dukungan dan motivasi pada penulis, Ita Novita (F.Psi 07), Erni (F.Psi
(F.Psi 07), Iren (F.Psi 07), Didier (F.Psi 07), Desmi (F.Psi 07), Rora
(F.Psi 07), Nela (F.Psi 07), K’Sustri (F.Psi 07), serta semua
teman-teman anak-anak 20077 yang tidak bisa saya sebutkan satu persatu.
Termakasih buat kebersamaan kita selama ini, dan terimakasih buat
bantuan dan dukungan serta doa-doa kalian.
14.Untuk K’Devi (F.Psi 06), K’Olive (F.Psi 06) dan Iren (F.Psi 07) yang
telah banyak memberikan dukungan moril kepada ku, terimakasih
saudari-saudariku.
15.Untuk sahabatku Dessi Sianipar (Akuntansi Unimed’07), Paber
Situngkir (FE USU 07), Lister (Unimed’07), Verawaty (Stikes’07),
terimakasih banyak buat masukan dan dukungan serta bantuan kalian
yah.
16.Untuk keluarga kecilku, senasib dan sepenanggungan Ka Dodo (Fisip
USU’2010) dan Ka Yeyen, makasih banyak buat dukungan dan
kebersamaan kita selamma ini. Semuanya tidak akan pernah terlupakan.
17.Seluruh penulis buku dan peneliti yang namanya tercantum dan menjadi
sumber referensi dalam skripsi ini.
Semoga Tuhan Yang Maha Kuasa memberikan balasan atas banntun
yang diberikan dalam penulisan skripsi ini. Penulis juga menyadari bahwa
tulisan ini masih jauh dari kesempurnaan. Untuk itu penulis meminta maaf
dan sekaligus mengharapkan masukan dan kritikan yang bersifat membangun
kata penulis mengharapkan semoga skripsi ini dapat bermanfaat bagi kita
semua.
Medan, Maret 2011
DAFTAR ISI
ABSTRAK ... i
KATA PENGANTAR ... ii
DAFTAR ISI ... iii
DAFTAR TABEL... iv
DAFTAR RUMUS... v
DAFTAR LAMPIRAN... vi
BAB I PENDAHULUAN A. Latar Belakang ... 1
B. Perumusan Masalah ... 9
C. Tujuan Penelitian ... 10
D. Manfaat Penelitian ... 11
E. Sistematika Penelitian... 12
BAB II TINJAUAN PUSTAKA A. Classical True-score Theory ………. 13
1. Pengertian Classical True-score Theory ………. 13
2. Asumsi-asumsi dalam Classical True-score Theory …… 13
B. Analisis Karakteristik Psikometri ………. …. 15
1. Indeks Kesulitan Aitem ………. 16
a. Pengertian Indeks Kesulitan Aitem ………. 16
b. Analisis Indeks Kesulitan Aitem ………. 17
2. Indeks Diskriminasi Aitem ……….. 19
b. Analisis Indeks Diskriminasi Aitem ……….. 21
3. Efektivitas Distraktor……… 24
4. Reliabilitas ……… 25
a. Pengertian Reliabilitas ……… 25
b. Jenis-jenis Pendekatan Estimasi Reliabilitas………… 27
c. Analisis Koefisien Reliabilitas……….. 37
d. Interpretasi Koefisien Reliabilitas ……… 38
e. Faktor-faktor yang Mempengaruhi Reliabilitas ……… 40
5. Validitas ………. 41
a. Pengertian Validitas ……….. 41
b. Jenis-jenis Validitas………. 43
6. Hubungan Karakteristik Psikometri……… 46
C. Intelligenz Structure Test (IST)……… 47
D. Subtes Wortauswahl (WA)……… 51
a. Inductive Reasoning……….. 53
b. Categorization……… 54
c. Skoring dan Interpretasi WA………. 55
BAB III METODE PENELITIAN A. Jenis Penelitian……….. 57
B. Metode Pengumpulan Data ……… 57
C. Data Penelitian……….. 58
D. Prosedur dan Pelaksanaan Penelitian………. 58
F. Analisis Data……….. 61
BAB IV HASIL DAN PEMBAHASAN
A. Deskripsi Hasil
1. Analisis Indeks Kesulitan Aitem Subtes WA
2. Analisis Indeks Daya Diskriminasi Aitem Subtes WA.
3. Analisis Efektivitas Distraktor Subtes WA.
4. Seleksi Aitem Berdasarkan Indeks Kesulitan Aitem, Indeks Daya
Diskriminasi Aitem dan Efektivitas Distraktor
5. Indeks Reliabilitas Subtes WA
6. Analisis Validitas Konstrak Subtes WA
B. Pembahasan
1. Analisis Indeks Kesulitan Aitem Subtes WA
2. Analisis Indeks Daya Diskriminasi Aitem Subtes WA.
3. Analisis Efektivitas Distraktor Subtes WA.
4. Seleksi Aitem Berdasarkan Indeks Kesulitan Aitem, Indeks Daya
Diskriminasi Aitem dan Efektivitas Distraktor
5. Indeks Reliabilitas Subtes WA
6. Analisis Validitas Konstrak Subtes WA
BAB V KESIMPULAN DAN SARAN
1. Kesimpulan
2. Saran
DAFTAR TABEL
Halaman
Tabel 1 Kategori Tingkat Kesulitan Aitem
Tabel 2 Evaluasi Indeks Daya Diskriminasi Aitem Tabel 3 Indeks kesulitan aitem subtes WA
Tabel 4 Analisis aitem berdasarkan nila p
Tabel 5 Indeks Daya Diskriminasi Aitem Subtes WA dengan metode extreme group
Tabel 6 Hasil Analisis Indeks Daya Diskriminasi Aitem Subtes WA dengan bantuan program Iteman.
Tabel 7 Analisis aitem berdasarkan nilai d Tabel 8 Efektivitas Distraktor Subtes WA
Tabel 10 Seleksi Aitem Berdasarkan Indeks Kesulitan Aitem, Indeks Daya Diskriminasi Aitem dan Efektivitas Distraktor
DAFTAR FORMULA
Formula 6 Indeks Kesulitan Aitem
Formula 7 Indeks Diskriminasi Aitem
Formula 8 Bentuk sederhana dari formua Indeks Diskriminasi Aitem
Formula 9 Formula Poin Biserial
Formula 10 Formula Sperman Brown
Formula 11 Formula Rulon
Formula 12 Formula Koefisien Alpha untuk Tes Belah Dua
Formula 13 Formula Koefisien Alpha untuk Tes Belah Lebih dari Dua Belahan
Formula 14 Formula Flanagan
Formula 15 Formula KR-20
Formula 16 Formula KR-21
Formula 17 Bentuk lain Formula KR-21
Formula 18 Formula untuk Tes Belah Tiga (Formula Kristof)
Formula 19 Formula Reliabilitas Hoyt
Formula 20 Formula Feldt
Formula 21 Interpretasi 3 Koefisien Reliabilitas
Formula 22 Interpretasi 4 Koefisien Reliabilitas
Formula 23 Interpretasi 5 Koefisien Reliabilitas
Formula 24 Interpretasi 6 Koefisien Reliabilitas
DAFTAR LAMPIRAN
Halaman
Lampiran 1 DATA PENELITIAN
A. Tabulasi Respon Subjek terhadap Subtes WA pada IST
Lampiran 2 ANALISIS PARAMETER AITEM DENGAN
PROGRAM ITEMAN
A. Menyimpan Data dalam Bentuk NotePad/Fixed ASCII
B. Membuat Syntax (Control Tile)
C. Membuka Lembar Kerja ITEMAN
D. Membaca Hasil Analisis Iteman
E. Output Analisis Aitem Subtes WAdengan Iteman
Lampiran 3 OUTPUT ANALISIS KORELASI SUBTES RA
DENGAN 8 SUBTES LAINNYA PADA IST
DENGAN BANTUAN SPSS VERSI 16
A. Transformasi Z Skor Subjek Pada 9 Subtes IST.
Karakteristik Psikometri Subtes Wortauswahl (WA)
Pada Intelligenz Struktur Test (IST)
Dermika Sirait dan Lili Garliah
ABSTRAK
Tes psikologi dibangun oleh sekumpulan aitem yang telah dirancang sedemikian rupa, baik itu berbentuk pertanyaan atau pernyataan mengenai sesuatu hal yang hendak diukur atau diungkap (Azwar, 2007). Oleh karena itu, kualitas sebuah alat tes sangat ditentukan oleh kualitas aitem-aitem pembangunnya. Suatu tes psikologi yang baik secara psikometri merupakan syarat mendasar untuk mencapai tujuan tes itu sendiri. Oleh karena itu adalah sangat penting untuk melakukan analisa karakteristik psikometri pada setiap alat tes psikologi yang digunakan. Tujuan dari penelitian ini adalah untuk menganalisis karakteristik psikometri subtes Wortauswahl (WA) pada Intelegenz Struktur Test (IST) yang digunakan di P3M Fakultas Psikologi Universitas Sumatera Utara, yang mencakup analisis indeks kesulitan aitem, indeks daya diskriminasi aitem, analisis efektivitas distraktor, analisis reliabilitas serta analisis validitas konstrak subtes WA.
Metode pengumpulan data yang digunakan dalam penelitian ini adalah metode dokumentasi, yaitu dengan menggunakan data yang didokumentasikan oleh Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) Fakultas Psikologi Universitas Sumatera Utara, berupa respon jawaban subjek terhadap subtes
Wortauswahl (WA) yang berjumlah total 2011 orang.
Secara keseluruhan, dengan menggunakan pendekatan teori skor murni klasik diperoleh bahwa dari total 20 aitem subtes WA, tidak ada satu pun yang memiliki taraf kesulitan tinggi, 16 aitem mampu membedakan antara individu yang memiliki dan yang tidak memiliki trait yang diukur, serta 17 aitem memiliki distraktor yang berfungsi secara efektif. Selain itu juga diperoleh indeks reliabilitas subtes WA α = 0.650, dimana indeks ini menunjukkan bahwa subtes tersebut sudah tidak reliabel. Validitas konstruk subtes WA juga dapat dilihat dengan mengkorelasikan skor subtes WA dengan 8 subtes WA lainnya, yang menghasilkan nilai korelasi maing-masing r(WA,SE) = 0.552, r(WA,AN) = 0.579, r(WA,GE) = 0.524, r(WA,RA) = 0.548, r(WA,ZR) = 0.546, r(WA,FA) = 0.379, r(WA,WU) = 0.384, r(WA,ME) = 0.540. Nilai korelasi ini menunjukkan bahwa subtes WA sudah konvergen dengan delapan subtes lainnya. Itu artinya WA sudah tidak valid mengukur konstrak yang dimaksud pada awalnya. Hasil akhirnya menunjukkan bahwa secara keseluruhan aitem-aitem subtes WA memerlukan revisi untuk dapat dipergunakan secara memuaskan sesuai dengan tujuannya.
Psychometric Characteristic of Wortauswahl (WA) Subtest in Intelligenz Struktur Test (IST)
Dermika Sirait and Lili Garliah
ABSTRACT
Psychology test consist of a group of item which have been designed in such a manner, in form of questions or statements about something that will be measured (Azwar, 2007). Therefore, the quality of a psychology test determined by it’s items constructor’s quality. A psychology test that good in psychometric is a basic condition to reach the purpose of its test instrument. That’s why that it is so important to analyzing the psychometric properties for each psychology test that be used. The aim of this study was to analyze the psychometric properties of
Wortauswahl (WA) Subtest in Intelligenz Struktur Test (IST) that have been being
used in Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) faculty of Psychology, University of North Sumatera, include item difficulty index, item discrimination index, effectivity of distractor, instrument reliability and construct validity of Wortauswahl (WA) Subtest in Intelligenz Struktur Test (IST).
This study uses documentation method. The data was the score of
Wortauswahl (WA) subtest from the documentation of Pusat Penelitian dan Pengabdian pada Masyarakat (P3M) faculty of Psychology, University of North
Sumatera, namely the respon of subjects to Wortauswahl (WA) subtest. The data was collected from 2011 subjects.
Overall, using classical true score test theory approach we found that from total 20 items of Wortauswahl (WA) subtest, None of items that has high level of difficulty. 16 items pass of selection of item discrimination index, it’s mean that 16 items can discriminate between people who have and doesn’t have the trait measured. 17 items have effective distractor. Beside it, we found that
Wortauswahl (WA) subtest has reliability index α = 0.650. It’s mean that WA subtest have not reliable. Construct validity of Wortauswahl (WA) subtest also can be seen in way correlate WA score subject with eight others. The value of correlation index indicate the construct validity of Wortauswahl (WA) subtest. They are r(WA,SE) =0.552, r(WA,AN) = 0.579, r(WA,GE) = 0.524, r(WA,RA) = 0.548, r(WA,ZR) = 0.546, r(WA,FA) = 0.379, r(WA,WU) = 0.384, and r(WA,ME) = 0.540. The correlation index show that WA subtest have not valid to measure the aimed trait. The final result show that overall items of Wortauswahl (WA) subtest need to be revised so that can be used well according to early purpose of the test.
BAB I
PENDAHULUAN
A.Latar Belakang
Psikologi merupakan salah satu bidang ilmu yang sangat dekat dengan
kehidupan manusia, bahkan boleh dikatakan bahwa dimana ada manusia, disana
ilmu psikologi itu berlaku. Hal ini disebabkan karena psikologi adalah ilmu yang
mempelajari perilaku manusia. Dewasa ini ilmu psikologi semakin berkembang
dan kebutuhan akan jasa layanan psikologi semakin meningkat. Hal ini sesuai
dengan apa yang dinyatakan oleh Gunarsa (1992), bahwa semakin maraknya
biro-biro psikologi di kota-kota besar menandakan bahwa masyarakat mulai
mempercayai biro-biro psikologi untuk mengukur aspek psikologis dalam dirinya
Menurut data yang diperoleh Hirzithariqi (2009) ada banyak nama-nama biro
konsultasi psikologi yang berkembang. Tercatat di Jakarta ada 109 biro layanan
psikologi, di Yogyakarta ada 8 biro layanan psikologi, di Bandung ada 7 biro, dan
masih banyak biro di kota-kota kecil yang belum terjangkau. Di kota medan
sendiri ada 6 biro layanan psikologi yang tercatat pada tahun 2009, termasuk
Pusat Penelitian dan Pengembangan Masyarakat (selanjutnya akan disebut P3M)
Fakultas Psikologi Universitas Sumatra Utara.
Berkaitan dengan kebutuhan akan ilmu psikologi yang semakin
meningkat, baik dalam dunia pendidikan maupun pekerjaan, orang-orang
berlomba-lomba untuk belajar tentang psikologi, latihan psikotes dan berbagai hal
dinyatakan oleh Anastasi dan Urbina (2003) bahwa aplikasi utama tes psikologi
adalah untuk seleksi dan klasifikasi sumber daya manusia untuk bidang industri,
seperti penerimaan karyawan, penunjukan tugas, pemindahan, promosi atau
bahkan pemutusan hubungan kerja . Karena bersifat kompetisi ini lah maka
orang-orang beerusaha untuk memenangkan kompetisi tersebut dengan berbagai
cara. Mereka berusaha mencari buku panduan dan bimbingan tes serta
latihan-latihan. Tentu saja hal ini sangat merugikan, karena tes psikologi yang seharusnya
dijaga kerahasiaannya akan menjadi suatu alat tes yang tidak valid dan tidak
reliabel. Tes psikologi akan kehilangan fungsi sebagai suatu instrumen yang dapat
digunakan untuk mengukur secara objektif sampel perilaku manusia.
Tes Psikologi merupakan salah satu andalan dalam ilmu psikologi.
Menurut Anastasi & Urbina (2003), tes psikologi merupakan suatu pengukuran
yang objektif terhadap suatu sampel perilaku. Tujuan dari tes psikologi adalah
untuk mengukur perbedaan antara individu atau reaksi individu yang sama pada
situasi yang berbeda. Tes psikologi memiliki empat tujuan utama, yaitu diagnosa,
prediksi, dekripsi dan pemahaman diri. Berdasarkan empat fungsi utama tersebut,
maka dapat disimpulkan bahwa sebuah tes psikologi sangat berperan penting
dalam memberikan profil mengenai seseorang. Untuk itulah tes psikologi perlu
dijaga dengan baik, agar tujuan-tujuan tersebut bisa tercapai.
Tes psikologi dibangun oleh sekumpulan aitem yang telah dirancang
sedemikian rupa, baik itu berbentuk pertanyaan atau pernyataan mengenai sesuatu
hal yang hendak diukur atau diungkap (Azwar, 2007). Berdasarkan definisi di atas
yang membangunnya. Suatu tes psikologi yang baik secara psikometri merupakan
syarat mendasar untuk mencapai tujuan tes itu sendiri. Oleh karena itu adalah
penting untuk melakukan analisa karakteristik psikometri pada setiap alat tes
psikologi yang digunakan.
Ada berbagai jenis tes psikologi yang disesuaikan dengan objek
pengukurannya dan digunakan sesuai dengan kebutuhan, diantaranya tes
inteligensi, tes bakat, tes prestasi, tes kreativitas tes kepribadian, inventori minat,
prosedur tingkah laku, tes neuropsikologi (Gregory, 2004). Intelegenz Struktur
Test (selanjutnya akan disebut dengan IST) sendiri merupakan salah satu dari jenis
tes inteligensi yang banyak digunakan saat ini. IST merupakan suatu alat tes
inteligensi yang dibuat di Jerman oleh Rudolf Amthauer pada tahun 1953. Tes ini
terdiri dari 9 subtes yang mengukur aspek inteligensi yang berbeda-beda satu
sama lain. Menurut Amthauer, inteligensi merupakan suatu struktur tersendiri dari
keseluruhan struktur kepribadian manusia yang terdiri dari kemampuan jiwani dan
rohani. Struktur tersebut memiliki fungsi sedemikian rupa, sehingga
memungkinkan manusia itu bertindak sebagai pelaku dalam dunianya. Inteligensi
dapat dinilai berdasarkan keberhasilan atau prestasi yang dicapai individu (diktat
kuliah IST Universitas Padjadjaran, 2008).
Menurut Bonang, dkk (dalam Gayatri, 2008), IST merupakan alat tes
inteligensi yang paling sering digunakan, baik di lingkungan pendidikan maupun
pekerjaan. Di bidang pendidikan, tes inteligensi digunakan untuk mengetahui
kecerdasan dan tingkat kemampuan siswa, sehingga berdasarkan profil siswa bisa
siswa tersebut. Selain itu, tes inteligensi juga dapat mengukur minat dan bakat
siswa, sehingga dapat membantu proses penjurusan, misalnya apakah siswa
tersebut lebih cenderung ke IPA, IPS atau Bahasa. Dalam hal ini, tes inteligensi
dapat membantu siswa dalam mengenali diri dan potensi yang dimiliki, sehingga
dari awal bisa mengarahkan dirinya ke bidang yang tepat pada saat kuliah
nantinya. Di bidang pekerjaan, tes inteligensi sering digunakan untuk menyeleksi
karyawan, menempatkan karyawan pada suatu jabatan tertentu, mengevaluasi
karyawan dan lain sebagainya. Selain di bidang pendidikan dan pekerjaan, tes
inteligensi juga sering dipergunakan di bidang klinis, seperti diagnosa mental
retardation. Biasanya penggunaan IST dipaketkan dengan tes-tes psikologis
lainnya. Namun beberapa keluhan yang sering disampaikan mengenai IST sendiri
adalah adanya beberapa aitem yang sudah tidak relevan dengan keadaan sekarang
yang menyulitkan subjek dalam mengerjakan aitem tersebut.
Saat ini IST yang digunakan di Indonesia adalah IST ’70 yang diadaptasi
untuk pertama kalinya pada tahun 1973 oleh Fakultas Psikologi Universitas
Padjadjaran. Salah satu biro yang menggunakan IST adalah Unit Pelayanan Pusat
Penelitian dan Pengembangan Masyarakat (selanjutnya disebut P3M) Fakultas
Psikologi Universitas Sumatra Utara. Biasanya IST digunakan untuk menyeleksi
karyawan-karyawan yang akan diterima oleh perusahaan yang mempercayakan
P3M Fakultas Psikologi Universitas Sumatera Utara sebagai recruiternya. Sejak
bulan April 2010 sampai bulan Agustus 2010 tercatat beberapa perusahaan besar
yang mempercayakan P3M Fakultas Psikologi Universitas Sumatera Utara
digunakan dalam proses seleksi tersebut. (Novi, Komunikasi Personal, Oktober
2010).
Permasalahan dalam penggunaan IST yaitu pemakaian yang dianggap
sudah terlalu sering sehingga terdapat kejenuhan dalam pemakaiannya dan
menimbulkkan efek pembelajaran bagi subjek. Di samping itu penggunaanya
yang sering dimaksudkan untuk kepentingan seleksi menyebabkan orang-orang
berusaha untuk mempelajari tes tersebut dengan berbagai cara, termasuk mencari
buku-buku panduan dan soal-soal latihan yang memang sudah banyak beredar di
internet maupun di toko-toko buku. Sebagai contoh kasus, peneliti dalam
pembicaraan pribadinya dengan salah satu peserta tes seleksi karyawan di
lingkungan Fakultas Psikologi Universitas Sumatera Utara, menemukan bahwa
soal-soal mirip dengan IST memang sudah banyak dijual di pasaran.
“soal-soal kemarin mah dah sering saya kerjakan, saya punya bukunya juga, dibeli di gramedia,,,model soalnya sama bahkan ada yang sama persis. Di internet apalagi, gampang dicari soal yang seperti itu” (Sitio, peserta tes Pelindo I 2009, Maret 2011)
Fenomena di atas menunjukkan bahwa selain penggunaan IST yang sudah
terlalu sering sehingga menimbulkan pembelajaran, kerahasiaan tes ini juga
memang sudah sangat sulit untuk dikontrol. Hal ini juga didukung oleh issue yang
beredar menurut HIMPSI (Himpunan Sarjana Psikologi dan Psikolog Indonesia)
inteligensi. Kondisi ini dilatarbelakangi oleh kedua faktor tadi, yaitu frekuensi
pemakaian yang sudah terlalu tinggi dan kerahasiaannya yang sulit dikontrol.
Penemuan lain mengenai permasalahan penggunaan IST, khususnya di
lingkungan P3M Fakultas Psikologi USU yaitu dikawatirkan alat tes ini sudah
bocor. Berdasarkan hasil wawancara dengan salah satu administrasi P3M
menyatakan bahwa beberapa tahun terakhir sering ditemukan lembar jawaban
dengan nilai yang sempurna untuk beberapa subtes (Novi, Komunikasi Personal,
Oktober 2010). Hal ini tentu saja mustahil terjadi sekalipun untuk subjek genius
sekalipun atau seandainya terjadi proses pembelajaran karena dikenai tes yang
sama secara berulang-ulang. Kemungkinan besar nilai sempurna tersebut
disebabkan karena mereka memiliki kunci jawaban.
Beberapa penelitian terhadap IST sebenarnya sudah pernah dilakukan di
Indonesia. Salah satunya dilakukan oleh Santosa et al. pada tahun 1997. Penelitian
ini dimaksudkan untuk menguji validitas prediktif dengan subjek penelitian
mahasiswa baru di Atmajaya pada tahun akademik 1997/1998. Hasilnya
menyatakan bahwa beberapa subtes pada IST dapat dijadikan prediktor untuk
prestasi mahasiswa di semester pertama, namun skor total IST secara keseluruhan
kurang baik dalam memprediksi keberhasilan prestasi mahasiswa. Hanya
beberapa tes yang berkorelasi signifikan (p≤0.05) dengan prestasi mahasiswa dan
korelasinya masih dalam taraf yang kecil. Subtes-subtes tersebut adalah SE
(saterganzung) dengan r = 0,219; AN (Analogien) dengan r = 0,192; ME (Merk
Zahlen Reihen) dengan r = 0,176; GE (Gemeinsamkeiten) dengan r = 0,152
(dalam Bawono, 2008).
Penelitian lain terhadap IST dilakukan oleh Fakultas Psikologi Universitas
Airlangga pada tahun 2004 untuk melihat validitas dan reabilitas. Penelitian ini
menggunakan populasi siswa SMU Negeri maupun swasta Jawa Timur. Hasil
dari penelitian ini menunjukkan bahwa dari 176 item tes terdapat 131 item yang
dinyatakan valid dan 45 item yang dinyatakan gugur dan dari sembilan subtes,
satu subtes yakni ZR (dengan jumlah item 20) dinyatakan semua itemnya valid.
Sedangkan untuk realibitas dari Sembilan subtes tersebut semuanya dinyatakan
reliabel dengan besar koefisien sebesar 0,463-0,821 pada taraf signifikansi 0,01
(Hamidah, 2000).
Dari beberapa penelitian yang telah dilakukan, peneliti merasa masih
kurangnya penelitian mengenai validitas dan reliabilitas terhadap IST, mengingat
tes ini merupakan salah satu alat tes yang masih sering digunakan dan juga bahwa
syarat alat tes yang baik adalah alat tes yang harus terus menerus dievaluasi
penggunaannya. Hal ini sesuai dengan apa yang dinyatakan oleh Bonang et al.
(dalam Bawono 2008) bahwa sebuah tes yang telah dipakai dalam jangka waktu
yang cukup lam seperti IST, memang memerlukan pengujian ulang untuk melihat
sejauhmana tes tersebut masih dapat digunakan sebagai alat ukur yang handal.
Pada penelitian ini, akan dilakukan analisis karakteristik psikometri pada
satu subtes saja, yaitu subtes wortaushwahl (selanjutnya akan disebut dengan
WA). Secara umum, subtes WA ini sering dikenal dengan penalaran verbal.
diantaranya memiliki kemiripan dan testee diharapkan mampu memilih satu yang
paling berbeda. Sebelum menentukan satu kata yang paling berbeda, testee perlu
menentukan empat kata yang mirip dan bisa dikelompokkan ke dalam satu
kategori. Maka disimpulkan bahwa subtes WA ini mengukur kemampuan
inductive reasoning yang di dalamnya terdapat proses categorization.
Berpikir Induktif (Inductive Reasoning) mencakup pembuatan prediksi
mengenai situasi baru berdasarkan pengetahuan yang sudah ada. Induksi
berhubungan dengan banyak penalaran yang dilakukan oleh manusia dalam
kehidupan sehari-hari, seperti memprediksi kemungkinan hujan turun,
memprediksi bagaimana reaksi pasangan ketika menerima sekotak coklat
pemberian suami, memprediksi kenaikan harga 6 bulan ke depannya, dan
sebagainya. Lebih umum, induksi tercakup dalam suatu ranges aktivitas-aktivitas
kognitif seperti categorization, probability judgment, analogical reasoning,
scientific inference, and decision making. (Brett K. Hayes; Evan Heit; and Haruka
Swendsen, 2010).
Categorization dan inductive reasoning berjalan berdampingan. Menurut
Anderson (dalam Heit, 2007), fungsi utama dari categorization bukan supaya kita
dapat mengkategorikan sesuatu hal, tetapi lebih kepada mengijinkan kita untuk
membuat suatu kesimpulan. Categorization terdiri dari objek-objek atau
kejadian-kejadian yang harus kita kelompokkan bersama karena kita merasa mereka
berhubungan. Kemampuan categorization memungkinkan kita untuk berinteraksi
dengan lingkungan tanpa diliputi oleh kerumitannya. Jadi kemampuan
kehidupan manusia. Bruner, Goodnow and Austin (dalam Stephen K. Reed, 2004)
menyebutkan lima keuntungan categorization, yaitu: (1) mengkategorikan objek
dapat mengurangi kompleksitas lingkungan, (2) kategorisasi berarti objek di dunia
sekitar dapat teridentifikasi, (3) membangun categorization mengurangi
kebutuhan untuk terus-terus belajar hal yang sama, (4) Categorizing mengijinkan
kita untuk memutuskan hal apa yang mendasari suatu tindakan yang sesuai, (5)
Categorizing memungkinkan kita untuk menyusun dan menghubungkan kelas dari
objek dan kejadian-kejadian.
Sebelumnya sudah pernah dilakukan penelitian analisis karakteristik
psikometri khusus terhadap subtes WA di Universitas Katolik Atmajaya Jakarta.
Penelitian ini menggunakan sampel anak SMA. Hasilnya adalah bahwa semua
aitem dalam subtes ini memilliki daya diskriminasi yang baik, namun tidak
reliabel, memiliki validitas prediktif yang sangat rendah, Artinya dari penelitian
ini didapat bahwa subtes WA tidak bisa memprediksi siswa siswi SMA jurusan
IPA atau IPS (Gayatri, 2008).
Mengingat masih sangat kurangnya penelitian terhadap subtes WA ini, dan
juga menyadari permasalahan-permasalahan dalam penggunaan IST yang sudah
dijelaskan sebelumnya, serta mengingat bahwa aspek yang diukur oles subtes WA
merupakan suatu aspek yang sangat dibutuhkan dalam kehidupan sehari-hari,
maka penelitian ini bermaksud untuk melakukan analisis karakteristik psikometri
terhadap IST subtes WA. Adapun karakteristik psikometri yang dimaksud dalam
penelitian ini adalah parameter aitem subtes WA berupa indeks diskriminasi dan
validitas dan analisis reliabilitas. Masing-masing parameter akan dihitung secara
terpisah, dan pada akhirnya secara bersama-sama akan menunjukkan apakah
aitem-aitem dalam alat tes baik atau tidak (Kaplan & saccuzzo, 2005). Proses
analisis karakteristik psikometri akan dilakukan dengan menggunakan pendekatan
teori klasik atau Classical Test Theory (selanjutnya disebut CTT). CTT ini
memiliki asumsi bahwa setiap pengukuran menghasilkan skor tampak (X),
dimana skor X ini merupakan skor murni (T) individu ditambah error (E)
pengukuran. Jadi setiap pengukuran yang dilakukan mengandung error. Semakin
tinggi error yang terjadi, maka semakin tidak bagus intrumen tersebut.
B. Perumusan Masalah
Sejak pertamakali dibuat pada tahun 1953 oleh Amthauer, IST telah
direvisi beberapa kali, yaitu IST 1955, IST 70, IST 2000, IST 2000-Revised.
Meskipun sudah direvisi beberapa kali, itu haya terjadi di luar negeri. Kebanyakan
di Indonesia masih menggunakan versi IST 70 yang diadaptasi untuk pertama
kalinya oleh Universitas Padjajaran, termasuk P3M Fakultas Psikologi Universitas
Sumatera Utara. Penggunaan IST versi 70 yang diketahui peneliti belum pernah
direvisi dikawatirkan sudah tidak relevan dengan kondisi saat ini. Selain itu,
penggunaan IST yang terlalu sering dan maraknya soal-soal tes/ latihan yang
begitu mirip dengan IST yang tersedia dipasaran, juga dikawatirkan telah
menimbulkan proses pembelajaran bagi peserta tes, yang mana hal ini sangat
melihat, apakah IST khususnya subtes WA masih layak dipergunakan sebagai tes
seleksi.
Penelitian ini bersifat eksploratif yang berusaha mencari jawaban atas
pertanyaan penelitian : “Bagaimanakah kualitas dari subtes WA pada IST
berdasarkan hasil analisis karakteristik psikometri?”. Adapun karakteristik
psikometri yang akan ditinjau dirumuskan dalam bentuk pertanyaan-pertanyaan
sebagai berikut:
1. Seberapa besar indeks kesulitan aitem subtes WA pada IST?
2. Seberapa besar indeks daya diskriminasi aitem subtes WA pada IST?
3. Bagaimanakah efektivitas distraktor aitem-aitem subtes WA pada IST?
4. Seberapa besar indeks reliabilitas dari subtes WA pada IST?
5. Bagaimana validitas konstruk dari subtes WA pada IST, ditinjau dari
indeks validitas konvergen dan indeks validitas diskriminan nya?
C. Tujuan Penelitian
Penelitian ini bertujuan untuk melihat apakah IST, khususnya subtes WA
masih layak digunakan sebagai alat tes intelegensi, berdasarkan hasil analisis
karakteristik psikometri yang dilakukan.
D. Manfaat Penelitian
Penelitian mengenai Karakteristik Psikometri Subets WA pada IST ini
diharapkan akan bermanfaat, baik secara teoritis maupun secara praktis, yaitu :
Hasil penelitian ini diharapkan bisa menambah data dalam bidang
psikometri dan hal-hal yang berkaitan dengan karakteristik psikometri, kelayakan
alat tes serta pengukuran inteligensi melalui alat ukur tertentu, khususnya subtes
WA pada IST.
2. Manfaat Praktis
Hasil penelitian ini diharapkan dapat menjadi pertimbangan ketika
menggunakan IST khususnya subtes WA, baik itu biro penyelenggara tes
maupun perusahaan pengguna jasa tes tersebut dalam rangka pengambilan
keputusan selanjutnya, baik secara administratif maupun akademik terhadap
calon karyawan, karena disadari atau tidak kualitas instrumen yang digunakan
dalam proses seleksi calon karyawan akan menentukan keberhasilan institusi dan
perusahaan untuk menemukan individu yang paling sesuai untuk pekerjaan yang
tepat.
Selain itu juga, hasil penelitian ini diharapkan jadi dasar pertimbangan
bagi para tenaga akademisi, khususnya bidang psikometri untuk dapat melakukan
suatu revisi terhadap IST, khususnya subtes WA.
E. Sistematika Penulisan
Adapun sistematika penulisan yang disusun dalam penelitian ini adalah :
Bab I : Pendahuluan
Bab ini menjelaskan latar belakang masalah penelitian, pertanyaan
penelitian, tujuan dan manfaat penelitian, serta sistematika penulisan.
Bab ini memuat tinjauan pustaka yang menjadi acuan dalam pembahasan
masalah. Teori- teori yang dimuat adalah teori yang berhubungan dengan
pendekatan CTT, Analisis Psikometri, Intelligenz Strucrure Test, dan
Subtes WA.
Bab III : Metodologi Penelitian
Pada bab ini dijelaskan mengenai jenis penelitian, metode pengumpulan
data, populasi yang digunakan, persiapan dan pelaksanaan penelitian,
program yang digunakan serta analisis data.
Bab IV : Hasil dan Pembahasan
Bab ini memuat hasil analisis karakteristik psikometri serta pembahasan
hasil pennelitian dengan teori yang relevan.
Bab V : Kesimpulan dan Saran
Bab ini berisi kesimpulan yang diperoleh dari penelitian, hasil penelitian,
serta saran-saran yang diperlukan, baik untuk penyempurnaan penelitian
BAB II
TINJAUAN PUSTAKA
Menurut Azwar (2007) bahwa teori pengukuran dapat dibahas dari tiga
macam pendekatan secara umum, yaitu (a) pendekatan teori skor murni klasikal
(classical score theory), (b) pendekatan teori skor murni kuat (strong
true-score theory) dan (c) pendekatan latent-trait theory.
Teori murni kuat mempunyai pandangan yang mirip dengan teori
skor-murni klasikal mengenai nilai harapan skor tampak yang merupakan skor skor-murni,
akan tetapi dalam teori skor murni kuat terdapat asumsi-asumsi tambahan
mengenai probabilitas skor-tampak yang akan diperoleh seorang subjek yang
merupakan skor-murni tertentu sehingga dengan asumsi-asumsi tersebut
kelayakan teori skor-murni kuat bagi data tertentu, dapat diuji.
Sedangkan latent-trait theory berasumsi bahwa aspek performansi
terpenting pada suatu tes dapat ditunjukkan oleh kedudukan seorang subjek pada
suatu latent-trait yang berupa karakteristik psikologis yang tidak tampak. Berbeda
dengan teori skor murni kuat, walaupun asumsi bahwa nilai harapan skor tampak
pada teori latent-trait juga merupakan skor murni, pada umumnya tidak terdapat
hubungan linear antara skor-murni dengan latent-trait sehingga nilai harapan skor
tampak tidak sama dengan nilai latent-trait.
Teori skor murni kuat dan teori latent-trait tidak cuma sekedar membahas
eror standar yang bervariasi sesuai dengan level skor murni atau latent-traitnya.
Menurut kedua teori tersebut, eror standar tidak terpengaruh oleh distribusi skor
subjek.
Penelitian ini akan menggunakan pendekatan pendekatan teori skor murni
klasikal dalam proses analisis yang dilakukan, denga pertimbangan bahwa teori
ini lebih praktis dalam menerangkan masalah reliabilitas dan validitas. Selain itu
juga pemahamannya yang tidak menuntut pengetahuan yang terlalu dalam
mengenai beberapa fungsi distribusi statistik dan model-model matematiknya.
E. Classical True-score Theory
1. Pengertian Classical True-score Theory
Classical True-score Theory (selanjutnya disebut dengan CTT) merupakan
pendekatan yang telah berhasil meletakkan dasar-dasar konsepsi reliabilitas pada
dekade-dekade yang telah lalu dan memiliki kontribusi yang sangat besar dalam
pengembangan formula-formula reliabilitas. Pendekatan ini juga memiliki nilai
praktis yang tinggi dalam menerangkan masalah validitas dan reliabilitas (Azwar,
2004)
CTT pada intinya dijelaskan dalam bentuk asumsi-asumsi matematis, yang
pada akhirnya dijadikan sebagai dasar turunan aljabar atau
2. Asumsi-asumsi dalam Classical True-score Theory
Sebelum membahas asumsi-asumsi dalam CTT, perlu diketahui bahwa
asumsi-asumsi tersebut merupakan hubungan matematis dari skor tampak (X), skor
murni (T), dan eror pengukuran (E). Skor tampak merupakan angka yang
menunjukkan nilai performansi subjek pada suatu pengukuran, yang tidak lain
merupakan nilai total dari jawaban subjek dalam tes tersebut. Skor murni dijelaskan
sebagai angka performansi.
Adapun sumsi-asumsi dalam CTT (dalam Azwar, 2007) adalah sebagai berikut:
Asumsi 1 :
X = T + E (1)
Asumsi ini menjelaskan bahwa sifat aditif berlaku pada hubungan antara
skor tampak, skor muni, dan eror. Skor tampak (X) merupakan jumlah skor murni
(T) dan eror (E)
Asumsi 2:
ε(X) = T (2)
Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan dari
skor tampaknya. Jadi, T merupakan harga rata-rata distribusi teoretik skor tampak
apabila orang yang sama dikenai tes yang sama berulangkali dengan asumsi
pengulangan tes itu dilakukan tidak terbatas banyaknya dan setiap pengulangan
tes adalah independen satu sama lain.
Asumsi 3:
Asumsi ini menyatakan bahwa bagi populasi subjek yang dikenai tes,
distribusi eror pengukuran dan distribusi skor murni tidak berkorelasi.
Implikasinya, skor murni yang tinggi tidak selalu berarti mengandung eror yang
selalu positif ataupun selalu negatif (Azwar, 2007).
Asumsi 4:
= 0 (4)
Asumsi ini menyatakan bahwa dalam eror pada dua tes ( yang dimaksud
untuk mengukur hal yang sama) tidak saling berkorelasi. Asumsi ini akan tidak
terpenuhi sekiranya skor tampak dipengaruhi kondisi testing, seperti misalnya
kelelahan, Practice effect, suasana hati, atau factor-faktor dari lingkungan
(Suryabrata, 2005).
Asumsi 5 :
= 0 (5)
Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama,
maka eror pada tes pertama tidak berkorelasi dengan skor-skor murni pada tes
kedua.
Asumsi 6
Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama
membunyai skot tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan jika
untuk setiap populasi subjek T = T’ serta varians eror kedua tes tersebut sama,
Asumsi 7
Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama
membunyai skot tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan jika
untuk setiap populasi subjek T1 = T2 + C. Dengan C sebagai suatu bilangan
konstan, maka kedua tes tersebut dapat disebut sebagai tes yang setara (equivalent
test).
B. Analisis Karakteristik Psikometri
Sebuah instrument tes merupakan sekumpulan aitem yang disusun
sedemikian rupa, baik berupa pertanyaan maupun pernyataan mengenai suatu hal
yang hendak diukur (Azwar, 2007). Proses analisis terhadap karakteristik
psikometri dari suatu instrument tes ditujukan untuk memilih aitem-aitem yang
layak dan mengetahui kelayakan instrument tersebut. Jadi proses analisis dapat
dilakukan untuk merancang sebuah instrumen tes yang baru atau menguji
instrument yang sudah ada. Proses analisis tersebut secara sederhana meliputi dua
cara, yaitu:
Tahap Pertama adalah analisis dan seleksi aitem berdasarkan evaluasi
secara kualitatif. Evaluasi ini bertujuan untuk melihat apakah aitem yang ditulis
sudah sesuai dengan blue-print dan indikator perilaku yang hendak diungkap,
melihat apakah aitem telah ditulis sesuai dengan kaidah penulisan yang benar, dan
melihat apakah aitem-aitem yang ditulis masih mengandung social desirability
Tahap kedua adalah prosedur seleksi aitem berdasarkan data empiris
dengan melakukan analisis kuantitatif terhadap parameter-parameter aitem.
Parameter-parameter yang dimaksud meliputi indeks diskriminasi aitem dan
indeks kesulitan aitem, analisis efektivitas distraktor, analisis reliabilitas, serta
analisis validitas dari instrumen tersebut (Crocker & Algina, 2005).
1. Indeks Kesulitan Aitem
a. Pengertian Indeks Kesulitan Aitem
Indeks kesulitan aitem yang biasanya disimbolkan dengan huruf p
merupakan rasio antara penjawab aitem dengan benar dan banyaknya penjawab
aitem. Secara teoritik dikatakan bahwa p sebenarnya merupakan probabilitas
empirik untuk lulus aitem tertentu bagi kelompok subjek tertentu. Secara
matematis diformulaikan sebagai berikut:
p = ni / N (6)
Keterangan:
p = indeks kesulitan aitem
ni = banyaknya subjek yang menjawab aitem dengan benar
N = banyaknya subjek yang menjawab aitem
Selain untuk membedakan subjek yang menguasai suatu pelajaran dengan
baik dengan yang tidak menguasai dengan baik, indeks kesulitan aitem juga
berfungsi dalam hal penyusunan aitem-aitem saat penyusunan alat tes. Hal ini
sesuai dengan apa yang diungkapkan oleh Kumar (2009), yang menyatakan
bahwa penyusunan aitem dilakukan berdasarkan nilai indeks kesulitan aitem.
aitem-aitem dalam tes secara sistematis, dengan menempatkan aitem-aitem-aitem-aitem berdasarkan
tingkat kesukarannya, mulai dari aitem yang paling mudah hingga yang paling
sulit. Sehingga pola penyusunan aitem-aitem dalam tes dimulai dari aitem dengan
harga p yang paling tinggi hingga aitem dengan harga p yang paling rendah.
b. Analisis Indeks Kesulitan Aitem
Nilai p yang semakin tinggi menunjukkan bahwa aitem yang bersangkutan
semakin mudah. Nilai p berkisar dari 0 sampai dengan angka 1. Apabila sebuah
aitem sedemikian sukarnya, sehingga tidak seorang subjek pun dapat menjawab
dengan benar, maka harga p = 0, sedangkan apabila suatu aitem sedemikian
mudahnya sehingga seluruh subjek dapat menjawab dengan benar, maka harga p
= 1. Aitem yang terlalu mudah atau terlalu sulit biasanya tidak akan banyak
berguna dalam membedakan subjek yang menguasai bahan pelajaran dan mereka
yang tidak (Azwar, 2007).
Pada umumnya harga p yang berada disekitar 0,50 dianggap yang terbaik.
Menurut Azwar (2007), harga p terbaik adalah yang sesuai yang sesuai dengan
tujuan tes yang bersangkutan. Misalnya kadang-kadang dikehendaki harga p <
0,50 (aitemnya lebih sulit) apabila aitem aitem itu dimaksudkan sebagai bagian
dari suatu tes yang digunakan dalam prosedur seleksi guna memilih sebagian kecil
saja dari antara pelamar. Tidak jarang pula sebuah tes prestasi perlu disusun
dengan memasukkan banyak aitem yang taraf kesulitannya rendah (p tinggi)
dengan tujuan untuk evaluasi formatif.
Jadi bisa dikatakan bahwa harga p yang berada pada titik ekstrem (terlalu
Oleh karena itu, umumnya pada penyusunan instrumen tes disarankan untuk
menggunakan aitem dengan taraf kesulitan sedang (0,50). Namun Lord (dalam
Murphy & Davidshofer, 2003) menyatakan bahwa untuk tes seleksi karyawan, p
akan dikatakan baik jika nilai p mendekati 0,2.
Allen & Yen (dalam Lababa, 2008) mengkategorikan nilai p sebagai
berikut:
Tabel 1 Kategori Tingkat Kesulitan aitem
No P Kategori
1 p<0,3 Sulit
2 0,3≤p≤0,7 Sedang
3 p>0,7 Mudah
Ada beberapa hal yang perlu dipahami mengenai indeks kesulitan aitem
ini, diantaranya pertama adalah bahwa harga p dari suatu aitem menunjukkan
taraf kesulitan aitem tersebut bagi kelompok yang bersangkutan, yaitu kelompok
yang menjadi dasar dalam menghitung p itu sendiri (Azwar, 2005). Artinya harga
p suatu aitem akan berbeda apabila dihitung pada kelompok siswa yang berbeda.
Kedua bahwa besarnya harga p yang kita hitung merupakan indek kesulitan aitem
bagi seluruh kelompok yang bersangkutan, bukan indeks kesulitan bagi
masing-masing individu dalam kelompok. Artinya harga p yang dihitung dalam kelompok
hanya merupakan rata-rata indeks kesulitan bagi seluruh individu dalam kelompok
tersebut.
Berdasarkan penjelasan di atas, maka dalam penelitian ini aitem dikatakan
memiliki indeks diskriminasi yang baik jika harga p lebih kecil dari 0,3, dengan
alasan bahwa IST dalam hal ini digunakan untuk seleksi karyawan, yaitu memilih
2. Indeks Daya Diskriminasi Aitem
a. Pengertian Indeks Diskriminasi Aitem.
Indeks daya diskriminasi aitem atau sering disebut dengan daya beda
aitem merupakan parameter yang paling penting dalam tes psikologi yang
menunjukkan sejauh mana aitem mampu membedakan antara individu atau
kelompok individu yang memiliki dan yang tidak memiliki atribut yang diukur
(Azwar, 2005). Artinya bahwa aitem yang memiliki daya beda yang tinggi harus
memiliki skor yang tinggi pada individu yang memiliki atribut yang diukur dan
skor yang rendah pada individu yang tidak memiliki atribut yang diukur.
Indeks diskriminasi aitem (d) secara sederhana didefinisikan sebagai
perbedaan proporsi penjawab aitem dengan benar antara Kelompok Tinggi dengan
Kelompok Rendah.
Secara matematis diformulasikan sebagai berikut:
(7)
Keterangan:
d : Indeks diskriminasi Aitem
niT : jumlah subjek penjawab dengan benar dari Kelompok Tinggi nT : Jumlah subjek Kelompok Tinggi
niR : jumlah subjek penjawab dengan benar dari Kelompok Rendah nR : Jumlah subjek Kelompok Rendah
Formulasi di atas sama dengan perbedaan/ selisih indeks kesulitan pada
Kelompok Tinggi dan Kelompok Rendah, sehingga lebih sederhana dapat
-
(8)
Keterangan :
= Indeks kesulitan pada Kelompok Tinggi
= Indeks kesulitan pada Kelompok Rendah
Dalam skala sikap, sebuah aitem dikatakan memiliki daya beda tinggi jika
aitem tersebut mampu membedakan antara subjek yang bersikap positif dan
subjek yang bersifat negatif. Sedangkan untuk sebuah tes inteligensi, sebuah aitem
dikatakan memiliki daya beda tinggi jika aitem tersebut mampu membedakan
subjek yang memiliki kemampuan tinggi (Kelompok Tinggi) dan subjek yang
memiliki kemampuan rendah (Kelompok Rendah). Artinya suatu aitem tersebut
haruslah dijawab dengan benar oleh semua atau sebagian besar subjek Kelompok
Tinggi dan tidak dapat dijawab dengan benar oleh semua atau sebagian besar
subjek Kelompok Rendah (Azwar, 2007).
b. Analisis Indeks Diskriminasi Aitem
Menurut Murphy dan Davidshofer (2003), jika suatu tes dan satu aitem
mengukur hal yang sama, maka diharapkan bahwa orang yang mengerjakan tes
dengan baik akan menjawab aitem tersebut dengan benar, dan orang yang
mengerjakan tes dengan buruk menjawab aitem tersebut dengan salah. Dengan
kata lain, aitem yang memiliki daya diskriminasi yang baik mampu membedakan
antara orang yang mengerjakan tes dengan baik dan orang yang mengerjakan tes
dengan buruk.
Nilai Indeks diskriminasi (d) berkisar mulai dari -1 sampai dengan +1,
Daya diskriminasi maksimal tercapai apabila seuruh subjek Kelompok Tinggi
dapat menjawab dengan benar ( ), sedangkan seluruh subjek Kelompok
Rendah tidak seorang pun yang dapat menjawab dengan benar ( ). Dalam
hal ini, harga indeks diskriminasi d = 1-0=1.
Harga d yang berada disekitar 0 menunjukkan bahwa aitem yang
bersangkutan memiliki daya diskriminasi yang rendah, sedangkan harga d yang
negative menunjukkan bahwa aitem yang bersanngkutan tidak ada gunanya sama
sekali, bahkan memberikan informasi yang menyesatkan.
Indeks diskriminasi yang ideal yang ideal adalah yang sebesar mungkin
mendekati angka 1. Semakin besar indeks kemsukaran aitem (semakin mendekati
angka 1) berarti aitem tersebut semakin mampu membedakan antara subjek yang
menguasai bahan yang diujikan dan dan subjek yang tidak menguasai.
Menurut Thorndike (dalam Azwar, 2005) bahwa dalam proses seleksi
aitem, aitem-aitem yang memiliki nilai diskriminasi di atas 0,50 akan langsung
dianggap baik sedangkan aitem-aitem dengan indeks diskriminasi di bawah 0,20
dapat langsung dibuang dan dianggap jelek. Sementara menurut Ebel (dalam
Azwar, 2005) terdapat suatu panduan dalam evaluasi indeks diskriminasi aitem,
yaitu:
Tabel 2 Evaluasi Indeks Daya Diskriminasi Aitem
Indeks Daya Beda Evaluasi
≥ 0,40 Sangat bagus
0,30 – 0,39 Lumayan bagus, tidak membutuhkan revisi 0,20 – 0,29 Belum memuaskan, perlu direvisi
Menurut Murphy dan Davidshofer (2003), ada tiga statistik yang dapat
digunakan untuk mengukur daya diskriminasi suatu aitem, yaitu:
1. Method of Extreme Group
Metode ini biasanya dugunakan untuk indeks diskriminasi pada kelompok
besar. Diskriminasi aitem dapat dihitung dengan cara membagi kelompok menjadi
dua, Upper group (Kelompok Tinggi) yakni kelompok yang memiliki skor yang
tinggi (25-35 % nilai tertinggi didalam kelompok) dan lower group (Kelompok
Rendah) yakni kelompok yang memiliki nilai yang rendah (25-35 % nilai terendah
dalam kelompok). Aitem yang memiliki indeks diskriminasi yang baik akan
dijawab benar oleh Kelompok Tinggi dan dijawab salah oleh Kelompok Rendah.
2. Korelasi Aitem-Total
Parameter daya beda aitem yang berupa koefisien korelasi aitem-total
memperlihatkan kesesuaian fungsi aitem dengan fungsi skala / tes dalam
mengungkap perbedaan individual. Besarnya koefisien korelasi aitem-total
bergerak 0 sampai dengan 1,00. Semakin baik daya diskriminasi aitem, maka
koefisien korelasi semakin mendekati angka 1,00.
Korelasi aitem total dapat diketahui dengan menghitung korelasi point
biserial (rpbis). Korelasi point biserial yang bernilai positif menunjukkan bahwa
aitem dan tes mengukur hal yang sama, nilai mendekati nol menunjukkan bahwa
bahwa aitem tidak memiliki indeks daya beda yang baik sehingga kelompok
tinggi menjawab pertayaan dengan salah dan kelompok rendah menjawab
pertanyaan dengan benar. Nilai negatif menunjukkan bahwa aitem tidak
r
pbis=
[(Mi – Mx)/Sx] / √[p/(1-p)](9) Keterangan :
rpb : Korelasi point biserial
Mi :Mean skor X dari seluruh subjek yang mendapat angka 1 pada variabel dikotomi i
Mx : Mean skor dari seluruh subjek
Sx :Standard deviasi skor X
P :Proporsi subjek yang mendapat angka 1 pada variabel dikotomi
3. Korelasi Inter-Aitem
Pengujian terhadap korelasi inter-aitem dapat membantu kita mengetahui
mengapa beberapa aitem gagal membedakan anatara subjek yang bekerja dengan
baik (Kelompok Tinggi) dan yang bekerja dengan buruk (Kelompok Rendah)
(Murphy dan Davidshofer, 2003)
Korelasi inter-aitem yang bernilai rendah dapat memiliki dua arti,
kemungkinan pertama adalah aitem tidak mengukur hal yang sama dengan tes,
sehingga aitem harus dibuang atau dibuat ulang, kemungkinan kedua adalah aitem
memang mengukur atribut yang berbeda dengan tes dikarenakan tes memang
disusun untuk mengukur dua atribut yang berbeda.
Dalam penelitian ini, indeks diskriminasi akan diukur dengan dua cara,
yaitu dengan metode extreme group dan metode korelasi aitem-total. Dengan
metode extreme group, diharapkan bisa melihat perbedaan antara Kelompok
Tinggi dan Kelompok Rendah. Sedangkan dengan metode korelasi aitem-total
diharapkan dapat melihat kesesuaian fungsi aitem dengan fungsi tes dalam
3. Efektivitas Distraktor
Efektivits distraktor-distraktor pada suatu aitem dianalisis dari distribusi
jawaban terhadap aitem yang bersangkutan pada setiap alternatif yang disediakan.
Efektivitas distraktor diperiksa untuk melihat apakah semua distraktor atau
semua pilihan jawaban yang bukan kunci telah berfungsi sebagaimana mestinya,
yaitu apakah distraktor-distraktor tersebut telah dipilih lebih banyak (atau semua)
siswa Kelompok Rendah sedangkan siswa dari Kelompok Tinggi hanya sedikit
(atau tidak ada) yang memilihnya.
Efektivitas distraktor dilihat dari dua kriteria, yaitu: (a) distraktor dipilih oleh
siswa dari Kelompok Rendah, dan (b) pemilih distraktor tersebar relative
proporsional pada masing-masing distrakktor yang ada (Azwar, 2005)
4. Reliabilitas
a. Pengertian Reliabilitas
Reliabilitas merupakan penerjemahan dari kata reliability yang berasal
dari dua kata yaitu rely dan ability, dimana rely memilliki arti percaya atau
mempercayakan sedangkan ability memiliki arti kemampuan. Ada banyak istilah
yang digunakan untuk menyatakan reliabilitas, seperti keterpercayaan,
keterandalan, keajegan, kestabilan, konsistensi dan sebagainya, namun pada
intinya konsep reliabilitas memiliki makna: sejauh mana hasil suatu tes/
pengukuran dapat dipercaya (Azwar, 2007)
Crocker dan Algina (2005) menjelaskan bahwa pada dasarnya reliabilitas
”a reliability term refers to the degree to which individuals deviation scores, or z-scores, remain relatively consistent over repeated
administration of the same test or alternate test forms”.
Reliabilitas suatu tes ditunjukkan oleh taraf konsistensi skor yang
diperoleh para subjek yang diukur dengan alat yang sama atau minimal setara,
dalam kondisi yang berbeda (Suryabrata, 2005). Konsepsi mengenai reliabilitas
berkaitan dengan derajat konsistensi antara dua perangkat skor tes, maka formula
reliabilitas selalu dinyatakan dalam bentuk koefisien korelasi (Azwar, 2007).
Menurut Gregory (2000), reliabilitas dalam pengukuran psikologis menunjukkan
atribut konsistensi dari pengukuran itu sendiri. Hanya sedikit dari pengukuran
behavioral yang benar-benar reliabel, dan reliabilitas itu sendiri bersifat kontinum.
Berdasarkan beberapa definisi di atas, dapat disimpulkan bahwa
reliabilitas pada dasarnya merupakan ketetapan atau derajat konsistensi
performansi relative dari individu yang dikenai tes ketika diberikan tes yang sama
secara berulang atau tes yang parallel.
Tujuan dari sebuah pengetesan adalah untuk mengetahui true score
seseorang yang bersifat latent. Karena bersifat latent, maka skor ini tidak pernah
diketahui secara pasti nilainya dan yang paling mungkin dilakukan untuk
mengetahui true score ini adalah membuat perkiraan melalui observed score.
Observed score adalah skor individu yang diperoleh dari pengetesan. Faktor yang
adalah kondisi yang tidak sesuai atau tidak relevan dengan maksud tes (Anastasi
& Urbina, 1997). Ada dua jenis error yang sering terjadi, yaitu:
1) Systematic error yaitu kecenderungan individu untuk memperoleh skor
yang tinggi semua atau rendah semua. Sifat eror ini selalu konstan.
Sumbernya adalah karakteristik fisik individu, proses tes/ tes yang
tidak berkaitan dengan konstruk yang ingin diukkur. Misalnya alat
ukur rusak, gangguan pendengaran, gangguan penglihatan, dll.
2) Unsystematic error (random error), yaitu kecenderungan individu
memperoleh skor yang tidak tetap, terkadang baik, terkadang buruk.
Error ini bersifat random. Ada berbagai hal yang dapat menimbulkan
random error, antara lain kelelahan memori subjek dan naik turunnya
suasana hati, dll.
b. Jenis-jenis Pendekatan Estimasi Reliabilitas
Estimasi terhadap tingginya reliabilitas dapat dilakukan melalui berbagai
metode pendekatan, dimana masing-masing metode pendekatan dikembangkan
sesuai dengan sifat dan fungsi alat ukur yang bersangkutan dengan
mempertimbangkan segi-segi praktisnya (Azwar, 2007)
Menurut Azwar (2007), secara tradisional terdapat tiga macam
pendekatan reliabilitas yaitu :
1) Pendekatan Tes Ulang (tes-retest)
Pendekatan ini menunjukkan konsistensi pengukuran dari waktu ke waktu
dan menghasilkan koefisien reliabilitas yang dinamakan koefisien stabilitas.
dengan tenggang waktu tertentu. Asumsinya adalah bahwa suatu tes yang reliable
tentu akan menghasilkan skor tampak yang relative sama apabila dikenakan dua
kali pada waktu yang berbeda. Semakin besar variasi perbedaan skor subjek
antara kedua pengenaan tes, berarti semakin sulit untuk mempercayai bahwa tes
itu memberikan hasil ukur yang konsisten (Azwar, 2007)
Dalam prakteknya, pendekatan ini memiliki keterbatasan yaitu kurang
praktis dalam pelaksanaan tes sebanyak dua kali, dan besarnya kemungkinan
terjadi efek bawaan (carry-over effects) dari satu pengenaan tes ke pengenaan te
syang kedua. Artinya dalam hal ini besar kemungkinan terjadinya proses
pembelajaran bagi subjek dan hal ini akan mempengaruhi terhadapa skor hasil tes
yang kedua kalinya.
2) Pendekatan Bentuk-Paralel (alternate-forms)
Pendekatan bentuk paralel merupakan pengenaan dua bentuk tes pararel
dalam waktu yang bersamaan pada satu kelompok subjek. Jadi pendekatan ini
hanya dapat dilakukan apabila tersedia dua bentuk instrumen yang dapat dianggap
memenuhi asumsi parallel. Salah satu indicator terpenuhinya asumsi paralel
adalah setaranya korelasi antara skor kedua instrument tersebut dengan skor suatu
ukuran lain.
Tentu saja untuk dapat paralel kedua bentuk instrumen harus disusun
dengan tujuan mengukur objek psikologis yang sama, berdasarkan blue-Print
(pola-rancangan) yang sama dan spesifikasi yang sama pula.
Kelemahan utama dari pendekatan ini adalah sulitnya menyusun dua alat
pendekatan ini juga memiliki kelebihan, yaitu dapat menghilangkan
kemungkinan terjadinya efek bawaan.
3) Pendekatan Konsistensi Internal (Internal-Consistency)
Pendekatan konsistensi internal dilakukan dengan menggunakan satu
bentuk tes yang dikenakan hanya sekali saja pada sekelompok subjek (single-trial
administration). Pendekatan ini mengatasi kelemahan pada pendekatan tes-retest
dan alternate-forms.
Pendekatan reliabilitas konsistensi internal bertujuan untuk melihat
konsistensi antar-aitem atau antar bagian dalam tes itu sendiri. Untuk itu, setelah
skor setiap aitem diperoleh dari sekelompok subjek, tes dibagi menjadi beberapa
belahan, bisa dua belahan, tiga belahan dan bahkan belahan sebanyak aitem.
Membelah tes prinsipnya adalah mengusahakan agar antar belahan memiliki
jumlah aitem sama banyak, taraf kesulitan seimbang, isi sebanding, dan
memenuhi ciri-ciri paralel .
Bentuk dan sifat alat ukur serta banyaknya belahan yang dibuat akan
menentukan teknik perhitungan koefisien reliabilitasnya. Ada beberapa teknik
komputasi reliabilitas konsistensi internal diantaranya: Formula Spearman-Brown,
Formula Rulon, Formula Alpha, Formula-formula Kuder-Richardson, Formula
Kristof, Formula Analisis varians dan sebagainya. Berikut ini akan dijelaskan