TEST
(IST)
SKRIPSI
Diajukan untuk memenuhi persyaratan Ujian Sarjana Psikologi
Oleh:
KIKI FATMALA SARI
071301068
FAKULTAS PSIKOLOGI
UNIVERSITAS SUMATERA UTARA
GENAP, 2010/2011
RECHENAUFGABEN
(RA) PADA
INTELLIGENZ STRUKTUR
TEST
(IST)
Dipersiapkan dan disusun oleh:
KIKI FATMALA SARI 071301068
Telah dipertahankan di depan Dewan Penguji
Pada tanggal 15 Maret 2011
Mengesahkan,
Dekan Fakultas Psikologi
Prof. Dr. Irmawati, Psikolog
NIP. 19530131980032001
Tim Penguji
1. Etty Rahmawati, M.Si. Penguji I/Pembimbing
NIP. 198107252008012013
2. Ika Sari Dewi, S.Psi.,psikolog Penguji II
NIP. 197809102005012001
3. Eka Danta Jaya G., M.A Penguji III
NIP. 197308192001121001
sesungguhnya bahwa skripsi saya yang berjudul :
Karakteristik Psikometri Subtes
Rechenaufgaben (RA) Pada Intelligenz Struktur Test (IST)
adalah hasil karya sendiri dan belum pernah diajukan untuk memperoleh gelar
kesarjanaan di Fakultas Psikologi Universitas Sumatera Utara.
Adapun bagian-bagian tertentu dalam penulisan skripsi ini saya kutip dari
hasil karya orang lain yang telah dituliskan sumbernya secara jelas sesuai dengan
norma, kaidah, dan etika penulisan ilmiah.
Apabila di kemudian hari ditemukan adanya kecurangan di dalam skripsi
ini, saya bersedia menerima sanksi dari Fakultas Psikologi Universitas Sumatera
Utara sesuai dengan peraturan yang berlaku.
Medan, Maret 2011
Kiki Fatmala Sari
NIM 071301068
ABSTRAK
Intelligenz Struktur Test (IST) merupakan salah satu tes inteligensi yang sering digunakan untuk seleksi karyawan dalam jumlah besar oleh P3M Fakultas Psikologi USU. IST yang digunakan adalah IST adaptasi UNPAD tahun 1970-an yang belum pernah dievaluasi secara psikometri oleh P3M Fakultas Psikologi USU. Usia IST yang tidak mudah dan rendahnya pengawasan terhadap kerahasiaan tes mengakibatkan IST tidak reliabel dan valid lagi dalam mengukur kemampuan inteligensi individu. Padahal, seperangkat tes yang berkualitas baik secara psikometri merupakan salah satu syarat mutlak yang harus dipenuhi agar proses pengukuran serta penggunaan hasil pengukuran dapat dipercaya. Oleh karena itu, diperlukan evaluasi terhadap IST, khususnya subtes RA.
Tujuan dari penelitian ini adalah untuk melihat apakah subtes RA masih mampu mengungkap fungsi ukurnya sesuai dengan tujuan subtes RA disusun melalui analisis karakteristik psikometri mencakup analisis indeks kesukaran aitem, indeks diskriminasi aitem, reliabilitas, serta validitas konstrak subtes RA tersebut.
Metode pengumpulan data yang digunakan pada penelitian ini adalah metode dokumentasi, yaitu dengan menggunakan data yang didokumentasikan oleh P3M Fakultas Psikologi USU. Data tersebut berupa respon subjek terhadap subtes RA pada lembar jawaban IST yang diperoleh dari 2011 subjek. Hasil penelitian secara keseluruhan, dengan menggunakan pendekatan teori tes klasik dan berdasarkan tujuan IST, khususnya subtes RA sebagai salah satu tes inteligensi ditemukan bahwa dari total 20 aitem pada subtes RA, 16 aitem yang dianggap baik berdasarkan indeks diskriminasinya. Berdasarkan koefisien reliabilitasnya dan nilai koefisien reliabilitas yang baik untuk tes inteligensi menurut Murphy & Davidshofer (2003) adalah ≥ 0,90, subtes RA dianggap kurang reliabel dalam mengukur fungsi ukurnya karena hanya memiliki koefisien reliabilitas sebesar 0,851. Selain itu, berdasarkan analisis validitas konstraknya, subtes RA tidak lagi berfungsi sebagaimana tujuan awal subtes ini di susun. Pada akhirnya penelitian ini menggambarkan bahwa perlunya peninjauan ulang terhadap aitem-aitem subtes RA sebelum digunakan sebagai tes inteligensi, khususnya pada individu dengan latar belakang pendidikan SMA, D3, dan S1.
Kata Kunci : karakteristik psikometri, teori tes klasik, IST, subtes RA
1
Mahasiswa Fakultas Psikologi Universitas Sumatera Utara
2
Dosen Departemen Umum & Eksperimen Fakultas Psikologi Universitas Sumatera Utara
ABSTRACT
Intelligenz Struktur Test (IST) is one of the intelligence tests that are often used for selection a large number of employees and conducted by P3M Psychology Faculty of USU. The IST is adopted from UNPAD in the 1970s that has never been evaluated psychometrically by P3M Psychology Faculty of USU. The longterm using of IST and low control over the confidentiality of test result is not reliable and valid in measuring individual intelligence. In fact, the tests that has good quality psychometrically is one of necessary condition that must be met for measurement and using of trusted measurement results. Therefore, it is necessary to evaluate the IST, especially the RA subtest.
The aim of this study is to see if RA subtest is still able to reveal the measuring function in accordance with the objectives of RA subtest that is created by analysis of psychometric characteristics includes the analysis of difficulty item index, discrimination item index, reliability, and validity construct of the the RA subtest.
The method of data collection that is used in this study is a documentation method, by using the data documented by the P3M Psychology Faculty of USU as 2011 answer sheets of IST subject. With using classical test theory (CTT) and based on the purpose of IST as a test selection of large number of employees , the result of this study showed the total of 20 items on RA subtest, only 16 items are considered as good item. From the coefficient of reliability and good reliability coefficients for tests of intelligence according to Murphy & Davidshofer (2003), RA subtest was considered less reliable in measuring the measurement function because it only has a reliability coefficient of 0.851. In addition, Based on validity, RA subtest is no longer serve as the initial aim of this subtest designed. At last, this study showed that it is necessary to review of the items of RA subtest before being used as intelligence tests to an individual, especially in individuals with educational backgrounds from high school, D3, and S1.
Keywords : psychometric characteristics, classical test theory, IST, subtestRA
1
Student of Psychology Faculty , Sumatera Utara University
2
Lecturer Department of General and Experimental of Psychology Faculty, Sumatera Utara University
limpahan rahmat, karunia dan kekuatan dalam penyelesaikan skripsi ini serta
terima kasih telah memberikan penulis orang tua yang sangat luar biasa, Zulfarizal
dan Ernawilis, yang selama ini menjadi motivasi penulis untuk bisa menjadi yang
terbaik bagi mereka. Mereka selalu memotivasi penulis dalam proses pendidikan
yang penulis jalani sampai penyelesaian skripsi ini.
Judul Penyusunan skripsi ini adalah: “Karakteristik Psikometri Subtes
Rechenaufgaben (RA) Pada Intelligenz Struktur Test (IST)”. Skripsi ini disusun
dalam rangka memenuhi salah satu syarat untuk mencapai gelar Sajana Psikologi
Fakultas Psikologi Universitas Sumatera Utara Medan.
Penulis menyadari bahwa tanpa bantuan dan bimbingan dari berbagai
pihak, baik dari masa perkuliahan sampai pada penyusunan skripsi ini sangatlah
sulit bagi penulis untuk dapat menyelesaikan penulisan skripsi ini. Oleh karena
itu, penulis mengucapkan terimakasih kepada:
1. Prof. Dr. Irmawati, Psikolog selaku Dekan Fakultas Psikologi.
2. Ibu Etty Rahmawati, M.Si selaku dosen pembimbing dan penguji skripsi ini
yang telah banyak menyediakan waktu, tenaga, dan pikiran dalam
membimbing dan motivasi penulis.
3. Ibu Lily Garliah, M.Si dan Ibu Ika Sari Dewi, S.Psi., Psikolog selaku dosen
penguji seminar yang telah memberikan masukan dan dukungan.
skripsi ini.
5. Ibu Liza Marini, M.Psi. selaku dosen pembimbing akademik selama peneliti
kuliah di Fakultas Psikologi USU yang telah membimbing dan memberikan
saran kepada peneliti dalam proses perkuliahan.
6. Semua staf pengajar dan pegawai Fakultas Psikologi USU yang selalu
memberikan ilmunya kepada penulis dan membantu penulis dalam proses
pendidikan dan menyelesaikan skripsi ini.
7. Pihak P3M Fakultas Psikologi USU yang telah bersedia diwawancarai dan
memberikan izin kepada peneliti untuk menggunakan dokumentasi data IST.
8. Erlina Desi Purwanti, Da Wewen, Bang David selaku kakak yang selalu
memberikan bantuan dan motivasi kepada penulis selama proses awal
pendidikan sampai penulis bisa menyelesaikan skripsi ini. Agra dan Yazeed
selaku adek yang telah mengisi hari-hari peneliti dengan kebahagian.
9. Nang Nia selaku kakak yang selalu sabar mendengarkan keluh kesah, selalu
memberikan semangat, kasih sayang dan memanjakan peneliti. Miss you Sis.
10. Kak Rena Elvira, Fitri Susanti, Dermika dan Princen selaku rekan yang
sama-sama mengikuti penelitian payung IST atas kerjasama-sama, bantuan, motivasi dan
masukan yang diberikan selama ini.
11. Kak Sofi selaku kakak kos selama tiga setengah tahun terakhir ini yang telah
banyak membantu dan memberi masukan selama penulis menjalani proses
12. Adela Eka Putra Marza, Thanks a lot, love you. I am speechless for you.
13. Nana Z. Siregar selaku sahabat dan teman satu Pembimbing Akademik (PA)
yang telah banyak membantu dan menemani penulis dalam permasalahan KRS,
pembayaran uang kuliah, dan banyak hal lain yang tidak dapat penulis
sebutkan satu persatu. Selanjutnya, sahabat-sahabat yang baik hati lainya
(Massita Ozar, Vety Dazefa, Khairiah Mulia Rahma, Nuzulia Rahmati,
Zulfadilah Nst., dan Ridya Tyastiti) yang telah banyak membantu dan berbagi
suka dan duka selama masa perkuliahan. Semoga pertemanan ini terpelihara
indah sampai nantinya. Love you all. Dan, Vet, terima kasih atas foto-foto
ucapan selamat ultahnya ya.
14. Riva Perlia Asmi selaku teman yang telah mengirimkan makalah dan Diktat
kuliah IST dari Bandung ke Medan. Makalah dan Diktat tersebut menjadi
lansadan teori tentang IST bagi penulis dan 4 orang teman lainnya yang juga
meneliti tentang IST.
15. Sahabat-sahabat yang selalu memberikan semangat kepada peneliti, yaitu
Yessi (Cuyes), Dini, Nenek, Bunda Wiry, & Nyak Ririn. Sahabat-sahabat
dikampung, yaitu Jeli, Mela, Mega, Vanny, dan Nining.
16. Uda-uda, Uni-uni, Kawan-kawan serta Adiak-adiak satu kampung yang telah
banyak membantu dan memberikan warna yang berbeda dalam hidup penulis
selama penulis hidup di Medan. Terima kasih atas kesempatan dan
17. Seterusnya terima kasih kepada semua pihak yang tidak dapat penulis
sebutkan satu persatu, yang telah banyak memberikan dukungan kepada
penulis dalam menyelesaikan proposal skripsi ini.
Semoga Allah SWT memberikan balaasan atas segala bantuan yang
diberikan selama penulis menjalani pendidikan dan dalam penyusunan skripsi ini.
Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Untuk itu
penulis meminta maaf dan mengharapkan masukan yang membangun sehingga
pelaporan hasil penelitian ini menjadi lebih baik lagi di masa yang akan datang.
Akhir kata penulis berharap skripsi ini dapat bermanfaat bagi kita semua.
Medan, Maret 2011
Peneliti
HALAMAN PENGESAHAN……….ii
PERNYATAAN KEASLIAN SKRIPSI……..………..…iii
ABSTRAK………..iv
KATA PENGANTAR…...……….vi
DAFTAR ISI………x
DAFTAR TABEL……….xiv
DAFTAR RUMUS………...xv
DAFTAR LAMPIRAN……….xvi
BAB I PENDAHULUAN A. Latar Belakang Masalah... 1
B. Identifikasi Masalah ... 9
C. Rumusan Masalah... 10
D. Tujuan Penelitian ... 10
E. Manfaat Penelitian ... 11
1. Manfaat Teoritis ... 11
2. Manfaat Praktis ... 11
BAB II TINJAUAN PUSTAKA A. Classical Test Theory (CTT)... 14
1. Pengertian CTT ...14
1. Indeks Kesukaran Aitem...…………... 18
a. Pengertian Indeks Kesukaran Aitem ...…………... 18
b. Analisis Indeks Kesukaran Aitem ... 20
2. Indeks Diskriminasi Aitem ...…...22
a. Pengertian Indeks Diskriminasi Aitem……...22
b. Analisis Indeks Diskriminasi Aitem ...………...23
3. Reliabilitas Alat Ukur……... 26
a. Pengertian Reliabilitas.………... 26
b. Bentuk Estimasi Reliabilitas ... 27
c. Interpretasi Koefisien Reliabilitas ... 36
d. Faktor-faktor yang Mempengaruhi Koefisien Reliabilitas ... 38
4. Validitas ... 40
a. Pengertian Validitas ... 40
b. Jenis-Jenis Validitas ... 41
c. Interpretasi Koefisien Validitas………..44
C. Analisis Karakteristik Psikometri Alat Ukur...45
D. Intelligenz-Struktur-Test (IST)... 47
1. Sejarah dan Perkembangan ………... 47
2. Fungsi dan Tujuan IST.………... 50
3. Subtes-subte dalam IST……….50
4. Skoring dan Interpretasi………52
BAB III METODE PENELITIAN
A. Data yang Digunakan...……... 55
B. Subjek Penelitian ... 55
C. Metode Pengumpulan Data...………... 56
D. Persiapan dan Pelaksanaan Penelitian ... 56
1. Persiapan Izin Penelitian ....…... 56
2. Pelaksanaan Penelitian... 56
E. Program Komputer yang Digunakan ... 57
F. Analisis Data ... 58
BAB IV HASIL DAN PEMBAHASAN A. Deskripsi Hasil……...……... 60
1. Analisis Indeks Kesukaran Aitem... 60
2. Analisis Indeks Diskriminasi Aitem... 62
3. Analisis Reliabilitas Subtes RA…...63
4. Analisis Validitas Konstrak Subtes RA... 64
5. Analisis Berdasarkan Karakteristik Psikometri………66
B. Pembahasan….……...……... 67
1. Analisis Indeks Kesukaran Aitem... 67
2. Analisis Indeks Diskriminasi Aitem... 68
3. Analisis Reliabilitas Subtes RA…... 69
BAB V KESIMPULAN DAN SARAN
A. Kesimpulan…………...……... 75
B. Saran ...………... 76
1. Saran Praktis………... 76
2. Saran Penelitian………... 77
DAFTAR PUSTAKA………78
Tabel 2. Evaluasi Indek Diskriminasi Aitem………24
Tabel 3. Kategori Nilai Estimasi Koefisien Reliabilitas………...38
Tabel 4. Gambaran Umum Subjek Penelitian Berdasarkan Jenis Kelamin……..55
Tabel 5. Hasil Analisis Indeks Kesukaran Aitem Subtes RA….………..61
Tabel 6. Pengelompokan p Subtes RA……….….61
Tabel 7. Hasil Analisis Indek Diskriminasi Aitem Subtes RA…………...……..62
Tabel 8. Evaluasi d Subtes RA………..………....……63
Tabel 9. Matriks Korelasi Antar Subtes pada IST.……….….…..65
Tabel 10. Korelasi Subtes RA dengan 8 Subtes Lainnya..…...……….65
Tabel 11. Nilai p dan d Subtes RA…………...………...………..66
Rumus 1 Asumsi I……….………15
Rumus 2 Asumsi II………15
Rumus 3 Asumsi III………..………15
Rumus 4 Asumsi IV……….……….16
Rumus 5 Asumsi V……….…………..16
Rumus 6 Indeks Kesukaran Aitem………18
Rumus 7 Hubungan Indeks Kesukaran Aitem dan Rata-rata………19
Rumus 8 Rata-rata Indeks Kesukaran Aitem………19
Rumus 9 Indeks Diskriminasi Aitem………22
Rumus 10 Indeks Diskriminasi Aitem dengan nilai p………...23
Rumus 11 Spearman-Brown……….…31
Rumus 12 Koefisien Alpha………...32
Rumus 13 Koefisien Alpha untuk Tes Belah Dua………32
Rumus 14 Kuder-Richardson 20………...33
Rumus 15 Kuder-Richardson 21………...34
Rumus 16 Kuder-Richardson 21 dengan rata-rata………....34
Rumus 17 Kristof untuk Belah Tiga……….35
Rumus 18 Flanagan………...35
Rumus 19 Standar Eror Pengukuran……….37
A. Tabulasi Respon Subjek terhadap Subtes RA pada IST….………..…80
B. Z-Skor Subjek pada 9 Subtes IST ………81
LAMPIRAN II Analisis Parameter Aitem dengan Program Iteman A. Menyimpan Data dalam Bentuk Notepad/Fixed ASCII….………….82
B. Membuat Syntax (Control Tile)….………....83
C. Membuka Lembar Kerja Iteman………...………84
D. Memasukkan Data………....85
D. Membaca Hasil Analisis Iteman……….…………..86
E. Hasil Analisis p, d dan Reliabilitas Subtes RA dengan Iteman……....88
LAMPIRAN III Hasil Analisis Korelasi Antar Subtes pada IST dengan Bantuan Program SPSS Versi 16 A. Hasil Korelasi Antar Subtes pada IST...………89
ABSTRAK
Intelligenz Struktur Test (IST) merupakan salah satu tes inteligensi yang sering digunakan untuk seleksi karyawan dalam jumlah besar oleh P3M Fakultas Psikologi USU. IST yang digunakan adalah IST adaptasi UNPAD tahun 1970-an yang belum pernah dievaluasi secara psikometri oleh P3M Fakultas Psikologi USU. Usia IST yang tidak mudah dan rendahnya pengawasan terhadap kerahasiaan tes mengakibatkan IST tidak reliabel dan valid lagi dalam mengukur kemampuan inteligensi individu. Padahal, seperangkat tes yang berkualitas baik secara psikometri merupakan salah satu syarat mutlak yang harus dipenuhi agar proses pengukuran serta penggunaan hasil pengukuran dapat dipercaya. Oleh karena itu, diperlukan evaluasi terhadap IST, khususnya subtes RA.
Tujuan dari penelitian ini adalah untuk melihat apakah subtes RA masih mampu mengungkap fungsi ukurnya sesuai dengan tujuan subtes RA disusun melalui analisis karakteristik psikometri mencakup analisis indeks kesukaran aitem, indeks diskriminasi aitem, reliabilitas, serta validitas konstrak subtes RA tersebut.
Metode pengumpulan data yang digunakan pada penelitian ini adalah metode dokumentasi, yaitu dengan menggunakan data yang didokumentasikan oleh P3M Fakultas Psikologi USU. Data tersebut berupa respon subjek terhadap subtes RA pada lembar jawaban IST yang diperoleh dari 2011 subjek. Hasil penelitian secara keseluruhan, dengan menggunakan pendekatan teori tes klasik dan berdasarkan tujuan IST, khususnya subtes RA sebagai salah satu tes inteligensi ditemukan bahwa dari total 20 aitem pada subtes RA, 16 aitem yang dianggap baik berdasarkan indeks diskriminasinya. Berdasarkan koefisien reliabilitasnya dan nilai koefisien reliabilitas yang baik untuk tes inteligensi menurut Murphy & Davidshofer (2003) adalah ≥ 0,90, subtes RA dianggap kurang reliabel dalam mengukur fungsi ukurnya karena hanya memiliki koefisien reliabilitas sebesar 0,851. Selain itu, berdasarkan analisis validitas konstraknya, subtes RA tidak lagi berfungsi sebagaimana tujuan awal subtes ini di susun. Pada akhirnya penelitian ini menggambarkan bahwa perlunya peninjauan ulang terhadap aitem-aitem subtes RA sebelum digunakan sebagai tes inteligensi, khususnya pada individu dengan latar belakang pendidikan SMA, D3, dan S1.
Kata Kunci : karakteristik psikometri, teori tes klasik, IST, subtes RA
1
Mahasiswa Fakultas Psikologi Universitas Sumatera Utara
2
Dosen Departemen Umum & Eksperimen Fakultas Psikologi Universitas Sumatera Utara
ABSTRACT
Intelligenz Struktur Test (IST) is one of the intelligence tests that are often used for selection a large number of employees and conducted by P3M Psychology Faculty of USU. The IST is adopted from UNPAD in the 1970s that has never been evaluated psychometrically by P3M Psychology Faculty of USU. The longterm using of IST and low control over the confidentiality of test result is not reliable and valid in measuring individual intelligence. In fact, the tests that has good quality psychometrically is one of necessary condition that must be met for measurement and using of trusted measurement results. Therefore, it is necessary to evaluate the IST, especially the RA subtest.
The aim of this study is to see if RA subtest is still able to reveal the measuring function in accordance with the objectives of RA subtest that is created by analysis of psychometric characteristics includes the analysis of difficulty item index, discrimination item index, reliability, and validity construct of the the RA subtest.
The method of data collection that is used in this study is a documentation method, by using the data documented by the P3M Psychology Faculty of USU as 2011 answer sheets of IST subject. With using classical test theory (CTT) and based on the purpose of IST as a test selection of large number of employees , the result of this study showed the total of 20 items on RA subtest, only 16 items are considered as good item. From the coefficient of reliability and good reliability coefficients for tests of intelligence according to Murphy & Davidshofer (2003), RA subtest was considered less reliable in measuring the measurement function because it only has a reliability coefficient of 0.851. In addition, Based on validity, RA subtest is no longer serve as the initial aim of this subtest designed. At last, this study showed that it is necessary to review of the items of RA subtest before being used as intelligence tests to an individual, especially in individuals with educational backgrounds from high school, D3, and S1.
Keywords : psychometric characteristics, classical test theory, IST, subtestRA
1
Student of Psychology Faculty , Sumatera Utara University
2
Lecturer Department of General and Experimental of Psychology Faculty, Sumatera Utara University
A.Latar Belakang Masalah
Pendidikan Ilmu Psikologi mulai diselenggarakan di Indonesia pada tahun
1953. Sejak itu, ilmu psikologi berkembang dan banyak diselenggarakan di
perguruan tinggi negeri maupun swasta. Selain itu, perkembangan ilmu psikologi
juga ditandai oleh banyaknya penemuan ilmiah tentang pengaruh aspek psikologis
dalam kehidupan individu sehingga ilmu psikologi semakin dikenal umum dan
diterima oleh masyarakat Indonesia.
Masyarakat lebih mengenal Psikologi dari jasa dan praktik yang
disediakan oleh tenaga profesional psikologi atau Psikolog. Jasa dan praktik
Psikologi ini diberikan untuk menolong individu dalam bentuk asesmen,
diagnosis, prognosis, konseling dan psikoterapi. Namun, bentuk dari jasa dan
praktik Psikologi yang lebih dikenal dan berkembang di masyarakat adalah
asesmen dalam bentuk pengukuran aspek-aspek psikologis pada diri individu.
Menurut Azwar (2007), alat yang digunakan untuk mengungkap aspek-aspek
psikologis dalam diri individu disebut dengan tes psikologi.
Tes Psikologi merupakan suatu alat ukur yang objektif dan terstandar
terhadap suatu sampel prilaku (Anastasi & Urbina, 2006). Menurut Sukardi
(1997), tes psikologi berfungsi untuk seleksi, klasifikasi, deskripsi, mengevaluasi
suatu treatment, dan menguji suatu hipotesis yang berhubungan dengan
aspek-aspek psikologis. Namun, fungsi yang lebih umum dan berkembang saat ini
adalah untuk seleksi, khususnya seleksi karyawan. Fungsi ini digunakan oleh
bidang industri dan organisasi untuk memutuskan individu yang tepat untuk suatu
pekerjaan tertentu.
Aneka ragam tes psikologi telah dirancang dengan fungsi dan tujuan yang
berbeda yang umum digunakan dalam seleksi, diantaranya tes intelegensi, bakat,
minat dan kepribadian. Dari berbagai jenis tes psikologi ini, salah satu yang cukup
penting dalam mengukur dan memprediksi tingkah laku seseorang adalah tes
inteligensi. Menurut Anastasi & Urbina (2006) tes inteligensi dapat digunakan
untuk mengukur kemampuan kognisi atau disebut juga inteligensi pada individu
yang telihat dari perilaku-perilaku yang ditunjukkan.
Intelligenz Struktur Test (disingkat IST) merupakan tes inteligensi yang
umum digunakan di Indonesia. Tes inteligensi ini dikembangkan oleh Rodolf
Amthauer pada tahun 1953. IST diciptakan berdasarkan pandangan bahwa
inteligensi merupakan keseluruhan struktur dari kemampuan jiwa dan rohani yang
akan tampak jelas dalam hasil tes. Tes ini terdiri dari sembilan subtes yaitu
Satzergaenzung (SE), Wortauswahl (WA), Analogien (AN), Gemeinsamkeiten
(GE), Merkaufgaben (ME), Rechenaufgaben (RA), Zahlenreinhen (ZR),
Figurenauswahl (FA), dan Wuerfelaufgaben (WU). Setiap subtes ini mengukur
aspek-aspek yang berbeda dari inteligensi dan dapat digunakan secara keseluruhan
atau satu subtes saja. Oleh karena itu, tes ini dapat menggambarkan pola kerja
tertentu, sehingga akan cocok digunakan untuk memprediksi tuntutan profesi atau
Tes inteligensi yang dikembangkan oleh Amthauer ini digunakan di
Indonesia setelah di adaptasi oleh Fakultas Psikologi Universitas Padjajaran
Bandung (UNPAD) dari alat tes aslinya. Semenjak diadaptasi, IST sering
digunakan oleh biro-biro psikologi di Indonesia salah satunya adalah Unit Pusat
Penelitian dan Pengabdian pada Masyarakat Fakultas Psikologi Universitas
Sumatra Utara (P3M Fakultas Psikologi USU). IST yang digunakan oleh P3M
Fakultas Psikologi USU ini merupakan IST-70 adaptasi tahun 1970-an di
Universitas Padjajaran Bandung. Berikut penuturan seorang staf P3M, Novi:
“IST yang kita pakai disini adalah IST adaptasi UNPAD tahun 1970-an. Tes ini lebih sering digunakan untuk tes yang diambil secara kelompok dengan peserta lebih dari 100 orang. Biasanya untuk seleksi pegawai. Sejak saya disini, IST telah digunakan dalam proses seleksi penerimaan karyawan beberapa perusahaan besar” Novi (komunikasi personal, 24 juli dan 06 Oktober 2010).
Berdasarkan pernyataan tersebut dapat diketahui bahwa IST yang
digunakan oleh P3M Fakultas Psikologi USU telah berusia lebih dari tiga puluh
tahun dan masih sering digunakan oleh P3M Fakultas Psikologi USU, terutama
dalam proses seleksi karyawan.
Proses seleksi karyawan merupakan proses pencarian individu yang tepat
untuk suatu pekerjaan. Hasil tes atau skor IST menjadi salah satu landasan
pengambilan keputusan apakah individu diterima atau tidak. Kelayakan keputusan
yang diambil berdasarkan interpretasi skor tes sangatlah ditentukan oleh kualitas
pengukuran dan ketepatan interpretasinya (Azwar, 2007). Selain itu, harus
disadari bahwa subjek tes adalah manusia. Oleh karena itu, persoalan tes dan
pengukuran bukan sekedar masalah keberhasilan mendeskripsikan atribut dalam
penting adalah akibat yang dapat ditimbulkan oleh hasil tes. Akibat tersebut
bahkan dapat menjangkau bukan saja subjek pengukuran itu saja melainkan juga
orang-orang lain yang ikut berkepentingan dalam dirinya.
Azwar (2007) menyatakan bahwa sebagai alat ukur, suatu tes dapat
dikatakan berhasil menjalankan fungsi ukurnya apabila alat tersebut mampu
memberikan hasil ukur yang cermat dan akurat. Artinya, suatu alat tes berkualitas
baik dalam proses seleksi akan menentukan seberapa baik proses seleksi itu
membedakan antara peserta tes yang mempunyai sedikit kemampuan dan yang
mempunyai lebih banyak kemampuan, sehingga akan menentukan seberapa baik
dan tepat individu yang terpilih dari proses seleksi tersebut sesuai dengan yang
diharapkan. Selain itu, suatu alat tes yang baik terdiri dari aitem-aitem yang
dirancang sedemikian rupa dalam bentuk pernyataan mengenai dimensi apa yang
hendak diukur atau diungkap dari aitem tersebut (Azwar 2007). Jadi, suatu tes
yang berkualitas ditentukan oleh kualitas aitem-aitem didalamnya sehingga
syarat-syarat validitas, reliabilitas, dan objektivitas pada penggunaan tes sebagai
alat ukur terpenuhi. Cara yang dapat dilakukan untuk mengetahui suatu alat ukur
memiliki kualitas yang baik atau tidak dapat diketahui melalui uji analisis
karakteristik psikometri pada alat ukur tersebut.
Analisis karakteristik psikometri pada IST pernah dilakukan oleh Santosa
dkk. (dalam Astya, 2008) pada tahun 1997 di Universitas Atma Jaya, Jakarta.
Penelitian tersebut dilakukan untuk uji validitas prediktif sehubungan dengan
pemakaian IST sebagai tes seleksi masuk mahasiswa baru Universitas Atma Jaya
Ilmu Pendidikan, dan Fakultas Psikologi. Hasilnya menunjukkan bahwa IST
kurang baik dalam memprediksi keberhasilan prestasi mahasiswa pada semester
pertama. Hanya beberapa subtes saja yang berkorelasi signifikan (p≤0.05) dengan
prestasi mahasiswa dan korelasinya masih dalam taraf yang kecil. Subtes-subtes
tersebut adalah SE dengan r = 0,219; AN dengan r = 0,192; ME dengan r = 0,210;
RA dengan r =0,251; ZR dengan r = 0,176; GE dengan r = 0,152.
Sejak dilakukan uji validitas prediktif ini, IST tidak lagi digunakan untuk
alat seleksi di Universitas Atma Jaya karena dianggap tidak dapat meramalkan
prestasi mahasiswa (Astya, 2008). Pada tahun 2001, Fakultas Psikologi
Universitas Airlangga melakukan uji validitas dan reliabilitas pada aitem IST
dengan subjek 200 siswa SMA, hasilnya menunjukkan bahwa dari 176 aitem
terdapat 131 aitem yang dinyatakan valid dan 45 aitem yang dinyatakan gugur dan
dari sembilan subtes, satu subtes yakni ZR (dengan jumlah aitem 20) dinyatakan
semua aitemnya valid. Sedangkan untuk reliabilitas dari sembilan subtes tersebut
semuanya dinyatakan reliabel dengan besar koefisien sebesar 0,463-0,821 pada
taraf signifikansi 0,01. Namun hasil ini tidak bisa digeralisasi lebih luas
mengingat jumlah dan karakteristik subjek yang terbatas (Hamidah, 2001).
Santosa dkk. (dalam Widianti, 2008) juga menyatakan bahwa sebuah tes
yang telah dipakai dalam jangka waktu lama seperti IST, memang memerlukan
pengujian ulang untuk melihat sejauhmana tes tersebut masih dapat digunakan
sebagai alat ukur yang handal. Handayani (dalam Widianti, 2008) juga
menyatakan bahwa issue lainnya yang berkembang menurut Himpunan Sarjana
kota-kota besar seperti Jakarta karena IST diduga tidak valid untuk mengukur
inteligensi. Kondisi ini dilatarbelakangi oleh frekuensi pemakaian yang terlalu
tinggi dan kerahasiaan yang sulit dikontrol. Hasil wawancara dengan dosen
Fakultas Psikologi USU yang juga ketua P3M Fakultas Psikologi diketahui bahwa
IST juga telah bocor di kota Medan, tidak jarang individu memiliki lembar IST
dan mendapatkan skor yang mendekati sempurna walaupun individu tersebut
tidak mau menjawab semua dengan benar karena takut dicurigai oleh tester atau
individu yang memberikan tes. Oleh karena itu, penggunaan IST di P3M Fakultas
Psikologi USU umumnya atas permintaan individu atau perusahaan yang
bersangkutan. Sebelumnya, pihak P3M akan menjelaskan kelemahan dan
kelebihan tes tersebut (Komunikasi Personal, Ari Widiyanta, 26 November 2010).
Validitas dan reliabilitas yang masih dipertanyakan serta kerahasian yang
sulit dikontrol pada IST seharusnya membuat para pengguna tes ini
mempertanyakan kelayakan tes dalam mengukur inteligensi dan melakukan
evaluasi terhadap alat tes tersebut. Namun kenyataannya, IST masih saja
digunakan di Indonesia, khususnya oleh P3M Fakultas Psikologi USU tanpa
pernah melakukan evaluasi atau uji analisis karakteristik psikometri terhadap IST
tersebut. Sukardi (1997) menyatakan bahwa syarat tes yang baik memiliki kriteria
pokok sebagai berikut: tes yang terstandar atau baku dalam hal administrasi,
penskoran dan norma yang digunakan untuk membantu interpretasi skor; objektif;
valid; dan reliabel. Maka dapat disimpulkan bahwa suatu tes yang tidak memiliki
kriteria ini, dapat dikatakan bahwa tes tersebut tidak objektif dan tidak layak
proses analisis karakteristik psikometri terhadap IST sebagai salah satu tes
inteligensi yang sering digunakan oleh P3M Fakultas Psikologi USU.
Pada penelitian ini, pengujian secara psikometri hanya akan dilakukan
pada satu subtes, yaitu subtes Rechenaufgaben (RA). Subtes RA terdiri dari 20
soal mulai dari nomor 77 sampai dengan 96. Subtes digunakan untuk mengetahui
kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan
kemampuan mengambil kesimpulan (Polhaupessy dalam Diktat Kuliah IST
UNPAD, 2009).
Aitem-aitem dalam subtes RA disajikan dalam bentuk kalimat cerita.
Kalimat-kalimat tersebut terdiri dari 14 kata sampai dengan 38 kata. Seperti aitem
terakhir nomor 96, aitem ini dinyatakan dengan kalimat cerita yang paling
panjang sekitar 38 kata diantara aitem yang lainnya. Hal ini menunjukkan bahwa
aitem tersebut tidak hanya mengukur kemampuan berpikir praktis dalam
berhitung, tetapi juga mengukur kemampuan pemahaman bahasa individu yang
dikenai tes. Selain itu angka dan bilangan yang digunakan dalam subtes ini tidak
sesuai dengan perkembangan Indonesia saat ini. Seperti pada aitem no 77, 81, 84,
89, 91 menggunakan bilangan puluhan rupiah bahkan satuan rupiah. Sekarang ini,
nilai uang dalam bentuk satuan rupiah atau puluhan rupiah tidak lagi dikenal dan
digunakan dalam transaksi jual beli di Indonesia. Nominal uang yang paling kecil
yang masih berlaku adalah Rp. 100,-.
Hasil penelitian Fakultas Psikologi Universitas Atma Jaya, Jakarta tahun
2008 dengan subjek siswa SMA, menunjukkan bahwa subtes RA mengukur
IPS dan IPA, namun tidak berfungsi sebagai tes differensial (Engelen, 2008).
Berdasarkan hasil tersebut dapat dikatakan bahwa subtes ini tidak dapat
membedakan individu yang memiliki kemampuan berpikir praktis dalam
berhitung, berpikir induktif, reasoning, dan kemampuan mengambil kesimpulan
dengan individu yang tidak memiliki kemampuan tersebut.
Secara umum, analisis yang akan dilakukan dalam penelitian ini mencakup
analisis karakteristik psikometri berupa analisis indeks diskriminasi dan kesukaran
aitem, reliabilitas, serta analisis validitas subtes RA. Analisis reliabilitas dilakukan
sebagai salah satu pendekatan untuk mengestimasi skor murni individu. Melalui
koefisien reliabilitas dapat diestimasi letak skor murni individu dalam suatu
wilayah interval tertentu. Semakin tinggi koefisien reliabilitas mengindikasikan
semakin kecil pula eror yang terjadi dalam konteks pengukuran (Suryabrata,
2005). Selanjutnya uji validitas, Azwar (2007) mengartikan validitas sebagai
sejauhmana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya. Pada penelitian ini validitas yang akan diuji adalah validitas konstrak
yang bertujuan untuk meneliti ketepatan subtes RA dalam mengukur kemampuan
berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan
mengambil kesimpulan dengan menggunakan metode multitrait-multimethod
yang meliputi validitas diskriminan dan konvergen. Koefisien validitas konvergen
dan diskriminan dilihat dari korelasi antara subtes RA dengan 8 subtes lainnya
pada IST dalam bentuk matrik multitrait-multimethod. Korelasi yang tinggi
konvergen. Sebaliknya, korelasi yang rendah menunjukkan bahwa subtes-subtes
tersebut mengukur hal yang berbeda.
B.Identifikasi Masalah
Berdasarkan Latar Belakang Masalah yang telah diuraikan, maka dapat
diidentifikasi beberapa masalah yang berhubungan dengan IST, khususnya subtes
RA, yaitu:
1. IST masih sering digunakan sebagai tes inteligensi oleh P3M Fakultas
Psikologi USU, meskipun IST yang digunakan oleh P3M Fakultas Psikologi
USU tersebut merupakan IST adaptasi Fakultas Psikologi UNPAD, Bandung
tahun 1970-an dan belum pernah dievaluasi secara psikometri oleh P3M
Fakultas psikologi USU.
2. Hasil beberapa penelitian menyatakan bahwa sekarang ini IST memiliki
validitas prediktif kurang baik, 45 aitem IST dinyatakan gugur atau tidak valid,
serta tidak lagi digunakan di kota-kota besar seperti di Jakarta karena diduga
tidak valid untuk mengukur inteligensi akibat frekuensi pemakaian yang terlalu
tinggi dan kerahasiaan yang sulit dikontrol.
3. IST juga telah bocor di Kota Medan sehingga tidak jarang individu memiliki
lembar IST dan mendapatkan skor IST yang mendekati sempurna.
4. Hasil penelitian tentang subtes RA diketahui bahwa subtes RA mengukur
konstruk inductive reasoning dan tidak berfungsi sebagai tes differensial.
5. Aitem pada subtes RA berbentuk kalimat cerita yang terdiri dari 14 sampai 38
ukurnya tetapi juga mengungkap kemampuan bahasa yang dimiliki oleh
individu yang dikenai tes.
6. Penggunaan nilai mata uang yang berlaku di Indonesia pada tahun 1970-an
membuat aitem dalam subtes ini tidak sesuai lagi dengan nilai mata uang yang
berlaku dalam transaksi jual beli di Indonesia sekarang ini.
C. Rumusan Masalah
Permasalahan dalam penelitian ini dirumuskan dalam bentuk pertanyaan
sebagai berikut:
1. Seberapa baikkah indeks kesukaran aitem subtes RA pada IST?
2. Seberapa baikkah indeks diskriminasi aitem subtes RA pada IST?
3. Apakah subtes RA pada IST masih dapat dipercaya atau memiliki nilai
reliabilitas yang baik?
4. Bagaimanakah validitas konstrak subtes RA pada IST yang dilihat dari
koefisien validitas konvergen dan koefisien validitas diskriminan?
5. Bagaimanakah kualitas subtes RA pada IST berdasarkan hasil analisis
karakteristik psikometri?
D. Tujuan Penelitian
Penelitian ini bertujuan untuk melihat apakah IST masih berfungsi sesuai
dengan tujuan IST disusun, khususnya pada subtes RA berdasarkan karakteristik
E. Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan manfaat teoritis maupun
praktis, sebagai berikut:
1. Manfaat Teoritis
Penelitian ini diharapkan dapat menambah manfaat keilmuan dalam
bidang psikologi mengenai karakteristik psikometri subtes RA pada IST sehingga
dapat memberikan informasi apakah subtes RA pada IST masih berfungsi sesuai
dengan tujuan subtes tersebut disusun.
2. Manfaat Praktis
a) Penelitian ini diharapkan menjadi masukan dan landasan bagi akademisi
psikometri untuk merevisi IST, khususnya subtes RA.
b) Penelitian ini diharapkan dapat menjadi bahan pertimbangan bagi para
praktisi untuk menggunakan IST, khususnya subtes RA sebagai alat
BAB II
TINJAUAN PUSTAKA
Pada dasarnya ilmu pengukuran memiliki dua pendekatan, yaitu
pendekatan classical test theory (CTT) dan pendekatan teori modern. Pendekatan
CTT adalah metode pertama yang dikembangkan untuk pengukuran. Teori-teori
CTT mendominasi pengembangan rumus reliabilitas dan validitas yang dikenal
dewasa ini (Azwar, 2007 dan Suryabrata, 2005). Namun CTT memiliki beberapa
keterbatasan, yaitu tergantung pada kelompok sampel yang digunakan, asumsi
kesetaraan eror pengukuran pada semua subjek yang dikenai tes sulit untuk
diterima dan tidak ada pernyataan lain yang dapat memperkuat asumsi ini,
khususnya pada tes yang sulit, serta definisi tes paralel yang dimaksud oleh CTT
sangat sulit untuk dipenuhi dalam praktek (Azwar, 2005).
Pendekatan teori modern didasarkan pada sifat-sifat atau kemampuan yang
laten, yang mendasari performansi atau respon subjek terhadap aitem tertentu
sehingga disebut dengan Teori Sifat Laten (Latent Trait Theory) atau yang lebih
populer dengan sebutan Teori Respons Aitem (Item Response Theory yang
selanjutnya disingkat IRT (Suryabrata, 2005). Pendekatan ini bertujuan untuk
mengatasi kelemahan-kelemahan CTT. IRT dikembangkan atas dasar dua
postulat. Pertama, performansi seorang subjek pada suatu aitem dapat diprediksi
dari seperangkat faktor yang disebut traits, latent traits, atau kemampuan. Kedua,
hubungan antara performansi subjek pada suatu aitem dan kemampuan yang
meningkat secara monotonik yang disebut item characteristic function atau item
characteristic curve (ICC). ICC akan menunjukkan bahwa subjek yang memiliki
kemampuan yang tinggi akan memiliki peluang yang lebih besar untuk menjawab
aitem dengan benar. Artinya katakteristik-karakteristik aitem tidak lagi tergantung
pada kelompok subjek. Ini menjadi keuntungan menggunakan IRT yang tidak
dapat dijelaskan dengan CTT (Azwar, 2005). Model-model IRT memiliki
asumsi-asumsi pendukung walaupun tidak dapat diukur secara langsung, namun
dapat disimpulkan dan dinilai dari kesesuaian model pada perangkat data tes yang
akan dianalisis. Asumsi yang paling umum adalah unidimensionalitas, yaitu hanya
satu kemampuan yang diukur oleh aitem-aitem dalam setiap tes. Asumsi
berikutnya adalah independensi lokal, yaitu apabila kemampuan-kemampuan
yang mempengaruhi peformansi dijadikan konstan maka respon subjek terhadap
pasangan aitem manapun juga akan independen secara statistik satu sama lain.
Artinya kemampuan subjek pada suatu aitem tidak dipengaruhi oleh faktor-faktor
lainnya dan tidak berhubungan dengan kemampuan subjek pada aitem lainnya
(Azwar, 2005). Keuntungan lainya dalam menggunakan IRT adalah pendekatan
ini sangat mudah diadaptasikan untuk tes yang di administarasi dengan komputer
(Kaplan & Saccuzo, 2005). Keterbatasan dari pendekatan ini adalah proses yang
cukup rumit dan sulit untuk dilakukan karena analisis dilakukan per aitem dan
subjek.
Pada penelitian ini, pendekatan yang akan digunakan dalam proses analisis
adalah CTT dengan pertimbangan bahwa pendekatan ini yang dipelajari oleh
validitas, serta pendekatan ini lebih mudah digunakan karena analisis dilakukan
pada kelompok subjek bukan per subjek.
A. Classical Test Theory (CTT)
1. Pengertian CTT
Pendekatan CTT adalah metode pertama yang telah dikembangkan sejak
dahulu dan tetap digunakan dewasa ini dalam berbagai bidang kehidupan
sehingga pendekatan ini disebut dengan CTT atau teori tes klasik. CTT terbentuk
dan berkembang perlahan-lahan melalui unsur-unsur yang akhirnya secara
akumulatif menjadi bangunan teori yang utuh. Model pendekatan ini juga disebut
model skor murni (true score model). Inti CTT berupa asumsi-asumsi yang
dirumuskan secara sistematis (Suryabrata, 2005)
Asumsi-asumsi CTT pada dasarnya merupakan hubungan matematis dari
skor tampak yang disimbolkan dengan huruf X, skor murni yang dilambangkan
dengan huruf T, dan komponen eror pengukuran yang diberi simbol huruf E. X
merupakan nilai performansi individu yang diungkap oleh suatu pengukuran yang
dinyatakan dalam bentuk angka yang merupakan nilai total dari jawaban subjek
terhadap aitem atau pernyataan dalam tes tersebut. T menjelaskan performansi
individu sesungguhnya yang tidak mungkin dapat diungkap secara langsung oleh
tes. E menunjukkan besarnya eror individu dalam setiap tes yang angkanya juga
2. Asumsi-Asumsi dalam CTT
Pendekatan CTT terdiri dari asumsi-asumsi yang berkaitan dengan skor
tampak, skor murni dan komponen eror pengukuran. Allen & Yen (dalam Azwar,
2005) menguraikan hubungan antara eror pengukuran dan skor murni dalam
asumsi-asumsi sebagai berikut:
Asumsi 1: X = T + E (1)
Asumsi ini didasarkan pada model Spearman yang menyatakan bahwa
setiap skor tes menggambarkan gabungan dari dua komponen yaitu skor murni
dan komponen eror (Crocker & Algina, 2005). X merupakan jumlah T dan E,
sehingga besar X akan tergantung oleh besarnya E pengukuran, sedangkan
besarnya T individu pada setiap pengukuran yang sama diasumsikan selalu tetap.
Jadi dapat disimpulkan bahwa skor yang diperoleh dari suatu pengukuran
umumnya tidak menunjukkan keadaan sebenarnya (Suryabrata, 2005).
Asumsi 2: ε(X) = T (2)
Asumsi ini menyatakan bahwa T sama dengan nilai harapan dari X-nya
yang dilambangkan dengan ε(X). Jadi, T merupakan harga rata-rata dari distribusi
teoretik X apabila orang yang sama dikenai tes yang sama berulangkali dengan
asumsi pengulangan tes itu dilakukan tidak terbatas banyaknya dan setiap
pengulangan tes adalah independen satu sama lain.
Asumsi 3: = 0 (3)
Asumsi ini menyatakan bahwa bagi populasi subjek yang dikenai tes,
distribusi E pengukuran dan distribusi T tidak berkorelasi satu sama lain.
selalu positif ataupun selalu negative atau mempunyai E lebih tinggi dibanding
subjek yang T-nya rendah.
Asumsi 4: = 0 (4)
Asumsi ini menyatakan bahwa dalam eror pada dua tes ( yang dimaksud
untuk mengukur hal yang sama) tidak saling berkorelasi. Artinya besarnya E pada
suatu tes tidak tergantung pada E tes lainnya. Asumsi ini akan tidak terpenuhi
sekiranya skor tampak dipengaruhi kondisi testing, seperti misalnya kelelahan,
practice effect, suasana hati, atau factor-faktor dari lingkungan (Suryabrata, 2005).
Asumsi 5 = 0 (5)
Asumsi ini menyatakan bahwa E pada suatu tes tidak berkorelasi dengan T
pada tes lain.
E yang dimaksud dalam CTT adalah penyimpangan X dari skor harapan
teoritik yang terjadi secara random atau tidak terjadi secara sistematik. Jika
penyimpangan terjadi secara sistematik maka itu tidaklah dianggap sebagai
sumber eror.
Selain lima asumsi yang telah dijelaskan, terdapat dua asumsi lagi yang
dijelaskan oleh Suryabrata (2005), yaitu:
Asumsi 6
Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama
mempunyai skor tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan jika
untuk setiap populasi subjek T = T’ serta varians eror kedua tes tersebut sama,
Asumsi 7
Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama
mempunyai skor tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan
apabila untuk setiap populasi subjek T1 = T2 + C. Dengan C sebagai suatu
bilangan konstan, maka kedua tes tersebut dapat disebut sebagai tes yang setara
(equivalent test).
Dua tes yang setara dapat memiliki varians eror yang berbeda karena
keduanya belum tentu merupakan tes yang paralel, namun dua tes yang paralel
tentu memenuhi syarat sebagai tes yang setara (Azwar, 2005).
Asumsi-asumsi CTT secara sekilas terlihat sebagai sesuatu yang hanya
bersifat teoritis karena sulit untuk ditemukan dalam kehidupan nyata. Meskipun
demikian, CTT masih bertahan sebagai dasar pengembangan dan analisis alat
ukur psikologi. Berbagai tes telah disusun berdasarkan CTT di berbagai belah
dunia termasuk di Indonesia, seperti Tes Kemampuan Akademik (TPA), Ujian
Masuk Perguruan Tinggi Negeri (UMPTN), dan Ujian Akhir Nasional (UAN)
(Suryabrata, 2005).
B. Analisis Karakteristik Psikometri
Suatu alat ukur yang telah dikonstruksi pastinya belum dapat dikatakan
sebagai alat ukur yang layak pakai apabila analisis terhadap karakteristik
psikometri alat ukur tersebut belum dilakukan. Proses analisis terhadap
karakteristik psikometri dapat digunakan dalam merancang suatu alat ukur
dan reliabilitas suatu alat tes dengan cara memilih aitem-aitem yang baik sesuai
dengan tujuan alat tes (Crocker & Algina, 2005). Analisis aitem dapat dilakukan
secara kualitatif dan kuantitatif. Analisis aitem secara kualitatif berarti aitem
dianalisis berdasarkan bentuk dan isinya yang dapat dilakukan dengan
mempertimbangkan validitas isi. Sedangkan analisis secara kuantitatif dilakukan
dengan analisis parameter-parameter aitem berupa indeks kesukaran aitem, indeks
diskriminasi aitem, analisis reabilitas, dan validitas dari alat ukur tersebut
(Anastasi & Urbina, 2006).
Pada penelitian ini analisis aitem hanya dilakukan secara kuantitatif
dengan pertimbangan bahwa penelitian ini bertujuan untuk melihat validitas
konstrak dan reliabilitas alat ukur mengingat bahwa IST merupakan tes yang
diadaptasi yang telah lama digunakan dan tidak bertujuan untuk melihat kualitas
aitem secara kualitatif.
1. Indeks Kesukaran Aitem
a. Pengertian Indeks Kesukaran Aitem
Indeks kesukaran aitem adalah proporsi antara individu yang menjawab
aitem dengan benar dan total individu yang menjawab aitem tersebut. Indeks
kesukaran aitem atau derajat kesukaran aitem disimbolkan oleh huruf p dengan
rumus:
Keterangan:
p = Derajat kesukaran aitem
ni = Banyak peserta tes yang menjawab benar
N = Banyak peserta tes yang menjawab aitem
Indeks kesukaran aitem ditentukan oleh seberapa banyak peserta tes
berhasil menjawab aitem dengan benar. Semakin banyak peserta tes menjawab
dengan benar, berarti semakin mudah aitem tersebut dan sebaliknya semakin
sedikit peserta menjawab dengan benar, maka semakin sulit aitem tersebut
(Azwar, 2007).
Crocker & Algina (2005) menjelaskan bahwa untuk aitem yang memiliki
skor dikotomi, yaitu 0 jika salah dan 1 jika benar, rata-rata skor aitem tes sama
dengan indeks kesukaran aitem sehingga jumlah indeks kesukaran aitem pada
suatu tes menjadi sama dengan rata-rata dari skor tes tersebut.
μx = Σp (7)
Keterangan:
μx = rata-rata skor tes
Σp = jumlah indeks kesukaran aitem
Selanjutnya, jika indeks kesukaran aitem dirata-ratakan, maka;
μp = (μx)/k (8)
Keterangan:
μp = rata-rata indeks kesukaran aitem
μx = rata-rata skor tes
Menurut Kumar (2009), angka untuk indeks kesukaran aitem sama dengan
nomor aitem dalam tes tersebut. Artinya penyusunan aitem didasarkan pada
indeks kesukarannya. Pernyataan ini didukung oleh Murphy & Davidshofer
(2003) yang menyarankan untuk menyusun aitem-aitem dalam tes secara
sistematis, dengan menempatkan aitem-aitem berdasarkan taraf kesukarannya,
mulai dari aitem yang paling mudah hingga yang paling sulit. Oleh karena itu,
pola penyusunan aitem-aitem dalam tes sebaiknya dimulai dari aitem dengan
harga p yang paling tinggi hingga aitem dengan harga p yang paling rendah.
b. Analisis Indeks Kesukaran Aitem
Azwar (2007) menyatakan bahwa taraf kesukaran yang terbaik bergantung
pada tujuan dari tes tersebut. Untuk tes prestasi yang bertujuan untuk evaluasi
formatif misalnya, tidak jarang diperlukan aitem-aitem dengan taraf kesukaran
rendah atau aitem-aitem dengan harga p tinggi. Namun demikian untuk tes yang
bertujuan untuk proses seleksi masuk, terlebih dalam tes masuk yang bertujuan
untuk proses pendidikan atau pemilihan sebagian kecil calon karyawan, harus
diusahakan tes yang memiliki harga p yang rendah atau aitem yang sulit, sehingga
individu yang dinyatakan lulus selanjutnya adalah individu yang benar-benar
memiliki atribut yang diukur. Lord (dalam Murphy & Davidshofer, 2003)
menyatakan bahwa untuk tes seleksi karyawan, p akan dikatakan baik jika nilai p
mendekati 0,2. Namun, jika tes dimaksud sebagai perangkat untuk memilih
sebagian besar dari calon karyawan yang melamar, maka tes yang baik adalah
Pada dasarnya tes disusun untuk melihat perbedaan individu sehingga jika
tidak ada seorang pun yang menjawab pertanyanan dengan benar, dalam artian
soal sangat susah (p = 0) bahkan sebaliknya jika soal sangat gampang sehingga
semua dapat menjawab pertanyaan dengan benar (p= 1) tentu tujuan alat tes tidak
dapat dipenuhi (Murphy & Davidshofer, 2003). Oleh karena itu harga p bergerak
mulai dari 0 sampai dengan 1. Apabila dilihat lebih lanjut, harga p yang berada
pada titik ekstremnya yaitu titik 0 atau 1 mengindikasikan bahwa aitem tersebut
kurang berguna (Azwar, 2007). Allen & Yen (dalam Lababa, 2008),
mengkategorikan nilai p sebagai berikut:
Tabel 1. Kategori Nilai p
No. p Kategori
1 p < 0,3 Sulit 2 0.3 <p< 0,7 Sedang 3 p > 0,7 Mudah
Umumnya pada penyusunan alat tes disarankan untuk menggunakan aitem
dengan nilai p mendekati 0,5. Ketika tes disusun untuk pengukuran secara umum
seperti inteligensi, aitem dengan nilai p mendekati 0,5 akan lebih baik dari pada
aitem yang memiliki nilai p ekstrim. Jadi dalam analisis indeks kesukaran aitem,
aitem dengan p mendekati 0,5 akan lebih optimal (Murphy & Davidshofer, 2003).
Pada penelitian ini, IST merupakan salah satu tes inteligensi dan sering
digunakan oleh P3M Fakultas Psikologi USU. Oleh karena itu, berdasarkan
Murphy & Davidshofer, 2003, p akan dikatakan baik jika nilai p mendekati 0,5,
dan tidak mendekati 0 atau 1. Jika dihubungkan pada kategori Allen & Yen (
dalam Lababa, 2008) maka p yang dianggap baik berada pada kategori sedang
2. Indeks Diskriminasi Aitem
a. Pengertian Indeks Diskriminasi Aitem
Indeks diskriminasi aitem merupakan kemampuan aitem dalam
membedakan antara individu yang memiliki atribut psikologis yang diukur
dengan individu yang tidak memiliki atribut psikologis yang diukur (Azwar,
2007). Murphy dan Davidshofer (2003) mengatakan bahwa aitem yang baik akan
mampu membedakan kelompok individu yang mampu dan yang tidak mampu
mengerjakan suatu tes dengan baik. Artinya, aitem dengan indeks diskriminasi
yang baik harus dapat dijawab dengan benar oleh hampir seluruh kelompok
individu yang memiliki atribut, dan dijawab dengan salah oleh hampir sebagian
besar kelompok individu yang tidak memiliki atribut.
Menurut Azwar (2007), secara sederhana dapat dikatakan bahwa indeks
diskriminasi aitem merupakan suatu harga yang menunjukkan perbedaan proporsi
penjawab aitem dengan benar antara kelompok dengan kemampuan tinggi dengan
kelompok dengan kemampuan rendah. Indeks diskriminasi aitem disimbolkan
oleh d dengan rumus:
d = niT/NT– niR/NR (9)
Keterangan:
niT = Jumlah peserta dari kelompok tinggi yang menjawab aitem dengan benar
NT = Jumlah peserta dari kelompok tinggi
niR = Jumlah peserta dari kelompok rendah yang menjawab item dengan benar
Karena ni/N= p, maka dapat juga dirumuskan dengan:
d = pT-pR (10)
Keterangan:
pT = Indeks kesukaran item kelompok tinggi
pR = Indeks kesukaran item kelompok rendah
Pada penelitian ini indeks diskriminasi aitem dapat diartikan sebagai
kemampuan aitem dalam membedakan individu yang memiliki kemampuan
berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan
mengambil kesimpulan dengan individu yang tidak memiliki kemampuan
tersebut.
b. Analisis Indeks Diskriminasi Aitem
Diskriminasi aitem yang maksimal akan dicapai dalam kondisi ketika
seluruh subjek kelompok tinggi dapat menjawab aitem dengan benar dan seluruh
subjek kelompok rendah tidak mampu untuk menjawabnya, dalam hal ini akan
diperoleh harga d = 1. Secara matematik indeks diskriminasi aitem akan berkisar
mulai dari -1 sampai dengan +1. Namun demikian hanya harga d yang bernilai
positif saja yang memiliki arti dalam analisis aitem (Azwar, 2007).
Harga d yang berada disekitar 0 menunjukkan bahwa aitem yang
bersangkutan mempunyai diskriminasi yang rendah sedangkan harga d yang
negatif menunjukkan bahwa aitem yang bersangkutan tidak berguna sama sekali
bahkan bisa menyesatkan.
Indeks diskriminasi aitem yang ideal adalah yang mendekati angka 1,
mereka yang tidak menguasainya. Semakin kecil diskriminasi aitem (semakin
mendekati 0) berarti semakin tidak jelaslah fungsi aitem yang bersangkutan dalam
membedakan mana subjek yang menguasai materi yang diujikan dan subjek yang
tidak tahu apa-apa (Azwar,2007).
Ebel (dalam Azwar, 2007) terdapat suatu panduan dalam evaluasi indeks
diskriminasi aitem, yaitu :
Tabel 2. Evaluasi Indeks Diskriminasi Aitem
d Evaluasi
0,4 atau lebih Bagus sekali
0,3 - 0,39 Lumayan bagus, tidak membutuhkan revisi 0,2 – 0,29 Belum memuaskan, perlu revisi
d < 0,20 Jelek dan harus dibuang
Thorndike (dalam Azwar, 2007) mengatakan bahwa dalam proses seleksi
aitem, aitem-aitem yang memiliki nilai diskriminasi aitem di atas 0,50 akan
langsung dianggap baik sedangkan aitem-aitem dengan indeks diskriminasi di
bawah 0,20 dapat langsung dibuang dan dianggap jelek.
Menurut Murphy dan Davidshofer (2003) ada tiga cara statsistik yang
dapat digunakan untuk mengukur indeks diskriminasi aitem, yaitu:
1)Metode kelompok ekstrim
Metode kelompok ekstrim merupakan cara yang mudah untuk mengukur
indeks diskriminasi aitem pada kelompok yang besar. Indeks diskriminasi aitem
dapat dihitung dengan cara membagi kelompok menjadi dua, Upper group yakni
kelompok yang memiliki skor yang tinggi (25-35 % nilai tertinggi didalam
kelompok) dan lower group yakni kelompok yang memiliki nilai yang rendah
diskriminasi aitem yang baik akan dijawab benar oleh upper group dan dijawab
salah oleh lower group.
2)Korelasi aitem-total
Korelasi aitem-total memberikan informasi tentang apakah aitem
mengukur hal yang sama dengan tes. Korelasi aitem-total untuk aitem yang
diskor 1 jika benar dan 0 jika salah sering juga disebut korelasi poin biserial.
Artinya, korelasi poin biserial digunakan apabila aitem-aitem dalam tes berbentuk
dikotomi dan dengan skor total berupa data kontinyu. Nilai positif menunjukkan
bahwa aitem dan tes mengukur hal yang sama, nilai mendekati nol menunjukkan
bahwa bahwa aitem tidak memiliki indeks diskriminasi yang baik sehingga upper
group menjawab pertayaan dengan salah dan lower group menjawab pertanyaan
dengan benar.
3)Korelasi inter-aitem
Korelasi inter-aitem digunakan untuk memahami indeks diskriminasi
aitem. Korelasi inter-aitem tidak menjelaskan mengapa beberapa aitem
menunjukkan nilai yang tinggi ataupun rendah karena sangat jelas bahwa aitem
yang memiliki nilai korelasi aitem total yang positif akan menunjukkan nilai yang
positif juga pada kebanyakan aitemnya. Namun korelasi aitem total tidak dapat
menjelaskan mengapa korelasi aitem total dapat bernilai negatif. Dan dalam hal
ini dapat dijelaskan dengan menggunakan korelasi inter-aitem.
Korelasi inter-aitem dapat membantu dalam memahami mengapa beberapa
salah dan subjek dari lower group dapat menjawab dengan benar.
Korelasi inter-aitem yang bernilai rendah dapat memiliki dua arti,
kemungkinan pertama adalah aitem tidak mengukur hal yang sama dengan tes,
sehingga aitem harus dibuang atau dibuat ulang, kemungkinan kedua adalah aitem
memang mengukur atribut yang berbeda dengan tes dikarenakan tes memang
disusun untuk mengukur dua atribut yang berbeda.
Pada penelitian ini indeks diskriminasi aitem akan dianalisis dengan
metode korelasi aitem-total untuk melihat apakah aitem memang mengukur
kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan
kemampuan mengambil kesimpulan yang sama dengan semua aitem pada subtes
RA atau aitem juga mengukur atribut yang berbeda pada subtes RA. Rumus
korelasi aitem-total yang digunakan adalah korelasi point biserial dengan
pertimbangan bahwa aitem pada subtes RA memiliki skor dikotomi, yaitu diskor 1
jika benar dan 0 jika salah, serta skor total subjek berbentuk data kontinyu. Indeks
diskriminasi yang dikatakan baik dalam penelitian ini didasari pada evaluasi Ebel
(dalam Azwar, 2007), yaitu ≥ 0,4 dengan evaluasi bagus sekali.
3. Reliabilitas Alat Ukur
a. Pengertian Reliabilitas
Reliabilitas merupakan penerjemahan dari kata reliability yang
menyatakan keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi dan
sebagainya, namun pada intinya konsep reliabilitas memiliki makna sejauh mana
Urbina (2006) reliabilitas suatu tes merujuk pada konsistensi skor yang di peroleh
oleh individu yang sama ketika diberikan tes ulang yang sama atau seperangkat
tes yang ekivalen dengan tes sebelumnya pada kondisi yang berbeda. Suryabrata
(2005) menyatakan bahwa reliabilitas alat ukur menunjukkan sejauh mana hasil
pengukuran dengan alat tersebut dapat dipercaya, yang mana hal ini ditunjukkan
oleh taraf konsistensi skor yang diperoleh para subjek yang diukur dengan alat
yang sama atau minimal setara, dalam kondisi yang berbeda. Oleh sebab itu,
konsepsi mengenai reliabilitas berkaitan dengan derajat konsistensi antara dua
perangkat skor tes, maka rumus reliabilitas selalu dinyatakan dalam bentuk
koefisien korelasi (Azwar, 2005).
b. Bentuk Estimasi Reliabilitas
Reliabilitas alat ukur yang juga menunjukkan eror pengukuran yang tidak
dapat ditentukan secara pasti, hanya dapat diestimasi (Suryabrata, 2005). Estimasi
reliabilitas dapat dilakukan melalui beberapa metode berdasarkan CTT, yaitu
pendekatan tes ulang, pendekatan tes paralel, dan pendekatan konsistensi internal
(Azwar, 2005 dan Suryabrata, 2005).
1) Pendekatan tes ulang
Pendekatan tes ulang adalah salah satu dari pendekatan pertama yang
pantas dan mudah untuk mengestimasi reliabilitas dari suatu skor tes (Murphy dan
Davidshofer, 2003). Pendekatan ini dilakukan dengan cara menyajikan tes dua
kali pada suatu kelompok yang sama dalam rentang waktu tertentu, minsalnya dua
minggu (Suryabrata, 2005). Asumsinya adalah suatu tes yang reliabel akan
waktu yang berbeda pada sekelompok subjek yang sama (Azwar, 2005). Sehingga
akan diperoleh dua distribusi skor dari kelompok tersebut. Korelasi antara dua
skor pada dua waktu yang berbeda tersebut disebut koefisien reliabilitas (r)
(Kumar, 2009).
Pendekatan tes ulang ini dapat dikatakan baik secara teori, namun dalam
prakterknya mengandung kelemahan, yaitu kondisi subjek pada tes kedua tidak
lagi sama dengan kondisi subjek pada tes pertama baik dari proses belajar,
perubahan motivasi, pengalaman, sehingga pendekatan ini lebih baik digunakan
bila objek ukur berupa keterampilan, terutama keterampilan fisik (Suryabrata,
2005). Menurut Azwar (2005), pendekatan tes ulang cocok digunakan hanya bagi
tes yang mengukur aspek psikologis yang relatif stabil dan tidak mudah berubah.
Rumus yang dapat digunakan untuk menentukan reliabilitas tes ulang
adalah Pearson product-moment (Kumar, 2009).
2) Pendekatan tes paralel
Pendekatan reliabilitas bentuk paralel dilakukan dengan memberikan dua
bentuk tes yang paralel pada sekelompok subjek, yaitu tes yang memiliki tujuan
ukur yang sama dan isi aitem yang setara secara kualitas maupun kuantitas
(Azwar, 2005). Pendekatan ini juga disebut sebagai alternate form yang
digunakan untuk mengatasi kelemahan pendekatan tes ulang (Kumar, 2009).
Asumsinya, dua tes yang paralel akan menghasilkan skor tes yang berkorelasi
tinggi satu sama lain dan memiliki koefisien reliabilitas yang tinggi.
Keuntungan pendekatan ini adalah dapat mengurangi efek-efek praktis
namun kelemahan pendekatan ini adalah sulitnya menyusun perangkat tes yang
paralel (Kumar, 2009). Menurut Azwar (2005), dua tes yang paralel hanya ada
secara teoritis, tidak benar-benar paralel secara empirik.
Rumus yang dapat digunakan untuk menentukan reliabilitas tes ulang
adalah korelasi Pearsonproduct moment (Azwar, 2005).
3) Pendekatan konsistensi internal
Pendekatan ini dilakukan dengan memberikan satu bentuk tes dengan
sekali penyajian kepada sekelompok subjek yang bertujuan melihat konsistensi
antar aitem atau antar bagian dalam tes tersebut serta menghindari
masalah-masalah pada pendekatan tes ulang dan paralel. Seperangkat tes diberikan kepada
sekelompok subjek satu kali sehingga diperoleh satu distribusi skor tes dari
kelompok subjek tersebut. Untuk itu, prosedur analisis reliabilitasnya diarahkan
pada analisis terhadap aitem-aitem atau terhadap kelompok-kelompok aitem
dalam tes itu sehingga perlu dilakukan pembelahan tes menjadi beberapa
kelompok aitem yang disebut belahan tes. Cara pembelahan tes disesuaikan
dengan sifat dan fungsi tes serta jenis skala pengukuran yang digunakan dalam tes
tersebut yang kemudian akan menentukan rumusan atau rumus yang dapat
digunakan dalam menghitung koefisien reliabilitasnya. Setiap cara pembelahan
tes hendaknya mengusahakan agar antar belahan memiliki jumlah aitem sama
banyak, indeks kesukaran seimbang, isi sebanding, dan tujuan ukur yang sama
(a). Beberapa cara dalam pembelahan tes
i. Pembelahan cara random
Membelah tes menjadi dua bagian secara random dapat dilakukan dengan
cara undian sederhana guna menentukan aitem-aitem nomor berapa sajakah yang
dimasukkan menjadi belahan pertama dan yang mana menjadi belahan kedua.
Pembelahan secara random hanya boleh dilakukan bila tes yang akan dibelah
berisi aitem-aitem yang homogen baik dari segi konten maupun segi indeks
kesukaran aitem, namun jika aitem tersebut heterogen dapat juga menggunakan
cara pembelahan ini asalkan aitem tersebut jumlahnya sangat besar (Azwar,
2005).
ii. Pembelahan gasal-genap
Pembelahan gasal-genap dilakukan dengan cara mengelompokkan seluruh
aitem yang bernomor urut gasal menjadi belahan pertama dan seluruh aitem yang
bernomor urut genap dijadikan satu kelompok belahan kedua. Cara pembelahan
ini selain mudah dilakukan juga dapat menghindari kemungkinan terjadinya
pengelompokkan aitem-aitem tertentu ke dalam salah satu belahan saja (Azwar,
2005).
iii. Pembelahan matched-random subtes
Pembelahan dengan cara matched-random subtes ditemukan oleh
Gulikksen tahun 1950 (dalam Azwar, 2005). Sebelum melakukan pembelahan tes
terlebih dahulu harus dihitung indeks kesukaran aitem serta korelasi aitem dengan