Karakteristik Psikometri Subtes Rechenaufgaben (RA) Pada Intelligenz Struktur Test (IST)

(1)

TEST

(IST)

SKRIPSI

Diajukan untuk memenuhi persyaratan Ujian Sarjana Psikologi

Oleh:

KIKI FATMALA SARI

071301068

FAKULTAS PSIKOLOGI

UNIVERSITAS SUMATERA UTARA

GENAP, 2010/2011

(2)

RECHENAUFGABEN

(RA) PADA

INTELLIGENZ STRUKTUR

TEST

(IST)

Dipersiapkan dan disusun oleh:

KIKI FATMALA SARI 071301068

Telah dipertahankan di depan Dewan Penguji

Pada tanggal 15 Maret 2011

Mengesahkan,

Dekan Fakultas Psikologi

Prof. Dr. Irmawati, Psikolog

NIP. 19530131980032001

Tim Penguji

1. Etty Rahmawati, M.Si. Penguji I/Pembimbing

NIP. 198107252008012013

2. Ika Sari Dewi, S.Psi.,psikolog Penguji II

NIP. 197809102005012001

3. Eka Danta Jaya G., M.A Penguji III

NIP. 197308192001121001

(3)

sesungguhnya bahwa skripsi saya yang berjudul :

Karakteristik Psikometri Subtes

Rechenaufgaben (RA) Pada Intelligenz Struktur Test (IST)

adalah hasil karya sendiri dan belum pernah diajukan untuk memperoleh gelar

kesarjanaan di Fakultas Psikologi Universitas Sumatera Utara.

Adapun bagian-bagian tertentu dalam penulisan skripsi ini saya kutip dari

hasil karya orang lain yang telah dituliskan sumbernya secara jelas sesuai dengan

norma, kaidah, dan etika penulisan ilmiah.

Apabila di kemudian hari ditemukan adanya kecurangan di dalam skripsi

ini, saya bersedia menerima sanksi dari Fakultas Psikologi Universitas Sumatera

Utara sesuai dengan peraturan yang berlaku.

Medan, Maret 2011

Kiki Fatmala Sari

NIM 071301068

(4)

ABSTRAK

Intelligenz Struktur Test (IST) merupakan salah satu tes inteligensi yang sering digunakan untuk seleksi karyawan dalam jumlah besar oleh P3M Fakultas Psikologi USU. IST yang digunakan adalah IST adaptasi UNPAD tahun 1970-an yang belum pernah dievaluasi secara psikometri oleh P3M Fakultas Psikologi USU. Usia IST yang tidak mudah dan rendahnya pengawasan terhadap kerahasiaan tes mengakibatkan IST tidak reliabel dan valid lagi dalam mengukur kemampuan inteligensi individu. Padahal, seperangkat tes yang berkualitas baik secara psikometri merupakan salah satu syarat mutlak yang harus dipenuhi agar proses pengukuran serta penggunaan hasil pengukuran dapat dipercaya. Oleh karena itu, diperlukan evaluasi terhadap IST, khususnya subtes RA.

Tujuan dari penelitian ini adalah untuk melihat apakah subtes RA masih mampu mengungkap fungsi ukurnya sesuai dengan tujuan subtes RA disusun melalui analisis karakteristik psikometri mencakup analisis indeks kesukaran aitem, indeks diskriminasi aitem, reliabilitas, serta validitas konstrak subtes RA tersebut.

Metode pengumpulan data yang digunakan pada penelitian ini adalah metode dokumentasi, yaitu dengan menggunakan data yang didokumentasikan oleh P3M Fakultas Psikologi USU. Data tersebut berupa respon subjek terhadap subtes RA pada lembar jawaban IST yang diperoleh dari 2011 subjek. Hasil penelitian secara keseluruhan, dengan menggunakan pendekatan teori tes klasik dan berdasarkan tujuan IST, khususnya subtes RA sebagai salah satu tes inteligensi ditemukan bahwa dari total 20 aitem pada subtes RA, 16 aitem yang dianggap baik berdasarkan indeks diskriminasinya. Berdasarkan koefisien reliabilitasnya dan nilai koefisien reliabilitas yang baik untuk tes inteligensi menurut Murphy & Davidshofer (2003) adalah ≥ 0,90, subtes RA dianggap kurang reliabel dalam mengukur fungsi ukurnya karena hanya memiliki koefisien reliabilitas sebesar 0,851. Selain itu, berdasarkan analisis validitas konstraknya, subtes RA tidak lagi berfungsi sebagaimana tujuan awal subtes ini di susun. Pada akhirnya penelitian ini menggambarkan bahwa perlunya peninjauan ulang terhadap aitem-aitem subtes RA sebelum digunakan sebagai tes inteligensi, khususnya pada individu dengan latar belakang pendidikan SMA, D3, dan S1.

Kata Kunci : karakteristik psikometri, teori tes klasik, IST, subtes RA

1

Mahasiswa Fakultas Psikologi Universitas Sumatera Utara

2

Dosen Departemen Umum & Eksperimen Fakultas Psikologi Universitas Sumatera Utara

(5)

ABSTRACT

Intelligenz Struktur Test (IST) is one of the intelligence tests that are often used for selection a large number of employees and conducted by P3M Psychology Faculty of USU. The IST is adopted from UNPAD in the 1970s that has never been evaluated psychometrically by P3M Psychology Faculty of USU. The longterm using of IST and low control over the confidentiality of test result is not reliable and valid in measuring individual intelligence. In fact, the tests that has good quality psychometrically is one of necessary condition that must be met for measurement and using of trusted measurement results. Therefore, it is necessary to evaluate the IST, especially the RA subtest.

The aim of this study is to see if RA subtest is still able to reveal the measuring function in accordance with the objectives of RA subtest that is created by analysis of psychometric characteristics includes the analysis of difficulty item index, discrimination item index, reliability, and validity construct of the the RA subtest.

The method of data collection that is used in this study is a documentation method, by using the data documented by the P3M Psychology Faculty of USU as 2011 answer sheets of IST subject. With using classical test theory (CTT) and based on the purpose of IST as a test selection of large number of employees , the result of this study showed the total of 20 items on RA subtest, only 16 items are considered as good item. From the coefficient of reliability and good reliability coefficients for tests of intelligence according to Murphy & Davidshofer (2003), RA subtest was considered less reliable in measuring the measurement function because it only has a reliability coefficient of 0.851. In addition, Based on validity, RA subtest is no longer serve as the initial aim of this subtest designed. At last, this study showed that it is necessary to review of the items of RA subtest before being used as intelligence tests to an individual, especially in individuals with educational backgrounds from high school, D3, and S1.

Keywords : psychometric characteristics, classical test theory, IST, subtestRA

1

Student of Psychology Faculty , Sumatera Utara University

2

Lecturer Department of General and Experimental of Psychology Faculty, Sumatera Utara University

(6)

limpahan rahmat, karunia dan kekuatan dalam penyelesaikan skripsi ini serta

terima kasih telah memberikan penulis orang tua yang sangat luar biasa, Zulfarizal

dan Ernawilis, yang selama ini menjadi motivasi penulis untuk bisa menjadi yang

terbaik bagi mereka. Mereka selalu memotivasi penulis dalam proses pendidikan

yang penulis jalani sampai penyelesaian skripsi ini.

Judul Penyusunan skripsi ini adalah: “Karakteristik Psikometri Subtes

Rechenaufgaben (RA) Pada Intelligenz Struktur Test (IST)”. Skripsi ini disusun

dalam rangka memenuhi salah satu syarat untuk mencapai gelar Sajana Psikologi

Fakultas Psikologi Universitas Sumatera Utara Medan.

Penulis menyadari bahwa tanpa bantuan dan bimbingan dari berbagai

pihak, baik dari masa perkuliahan sampai pada penyusunan skripsi ini sangatlah

sulit bagi penulis untuk dapat menyelesaikan penulisan skripsi ini. Oleh karena

itu, penulis mengucapkan terimakasih kepada:

1. Prof. Dr. Irmawati, Psikolog selaku Dekan Fakultas Psikologi.

2. Ibu Etty Rahmawati, M.Si selaku dosen pembimbing dan penguji skripsi ini

yang telah banyak menyediakan waktu, tenaga, dan pikiran dalam

membimbing dan motivasi penulis.

3. Ibu Lily Garliah, M.Si dan Ibu Ika Sari Dewi, S.Psi., Psikolog selaku dosen

penguji seminar yang telah memberikan masukan dan dukungan.

(7)

skripsi ini.

5. Ibu Liza Marini, M.Psi. selaku dosen pembimbing akademik selama peneliti

kuliah di Fakultas Psikologi USU yang telah membimbing dan memberikan

saran kepada peneliti dalam proses perkuliahan.

6. Semua staf pengajar dan pegawai Fakultas Psikologi USU yang selalu

memberikan ilmunya kepada penulis dan membantu penulis dalam proses

pendidikan dan menyelesaikan skripsi ini.

7. Pihak P3M Fakultas Psikologi USU yang telah bersedia diwawancarai dan

memberikan izin kepada peneliti untuk menggunakan dokumentasi data IST.

8. Erlina Desi Purwanti, Da Wewen, Bang David selaku kakak yang selalu

memberikan bantuan dan motivasi kepada penulis selama proses awal

pendidikan sampai penulis bisa menyelesaikan skripsi ini. Agra dan Yazeed

selaku adek yang telah mengisi hari-hari peneliti dengan kebahagian.

9. Nang Nia selaku kakak yang selalu sabar mendengarkan keluh kesah, selalu

memberikan semangat, kasih sayang dan memanjakan peneliti. Miss you Sis.

10. Kak Rena Elvira, Fitri Susanti, Dermika dan Princen selaku rekan yang

sama-sama mengikuti penelitian payung IST atas kerjasama-sama, bantuan, motivasi dan

masukan yang diberikan selama ini.

11. Kak Sofi selaku kakak kos selama tiga setengah tahun terakhir ini yang telah

banyak membantu dan memberi masukan selama penulis menjalani proses

(8)

12. Adela Eka Putra Marza, Thanks a lot, love you. I am speechless for you.

13. Nana Z. Siregar selaku sahabat dan teman satu Pembimbing Akademik (PA)

yang telah banyak membantu dan menemani penulis dalam permasalahan KRS,

pembayaran uang kuliah, dan banyak hal lain yang tidak dapat penulis

sebutkan satu persatu. Selanjutnya, sahabat-sahabat yang baik hati lainya

(Massita Ozar, Vety Dazefa, Khairiah Mulia Rahma, Nuzulia Rahmati,

Zulfadilah Nst., dan Ridya Tyastiti) yang telah banyak membantu dan berbagi

suka dan duka selama masa perkuliahan. Semoga pertemanan ini terpelihara

indah sampai nantinya. Love you all. Dan, Vet, terima kasih atas foto-foto

ucapan selamat ultahnya ya.

14. Riva Perlia Asmi selaku teman yang telah mengirimkan makalah dan Diktat

kuliah IST dari Bandung ke Medan. Makalah dan Diktat tersebut menjadi

lansadan teori tentang IST bagi penulis dan 4 orang teman lainnya yang juga

meneliti tentang IST.

15. Sahabat-sahabat yang selalu memberikan semangat kepada peneliti, yaitu

Yessi (Cuyes), Dini, Nenek, Bunda Wiry, & Nyak Ririn. Sahabat-sahabat

dikampung, yaitu Jeli, Mela, Mega, Vanny, dan Nining.

16. Uda-uda, Uni-uni, Kawan-kawan serta Adiak-adiak satu kampung yang telah

banyak membantu dan memberikan warna yang berbeda dalam hidup penulis

selama penulis hidup di Medan. Terima kasih atas kesempatan dan

(9)

17. Seterusnya terima kasih kepada semua pihak yang tidak dapat penulis

sebutkan satu persatu, yang telah banyak memberikan dukungan kepada

penulis dalam menyelesaikan proposal skripsi ini.

Semoga Allah SWT memberikan balaasan atas segala bantuan yang

diberikan selama penulis menjalani pendidikan dan dalam penyusunan skripsi ini.

Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Untuk itu

penulis meminta maaf dan mengharapkan masukan yang membangun sehingga

pelaporan hasil penelitian ini menjadi lebih baik lagi di masa yang akan datang.

Akhir kata penulis berharap skripsi ini dapat bermanfaat bagi kita semua.

Medan, Maret 2011

Peneliti

(10)

HALAMAN PENGESAHAN……….ii

PERNYATAAN KEASLIAN SKRIPSI……..………..…iii

ABSTRAK………..iv

KATA PENGANTAR…...……….vi

DAFTAR ISI………x

DAFTAR TABEL……….xiv

DAFTAR RUMUS………...xv

DAFTAR LAMPIRAN……….xvi

BAB I PENDAHULUAN A. Latar Belakang Masalah... 1

B. Identifikasi Masalah ... 9

C. Rumusan Masalah... 10

D. Tujuan Penelitian ... 10

E. Manfaat Penelitian ... 11

1. Manfaat Teoritis ... 11

2. Manfaat Praktis ... 11

BAB II TINJAUAN PUSTAKA A. Classical Test Theory (CTT)... 14

1. Pengertian CTT ...14

(11)

1. Indeks Kesukaran Aitem...…………... 18

a. Pengertian Indeks Kesukaran Aitem ...…………... 18

b. Analisis Indeks Kesukaran Aitem ... 20

2. Indeks Diskriminasi Aitem ...…...22

a. Pengertian Indeks Diskriminasi Aitem……...22

b. Analisis Indeks Diskriminasi Aitem ...………...23

3. Reliabilitas Alat Ukur……... 26

a. Pengertian Reliabilitas.………... 26

b. Bentuk Estimasi Reliabilitas ... 27

c. Interpretasi Koefisien Reliabilitas ... 36

d. Faktor-faktor yang Mempengaruhi Koefisien Reliabilitas ... 38

4. Validitas ... 40

a. Pengertian Validitas ... 40

b. Jenis-Jenis Validitas ... 41

c. Interpretasi Koefisien Validitas………..44

C. Analisis Karakteristik Psikometri Alat Ukur...45

D. Intelligenz-Struktur-Test (IST)... 47

1. Sejarah dan Perkembangan ………... 47

2. Fungsi dan Tujuan IST.………... 50

3. Subtes-subte dalam IST……….50

4. Skoring dan Interpretasi………52

(12)

BAB III METODE PENELITIAN

A. Data yang Digunakan...……... 55

B. Subjek Penelitian ... 55

C. Metode Pengumpulan Data...………... 56

D. Persiapan dan Pelaksanaan Penelitian ... 56

1. Persiapan Izin Penelitian ....…... 56

2. Pelaksanaan Penelitian... 56

E. Program Komputer yang Digunakan ... 57

F. Analisis Data ... 58

BAB IV HASIL DAN PEMBAHASAN A. Deskripsi Hasil……...……... 60

1. Analisis Indeks Kesukaran Aitem... 60

2. Analisis Indeks Diskriminasi Aitem... 62

3. Analisis Reliabilitas Subtes RA…...63

4. Analisis Validitas Konstrak Subtes RA... 64

5. Analisis Berdasarkan Karakteristik Psikometri………66

B. Pembahasan….……...……... 67

1. Analisis Indeks Kesukaran Aitem... 67

2. Analisis Indeks Diskriminasi Aitem... 68

3. Analisis Reliabilitas Subtes RA…... 69

(13)

BAB V KESIMPULAN DAN SARAN

A. Kesimpulan…………...……... 75

B. Saran ...………... 76

1. Saran Praktis………... 76

2. Saran Penelitian………... 77

DAFTAR PUSTAKA………78

(14)

Tabel 2. Evaluasi Indek Diskriminasi Aitem………24

Tabel 3. Kategori Nilai Estimasi Koefisien Reliabilitas………...38

Tabel 4. Gambaran Umum Subjek Penelitian Berdasarkan Jenis Kelamin……..55

Tabel 5. Hasil Analisis Indeks Kesukaran Aitem Subtes RA….………..61

Tabel 6. Pengelompokan p Subtes RA……….….61

Tabel 7. Hasil Analisis Indek Diskriminasi Aitem Subtes RA…………...……..62

Tabel 8. Evaluasi d Subtes RA………..………....……63

Tabel 9. Matriks Korelasi Antar Subtes pada IST.……….….…..65

Tabel 10. Korelasi Subtes RA dengan 8 Subtes Lainnya..…...……….65

Tabel 11. Nilai p dan d Subtes RA…………...………...………..66

(15)

Rumus 1 Asumsi I……….………15

Rumus 2 Asumsi II………15

Rumus 3 Asumsi III………..………15

Rumus 4 Asumsi IV……….……….16

Rumus 5 Asumsi V……….…………..16

Rumus 6 Indeks Kesukaran Aitem………18

Rumus 7 Hubungan Indeks Kesukaran Aitem dan Rata-rata………19

Rumus 8 Rata-rata Indeks Kesukaran Aitem………19

Rumus 9 Indeks Diskriminasi Aitem………22

Rumus 10 Indeks Diskriminasi Aitem dengan nilai p………...23

Rumus 11 Spearman-Brown……….…31

Rumus 12 Koefisien Alpha………...32

Rumus 13 Koefisien Alpha untuk Tes Belah Dua………32

Rumus 14 Kuder-Richardson 20………...33

Rumus 15 Kuder-Richardson 21………...34

Rumus 16 Kuder-Richardson 21 dengan rata-rata………....34

Rumus 17 Kristof untuk Belah Tiga……….35

Rumus 18 Flanagan………...35

Rumus 19 Standar Eror Pengukuran……….37

(16)

A. Tabulasi Respon Subjek terhadap Subtes RA pada IST….………..…80

B. Z-Skor Subjek pada 9 Subtes IST ………81

LAMPIRAN II Analisis Parameter Aitem dengan Program Iteman A. Menyimpan Data dalam Bentuk Notepad/Fixed ASCII….………….82

B. Membuat Syntax (Control Tile)….………....83

C. Membuka Lembar Kerja Iteman………...………84

D. Memasukkan Data………....85

D. Membaca Hasil Analisis Iteman……….…………..86

E. Hasil Analisis p, d dan Reliabilitas Subtes RA dengan Iteman……....88

LAMPIRAN III Hasil Analisis Korelasi Antar Subtes pada IST dengan Bantuan Program SPSS Versi 16 A. Hasil Korelasi Antar Subtes pada IST...………89

(17)

ABSTRAK

Intelligenz Struktur Test (IST) merupakan salah satu tes inteligensi yang sering digunakan untuk seleksi karyawan dalam jumlah besar oleh P3M Fakultas Psikologi USU. IST yang digunakan adalah IST adaptasi UNPAD tahun 1970-an yang belum pernah dievaluasi secara psikometri oleh P3M Fakultas Psikologi USU. Usia IST yang tidak mudah dan rendahnya pengawasan terhadap kerahasiaan tes mengakibatkan IST tidak reliabel dan valid lagi dalam mengukur kemampuan inteligensi individu. Padahal, seperangkat tes yang berkualitas baik secara psikometri merupakan salah satu syarat mutlak yang harus dipenuhi agar proses pengukuran serta penggunaan hasil pengukuran dapat dipercaya. Oleh karena itu, diperlukan evaluasi terhadap IST, khususnya subtes RA.

Tujuan dari penelitian ini adalah untuk melihat apakah subtes RA masih mampu mengungkap fungsi ukurnya sesuai dengan tujuan subtes RA disusun melalui analisis karakteristik psikometri mencakup analisis indeks kesukaran aitem, indeks diskriminasi aitem, reliabilitas, serta validitas konstrak subtes RA tersebut.

Metode pengumpulan data yang digunakan pada penelitian ini adalah metode dokumentasi, yaitu dengan menggunakan data yang didokumentasikan oleh P3M Fakultas Psikologi USU. Data tersebut berupa respon subjek terhadap subtes RA pada lembar jawaban IST yang diperoleh dari 2011 subjek. Hasil penelitian secara keseluruhan, dengan menggunakan pendekatan teori tes klasik dan berdasarkan tujuan IST, khususnya subtes RA sebagai salah satu tes inteligensi ditemukan bahwa dari total 20 aitem pada subtes RA, 16 aitem yang dianggap baik berdasarkan indeks diskriminasinya. Berdasarkan koefisien reliabilitasnya dan nilai koefisien reliabilitas yang baik untuk tes inteligensi menurut Murphy & Davidshofer (2003) adalah ≥ 0,90, subtes RA dianggap kurang reliabel dalam mengukur fungsi ukurnya karena hanya memiliki koefisien reliabilitas sebesar 0,851. Selain itu, berdasarkan analisis validitas konstraknya, subtes RA tidak lagi berfungsi sebagaimana tujuan awal subtes ini di susun. Pada akhirnya penelitian ini menggambarkan bahwa perlunya peninjauan ulang terhadap aitem-aitem subtes RA sebelum digunakan sebagai tes inteligensi, khususnya pada individu dengan latar belakang pendidikan SMA, D3, dan S1.

Kata Kunci : karakteristik psikometri, teori tes klasik, IST, subtes RA

1

Mahasiswa Fakultas Psikologi Universitas Sumatera Utara

2

Dosen Departemen Umum & Eksperimen Fakultas Psikologi Universitas Sumatera Utara

(18)

ABSTRACT

Intelligenz Struktur Test (IST) is one of the intelligence tests that are often used for selection a large number of employees and conducted by P3M Psychology Faculty of USU. The IST is adopted from UNPAD in the 1970s that has never been evaluated psychometrically by P3M Psychology Faculty of USU. The longterm using of IST and low control over the confidentiality of test result is not reliable and valid in measuring individual intelligence. In fact, the tests that has good quality psychometrically is one of necessary condition that must be met for measurement and using of trusted measurement results. Therefore, it is necessary to evaluate the IST, especially the RA subtest.

The aim of this study is to see if RA subtest is still able to reveal the measuring function in accordance with the objectives of RA subtest that is created by analysis of psychometric characteristics includes the analysis of difficulty item index, discrimination item index, reliability, and validity construct of the the RA subtest.

The method of data collection that is used in this study is a documentation method, by using the data documented by the P3M Psychology Faculty of USU as 2011 answer sheets of IST subject. With using classical test theory (CTT) and based on the purpose of IST as a test selection of large number of employees , the result of this study showed the total of 20 items on RA subtest, only 16 items are considered as good item. From the coefficient of reliability and good reliability coefficients for tests of intelligence according to Murphy & Davidshofer (2003), RA subtest was considered less reliable in measuring the measurement function because it only has a reliability coefficient of 0.851. In addition, Based on validity, RA subtest is no longer serve as the initial aim of this subtest designed. At last, this study showed that it is necessary to review of the items of RA subtest before being used as intelligence tests to an individual, especially in individuals with educational backgrounds from high school, D3, and S1.

Keywords : psychometric characteristics, classical test theory, IST, subtestRA

1

Student of Psychology Faculty , Sumatera Utara University

2

Lecturer Department of General and Experimental of Psychology Faculty, Sumatera Utara University

(19)

A.Latar Belakang Masalah

Pendidikan Ilmu Psikologi mulai diselenggarakan di Indonesia pada tahun

1953. Sejak itu, ilmu psikologi berkembang dan banyak diselenggarakan di

perguruan tinggi negeri maupun swasta. Selain itu, perkembangan ilmu psikologi

juga ditandai oleh banyaknya penemuan ilmiah tentang pengaruh aspek psikologis

dalam kehidupan individu sehingga ilmu psikologi semakin dikenal umum dan

diterima oleh masyarakat Indonesia.

Masyarakat lebih mengenal Psikologi dari jasa dan praktik yang

disediakan oleh tenaga profesional psikologi atau Psikolog. Jasa dan praktik

Psikologi ini diberikan untuk menolong individu dalam bentuk asesmen,

diagnosis, prognosis, konseling dan psikoterapi. Namun, bentuk dari jasa dan

praktik Psikologi yang lebih dikenal dan berkembang di masyarakat adalah

asesmen dalam bentuk pengukuran aspek-aspek psikologis pada diri individu.

Menurut Azwar (2007), alat yang digunakan untuk mengungkap aspek-aspek

psikologis dalam diri individu disebut dengan tes psikologi.

Tes Psikologi merupakan suatu alat ukur yang objektif dan terstandar

terhadap suatu sampel prilaku (Anastasi & Urbina, 2006). Menurut Sukardi

(1997), tes psikologi berfungsi untuk seleksi, klasifikasi, deskripsi, mengevaluasi

suatu treatment, dan menguji suatu hipotesis yang berhubungan dengan

aspek-aspek psikologis. Namun, fungsi yang lebih umum dan berkembang saat ini

(20)

adalah untuk seleksi, khususnya seleksi karyawan. Fungsi ini digunakan oleh

bidang industri dan organisasi untuk memutuskan individu yang tepat untuk suatu

pekerjaan tertentu.

Aneka ragam tes psikologi telah dirancang dengan fungsi dan tujuan yang

berbeda yang umum digunakan dalam seleksi, diantaranya tes intelegensi, bakat,

minat dan kepribadian. Dari berbagai jenis tes psikologi ini, salah satu yang cukup

penting dalam mengukur dan memprediksi tingkah laku seseorang adalah tes

inteligensi. Menurut Anastasi & Urbina (2006) tes inteligensi dapat digunakan

untuk mengukur kemampuan kognisi atau disebut juga inteligensi pada individu

yang telihat dari perilaku-perilaku yang ditunjukkan.

Intelligenz Struktur Test (disingkat IST) merupakan tes inteligensi yang

umum digunakan di Indonesia. Tes inteligensi ini dikembangkan oleh Rodolf

Amthauer pada tahun 1953. IST diciptakan berdasarkan pandangan bahwa

inteligensi merupakan keseluruhan struktur dari kemampuan jiwa dan rohani yang

akan tampak jelas dalam hasil tes. Tes ini terdiri dari sembilan subtes yaitu

Satzergaenzung (SE), Wortauswahl (WA), Analogien (AN), Gemeinsamkeiten

(GE), Merkaufgaben (ME), Rechenaufgaben (RA), Zahlenreinhen (ZR),

Figurenauswahl (FA), dan Wuerfelaufgaben (WU). Setiap subtes ini mengukur

aspek-aspek yang berbeda dari inteligensi dan dapat digunakan secara keseluruhan

atau satu subtes saja. Oleh karena itu, tes ini dapat menggambarkan pola kerja

tertentu, sehingga akan cocok digunakan untuk memprediksi tuntutan profesi atau

(21)

Tes inteligensi yang dikembangkan oleh Amthauer ini digunakan di

Indonesia setelah di adaptasi oleh Fakultas Psikologi Universitas Padjajaran

Bandung (UNPAD) dari alat tes aslinya. Semenjak diadaptasi, IST sering

digunakan oleh biro-biro psikologi di Indonesia salah satunya adalah Unit Pusat

Penelitian dan Pengabdian pada Masyarakat Fakultas Psikologi Universitas

Sumatra Utara (P3M Fakultas Psikologi USU). IST yang digunakan oleh P3M

Fakultas Psikologi USU ini merupakan IST-70 adaptasi tahun 1970-an di

Universitas Padjajaran Bandung. Berikut penuturan seorang staf P3M, Novi:

“IST yang kita pakai disini adalah IST adaptasi UNPAD tahun 1970-an. Tes ini lebih sering digunakan untuk tes yang diambil secara kelompok dengan peserta lebih dari 100 orang. Biasanya untuk seleksi pegawai. Sejak saya disini, IST telah digunakan dalam proses seleksi penerimaan karyawan beberapa perusahaan besar” Novi (komunikasi personal, 24 juli dan 06 Oktober 2010).

Berdasarkan pernyataan tersebut dapat diketahui bahwa IST yang

digunakan oleh P3M Fakultas Psikologi USU telah berusia lebih dari tiga puluh

tahun dan masih sering digunakan oleh P3M Fakultas Psikologi USU, terutama

dalam proses seleksi karyawan.

Proses seleksi karyawan merupakan proses pencarian individu yang tepat

untuk suatu pekerjaan. Hasil tes atau skor IST menjadi salah satu landasan

pengambilan keputusan apakah individu diterima atau tidak. Kelayakan keputusan

yang diambil berdasarkan interpretasi skor tes sangatlah ditentukan oleh kualitas

pengukuran dan ketepatan interpretasinya (Azwar, 2007). Selain itu, harus

disadari bahwa subjek tes adalah manusia. Oleh karena itu, persoalan tes dan

pengukuran bukan sekedar masalah keberhasilan mendeskripsikan atribut dalam

(22)

penting adalah akibat yang dapat ditimbulkan oleh hasil tes. Akibat tersebut

bahkan dapat menjangkau bukan saja subjek pengukuran itu saja melainkan juga

orang-orang lain yang ikut berkepentingan dalam dirinya.

Azwar (2007) menyatakan bahwa sebagai alat ukur, suatu tes dapat

dikatakan berhasil menjalankan fungsi ukurnya apabila alat tersebut mampu

memberikan hasil ukur yang cermat dan akurat. Artinya, suatu alat tes berkualitas

baik dalam proses seleksi akan menentukan seberapa baik proses seleksi itu

membedakan antara peserta tes yang mempunyai sedikit kemampuan dan yang

mempunyai lebih banyak kemampuan, sehingga akan menentukan seberapa baik

dan tepat individu yang terpilih dari proses seleksi tersebut sesuai dengan yang

diharapkan. Selain itu, suatu alat tes yang baik terdiri dari aitem-aitem yang

dirancang sedemikian rupa dalam bentuk pernyataan mengenai dimensi apa yang

hendak diukur atau diungkap dari aitem tersebut (Azwar 2007). Jadi, suatu tes

yang berkualitas ditentukan oleh kualitas aitem-aitem didalamnya sehingga

syarat-syarat validitas, reliabilitas, dan objektivitas pada penggunaan tes sebagai

alat ukur terpenuhi. Cara yang dapat dilakukan untuk mengetahui suatu alat ukur

memiliki kualitas yang baik atau tidak dapat diketahui melalui uji analisis

karakteristik psikometri pada alat ukur tersebut.

Analisis karakteristik psikometri pada IST pernah dilakukan oleh Santosa

dkk. (dalam Astya, 2008) pada tahun 1997 di Universitas Atma Jaya, Jakarta.

Penelitian tersebut dilakukan untuk uji validitas prediktif sehubungan dengan

pemakaian IST sebagai tes seleksi masuk mahasiswa baru Universitas Atma Jaya

(23)

Ilmu Pendidikan, dan Fakultas Psikologi. Hasilnya menunjukkan bahwa IST

kurang baik dalam memprediksi keberhasilan prestasi mahasiswa pada semester

pertama. Hanya beberapa subtes saja yang berkorelasi signifikan (p≤0.05) dengan

prestasi mahasiswa dan korelasinya masih dalam taraf yang kecil. Subtes-subtes

tersebut adalah SE dengan r = 0,219; AN dengan r = 0,192; ME dengan r = 0,210;

RA dengan r =0,251; ZR dengan r = 0,176; GE dengan r = 0,152.

Sejak dilakukan uji validitas prediktif ini, IST tidak lagi digunakan untuk

alat seleksi di Universitas Atma Jaya karena dianggap tidak dapat meramalkan

prestasi mahasiswa (Astya, 2008). Pada tahun 2001, Fakultas Psikologi

Universitas Airlangga melakukan uji validitas dan reliabilitas pada aitem IST

dengan subjek 200 siswa SMA, hasilnya menunjukkan bahwa dari 176 aitem

terdapat 131 aitem yang dinyatakan valid dan 45 aitem yang dinyatakan gugur dan

dari sembilan subtes, satu subtes yakni ZR (dengan jumlah aitem 20) dinyatakan

semua aitemnya valid. Sedangkan untuk reliabilitas dari sembilan subtes tersebut

semuanya dinyatakan reliabel dengan besar koefisien sebesar 0,463-0,821 pada

taraf signifikansi 0,01. Namun hasil ini tidak bisa digeralisasi lebih luas

mengingat jumlah dan karakteristik subjek yang terbatas (Hamidah, 2001).

Santosa dkk. (dalam Widianti, 2008) juga menyatakan bahwa sebuah tes

yang telah dipakai dalam jangka waktu lama seperti IST, memang memerlukan

pengujian ulang untuk melihat sejauhmana tes tersebut masih dapat digunakan

sebagai alat ukur yang handal. Handayani (dalam Widianti, 2008) juga

menyatakan bahwa issue lainnya yang berkembang menurut Himpunan Sarjana

(24)

kota-kota besar seperti Jakarta karena IST diduga tidak valid untuk mengukur

inteligensi. Kondisi ini dilatarbelakangi oleh frekuensi pemakaian yang terlalu

tinggi dan kerahasiaan yang sulit dikontrol. Hasil wawancara dengan dosen

Fakultas Psikologi USU yang juga ketua P3M Fakultas Psikologi diketahui bahwa

IST juga telah bocor di kota Medan, tidak jarang individu memiliki lembar IST

dan mendapatkan skor yang mendekati sempurna walaupun individu tersebut

tidak mau menjawab semua dengan benar karena takut dicurigai oleh tester atau

individu yang memberikan tes. Oleh karena itu, penggunaan IST di P3M Fakultas

Psikologi USU umumnya atas permintaan individu atau perusahaan yang

bersangkutan. Sebelumnya, pihak P3M akan menjelaskan kelemahan dan

kelebihan tes tersebut (Komunikasi Personal, Ari Widiyanta, 26 November 2010).

Validitas dan reliabilitas yang masih dipertanyakan serta kerahasian yang

sulit dikontrol pada IST seharusnya membuat para pengguna tes ini

mempertanyakan kelayakan tes dalam mengukur inteligensi dan melakukan

evaluasi terhadap alat tes tersebut. Namun kenyataannya, IST masih saja

digunakan di Indonesia, khususnya oleh P3M Fakultas Psikologi USU tanpa

pernah melakukan evaluasi atau uji analisis karakteristik psikometri terhadap IST

tersebut. Sukardi (1997) menyatakan bahwa syarat tes yang baik memiliki kriteria

pokok sebagai berikut: tes yang terstandar atau baku dalam hal administrasi,

penskoran dan norma yang digunakan untuk membantu interpretasi skor; objektif;

valid; dan reliabel. Maka dapat disimpulkan bahwa suatu tes yang tidak memiliki

kriteria ini, dapat dikatakan bahwa tes tersebut tidak objektif dan tidak layak

(25)

proses analisis karakteristik psikometri terhadap IST sebagai salah satu tes

inteligensi yang sering digunakan oleh P3M Fakultas Psikologi USU.

Pada penelitian ini, pengujian secara psikometri hanya akan dilakukan

pada satu subtes, yaitu subtes Rechenaufgaben (RA). Subtes RA terdiri dari 20

soal mulai dari nomor 77 sampai dengan 96. Subtes digunakan untuk mengetahui

kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan

kemampuan mengambil kesimpulan (Polhaupessy dalam Diktat Kuliah IST

UNPAD, 2009).

Aitem-aitem dalam subtes RA disajikan dalam bentuk kalimat cerita.

Kalimat-kalimat tersebut terdiri dari 14 kata sampai dengan 38 kata. Seperti aitem

terakhir nomor 96, aitem ini dinyatakan dengan kalimat cerita yang paling

panjang sekitar 38 kata diantara aitem yang lainnya. Hal ini menunjukkan bahwa

aitem tersebut tidak hanya mengukur kemampuan berpikir praktis dalam

berhitung, tetapi juga mengukur kemampuan pemahaman bahasa individu yang

dikenai tes. Selain itu angka dan bilangan yang digunakan dalam subtes ini tidak

sesuai dengan perkembangan Indonesia saat ini. Seperti pada aitem no 77, 81, 84,

89, 91 menggunakan bilangan puluhan rupiah bahkan satuan rupiah. Sekarang ini,

nilai uang dalam bentuk satuan rupiah atau puluhan rupiah tidak lagi dikenal dan

digunakan dalam transaksi jual beli di Indonesia. Nominal uang yang paling kecil

yang masih berlaku adalah Rp. 100,-.

Hasil penelitian Fakultas Psikologi Universitas Atma Jaya, Jakarta tahun

2008 dengan subjek siswa SMA, menunjukkan bahwa subtes RA mengukur

(26)

IPS dan IPA, namun tidak berfungsi sebagai tes differensial (Engelen, 2008).

Berdasarkan hasil tersebut dapat dikatakan bahwa subtes ini tidak dapat

membedakan individu yang memiliki kemampuan berpikir praktis dalam

berhitung, berpikir induktif, reasoning, dan kemampuan mengambil kesimpulan

dengan individu yang tidak memiliki kemampuan tersebut.

Secara umum, analisis yang akan dilakukan dalam penelitian ini mencakup

analisis karakteristik psikometri berupa analisis indeks diskriminasi dan kesukaran

aitem, reliabilitas, serta analisis validitas subtes RA. Analisis reliabilitas dilakukan

sebagai salah satu pendekatan untuk mengestimasi skor murni individu. Melalui

koefisien reliabilitas dapat diestimasi letak skor murni individu dalam suatu

wilayah interval tertentu. Semakin tinggi koefisien reliabilitas mengindikasikan

semakin kecil pula eror yang terjadi dalam konteks pengukuran (Suryabrata,

2005). Selanjutnya uji validitas, Azwar (2007) mengartikan validitas sebagai

sejauhmana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi

ukurnya. Pada penelitian ini validitas yang akan diuji adalah validitas konstrak

yang bertujuan untuk meneliti ketepatan subtes RA dalam mengukur kemampuan

berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan

mengambil kesimpulan dengan menggunakan metode multitrait-multimethod

yang meliputi validitas diskriminan dan konvergen. Koefisien validitas konvergen

dan diskriminan dilihat dari korelasi antara subtes RA dengan 8 subtes lainnya

pada IST dalam bentuk matrik multitrait-multimethod. Korelasi yang tinggi

(27)

konvergen. Sebaliknya, korelasi yang rendah menunjukkan bahwa subtes-subtes

tersebut mengukur hal yang berbeda.

B.Identifikasi Masalah

Berdasarkan Latar Belakang Masalah yang telah diuraikan, maka dapat

diidentifikasi beberapa masalah yang berhubungan dengan IST, khususnya subtes

RA, yaitu:

1. IST masih sering digunakan sebagai tes inteligensi oleh P3M Fakultas

Psikologi USU, meskipun IST yang digunakan oleh P3M Fakultas Psikologi

USU tersebut merupakan IST adaptasi Fakultas Psikologi UNPAD, Bandung

tahun 1970-an dan belum pernah dievaluasi secara psikometri oleh P3M

Fakultas psikologi USU.

2. Hasil beberapa penelitian menyatakan bahwa sekarang ini IST memiliki

validitas prediktif kurang baik, 45 aitem IST dinyatakan gugur atau tidak valid,

serta tidak lagi digunakan di kota-kota besar seperti di Jakarta karena diduga

tidak valid untuk mengukur inteligensi akibat frekuensi pemakaian yang terlalu

tinggi dan kerahasiaan yang sulit dikontrol.

3. IST juga telah bocor di Kota Medan sehingga tidak jarang individu memiliki

lembar IST dan mendapatkan skor IST yang mendekati sempurna.

4. Hasil penelitian tentang subtes RA diketahui bahwa subtes RA mengukur

konstruk inductive reasoning dan tidak berfungsi sebagai tes differensial.

5. Aitem pada subtes RA berbentuk kalimat cerita yang terdiri dari 14 sampai 38

(28)

ukurnya tetapi juga mengungkap kemampuan bahasa yang dimiliki oleh

individu yang dikenai tes.

6. Penggunaan nilai mata uang yang berlaku di Indonesia pada tahun 1970-an

membuat aitem dalam subtes ini tidak sesuai lagi dengan nilai mata uang yang

berlaku dalam transaksi jual beli di Indonesia sekarang ini.

C. Rumusan Masalah

Permasalahan dalam penelitian ini dirumuskan dalam bentuk pertanyaan

sebagai berikut:

1. Seberapa baikkah indeks kesukaran aitem subtes RA pada IST?

2. Seberapa baikkah indeks diskriminasi aitem subtes RA pada IST?

3. Apakah subtes RA pada IST masih dapat dipercaya atau memiliki nilai

reliabilitas yang baik?

4. Bagaimanakah validitas konstrak subtes RA pada IST yang dilihat dari

koefisien validitas konvergen dan koefisien validitas diskriminan?

5. Bagaimanakah kualitas subtes RA pada IST berdasarkan hasil analisis

karakteristik psikometri?

D. Tujuan Penelitian

Penelitian ini bertujuan untuk melihat apakah IST masih berfungsi sesuai

dengan tujuan IST disusun, khususnya pada subtes RA berdasarkan karakteristik

(29)

E. Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan manfaat teoritis maupun

praktis, sebagai berikut:

1. Manfaat Teoritis

Penelitian ini diharapkan dapat menambah manfaat keilmuan dalam

bidang psikologi mengenai karakteristik psikometri subtes RA pada IST sehingga

dapat memberikan informasi apakah subtes RA pada IST masih berfungsi sesuai

dengan tujuan subtes tersebut disusun.

2. Manfaat Praktis

a) Penelitian ini diharapkan menjadi masukan dan landasan bagi akademisi

psikometri untuk merevisi IST, khususnya subtes RA.

b) Penelitian ini diharapkan dapat menjadi bahan pertimbangan bagi para

praktisi untuk menggunakan IST, khususnya subtes RA sebagai alat

(30)

BAB II

TINJAUAN PUSTAKA

Pada dasarnya ilmu pengukuran memiliki dua pendekatan, yaitu

pendekatan classical test theory (CTT) dan pendekatan teori modern. Pendekatan

CTT adalah metode pertama yang dikembangkan untuk pengukuran. Teori-teori

CTT mendominasi pengembangan rumus reliabilitas dan validitas yang dikenal

dewasa ini (Azwar, 2007 dan Suryabrata, 2005). Namun CTT memiliki beberapa

keterbatasan, yaitu tergantung pada kelompok sampel yang digunakan, asumsi

kesetaraan eror pengukuran pada semua subjek yang dikenai tes sulit untuk

diterima dan tidak ada pernyataan lain yang dapat memperkuat asumsi ini,

khususnya pada tes yang sulit, serta definisi tes paralel yang dimaksud oleh CTT

sangat sulit untuk dipenuhi dalam praktek (Azwar, 2005).

Pendekatan teori modern didasarkan pada sifat-sifat atau kemampuan yang

laten, yang mendasari performansi atau respon subjek terhadap aitem tertentu

sehingga disebut dengan Teori Sifat Laten (Latent Trait Theory) atau yang lebih

populer dengan sebutan Teori Respons Aitem (Item Response Theory yang

selanjutnya disingkat IRT (Suryabrata, 2005). Pendekatan ini bertujuan untuk

mengatasi kelemahan-kelemahan CTT. IRT dikembangkan atas dasar dua

postulat. Pertama, performansi seorang subjek pada suatu aitem dapat diprediksi

dari seperangkat faktor yang disebut traits, latent traits, atau kemampuan. Kedua,

hubungan antara performansi subjek pada suatu aitem dan kemampuan yang

(31)

meningkat secara monotonik yang disebut item characteristic function atau item

characteristic curve (ICC). ICC akan menunjukkan bahwa subjek yang memiliki

kemampuan yang tinggi akan memiliki peluang yang lebih besar untuk menjawab

aitem dengan benar. Artinya katakteristik-karakteristik aitem tidak lagi tergantung

pada kelompok subjek. Ini menjadi keuntungan menggunakan IRT yang tidak

dapat dijelaskan dengan CTT (Azwar, 2005). Model-model IRT memiliki

asumsi-asumsi pendukung walaupun tidak dapat diukur secara langsung, namun

dapat disimpulkan dan dinilai dari kesesuaian model pada perangkat data tes yang

akan dianalisis. Asumsi yang paling umum adalah unidimensionalitas, yaitu hanya

satu kemampuan yang diukur oleh aitem-aitem dalam setiap tes. Asumsi

berikutnya adalah independensi lokal, yaitu apabila kemampuan-kemampuan

yang mempengaruhi peformansi dijadikan konstan maka respon subjek terhadap

pasangan aitem manapun juga akan independen secara statistik satu sama lain.

Artinya kemampuan subjek pada suatu aitem tidak dipengaruhi oleh faktor-faktor

lainnya dan tidak berhubungan dengan kemampuan subjek pada aitem lainnya

(Azwar, 2005). Keuntungan lainya dalam menggunakan IRT adalah pendekatan

ini sangat mudah diadaptasikan untuk tes yang di administarasi dengan komputer

(Kaplan & Saccuzo, 2005). Keterbatasan dari pendekatan ini adalah proses yang

cukup rumit dan sulit untuk dilakukan karena analisis dilakukan per aitem dan

subjek.

Pada penelitian ini, pendekatan yang akan digunakan dalam proses analisis

adalah CTT dengan pertimbangan bahwa pendekatan ini yang dipelajari oleh

(32)

validitas, serta pendekatan ini lebih mudah digunakan karena analisis dilakukan

pada kelompok subjek bukan per subjek.

A. Classical Test Theory (CTT)

1. Pengertian CTT

Pendekatan CTT adalah metode pertama yang telah dikembangkan sejak

dahulu dan tetap digunakan dewasa ini dalam berbagai bidang kehidupan

sehingga pendekatan ini disebut dengan CTT atau teori tes klasik. CTT terbentuk

dan berkembang perlahan-lahan melalui unsur-unsur yang akhirnya secara

akumulatif menjadi bangunan teori yang utuh. Model pendekatan ini juga disebut

model skor murni (true score model). Inti CTT berupa asumsi-asumsi yang

dirumuskan secara sistematis (Suryabrata, 2005)

Asumsi-asumsi CTT pada dasarnya merupakan hubungan matematis dari

skor tampak yang disimbolkan dengan huruf X, skor murni yang dilambangkan

dengan huruf T, dan komponen eror pengukuran yang diberi simbol huruf E. X

merupakan nilai performansi individu yang diungkap oleh suatu pengukuran yang

dinyatakan dalam bentuk angka yang merupakan nilai total dari jawaban subjek

terhadap aitem atau pernyataan dalam tes tersebut. T menjelaskan performansi

individu sesungguhnya yang tidak mungkin dapat diungkap secara langsung oleh

tes. E menunjukkan besarnya eror individu dalam setiap tes yang angkanya juga

(33)

2. Asumsi-Asumsi dalam CTT

Pendekatan CTT terdiri dari asumsi-asumsi yang berkaitan dengan skor

tampak, skor murni dan komponen eror pengukuran. Allen & Yen (dalam Azwar,

2005) menguraikan hubungan antara eror pengukuran dan skor murni dalam

asumsi-asumsi sebagai berikut:

Asumsi 1: X = T + E (1)

Asumsi ini didasarkan pada model Spearman yang menyatakan bahwa

setiap skor tes menggambarkan gabungan dari dua komponen yaitu skor murni

dan komponen eror (Crocker & Algina, 2005). X merupakan jumlah T dan E,

sehingga besar X akan tergantung oleh besarnya E pengukuran, sedangkan

besarnya T individu pada setiap pengukuran yang sama diasumsikan selalu tetap.

Jadi dapat disimpulkan bahwa skor yang diperoleh dari suatu pengukuran

umumnya tidak menunjukkan keadaan sebenarnya (Suryabrata, 2005).

Asumsi 2: ε(X) = T (2)

Asumsi ini menyatakan bahwa T sama dengan nilai harapan dari X-nya

yang dilambangkan dengan ε(X). Jadi, T merupakan harga rata-rata dari distribusi

teoretik X apabila orang yang sama dikenai tes yang sama berulangkali dengan

asumsi pengulangan tes itu dilakukan tidak terbatas banyaknya dan setiap

pengulangan tes adalah independen satu sama lain.

Asumsi 3: = 0 (3)

Asumsi ini menyatakan bahwa bagi populasi subjek yang dikenai tes,

distribusi E pengukuran dan distribusi T tidak berkorelasi satu sama lain.

(34)

selalu positif ataupun selalu negative atau mempunyai E lebih tinggi dibanding

subjek yang T-nya rendah.

Asumsi 4: = 0 (4)

Asumsi ini menyatakan bahwa dalam eror pada dua tes ( yang dimaksud

untuk mengukur hal yang sama) tidak saling berkorelasi. Artinya besarnya E pada

suatu tes tidak tergantung pada E tes lainnya. Asumsi ini akan tidak terpenuhi

sekiranya skor tampak dipengaruhi kondisi testing, seperti misalnya kelelahan,

practice effect, suasana hati, atau factor-faktor dari lingkungan (Suryabrata, 2005).

Asumsi 5 = 0 (5)

Asumsi ini menyatakan bahwa E pada suatu tes tidak berkorelasi dengan T

pada tes lain.

E yang dimaksud dalam CTT adalah penyimpangan X dari skor harapan

teoritik yang terjadi secara random atau tidak terjadi secara sistematik. Jika

penyimpangan terjadi secara sistematik maka itu tidaklah dianggap sebagai

sumber eror.

Selain lima asumsi yang telah dijelaskan, terdapat dua asumsi lagi yang

dijelaskan oleh Suryabrata (2005), yaitu:

Asumsi 6

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama

mempunyai skor tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan jika

untuk setiap populasi subjek T = T’ serta varians eror kedua tes tersebut sama,

(35)

Asumsi 7

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama

mempunyai skor tampak X dan X’ yang memenuhi asumsi 1 sampai 5, dan

apabila untuk setiap populasi subjek T1 = T2 + C. Dengan C sebagai suatu

bilangan konstan, maka kedua tes tersebut dapat disebut sebagai tes yang setara

(equivalent test).

Dua tes yang setara dapat memiliki varians eror yang berbeda karena

keduanya belum tentu merupakan tes yang paralel, namun dua tes yang paralel

tentu memenuhi syarat sebagai tes yang setara (Azwar, 2005).

Asumsi-asumsi CTT secara sekilas terlihat sebagai sesuatu yang hanya

bersifat teoritis karena sulit untuk ditemukan dalam kehidupan nyata. Meskipun

demikian, CTT masih bertahan sebagai dasar pengembangan dan analisis alat

ukur psikologi. Berbagai tes telah disusun berdasarkan CTT di berbagai belah

dunia termasuk di Indonesia, seperti Tes Kemampuan Akademik (TPA), Ujian

Masuk Perguruan Tinggi Negeri (UMPTN), dan Ujian Akhir Nasional (UAN)

(Suryabrata, 2005).

B. Analisis Karakteristik Psikometri

Suatu alat ukur yang telah dikonstruksi pastinya belum dapat dikatakan

sebagai alat ukur yang layak pakai apabila analisis terhadap karakteristik

psikometri alat ukur tersebut belum dilakukan. Proses analisis terhadap

karakteristik psikometri dapat digunakan dalam merancang suatu alat ukur

(36)

dan reliabilitas suatu alat tes dengan cara memilih aitem-aitem yang baik sesuai

dengan tujuan alat tes (Crocker & Algina, 2005). Analisis aitem dapat dilakukan

secara kualitatif dan kuantitatif. Analisis aitem secara kualitatif berarti aitem

dianalisis berdasarkan bentuk dan isinya yang dapat dilakukan dengan

mempertimbangkan validitas isi. Sedangkan analisis secara kuantitatif dilakukan

dengan analisis parameter-parameter aitem berupa indeks kesukaran aitem, indeks

diskriminasi aitem, analisis reabilitas, dan validitas dari alat ukur tersebut

(Anastasi & Urbina, 2006).

Pada penelitian ini analisis aitem hanya dilakukan secara kuantitatif

dengan pertimbangan bahwa penelitian ini bertujuan untuk melihat validitas

konstrak dan reliabilitas alat ukur mengingat bahwa IST merupakan tes yang

diadaptasi yang telah lama digunakan dan tidak bertujuan untuk melihat kualitas

aitem secara kualitatif.

1. Indeks Kesukaran Aitem

a. Pengertian Indeks Kesukaran Aitem

Indeks kesukaran aitem adalah proporsi antara individu yang menjawab

aitem dengan benar dan total individu yang menjawab aitem tersebut. Indeks

kesukaran aitem atau derajat kesukaran aitem disimbolkan oleh huruf p dengan

rumus:

(37)

Keterangan:

p = Derajat kesukaran aitem

ni = Banyak peserta tes yang menjawab benar

N = Banyak peserta tes yang menjawab aitem

Indeks kesukaran aitem ditentukan oleh seberapa banyak peserta tes

berhasil menjawab aitem dengan benar. Semakin banyak peserta tes menjawab

dengan benar, berarti semakin mudah aitem tersebut dan sebaliknya semakin

sedikit peserta menjawab dengan benar, maka semakin sulit aitem tersebut

(Azwar, 2007).

Crocker & Algina (2005) menjelaskan bahwa untuk aitem yang memiliki

skor dikotomi, yaitu 0 jika salah dan 1 jika benar, rata-rata skor aitem tes sama

dengan indeks kesukaran aitem sehingga jumlah indeks kesukaran aitem pada

suatu tes menjadi sama dengan rata-rata dari skor tes tersebut.

μx = Σp (7)

Keterangan:

μx = rata-rata skor tes

Σp = jumlah indeks kesukaran aitem

Selanjutnya, jika indeks kesukaran aitem dirata-ratakan, maka;

μp = (μx)/k (8)

Keterangan:

μp = rata-rata indeks kesukaran aitem

μx = rata-rata skor tes

(38)

Menurut Kumar (2009), angka untuk indeks kesukaran aitem sama dengan

nomor aitem dalam tes tersebut. Artinya penyusunan aitem didasarkan pada

indeks kesukarannya. Pernyataan ini didukung oleh Murphy & Davidshofer

(2003) yang menyarankan untuk menyusun aitem-aitem dalam tes secara

sistematis, dengan menempatkan aitem-aitem berdasarkan taraf kesukarannya,

mulai dari aitem yang paling mudah hingga yang paling sulit. Oleh karena itu,

pola penyusunan aitem-aitem dalam tes sebaiknya dimulai dari aitem dengan

harga p yang paling tinggi hingga aitem dengan harga p yang paling rendah.

b. Analisis Indeks Kesukaran Aitem

Azwar (2007) menyatakan bahwa taraf kesukaran yang terbaik bergantung

pada tujuan dari tes tersebut. Untuk tes prestasi yang bertujuan untuk evaluasi

formatif misalnya, tidak jarang diperlukan aitem-aitem dengan taraf kesukaran

rendah atau aitem-aitem dengan harga p tinggi. Namun demikian untuk tes yang

bertujuan untuk proses seleksi masuk, terlebih dalam tes masuk yang bertujuan

untuk proses pendidikan atau pemilihan sebagian kecil calon karyawan, harus

diusahakan tes yang memiliki harga p yang rendah atau aitem yang sulit, sehingga

individu yang dinyatakan lulus selanjutnya adalah individu yang benar-benar

memiliki atribut yang diukur. Lord (dalam Murphy & Davidshofer, 2003)

menyatakan bahwa untuk tes seleksi karyawan, p akan dikatakan baik jika nilai p

mendekati 0,2. Namun, jika tes dimaksud sebagai perangkat untuk memilih

sebagian besar dari calon karyawan yang melamar, maka tes yang baik adalah

(39)

Pada dasarnya tes disusun untuk melihat perbedaan individu sehingga jika

tidak ada seorang pun yang menjawab pertanyanan dengan benar, dalam artian

soal sangat susah (p = 0) bahkan sebaliknya jika soal sangat gampang sehingga

semua dapat menjawab pertanyaan dengan benar (p= 1) tentu tujuan alat tes tidak

dapat dipenuhi (Murphy & Davidshofer, 2003). Oleh karena itu harga p bergerak

mulai dari 0 sampai dengan 1. Apabila dilihat lebih lanjut, harga p yang berada

pada titik ekstremnya yaitu titik 0 atau 1 mengindikasikan bahwa aitem tersebut

kurang berguna (Azwar, 2007). Allen & Yen (dalam Lababa, 2008),

mengkategorikan nilai p sebagai berikut:

Tabel 1. Kategori Nilai p

No. p Kategori

1 p < 0,3 Sulit 2 0.3 <p< 0,7 Sedang 3 p > 0,7 Mudah

Umumnya pada penyusunan alat tes disarankan untuk menggunakan aitem

dengan nilai p mendekati 0,5. Ketika tes disusun untuk pengukuran secara umum

seperti inteligensi, aitem dengan nilai p mendekati 0,5 akan lebih baik dari pada

aitem yang memiliki nilai p ekstrim. Jadi dalam analisis indeks kesukaran aitem,

aitem dengan p mendekati 0,5 akan lebih optimal (Murphy & Davidshofer, 2003).

Pada penelitian ini, IST merupakan salah satu tes inteligensi dan sering

digunakan oleh P3M Fakultas Psikologi USU. Oleh karena itu, berdasarkan

Murphy & Davidshofer, 2003, p akan dikatakan baik jika nilai p mendekati 0,5,

dan tidak mendekati 0 atau 1. Jika dihubungkan pada kategori Allen & Yen (

dalam Lababa, 2008) maka p yang dianggap baik berada pada kategori sedang

(40)

2. Indeks Diskriminasi Aitem

a. Pengertian Indeks Diskriminasi Aitem

Indeks diskriminasi aitem merupakan kemampuan aitem dalam

membedakan antara individu yang memiliki atribut psikologis yang diukur

dengan individu yang tidak memiliki atribut psikologis yang diukur (Azwar,

2007). Murphy dan Davidshofer (2003) mengatakan bahwa aitem yang baik akan

mampu membedakan kelompok individu yang mampu dan yang tidak mampu

mengerjakan suatu tes dengan baik. Artinya, aitem dengan indeks diskriminasi

yang baik harus dapat dijawab dengan benar oleh hampir seluruh kelompok

individu yang memiliki atribut, dan dijawab dengan salah oleh hampir sebagian

besar kelompok individu yang tidak memiliki atribut.

Menurut Azwar (2007), secara sederhana dapat dikatakan bahwa indeks

diskriminasi aitem merupakan suatu harga yang menunjukkan perbedaan proporsi

penjawab aitem dengan benar antara kelompok dengan kemampuan tinggi dengan

kelompok dengan kemampuan rendah. Indeks diskriminasi aitem disimbolkan

oleh d dengan rumus:

d = niT/NT– niR/NR (9)

Keterangan:

niT = Jumlah peserta dari kelompok tinggi yang menjawab aitem dengan benar

NT = Jumlah peserta dari kelompok tinggi

niR = Jumlah peserta dari kelompok rendah yang menjawab item dengan benar

(41)

Karena ni/N= p, maka dapat juga dirumuskan dengan:

d = pT-pR (10)

Keterangan:

pT = Indeks kesukaran item kelompok tinggi

pR = Indeks kesukaran item kelompok rendah

Pada penelitian ini indeks diskriminasi aitem dapat diartikan sebagai

kemampuan aitem dalam membedakan individu yang memiliki kemampuan

berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan kemampuan

mengambil kesimpulan dengan individu yang tidak memiliki kemampuan

tersebut.

b. Analisis Indeks Diskriminasi Aitem

Diskriminasi aitem yang maksimal akan dicapai dalam kondisi ketika

seluruh subjek kelompok tinggi dapat menjawab aitem dengan benar dan seluruh

subjek kelompok rendah tidak mampu untuk menjawabnya, dalam hal ini akan

diperoleh harga d = 1. Secara matematik indeks diskriminasi aitem akan berkisar

mulai dari -1 sampai dengan +1. Namun demikian hanya harga d yang bernilai

positif saja yang memiliki arti dalam analisis aitem (Azwar, 2007).

Harga d yang berada disekitar 0 menunjukkan bahwa aitem yang

bersangkutan mempunyai diskriminasi yang rendah sedangkan harga d yang

negatif menunjukkan bahwa aitem yang bersangkutan tidak berguna sama sekali

bahkan bisa menyesatkan.

Indeks diskriminasi aitem yang ideal adalah yang mendekati angka 1,

(42)

mereka yang tidak menguasainya. Semakin kecil diskriminasi aitem (semakin

mendekati 0) berarti semakin tidak jelaslah fungsi aitem yang bersangkutan dalam

membedakan mana subjek yang menguasai materi yang diujikan dan subjek yang

tidak tahu apa-apa (Azwar,2007).

Ebel (dalam Azwar, 2007) terdapat suatu panduan dalam evaluasi indeks

diskriminasi aitem, yaitu :

Tabel 2. Evaluasi Indeks Diskriminasi Aitem

d Evaluasi

0,4 atau lebih Bagus sekali

0,3 - 0,39 Lumayan bagus, tidak membutuhkan revisi 0,2 – 0,29 Belum memuaskan, perlu revisi

d < 0,20 Jelek dan harus dibuang

Thorndike (dalam Azwar, 2007) mengatakan bahwa dalam proses seleksi

aitem, aitem-aitem yang memiliki nilai diskriminasi aitem di atas 0,50 akan

langsung dianggap baik sedangkan aitem-aitem dengan indeks diskriminasi di

bawah 0,20 dapat langsung dibuang dan dianggap jelek.

Menurut Murphy dan Davidshofer (2003) ada tiga cara statsistik yang

dapat digunakan untuk mengukur indeks diskriminasi aitem, yaitu:

1)Metode kelompok ekstrim

Metode kelompok ekstrim merupakan cara yang mudah untuk mengukur

indeks diskriminasi aitem pada kelompok yang besar. Indeks diskriminasi aitem

dapat dihitung dengan cara membagi kelompok menjadi dua, Upper group yakni

kelompok yang memiliki skor yang tinggi (25-35 % nilai tertinggi didalam

kelompok) dan lower group yakni kelompok yang memiliki nilai yang rendah

(43)

diskriminasi aitem yang baik akan dijawab benar oleh upper group dan dijawab

salah oleh lower group.

2)Korelasi aitem-total

Korelasi aitem-total memberikan informasi tentang apakah aitem

mengukur hal yang sama dengan tes. Korelasi aitem-total untuk aitem yang

diskor 1 jika benar dan 0 jika salah sering juga disebut korelasi poin biserial.

Artinya, korelasi poin biserial digunakan apabila aitem-aitem dalam tes berbentuk

dikotomi dan dengan skor total berupa data kontinyu. Nilai positif menunjukkan

bahwa aitem dan tes mengukur hal yang sama, nilai mendekati nol menunjukkan

bahwa bahwa aitem tidak memiliki indeks diskriminasi yang baik sehingga upper

group menjawab pertayaan dengan salah dan lower group menjawab pertanyaan

dengan benar.

3)Korelasi inter-aitem

Korelasi inter-aitem digunakan untuk memahami indeks diskriminasi

aitem. Korelasi inter-aitem tidak menjelaskan mengapa beberapa aitem

menunjukkan nilai yang tinggi ataupun rendah karena sangat jelas bahwa aitem

yang memiliki nilai korelasi aitem total yang positif akan menunjukkan nilai yang

positif juga pada kebanyakan aitemnya. Namun korelasi aitem total tidak dapat

menjelaskan mengapa korelasi aitem total dapat bernilai negatif. Dan dalam hal

ini dapat dijelaskan dengan menggunakan korelasi inter-aitem.

Korelasi inter-aitem dapat membantu dalam memahami mengapa beberapa

(44)

salah dan subjek dari lower group dapat menjawab dengan benar.

Korelasi inter-aitem yang bernilai rendah dapat memiliki dua arti,

kemungkinan pertama adalah aitem tidak mengukur hal yang sama dengan tes,

sehingga aitem harus dibuang atau dibuat ulang, kemungkinan kedua adalah aitem

memang mengukur atribut yang berbeda dengan tes dikarenakan tes memang

disusun untuk mengukur dua atribut yang berbeda.

Pada penelitian ini indeks diskriminasi aitem akan dianalisis dengan

metode korelasi aitem-total untuk melihat apakah aitem memang mengukur

kemampuan berpikir praktis dalam berhitung, berpikir induktif, reasoning, dan

kemampuan mengambil kesimpulan yang sama dengan semua aitem pada subtes

RA atau aitem juga mengukur atribut yang berbeda pada subtes RA. Rumus

korelasi aitem-total yang digunakan adalah korelasi point biserial dengan

pertimbangan bahwa aitem pada subtes RA memiliki skor dikotomi, yaitu diskor 1

jika benar dan 0 jika salah, serta skor total subjek berbentuk data kontinyu. Indeks

diskriminasi yang dikatakan baik dalam penelitian ini didasari pada evaluasi Ebel

(dalam Azwar, 2007), yaitu ≥ 0,4 dengan evaluasi bagus sekali.

3. Reliabilitas Alat Ukur

a. Pengertian Reliabilitas

Reliabilitas merupakan penerjemahan dari kata reliability yang

menyatakan keterpercayaan, keterandalan, keajegan, kestabilan, konsistensi dan

sebagainya, namun pada intinya konsep reliabilitas memiliki makna sejauh mana

(45)

Urbina (2006) reliabilitas suatu tes merujuk pada konsistensi skor yang di peroleh

oleh individu yang sama ketika diberikan tes ulang yang sama atau seperangkat

tes yang ekivalen dengan tes sebelumnya pada kondisi yang berbeda. Suryabrata

(2005) menyatakan bahwa reliabilitas alat ukur menunjukkan sejauh mana hasil

pengukuran dengan alat tersebut dapat dipercaya, yang mana hal ini ditunjukkan

oleh taraf konsistensi skor yang diperoleh para subjek yang diukur dengan alat

yang sama atau minimal setara, dalam kondisi yang berbeda. Oleh sebab itu,

konsepsi mengenai reliabilitas berkaitan dengan derajat konsistensi antara dua

perangkat skor tes, maka rumus reliabilitas selalu dinyatakan dalam bentuk

koefisien korelasi (Azwar, 2005).

b. Bentuk Estimasi Reliabilitas

Reliabilitas alat ukur yang juga menunjukkan eror pengukuran yang tidak

dapat ditentukan secara pasti, hanya dapat diestimasi (Suryabrata, 2005). Estimasi

reliabilitas dapat dilakukan melalui beberapa metode berdasarkan CTT, yaitu

pendekatan tes ulang, pendekatan tes paralel, dan pendekatan konsistensi internal

(Azwar, 2005 dan Suryabrata, 2005).

1) Pendekatan tes ulang

Pendekatan tes ulang adalah salah satu dari pendekatan pertama yang

pantas dan mudah untuk mengestimasi reliabilitas dari suatu skor tes (Murphy dan

Davidshofer, 2003). Pendekatan ini dilakukan dengan cara menyajikan tes dua

kali pada suatu kelompok yang sama dalam rentang waktu tertentu, minsalnya dua

minggu (Suryabrata, 2005). Asumsinya adalah suatu tes yang reliabel akan

(46)

waktu yang berbeda pada sekelompok subjek yang sama (Azwar, 2005). Sehingga

akan diperoleh dua distribusi skor dari kelompok tersebut. Korelasi antara dua

skor pada dua waktu yang berbeda tersebut disebut koefisien reliabilitas (r)

(Kumar, 2009).

Pendekatan tes ulang ini dapat dikatakan baik secara teori, namun dalam

prakterknya mengandung kelemahan, yaitu kondisi subjek pada tes kedua tidak

lagi sama dengan kondisi subjek pada tes pertama baik dari proses belajar,

perubahan motivasi, pengalaman, sehingga pendekatan ini lebih baik digunakan

bila objek ukur berupa keterampilan, terutama keterampilan fisik (Suryabrata,

2005). Menurut Azwar (2005), pendekatan tes ulang cocok digunakan hanya bagi

tes yang mengukur aspek psikologis yang relatif stabil dan tidak mudah berubah.

Rumus yang dapat digunakan untuk menentukan reliabilitas tes ulang

adalah Pearson product-moment (Kumar, 2009).

2) Pendekatan tes paralel

Pendekatan reliabilitas bentuk paralel dilakukan dengan memberikan dua

bentuk tes yang paralel pada sekelompok subjek, yaitu tes yang memiliki tujuan

ukur yang sama dan isi aitem yang setara secara kualitas maupun kuantitas

(Azwar, 2005). Pendekatan ini juga disebut sebagai alternate form yang

digunakan untuk mengatasi kelemahan pendekatan tes ulang (Kumar, 2009).

Asumsinya, dua tes yang paralel akan menghasilkan skor tes yang berkorelasi

tinggi satu sama lain dan memiliki koefisien reliabilitas yang tinggi.

Keuntungan pendekatan ini adalah dapat mengurangi efek-efek praktis

(47)

namun kelemahan pendekatan ini adalah sulitnya menyusun perangkat tes yang

paralel (Kumar, 2009). Menurut Azwar (2005), dua tes yang paralel hanya ada

secara teoritis, tidak benar-benar paralel secara empirik.

Rumus yang dapat digunakan untuk menentukan reliabilitas tes ulang

adalah korelasi Pearsonproduct moment (Azwar, 2005).

3) Pendekatan konsistensi internal

Pendekatan ini dilakukan dengan memberikan satu bentuk tes dengan

sekali penyajian kepada sekelompok subjek yang bertujuan melihat konsistensi

antar aitem atau antar bagian dalam tes tersebut serta menghindari

masalah-masalah pada pendekatan tes ulang dan paralel. Seperangkat tes diberikan kepada

sekelompok subjek satu kali sehingga diperoleh satu distribusi skor tes dari

kelompok subjek tersebut. Untuk itu, prosedur analisis reliabilitasnya diarahkan

pada analisis terhadap aitem-aitem atau terhadap kelompok-kelompok aitem

dalam tes itu sehingga perlu dilakukan pembelahan tes menjadi beberapa

kelompok aitem yang disebut belahan tes. Cara pembelahan tes disesuaikan

dengan sifat dan fungsi tes serta jenis skala pengukuran yang digunakan dalam tes

tersebut yang kemudian akan menentukan rumusan atau rumus yang dapat

digunakan dalam menghitung koefisien reliabilitasnya. Setiap cara pembelahan

tes hendaknya mengusahakan agar antar belahan memiliki jumlah aitem sama

banyak, indeks kesukaran seimbang, isi sebanding, dan tujuan ukur yang sama

(48)

(a). Beberapa cara dalam pembelahan tes

i. Pembelahan cara random

Membelah tes menjadi dua bagian secara random dapat dilakukan dengan

cara undian sederhana guna menentukan aitem-aitem nomor berapa sajakah yang

dimasukkan menjadi belahan pertama dan yang mana menjadi belahan kedua.

Pembelahan secara random hanya boleh dilakukan bila tes yang akan dibelah

berisi aitem-aitem yang homogen baik dari segi konten maupun segi indeks

kesukaran aitem, namun jika aitem tersebut heterogen dapat juga menggunakan

cara pembelahan ini asalkan aitem tersebut jumlahnya sangat besar (Azwar,

2005).

ii. Pembelahan gasal-genap

Pembelahan gasal-genap dilakukan dengan cara mengelompokkan seluruh

aitem yang bernomor urut gasal menjadi belahan pertama dan seluruh aitem yang

bernomor urut genap dijadikan satu kelompok belahan kedua. Cara pembelahan

ini selain mudah dilakukan juga dapat menghindari kemungkinan terjadinya

pengelompokkan aitem-aitem tertentu ke dalam salah satu belahan saja (Azwar,

2005).

iii. Pembelahan matched-random subtes

Pembelahan dengan cara matched-random subtes ditemukan oleh

Gulikksen tahun 1950 (dalam Azwar, 2005). Sebelum melakukan pembelahan tes

terlebih dahulu harus dihitung indeks kesukaran aitem serta korelasi aitem dengan