PROCEEDING Seminar Nasional Psikometri EVALUASI KARAKTERISTIK PSIKOMETRI INTELLIGENZ STRUKTUR TEST (IST)

(1)

PROCEEDING Seminar Nasional Psikometri

EVALUASI KARAKTERISTIK PSIKOMETRI INTELLIGENZ STRUKTUR TEST (IST)

Etti Rahmawati Universitas Sumatera Utara [email protected]

ABSTRAK. Intelligenz Struktur Test (IST) merupakan satu dari banyak tes mengukur inteligensi yang masih sering digunakan meskipun usianya lebih dari 40 tahun sejak pertama sekali diadaptasi ke dalam versi Indonesia. Memastikan bahwa aitem-aitem IST masih memiliki kualitas yang baik untuk digunakan sebagai dasar pengambilan keputusan dirasakan perlu agar tidak terjadi kesalahan dalam pengambilan keputusan akibat penggunaannya. Penelitian ini bertujuan untuk mengevaluasi apakah IST masih memiliki kualitas yang baik dengan menganalisis tingkat kesukaran aitem, daya diskriminasi aitem, dan peluang tebakan semu menggunakan pendekatan item response theory dengan metode marginal maksimum likelihood menggunakan Program R. Pendekatan item response theory digunakan karena kemampuan teori ini mengestimasi karakteristik psikometri aitem tanpa tergantung oleh karakteristik peserta, dan sebaliknya karakteristik peserta tanpa tergantung pada karakteristik psikometri aitem sehingga dapat menghasilkan pengukuran yang equivalen pada peserta dari berbagai kelompok penelitian yang berbeda dan lebih dapat dipercaya. Hasil analisis menunjukkan bahwa 53.125% dari aitem-aitem IST yang dianalisis memiliki karakteristik psikometri yang kurang baik menurut batasan psikometri.

Kata kunci : Karakteristik Psikometri, Item Response Theory, Intelligenz Struktur Test (IST)

A. Latar Belakang

Hasil pengukuran yang dapat dipercaya, diperoleh dari tes yang memiliki kualitas yang dapat dipercaya. Memastikan bahwa tes yang kita gunakan memiliki kualitas yang baik adalah merupakan keharusan. Terlebih pada tes-tes yang hasilnya akan dipergunakan sebagai dasar pengambilan keputusan untuk menentukan posisi penting individu seperti dalam pelaksanaan rekrutmen, penempatan, baik dalam setting pendidikan maupun organisasi. Penggunaan tes dalam bidang Psikologi adalah suatu yang sangat sering dilakukan dalam pengambilan keputusan. Bahkan tidak jarang, hasil dari tes yang dilakukan digunakan sebagai satu-satunya pertimbangan dalam mengambil keputusan. Tes yang masih sangat sering digunakan sampai saat ini berdasarkan pengamatan peneliti, terutama adalah Intelligenz Srukture Test (IST). IST pernah dievaluasi melalui penelitian yang dilakukan oleh beberapa peneliti dari Fakultas Psikologi Universitas Sumatera Utara pada tahun 2011. Evaluasi

karakteristik IST yang telah dilakukan menggunakan pendekatan teori klasik.

Pendekatan yang digunakan dalam evaluasi karakteristik psikometris sebuah tes juga menentukan hasil evaluasi. Meskipun pendekatan teori klasik merupakan pendekatan yang memiliki dasar yang sangat kuat tetapi ada beberapa keterbatas yang dimiliki yang akan mempengaruhi parameter yang diestimasi. Sebuah pendekatan yang relatif lebih baru melengkapi teori tes klasik dalam bidang pengukuran. Pendekatan yang dikenal dengan Item Response Theory, melengkapi teori tes klasik dengan mengatasi ketergantungan ukuran ciri peserta terhadap ciri aitem, serta ketergantungan ukuran ciri aitem terhadap peserta tes. Sehingga dapat menghasilkan pengukuran yang equivalen pada peserta dari berbagai kelompok eksperimen yang berbeda. Hal ini memiliki peranan yang sangat penting untuk melihat perbedaan pada suatu atribut dalam penelitian lintas budaya.

(2)

PROCEEDING Seminar Nasional Psikometri Intelligenz Struktur Test (IST)

merupakan satu dari banyak tes yang masih sering digunakan. Dengan demikian, memastikan apakah IST masih memiliki kualitas yang baik dan apakah tes ini benar-benar presisi digunakan sebagai dasar pengambilan keputusan dirasakan perlu agar tidak terjadi kesalahan dalam pengambilan keputusan akibat penggunaannya. Mengingat evaluasi yang telah dilakukan masih menggunakan pendekatan teori klasik maka dirasa belum cukup untuk memastikan kualitas IST. Oleh karena itu, penelitian ini dilakukan untuk mengevaluasi karakteristik IST menggunakan pendekatan item response theory.

B. Kajian Pustaka

1. Teori Respons Aitem

Item response theory mendasarkan diri pada sifat-sifat atau kemampuan laten yang mendasari kinerja atau performansi peserta terhadap aitem tes tertentu. Hambleton, dkk (1991) mengemukakan bahwa item response theory bersandar pada 2 postulat dasar, yaitu :

a. Performansi peserta dalam suatu tes dapat diprediksi dengan sekumpulan faktor yang disebut trait, ciri laten atau kemampuan.

b. Hubungan antara performansi peserta dengan sekumpulan trait yang mendasarinya dapat digambarkan dengan fungsi yang meningkat secara monoton yang disebut item characteristic curve (ICC). Fungsi ini menunjukkan bahwa bila terjadi peningkatan trait, probabilitas jawaban benar juga meningkat.

Asumsi Item Response Theory

Sebelum menggunakan item response theory, ada beberapa asumsi yang harus dipenuhi untuk menentukan apakah item response theory merupakan tehnik yang tepat untuk digunakan. Menurut Hambleton, dkk (1991), Naga (1992), Scheuneman dan Bleistein (1989) asumsi yang harus dipenuhi adalah unidimensi, independensi lokal, dan item characteristic curve (ICC).

1). Unidimensi

Item response theory mensyaratkan setiap aitem hanya mengukur satu ciri peserta. Unidimensi diukur sebagai derajat ketergantungan suatu aitem secara statistik. Ketergantungan diartikan sebagai trait atau kemampuan tunggal (Crocker & Algina, 1986).

2). Independensi lokal

Bila menggunakan item response theory, diasumsikan bahwa respon pada aitem yang satu bebas dari pengaruh respon pada aitem lain jika kemampuan yang mempengaruhi performansi dibuat konstan. Sehingga jika kemampuan disamakan pada aitem, aitem tidak saling berhubungan (Hambleton, dkk, 1991).

Asumsi independensi lokal terpenuhi jika asumsi unidimensi terpenuhi. Namun asumsi independensi lokal dapat terpenuhi pada tes meskipun asumsi unidimensi tidak terpenuhi. Menurut Fennessy, dkk, Thissen, dkk, Steinberg dan Mooney, jika independensi lokal tidak terpenuhi maka hasil estimasi parameter aitem, parameter kemampuan, dan statistik tes yang lain tidak akurat (Zenisky, dkk, 2003)

3). Kurva karakteristik aitem

Item characteristic curve (ICC) dapat merefleksikan hubungan yang sebenarnya antara kemampuan dan respon peserta terhadap aitem tes, oleh karena itu parameter aitem dan parameter peserta harus invarian. (Naga, 1992).

a. Parameter-Parameter dalam Item Response Theory

Item characteristic curve (ICC) dalam item response theory dibentuk dengan tiga unsur, yaitu parameter aitem, parameter peserta dan jawaban peserta terhadap aitem. Sementara itu jawaban peserta terhadap aitem ditentukan oleh parameter aitem dan parameter peserta. Parameter aitem terdiri dari tingkat kesulitan aitem yang dilambangkan dengan b, daya beda aitem yang dilambangkan dengan a dan peluang tebakan semu yang dilambangkan dengan c,

(3)

PROCEEDING Seminar Nasional Psikometri sedangkan parameter peserta dilambangkan

dengan theta () dan respon peserta terhadap aitem dinyatakan dalam bentuk probabilitas menjawab benar yang dilambangkan dengan Pi () (Naga, 1992).

1). Parameter kemampuan ()

Kemampuan peserta tidak dapat diukur secara langsung, oleh karena itu kemampuan diestimasi lewat respon peserta terhadap suatu aitem. Hal ini yang menyebabkan  sering disebut sebagai kemampuan laten yang mendasari suatu tes. Pada item response theory, parameter  membentuk suatu kontinum. Secara teoritis nilainya membentang dari negatif tidak terhingga sampai positif tidak terhinggga. Tetapi secara praktis nilai yang dianggap cukup berarti terletak antara - 4 sampai + 4 (Naga, 1992). 2). Parameter tingkat kesukaran aitem (b) Parameter kesulitan aitem merupakan parameter lokasi yang menunjukkan posisi item characteristic curve (ICC) dalam skala kemampuan. Bila nilai b lebih besar, lebih besar kemampuan yang diperlukan peserta untuk dapat menjawab aitem dengan benar, yang berarti aitem lebih sulit. Item characteristic curve (ICC) pada aitem yang lebih sulit berada disebelah kanan atau semakin tinggi kemampuan yang dibutuhkan untuk menjawab aitem dengan benar, letak KKA semakin kekanan. Semakin mudah aitem atau semakin rendah kemampuan letak KKA semakin kekiri (Hambleton dkk, 1991). Menurut Hambleton dan Swaminathan (1985) nilai b bergerak dari -2 sampai dengan +2.

3). Parameter daya diskriminasi aitem (a) Dalam prakteknya, indeks Daya diskriminasi aitem menunjukkan seberapa baik suatu aitem dapat membedakan antara peserta yang memiliki kemampuan yang tinggi dan peserta yang memiliki kemampuan yang rendah. Nilai daya diskriminasi aitem bergerak dari 0 sampai dengan 2 (Hambleton, dkk, 1991).

4). Parameter peluang tebakan semu (c)

Parameter c melambangkan probabilitas peserta yang memiliki kemampuan rendah dapat menjawab aitem sulit dengan benar. Secara umum disebut juga dengan parameter tebakan karena diasumsikan peserta dapat menjawab aitem dengan benar dengan cara menebak. Secara teoritis, nilai c bergerak dari 0 sampai dengan 1. Tetapi menurut Baker (2001) nilai c di atas 0,35 tidak dapat diterima.

b. Model-Model dalam Item

Response Theory

Parameter aitem dan parameter peserta dihubungkan dengan suatu model rumus yang dikenal dengan fungsi karakteristik aitem (item characteristic function) oleh karena itu setelah semua asumsi dasar dipenuhi, dipilih model item response theory yang akan digunakan. Untuk menentukan model yang tepat, perlu dibuat asumsi tentang fungsi karakteristik aitem. Asumsi ini akan membantu menentukan jumlah parameter yang dibutuhkan dalam model yang digunakan (Harvey & Thomas, 1996). Kemudian parameter tersebut digunakan untuk memperoleh item characteristic curve (ICC). Model-model item response theory yang sering digunakan adalah model logistik 1, 2, dan 3 parameter (Hambleton, dkk, 1991).

1). Model logistik 1 parameter

Model Logistik 1 parameter sering juga disebut model Rasch. Sesuai dengan namanya dalam model ini hanya menggunakan parameter b untuk membedakan antar aitem. Dalam model logistik 1 parameter diasumsikan hanya kesulitan aitem sebagai karakter yang mempengaruhi performansi peserta. Dengan demikian, parameter a dan parameter c diasumsikan konstan untuk semua aitem. 2). Model logistik 2 parameter

Model logistik 2 parameter mirip dengan model logistik 1 parameter. Hanya ada penambahan 2 elemen dalam bentuk matematikanya, yaitu parameter daya beda (a) dan D. D adalah faktor penskalaan,

(4)

PROCEEDING Seminar Nasional Psikometri sehingga skala menjadi cocok dengan

distribusi kumulatif normal atau fungsi ogive normal (Hambleton, dkk, 1991). Untuk memperoleh model logistik yang sangat dekat dengan model ogive normal diperlukan nilai D = 1,702, karena dengan nilai D = 1,702 selisih antara model ogive normal dengan model logistik kurang dari 0,01, sehingga kita dapat mengalihkan perhitungan model ogive normal ke perhitungan model logistik.

3). Model logistik 3 parameter

Pada model tes pilihan berganda, peserta mungkin untuk menebak jawaban yang benar. Berbagai kemungkinan tebakan menyebabkan seseorang dengan kemampuan yang sangat rendah dapat menjawab aitem dengan benar. Bahkan ketika mereka memiliki probabilitas mejawab aitem dengan benar yang sangat rendah pada tingkat kemampuan mereka (Harvey & Thomas, 1996). Dengan alasan ini, Birbaum pada tahun 1968 (Johnson, 2004) mengembangkan generalisasi model logistik 2 parameter yang fungsi respon aitemnya memiliki asymtot tidak mendekati nol.

c. Kecocokan Model

Alasan utama pemilihan suatu model tertentu adalah kecocokannya dengan keadaan data yang sebenarnya serta seberapa rinci model tersebut mampu menggambarkan keadaan data yang sebenarnya. Setelah model kita pilih, maka seluruh analisis akan didasarkan pada model tersebut. Suryabrata (2004) mengemukakan bahwa model-model respon aitem pada item response theory dapat palsu, artinya suatu model respon aitem dapat cocok dengan suatu perangkat data tes tertentu dapat pula tidak, jadi model tersebut mungkin tidak dapat secara baik menjelaskan data yang ada. Oleh karena itu, setiap penerapan item response theory merupakan hal yang esensial untuk menguji kesesuaian model dengan data yang ada.

2. Intelligenz Struktur Test (IST)

Intelligenz Struktur Test (IST) merupakan tes kecerdasan yang disusun berdasarkan model structural kecerdasan. ). IST yang saat ini banyak digunakan di Indonesia adalah IST versi 70 hasil adaptasi Fakultas Psikologi Universitas Padjadjaran pada tahun 1973, yang dikonstruk oleh Rudolf Amthauer di Frankfurt Jerman pada tahun 1953 dan telah mengalami beberapa kali revisi. Subtes dalam IST 70 adalah Satzergänzung (SE) melengkapi kalimat, Wortauswahl (WA) persamaan kata, Analogien (AN) analogi verbal, Gemeinsamkeiten (GE) sifat yang sama, Rechenaufgaben (RA) berhitung, Zahlenreihen (ZR) deret angka, Figurenauswahl (FA) pemilihan gambar/pemilihan bentuk, Würfelaufgaben (WU) tugas kubus/latihan balok, dan Merkaufgaben (ME) ingatan (LPSP3 UI, 2012).

C. Metode Penelitian

Data yang digunakan dalam penelitian ini adalah respon jawaban IST dari peserta yang mengikuti tes di Pusat Penelitian dan Pengabdian Kepada Masyarakat (P3M) Universitas Sumatera Utara. Parameter diestimasi dengan menggunakan pendekatan item response theory dengan metode estimasi marginal maximum likelihood menggunakan program R versi 2.9.

D. Diskusi Dan Pembahasan 1. Hasil Penelitian

a. Hasil Analisis Uji Kecocokan Model Hasil analisis uji kecocokan model pada kedelapan subtes IST disajikan pada Tabel 1.

Tabel.1 Hasil Uji Kecocokan Model

No Subtes Model 1 SE 3PL 2 WA 2PL 3 AN 3PL 4 RA 3PL 5 ZR 3PL 6 FA 3PL 7 WU 3PL 8 ME 3PL

(5)

PROCEEDING Seminar Nasional Psikometri Berdasarkan hasil analisis diketahui bahwa

data pada ke tujuh subtes IST dapat dijelaskan dengan baik oleh model 3 PL dan 1 subtes dengan model 2 PL.

b. Hasil Analisis Parameter Aitem

Hasil analisis parameter aitem yang meliputi indeks kesukaran aitem, indeks daya diskriminasi aitem, dan peluang tebakan

pada masing-masing subtes IST menggunakan metode Marginal Maksimum Likelihood disajikan berikut ini :

1) Subtes SE

Hasil analisis pada aitem-aitem subtes SE ditemukan bahwa 5 aitem subtes SE memiliki tingkat kesukaran diatas 2.00, 5 aitem memiliki indeks daya diskriminasi diatas 2.00, dan tidak ada aitem yang memiliki nilai peluang tebakan diatas 0.35. Rangkuman hasil analisis disajikan pada Tabel 2.

Tabel 2. Karakteristik Psikometris Aitem Subtes SE Aite

m PT Ket

IK

A Ket IDD Ket

Aite

m PT Ket

IK

A Ket IDD Ket

1 0 dtr m -0.27 8 dtr m 0.67 9 dtr m 11 0 dtr m -0.15 7 dtr m 1.14 6 dtr m 2 0 dtr m -1.11 9 dtr m 3.13 dtl k 12 0 dtr m 2.78 7 dtl k 0.48 6 dtr m 3 0 dtr m -1.10 5 dtr m 2.18 1 dtl k 13 0.11 8 dtr m 0.63 1 dtr m 1.24 dtr m 4 0 dtr m -1.05 7 dtr m 5.12 2 dtl k 14 0 dtr m 0.18 6 dtr m 0.99 1 dtr m 5 0.17 5 dtr m 1.78 9 dtr m 2.51 4 dtl k 15 0.08 6 dtr m 2.53 9 dtl k 1.02 9 dtr m 6 0 dtr m -0.18 4 dtr m 0.95 4 dtr m 16 0.14 8 dtr m 2.21 4 dtl k 8.66 dtl k 7 0.15 8 dtr m 1.40 7 dtr m 1.33 6 dtr m 17 0 dtr m 2.28 5 dtl k 0.51 3 dtr m 8 0 dtr m 0.44 1 dtr m 0.76 2 dtr m 18 0.11 5 dtr m 2.59 6 dtl k 1.22 1 dtr m 9 0.13 7 dtr m 0.17 7 dtr m 1.51 3 dtr m 19 0.01 9 dtr m 0.91 6 dtr m 1.13 1 dtr m 10 0 dtr m -0.34 7 dtr m 1.53 7 dtr m 20 0.15 2 dtr m 1.92 8 dtr m 1.51 4 dtr m Keterangan : PT = Peluang Tebakan; IKA = Indeks Kesukaran A; IDD = Indeks Daya

Diskriminasi Aitem 2) Subtes WA

Hasil estimasi karakteristik aitem-aitem subtes WA didapatkan bahwa 5 aitem memiliki tingkat kesukaran lebih kecil dari

-2.00 dan2 aitem diatas 2.00 serta 3 aitem memiliki indeks daya diskriminasi lebih kecil dari nol. Rangkuman hasil analisis disajikan pada Tabel 3.

(6)

Aitem IKA Ket IDD Ket Aitem IKA Ket IDD Ket

21 -0.689 dtrm 1.075 dtrm 31 -147.285 dtlk -0.281 Dtlk 22 -2.32 dtlk 1.198 dtrm 32 0.951 dtrm 0.852 Dtrm 23 -2.544 dtlk -0.825 dtlk 33 1.791 dtrm 0.43 Dtrm 24 -1.326 dtrm 1.36 dtrm 34 -0.994 dtrm 0.524 Dtrm 25 -1.838 dtrm 0.897 dtrm 35 -122.708 dtlk -0.007 Dtlk 26 -1.314 dtrm 1.209 dtrm 36 0.875 dtrm 0.89 Dtrm 27 -1.44 Dtrm 0.924 dtrm 37 -1.349 dtrm 0.233 Dtrm 28 -2.751 Dtlk 0.318 dtrm 38 32.049 dtlk 0.074 Dtrm 29 0.629 Dtrm 0.543 dtrm 39 1.364 dtrm 0.575 Dtrm 30 -1.152 Dtrm 1.494 dtrm 40 13.892 dtlk 0.172 Dtrm Keterangan : IKA = Indeks Kesukaran Aitem; IDD = Indeks Daya Diskriminasi Aitem

3) Subtes AN

Hasil estimasi karakteristik aitem subtes AN bahwa keseluruhan aitem memiliki peluang tebakan dibawah 0.35, sebanyak 5 aitem memiliki tingkat kesukaran diatas 2.00

dan 1 lebih kecil dari -2.00. Serta 6 aitem memiliki indeks daya diskriminasi diatas 2.00. Rangkuman hasil analisis disajikan pada Tabel 4.

Tabel 4. Karakteristik Psikometris Aitem Subtes AN Aite m PT Ket IK A Ke t IDD Ke t Aite m PT Ke t IK A Ke t IDD Ke t 41 0 Dtr m -1.16 5 dtr m 3.14 6 dtl k 51 0.18 3 dtr m 0.82 1 dtr m 2.78 6 dtl k 42 0 Dtr m -0.83 7 dtr m 0.73 1 dtr m 52 0.01 7 dtr m 1.70 3 dtr m 1.60 8 dtr m 43 0 Dtr m -1.01 9 dtr m 1.57 4 dtr m 53 0.09 5 dtr m 1.97 7 dtr m 2.96 1 dtl k 44 0.03 7 Dtr m -0.74 9 dtr m 1.71 3 dtr m 54 0.06 6 dtr m 0.95 2 dtr m 1.30 3 dtr m 45 0 dtr m -0.45 2 dtr m 1.85 9 dtr m 55 0.10 3 dtr m 2.00 5 dtr m 2.01 8 dtr m 46 0.00 6 dtr m -2.66 9 dtl k -1.16 5 dtr m 56 0.11 7 dtr m 1.88 7 dtr m 2.52 9 dtl k 47 0.12 dtr 0.17 dtr 3.32 dtl 57 0.13 dtr 3.19 dtl 0.82 dtr

(7)

4 m 5 m 4 k 8 m 5 k m 48 0 dtr m 0.69 2 dtr m 0.49 4 dtr m 58 0.00 2 dtr m 8.00 5 dtl k 0.17 3 dtr m 49 0.12 5 dtr m 3.13 9 dtl k 0.53 3 dtr m 59 0.09 5 dtr m 2.31 4 dtl k 2.04 8 dtr m 50 0.15 8 dtr m 1.14 4 dtr m 2.54 4 dtl k 60 0.11 9 dtr m 2.65 8 dtl k 1.64 dtr m Keterangan : PT = Peluang Tebakan; IKA = Indeks Kesukaran A; IDD = Indeks Daya

Diskriminasi Aitem 4) Subtes RA

Hasil estimasi karakteristik aitem-aitem subtes RA bahwa keseluruhan aitem memiliki peluang tebakan dibawah 0.35, 4 aitem yang memiliki tingkat kesukaran diatas

2.00 dan 1 lebih kecil dari -2.00. serta 10 aitem memiliki indeks daya diskriminasi diatas 2.00. Rangkuman hasil analisis disajikan pada Tabel 5.

Tabel 5. Karakteristik Psikometris Aitem Subtes RA

Aitem PT Ket IKA Ket IDD Ket Aitem PT Ket IKA Ket IDD Ket

77 0 dtrm -2.952 dtlk 1.075 dtrm 87 0 dtrm 0.887 dtrm 1.934 dtrm 78 0.064 dtrm -0.857 dtrm 1.376 dtrm 88 0.011 dtrm 1.196 dtrm 3.829 dtlk 79 0 dtrm 0.385 dtrm 1.31 dtrm 89 0.003 dtrm 1.445 dtrm 3.407 dtlk 80 0 dtrm 0.907 dtrm 1.516 dtrm 90 0.009 dtrm 1.277 dtrm 3.21 dtlk 81 0 dtrm -0.528 dtrm 1.978 dtrm 91 0.006 dtrm 1.612 dtrm 4.064 dtlk 82 0 dtrm 0.628 dtrm 1.99 dtrm 92 0.003 dtrm 1.633 dtrm 3.883 dtlk 83 0 dtrm -0.101 dtrm 1.07 dtrm 93 0.003 dtrm 2.374 dtlk 3.72 dtlk 84 0 dtrm 0.558 dtrm 2.388 dtlk 94 0.003 dtrm 2.139 dtlk 3.622 dtlk 85 0.014 dtrm 1.155 dtrm 2.076 dtlk 95 0.004 dtrm 2.133 dtlk 2.899 Dtlk 86 0.01 dtrm 1.902 dtrm 1.985 dtrm 96 0 dtrm 3.089 dtlk 1.984 Dtrm

Keterangan : PT = Peluang Tebakan; IKA = Indeks Kesukaran A; IDD = Indeks Daya Diskriminasi Aitem

5) Subtes ZR

Hasil estimasi karakteristik aitem subtes ZR bahwa keseluruhan aitem memiliki peluang tebakan dibawah 0.35, hanya 1 aitem yang memiliki tingkat

kesukaran lebih kecil dari -2.00 dan 10 aitem memiliki indeks daya diskriminasi diatas 2.00. Rangkuman hasil analisis disajikan pada Tabel 6.

(8)

Tabel 6. Karakteristik Psikometris Aitem Subtes ZR Aite m PT Ke t IK A Ke t ID D Ke t Aite m PT Ke t IK A Ke t ID D Ke t 97 0 dtr m -2.22 4 dtl k 1.67 1 dtr m 107 0.01 4 dtr m -0.09 dtr m 2.37 3 dtl k 98 0 dtr m -1.37 4 dtr m 1.85 1 dtr m 108 0.02 1 dtr m 0.14 4 dtr m 1.40 3 dtr m 99 0 dtr m -1.19 4 dtr m 1.83 6 dtr m 109 0.06 dtr m 0.38 dtr m 2.19 9 dtl k 100 0 dtr m -1.24 5 dtr m 2.37 1 dtl k 110 0.01 3 dtr m 0.75 dtr m 3.03 5 dtl k 101 0 dtr m -0.43 3 dtr m 1.14 4 dtr m 111 0.04 9 dtr m 0.67 1 dtr m 2.85 3 dtl k 102 0 dtr m -0.74 3 dtr m 1.82 7 dtr m 112 0 dtr m 0.85 5 dtr m 2.47 5 dtl k 103 0.01 7 dtr m 0.30 6 dtr m 1.62 5 dtr m 113 0 dtr m 1.14 1 dtr m 1.72 1 dtr m 104 0.02 3 dtr m 0.62 8 dtr m 2.11 dtl k 114 0.04 dtr m 1.34 7 dtr m 2.49 2 dtl k 105 0 dtr m 0.52 4 dtr m 1.08 6 dtr m 115 0.01 3 dtr m 1.38 3 dtr m 3.17 8 dtl k 106 0 dtr m -0.32 5 dtr m 1.91 8 dtr m 116 0.03 dtr m 1.3 dtr m 2.70 5 dtl k Keterangan : PT = Peluang Tebakan; IKA = Indeks Kesukaran A; IDD = Indeks Daya

Diskriminasi Aitem 6) Subtes FA

Hasil estimasi karakteristik pada aitem-aitem subtes FA diketahui 4 aitem memiliki peluang tebakan diatas 0.35, sebanyak 2 aitem memiliki tingkat

kesukaran di atas 2.00 dan hanya 1 lebih kecil dari -2.00. Dua aitem memiliki indeks daya diskriminasi diatas 2.00 dan 1 aitem lebih kecil dari nol. Rangkuman hasil analisis disajikan pada Tabel 7.

Tabel 7. Karakteristik Psikometris Aitem Subtes FA

(9)

m t A t D t m t A t D t 117 0.71 9 dtl k -0.53 dtr m 1.30 3 dtr m 127 0.18 5 dtr m 1.66 4 dtr m 1.86 6 dtr m 118 0.44 3 dtl k -0.03 4 dtr m 1.82 8 dtr m 128 0.14 dtr m 1.82 3 dtr m 3.85 2 dtl k 119 0.31 4 dtr m 1.24 9 dtr m 0.72 7 dtr m 129 0.00 3 dtr m -1.22 8 dtr m 1.46 5 dtr m 120 0.18 1 dtr m 0.93 6 dtr m 1.49 2 dtr m 130 0.43 2 dtl k 1.48 dtr m 1.81 dtr m 121 0.00 3 dtr m -1.58 4 dtr m 0.94 9 dtr m 131 0 dtr m -1.27 dtr m 1.09 3 dtr m 122 0.42 1 dtl k 0.58 8 dtr m 8.16 9 dtl k 132 0.05 3 dtr m 2.89 4 dtl k 1.62 6 dtr m 123 0.30 8 dtr m 0.42 6 dtr m 1.94 4 dtr m 133 0 dtr m -0.89 8 dtr m 1.00 4 dtr m 124 0.27 1 dtr m 0.68 8 dtr m 1.27 dtr m 134 0.00 1 dtr m -0.77 8 dtr m 0.59 7 dtr m 125 0.00 4 dtr m -1.65 5 dtr m 0.82 3 dtr m 135 0.00 7 dtr m 5.93 5 dtl k 0.26 4 dtr m 126 0.00 1 dtr m -0.50 1 dtr m 0.80 9 dtr m 136 0.00 2 dtr m -5.16 2 dtl k -0.88 2 dtl k Keterangan : PT = Peluang Tebakan; IKA = Indeks Kesukaran A; IDD = Indeks Daya

Diskriminasi Aitem 7) Subtes WU

Hasil estimasi karakteristik aitem subtes WU diketahui terdapat 1 aitem memiliki peluang tebakan diatas 0.35 dengan keseluruhan aitem memiliki indeks

kesukaran diatas -2.00 dan lebih kecil dari 2.00. Serta terdapat 15 aitem yang memiliki indeks daya diskriminasi lebih besar dari 2.00. Rangkuman hasil analisis disajikan pada Tabel 8.

Tabel 8. Karakteristik Psikometris Aitem Subtes WU Aitem PT Ke t IK A Ke t ID D Ke t Aite m PT Ket IK A Ke t ID D Ke t 137 _0.47 _dtl -0.12 dtr 3.40 dtl 147 0 _Dtr -0.41 dtr 2.38 dtl

(10)

9 k 9 m 1 k m 1 m 5 k 138 0.00 1 dtr m -0.56 6 dtr m 1.95 3 dtr m 148 0.21 8 Dtr m 1.27 6 dtr m 8.72 9 dtl k 139 0 dtr m -0.59 8 dtr m 2.15 9 dtl k 149 0.09 5 Dtr m 1.36 8 dtr m 1.57 5 dtr m 140 0.01 5 dtr m -0.76 1 dtr m 2.79 8 dtl k 150 0 Dtr m -0.20 7 dtr m 1.76 5 dtr m 141 0.18 2 dtr m 1.39 8 dtr m 5.04 2 dtl k 151 0.22 1 Dtr m 1.25 1 dtr m 4.69 2 dtl k 142 0 dtr m -0.25 8 dtr m 1.81 2 dtr m 152 0.14 8 Dtr m 1.51 3 dtr m 3.6 dtl k 143 0.00 2 dtr m -0.71 8 dtr m 1.95 3 dtr m 153 0.11 2 Dtr m 1.55 5 dtr m 4.77 4 dtl k 144 0.17 7 dtr m 1.19 6 dtr m 3.26 9 dtl k 154 0.15 9 Dtr m 1.56 dtr m 3.79 3 dtl k 145 0 dtr m -0.54 5 dtr m 2.15 dtl k 155 0.16 6 Dtr m 1.60 6 dtr m 5.47 dtl k 146 0.28 7 dtr m 0.17 1 dtr m 2.07 9 dtl k 156 0.13 8 Dtr m 1.71 7 dtr m 4.94 3 dtl k Keterangan : PT = Peluang Tebakan; IKA = Indeks Kesukaran Aitem; IDD = Indeks Daya

Diskriminasi Aitem 8) Subtes ME

Hasil estimasi karakteristik aitem-aitem subtes ME diketahui keseluruhan aitem memiliki peluang tebakan dibawah 0.35 serta memiliki indeks kesukaran lebih besar dari

-2.00 dan lebih kecil dari -2.00. Empat belas aitem memiliki indeks daya diskriminasi diatas 2.00. Rangkuman hasil analisis disajikan pada Tabel 9.

(11)

Tabel 9. Karakteristik Psikometris Aitem Subtes ME

Aitem PT Ket IKA Ket IDD Ket Aitem PT Ket IKA Ket IDD Ket 157 0 dtrm -0.364 dtrm 1.815 Dtrm 167 0.098 dtrm 0.171 dtrm 2.134 dtlk 158 0.057 dtrm -0.355 dtrm 1.804 Dtrm 168 0.08 dtrm 0.235 dtrm 2.792 dtlk 159 0.096 dtrm -0.331 dtrm 1.936 dtrm 169 0.037 dtrm -0.032 dtrm 2.225 dtlk 160 0 dtrm -0.55 dtrm 2.02 dtlk 170 0.017 dtrm -0.3 dtrm 2.141 dtlk 161 0 dtrm -0.332 dtrm 1.766 dtrm 171 0.124 dtrm -0.371 dtrm 2.533 dtlk 162 0 dtrm -0.737 dtrm 2.655 dtlk 172 0 dtrm -0.374 dtrm 2.007 dtrm 163 0.121 dtrm -0.465 dtrm 2.535 dtlk 173 0.031 dtrm -0.143 dtrm 2.13 dtlk 164 0 dtrm -0.942 dtrm 2.334 dtlk 174 0.06 dtrm 0.275 dtrm 2.845 dtlk 165 0.001 dtrm -0.35 dtrm 2.011 dtlk 175 0.07 dtrm 0.19 dtrm 2.967 dtlk 166 0.005 dtrm -0.223 dtrm 1.68 dtrm 176 0.062 dtrm 0.083 dtrm 2.335 dtlk Keterangan : PT = Peluang Tebakan; IKA = Indeks Kesukaran A; IDD = Indeks Daya

Diskriminasi Aitem

c. Rangkuman Hasil Estimasi Parameter Aitem

Berdasarkan hasil analisis parameter aitem pada masing-masing subtes, berikut

disajikan rangkuman hasil analisis aitem-aitem yang masuk dalam kategori memiliki parameter yang baik dan tidak baik berdasarkan batasan psikometris.

Tabel 10. Rangkuman Hasil Estimasi Parameter berdasarkan batasan parameter aitem Paramet er Batasan Nilai Keterang an SE W A AN RA ZR FA WU ME b -2 ≤ b ≤ 2 Baik 15 (75) 13 (65 ) 14 (70) 15 (75) 19 (95) 17 (85) 20 (100) 20 (100 ) b < -2, b > 2 Tidak Baik 5 (25) 7 (35 ) 6 (30) 5 (25) 1 (5) 3 (15) 0 (0) 0 (0) a 0 ≤ a ≤ 2 Baik 15 (75) 17 (85 ) 14 (70) 10 (50) 10 (50) 17 (85) 5 (25) 6 (30)

(12)

PROCEEDING Seminar Nasional Psikometri a < 0, a > 2 Tidak Baik 5 (25) 3 (15 ) 6 (30) 10 (50) 10 (50) 3 (15) 15 (75) 14 (70) c 0 ≤ c ≤ 0.35 Baik 20 (100) - 20 (100) 20 (100) 20 (100) 16 (80) 19 (95) 20 (100 ) c > 0.35 Tidak Baik 0 (0) - 0 (0) 0 (0) 0 (0) 4 (20) 1 (5) 0 (0) Keterangan : angka di dalam kurung dalam persentase

Tabel 11 merangkum hasil analisis aitem berdasarkan batasan parameter daya beda

aitem, tingkat kesulitan aitem, dan peluang tebakan secara bersama-sama

tabel 11. Rangkuman hasil estimasi parameter berdasarkan batasan ketiga parameter aitem Parameter Keterang an SE WA AN RA ZR FA WU ME Total -2 ≤ b ≤ 2; 0 ≤ a ≤ 2; 0 ≤ c ≤ 0.35 Baik 11 (0.55) 13 (0.65 ) 8 (0.40 ) 9 (0.45) 9 (0.45) 12 (0.6) 5 (0.25 ) 6 (0.30 ) 73 (0.45 6) b < -2 atau b > 2; a < 0 atau a > 2; c > 0.35 Tidak Baik 9 (0.45) 7 (0.35 ) 12 (0.6) 11 (0.55) 11 (0.55) 8 (0.4) 15 (0.75 ) 14 (0.7) 87 (0.54 4) Keterangan : angka di dalam kurung dalam persentase

2. Pembahasan

Sebagai alat tes yang masih sangat sering digunakan dalam berbagai tujuan terutama dalam seleksi baik dalam bidang pendidikan maupun lingkungan organisasi, IST masih sangat harus diperhatikan. Karena berdasarkan analisis karakteristik dengan metode Marginal Maksimum Likelihood menggunakan pendekatan item response theory ditemukan bahwa 41.25% dari 160 aitem IST yang dianalisis memiliki indeks daya diskriminasi yang masuk dalam kategori tidak baik, 16.87 % dari 160 memiliki tingkat kesukaran dalam kategori tidak baik dan 3.57% memiliki peluang tebakan dalam kategori tidak baik.

Banyaknya aitem yang memiliki indeks daya diskriminasi yang kurang baik dapat membuktikan bahwa memang benar adanya dugaan bahwa alat tes ini sudah bocor di masyarakat sehingga aitem sudah tidak dapat berfungsi dengan baik untuk membedakan antara individu yang memiliki atribut yang sedang diukur. Hal ini sangat didukung oleh hasil estimasi terhadap peluang tebakan pada aitem-aitem IST. Dari 140 aitem, hanya 3.57% aitem yang

memiliki kecenderungan yang tinggi untuk dijawab oleh responden dengan benar dengan cara ditebak, pada hal terdapat 11.25% aitem yang memiliki indeks kesukaran yang sangat tinggi bahkan jauh dari ketentuan. Selain itu terdapat 5.625 % aitem yang memiliki indeks kesulitan yang sangat rendah bahkan mencapai -147.285 yaitu pada aitem nomor 31 pada subtes WA.

Berdasarkan hasil analisis dengan menggunakan kriteria peluang tebakan, indeks kesukaran aitem dan indeks daya diskriminasi secara bersama-sama diketahui bahwa dari 160 aitem yang dianalisis hanya 45.625% yang memiliki kualitas yang masih baik. Hal ini menunjukkan bahwa aitem-aitem IST sudah mengalami perubahan dari fungsinya saat dikonstrak. Salah satu penyebabnya adalah individu sudah familiar dengan aitem-aitemnya, hal ini dapat disebabkan oleh usia tes ini juga sudah hampir mencapai 40 tahun sejak pertama kali diadaptasi di Indonesia dan adanya dugaan adanya kebocoran di masyarakat. Dengan demikian penggunaan IST sebagai satu-satunya dasar

(13)

PROCEEDING Seminar Nasional Psikometri pertimbangan pengambilan keputusan

dalam seleksi benar-benar harus dipertimbangkan ulang.

E. Kesimpulan, Saran, Dan Keterbatasan Penelitian 1. Kesimpulan

Berdasarkan hasil analisis parameter aitem peluang tebakan, indeks kesukaran aitem, dan indeks daya diskriminasi aitem pada 2011 data subjek dengan metode estimasi marginal maksimum likelihood dengan pendekatan item response theory maka dapat disimpulkan bahwa 54.375% aitem IST yang dianalisis memiliki kualitas yang kurang baik menurut batasan psikometris.

2. Saran

Berdasarkan hasil penemuan dari penelitian ini, maka peneliti menyarankan beberapa hal :

1. Penggunaan IST sebagai satu-satunya dasar pertimbangan pengambilan keputusan dalam seleksi harus dihindari. 2. Melakukan revisi pada aitem-aitem IST

yang memiliki kualitas yang tidak baik jika penggunaan IST masih akan terus dilakukan.

3. Keterbatasan Penelitian

Pada penelitian ini hanya dilakukan analisis karakteristik psikometris aitem-aitem pada kedelapan subtes IST. Aitem-aitem subtes GE belum dianalisis bagaimana karakteristik psikometrinya, sehingga belum mendapat gambaran secara menyeluruh tentang kualitas aitem IST berdasarkan parameter daya beda aitem, tingkat kesulitan aitem, dan peluang tebakan.

DAFTAR PUSTAKA

Baker. F. B. (2001). The basics of item response theory. New York : Cleringhouse on Assessment and Evaluation.

Crocker. L. & Algina. J. (1986). Introduction to classical and modern test theory. New York : Holt, Rinehart and Winston, Inc.

Hambleton, R. K. (1989). Principles and selected applications of item response theory. In R. L. Linn (Ed.), Educational Measurement. 147–200.

Hambleton. R. K. & Swaminathan. H. (1985). Item response theory. Boston : Kluwer Nijhoff Publisher.

Hambleton. R. K., Swaminathan. H, & Rogers. H. J. (1991). Fundamentals of item response theory. California : SAGE Publication, Inc.

Harvey, R.J. & Thomas, L. A. (1996). Using item response theory to score the myers-briggs type indicator: rational and research findings. Journal of Psychological Type, 37, 16 -60.

Johnson. M. S. (2004). Aitem response models and their use in measuring food insecurity and hunger. City University of New York.

LPSP3 UI. (2012) . Intelligenz Struktur Test, Manual dan Norma. Jakarta. LPSP3 Fakultas Psikologi UI.

Naga. D. S. (1992). Pengantar Teori Skor. Jakarta. Gunadarma.

Scheuneman. J. D. & Bleistein. C. A. (1989). A Consumers’s guide to statistics for identifying differential item functioning. Applied Measurement in Education, 2 (3), 255-275.

Suryabrata. S. (2004). Pengembangan alat ukur psikologis. Yogyakarta: ANDI. Zenisky. A. L., Hambleton. R. K., & Robin. F. (2003). Detection of differential item functioning in large-scale state assessments: A Study evaluating a two-stage approach. Educational and Psychological