BAB II
TINJAUAN PUSTAKA
1. Revisi Tes
a. Definisi Revisi Tes
Revisi sebuah tes dapat dilakukan dalam berbagai bentuk. Butcher
(2000) mengungkapkan bahwa merubah isi tes seperti, perubahan tampilan
booklet, perubahan manual tes, menghapus aitem yang kurang baik,
menambah aitem, mengganti aitem, ataupun mengembangkan norma baru
dianggap sebagai perevisian sebuah tes. Beberapa tipe tes psikologi
berkemungkinan berisi aitem yang ketinggalan zaman ataupun membutuhkan
revisi yang lebih sering dibandingkan tes yang lain. Contohnya seperti tes
inteligensi, tes prestasi, ataupun tes minat yang aitem-aitemnya berpatokan
pada informasi yang berkembang di masa itu sehingga tentunya lebih sering
membutuhkan revisi dibandingkan tes kepribadian yang kontennya lebih
konstan sepanjang waktu (Butcher, 2000).
Beberapa faktor yang mempengaruhi kapan sebuah tes perlu direvisi
adalah keawetan konten tes dan popularitas tes (Murpy, 2003). Pertama,
keawetan konten tes. Banyak tes berisi aitem-aitem yang perlu diperbarui
terlebih dahulu agar tetap sesuai dengan perkembangan zaman. Apabila aitem
tidak revisi, maka individu akan kesulitan dalam memberikan jawaban karena
tidak memahami maksud aitem tersebut. Sehingga, merevisi aitem-aitem
Kedua, popularitas tes. Tes yang populer cenderung menjadi subjek
penelitian yang akhirnya memberikan informasi-informasi bermakna
mengenai sebuah tes. Informasi tersebut dapat berupa evaluasi karakteristik
psikometris, makna skor tes, ataupun generalisasi tes. Berdasarkan data-data
yang diperoleh, penelitian-penelitian tersebut sering menyarankan untuk
melakukan modifikasi konten, perubahan prosedur administrasi, ataupun
perubahan skoring tes (Murphy, 2003).
b. ProsedurRevisi Tes
Langkah-langkah dasar dalam penyusunan skala psikologi
memberikan gambaran alur kerja umum mengenai prosedur yang bisa
dilakukan untuk merevisi sebuah alat tes. Azwar (2010) membuat alur kerja
Gambar 1. Alur Kerja Penyusunan Skala Psikologi
Proses penyusunan skala psikologi diawali dengan memilih suatu
definisi dan mengenai teori yang mendasari konstrak psikologis atribut yang
hendak diukur, atau disebut juga dengan identifikasi tujuan ukur. Setelah
teridentifikasi, perlu dilakukan pembatasan domain ukur berdasarkan
konstrak yang bersangkutan dengan menguraikan komponen atau dimensi
Proses dilanjutkan dengan menentukan format stimulus yang akan
digunakan dengan mempertimbangkan kelebihan teoritis dan manfaat praktis
format yang hendak dipilih. Apabila indikator perilaku telah dirumuskan
dengan benar lalu disajikan dalam bentuk blue-print. Dalam penelitian,
keempat tahap tersebut tidak lagi dilakukan karena menggunakan
aspek-aspek yang telah ada sebelumnya.
Proses perevisian alat tes dalam penelitian ini dimulai dari tahap
kelima, yaitu penulisan aitem. Peneliti menulis aitem-aitem yang perlu
diubah ataupun diganti. Setiap aitem yang telah ditulis perlu diperiksa ulang
oleh penulis aitem apakah aitem tersebut telah sesuai dengan indikator yang
hendak diungkap dan sesuai pedoman penulisan aitem. Setelah seluruh aitem
ditulis, aitem akan di-review oleh beberapa orang yang kompeten mengenai
konstruksi skala dan masalah atribut yang diukur. Aitem-aitem yang tidak
sesuai perlu diperbaiki atau ditulis ulang sehingga aitem-aitem yang
diloloskan ke tahap uji coba hanyalah aitem-aitem yang diyakini akan
berfungsi dengan baik.
Kalimat-kalimat dalam aitem perlu diuji coba untuk melihat apakah
aitem tersebut dapat dipahami dengan jelas oleh subjek seperti yang
diinginkan oleh penulis aitem. Terkadang apa yang sudah jelas bagi penulis
aitem mungkin saja tidak cukup jelas bagi para subjek. Uji coba ini juga
dijadikan salah satu cara untuk memperoleh data respon yang akan digunakan
Selanjutnya, akan dilakukan analisis aitem yang merupakan pengujian
parameter-parameter aitem apakah sudah memenuhi persyaratan psikometris
untuk dimasukkan ke dalam skala. Hasil analisis aitem ini akan dijadikan
dasar dalam menseleksi aitem-aitem. Aitem-aitem yang tidak memenuhi
persyaratan psikometris akan disingkirkan atau diperbaiki terlebih dahulu.
Pengujian reliabilitas skala dilakukan terhadap aitem-aitem yang telah
lolos yang jumlahnya disesuaikan dengan blue-print. Proses validasi
umumnya merupakan proses yang berkelanjutan. Pada skala-skala yang akan
digunakan secara terbatas biasanya dilakukan uji validitas kriteria sedangkan
pada skala-skala yang akan digunakan secara luas biasnya dilakukan analisis
faktor.
Terakhir, format final skala harus disusun dengan tampilan yang
menarik dan mudah untuk dibaca oleh subjek. Skala juga harus dilengkapi
dengan petunjuk pengerjaan. Pemilihan huruf dan ukuran kertas juga harus
dipertimbangkan agar membuat subjek nyaman dalam menjawab
aitem-aitem.
Pada penelitian ini, proses revisi aitem akan dimulai dari tahap
penulisan aitem-aitem yang telah teridentifikasi perlu direvisi. Berdasarkan
penelitian-penelitian sebelumnya ditemukan bahwa terdapat 17 dari 20 aitem
yang ada di dalam subtes RA pada IST perlu direvisi, yaitu aitem nomor 77,
78, 80, 81, 82, 84, 85, 87, 88, 89, 90, 91, 92, 93, 94, 95, dan 96. Setelah aitem
ditulis dan dievaluasi oleh professional judgement, maka aitem-aitem tersebut
Apabila data telah diperoleh, aitem-aitem akan dianalisis mengenai
persyaratan psikometerisnya. Jika belum memenuhi, maka aitem akan
kembali ke tahap penulisan aitem hingga akhirnya memenuhi persyaratan
psikometris seperti yang diinginkan oleh peneliti. Aitem-aitem yang telah
lolos adalah aitem-aitem yang dimasukkan ke dalam format final skala.
2. Evaluasi Karakteristik Psikometris a. Teori Respon Butir
Pendekatan teori respon butir didasarkan pada sifat-sifat atau
kemampuan laten yang mendasari respon subjek terhadap aitem tertentu.
Teori respon butir, atau dikenal juga dengan latent trait theory, mengestimasi
tingkat trait berdasarkan respon subjek serta karakteristik aitem yang
diberikan (Embretson, 2000).
Teori respon butir diperkenalkan oleh Lord dan Novick pada tahun
1968 dan mulai mendominasi dasar teoritis sebuah pengukuran. Hal ini
dikarenakan teori respon butir memiliki prinsip pengukuran yang lebih
seimbang secara teoritis dan mampu mengatasi masalah-masalah pengukuran
dengan lebih baik. Prinsip-prinsip teori respon butir dapat digunakan untuk
menseleksi aitem mana yang paling tepat diberikan untuk seorang subjek dan
menghitung skor antar subset aitem yang berbeda (Embretson, 2000).
Banyak model teori respon butir yang sudah dikembangkan untuk
diaplikasikan pada berbagai bidang psikologi. Sehingga teori respon butir
gangguan prilaku, sikap, dan trait kognitif seperti inteligensi (Embretson,
2000).
1) Asumsi Teori Respon Butir
Teori Respon Butir memiliki beberapa asumsi kunci, yaitu Kurva
Karakteristik Aitem (KKA), independensi lokal, dan unidimensionalitas
(Embretson, 2000).
a) Kurva Karakteristik Aitem. Bentuk KKA menunjukkan bagaimana
hubungan antara perubahan kemampuan subjek dan perubahan responnya
terhadap aitem. Pada aitem dikotomi, yaitu sebuah respon tertentu akan
dianggap benar, KKA meregresi kemungkinan kesuksesan suatu aitem
pada tingkat kemampuan tertentu. Untuk aitem politomi, seperti skala
rating, KKA meregresi kemungkinan respon masing-masing kategori pada
tingkat kemampuan.
b) Asumsi independensi lokal. Hal ini menyangkut tentang kecukupan model
teori respon butir terhadap data. Independensi lokal diperoleh ketika
hubungan antar aitem atau antar subjek dikarakteristikkan sepenuhnya oleh
model teori respon butir. Independensi lokal juga dapat diperoleh ketika
kemungkinan menyelesaikan suatu aitem tidak beketergantungan dengan
aitem-aitem lainnya, adanya pengontrolan terhadap parameter subjek dan
parameter aitem.
c) Unidimensionalitas. Independensi lokal juga berhubungan dengan jumlah
variabel trait yang mendasari aitem. Independensi lokal akan menunjukkan
subjek hanya pada satu dimensi. Namun, independensi lokal juga bisa
dicapai dengan data multidimensi jika masing-masing dimensi memiliki
parameter subjek ataupun dengan data yang mana setiap aitem saling
beketergantungan.
2) Model Teori Respon Butir
Model teori respon butir dapat dikategorikan berdasarkan jumlah
respon yang diskor, yaitu dikomotomi dan politomi. Pada model dikotomi,
respon aitem diskor ke dalam dua kelompok yang menunjukkan sukses (1)
atau gagal (2). Aitem pilihan berganda juga termasuk ke dalam model
dikotomi karena walaupun memiliki banyak pilihan jawaban, namun jawaban
tetap di skor sebagai benar atau salah (Embretson, 2000).
Pada model politomi, sebuah aitem memiliki lebih dari dua pilihan
respon jawaban. Masing-masing respon tersebut memiliki nilai skor yang
berbeda-beda pula. Contohnya seperti aitem model Likert yang mana setiap
pilihan jawaban di skor dari rentang 1 sampai 5 (Embretson, 2000).
Teori respon butir memiliki 3 model fungsi distribusi logistik, yaitu
model logistik 1 parameter, model logistik 2 parameter, dan model logistik 3
parameter (Naga, 1992). Perbedaan tiga model ini terletak pada jumlah
parameter yang digunakan. Model paling sederhana dalam teori respon butir
adalah model logistik 1 parameter yang juga dikenal sebagai model Rasch.
Model Rasch hanya menggunakan parameter b atau kesulitan aitem untuk
membedakan antar aitem. Variabel independen dalam model ini adalah trait
adalah adalah respon dikotomi (sukses atau gagal, benar atau salah) dari
orang tertentu tentang suatu aitem. Terdapat dua versi variabel dependen,
yaitu log odds dan probability (Embretson, 2000).
Pada log odds dalam Rasch model, odds menunjukkan rasio jumlah
benar dengan jumlah berhasil (Embretson, 2000). Rasio ini terlihat dari
perbedaan antara trait score (Өs) dengan tingkat kesulitan aitem (βi).
Sehingga rasio kemungkinan berhasil untuk subjek s pada aitem i, yaitu Pis,
terhadap kemungkinan gagal, yaitu 1- Pis, ditunjukkan seperti di bawah ini.
In [Pis / (1 - Pis)] = Өs - βi (1)
Ketika tingkat kesulitan aitem meningkat, maka log odds akan
menurun. Ketika tingkat kesulitan aitem sama dengan trait level, log odds
akan bernilai 0. Jika trait level lebih besar daripada tingkat kesulitan aitem,
maka orang tersebut akan lebih mungkin untuk berhasil. Sebaliknya, jika
tingkat kesulitan aitem lebih besar daripada trait level, maka orang tersebut
lebih berkemungkinan untuk gagal (Embretson, 2000).
Terdapat beberapa ciri dari Rasch model seperti di bawah ini
(Embretson, 2000).
1. Estimasi trait level dapat dilakukan pada aitem manapun yang telah
diketahui tingkat kesulitan aitemnya.
2. Kedua properti aitem dan trait level berkaitan dengan perilaku karena
pada subjek dan aitem terdapat parameter-parameter yang terpisah.
3. Trait level dan properti aitem merupakan variabel independen yang
4. Probabilitas respon akan meningkat dengan menjumlahkan nilai
konstan ada trait level atau dengan membagi kesulitan aitem dengan
nilai konstan tersebut.
Pada versi probability, variabel dependen merupakan probabilitas
subjek s untuk berhasil pada aitem i, P(Xis=1). Fungsi logistik ini
memberikan prediksi sebagai berikut (Embretson, 2000).
Ө β Ө – β Ө – β (2)
Perbedaan versi ini dengan versi sebelumnya adalah variabel
dependen diprediksi sebagai probabilitas daripada sebagai log odds. Versi ini
juga dikenal sebagai model pengukuran 1 parameter. Salah satu kelebihan
versi ini yaitu probabilitas merupakan variabel dependen yang lebih familiar
dibandingkan rasio log odds. Dengan model ini karakter yang mempengaruhi
performansi subjek diasumsikan adalah hanya kesulitan aitem.
Model logistik 2 parameter memiliki dua elemen dalam bentuk
matematikanya, yaitu parameter daya beda (a) dan parameter kesulitan aitem
(b). Sedangkan, model logistik 3 parameter ditujukan pada aitem pilihan
berganda karena adanya tambahan parameter peluang tebakan (c).
Pada penelitian ini, model yang dipilih adalah model logistik 1
parameter untuk melihat parameter kesulitan aitem pada subtes RA dengan
alasan lebih praktis dan lebih mudah untuk dilakukan oleh peneliti. Metode
estimasi yang akan digunakan adalah metode kemungkinan maksimum
panjang tes maupun sampel dengan asumsi bahwa distribusi kemampuan
adalah normal.
3) Parameter Teori Respon Butir
Pada teori respon butir terdapat tiga unsur parameter yaitu paramater
aitem, parameter peserta dan parameter respon (Naga, 1992). Ketiga unsur ini
berhubungan sehingga menghasilkan fungsi atau Kurva Karakteristik Aitem.
Hal ini tampak dari respon peserta terhadap aitem yang berhubungan dengan
atau dapat ditentukan oleh ciri aitem atau ciri peserta yang bersangkutan.
Dalam hubungan ini, ciri peserta dinyatakan melalui parameter peserta (Ө),
ciri aitem dinyatakan melalui tiga parameter aitem a, b, dan c, serta ciri respon
dinyatakan dalam bentuk probabilitas jawaban benar (P(Ө)).
Parameter peserta (Ө) hanya bisa diukur melalui respon subjek
terhadap suatu aitem yang membentuk suatu kontinum. Secara teoritis, nilai
baku untuk parameter peserta membentang dari minus tak terhingga sampai
positif tidak terhingga. Namun secara praktis, nilai baku yang dianggap
berguna hanya terletak antara -4 sampai +4.
Parameter aitem a adalah parameter aitem yang berkaitan dengan daya
beda yaitu kemampuan aitem untuk mempertegas perbedaan subjek yang
mampu menjawab dengan benar dan yang tidak. Nilai parameter aitem a
bergerak daru 0 sampai dengan +2. Kemudian, parameter aitem b adalah
parameter aitem yang berkaitan dengan kesulitan aitem yaitu sulit atau
mudahnya aitem tersebut untuk dijawab oleh subjek. Nilai parameter aitem b
berkaitan dengan peluang tebakan semu subjek yakni peluang yang dapat
menyebabkan subjek secara kebetulan menjawab aitem tersebut dengan benar.
Nilai responsi atau jawaban benar dari subjek terhadap aitem tersebut terletak
di antara 0 dan 1.
4) Fungsi Informasi Aitem dan Tes
Konsep informasi psikometri merupakan ciri penting dalam teori
respon butir. Melalui hal ini sebuah item-response curve (IRC) pada model
dikotomi atau category-response curve pada model politomi dapat diubah
menjadi item information curve (IIC). IIC mengindikasikan jumlah informasi
psikometris yang dimiliki sebuah aitem di sepanjang kontinum latent-trait
(Embretson, 2000).
Formula informasi aitem pada 1PL ditunjukkan seperti di bawah ini.
I(Ө) = Pi(Ө)(1- Pi(Ө)) (3)
Terdapat beberapa aturan dalam formula ini, yaitu sebagai berikut.
a) Jumlah informasi dari sebuah aitem dimaksimalkan pada parameter
kesulitan aitem, sehingga aitem yang memiliki kesulitan yang sama
dengan kemampuan subjek akan sangat informatif.
b) Jumlah informasi yang disediakan sebuah aitem ditentukan dari parameter
diskriminasinya. Semakin tinggi diskriminasi aitemnya, maka semakin
banyak informasi aitem yang akan diberikan menyangkut parameter
kesulitan aitem (Embretson, 2000).
Informasi tes juga merupakan hal yang penting dalam menentukan
measurement subjek. Dengan mengetahui fungsi informasi tes, peneliti dapat
menentukan seberapa baik sebuah tes dalam rentang latent trait. Perlu
diketahui pula bahwa informasi tes merupakan suatu hal yang independen
pada subjek tertentu yang mengikuti tes (Embretson, 2000).
Terdapat banyak pengunaan informasi aitem dan informasi tes dalam
teori respon butir. Pertama, informasi tes digunakan untuk menentukan aitem
mana yang akan diberikan pada subjek tertentu ketika melakukan
computerized adaptive test. Kedua, informasi tes dapat digunakan untuk
membandingkan dua pengukuran konstrak yang sama. Terakhir, informasi
aitem dapat dimanfaatkan untuk desain tes dasar, seperti memilih aitem yang
akan dimasukkan ke dalam sebuah pengukuran (Embretson, 2000).
Perbedaan versi ini dengan versi sebelumnya adalah variabel
dependen diprediksi sebagai probabilitas daripada sebagai log odds. Versi ini
juga dikenal sebagai model pengukuran 1 parameter. Salahsatu kelebihan
versi ini yaitu probabilitas merupakan variabel dependen yang lebih familiar
dibandingkan rasio log odds (Embretson, 2000).
3. Subtes Rechenaufgaben (RA)
Subtes RA merupakan subtes kelima dari alat ukur inteligensi IST.
Subtes ini terdiri dari 20 soal cerita hitungan matematika praktis yang
mengungkap kemampuan berpikir praktis mengenai bilangan. Aspek-aspek
praktis dalam masalah hitungan, daya nalar, dan kemampuan mengambil
kesimpulan.
Polhaupessy (2009) menjelaskan bahwa terdapat beberapa aspek dalam
subtes RA. Pembagian aspek-aspek di dalam keduapuluh aitem subtes RA
dijelaskan dalam tabel 1.
Tabel 1. Aspek Aitem Subtes RA
No Aspek Nomor Aitem
1 Berpikir praktis dalam masalah hitungan 1, 2, 3, 4, 5, 6, 7, 8, 11 2 Berpikir logis indukif 9, 10, 12, 13, 14, 15, 16, 17
3 Daya nalar 18, 19, 20
4 Kemampuan mengambil keputusan 18, 19, 20
Berpikir praktis dalam masalah hitungan artinya adalah berhitung
dengan cara-cara yang efisien dan mudah (Alwi, 2005). Aspek ini diungkap
oleh 9 aitem atau 45% aitem subtes RA. Aspek berpikir logis induktif yaitu
berpikir dengan logika yang berangkat dari serangkaian fakta-fakta khusus
untuk mencapai kesimpulan umum (Alwi, 2005). Kesimpulan yang ditarik
dari hal yang diteliti akan juga berlaku bagi hal yang sejenis namun belum
diteliti. Aspek ini terungkap dari 8 aitem atau 40% aitem subtes RA.
Alwi (2005) mendefinisikan aspek daya nalar sebagai kemampuan
untuk mengembangkan pikiran atau menganalisa berdasarkan fakta, bukti,
atau prinsip yang masuk akal. Aspek terakhir yaitu kemampuan mengambil
keputusan merupakan kemampuan untuk mengambil keputusan berdasarkan
pemikiran induktif maupun deduktif (Alwi, 2005). Kedua aspek ini terungkap
Subtes RA memiliki waktu pengerjaan 10 menit tanpa menggunakan
alat bantu kalkulator. Hasil subtes RA sendiri bisa digunakan terpisah sebagai
alat ukur kemampuan berpikir praktis mengenai bilangan seseorang. Hal ini
dikarenakan subtes-subtes IST memiliki interkorelasi yang rendah antar
subtes.
IST dikembangkan oleh Rudolf Amthauer di Frankfurt, Jerman, pada
tahun 1953. Amthauer mengungkapkan bahwa inteligensi adalah keseluruhan
struktur dari kemampuan jiwa-rohani manusia yang akan tampak jelas dalam
hasil tes. Intelegensi hanya akan dapat dikenali atau dilihat melalui
manifestasinya misalnya pada hasil atau prestasi suatu tes (Polhaupessy,
2009).
Amthaeuer (dalam Polhaupessy, 2009) menyatakan bahwa untuk
mengukur intelegensi seseorang diperlukan suatu rangkaian baterai tes yang
terdiri dari subtes-subtes. Antara subtes satu dengan lainnya, ada yang saling
berhubungan karena mengukur faktor yang sama (general factor atau group
factor), tetapi ada juga yang tidak berhubungan karena masing-masing subtes
mengukur faktor khusus (special factor).
Semenjak diciptakan, IST terus dikembangkan oleh Amthauer dengan
bantuan dari para koleganya, berikut adalah perkembangan tes IST dari tahun
a. IST 1953
IST yang pertama ini pada awalnya hanya digunakan untuk individu
usia 14 sampai dengan 60 tahun. Proses penyusunan norma diambil dari 4000
subjek pada tahun 1953.
b. IST 1955
IST merupakan pengembangan dari IST 1953, pada IST 1955 rentang
usia untuk subjek diperluas menjadi berawal dari umur 13 tahun. Subjek
dalam penyusunan norma bertambah menjadi 8642 orang. Pada tes ini sudah
ada pengelompokan jenis kelamin dan kelompok usia.
c. IST 70
Berdasarkan permintaan dan tuntutan pengguna yang menyarankan
pengkoreksian dengan mesin juga pengembangan tes setelah penggunaan
lebih dari 10 tahun, maka disusunlah IST 70. Dalam IST 70 ini tidak terlalu
banyak perubahan, tes ini memiliki 6 bentuk, setiap pemeriksaan dilakukan 2
tes sebagai bentuk parallel; yaitu A1 dan B2, atau C3 dan D4. Dua bentuk
lainnya untuk pemerintah dan hanya bagi penggunaan khusus. Pada IST 70,
rentang kelompok usia diperluas menjadi berawal dari 12 tahun. Disamping
itu telah ditambah tabel kelompok dan pekerjaan. Namun demikian, pada IST
70 terdapat kekurangan yaitu penyebaran bidang yang tidak merata dan
menggunakan kalimat dalam subtes RA sehingga jika subjek gagal dalam
subtes ini dapat dimungkinkan karena tidak mampu mengerjakan soal
d. IST 2000
Sebagai koreksi dari IST 70, pada IST 2000 tidak terdapat soal kalimat
pada soal hitungan.
e. IST 2000-Revised
Pada IST 2000-R ini terdapat beberapa perkembangan subtes juga
penambahan subtes. IST ini terdiri dari 3 modul, yaitu sebagai berikut :
1) Grundmodul-Kurzform (Modul Dasar-Singkatan); terdiri dari subtes :
SE, AN, GE, RE, ZR, RZ, FA, WU, dan MA.
2) Modul ME: terdiri dari subtes ME Verbal dan ME Figural
3) Erweiterungmodul (Modul menguji pengetahuan); terdiri dari subtes
Wissentest (tes pengetahuan)
IST yang sekarang digunakan di Indonesia adalah IST hasil adaptasi
Fakultas Psikologi Universitas Padjajaran Bandung. Adaptasi ini dilakukan
kepada IST-70. Tes ini pertama kali digunakan oleh Psikolog Angkatan Darat
Bandung, Jawa Barat (Polhaupessy, 2009).
IST terdiri dari sembilan subtes dengan total 176 aitem.
Masing-masing subtes memiliki durasi pengerjaan yang berbeda-beda dan
diadministrasikan dengan menggunakan manual (Polhaupessy, 2009).
Kesembilan subtes tersebut antara lain:
a. Satzeranzung (SE) : melengkapi kalimat
Subtes ini mengukur pembentukan keputusan, melakukan penilaian
mandiri. Durasi yang diberikan untuk mengerjakan subtes ini adalah 6
menit.
b. Wortauswahl (WA) : melengkapi kalimat
Subtes ini mengukur kemampuan bahasa, berpikr verbal secara induktif,
kemampuan berempati, dan memahami pengertian bahasa. Durasi yang
diberikan untuk mengerjakan subtes ini adalah 6 menit.
c. Analogien (AN) : persamaan kata
Subtes ini mengukur kemampuan pengkombinasian, fleksibilitas dalam
berpikir, mendeteksi dan memindahkan hubungan-hubungan, kejelasan
dan kekonsuenan dalam berpikir, serta pertentangan terhadap penjelasan
yang mengira-ngira. Durasi yang diberikan untuk mengerjakan subtes ini
adalah 7 menit.
d. Gemeinsamkeiten (GE) : sifat yang dimiliki bersama
Subtes ini mengukur kemampuan abstraksi verbal, kemampuan
menyatakan pengertian sesuatu dalam bahasa, serta berpikir logis dalam
bentuk bahasa. Durasi yang diberikan untuk mengerjakan subtes ini adalah
8 menit.
e. Merk Aufgaben (ME) : latihan simbol
Subtes ini mengukur kemampuan memberikan perhatian, kemampuan
menyimpan kata-kata yang telah dipelajari, kemampuan mengingat dalam
waktu jangka lama, serta daya ingat. Durasi yang diberikan untuk subtes
f. Rechen Aufgaben (RA) : berhitung
Subtes ini mengukur kemampuan berpikir praktis dalam melakukan
hitungan, berpikir secara logis-induktif, berpikir secara matematis, daya
nalar, dan kemampuan mengambil kesimpulan. Durasi yang diberikan
untuk mengerjakan subtes ini adalah 10 menit.
g. Zahlen Reihen (ZR) : deret angka
Subtes ini mengukur kemampuan berpikir teoritis dalam masalah
hitungan, berpikir secara induktif dengan angka-angka, serta fleksibilitas
dalam berpikir. Durasi yang diberikan untuk mengerjakan subtes ini
adalah 10 menit.
h. Form Auswahl (FA) : memilih bentuk
Subtes ini mengukur kemampuan membayangkan, kemampuan
mengkonstruksi, berpikir konkrit menyeluruh, serta memasukkan bagian
pada suatu keseluruhan. Durasi yang diberikan untuk mengerjakan subtes
ini adalah 7 menit.
i. Wurfel Aufgaben (WU) : latihan balok
Subtes ini mengukur daya bayang ruang, kemampuan tiga dimensi,
analitis, serta kemampuan konstruktif teknis. Durasi yang diberikan untuk
mengerjakan subtes ini adalah 9 menit.
Penelitian ini berfokus pada revisi aitem pada subtes RA. Hal ini
dikarenakan subtes RA memiliki hasil evaluasi karakteristi psikometri yang
psikometrinya. Hasil tersebut menunjukkan bahwa subtes RA memiliki
karakteristik psikometri yang kurang baik sehingga perlu direvisi.
Sari dan Rahmawati (2011) menemukan bahwa subtes ini memiliki
interkorelasi tinggi dengan 8 subtes lainnya, berkisar dari 0.417 sampai 0.999.
Hal ini menunjukkan bahwa subtes RA tidak lagi berfungsi sebagaimana tes
ini disusun oleh Amthauer pada tahun 1953.
Reliabilitas subtes RA juga tidak mencapai nilai 0.90 seperti yang
seharusnya karena hanya sebesar 0.851. Analisis indeks kesukaran aitem
memperlihatkan bahwa terdapat 15 aitem memiliki nilai p mendekati 0
maupun 1. Padahal, Murphy & Davidshofer (2003) mengungkapkan bahwa
nilai p yang baik berada pada rentang 0.30 < p < 0.70. Analisis indeks daya
beda aitem menunjukkan terdapat 4 aitem yang memiliki d < 0.40, yaitu
aitem nomor 77, 93, 94, dan 96. Hal ini mencerminkan bahwa aitem tersebut
kurang mampu membedakan kemampuan berpikir praktis mengenai
perhitungan, berpikir matematis, logis-induktif, penalaran, serta daya
pengambilan keputusan individu.
Rahmawati (2014) menganalisa DIF subtes ini dan menemukan
terdapat 4 aitem menguntungkan kelompok perempuan yaitu aitem nomor 81,
82, 85, dan 88 dan 4 aitem menguntungkan kelompok laki-laki yaitu aitem
nomor 78, 80, 87, dan 96. Adanya DIF pada 8 aitem dalam subtes RA
mencerminkan bahwa tes tidak dapat menunjukkan perbedaan kemampuan
antarindividu yang sesungguhnya. Sebaliknya, tes justru menunjukkan
(2014) menemukan bahwa berdasarkan pendekatan Item Response Theory
terdapat 10 aitem memiliki indeks daya diskriminasi aitem dalam kategori
kurang baik yaitu aitem nomor 84, 85, 88, 89, 90, 91, 92, 93, 94, dan 95 serta
terdapat 5 aitem memiliki indeks kesukaran aitem yang kurang baik yaitu
aitem nomor 77, 93, 94, 95, dan 96.
Penemuan-penemuan di atas membuat peneliti tertarik dalam
melakukan revisi subtes RA dibandingkan pada subtes lainnya karena telah
memiliki data yang lebih lengkap yang menunjukkan bahwa subtes RA perlu
direvisi, yang meliputi indeks kesukaran aitem, daya diskriminasi aitem, dan