BAB II TINJAUAN PUSTAKA 1. Revisi Tes - Karakteristik Psikometri Subtes Rechenaufgaben (RA) Versi Revisi pada Intelligenz Struktur Test (IST

(1)

BAB II

TINJAUAN PUSTAKA

1. Revisi Tes

a. Definisi Revisi Tes

Revisi sebuah tes dapat dilakukan dalam berbagai bentuk. Butcher

(2000) mengungkapkan bahwa merubah isi tes seperti, perubahan tampilan

booklet, perubahan manual tes, menghapus aitem yang kurang baik,

menambah aitem, mengganti aitem, ataupun mengembangkan norma baru

dianggap sebagai perevisian sebuah tes. Beberapa tipe tes psikologi

berkemungkinan berisi aitem yang ketinggalan zaman ataupun membutuhkan

revisi yang lebih sering dibandingkan tes yang lain. Contohnya seperti tes

inteligensi, tes prestasi, ataupun tes minat yang aitem-aitemnya berpatokan

pada informasi yang berkembang di masa itu sehingga tentunya lebih sering

membutuhkan revisi dibandingkan tes kepribadian yang kontennya lebih

konstan sepanjang waktu (Butcher, 2000).

Beberapa faktor yang mempengaruhi kapan sebuah tes perlu direvisi

adalah keawetan konten tes dan popularitas tes (Murpy, 2003). Pertama,

keawetan konten tes. Banyak tes berisi aitem-aitem yang perlu diperbarui

terlebih dahulu agar tetap sesuai dengan perkembangan zaman. Apabila aitem

tidak revisi, maka individu akan kesulitan dalam memberikan jawaban karena

tidak memahami maksud aitem tersebut. Sehingga, merevisi aitem-aitem

(2)

Kedua, popularitas tes. Tes yang populer cenderung menjadi subjek

penelitian yang akhirnya memberikan informasi-informasi bermakna

mengenai sebuah tes. Informasi tersebut dapat berupa evaluasi karakteristik

psikometris, makna skor tes, ataupun generalisasi tes. Berdasarkan data-data

yang diperoleh, penelitian-penelitian tersebut sering menyarankan untuk

melakukan modifikasi konten, perubahan prosedur administrasi, ataupun

perubahan skoring tes (Murphy, 2003).

b. ProsedurRevisi Tes

Langkah-langkah dasar dalam penyusunan skala psikologi

memberikan gambaran alur kerja umum mengenai prosedur yang bisa

dilakukan untuk merevisi sebuah alat tes. Azwar (2010) membuat alur kerja

(3)

Gambar 1. Alur Kerja Penyusunan Skala Psikologi

Proses penyusunan skala psikologi diawali dengan memilih suatu

definisi dan mengenai teori yang mendasari konstrak psikologis atribut yang

hendak diukur, atau disebut juga dengan identifikasi tujuan ukur. Setelah

teridentifikasi, perlu dilakukan pembatasan domain ukur berdasarkan

konstrak yang bersangkutan dengan menguraikan komponen atau dimensi

(4)

Proses dilanjutkan dengan menentukan format stimulus yang akan

digunakan dengan mempertimbangkan kelebihan teoritis dan manfaat praktis

format yang hendak dipilih. Apabila indikator perilaku telah dirumuskan

dengan benar lalu disajikan dalam bentuk blue-print. Dalam penelitian,

keempat tahap tersebut tidak lagi dilakukan karena menggunakan

aspek-aspek yang telah ada sebelumnya.

Proses perevisian alat tes dalam penelitian ini dimulai dari tahap

kelima, yaitu penulisan aitem. Peneliti menulis aitem-aitem yang perlu

diubah ataupun diganti. Setiap aitem yang telah ditulis perlu diperiksa ulang

oleh penulis aitem apakah aitem tersebut telah sesuai dengan indikator yang

hendak diungkap dan sesuai pedoman penulisan aitem. Setelah seluruh aitem

ditulis, aitem akan di-review oleh beberapa orang yang kompeten mengenai

konstruksi skala dan masalah atribut yang diukur. Aitem-aitem yang tidak

sesuai perlu diperbaiki atau ditulis ulang sehingga aitem-aitem yang

diloloskan ke tahap uji coba hanyalah aitem-aitem yang diyakini akan

berfungsi dengan baik.

Kalimat-kalimat dalam aitem perlu diuji coba untuk melihat apakah

aitem tersebut dapat dipahami dengan jelas oleh subjek seperti yang

diinginkan oleh penulis aitem. Terkadang apa yang sudah jelas bagi penulis

aitem mungkin saja tidak cukup jelas bagi para subjek. Uji coba ini juga

dijadikan salah satu cara untuk memperoleh data respon yang akan digunakan

(5)

Selanjutnya, akan dilakukan analisis aitem yang merupakan pengujian

parameter-parameter aitem apakah sudah memenuhi persyaratan psikometris

untuk dimasukkan ke dalam skala. Hasil analisis aitem ini akan dijadikan

dasar dalam menseleksi aitem-aitem. Aitem-aitem yang tidak memenuhi

persyaratan psikometris akan disingkirkan atau diperbaiki terlebih dahulu.

Pengujian reliabilitas skala dilakukan terhadap aitem-aitem yang telah

lolos yang jumlahnya disesuaikan dengan blue-print. Proses validasi

umumnya merupakan proses yang berkelanjutan. Pada skala-skala yang akan

digunakan secara terbatas biasanya dilakukan uji validitas kriteria sedangkan

pada skala-skala yang akan digunakan secara luas biasnya dilakukan analisis

faktor.

Terakhir, format final skala harus disusun dengan tampilan yang

menarik dan mudah untuk dibaca oleh subjek. Skala juga harus dilengkapi

dengan petunjuk pengerjaan. Pemilihan huruf dan ukuran kertas juga harus

dipertimbangkan agar membuat subjek nyaman dalam menjawab

aitem-aitem.

Pada penelitian ini, proses revisi aitem akan dimulai dari tahap

penulisan aitem-aitem yang telah teridentifikasi perlu direvisi. Berdasarkan

penelitian-penelitian sebelumnya ditemukan bahwa terdapat 17 dari 20 aitem

yang ada di dalam subtes RA pada IST perlu direvisi, yaitu aitem nomor 77,

78, 80, 81, 82, 84, 85, 87, 88, 89, 90, 91, 92, 93, 94, 95, dan 96. Setelah aitem

ditulis dan dievaluasi oleh professional judgement, maka aitem-aitem tersebut

(6)

Apabila data telah diperoleh, aitem-aitem akan dianalisis mengenai

persyaratan psikometerisnya. Jika belum memenuhi, maka aitem akan

kembali ke tahap penulisan aitem hingga akhirnya memenuhi persyaratan

psikometris seperti yang diinginkan oleh peneliti. Aitem-aitem yang telah

lolos adalah aitem-aitem yang dimasukkan ke dalam format final skala.

2. Evaluasi Karakteristik Psikometris a. Teori Respon Butir

Pendekatan teori respon butir didasarkan pada sifat-sifat atau

kemampuan laten yang mendasari respon subjek terhadap aitem tertentu.

Teori respon butir, atau dikenal juga dengan latent trait theory, mengestimasi

tingkat trait berdasarkan respon subjek serta karakteristik aitem yang

diberikan (Embretson, 2000).

Teori respon butir diperkenalkan oleh Lord dan Novick pada tahun

1968 dan mulai mendominasi dasar teoritis sebuah pengukuran. Hal ini

dikarenakan teori respon butir memiliki prinsip pengukuran yang lebih

seimbang secara teoritis dan mampu mengatasi masalah-masalah pengukuran

dengan lebih baik. Prinsip-prinsip teori respon butir dapat digunakan untuk

menseleksi aitem mana yang paling tepat diberikan untuk seorang subjek dan

menghitung skor antar subset aitem yang berbeda (Embretson, 2000).

Banyak model teori respon butir yang sudah dikembangkan untuk

diaplikasikan pada berbagai bidang psikologi. Sehingga teori respon butir

(7)

gangguan prilaku, sikap, dan trait kognitif seperti inteligensi (Embretson,

2000).

1) Asumsi Teori Respon Butir

Teori Respon Butir memiliki beberapa asumsi kunci, yaitu Kurva

Karakteristik Aitem (KKA), independensi lokal, dan unidimensionalitas

(Embretson, 2000).

a) Kurva Karakteristik Aitem. Bentuk KKA menunjukkan bagaimana

hubungan antara perubahan kemampuan subjek dan perubahan responnya

terhadap aitem. Pada aitem dikotomi, yaitu sebuah respon tertentu akan

dianggap benar, KKA meregresi kemungkinan kesuksesan suatu aitem

pada tingkat kemampuan tertentu. Untuk aitem politomi, seperti skala

rating, KKA meregresi kemungkinan respon masing-masing kategori pada

tingkat kemampuan.

b) Asumsi independensi lokal. Hal ini menyangkut tentang kecukupan model

teori respon butir terhadap data. Independensi lokal diperoleh ketika

hubungan antar aitem atau antar subjek dikarakteristikkan sepenuhnya oleh

model teori respon butir. Independensi lokal juga dapat diperoleh ketika

kemungkinan menyelesaikan suatu aitem tidak beketergantungan dengan

aitem-aitem lainnya, adanya pengontrolan terhadap parameter subjek dan

parameter aitem.

c) Unidimensionalitas. Independensi lokal juga berhubungan dengan jumlah

variabel trait yang mendasari aitem. Independensi lokal akan menunjukkan

(8)

subjek hanya pada satu dimensi. Namun, independensi lokal juga bisa

dicapai dengan data multidimensi jika masing-masing dimensi memiliki

parameter subjek ataupun dengan data yang mana setiap aitem saling

beketergantungan.

2) Model Teori Respon Butir

Model teori respon butir dapat dikategorikan berdasarkan jumlah

respon yang diskor, yaitu dikomotomi dan politomi. Pada model dikotomi,

respon aitem diskor ke dalam dua kelompok yang menunjukkan sukses (1)

atau gagal (2). Aitem pilihan berganda juga termasuk ke dalam model

dikotomi karena walaupun memiliki banyak pilihan jawaban, namun jawaban

tetap di skor sebagai benar atau salah (Embretson, 2000).

Pada model politomi, sebuah aitem memiliki lebih dari dua pilihan

respon jawaban. Masing-masing respon tersebut memiliki nilai skor yang

berbeda-beda pula. Contohnya seperti aitem model Likert yang mana setiap

pilihan jawaban di skor dari rentang 1 sampai 5 (Embretson, 2000).

Teori respon butir memiliki 3 model fungsi distribusi logistik, yaitu

model logistik 1 parameter, model logistik 2 parameter, dan model logistik 3

parameter (Naga, 1992). Perbedaan tiga model ini terletak pada jumlah

parameter yang digunakan. Model paling sederhana dalam teori respon butir

adalah model logistik 1 parameter yang juga dikenal sebagai model Rasch.

Model Rasch hanya menggunakan parameter b atau kesulitan aitem untuk

membedakan antar aitem. Variabel independen dalam model ini adalah trait

(9)

adalah adalah respon dikotomi (sukses atau gagal, benar atau salah) dari

orang tertentu tentang suatu aitem. Terdapat dua versi variabel dependen,

yaitu log odds dan probability (Embretson, 2000).

Pada log odds dalam Rasch model, odds menunjukkan rasio jumlah

benar dengan jumlah berhasil (Embretson, 2000). Rasio ini terlihat dari

perbedaan antara trait score (Өs) dengan tingkat kesulitan aitem (βi).

Sehingga rasio kemungkinan berhasil untuk subjek s pada aitem i, yaitu Pis,

terhadap kemungkinan gagal, yaitu 1- Pis, ditunjukkan seperti di bawah ini.

In [Pis / (1 - Pis)] = Өs - βi (1)

Ketika tingkat kesulitan aitem meningkat, maka log odds akan

menurun. Ketika tingkat kesulitan aitem sama dengan trait level, log odds

akan bernilai 0. Jika trait level lebih besar daripada tingkat kesulitan aitem,

maka orang tersebut akan lebih mungkin untuk berhasil. Sebaliknya, jika

tingkat kesulitan aitem lebih besar daripada trait level, maka orang tersebut

lebih berkemungkinan untuk gagal (Embretson, 2000).

Terdapat beberapa ciri dari Rasch model seperti di bawah ini

(Embretson, 2000).

1. Estimasi trait level dapat dilakukan pada aitem manapun yang telah

diketahui tingkat kesulitan aitemnya.

2. Kedua properti aitem dan trait level berkaitan dengan perilaku karena

pada subjek dan aitem terdapat parameter-parameter yang terpisah.

3. Trait level dan properti aitem merupakan variabel independen yang

(10)

4. Probabilitas respon akan meningkat dengan menjumlahkan nilai

konstan ada trait level atau dengan membagi kesulitan aitem dengan

nilai konstan tersebut.

Pada versi probability, variabel dependen merupakan probabilitas

subjek s untuk berhasil pada aitem i, P(Xis=1). Fungsi logistik ini

memberikan prediksi sebagai berikut (Embretson, 2000).

Ө β _{Ө – β} Ө – β (2)

Perbedaan versi ini dengan versi sebelumnya adalah variabel

dependen diprediksi sebagai probabilitas daripada sebagai log odds. Versi ini

juga dikenal sebagai model pengukuran 1 parameter. Salah satu kelebihan

versi ini yaitu probabilitas merupakan variabel dependen yang lebih familiar

dibandingkan rasio log odds. Dengan model ini karakter yang mempengaruhi

performansi subjek diasumsikan adalah hanya kesulitan aitem.

Model logistik 2 parameter memiliki dua elemen dalam bentuk

matematikanya, yaitu parameter daya beda (a) dan parameter kesulitan aitem

(b). Sedangkan, model logistik 3 parameter ditujukan pada aitem pilihan

berganda karena adanya tambahan parameter peluang tebakan (c).

Pada penelitian ini, model yang dipilih adalah model logistik 1

parameter untuk melihat parameter kesulitan aitem pada subtes RA dengan

alasan lebih praktis dan lebih mudah untuk dilakukan oleh peneliti. Metode

estimasi yang akan digunakan adalah metode kemungkinan maksimum

(11)

panjang tes maupun sampel dengan asumsi bahwa distribusi kemampuan

adalah normal.

3) Parameter Teori Respon Butir

Pada teori respon butir terdapat tiga unsur parameter yaitu paramater

aitem, parameter peserta dan parameter respon (Naga, 1992). Ketiga unsur ini

berhubungan sehingga menghasilkan fungsi atau Kurva Karakteristik Aitem.

Hal ini tampak dari respon peserta terhadap aitem yang berhubungan dengan

atau dapat ditentukan oleh ciri aitem atau ciri peserta yang bersangkutan.

Dalam hubungan ini, ciri peserta dinyatakan melalui parameter peserta (Ө),

ciri aitem dinyatakan melalui tiga parameter aitem a, b, dan c, serta ciri respon

dinyatakan dalam bentuk probabilitas jawaban benar (P(Ө)).

Parameter peserta (Ө) hanya bisa diukur melalui respon subjek

terhadap suatu aitem yang membentuk suatu kontinum. Secara teoritis, nilai

baku untuk parameter peserta membentang dari minus tak terhingga sampai

positif tidak terhingga. Namun secara praktis, nilai baku yang dianggap

berguna hanya terletak antara -4 sampai +4.

Parameter aitem a adalah parameter aitem yang berkaitan dengan daya

beda yaitu kemampuan aitem untuk mempertegas perbedaan subjek yang

mampu menjawab dengan benar dan yang tidak. Nilai parameter aitem a

bergerak daru 0 sampai dengan +2. Kemudian, parameter aitem b adalah

parameter aitem yang berkaitan dengan kesulitan aitem yaitu sulit atau

mudahnya aitem tersebut untuk dijawab oleh subjek. Nilai parameter aitem b

(12)

berkaitan dengan peluang tebakan semu subjek yakni peluang yang dapat

menyebabkan subjek secara kebetulan menjawab aitem tersebut dengan benar.

Nilai responsi atau jawaban benar dari subjek terhadap aitem tersebut terletak

di antara 0 dan 1.

4) Fungsi Informasi Aitem dan Tes

Konsep informasi psikometri merupakan ciri penting dalam teori

respon butir. Melalui hal ini sebuah item-response curve (IRC) pada model

dikotomi atau category-response curve pada model politomi dapat diubah

menjadi item information curve (IIC). IIC mengindikasikan jumlah informasi

psikometris yang dimiliki sebuah aitem di sepanjang kontinum latent-trait

(Embretson, 2000).

Formula informasi aitem pada 1PL ditunjukkan seperti di bawah ini.

I(Ө) = Pi(Ө)(1- Pi(Ө)) (3)

Terdapat beberapa aturan dalam formula ini, yaitu sebagai berikut.

a) Jumlah informasi dari sebuah aitem dimaksimalkan pada parameter

kesulitan aitem, sehingga aitem yang memiliki kesulitan yang sama

dengan kemampuan subjek akan sangat informatif.

b) Jumlah informasi yang disediakan sebuah aitem ditentukan dari parameter

diskriminasinya. Semakin tinggi diskriminasi aitemnya, maka semakin

banyak informasi aitem yang akan diberikan menyangkut parameter

kesulitan aitem (Embretson, 2000).

Informasi tes juga merupakan hal yang penting dalam menentukan

(13)

measurement subjek. Dengan mengetahui fungsi informasi tes, peneliti dapat

menentukan seberapa baik sebuah tes dalam rentang latent trait. Perlu

diketahui pula bahwa informasi tes merupakan suatu hal yang independen

pada subjek tertentu yang mengikuti tes (Embretson, 2000).

Terdapat banyak pengunaan informasi aitem dan informasi tes dalam

teori respon butir. Pertama, informasi tes digunakan untuk menentukan aitem

mana yang akan diberikan pada subjek tertentu ketika melakukan

computerized adaptive test. Kedua, informasi tes dapat digunakan untuk

membandingkan dua pengukuran konstrak yang sama. Terakhir, informasi

aitem dapat dimanfaatkan untuk desain tes dasar, seperti memilih aitem yang

akan dimasukkan ke dalam sebuah pengukuran (Embretson, 2000).

Perbedaan versi ini dengan versi sebelumnya adalah variabel

dependen diprediksi sebagai probabilitas daripada sebagai log odds. Versi ini

juga dikenal sebagai model pengukuran 1 parameter. Salahsatu kelebihan

versi ini yaitu probabilitas merupakan variabel dependen yang lebih familiar

dibandingkan rasio log odds (Embretson, 2000).

3. Subtes Rechenaufgaben (RA)

Subtes RA merupakan subtes kelima dari alat ukur inteligensi IST.

Subtes ini terdiri dari 20 soal cerita hitungan matematika praktis yang

mengungkap kemampuan berpikir praktis mengenai bilangan. Aspek-aspek

(14)

praktis dalam masalah hitungan, daya nalar, dan kemampuan mengambil

kesimpulan.

Polhaupessy (2009) menjelaskan bahwa terdapat beberapa aspek dalam

subtes RA. Pembagian aspek-aspek di dalam keduapuluh aitem subtes RA

dijelaskan dalam tabel 1.

Tabel 1. Aspek Aitem Subtes RA

No Aspek Nomor Aitem

1 Berpikir praktis dalam masalah hitungan 1, 2, 3, 4, 5, 6, 7, 8, 11 2 Berpikir logis indukif 9, 10, 12, 13, 14, 15, 16, 17

3 Daya nalar 18, 19, 20

4 Kemampuan mengambil keputusan 18, 19, 20

Berpikir praktis dalam masalah hitungan artinya adalah berhitung

dengan cara-cara yang efisien dan mudah (Alwi, 2005). Aspek ini diungkap

oleh 9 aitem atau 45% aitem subtes RA. Aspek berpikir logis induktif yaitu

berpikir dengan logika yang berangkat dari serangkaian fakta-fakta khusus

untuk mencapai kesimpulan umum (Alwi, 2005). Kesimpulan yang ditarik

dari hal yang diteliti akan juga berlaku bagi hal yang sejenis namun belum

diteliti. Aspek ini terungkap dari 8 aitem atau 40% aitem subtes RA.

Alwi (2005) mendefinisikan aspek daya nalar sebagai kemampuan

untuk mengembangkan pikiran atau menganalisa berdasarkan fakta, bukti,

atau prinsip yang masuk akal. Aspek terakhir yaitu kemampuan mengambil

keputusan merupakan kemampuan untuk mengambil keputusan berdasarkan

pemikiran induktif maupun deduktif (Alwi, 2005). Kedua aspek ini terungkap

(15)

Subtes RA memiliki waktu pengerjaan 10 menit tanpa menggunakan

alat bantu kalkulator. Hasil subtes RA sendiri bisa digunakan terpisah sebagai

alat ukur kemampuan berpikir praktis mengenai bilangan seseorang. Hal ini

dikarenakan subtes-subtes IST memiliki interkorelasi yang rendah antar

subtes.

IST dikembangkan oleh Rudolf Amthauer di Frankfurt, Jerman, pada

tahun 1953. Amthauer mengungkapkan bahwa inteligensi adalah keseluruhan

struktur dari kemampuan jiwa-rohani manusia yang akan tampak jelas dalam

hasil tes. Intelegensi hanya akan dapat dikenali atau dilihat melalui

manifestasinya misalnya pada hasil atau prestasi suatu tes (Polhaupessy,

2009).

Amthaeuer (dalam Polhaupessy, 2009) menyatakan bahwa untuk

mengukur intelegensi seseorang diperlukan suatu rangkaian baterai tes yang

terdiri dari subtes-subtes. Antara subtes satu dengan lainnya, ada yang saling

berhubungan karena mengukur faktor yang sama (general factor atau group

factor), tetapi ada juga yang tidak berhubungan karena masing-masing subtes

mengukur faktor khusus (special factor).

Semenjak diciptakan, IST terus dikembangkan oleh Amthauer dengan

bantuan dari para koleganya, berikut adalah perkembangan tes IST dari tahun

(16)

a. IST 1953

IST yang pertama ini pada awalnya hanya digunakan untuk individu

usia 14 sampai dengan 60 tahun. Proses penyusunan norma diambil dari 4000

subjek pada tahun 1953.

b. IST 1955

IST merupakan pengembangan dari IST 1953, pada IST 1955 rentang

usia untuk subjek diperluas menjadi berawal dari umur 13 tahun. Subjek

dalam penyusunan norma bertambah menjadi 8642 orang. Pada tes ini sudah

ada pengelompokan jenis kelamin dan kelompok usia.

c. IST 70

Berdasarkan permintaan dan tuntutan pengguna yang menyarankan

pengkoreksian dengan mesin juga pengembangan tes setelah penggunaan

lebih dari 10 tahun, maka disusunlah IST 70. Dalam IST 70 ini tidak terlalu

banyak perubahan, tes ini memiliki 6 bentuk, setiap pemeriksaan dilakukan 2

tes sebagai bentuk parallel; yaitu A1 dan B2, atau C3 dan D4. Dua bentuk

lainnya untuk pemerintah dan hanya bagi penggunaan khusus. Pada IST 70,

rentang kelompok usia diperluas menjadi berawal dari 12 tahun. Disamping

itu telah ditambah tabel kelompok dan pekerjaan. Namun demikian, pada IST

70 terdapat kekurangan yaitu penyebaran bidang yang tidak merata dan

menggunakan kalimat dalam subtes RA sehingga jika subjek gagal dalam

subtes ini dapat dimungkinkan karena tidak mampu mengerjakan soal

(17)

d. IST 2000

Sebagai koreksi dari IST 70, pada IST 2000 tidak terdapat soal kalimat

pada soal hitungan.

e. IST 2000-Revised

Pada IST 2000-R ini terdapat beberapa perkembangan subtes juga

penambahan subtes. IST ini terdiri dari 3 modul, yaitu sebagai berikut :

1) Grundmodul-Kurzform (Modul Dasar-Singkatan); terdiri dari subtes :

SE, AN, GE, RE, ZR, RZ, FA, WU, dan MA.

2) Modul ME: terdiri dari subtes ME Verbal dan ME Figural

3) Erweiterungmodul (Modul menguji pengetahuan); terdiri dari subtes

Wissentest (tes pengetahuan)

IST yang sekarang digunakan di Indonesia adalah IST hasil adaptasi

Fakultas Psikologi Universitas Padjajaran Bandung. Adaptasi ini dilakukan

kepada IST-70. Tes ini pertama kali digunakan oleh Psikolog Angkatan Darat

Bandung, Jawa Barat (Polhaupessy, 2009).

IST terdiri dari sembilan subtes dengan total 176 aitem.

Masing-masing subtes memiliki durasi pengerjaan yang berbeda-beda dan

diadministrasikan dengan menggunakan manual (Polhaupessy, 2009).

Kesembilan subtes tersebut antara lain:

a. Satzeranzung (SE) : melengkapi kalimat

Subtes ini mengukur pembentukan keputusan, melakukan penilaian

(18)

mandiri. Durasi yang diberikan untuk mengerjakan subtes ini adalah 6

menit.

b. Wortauswahl (WA) : melengkapi kalimat

Subtes ini mengukur kemampuan bahasa, berpikr verbal secara induktif,

kemampuan berempati, dan memahami pengertian bahasa. Durasi yang

diberikan untuk mengerjakan subtes ini adalah 6 menit.

c. Analogien (AN) : persamaan kata

Subtes ini mengukur kemampuan pengkombinasian, fleksibilitas dalam

berpikir, mendeteksi dan memindahkan hubungan-hubungan, kejelasan

dan kekonsuenan dalam berpikir, serta pertentangan terhadap penjelasan

yang mengira-ngira. Durasi yang diberikan untuk mengerjakan subtes ini

adalah 7 menit.

d. Gemeinsamkeiten (GE) : sifat yang dimiliki bersama

Subtes ini mengukur kemampuan abstraksi verbal, kemampuan

menyatakan pengertian sesuatu dalam bahasa, serta berpikir logis dalam

bentuk bahasa. Durasi yang diberikan untuk mengerjakan subtes ini adalah

8 menit.

e. Merk Aufgaben (ME) : latihan simbol

Subtes ini mengukur kemampuan memberikan perhatian, kemampuan

menyimpan kata-kata yang telah dipelajari, kemampuan mengingat dalam

waktu jangka lama, serta daya ingat. Durasi yang diberikan untuk subtes

(19)

f. Rechen Aufgaben (RA) : berhitung

Subtes ini mengukur kemampuan berpikir praktis dalam melakukan

hitungan, berpikir secara logis-induktif, berpikir secara matematis, daya

nalar, dan kemampuan mengambil kesimpulan. Durasi yang diberikan

untuk mengerjakan subtes ini adalah 10 menit.

g. Zahlen Reihen (ZR) : deret angka

Subtes ini mengukur kemampuan berpikir teoritis dalam masalah

hitungan, berpikir secara induktif dengan angka-angka, serta fleksibilitas

dalam berpikir. Durasi yang diberikan untuk mengerjakan subtes ini

adalah 10 menit.

h. Form Auswahl (FA) : memilih bentuk

Subtes ini mengukur kemampuan membayangkan, kemampuan

mengkonstruksi, berpikir konkrit menyeluruh, serta memasukkan bagian

pada suatu keseluruhan. Durasi yang diberikan untuk mengerjakan subtes

ini adalah 7 menit.

i. Wurfel Aufgaben (WU) : latihan balok

Subtes ini mengukur daya bayang ruang, kemampuan tiga dimensi,

analitis, serta kemampuan konstruktif teknis. Durasi yang diberikan untuk

mengerjakan subtes ini adalah 9 menit.

Penelitian ini berfokus pada revisi aitem pada subtes RA. Hal ini

dikarenakan subtes RA memiliki hasil evaluasi karakteristi psikometri yang

(20)

psikometrinya. Hasil tersebut menunjukkan bahwa subtes RA memiliki

karakteristik psikometri yang kurang baik sehingga perlu direvisi.

Sari dan Rahmawati (2011) menemukan bahwa subtes ini memiliki

interkorelasi tinggi dengan 8 subtes lainnya, berkisar dari 0.417 sampai 0.999.

Hal ini menunjukkan bahwa subtes RA tidak lagi berfungsi sebagaimana tes

ini disusun oleh Amthauer pada tahun 1953.

Reliabilitas subtes RA juga tidak mencapai nilai 0.90 seperti yang

seharusnya karena hanya sebesar 0.851. Analisis indeks kesukaran aitem

memperlihatkan bahwa terdapat 15 aitem memiliki nilai p mendekati 0

maupun 1. Padahal, Murphy & Davidshofer (2003) mengungkapkan bahwa

nilai p yang baik berada pada rentang 0.30 < p < 0.70. Analisis indeks daya

beda aitem menunjukkan terdapat 4 aitem yang memiliki d < 0.40, yaitu

aitem nomor 77, 93, 94, dan 96. Hal ini mencerminkan bahwa aitem tersebut

kurang mampu membedakan kemampuan berpikir praktis mengenai

perhitungan, berpikir matematis, logis-induktif, penalaran, serta daya

pengambilan keputusan individu.

Rahmawati (2014) menganalisa DIF subtes ini dan menemukan

terdapat 4 aitem menguntungkan kelompok perempuan yaitu aitem nomor 81,

82, 85, dan 88 dan 4 aitem menguntungkan kelompok laki-laki yaitu aitem

nomor 78, 80, 87, dan 96. Adanya DIF pada 8 aitem dalam subtes RA

mencerminkan bahwa tes tidak dapat menunjukkan perbedaan kemampuan

antarindividu yang sesungguhnya. Sebaliknya, tes justru menunjukkan

(21)

(2014) menemukan bahwa berdasarkan pendekatan Item Response Theory

terdapat 10 aitem memiliki indeks daya diskriminasi aitem dalam kategori

kurang baik yaitu aitem nomor 84, 85, 88, 89, 90, 91, 92, 93, 94, dan 95 serta

terdapat 5 aitem memiliki indeks kesukaran aitem yang kurang baik yaitu

aitem nomor 77, 93, 94, 95, dan 96.

Penemuan-penemuan di atas membuat peneliti tertarik dalam

melakukan revisi subtes RA dibandingkan pada subtes lainnya karena telah

memiliki data yang lebih lengkap yang menunjukkan bahwa subtes RA perlu

direvisi, yang meliputi indeks kesukaran aitem, daya diskriminasi aitem, dan