i
EVALUASI PSIKOMETRIK TES POTENSI AKADEMIK PLUS
(TPA PLUS) SEBAGAI TES SELEKSI PENERIMAAN MAHASISWA
BARU ANGKATAN 2010/2011 UNIVERSITAS SANATA DHARMA
Skripsi
Diajukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Psikologi
Program Studi Psikologi
Oleh:
Christine Kurniati
079114123
PROGRAM STUDI PSIKOLOGI JURUSAN PSIKOLOGI
FAKULTAS PSIKOLOGI
UNIVERSITAS SANATA DHARMA
iv
“DREAM, BELIEVE AND
MAKE IT HAPPEN”
small people can do BIG things
v
Dedicated to:
1. My Great Father and Savior, Jesus Christ
2. Papa, Mama, Emak, Uil, Mak’e, Alm. Bapake
3. Tante Tin, Om Yen and Nana
vii
Evaluasi Psikometrik Tes Potensi Akademik Plus (TPA Plus) sebagai Tes Seleksi Penerimaan Mahasiswa Baru Angkatan 2010/2011
Universitas Sanata Dharma Christine Kurniati
ABSTRAK
Penelitian bertujuan untuk mendiskripsikan tentang kualitas psikometrik dari Tes Potensi Akademik Plus (TPA Plus) yang terdiri atas Subtes Penalaran Verbal, Kemampuan Numerik, Penalaran Mekanik, Hubungan Ruang dan Bahasa Inggris. TPA Plus dianalisis menggunakan teknik analisis aitem sehingga diketahui taraf kesukran, korelasi aitem total dan efektifitas distraktornya. Selain itu, peneliti juga melakukan akan melakukan usaha peningkatan efisiensi dengan cara memperpendek tes. Tentu saja tes yang telah diperpendek perlu dilihat validitas, reliabilitas dan normanya sehingga dapat berfungsi dengan baik. Secara keseluruhan beberapa aitem dari masing-masing subtes perlu direvisi sehingga aitem-aitemnya mempunyai kualitas yang baik. aitem-aitem yang memiliki masalah serius juga harus digugurkan agar dapat meningkatkan reliabilitas dan validitas dari tes tersebut. Beberapa distraktor juga perlu diperbaiki sehingga dapat berfungsi sebagaimana mestinya yaitu dipilih oleh sebagian atau seluruh subjek Kelompok Rendah. Tiap subtes dari TPA Plus ini dapat dibuat menjadi 2 form yang isinya lebih sedikit dari sebelumnya. Kedua form tersebut aitem yang mempunyai karakteristik yang hampir sama. Tiap form yang telah terbentuk memiliki reliabilitas antara 0.727 – 0.859. reliabilitas yang didapatkan ini kurang memuaskan karena lebih rendah dari standart yang diajukan oleh para ahli, yaitu antara 0.85 – 0.96. Validitasnya yang dihasilkan dapat dikatakan baik karena aitem-aitem yang menyusun form tersebut dapat mengungkap suatu konstruk teori yang masing-masing tes. Namun, ditemukan form yang memiliki validitas kurang meyakinkan, yaitu Subtes Kemampuan Numerik Form II. Pembuatan norma baru dilakukan dengan menggunakan teknik sten scale dengan 10 kategori yaitu dari kategori Istemewa hingga Amat Sangat Rendah. Pada Subtes Penalaran Mekanik baik Form I maupun II terdiri dari 9 kategori karena ada 2 kategori yang memiliki skor sama sehingga peneliti memilih satu kategori saja.
viii
Psychometric Qualities of Tes Potensi Akademik Plus (TPA Plus) as Selection Test for New Grade 2010/2011 Sanata Dharma University
Christine Kurniati
ABSTRACT
This research ia aimed to describe the psychometric qualities of Tes Potensi Akademik Plus (TPA Plus) that consist of 5 subtests, Penalaran Verbal, Kemampuan Numerik, Penalaran Mekanik, Hubungan Ruang dan Bahasa Inggris. TPA Plus are analyzed with item analysis to know about item difficulty, item-total correlation coefisien and distractor power. Besides it, researcher will increase efficiency by shorten this test and of course will do analyze about validity, reliability and new norm so that the new form can do good function. Over all, some items on each form must to repair so that items have good quality. Items that have serious problem must to fall out from test and it will increase reliability and validity of test. Some distractors need to repair so that distractors can do good function, that is choosen by some or whole subject of Lower Group. Each subtest of TPA Plus can be made to 2 forms (short form). Two forms of subtest are composed by items that have same charactetistic. All forms have reliability that are between 0,727 – 0,859. These reliability coefisient are unsatisfactory because they are below the standard good reliability. All forms have good validity because all items can express a construc of theory. But, for Kemampuan Numerik Form II has unconvience validity. Researcher also made new norm by using Sten Scale technique with ten categories from Special to Extreamly Low. But Penalaran Mekanik Form I and II has 9 categories because 2 of categories got same score, so researcher decided to one of both.
ix
LEMBAR PERNYATAAN PERSETUJUAN
PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma :
Nama : Christine Kurniati
Nomor Mahasiswa : 079114123
Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan Universitas Sanata Dharma karya ilmiah saya yang berjudul :
“EVALUASI PSIKOMETRIK TES POTENSI AKADEMIK PLUS (TPA PLUS) SEBAGAI TES SELEKSI PENERIMAAN MAHASISWA BARU
ANGKATAN 2010/2011 UNIVERITAS SANATA DHARMA”
Beserta perangkat yang diperlukan (bila ada), dengan demikian saya memberikan kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya.
Dibuat di Yogyakarta
Pada tanggal :15 Agustus 2011
Yang menyatakan
x
KATA PENGANTAR
Penelitian ini adalah salah satu upaya untuk mengevalusi kualitas
psikometrik dari Tes Potensi Akademik Plus (TPA Plus) yang digunakan oleh
Universitas Sanata Dharma dalam melakukan seleksi mahasiswa baru. Peneliti
berharap dengan penelitian dapat memberikan informasi dan bahan pertimbangan
yang bermanfaat bagi penelitian mengenai kualitas psikometrik alat tes.
Penelitian ini dapat terselesaikan dengan baik karena rahmat dan kasih dari
Tuhan Yesus Kristus yang selalu senantiasa menyertai dalam pengerjaan skripsi
ini. Selain itu, terselesaikannya penulisan skripsi ini juga tidak lepas dari saran
dan dukungan dari banyak orang.
Oleh karena itu, peneliti ingin mengucapkan banyak terima kasih kepada:
1. Bapak Agung Santoso, MA. selaku Dosen Pembimbing Skripsi yang dengan
sabarnya membimbing dari awal sampai skripsi ini selesai. Makasih banget
Pak. GBU
2. Bapak Y. Heri Widodo selaku Kepala P2TKP yang telah memberikan
masukan dan izin untuk menggunakan hasil tes yang diperlukan.
3. Lembaga Penelitian dan Pengabdian Kepada Masyarakat (LPPM) Universitas
Sanata Dharma yang telah mendanai penelitian ini hingga selesai.
4. Bp. Budi Setyahandana selaku Kepala Humas Universitas Sanata Dharma,
terimakasih atas penjelasan mengenai pelaksanaan tes seleksi saat pameran
xi
5. Bapak Toni, Mbak Diana dan asisten P2TKP (Mbak Jesi, Mbak Tinul, Mbak
Nur, Mbak Ma’e, Mbak Wulan, Dino, Ika, especially Dese &Nina) yang telah
membantu saya memasukan data yang jumlahnya beribu-ribu. Matur nuwun
sanget.
6. Semua Dosen Fakultas Sanata Dharma yang telah membagi ilmu.
7. Mas Gandung, Bu Nani, Mas Muji, Mas Doni terimakasih atas kerjasamanya
dalam proses administrasi kuliah, pengetesan dan peminjaman buku. *Pak
Gie terimakasih buat keramahannya*
8. Papa yang selalu menelpon menanyakan kabarku dan skripsiku. Thanks and
love u pa… Mama dan emak yang selalu menasihati. Uil yang selalu
membuat ketawa, jengkel, bangga dan makan terus ;). Mak’e, Alm. bapak’e
makasih buat kasih sayangnya. God Bless
9. Tante Tin, Om Yen dan Nana terimakasih buat supportnya, semoga
membanggakan kalian.
10. Mama Yan dan Om An terimakasih buat saran dan dukungannya.
11. Sahabat-sahabatku: Nana, Emak, Clara, Ngatini terimakasih buat
kebesamaannya selama kuliah, dukungan dan selalu kasih semangat biar aku
cepet nyelesain skripsi. Joko, Ko Edi, Koen thanks for always count on me.
Last but not least, thanks a lot to Mbudeng, u’re the best ever…u know me so
well…hahaha
12. Semua temen-temen angkatan 2007, teman seperjuangan Lili, Wini, Ina
Finally..we made it….!!!! Manda, Rani, Santa thanks ya uda bersama diakhir
xii
13. My mood booster Agnes Monica, u’re so inspiring and also NIC, esp
#timkompak (david, devi, hidz, ria, grace, zana) love y’all.
Yogyakarta, 15 Agustus 2011
xiii
DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN PEMBIMBING ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN PERSEMBAHAN ... iv
PERNYATAAN KEASLIAN KARYA ... v
ABSTRAK ... vi
ABSTRACT ... vii
HALAMAN PERSETUJUAN PUBLIKASI ... ix
KATA PENGANTAR ... x
DAFTAR ISI ... xiii
DAFTAR TABEL ... xvi
DAFTAR LAMPIRAN ... xviii
BAB I. PENDAHULUAN ... 1
A. Latar Belakang ... 1
B. Rumusan Masalah ... 7
C. Tujuan Penelitian ... 7
D. Manfaat ... 8
BAB II. LANDASAN TEORI ... 9
A. Tes Psikologi... 9
1. Pengertian Tes Psikologi... 9
xiv
3. Tes Potensi Akademik ... 12
B. Kualitas Psikometrik ... 16
1. Reliabilitas Tes ... 16
2. Validitas Tes ... 20
3. Analisis Aitem ... 24
4. Norma ... 29
C. Tes Paralel... 32
D. Kerangka Penelitian ... 33
E. Pertanyaan Penelitian... 36
BAB III. METODE PENELITIAN ... 37
A. Jenis Penelitian ... 37
B. Identifikasi Variabel ... 37
C. Definisi Operasional ... 38
D. Subjek Penelitian ... 38
E. Metodde Pengambilan Data ... 38
F. Metode Analisis Data ... 38
BAB 1V. HASIL PENELITIAN DAN PEMBAHASAN ...41
A. Persiapan dan Pelaksanaan Penelitian... 41
B. Hasil Penelitian dan Pembahasan ... 41
1. Subtes Penalaran Verbal ... 41
2. Subtes Kemampuan Numerik ... 50
3. Subtes Penalaran Mekanik ... 57
xv
5. Subtes Bahasa Inggris ... 70
C. Keterbatasan Penelitian ... 77
BAB V. KESIMPULAN DAN SARAN ... 78
A. Kesimpulan ... 78
B. Saran ... 80
DAFTAR PUSTAKA ... 82
xvi
DAFTAR TABEL
Table 1. Kriteria Evaluasi Indeks Diskriminasi ... 27
Table 2. Distribusi Persentase dalam Pengubahan Skor Stanine ... 31
Table 3. Pedoman Penentuan Persentil Batas, Nilai Sten Scale dan Kualifikasinya ... 32
Subtes Penalaran Verbal Tabel 4. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... 42
Tabel 5. Daftar Aitem berdasarkan Efektivitas Distraktor ... 42
Tabel 6. Daftar Aitem yang Memiliki Karakteristik Sama dan Beda... 46
Tabel 7. Daftar Form ... 47
Tabel 8. Hasil Fit Indeks ... 48
Tabel 9. Norma Baru untuk Tiap Form. ... 50
Subtes Kemampuan Numerik Tabel 10. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... ... 50
Tabel 11. Daftar Aitem berdasarkan Efektivitas Distraktor ... 51
Tabel 12. Daftar Aitem yang Memiliki Karakteristik Sama dan Beda ... 53
Tabel 13. Daftar Form ... 54
Tabel 14. Hasil Fit Indeks ... 55
Tabel 15. Norma Baru untuk Tiap Form ... 57
Subtes Penalaran Mekanik Tabel 16. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... 57
xvii
Tabel 18. Daftar Aitem yang Memiliki Karakteristik Sama dan Beda ... 60
Tabel 19. Daftar Form ... 61
Tabel 20. Hasil Fit Indeks ... 62
Tabel 21. Norma Baru untuk Tiap Form ... 63
Subtes Hubungan Ruang Tabel 22. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... 64
Tabel 23. Daftar Aitem berdasarkan Efektivitas Distraktor ... 64
Tabel 24. Daftar Aitem yang Memiliki Karakteristik Sama dan Beda ... 67
Tabel 25. Daftar Form ... 67
Tabel 26. Hasil Fit Indeks ... 68
Tabel 27. Norma Baru untuk Tiap Form ... 70
Subtes Bahasa Inggris Tabel 28. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... 70
Tabel 29. Daftar Aitem berdasarkan Efektivitas Distraktor ... 71
Tabel 30. Daftar Aitem yang Memiliki Karakteristik Sama dan Beda... 74
Tabel 31. Daftar Form ... 74
Tabel 32. Hasil Fit Indeks ... 75
Tabel 33. Norma Baru untuk Tiap Form ... 77
Tabel 34. Banyaknya Aitem untuk Tiap Subtes Berdasarkan Analisis Aitem (
r
ixdan p) ... 78Tabel 35. Banyaknya Distraktor yang Perlu Direvisi untuk Tiap Subtes ... 78
xviii
DAFTAR LAMPIRAN
LAMPIRAN 1. GAMBAR SCATER PLOT
UNTUK TIAP SUBTES TPA PLUS ... 84
LAMPIRAN 2. GAMBAR MODEL PENELITIAN UNTUK TIAP FORM ... 88
LAMPIRAN 3. SUBTES PENALARAN VERBAL ... 99
Analisis Aitem ... 100
Analisis Faktor ... 105
Reliabilitas ... 109
Norma ... 110
LAMPIRAN 4. SUBTES KEMAMPUAN NUMERIK ... 113
Analisis Aitem ... 114
Analisis Faktor ... 118
Reliabilitas ... 122
Norma ... 123
LAMPIRAN 5. SUBTES PENALARAN MEKANIK ... 126
Analisis Aitem ... 127
Analisis Faktor ... 130
Reliabilitas ... 134
Norma ... 135
LAMPIRAN 6. SUBTES HUBUNGAN RUANG... 137
Analisis Aitem ... 138
xix
Reliabilitas ... 145
Norma ... 146
LAMPIRAN 7. SUBTES BAHASA INGGRIS 148 Analisis Aitem ... 149
Analisis Faktor ... 153
Reliabilitas ... 157
BAB I
PENDAHULUAN
A. Latar Belakang
Proses penerimaan mahasiswa baru adalah proses yang penting dalam
menjaring calon mahasiswa yang berkompeten. Hal ini dikarenakan
universitas adalah lembaga pendidikan tinggi yang memiliki kewajiban untuk
menyiapkan calon-calon pemimpin dan ilmuwan di masa mendatang.
Pelaksanaan seleksi calon mahasiswa memerlukan adanya prosedur yang baik
dan tepat agar bisa diperoleh mahasiswa yang memiliki kompetensi yang
diharapkan berhasil dalam kuliahnya.
Hal ini juga dilakukan oleh Universitas Sanata Dharma, yang
merupakan salah satu universitas swasta di Yogyakarta. Universitas Sanata
Dharma melakukan beberapa cara dalam menjaring calon mahasiswa, yaitu
melalui jalur kerja sama, pameran dan tes seleksi. Pelaksanaan tes seleksi
biasanya dilakukan oleh Pusat Pelayanan Tes dan Konsultasi Psikologi
(P2TKP), yaitu lembaga psikologi yang memfokuskan diri pada pelayanan
pengembangan sumber daya manusia yang meliputi tes psikologi, pelatihan,
dan konsultasi (www.usd.ac.id).
Alat tes yang biasa digunakan oleh P2TKP dalam proses
penerimaan mahasiswa baru adalah Tes Potensi Akademik Plus atau sering
disebut TPA Plus. Tes ini terdiri 4 subtes bakat adaptasi DAT (Differential
Aptitude Test), yaitu Penalaran Verbal, Kemampuan Numerik, Penalaran
Mekanik, dan Hubungan Ruang dan satu Tes Bahasa Inggris (Etikawati,
2004).
Pada awalnya tes masuk yang dimiliki Universitas Sanata Dharma
terdiri dari 4 subtes Umum dan 4 subtes Khusus. Tes ini kemudian dibuat
lebih singkat berdasarkan penelitian yang dilakukan oleh Supratiknya,
Suhartanto, dan Anantasari (1999) yang menunjukkan bahwa korelasi antar
skor total Tes Umum dan skor total Tes Khusus baik IPA maupun IPS
ternyata positif dan sangat signifikan. Hasil tersebut dapat diartikan bahwa
kedua kelompok tes tersebut berfungsi sebagai 2 metode untuk mengukur
sifat dan kemampuan yang sama. Oleh karena itu, tidak perlu menggunakan
kedua kelompok tes tersebut untuk tujuan yang sama, yaitu seleksi
penerimaan mahasiswa baru.
Sejak tahun 1988 hingga sekarang, penelitian atau evaluasi
terhadap alat tes masuk, baru dilakukan empat kali. Pertama, Supratiknya,
Suhartanto, dan Anantasari (1999) melakukan evaluasi mengenai kualitas alat
seleksi sehingga menghasilkan TPA plus. Raharjo (2003) melakukan
penelitian mengenai validitas prediktif tes masuk dengan Indeks Prestasi
Kumulatif (IPK) mahasiswa psikologi 1998 sebagai kriterionnya. Hasil
penelitian tersebut menunjukkan bahwa ada hubungan yang positif antara
Widodo (2004) melakukan penelitian tentang kemampuan prediktif
TPA Plus terhadap IPK mahasiswa program studi ilmu pengetahuan alam.
Hasil yang diperoleh dari penelitian tersebut adalah secara umum pada
berbagai program studi ilmu pengetahuan alam, ada hubungan yang positif
dan sangat signifikan antara skor tes potensi akademik plus dengan IPK.
Namun pada program studi Ilmu Komputer, ditemukan hubungan yang tidak
signifikan. Hal ini dimungkinkan karena jumlah subjek yang terlalu sedikit.
Etikawati (2004) juga melakukan penelitian yang sama dengan subjek
yang berbeda, yaitu mahasiswa program studi sosial. Hasil penelitian
tersebut menunjukkan bahwa TPA Plus berkorelasi positif dengan IPK.
Korelasi positif tersebut signifikan untuk 9 dari 12 program studi Ilmu Sosial.
Program studi yang memiliki korelasi tidak signifikan adalah Sastra
Indonesia, Sejarah dan Psikologi. Secara umum hal ini menunjukkan bahwa
TPA Plus cukup berdaya guna sebagai prediktor, walaupun nilai koefisien
korelasinya rendah.
Penelitian selanjutnya dilakukan oleh Wicaksono (2006) tentang
analisis faktor pada TPA Plus. Hasil analisis faktor TPA Plus dengan
menggunakan data skor angkatan 2002 – 2003 mengungkap adanya 2 faktor,
yaitu faktor mekanik-matematika (non verbal) dan faktor verbal. Faktor
mekanik-matematika (non verbal) disusun oleh variabel Kemampuan
Numerik, variabel Penalaran Mekanik dan variabel Hubungan Ruang.
Bahasa Inggris. Penelitian ini juga melakukan korelasi antara faktor 1 dan 2
dengan IPK. Koefisien korelasi antara faktor 1 dan IPK adalah -0.294 dengan
p = 0.001. Dalam hal ini, apabila nilai IPK tinggi maka mahasiswa memiliki
skor faktor 1 yang rendah. Sedangkan koefisien korelasi antara faktor 2 dan
IPK adalah 0.066 namun tidak signifikan (p = 0.243 ).
Penelitian-penelitian yang telah dilakukan biasanya hanya
menggunakan validitas sebagai parameter yang diteliti dan tidak membahas
mengenai reliabliitas dan kualitas aitem tes tersebut. Suatu alat tes perlu
dilakukan evaluasi mengenai reliabilitasnya karena reliabilitas adalah salah
satu syarat untuk tes yang baik. Reliabilitas sendiri adalah parameter yang
menunjukan keajegan suatu pengukuran ketika prosedur pengetesan diulang
pada populasi individu atau kelompok (AERA, 1999). Selain itu, masih
terdapat parameter-parameter lain yang perlu dicek kualitasnya, misalnya
kualitas aitem. Suatu tes perlu dilihat kualitas aitemnya karena penting untuk
mengidentifikasikan aitem-aitem yang tidak memuaskan dari tes sebelumnya
sehingga perlu direvisi, dihilangkan atau digantikan dengan aitem yang baru
(Gregory, 1996).
Hal lain yang perlu diperhatikan adalah masalah efisiensi. Alat tes
sebaiknya memiliki nilai efisiensi baik dalam hal waktu, ekonomi dan teknis.
Hal ini selaras dengan pernyataan Azwar (1997) bahwa kriteria suatu tes
dikatakan baik apabila mempunyai nilai ekonomis dan praktis. Pada
karena pengerjaannya yang cukup lama. TPA plus yang terdiri dari 5 subtes
memiliki waktu pengerjaan sebanyak 200 menit ditambah dengan waktu
pembagian dan pengumpulan buku soal serta pemberian instruksi. Hal ini
dapat menyebabkan kelelahan mental pada subjek yang berakibat pada
berkurangnya cadangan energi dan meningkatnya sisa metabolisme sebagai
penyebab hilangnya efisiensi otot (Suma’mur,1996). Keadaan ini dapat
berpengaruh pada cara pengerjaan dan hasil tes karena selama pengerjaan tes
tidak diberikan waktu istirahat khusus.
Bagian Humas Universitas Sanata Dharma pun mengakui bahwa
lamanya waktu pengerjaan di sisi lain membuat kendala saat melakukan
pameran universitas di sekolah-sekolah. Pemeran ini bertujuan untuk
mengenalkan Universitas Sanata Dharma pada sekolah-sekolah yang ada
diluar kota. Pada pameran seperti ini biasanya tes seleksi diadakan agar siswa
yang berminat bisa langsung mendaftar dan mengikutinya. Pada
kenyataannya, para siswa lebih memilih universitas yang memiliki tes dengan
waktu pengerjaan yang tidak terlalu lama agar bisa mengikuti tes dari
universitas lainnya. Beberapa universitas swasta yang menjadi kompetitor
saat pameran tersebut memiliki tes seleksi yang waktu pengerjaannya 1.5
sampai 2 jam (Setyahandana, komunikasi pribadi tanggal 13 Desember 2010
dan 1 Agustus 2011).
Lamanya waktu pengerjaan juga menambah biaya pengeluaran saat
banyaknya butir soal membuat buku lebih tebal sehingga terapa berat saat
membawanya dan perlu mengeluarkan biaya lagi untuk bagasi pesawat. Oleh
karena itu, Ketua Humas Universitas Sanata Dharma mengatakan bahwa jika
tes TPA Plus lebih pendek maka buku akan lebih tipis sehingga ringan dalam
membawanya. Waktu pengerjaan tes pun bisa lebih cepat sehingga
meminimalkan biaya pada saat di luar kota (Setyahandana, komunikasi
pribadi tanggal 13 Desember 2010).
Dari uraian diatas dapat disimpulkan bahwa ada beberapa masalah
dengan TPA Plus, yaitu bagaimana reliabilitas dan kualitas aitem dari TPA
Plus saat ini dan kurangnya nilai efisiensi penggunaan TPA Plus. Penelitian
ini akan dilakukan untuk mengevaluasi kualitas psikometrik TPA Plus yang
mencakup reliabilitas, validitas dan analisis aitem. Analisis aitem dilakukan
dengan harapan dapat mengatasi kekurangan dari penelitian sebelumnya yang
memperoleh koefisien korelasi yang rendah antara hasil tes dengan IPK.
Lebih lanjut, peneliti juga akan melakukan usaha meningkatkan efisiensi TPA
Plus dengan memperpendek tes namun tetap menjamin bahwa alat tes
tersebut dapat dipertanggungjawabkan dalam hal reliabilitas dan validitasnya.
Peneliti berharap penelitian ini dapat bermanfaat untuk pihak universitas baik
P2TKP maupun Humas Universitas Sanata Dharma dalam melakukan seleksi
B. Rumusan Masalah
1. Bagaimana taraf kesukaran aitem TPA Plus yang dimiliki P2TKP
Universitas Sanata Dharma?
2. Bagaimana korelasi aitem total pada TPA Plus?
3. Bagaimana efektifitas distraktor pada TPA Plus?
4. Apakah jumlah aitem-aitem TPA Plus dapat dikurangi untuk
meningkatkan efisiensi?
5. Bagaimana reliabilitas dari TPA Plus setelah diperpendek?
6. Bagaimana validitas dari TPA Plus setelah diperpendek?
7. Bagaimana norma baru dari TPA Plus setelah diperpendek?
C. Tujuan Penelitian
Penelitian ini memiliki tujuan:
1. Menetukan taraf kesukaran aitem-aitem TPA Plus.
2. Mengetahui besarnya korelasi aitem total TPA Plus.
3. Mengetahui efektivitas distraktor pada TPA Plus.
4. Mengidentifikasi aitem-aitem dengan karakteristik yang sama dalam
rangka memperpendek tes TPA Plus untuk meningkatkan efisiensi.
5. Mengetahui besarnya koefisien reliabilitas TPA Plus setelah diperpendek.
6. Mengetahui besarnya koefisien validitas TPA Plus setelah diperpendek.
D. Manfaat
1. Manfaat Teoritik
Hasil yang diperoleh dari penelitian ini diharapkan dapat menjadi bahan
informasi dan pertimbangan yang bermafaat untuk penelitian mengenai
kualitas psikometrik dari TPA Plus
2. Manfaat Praktis
Bagi P2TKP Universitas Sanata Dharma dapat memperoleh informasi
terbaru mengenai kualitas psikometrik TPA Plus yaitu mengenai validitas,
reliabilitas dan kualitas aitemnya. Selain itu, dengan adanya perpendekan
alat tes, diharapkan dapat memaksimalkan kerja calon mahasiswa baru
BAB II
LANDASAN TEORI
A. Tes
1. Pengertian Tes
Dilihat dari wujud fisiknya, suatu tes tidak lain daripada
sekumpulan pertanyaan yang harus dijawab dan/atau tugas yang harus
dikerjakan dan akan memberikan informasi mengenai aspek psikologis
tertentu berdasarkan jawaban terhadap pertanyaan-pertanyaan atau cara
dan hasil subjek dalam melakukan tugas-tugas tersebut (Azwar. 1996).
Gregory (1996) mendeskripsikan suatu tes adalah prosedur yang
standart untuk memperoleh sampel perilaku dan mendeskripsikannya
berdasarkan kategori atau skor. Anastasi & Urbina (1997) menjelaskan
bahwa tes adalah pengukuran yang objektif dan standart terhadap sampel
perilaku.
Friedenberg (1995) menyebutkan bahwa tes adalah salah satu tipe
asesmen yang menggunakan prosedur yang spesifik atau sistematik untuk
menemukan informasi dan mengubah informasi tersebut kedalam bentuk
angka atau skor.
Dari berbagai penjelasan mengenai tes di atas, maka dapat
disimpulkan bahwa tes adalah sekumpulan pertanyaan atau tugas-tugas
yang objektif, standar, dan sistematik untuk mengamati dan mengukur
perilaku seseorang.
2. Karakteristik Tes yang Baik
Tes yang baik harus didesain secara hati-hati dan dievaluasi secara
empiris untuk memastikan bahwa tes tersebut berguna dalam
menghasilkan informasi akurat. Menurut Friedenberg (1995), karakteristik
tes yang baik dibedakan menjadi dua, yaitu:
a. Sifat Konstruksi atau Desain
1) Tujuan tes yang jelas
Hal ini mengacu pada tiga hal, yaitu kawasan ukur,
pengguna tes dan penilaian tesnya dari aitem yang berbeda-beda.
2) Isi yang spesifik dan standar
Isi tes dikatakan spesifik apabila tes itu mencakup sebatas
kawasan ukurnya sehingga pertanyaanya dipilih sesuai dengan
tujuan yang telah ditetapkan. Sedangkan tes dikatakan standar
apabila semua subjek memiliki atribut atau pengetahuan yang
sama.
3) Prosedur administrasi yang baku
Penyelenggaran sebuah tes yang meliputi perlengkapan,
situasi, cara penyajian, petunjuk cara pengerjakan serta waktu yang
disediakan untuk mengerjakan tes tersebut harus distandarisasikan.
Kondisi yang standar digunakan agar skor tes yang dihasilkan
4) Aturan penilaian
Prosedur penilaian ini harus menggunakan cara yang sama
pada semua subjek. Aturan penilaian ini meliputi cara memberi
skor, pertimbangan untuk menentukan skor (ada kunci), sistem
penilaian (lambang-lambang yang digunakan serta artinya)
b. Sifat Psikometrik
1) Reliabilitas
Ide pokok dari konsep reliabilitas adalah sejauhmana hasil
suatu pengukuran dapat dipercaya. Hasil pengukuran dapat
dipercaya hanya apabila dalam beberapa kali pelaksanaan
pengukuran terhadap kelompok subjek yang sama diperoleh hasil
yang relatif sama, selama aspek yang diukur dalam diri subjek
memang belum berubah (Azwar, 1997)
2) Validitas
Suatu alat tes dikatakan memiliki validitas yang baik
apabila mampu menjalankan fungsi ukur dan memberikan hasil
ukur yang tepat dan akurat sesuai dengan maksud tes tersebut
(Azwar, 1997).
3) Analisis aitem
Analisis aitem dipandang penting untuk
mengidentifikasikan aitem-aitem yang perlu direvisi, dengan
meningkatkan reliabilitas dan validitas secara keseluruhan
(Friedenberg, 1995)
3. Tes Potensi Akademik
Tes potensi akademik adalah tes yang mempunyai tujuan untuk
mengungkap potensi seseorang dalam mempelajari pengetahuan atau
keterampilan (Etikawati, 2004). Berdasarkan saran penelitian yang
dilakukan oleh Supratiknya, Suhartanto dan Anantasari (1999) maka tes
potensi akademik yang saat ini digunakan oleh Universitas Sanata Dharma
adalah hasil gagasan dasar DAT (Differential Aptitude Test).
DAT dikembangkan pada tahun 1947 untuk memberikan prosedur
yang terintergrasi, ilmiah dan memiliki standart yang baik dalam
mengukur bermacam-macam kemampuan individu. Baterai tes ini
biasanya kejuruan dan bimbingan pendidikan murid setingkat SMA. Tes
ini terdiri dari 7 subtes, yaitu Penalaran Verbal, Penalaran Numerik,
Penalaran Abstrak, Kecepatan dan Ketepatan Klerikal, Penalaran Mekanik,
Hubungan Ruang dan Penggunaan Bahasa: Ejaan dan Tata Bahasa
(Bennett, Seashore & Wesmen, 1966).
Penalaran Verbal, Kemampuan Numerik dan Penalaran Abstrak
bersama-sam mengukur fungsi-fungsi yang berkaitan dengan kecerdasan
umum. Selain itu, Penalaran Verbal dan Kemampuan Numerik memiliki
prestasi akademik, sehingga skor kedua subtes ini sering disebut sebagai
indeks umum bakat sekolah. Sedangkan, Penalaran Mekanik dan
Hubungan Ruang memberi kontribusi dalam kaitannya mengukur
kemampuan siswa untuk memvisualisaikan benda-benda kongkrit dan
memanipulasi proses visualisasi dan mengenal prinsip fisika sederhana.
Kecepatan dan Ketepatan Klerikal serta Penggunaan Bahasa: Ejaan dan
Tata Bahasa merupakan tes yang merepresentasikan keterampilan yang
dibutuhkan dalam level pekerjaan (Anastasi & Urbina, 1997; Bennett,
Seashore & Wesmen, 1966).
Penelitian yang dilakukan oleh Supratiknya, Suhartanto, Anantasari
(1999) menyarankan untuk menggunakan 4 subtes adaptasi DAT yaitu
Penalaran Verbal, Kemampuan Numerik, Penalaran Mekanik dan
Hubungan ruang. Dipilihnya 4 subtes ini bertolak dari hasil penelitian
tentang Tes Umum dan mempertimbangkan gagasan dasar dari DAT yang
merupakan sumber dari Tes Umum serta memperhatikan jenis program
studi yang ada di Universitas Sanata Dharma. Selain empat subtes tersebut,
adapula subtes Bahasa Inggris. Subtes ini merupakan salah satu subtes dari
Tes Khusus IPA yang terbukti baik kuliatasnya sehingga tes ini tetap
digunakan.
Berikut adalah penjelas dari masing-masing subtes yang ada dalam
a. Tes Penalaran Verbal
Tes ini mengungkap kemampuan di dalam memahami
konsep-konsep yang disusun dalam kata-kata. Tes ini dipakai untuk
mengevaluasi kemampuan seseorang dalam berpikir konstruktif,
menentukan kesamaan diantara konsep-konsep yang berbeda dan dalam
tingkat abstraksi dapat memanipulasi ide-ide. Tes ini dapat
memprediksi keberhasilan seseorang di bidang yang memerlukan
pemahaman hubungan verbal yang kompleks dan kecakapan dalam
memanipulasi konsep-konsep secara verbal, misalnya dalam
keberhasilannya dalam bidang akademik.
b. Tes Kemampuan Numerik
Tes ini lebih sering disebut arithmetic computation daripada
disebut arithmetic reasoning. Hal ini dikarenakan aitem-aitem dalam
tes ini disusun untuk mengukur pemahaman yang berkaitan dengan
proses numerik dan kecakapan menggunakan konsep-konsep numerik
melalui perhitungan yang sederhana. Tes ini juga menghindari
penggunaan unsur-unsur bahasa yang biasa digunakan dalamarithmetic
reasoning.
c. Tes Penalaran Mekanik
Kemampuan yang diungkap dalam tes ini adalah dapat
menggambarkan salah satu aspek intelegensi dalam arti luas. Seseorang
yang dapat mengerjakan tes ini akan dapat mempelajari prinsip-prinsip
Aspek yang diukur adalah daya penalaran di bidang kerja mekanis dan
prinsip fisika. Tes ini dapat memprediksi cocok tidaknya seseorang
dalam pekerjaan atau pendidikan di bidang mekanik atau mesin, seperti
pertukangan, ahli mesin, pemeliharaan mesin dan perakitan
d. Tes Hubungan Ruang
Tes ini digunakan untuk mengukur kemampuan penalaran
seseorang yang bersifat nonverbal atau mengukur kemampuan
seseorang dalam berpikir dengan menggunakan simbol-simbol abstrak.
Untuk menyelesaikan tes ini diperlukan kemampuan persepsi karena
aitem-aitem tes disusun atas dasar prinsip adanya hubungan yang logis
dari figur-figur abstrak.
e. Tes Bahasa Inggris
Adalah tes yang mengukur kemampuan penguasaan subjek atas
tata bahasa dan kosa kata Bahasa Inggris sebagai bahasa asing.
Urutan penyajian dalam tes seleksi penerimaan mahasiswa baru di
Universitas Sanata Dharma adalah Penalaran Verbal, Kemampuan
Numerik, Penalaran Mekanik, Hubungan Ruang dan yang terakhir adalah
Bahasa Inggris. Setiap tes memiliki jumlah aitem yang berbeda-beda.
Penalaran Verbal memiliki 40 aitem, Kemampuan Numerik 40 aitem,
Penalaran Mekanik 30 aitem, Hubungan Ruang 30 aitem dan Bahasa
Inggris memiliki 40 aitem. Oleh karena itu, alokasi waktu untuk
pengerjaannya juga berbeda. Penalaran Verbal, Kemampuan Numerik,
waktu yang diperlukan adalah 40 menit, 40 menit, 40 menit, 30 menit, dan
50 menit. Total waktu yang dibutuhkan untuk mengerjakan Tes Potensi
Akademik plus adalah 200 menit.
B. Kualitas Psikometri
1. Reliabilitas Tes
Ide pokok dari konsep reliabilitas adalah sejauhmana hasil suatu
pengukuran dapat dipercaya. Hasil pengukuran dapat dipercaya hanya
apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok
subjek yang sama diperoleh hasil yang relatif sama, selama aspek yang
diukur dalam diri subjek memang belum berubah (Azwar, 1997)
Pengertian reliabilitas alat ukur dan hasil ukur biasanya dianggap
sama, namun penggunaannya masing-masing perlu diperhatikan. Konsep
reliabilitas dalam arti reliabilitas alat ukur erat berkaitan dengan masalah
eror pengukuran. Eror pengukuran sendiri menunjukkan pada sejauh mana
inkonsistensi hasil pengukuran apabila pengukuran dilakukan ulang pada
kelompok subjek yang sama. Sedangkan konsep reliabilitas dalam arti
reliabilitas hasil ukur erat hubungannya dengan eror dalam pengambilan
sampel yang mengacu pada inkonsistensi hasil ukur apabila pengukuran
dilakukan ulang pada kelompok individu yang berbeda (Azwar, 1997).
Ada beberapa pendekatan yang dapat dilakukan untuk
a. Pendekatan Tes Ulang
Pendekatan ini dilakukan dengan cara memberikan tes yang
sama pada sekelompok subjek dengan selang waktu yang berbeda
(Azwar, 2001). Pendekatan ini memiliki kelemahan yaitu adanya proses
belajar, pengalaman dan perubahan motivasi subjek antara pemberian
tes yang pertama dan yang kedua (Suryabrata, 1999)
b. Pendekatan Bentuk Paralel
Pendekatan ini dilakukan dengan memberikan sekaligus 2 tes
yang paralel satu sama lain kepada sekelompok subjek. Dalam
pelaksanaannya kedua tes paralel tersebut dapat digabungkan terlebih
dahalu, sehingga seakan-akan merupakan satu bentuk tes. (Azwar,
1997). Keterbatasan pendekatan ini adalah pada sulitnya menyusun 2
alat tes yang paralel (Suryabrata, 1999)
c. Pendekatan Konsistensi Internal
Pendekatan ini digunakan untuk menghindari masalah-masalah
yang biasanya ditimbulkan oleh pendekatan tes ulang dan paralel.
Pendekatan ini hanya memerlukan satu kali pengenaan sebuah tes
kepada sekelompok individu sebagai subjek (single trial
administration). Selanjutnya prosedur analisisnya diarahkan pada
analisis terhadap aitem atau kelompok aitem dalam tes tersebut
sehingga perlu dilakukan pembelahan tes menjadi beberapa kelompok
ini memiliki berbagai teknik dalam estimasi reliabilitas (Suryabrata,
1999), yaitu:
1) Teknik Belah Dua
Suatu perangkat tes diberikan kepada sekolompok subjek
satu kali. Kemudian skor yang diperoleh dibelah menjadi 2 bagian
yang setara dengan cara soal yang bernomor gasal dijadikan dalam
satu kelompok, begitu pula dengan soal bernomor genap. Estimasi
reliabilitas dicari denga menghitung korelasi skor pada belahan
pertama dengan skor pada belahan kedua, rhh.
2) Rumus Rulon
Rulon (1939) merumuskan suatu formula untuk
mengestimasi reliabilitas belah dua tanpa perlu berasumsi bahwa
kedua belahan mempunyai varians yang sama. Hal ini dikarenakan
perbedaan skor subjek pada kedua belahan tes akan membentuk
distribusi perbedaan skor dengan varians yang besarnya ditentukan
oleh varians eror masing-masing belahan (Azwar, 1997).
3) Rumus Flanagan
Flanagan menganggap bahwa varians-varians pada
perangkat belahan tes merupakan varians keliruan pengukuran.
4) Teknik KR20
Teknik ini dilakukan dengan cara membelah tes menjadi
sebanyak jumlah aitemnya sehingga setiap belahan hanya berisi
reliabilitas dari semua cara belah dua yang mungkin dilakukan.
Koefisien ini juga mencerminkan sejauhmana kesetaraan isi
aitem-aitem dalam tes (Azwar, 1997). Teknik KR20 ini dapat digunakan
pada tes yang menggunakan aitem dikotomi, seperti tes
kepribadian, minat, dan sikap (Friedenberg, 1995).
5) Teknik KR21
Teknik ini digunakan pada tes yang aitem-aitem nya diskor
benar atau salah (Friedenberg, 1995).
6) Teknik Analisis Varians
Teknik ini dipopulerkan oleh Hoyt. Dalam karyanya,
varians total dianalisis menjadi proporsi yang berasal dari peserta
tes, proporsi yang berasal dari soal-soal tes dan sisanya
(Suryabrata, 1999).
7) Koefisien Alpha
Koefisien alpha adalah estimasi konservatif dalam internal
konsistensi tes karena membandingkan performasi setiap tes
dengan performansi keseluruhan aitem (Friedenberg, 1995).
Prosedurnya adalah menemukan varian semua skor individu untuk
tiap soal, kemudian menambahkan varian-varian ini sepanjang
semua soal (Anastasi & Urbina, 1997).
Setelah diketahui bagaimana cara melakukan estimasi reliabilitas,
maka perlu diketahui pula mengenai standart atau kriteria untuk
Steiner & Norman, 1995) kriteria yang baik adalah minimum 0.94,
sedangkan Weiner dan Stewart (dalam Steiner & Norman, 1995)
mengajukan kriteria yang baik adalah 0.85. Murphy & Davidshofer
(1991) mengajukan koefisien relibilitas yang baik untuk tipestandardized
group tests of intelligence yaitu 0.90. Helmstadter (dalam Friedenberg,
1995) juga mengajukan koefisien reliabilitas yang baik untuk tipe tes
bakat, yaitu 0.96.
Jika suatu tes digunakan untuk melakukan individual judgement
maka tes tersebut harus lebih reliabel daripada tes yang digunakan untuk
membuat keputusan kelompok ataupun penelitian. Oleh karena itu, perlu
standart atau kriteria koefisien reliabilitas yang tinggi (Steiner & Norman,
1995).
2. Validitas Tes
Validitas adalah salah satu syarat penting bagi sebuah alat tes. Alat
tes yang valid akan dapat memberikan informasi yang dapat dipercaya
sehingga nantinya dapat diambil keputusan yang tepat sesuai dengan
tujuan yang dikehendaki. Oleh karena itu, perlu adanya usaha untuk
mengembangkan parameter ini. Saat ini, konsep mengenai validitas sudah
mengalami evolusi sehingga akan terlihat perpedaan antara konsep yang
lama dan yang baru (Azwar, 1997, Santoso, 2010).
Secara garis besar, konsep validitas yang lama mengacu pada
tidaknya alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki
dengan tepat. Dengan pengertian tersebut, maka diperoleh hasil yaitu suatu
alat tes yang valid dan alat tes yang tidak atau kurang valid. Sedangkan
konsep validitas yang baru menjelaskan bahwa validitas adalah suatu
rangkuman dari bukti-bukti yang dihasilkan. Maksudnya adalah suatu alat
tes tidak mungkin mempunyai kebenaran mutlak sehingga perlu adanya
bukti-bukti yang mendukung interpretasi dan kegunaan skor. Oleh karena
itu, validitas tidak bersifat diskrit, yaitu valid atau tidak valid, namun
memiliki makna tingkatan sehingga validitas merupakan suatu proses yang
tidak pernah berhenti (AERA, 1999, Santoso, 2010). Sumber-sumber
validitas didapatkan berdasarkan (AERA, 1999):
a. Isi Tes
Bukti validitas ini dapat diperoleh dari analisis hubungan antara
isi tes dan konstruk dari tes itu sendiri. Analisis tersebut dapat
menjelaskan apakah isi merepresentasikan domain materi dari suatu alat
tes serta relevansi domain materi dalam menginterpretasi skor tes.
Analisis ini dapat berasal dari penilaian ahli (expert judgement)
mengenai hubungan antara bagian-bagian tes dan konstruknya.
b. Proses Respon
Analisis teoritik dan empirik dari proses respon dapat
memberikan bukti dalam hal kecocokan antara konstruk dan
performansi atau respon alami yang sebenarnya dilakukan oleh testee.
tes mengenai strategi performansi atau responnya terhadap suatu aitem.
Cara lainnya adalah dengan melakukan observasi untuk merekam atau
mengevaluasi performansi testee. Oleh karena itu, validasi termasuk
studi empiris mengenai bagaimana observer dan judges (penilai)
mengevaluasi data dengan menganalisis kesesuaian antar proses dengan
interpretasi atau definisi konstruk.
c. Struktur Internal
Analisis ini dapat memberikan informasi apakah aitem-aitem
dalam suatu tes sesuai atau dapat mengungkap konstruk yang hendak
diukur (AERA, 1999, Azwar, 1997). Analisis ini dapat dilakukan
dengan menggunakan teknik analisis faktor. Teknik ini merupakan
kumpulan prosedur matematik yang kompleks guna menganalisis saling
hubungan variabel-variabel dan menjelaskan saling hubungan tersebut
dalam bentuk kelompok variabel yang terbatas yang disebut dengan
faktor (Azwar, 1997). Kegunaan dari analisis faktor ini adalah:
1) Mereduksi atau mengurangi variabel dengan tetap mempertahankan
informasi yang terkandung didalamnya.
2) Mengidentifikasi dimensi laten yang mendasari variabel-variabel.
3) Konfirmasi struktur dari suatu set variabel atau konstruk.
Menurut Hair, Anderson, Tattham dan Black (dalam
1) Confirmatory
Analisis Faktor yang bertujuan untuk mengevaluasi tingkat
keakurasian prediksi faktor-faktor yang ada dalam sebuah tes. Cara
yang digunakan dalam analisis adalah mengkonfirmasikan apakah
skor hasil tes dan variabel yang ada dalam tes memiliki kesesuain
dengan konstruk teori yang ingin diungkap.
2) Exploratory
Analisis ini akan membuat faktor yang dihasilkan lebih
sedikit dibandingkan dengan varibel yang ada dalam suatu tes.
d. Hubungan dengan Variabel Lain
Sumber validitas yang lainnya adalah analisis hubungan skor tes
dengan variabel atau kriteria eksternal. Suatu kriteria adalah variabel
perilaku yang akan diprediksikan oleh skor tes. Oleh karena itu, perlu
adanya komputasi korelasional antar skor tes dengan skor kriteria
(AERA, 1999, Azwar, 1997).
e. Konsekuensial
Menurut Messick (dalam Santoso, 2010) ada 2 aspek dari
validitas konsekuensial, yaitu:
1) Terkait dengan interpretasi dari hasil tes, maksudnya adalah
validitas konsekuensial merupakan suatu penilaian terhadap suatu
makna dari nama konstruk yang dipilih. Hal lain yang terkait
adalah teori yang mendasari interpretasi skor tes dan ideologi yang
2) Terkait dengan penggunaan tes, maksudnya adalah validitas
konsekuensial merupakan penilaian mengenai konsekuensi sosial
yang nyata dari pengguna tes dan penerapan tindakan berdasarkan
hasil tes.
3. Analisis Aitem
Analisis aitem merupakan prosedur kerja dalam melakukan
pengujian seluruh aitem tes yang didasarkan pada data empirik
(Suryabrata, 1999). Ada berbagai aitem statistik yang dapat dihitung
dengan berbagai teknik perhitungan. Ada 3 teknik perhitungan yang
biasanya sering digunakan, yaitu taraf kesukaran aitem, diskriminasi
aitem dan efektivitas distraktor. Teknik tersebut biasanya digunakan untuk
tes kemampuan (pilihan ganda), namun dua dari teknik tersebut, yaitu taraf
kesukaran aitem dan diskriminasi aitem dapat digunakan untuk
menganalisis jawaban pendek, essay dan juga tes kepribadian, minat dan
sikap.
Berikut adalah penjelasan dari ketiga teknik yang biasa digunakan
dalam proses analisis aitem :
a. Taraf Kesukaran Aitem
Suatu tes dirancang untuk menilai seakurat mungkin tingkat
pencapaian individu dalam kemampuan tertentu. Oleh karena itu, perlu
dilakukan pengukuran taraf kesukaran aitem yang bertujuan untuk
memilih aitem dengan tingkat kesukaran yang sesuai. Jika ada suatu
dengan benar oleh semua testee, maka aitem tersebut tidak dapat
memberikan informasi apa pun tentang perbedaan-perbedaan individu.
Selain itu, aitem tersebut juga tidak memberikan sumbangan reliabilitas
ataupun validitas pada tes itu (Anastasi, 1997).
Taraf kesukaran aitem dinyatakan dalam harga p yang
mempunyai proporsi yang bervariasi antara 0.0 dan 1.0. Jika harga p
mendekati 0.0 maka tidak ada seorang pun yang menjawab benar aitem
tersebut (terlalu sulit). Apabila harga p mendekati 1.0 maka banyak
orang yang menjawab dengan benar aitem tersebut, maka tidak ada
perbedaan individu dalam yang disumbangkan oleh aitem-aitem
tersebut. Biasanya digunakan batasan antara 0.30 sampai dengan 0.70
untuk menentukan apakah suatu aitem memiliki taraf kesukaran yang
baik atau tidak (Gregory, 1996)
Teknik ini cocok untuk tes yang mengukur performansi
maksimal seseorang seperti tes prestasi dan tes bakat. Hal ini
dikarenakan aitem tes yang dianalisis adalah yang memiliki jawaban
benar atau salah.
b. Analisis Diskriminasi Aitem
Berbeda dengan analisis taraf kesukaran aitem, analisis ini
cocok digunakan pada hampir semua jenis tes. Analisis ini
menunjukkan tingkat perbedaan tipe individu yang menjawab sebuah
Ada 2 pendekatan yang digunakan untuk mengevaluasi
diskriminasi aitem, yaitu (Friedenberg, 1995):
1) Indeks Diskriminasi Aitem
Indeks diskriminasi merupakan indeks statistik yang
menyatakan seberapa efisien suatu aitem dapat membedakan antara
individu-individu yang memperoleh skor tinggi dan rendah dalam
suatu tes. Indeks diskriminasi disimbolkan dengan huruf d.
Formula dari indeks diskriminasi adalah (Gregory, 1996):
d: (U - L) / N
Ket:
U: jumlah peserta tes bagian atas yang menjawab benar.
L: jumlah peserta tes bagian bawah yang menjawab benar.
N: jumlah total peserta tes.
Suatu aitem dikatakan memiliki daya diskriminasi yang
tinggi apabila aitem tersebut dapat dijawab dengan benar oleh
semua atau sebagian besar subjek kelompok atas (Kelompok
Tinggi - 27% dari skor tertinggi) dan tidak dapat dijawab dengan
benar oleh semua atau sebagaimana besar subjek kelompok bawah
(Kelompok Rendah – 27% dari skor terendah). Semakin besar
perbedaan proporsi penjawab benar dari Kelompok Tinggi dan
Kelompok Rendah, semakin besar pula daya diskriminasi suatu
Tinggi dan Kelompok Rendah tersebut sama, maka aitem tersebut
tidak mampu membedakan subjek yang memiliki kemampuan
tinggi dan rendah. Terlebih lagi, jika proporsinya terbalik dimana
penjawab benar dari Kelompok Tinggi lebih sedikit dibanding
penjawab benar dari Kelompok Rendah (Murphy & Davidshofer,
1991).
Ebel (dalam Azwar, 1997) menyarankan kriteria evaluasi
indeks diskriminasi dalam empat kategori:
Tabel 1. Kriteria Evaluasi Indeks Diskriminasi
Indeks Diskriminasi Evaluasi
0.4 atau lebih Bagus sekali 0.30 – 0.39 Cukup baik tapi perlu
peningkatan
0.20 – 0.29 Belum memuaskan, perludiperbaiki Kurang dari 0.20 Jelek dan harus dibuang
2) Korelasi Aitem Total
Korelasi aitem total adalah konsistensi atau keselaran
antara aitem dengan tes secara keseluruhan. Dasar kerja yang
digunakan adalah memilih aitem yang mengukur hal yang sama
dengan apa yang diukur oleh tes secara keseluruhan. Pengujian
tersebut dilakukan dengan cara mengkomputasi koefisien korelasi
antara distribusi skor pada setiap aitem dengan skor total itu
Semakin tinggi korelasi positif antara skor aitem dengan
skor tes berarti semakin tinggi konsistensi antar aitem tersebut
dengan tes keseluruhan. Sebaliknya, apabila semakin rendah
koefisien korelasi atau mendekati nol maka fungsi aitem tersebut
tidak cocok dengan fungsi ukur tes. Terlebih lagi bila koefisien
korelasi berharga negatif, artinya terdapat cacat serius pada aitem
yang bersangkutan. (Azwar, 1997). Koefisien rix yang kurang dari
0.3 biasanya dianggap kurang memuaskan (Azwar dalam Prakoso,
1998).
3) Analisis Efektifitas Distraktor
Efektifitas distraktor yang ada pada suatu aitem dianalisis
dari distribusi jawaban terhadap aitem yang bersangkutan pada
setiap alternatif jawaban yang disediakan. Efektifitas distraktor ini
dilakukan untuk melihat apakah semua distraktor yang tersedia
telah berfungsi sebagaimana mestinya, yaitu apakah
distraktor-distraktor tersebut telah dipilih oleh sebagian atau semua subjek
Kelompok Rendah, sedangkan subjek dari Kelompok Tinggi hanya
sedikit atau tidak ada yang memilihnya. Dengan kata lain distraktor
dibuat agar dianggap benar oleh subjek yang tidak tahu atau
Kelompok Rendah, sedangkan untuk Kelompok Tinggi diharapkan
dapat mengertahui kesalahan yang terdapat dalam distraktor
4. Norma
a. Definisi Norma
Skor kasar merupakan taraf informasi paling dasar yang
diberikan oleh tes psikologis (Supratiknya, 1998). Skor kasar adalah
total angka yang diperoleh subjek dalam menyelesaikan aitem secara
benar. Skor ini belum mempunyai makna atau tidak dapat digunakan
menginterpretasi. Skor kasar terlebih dahulu harus dibandingkan
dengan norma.
Norma adalah kerangka acuan yang disusun secara terpisah
dan diperoleh dari suatu sampel standarisasi (Supratiknya, 1998).
Norma disusun secara empiris dengan mengenakan tes pada sejumlah
besar subjek sebagai sampel. Sampel subjek harus bisa mencerminkan
populasi yang menjadi sasaran dari tes tersebut. Oleh karena itu, sampel
ini disebut kelompok norma atau sampel standardisasi (Friedenberg,
1995, Supratiknya, 1998). Norma akan menunjukkan posisi subjek
dalam suatu tes diantara subjek lain yang sebaya dalam hal usia, tingkat
pendidikan, jenis kelamin, dan sebagainya.
b. Teknik Tranformasi Skor Kasar
1) Persentil
Persentil menyatakan presentasi dari sekelompok subjek
dalam kelompok sample yang memiliki skor dibawah skor mentah
tertentu. Semakin tinggi persentil menunjukkan skor yang tinggi
dibandingkan dengan kelompok sampel dan tidak menjelaskan
tingkat keberhasilan subjek dalam menjawab pertanyaan (Gregory,
1996).
Persentil ke-50 (P50) dapat disamakan dengan median
yang merupakan ukuran tendensi sentral. Persentil di atas 50
menunjukkan kinerja atau performansi yang di atas rata-rata, begitu
pula sebaliknya jika persentil di bawah 50 maka kinerja atau
performansi subjek di bawah rata-rata. Skor persentil ini mudah
dihitung dan mudah dipahami. Selain itu, persentil dapat digunakan
untuk orang dewasa dan anak-anak serta cocok untuk semua jenis
tes, bail tes bakat maupun kepribadian (Anastasi & Urbina, 1998).
2) Skor Standart
Skor-skor standart mengungkap jarak individu dari
rata-rata berdasarkan simpangan baku distribusi. Skor ini dapat
diperoleh dengan transformasi linear atau non linear atas skor-skor
mentah yang orisinil (Anastasi & Urbina, 1998).
Skor standar dilambangkan dengan huruf z dan memiliki
penghitungan yang cukup sederhana dengan mengurangkan skor
mentah dengan skor rata-rata kemudian dibagi dengan skor standart
deviasi (Gregory, 1996).
3) Stanine
Stanine atau Standard Nine dikembangkan oleh United
satu bentuk skor standart yang membagi distribusi frekuensi
kedalam sembilan bagian (Azwar, 1998).
Dalam stanine, semua skor kasar diubah dalam satu digit
angka dengan rentang 1 sampai 9. Nilai rata-rata dalam skor
stanine selalu 5 dan standart deviasi selalu mendekati 2.
Pengubahan skor kasar ke skor stanine cukup mudah, yaitu skor di
susun dari rendah ke tinggi, kemudian 4% dari seluruh subjek akan
skor stanine 1, kemudian 7% dari seluruh subjek akan mendapat
skor stanine 2 dan seterusnya (Gregory, 1996).
Tabel 2. Distribusi Persentase dalam Pengubahan Skor Stanine
Presentase (%) 4 7 12 17 20 17 12 7 4
Stanine 1 2 3 4 5 6 7 8 9
4) Sten scale
Teknik ini diciptakan oleh Canfield (Gregory, 1996).
Penilaian dengan sten scale dilakukan dengan cara menentukan
terlebih dahulu persentil batasnya. Formulasi untuk menentukan
persentil batas adalah sebagai berikut:
Pn
=
+
Pn = persentil ke n, yaitu persentil batas tertentu
Bb= batas bawah nyata interval kelas yang mengandung Pn
1 0 0 = frekuensi kumulatif di bawah interval kelas yang
mengandung Pn
Fkb = frekuensi di bawah interval kelas yang mengandung Pn
fd = frekuensi interval yang mengandung Pn
i = lebar interval kelas
Setelah persentil batas ditentukan maka persentil batas
yang paling tinggi akan mendapat nilai sten scale 10 dengan
kualifikasi istimewa. Berikut adalah tabel pedoman untuk
penentuan persentil batas, nilaisten scaledan kualifikasinya:
Tabel 3. Pedoman Penentuan Persentil Batas, Nilai Sten scale dan Kualifikasinya
Persentil Batas NilaiSten scale Kualifikasi
99 10 Istimewa
95 9 Amat Tinggi
90 8 Tinggi
80 7 Lebih dari Cukup
60 6 Cukup
40 5 Ragu-ragu
20 4 Tidak Cukup
10 3 Rendah
5 2 Amat Rendah
1 1 Amat Sangat Rendah
5. Tes Paralel
Tes paralel adalah suatu tes lain yang memiliki kesamaan tujuan
ukurnya dan memiliki kesetaraan isi aitemnya baik secara kualitas maupun
yang sama, seperti tujuan ukur, batasan objek ukur, indikator-indikator
perilaku, banyaknya aitem, format aitem, taraf kesukaran aitem, dan
lain-lain. Secara empirik, kedua tes yang yang paralel harus menghasilkan
mean skor dan standart deviasi yang sama. Selain itu, tiap tes memiliki
korelasi yang sama dengan pengukuran lain serta skor murninya (Azwar,
1997, Gregory, 1996).
Tes paralel ini digunakan dalam skala Wechsler dengan
menggunakan skala yang diperpendek atau dipersingkat. Sasaran dari
skala yang diperpendek ini adalah mengurangi cukup banyak waktu
penyelenggaraan sambil mendapatkan IQ Skala Penuh yang diperkirakan
bisa dievaluasi menggunakan norma-norma yang telah diterbitkan. Cata
penyusunan bentuk pendek ini adalah dengan menghilangkan sejumlah
subtes dan skor-skor serupa di setiap skala. Cara lainnya adalah
mengurangi jumlah soal didalam subtes (Anastasi & Urbina, 1997).
C. Kerangka Penelitian
Dalam penelitian ini, peneliti akan melakukan:
1. Analisis Aitem
Teknik analisis aitem yang digunakan adalah taraf kesukaran
aitem, korelasi aitem total dan efektivitas distraktor. Suatu aitem dikatakan
baik apabila memiliki taraf kesukaran aitem (p) yang sedang yaitu 0,3 ≤p
analisis aitem ini akan terjadi penghilangan aitem yang tidak sesuai dengan
kriteria diatas namun perlu diperhatikan pula koefisien alfanya.
Oleh karena itu, tahap pertama yang perlu dilakukan adalah
mengecek koefisien korelasi total, apabila sesuai dengan kriteria maka
aitem tersebut dipertahankan. Namun apabila koefisien rix < 0,3 maka
perlu melihat koefisien alfanya, jika koefisien alfanya rendah maka aitem
tersebut dapat dipertahankan. Hal ini berarti bahwa jika aitem tersebut
dihilangkan maka akan membuat koefisien alfanya menjadi rendah
(Prakoso, 1998).
Suatu aitem dikatakan memiliki distraktor yang baik apabila
distraktor tersebut dipilih oleh sebagian besar subjek Kelompok Rendah
dan tidak dipilih atau sedikit dipilih oleh subjek Kelompok Tinggi.
2. Memperpendek Subtes TPA Plus
Tahap ini, peneliti menggunakan data hasil dari taraf kesukaran
aitem dan korelasi aitem total yang nantinya akan digunakan sebagai dasar
dalam melakukan pembelahan tes Matched-Random Subsets.Peneliti akan
membuat gambar dengan bantuan scater plot, sehingga terlihat sebaran
aitem-aitem. Aitem yang berdekatan akan dipilih salah satu karena setiap
aitem yang letaknya berdekatan akan memiliki karakteristik yang relatif
sama atau mirip satu sama lain (Azwar, 1997). Aitem-aitem tersebut akan
dipilih secara random untuk masuk ke dalam Form I atau Form II.
Sedangkan aitem-aitem yang letaknya berjauhan akan selalu ada dalam
3. Validitas
Sumber validitas yang akan dicari adalah menggunakan teknik
analisis faktor confirmatory. Form yang telah dibentuk dapat dinyatakan
memiliki validitas yang baik apabila data (skor hasil tes) sesuai dengan
model penelitian. Oleh karena itu, sebelum melakukan analisis, peneliti
membuat model penelitian terlebih dahulu.
Kesesuaian antara model penelitian dan data dapat diketahui
dengan melihat kriteria fit indeks seperti chi square χ2, SRMR dan
RMSEA. Nilai χ2
yang memiliki taraf signifikansi (p) > 0,05 dapat
dikatakan bahwa secara signifikan tidak ada perbedaan antara skor hasil
tes dengan model penelitian. Apabila dihasilkan nilai p < 0,05 maka perlu
dilihat hasil fit indeks yang lain yaitu SRMR dan RMSEA. Hal ini
dilakukan karena nilai χ2
peka terhadap jumlah subjek. Apabila jumlah
subjek banyak, maka χ2
akan menyatakan bahwa ada perbedaan yang
signifikan walaupun sebenarnya perbedaannya sangat kecil. Oleh karena
itu, jika SRMR kurang dari sama dengan 0.08 dan RMSEA kurang dari
0.06 maka dapat dikatakan bahwa ada kesesuaian atau model penelitian
didukung oleh data (Hu & Bentler, 1999).
4. Relibilitas
Tiap form yang dihasilkan akan dicek reliabilitasnya
menggunakan teknik cronbach’s alpha. Karena tes seleksi ini adalah untuk
keperluan individual judgement serta tes bakat ini termasuk dalam
yang tinggi. Koefisien reliabilitas menurut Kelley adalah 0.94,
Helmstadter 0,96, Murphy dan Davidshofer 0.90, sedangkan Weiner dan
Stewart 0.85 (Freidenberg, 1995; Murphy & Davidshofer, 1991; Steiner &
Norman, 1995).
5. Norma
Setelah alat tes dibuatshort formmaka perlu dibuat norma untuk
tiap short form-nya. Norma yang akan digunakan adalah menggunakan
teknik sten scale sehingga menghasilkan 10 kategori, yaitu kategori
Istimewa hingga kategori Amat Sangat Rendah.
D. Pertanyaan Penelitian
1. Bagaimana taraf kesukaran aitem TPA Plus yang dimiliki P2TKP
Universitas Sanata Dharma?
2. Bagaimana korelasi aitem total pada TPA Plus?
3. Bagaimana efektifitas distraktor pada TPA Plus?
4. Apakah jumlah aitem-aitem TPA Plus dapat dikurangi untuk
meningkatkan efisiensi?
5. Bagaimana reliabilitas dari TPA Plus setelah diperpendek?
6. Bagaimana validitas dari TPA Plus setelah diperpendek?
BAB III
METODE PENELITIAN
A. Jenis penelitian
Penelitian yang akan dilakukan bersifat Deskripttif karena hanya
menggambarkan parameter dari kualitas psikometrik tes penerimaan
mahasiswa baru tahun 2010 (TPA Plus) yang dimiliki oleh P2TKP
B. Identifikasi Variabel
Variabel dalam penelitian Tes Potensi Akademik Plus (TPA Plus) ini
adalah:
1. Skor aitem dari tiap subtes.
TPA Plus memiliki 5 subtes yaitu, Penalaran Verbal (40 aitem),
Kemampuan Numerik (40 aitem), Penalaran Mekanik (30 aitem),
Hubungan Ruang (30 aitem), Bahasa Inggris (40 aitem).
2. Skor total tiap subtes.
TPA Plus nantinya akan menghasilkan 5 skor total, yaitu skor total dari
subtes tes Penalaran Verbal, Kemampuan Numerik, Penalaran Mekanik,
Hubungan Ruang, Bahasa Inggris.
C. Definisi Operasional
1. Skor aitem diperoleh dengan mencocokan antara jawaban subjek dengan
kunci jawaban. Skor 1 akan diberikan pada jawaban yang sesuai dengan
kunci jawaban dan skor 0 untuk jawaban salah.
2. Skor total untuk tiap subtes diperoleh dengan menjumlahkan jawaban
yang benar dari tiap subjek.
D. Subjek Penelitian
Subjek yang digunakan dalam penelitian ini adalah calon mahasiswa
yang mengikuti Seleksi Penerimaan Mahasiswa Baru Universitas Sanata
Dharma tahun 2010 Gelombang Pertama yang berjumlah 998 orang.
E. Metode Pengambilan Data
Metode pengambilan data yang digunakan dalam penelitian ini adalah
metode dokumentasi. Data dokumentasi tersebut diperoleh dari Pusat
Pelayanan Tes dan Konseling Psikologi (P2TKP) Universitas Sanata Dharma.
F. Metode Analisis Data
Penelitian ini akan melakukan evaluasi psikometrik yaitu analisis
aitem, reliabilitas, validitas serta akan membuat bentuk pendek (short form)
1. Analisis aitem yang akan dilakukan adalah:
a. Taraf kesukaran aitem, secara teori analisis ini diperoleh dengan cara
membagi banyaknya subjek yang dapat menjawab benar suatu aitem
dengan banyaknya subjek yang menjadi sampel penelitian. Namun,
pada penelitian ini akan digunakan program SPSS 16 untuk
menganalisisnya.
b. Korelasi aitem total, diperoleh dengan cara mengkorelasikan distribusi
skor pada aitem dengan skor total dari test tersebut. Program SPSS 16
akan digunakan untuk menganalisis data yang telah diperoleh.
c. Efektivitas distraktor, diperoleh dengan membuat 2 kelompok yaitu
upper dan lower group terlebih dahulu kemudian dengan memberikan
formulasi pada program Excel 2007, maka nanti akan diperoleh
berapa jumlah jawaban untuk tiap pilihan jawaban pada
masing-masing kelompok.
2. Membuat short form TPA Plus. Cara ini tentunya dilakukan dengan
bantuan program SPSS 16 dengan memasukan data p (taraf kesukaran
aitem) dan rix (korelasi aitem total) dan meminta program untuk
memasangkan aitem.
3. Reliabilitas akan diestimasi menggunakan teknik Cronbach Alpha.
Analisis ini akan dibantu dengan menggunakan program SPSS 16. Teknik
analisis ini dikenakan pada subtes yang telah diperpendek.
4. Validitas yang akan dilakukan menggunakan teknik analisis faktor dengan
membuat model penelitian untuk tiap form yang dapat dibuat. Inti dari
model tersebut adalah aitem-aitem yang tersusun dalam suatu form dapat
mengungkap konstruk yang diukur. Model penelitian ini dapat dilihat
pada Lampiran 2.
5. Membuat norma TPA Plus yang baru setelah dimodifikasi dengan
BAB IV
HASIL PENELITIAN
A. Persiapan dan Pelaksanaan Penelitian
Sebelum penelitian, peneliti meminta ijin kepada Kepala P2TKP untuk
proses pengambilan data. Setelah ijin didapat, peneliti menanyakan kepada
staff P2TKP letak lembar jawab TPA Plus Angkatan 2010/2011 Gelombang
Pertama. Data yang telah didapat kemudian dipindahkan ke dalam komputer
secara manual oleh peneliti sendiri dibantu dengan asisten P2TKP.
Proses pengambilan data ini memakan waktu hampir 3 bulan, mulai
dari pengumpulan data hingga pemindahan data ke komputer. Proses ini
terhitung dari bulan Desember 2010 hingga Maret 2011.
Pada bulan Desember, peneliti juga melakukan wawancara dengan
Kepala Humas Universitas Sanata Dharma, Bp. Budi Setya Handana. Hal ini
dilakukan atas saran dosen pembimbing dan Kepala P2TKP untuk dijadikan
salah satu acuan membuat latar belakang.
B. Hasil Penelitian dan Pembahasan
1. Subtes Penalaran Verbal
a. Analisis Aitem
Hasil analisis aitem menunjukkan bahwa:
Tabel 4. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p)
0,3≤p≤0,7 p < 0,3 p > 0,7 rix≥0,3 1, 2, 7, 17, 18,
19, 10, 25, 27 31 4, 8, 36 rix < 0,3 15, 37 10, 16 12, 23, 33 rix < 0,3 namun
meningkatkan
Tabel 5.Daftar Distraktor Yang Perlu Direvisi
No. Efektivitas Distraktor No. Aitem (Distraktor) 1 Proporsi Kelompok Tinggi
(KT) lebih besar daripada Kelompok Rendah (KR)
1 (A dan B), 2 (A dan E), 4 (B), 5
2 Proporsi KT sama dengan KR (tidak dipilih sama sekali)
5(D) dan 26 (A)
Berdasarkan hasil analisis yang telah dipaparkan di atas, maka dapat
diketahui:
1) Aitem-aitem yang memiliki kualitas baik
Aitem nomor 1, 2, 7, 17, 18, 19, 20, 25 dan 27 tergolong dalam
korelasi aitem total diatas 0.3 serta taraf kesukaran aitem yang
sedang (0.3≤p≤0.7) (Azwar, 1997; Gregory, 1996).
Aitem-aitem nomor 11, 13, 22, 24, 28, 30 dan 32 memiliki
koefisien korelai aitem total yang kurang dari 0.3 Namun apabila
aitem-aitem tersebut dihilangkan maka akan menurunkan nilai
koefisien alpha (Prakoso, 1998). Oleh karena itu, aitem-aitem
tersebut masih dikatakan baik dengan taraf kesukaran aitem yang
sedang.
Namun semua aitem tersebut perlu perbaikan distraktor karena
terdapat distraktor yang banyak dipilih oleh subjek Kelompok
Tinggi, yaitu aitem nomor 1 (A dan B), 2 (A dan E), 7 (C), 11 (A
dan E), 13 (B), 17 (B dan D), 19 (C), 20 (D), 22 (E), 24 (A), 25 (C),
27 (D), 28 (B dan D) dan 32 (A). Distraktor-distraktor tersebut
banyak dipilih oleh subjek Kelompok Tinggi.Ini dapat diakibatkan
distraktor-distraktor ini mengandung kebenaran. Oleh karena itu,
perlu adanya evaluasi apakah distraktor-distraktor tersebut
mengandung kebenaran atau tidak. Apabila mengandung kebenaran
maka distraktor-distraktor tersebut perlu diganti.
Selain itu, ada pula distraktor yang memiliki proporsi yang
sama, baik pada Kelompok Tinggi maupun Kelompok Rendah, yaitu
aitem nomor 1 (C), 13 (E), 17 (E), 18 (A dan E), 19 (D), 20 (C), 22
(A dan D), 24 (E) dan 30 (A). Distraktor-distraktor ini tidak berguna
(Azwar, 1996). Oleh karena itu, perlu adanya revisi pada distraktor
semacam ini sehingga distraktor dapat berfungsi dengan baik.
2) Aitem-aitem yang perlu direvisi
Aitem-aitem nomor 4, 8, 31, dan 36 memiliki koefisien
korelasi aitem total yang baik yaitu diatas 0.3 namun memiliki taraf
kesukaran yang terlalu mudah (p > 0.7) atau terlalu sulit (p < 0.3).
Oleh karena itu, aitem nomor 4, 8 dan 36 perlu direvisi dengan
membuat aitem menjadi sulit, sedangkan aitem no 31 perlu direvisi
dengan membuat aitem menjadi mudah.
Aitem-aitem nomor 3, 5, 6, 9, 14, 21, 26, 29, 34, 35, 38, 39 dan
40 memiliki koefisien korelasi aitem total kurang dari 0.3, namun
apabila aitem-aitem tersebut tidak disertakan dalam perhitungan
estimasi alpha maka koefisien alphanya akan mengalami penurunan
(Prakoso, 1998). Oleh karena itu, aitem-aitem ini masih
dipertahankan dengan melakukan revisi berdasarkan taraf kesukaran
aitemnya. Aitem-aitem nomor 3, 5 dan 26 perlu direvisi dengan
membuat aitem menjadi sulit, sedangkan aitem-aitem nomor 6, 9,
14, 21, 29, 34, 35, 38, 39 dan 40 perlu direvisi dengan membuat
aitem menjadi mudah. Tindakan ini nantinya diharapkan dapat
meningkatkan nilai koefisien korelasi aitem total.
Aitem-aitem tersebut perlu juga dilakukan perbaikan
distraktor. Hal ini dikarenakan ada beberapa distraktor yang kurang
14 (C), 21 (C dan D), 26 (D), 29 (A, B dan D), 34 (C dan D), 35 (B
dan E), 36 (D), 38 (A, D dan E), 39 (B dan C) dan 40 (A) memiliki
distraktor yang banyak dipilih oleh subjek Kelompok Tinggi
dibandingkan dengan subjek Kelompok Rendah. Hal ini mungkin
dikarenakan distraktor-distraktor tersebut mengandung kebenaran.
Oleh karena itu, perlu adanya evaluasi apakah distraktor-distraktor
tersebut mengandung kebenaran atau tidak. Apabila mengandung
kebenaran maka distraktor-distraktor tersebut perlu diganti.
Ada pula distraktor yang memiliki proporsi yang sama baik
pada Kelompok Tinggi maupun Kelompok Rendah, yaitu aitem
nomor 3 (A, B dan D), 6 (E), 26 (C), 31 (A), 36 (C) dan 40 (C).
Distraktor-distraktor ini tidak berguna dalam membedakan antara
Kelompok Tinggi dan Kelompok Rendah (Azwar, 1996).
Selain itu, terdapat pula aitem yang memiliki distraktor yang
sama sekali tidak dipilih oleh subjek Kelompok Tinggi
maupunKelompok Rendah. Distraktor tersebut terdapat pada aitem
nomor 5 (D) dan 26 (A). Distraktor-distraktor ini dikatakan tidak
berfungsi karena jelas tidak ada pemilihnya. Hal ini dapat
dikarenakan isinya yang tidak relevan sehingga terlihat sebagai
pilihan yang salah, baik oleh subjek Kelompok Tinggi apalagi