Evaluasi psikometrik Tes Potensi Akademik plus (TPA Plus) sebagai tes seleksi penerimaan mahasiswa baru angkatan 2010/2011 Universitas Sanata Dharma - USD Repository

(1)

i

EVALUASI PSIKOMETRIK TES POTENSI AKADEMIK PLUS

(TPA PLUS) SEBAGAI TES SELEKSI PENERIMAAN MAHASISWA

BARU ANGKATAN 2010/2011 UNIVERSITAS SANATA DHARMA

Skripsi

Diajukan Untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Psikologi

Program Studi Psikologi

Oleh:

Christine Kurniati

079114123

PROGRAM STUDI PSIKOLOGI JURUSAN PSIKOLOGI

FAKULTAS PSIKOLOGI

UNIVERSITAS SANATA DHARMA

(2)

(3)

(4)

iv

“DREAM, BELIEVE AND

MAKE IT HAPPEN”

small people can do BIG things

(5)

v

Dedicated to:

1. My Great Father and Savior, Jesus Christ

2. Papa, Mama, Emak, Uil, Mak’e, Alm. Bapake

3. Tante Tin, Om Yen and Nana

(6)

(7)

vii

Evaluasi Psikometrik Tes Potensi Akademik Plus (TPA Plus) sebagai Tes Seleksi Penerimaan Mahasiswa Baru Angkatan 2010/2011

Universitas Sanata Dharma Christine Kurniati

ABSTRAK

Penelitian bertujuan untuk mendiskripsikan tentang kualitas psikometrik dari Tes Potensi Akademik Plus (TPA Plus) yang terdiri atas Subtes Penalaran Verbal, Kemampuan Numerik, Penalaran Mekanik, Hubungan Ruang dan Bahasa Inggris. TPA Plus dianalisis menggunakan teknik analisis aitem sehingga diketahui taraf kesukran, korelasi aitem total dan efektifitas distraktornya. Selain itu, peneliti juga melakukan akan melakukan usaha peningkatan efisiensi dengan cara memperpendek tes. Tentu saja tes yang telah diperpendek perlu dilihat validitas, reliabilitas dan normanya sehingga dapat berfungsi dengan baik. Secara keseluruhan beberapa aitem dari masing-masing subtes perlu direvisi sehingga aitem-aitemnya mempunyai kualitas yang baik. aitem-aitem yang memiliki masalah serius juga harus digugurkan agar dapat meningkatkan reliabilitas dan validitas dari tes tersebut. Beberapa distraktor juga perlu diperbaiki sehingga dapat berfungsi sebagaimana mestinya yaitu dipilih oleh sebagian atau seluruh subjek Kelompok Rendah. Tiap subtes dari TPA Plus ini dapat dibuat menjadi 2 form yang isinya lebih sedikit dari sebelumnya. Kedua form tersebut aitem yang mempunyai karakteristik yang hampir sama. Tiap form yang telah terbentuk memiliki reliabilitas antara 0.727 – 0.859. reliabilitas yang didapatkan ini kurang memuaskan karena lebih rendah dari standart yang diajukan oleh para ahli, yaitu antara 0.85 – 0.96. Validitasnya yang dihasilkan dapat dikatakan baik karena aitem-aitem yang menyusun form tersebut dapat mengungkap suatu konstruk teori yang masing-masing tes. Namun, ditemukan form yang memiliki validitas kurang meyakinkan, yaitu Subtes Kemampuan Numerik Form II. Pembuatan norma baru dilakukan dengan menggunakan teknik sten scale dengan 10 kategori yaitu dari kategori Istemewa hingga Amat Sangat Rendah. Pada Subtes Penalaran Mekanik baik Form I maupun II terdiri dari 9 kategori karena ada 2 kategori yang memiliki skor sama sehingga peneliti memilih satu kategori saja.

(8)

viii

Psychometric Qualities of Tes Potensi Akademik Plus (TPA Plus) as Selection Test for New Grade 2010/2011 Sanata Dharma University

Christine Kurniati

ABSTRACT

This research ia aimed to describe the psychometric qualities of Tes Potensi Akademik Plus (TPA Plus) that consist of 5 subtests, Penalaran Verbal, Kemampuan Numerik, Penalaran Mekanik, Hubungan Ruang dan Bahasa Inggris. TPA Plus are analyzed with item analysis to know about item difficulty, item-total correlation coefisien and distractor power. Besides it, researcher will increase efficiency by shorten this test and of course will do analyze about validity, reliability and new norm so that the new form can do good function. Over all, some items on each form must to repair so that items have good quality. Items that have serious problem must to fall out from test and it will increase reliability and validity of test. Some distractors need to repair so that distractors can do good function, that is choosen by some or whole subject of Lower Group. Each subtest of TPA Plus can be made to 2 forms (short form). Two forms of subtest are composed by items that have same charactetistic. All forms have reliability that are between 0,727 – 0,859. These reliability coefisient are unsatisfactory because they are below the standard good reliability. All forms have good validity because all items can express a construc of theory. But, for Kemampuan Numerik Form II has unconvience validity. Researcher also made new norm by using Sten Scale technique with ten categories from Special to Extreamly Low. But Penalaran Mekanik Form I and II has 9 categories because 2 of categories got same score, so researcher decided to one of both.

(9)

ix

LEMBAR PERNYATAAN PERSETUJUAN

PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma :

Nama : Christine Kurniati

Nomor Mahasiswa : 079114123

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan Universitas Sanata Dharma karya ilmiah saya yang berjudul :

“EVALUASI PSIKOMETRIK TES POTENSI AKADEMIK PLUS (TPA PLUS) SEBAGAI TES SELEKSI PENERIMAAN MAHASISWA BARU

ANGKATAN 2010/2011 UNIVERITAS SANATA DHARMA”

Beserta perangkat yang diperlukan (bila ada), dengan demikian saya memberikan kepada Perpustakaan Universitas Sanata Dharma hak untuk menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk pangkalan data, mendistribusikan secara terbatas, dan mempublikasikannya di Internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan nama saya sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya.

Dibuat di Yogyakarta

Pada tanggal :15 Agustus 2011

Yang menyatakan

(10)

x

KATA PENGANTAR

Penelitian ini adalah salah satu upaya untuk mengevalusi kualitas

psikometrik dari Tes Potensi Akademik Plus (TPA Plus) yang digunakan oleh

Universitas Sanata Dharma dalam melakukan seleksi mahasiswa baru. Peneliti

berharap dengan penelitian dapat memberikan informasi dan bahan pertimbangan

yang bermanfaat bagi penelitian mengenai kualitas psikometrik alat tes.

Penelitian ini dapat terselesaikan dengan baik karena rahmat dan kasih dari

Tuhan Yesus Kristus yang selalu senantiasa menyertai dalam pengerjaan skripsi

ini. Selain itu, terselesaikannya penulisan skripsi ini juga tidak lepas dari saran

dan dukungan dari banyak orang.

Oleh karena itu, peneliti ingin mengucapkan banyak terima kasih kepada:

1. Bapak Agung Santoso, MA. selaku Dosen Pembimbing Skripsi yang dengan

sabarnya membimbing dari awal sampai skripsi ini selesai. Makasih banget

Pak. GBU

2. Bapak Y. Heri Widodo selaku Kepala P2TKP yang telah memberikan

masukan dan izin untuk menggunakan hasil tes yang diperlukan.

3. Lembaga Penelitian dan Pengabdian Kepada Masyarakat (LPPM) Universitas

Sanata Dharma yang telah mendanai penelitian ini hingga selesai.

4. Bp. Budi Setyahandana selaku Kepala Humas Universitas Sanata Dharma,

terimakasih atas penjelasan mengenai pelaksanaan tes seleksi saat pameran

(11)

xi

5. Bapak Toni, Mbak Diana dan asisten P2TKP (Mbak Jesi, Mbak Tinul, Mbak

Nur, Mbak Ma’e, Mbak Wulan, Dino, Ika, especially Dese &Nina) yang telah

membantu saya memasukan data yang jumlahnya beribu-ribu. Matur nuwun

sanget.

6. Semua Dosen Fakultas Sanata Dharma yang telah membagi ilmu.

7. Mas Gandung, Bu Nani, Mas Muji, Mas Doni terimakasih atas kerjasamanya

dalam proses administrasi kuliah, pengetesan dan peminjaman buku. *Pak

Gie terimakasih buat keramahannya*

8. Papa yang selalu menelpon menanyakan kabarku dan skripsiku. Thanks and

love u pa… Mama dan emak yang selalu menasihati. Uil yang selalu

membuat ketawa, jengkel, bangga dan makan terus ;). Mak’e, Alm. bapak’e

makasih buat kasih sayangnya. God Bless

9. Tante Tin, Om Yen dan Nana terimakasih buat supportnya, semoga

membanggakan kalian.

10. Mama Yan dan Om An terimakasih buat saran dan dukungannya.

11. Sahabat-sahabatku: Nana, Emak, Clara, Ngatini terimakasih buat

kebesamaannya selama kuliah, dukungan dan selalu kasih semangat biar aku

cepet nyelesain skripsi. Joko, Ko Edi, Koen thanks for always count on me.

Last but not least, thanks a lot to Mbudeng, u’re the best ever…u know me so

well…hahaha

12. Semua temen-temen angkatan 2007, teman seperjuangan Lili, Wini, Ina

Finally..we made it….!!!! Manda, Rani, Santa thanks ya uda bersama diakhir

(12)

xii

13. My mood booster Agnes Monica, u’re so inspiring and also NIC, esp

#timkompak (david, devi, hidz, ria, grace, zana) love y’all.

Yogyakarta, 15 Agustus 2011

(13)

xiii

DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PERSETUJUAN PEMBIMBING ... ii

HALAMAN PENGESAHAN ... iii

HALAMAN PERSEMBAHAN ... iv

PERNYATAAN KEASLIAN KARYA ... v

ABSTRAK ... vi

ABSTRACT ... vii

HALAMAN PERSETUJUAN PUBLIKASI ... ix

KATA PENGANTAR ... x

DAFTAR ISI ... xiii

DAFTAR TABEL ... xvi

DAFTAR LAMPIRAN ... xviii

BAB I. PENDAHULUAN ... 1

A. Latar Belakang ... 1

B. Rumusan Masalah ... 7

C. Tujuan Penelitian ... 7

D. Manfaat ... 8

BAB II. LANDASAN TEORI ... 9

A. Tes Psikologi... 9

1. Pengertian Tes Psikologi... 9

(14)

xiv

3. Tes Potensi Akademik ... 12

B. Kualitas Psikometrik ... 16

1. Reliabilitas Tes ... 16

2. Validitas Tes ... 20

3. Analisis Aitem ... 24

4. Norma ... 29

C. Tes Paralel... 32

D. Kerangka Penelitian ... 33

E. Pertanyaan Penelitian... 36

BAB III. METODE PENELITIAN ... 37

A. Jenis Penelitian ... 37

B. Identifikasi Variabel ... 37

C. Definisi Operasional ... 38

D. Subjek Penelitian ... 38

E. Metodde Pengambilan Data ... 38

F. Metode Analisis Data ... 38

BAB 1V. HASIL PENELITIAN DAN PEMBAHASAN ...41

A. Persiapan dan Pelaksanaan Penelitian... 41

B. Hasil Penelitian dan Pembahasan ... 41

1. Subtes Penalaran Verbal ... 41

2. Subtes Kemampuan Numerik ... 50

3. Subtes Penalaran Mekanik ... 57

(15)

xv

5. Subtes Bahasa Inggris ... 70

C. Keterbatasan Penelitian ... 77

BAB V. KESIMPULAN DAN SARAN ... 78

A. Kesimpulan ... 78

B. Saran ... 80

DAFTAR PUSTAKA ... 82

(16)

xvi

DAFTAR TABEL

Table 1. Kriteria Evaluasi Indeks Diskriminasi ... 27

Table 2. Distribusi Persentase dalam Pengubahan Skor Stanine ... 31

Table 3. Pedoman Penentuan Persentil Batas, Nilai Sten Scale dan Kualifikasinya ... 32

Subtes Penalaran Verbal Tabel 4. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... 42

Tabel 5. Daftar Aitem berdasarkan Efektivitas Distraktor ... 42

Tabel 6. Daftar Aitem yang Memiliki Karakteristik Sama dan Beda... 46

Tabel 7. Daftar Form ... 47

Tabel 8. Hasil Fit Indeks ... 48

Tabel 9. Norma Baru untuk Tiap Form. ... 50

Subtes Kemampuan Numerik Tabel 10. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... ... 50

Tabel 12. Daftar Aitem yang Memiliki Karakteristik Sama dan Beda ... 53

Tabel 15. Norma Baru untuk Tiap Form ... 57

Subtes Penalaran Mekanik Tabel 16. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... 57

(17)

xvii

Subtes Hubungan Ruang Tabel 22. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... 64

Subtes Bahasa Inggris Tabel 28. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p) ... 70

Tabel 30. Daftar Aitem yang Memiliki Karakteristik Sama dan Beda... 74

Tabel 34. Banyaknya Aitem untuk Tiap Subtes Berdasarkan Analisis Aitem (

r

ixdan p) ... 78

Tabel 35. Banyaknya Distraktor yang Perlu Direvisi untuk Tiap Subtes ... 78

(18)

xviii

DAFTAR LAMPIRAN

LAMPIRAN 1. GAMBAR SCATER PLOT

UNTUK TIAP SUBTES TPA PLUS ... 84

LAMPIRAN 2. GAMBAR MODEL PENELITIAN UNTUK TIAP FORM ... 88

LAMPIRAN 3. SUBTES PENALARAN VERBAL ... 99

Analisis Aitem ... 100

Analisis Faktor ... 105

Reliabilitas ... 109

Norma ... 110

LAMPIRAN 4. SUBTES KEMAMPUAN NUMERIK ... 113

Norma ... 123

LAMPIRAN 5. SUBTES PENALARAN MEKANIK ... 126

Norma ... 135

LAMPIRAN 6. SUBTES HUBUNGAN RUANG... 137

(19)

xix

Norma ... 146

LAMPIRAN 7. SUBTES BAHASA INGGRIS 148 Analisis Aitem ... 149

(20)

BAB I

PENDAHULUAN

A. Latar Belakang

Proses penerimaan mahasiswa baru adalah proses yang penting dalam

menjaring calon mahasiswa yang berkompeten. Hal ini dikarenakan

universitas adalah lembaga pendidikan tinggi yang memiliki kewajiban untuk

menyiapkan calon-calon pemimpin dan ilmuwan di masa mendatang.

Pelaksanaan seleksi calon mahasiswa memerlukan adanya prosedur yang baik

dan tepat agar bisa diperoleh mahasiswa yang memiliki kompetensi yang

diharapkan berhasil dalam kuliahnya.

Hal ini juga dilakukan oleh Universitas Sanata Dharma, yang

merupakan salah satu universitas swasta di Yogyakarta. Universitas Sanata

Dharma melakukan beberapa cara dalam menjaring calon mahasiswa, yaitu

melalui jalur kerja sama, pameran dan tes seleksi. Pelaksanaan tes seleksi

biasanya dilakukan oleh Pusat Pelayanan Tes dan Konsultasi Psikologi

(P2TKP), yaitu lembaga psikologi yang memfokuskan diri pada pelayanan

pengembangan sumber daya manusia yang meliputi tes psikologi, pelatihan,

dan konsultasi (www.usd.ac.id).

Alat tes yang biasa digunakan oleh P2TKP dalam proses

penerimaan mahasiswa baru adalah Tes Potensi Akademik Plus atau sering

disebut TPA Plus. Tes ini terdiri 4 subtes bakat adaptasi DAT (Differential

(21)

Aptitude Test), yaitu Penalaran Verbal, Kemampuan Numerik, Penalaran

Mekanik, dan Hubungan Ruang dan satu Tes Bahasa Inggris (Etikawati,

2004).

Pada awalnya tes masuk yang dimiliki Universitas Sanata Dharma

terdiri dari 4 subtes Umum dan 4 subtes Khusus. Tes ini kemudian dibuat

lebih singkat berdasarkan penelitian yang dilakukan oleh Supratiknya,

Suhartanto, dan Anantasari (1999) yang menunjukkan bahwa korelasi antar

skor total Tes Umum dan skor total Tes Khusus baik IPA maupun IPS

ternyata positif dan sangat signifikan. Hasil tersebut dapat diartikan bahwa

kedua kelompok tes tersebut berfungsi sebagai 2 metode untuk mengukur

sifat dan kemampuan yang sama. Oleh karena itu, tidak perlu menggunakan

kedua kelompok tes tersebut untuk tujuan yang sama, yaitu seleksi

penerimaan mahasiswa baru.

Sejak tahun 1988 hingga sekarang, penelitian atau evaluasi

terhadap alat tes masuk, baru dilakukan empat kali. Pertama, Supratiknya,

Suhartanto, dan Anantasari (1999) melakukan evaluasi mengenai kualitas alat

seleksi sehingga menghasilkan TPA plus. Raharjo (2003) melakukan

penelitian mengenai validitas prediktif tes masuk dengan Indeks Prestasi

Kumulatif (IPK) mahasiswa psikologi 1998 sebagai kriterionnya. Hasil

penelitian tersebut menunjukkan bahwa ada hubungan yang positif antara

(22)

Widodo (2004) melakukan penelitian tentang kemampuan prediktif

TPA Plus terhadap IPK mahasiswa program studi ilmu pengetahuan alam.

Hasil yang diperoleh dari penelitian tersebut adalah secara umum pada

berbagai program studi ilmu pengetahuan alam, ada hubungan yang positif

dan sangat signifikan antara skor tes potensi akademik plus dengan IPK.

Namun pada program studi Ilmu Komputer, ditemukan hubungan yang tidak

signifikan. Hal ini dimungkinkan karena jumlah subjek yang terlalu sedikit.

Etikawati (2004) juga melakukan penelitian yang sama dengan subjek

yang berbeda, yaitu mahasiswa program studi sosial. Hasil penelitian

tersebut menunjukkan bahwa TPA Plus berkorelasi positif dengan IPK.

Korelasi positif tersebut signifikan untuk 9 dari 12 program studi Ilmu Sosial.

Program studi yang memiliki korelasi tidak signifikan adalah Sastra

Indonesia, Sejarah dan Psikologi. Secara umum hal ini menunjukkan bahwa

TPA Plus cukup berdaya guna sebagai prediktor, walaupun nilai koefisien

korelasinya rendah.

Penelitian selanjutnya dilakukan oleh Wicaksono (2006) tentang

analisis faktor pada TPA Plus. Hasil analisis faktor TPA Plus dengan

menggunakan data skor angkatan 2002 – 2003 mengungkap adanya 2 faktor,

yaitu faktor mekanik-matematika (non verbal) dan faktor verbal. Faktor

mekanik-matematika (non verbal) disusun oleh variabel Kemampuan

Numerik, variabel Penalaran Mekanik dan variabel Hubungan Ruang.

(23)

Bahasa Inggris. Penelitian ini juga melakukan korelasi antara faktor 1 dan 2

dengan IPK. Koefisien korelasi antara faktor 1 dan IPK adalah -0.294 dengan

p = 0.001. Dalam hal ini, apabila nilai IPK tinggi maka mahasiswa memiliki

skor faktor 1 yang rendah. Sedangkan koefisien korelasi antara faktor 2 dan

IPK adalah 0.066 namun tidak signifikan (p = 0.243 ).

Penelitian-penelitian yang telah dilakukan biasanya hanya

menggunakan validitas sebagai parameter yang diteliti dan tidak membahas

mengenai reliabliitas dan kualitas aitem tes tersebut. Suatu alat tes perlu

dilakukan evaluasi mengenai reliabilitasnya karena reliabilitas adalah salah

satu syarat untuk tes yang baik. Reliabilitas sendiri adalah parameter yang

menunjukan keajegan suatu pengukuran ketika prosedur pengetesan diulang

pada populasi individu atau kelompok (AERA, 1999). Selain itu, masih

terdapat parameter-parameter lain yang perlu dicek kualitasnya, misalnya

kualitas aitem. Suatu tes perlu dilihat kualitas aitemnya karena penting untuk

mengidentifikasikan aitem-aitem yang tidak memuaskan dari tes sebelumnya

sehingga perlu direvisi, dihilangkan atau digantikan dengan aitem yang baru

(Gregory, 1996).

Hal lain yang perlu diperhatikan adalah masalah efisiensi. Alat tes

sebaiknya memiliki nilai efisiensi baik dalam hal waktu, ekonomi dan teknis.

Hal ini selaras dengan pernyataan Azwar (1997) bahwa kriteria suatu tes

dikatakan baik apabila mempunyai nilai ekonomis dan praktis. Pada

(24)

karena pengerjaannya yang cukup lama. TPA plus yang terdiri dari 5 subtes

memiliki waktu pengerjaan sebanyak 200 menit ditambah dengan waktu

pembagian dan pengumpulan buku soal serta pemberian instruksi. Hal ini

dapat menyebabkan kelelahan mental pada subjek yang berakibat pada

berkurangnya cadangan energi dan meningkatnya sisa metabolisme sebagai

penyebab hilangnya efisiensi otot (Suma’mur,1996). Keadaan ini dapat

berpengaruh pada cara pengerjaan dan hasil tes karena selama pengerjaan tes

tidak diberikan waktu istirahat khusus.

Bagian Humas Universitas Sanata Dharma pun mengakui bahwa

lamanya waktu pengerjaan di sisi lain membuat kendala saat melakukan

pameran universitas di sekolah-sekolah. Pemeran ini bertujuan untuk

mengenalkan Universitas Sanata Dharma pada sekolah-sekolah yang ada

diluar kota. Pada pameran seperti ini biasanya tes seleksi diadakan agar siswa

yang berminat bisa langsung mendaftar dan mengikutinya. Pada

kenyataannya, para siswa lebih memilih universitas yang memiliki tes dengan

waktu pengerjaan yang tidak terlalu lama agar bisa mengikuti tes dari

universitas lainnya. Beberapa universitas swasta yang menjadi kompetitor

saat pameran tersebut memiliki tes seleksi yang waktu pengerjaannya 1.5

sampai 2 jam (Setyahandana, komunikasi pribadi tanggal 13 Desember 2010

dan 1 Agustus 2011).

Lamanya waktu pengerjaan juga menambah biaya pengeluaran saat

(25)

banyaknya butir soal membuat buku lebih tebal sehingga terapa berat saat

membawanya dan perlu mengeluarkan biaya lagi untuk bagasi pesawat. Oleh

karena itu, Ketua Humas Universitas Sanata Dharma mengatakan bahwa jika

tes TPA Plus lebih pendek maka buku akan lebih tipis sehingga ringan dalam

membawanya. Waktu pengerjaan tes pun bisa lebih cepat sehingga

meminimalkan biaya pada saat di luar kota (Setyahandana, komunikasi

pribadi tanggal 13 Desember 2010).

Dari uraian diatas dapat disimpulkan bahwa ada beberapa masalah

dengan TPA Plus, yaitu bagaimana reliabilitas dan kualitas aitem dari TPA

Plus saat ini dan kurangnya nilai efisiensi penggunaan TPA Plus. Penelitian

ini akan dilakukan untuk mengevaluasi kualitas psikometrik TPA Plus yang

mencakup reliabilitas, validitas dan analisis aitem. Analisis aitem dilakukan

dengan harapan dapat mengatasi kekurangan dari penelitian sebelumnya yang

memperoleh koefisien korelasi yang rendah antara hasil tes dengan IPK.

Lebih lanjut, peneliti juga akan melakukan usaha meningkatkan efisiensi TPA

Plus dengan memperpendek tes namun tetap menjamin bahwa alat tes

tersebut dapat dipertanggungjawabkan dalam hal reliabilitas dan validitasnya.

Peneliti berharap penelitian ini dapat bermanfaat untuk pihak universitas baik

P2TKP maupun Humas Universitas Sanata Dharma dalam melakukan seleksi

(26)

B. Rumusan Masalah

1. Bagaimana taraf kesukaran aitem TPA Plus yang dimiliki P2TKP

Universitas Sanata Dharma?

2. Bagaimana korelasi aitem total pada TPA Plus?

3. Bagaimana efektifitas distraktor pada TPA Plus?

4. Apakah jumlah aitem-aitem TPA Plus dapat dikurangi untuk

meningkatkan efisiensi?

5. Bagaimana reliabilitas dari TPA Plus setelah diperpendek?

6. Bagaimana validitas dari TPA Plus setelah diperpendek?

7. Bagaimana norma baru dari TPA Plus setelah diperpendek?

C. Tujuan Penelitian

Penelitian ini memiliki tujuan:

1. Menetukan taraf kesukaran aitem-aitem TPA Plus.

2. Mengetahui besarnya korelasi aitem total TPA Plus.

3. Mengetahui efektivitas distraktor pada TPA Plus.

4. Mengidentifikasi aitem-aitem dengan karakteristik yang sama dalam

rangka memperpendek tes TPA Plus untuk meningkatkan efisiensi.

5. Mengetahui besarnya koefisien reliabilitas TPA Plus setelah diperpendek.

6. Mengetahui besarnya koefisien validitas TPA Plus setelah diperpendek.

(27)

D. Manfaat

1. Manfaat Teoritik

Hasil yang diperoleh dari penelitian ini diharapkan dapat menjadi bahan

informasi dan pertimbangan yang bermafaat untuk penelitian mengenai

kualitas psikometrik dari TPA Plus

2. Manfaat Praktis

Bagi P2TKP Universitas Sanata Dharma dapat memperoleh informasi

terbaru mengenai kualitas psikometrik TPA Plus yaitu mengenai validitas,

reliabilitas dan kualitas aitemnya. Selain itu, dengan adanya perpendekan

alat tes, diharapkan dapat memaksimalkan kerja calon mahasiswa baru

(28)

BAB II

LANDASAN TEORI

A. Tes

1. Pengertian Tes

Dilihat dari wujud fisiknya, suatu tes tidak lain daripada

sekumpulan pertanyaan yang harus dijawab dan/atau tugas yang harus

dikerjakan dan akan memberikan informasi mengenai aspek psikologis

tertentu berdasarkan jawaban terhadap pertanyaan-pertanyaan atau cara

dan hasil subjek dalam melakukan tugas-tugas tersebut (Azwar. 1996).

Gregory (1996) mendeskripsikan suatu tes adalah prosedur yang

standart untuk memperoleh sampel perilaku dan mendeskripsikannya

berdasarkan kategori atau skor. Anastasi & Urbina (1997) menjelaskan

bahwa tes adalah pengukuran yang objektif dan standart terhadap sampel

perilaku.

Friedenberg (1995) menyebutkan bahwa tes adalah salah satu tipe

asesmen yang menggunakan prosedur yang spesifik atau sistematik untuk

menemukan informasi dan mengubah informasi tersebut kedalam bentuk

angka atau skor.

Dari berbagai penjelasan mengenai tes di atas, maka dapat

disimpulkan bahwa tes adalah sekumpulan pertanyaan atau tugas-tugas

yang objektif, standar, dan sistematik untuk mengamati dan mengukur

perilaku seseorang.

(29)

2. Karakteristik Tes yang Baik

Tes yang baik harus didesain secara hati-hati dan dievaluasi secara

empiris untuk memastikan bahwa tes tersebut berguna dalam

menghasilkan informasi akurat. Menurut Friedenberg (1995), karakteristik

tes yang baik dibedakan menjadi dua, yaitu:

a. Sifat Konstruksi atau Desain

1) Tujuan tes yang jelas

Hal ini mengacu pada tiga hal, yaitu kawasan ukur,

pengguna tes dan penilaian tesnya dari aitem yang berbeda-beda.

2) Isi yang spesifik dan standar

Isi tes dikatakan spesifik apabila tes itu mencakup sebatas

kawasan ukurnya sehingga pertanyaanya dipilih sesuai dengan

tujuan yang telah ditetapkan. Sedangkan tes dikatakan standar

apabila semua subjek memiliki atribut atau pengetahuan yang

sama.

3) Prosedur administrasi yang baku

Penyelenggaran sebuah tes yang meliputi perlengkapan,

situasi, cara penyajian, petunjuk cara pengerjakan serta waktu yang

disediakan untuk mengerjakan tes tersebut harus distandarisasikan.

Kondisi yang standar digunakan agar skor tes yang dihasilkan

(30)

4) Aturan penilaian

Prosedur penilaian ini harus menggunakan cara yang sama

pada semua subjek. Aturan penilaian ini meliputi cara memberi

skor, pertimbangan untuk menentukan skor (ada kunci), sistem

penilaian (lambang-lambang yang digunakan serta artinya)

b. Sifat Psikometrik

1) Reliabilitas

Ide pokok dari konsep reliabilitas adalah sejauhmana hasil

suatu pengukuran dapat dipercaya. Hasil pengukuran dapat

dipercaya hanya apabila dalam beberapa kali pelaksanaan

pengukuran terhadap kelompok subjek yang sama diperoleh hasil

yang relatif sama, selama aspek yang diukur dalam diri subjek

memang belum berubah (Azwar, 1997)

2) Validitas

Suatu alat tes dikatakan memiliki validitas yang baik

apabila mampu menjalankan fungsi ukur dan memberikan hasil

ukur yang tepat dan akurat sesuai dengan maksud tes tersebut

(Azwar, 1997).

3) Analisis aitem

Analisis aitem dipandang penting untuk

mengidentifikasikan aitem-aitem yang perlu direvisi, dengan

(31)

meningkatkan reliabilitas dan validitas secara keseluruhan

(Friedenberg, 1995)

3. Tes Potensi Akademik

Tes potensi akademik adalah tes yang mempunyai tujuan untuk

mengungkap potensi seseorang dalam mempelajari pengetahuan atau

keterampilan (Etikawati, 2004). Berdasarkan saran penelitian yang

dilakukan oleh Supratiknya, Suhartanto dan Anantasari (1999) maka tes

potensi akademik yang saat ini digunakan oleh Universitas Sanata Dharma

adalah hasil gagasan dasar DAT (Differential Aptitude Test).

DAT dikembangkan pada tahun 1947 untuk memberikan prosedur

yang terintergrasi, ilmiah dan memiliki standart yang baik dalam

mengukur bermacam-macam kemampuan individu. Baterai tes ini

biasanya kejuruan dan bimbingan pendidikan murid setingkat SMA. Tes

ini terdiri dari 7 subtes, yaitu Penalaran Verbal, Penalaran Numerik,

Penalaran Abstrak, Kecepatan dan Ketepatan Klerikal, Penalaran Mekanik,

Hubungan Ruang dan Penggunaan Bahasa: Ejaan dan Tata Bahasa

(Bennett, Seashore & Wesmen, 1966).

Penalaran Verbal, Kemampuan Numerik dan Penalaran Abstrak

bersama-sam mengukur fungsi-fungsi yang berkaitan dengan kecerdasan

umum. Selain itu, Penalaran Verbal dan Kemampuan Numerik memiliki

(32)

prestasi akademik, sehingga skor kedua subtes ini sering disebut sebagai

indeks umum bakat sekolah. Sedangkan, Penalaran Mekanik dan

Hubungan Ruang memberi kontribusi dalam kaitannya mengukur

kemampuan siswa untuk memvisualisaikan benda-benda kongkrit dan

memanipulasi proses visualisasi dan mengenal prinsip fisika sederhana.

Kecepatan dan Ketepatan Klerikal serta Penggunaan Bahasa: Ejaan dan

Tata Bahasa merupakan tes yang merepresentasikan keterampilan yang

dibutuhkan dalam level pekerjaan (Anastasi & Urbina, 1997; Bennett,

Seashore & Wesmen, 1966).

Penelitian yang dilakukan oleh Supratiknya, Suhartanto, Anantasari

(1999) menyarankan untuk menggunakan 4 subtes adaptasi DAT yaitu

Penalaran Verbal, Kemampuan Numerik, Penalaran Mekanik dan

Hubungan ruang. Dipilihnya 4 subtes ini bertolak dari hasil penelitian

tentang Tes Umum dan mempertimbangkan gagasan dasar dari DAT yang

merupakan sumber dari Tes Umum serta memperhatikan jenis program

studi yang ada di Universitas Sanata Dharma. Selain empat subtes tersebut,

adapula subtes Bahasa Inggris. Subtes ini merupakan salah satu subtes dari

Tes Khusus IPA yang terbukti baik kuliatasnya sehingga tes ini tetap

digunakan.

Berikut adalah penjelas dari masing-masing subtes yang ada dalam

(33)

a. Tes Penalaran Verbal

Tes ini mengungkap kemampuan di dalam memahami

konsep-konsep yang disusun dalam kata-kata. Tes ini dipakai untuk

mengevaluasi kemampuan seseorang dalam berpikir konstruktif,

menentukan kesamaan diantara konsep-konsep yang berbeda dan dalam

tingkat abstraksi dapat memanipulasi ide-ide. Tes ini dapat

memprediksi keberhasilan seseorang di bidang yang memerlukan

pemahaman hubungan verbal yang kompleks dan kecakapan dalam

memanipulasi konsep-konsep secara verbal, misalnya dalam

keberhasilannya dalam bidang akademik.

b. Tes Kemampuan Numerik

Tes ini lebih sering disebut arithmetic computation daripada

disebut arithmetic reasoning. Hal ini dikarenakan aitem-aitem dalam

tes ini disusun untuk mengukur pemahaman yang berkaitan dengan

proses numerik dan kecakapan menggunakan konsep-konsep numerik

melalui perhitungan yang sederhana. Tes ini juga menghindari

penggunaan unsur-unsur bahasa yang biasa digunakan dalamarithmetic

reasoning.

c. Tes Penalaran Mekanik

Kemampuan yang diungkap dalam tes ini adalah dapat

menggambarkan salah satu aspek intelegensi dalam arti luas. Seseorang

yang dapat mengerjakan tes ini akan dapat mempelajari prinsip-prinsip

(34)

Aspek yang diukur adalah daya penalaran di bidang kerja mekanis dan

prinsip fisika. Tes ini dapat memprediksi cocok tidaknya seseorang

dalam pekerjaan atau pendidikan di bidang mekanik atau mesin, seperti

pertukangan, ahli mesin, pemeliharaan mesin dan perakitan

d. Tes Hubungan Ruang

Tes ini digunakan untuk mengukur kemampuan penalaran

seseorang yang bersifat nonverbal atau mengukur kemampuan

seseorang dalam berpikir dengan menggunakan simbol-simbol abstrak.

Untuk menyelesaikan tes ini diperlukan kemampuan persepsi karena

aitem-aitem tes disusun atas dasar prinsip adanya hubungan yang logis

dari figur-figur abstrak.

e. Tes Bahasa Inggris

Adalah tes yang mengukur kemampuan penguasaan subjek atas

tata bahasa dan kosa kata Bahasa Inggris sebagai bahasa asing.

Urutan penyajian dalam tes seleksi penerimaan mahasiswa baru di

Universitas Sanata Dharma adalah Penalaran Verbal, Kemampuan

Numerik, Penalaran Mekanik, Hubungan Ruang dan yang terakhir adalah

Bahasa Inggris. Setiap tes memiliki jumlah aitem yang berbeda-beda.

Penalaran Verbal memiliki 40 aitem, Kemampuan Numerik 40 aitem,

Penalaran Mekanik 30 aitem, Hubungan Ruang 30 aitem dan Bahasa

Inggris memiliki 40 aitem. Oleh karena itu, alokasi waktu untuk

pengerjaannya juga berbeda. Penalaran Verbal, Kemampuan Numerik,

(35)

waktu yang diperlukan adalah 40 menit, 40 menit, 40 menit, 30 menit, dan

50 menit. Total waktu yang dibutuhkan untuk mengerjakan Tes Potensi

Akademik plus adalah 200 menit.

B. Kualitas Psikometri

1. Reliabilitas Tes

Ide pokok dari konsep reliabilitas adalah sejauhmana hasil suatu

pengukuran dapat dipercaya. Hasil pengukuran dapat dipercaya hanya

apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok

subjek yang sama diperoleh hasil yang relatif sama, selama aspek yang

diukur dalam diri subjek memang belum berubah (Azwar, 1997)

Pengertian reliabilitas alat ukur dan hasil ukur biasanya dianggap

sama, namun penggunaannya masing-masing perlu diperhatikan. Konsep

reliabilitas dalam arti reliabilitas alat ukur erat berkaitan dengan masalah

eror pengukuran. Eror pengukuran sendiri menunjukkan pada sejauh mana

inkonsistensi hasil pengukuran apabila pengukuran dilakukan ulang pada

kelompok subjek yang sama. Sedangkan konsep reliabilitas dalam arti

reliabilitas hasil ukur erat hubungannya dengan eror dalam pengambilan

sampel yang mengacu pada inkonsistensi hasil ukur apabila pengukuran

dilakukan ulang pada kelompok individu yang berbeda (Azwar, 1997).

Ada beberapa pendekatan yang dapat dilakukan untuk

(36)

a. Pendekatan Tes Ulang

Pendekatan ini dilakukan dengan cara memberikan tes yang

sama pada sekelompok subjek dengan selang waktu yang berbeda

(Azwar, 2001). Pendekatan ini memiliki kelemahan yaitu adanya proses

belajar, pengalaman dan perubahan motivasi subjek antara pemberian

tes yang pertama dan yang kedua (Suryabrata, 1999)

b. Pendekatan Bentuk Paralel

Pendekatan ini dilakukan dengan memberikan sekaligus 2 tes

yang paralel satu sama lain kepada sekelompok subjek. Dalam

pelaksanaannya kedua tes paralel tersebut dapat digabungkan terlebih

dahalu, sehingga seakan-akan merupakan satu bentuk tes. (Azwar,

1997). Keterbatasan pendekatan ini adalah pada sulitnya menyusun 2

alat tes yang paralel (Suryabrata, 1999)

c. Pendekatan Konsistensi Internal

Pendekatan ini digunakan untuk menghindari masalah-masalah

yang biasanya ditimbulkan oleh pendekatan tes ulang dan paralel.

Pendekatan ini hanya memerlukan satu kali pengenaan sebuah tes

kepada sekelompok individu sebagai subjek (single trial

administration). Selanjutnya prosedur analisisnya diarahkan pada

analisis terhadap aitem atau kelompok aitem dalam tes tersebut

sehingga perlu dilakukan pembelahan tes menjadi beberapa kelompok

(37)

ini memiliki berbagai teknik dalam estimasi reliabilitas (Suryabrata,

1999), yaitu:

1) Teknik Belah Dua

Suatu perangkat tes diberikan kepada sekolompok subjek

satu kali. Kemudian skor yang diperoleh dibelah menjadi 2 bagian

yang setara dengan cara soal yang bernomor gasal dijadikan dalam

satu kelompok, begitu pula dengan soal bernomor genap. Estimasi

reliabilitas dicari denga menghitung korelasi skor pada belahan

pertama dengan skor pada belahan kedua, rhh.

2) Rumus Rulon

Rulon (1939) merumuskan suatu formula untuk

mengestimasi reliabilitas belah dua tanpa perlu berasumsi bahwa

kedua belahan mempunyai varians yang sama. Hal ini dikarenakan

perbedaan skor subjek pada kedua belahan tes akan membentuk

distribusi perbedaan skor dengan varians yang besarnya ditentukan

oleh varians eror masing-masing belahan (Azwar, 1997).

3) Rumus Flanagan

Flanagan menganggap bahwa varians-varians pada

perangkat belahan tes merupakan varians keliruan pengukuran.

4) Teknik KR20

Teknik ini dilakukan dengan cara membelah tes menjadi

sebanyak jumlah aitemnya sehingga setiap belahan hanya berisi

(38)

reliabilitas dari semua cara belah dua yang mungkin dilakukan.

Koefisien ini juga mencerminkan sejauhmana kesetaraan isi

aitem-aitem dalam tes (Azwar, 1997). Teknik KR20 ini dapat digunakan

pada tes yang menggunakan aitem dikotomi, seperti tes

kepribadian, minat, dan sikap (Friedenberg, 1995).

5) Teknik KR21

Teknik ini digunakan pada tes yang aitem-aitem nya diskor

benar atau salah (Friedenberg, 1995).

6) Teknik Analisis Varians

Teknik ini dipopulerkan oleh Hoyt. Dalam karyanya,

varians total dianalisis menjadi proporsi yang berasal dari peserta

tes, proporsi yang berasal dari soal-soal tes dan sisanya

(Suryabrata, 1999).

7) Koefisien Alpha

Koefisien alpha adalah estimasi konservatif dalam internal

konsistensi tes karena membandingkan performasi setiap tes

dengan performansi keseluruhan aitem (Friedenberg, 1995).

Prosedurnya adalah menemukan varian semua skor individu untuk

tiap soal, kemudian menambahkan varian-varian ini sepanjang

semua soal (Anastasi & Urbina, 1997).

Setelah diketahui bagaimana cara melakukan estimasi reliabilitas,

maka perlu diketahui pula mengenai standart atau kriteria untuk

(39)

Steiner & Norman, 1995) kriteria yang baik adalah minimum 0.94,

sedangkan Weiner dan Stewart (dalam Steiner & Norman, 1995)

mengajukan kriteria yang baik adalah 0.85. Murphy & Davidshofer

(1991) mengajukan koefisien relibilitas yang baik untuk tipestandardized

group tests of intelligence yaitu 0.90. Helmstadter (dalam Friedenberg,

1995) juga mengajukan koefisien reliabilitas yang baik untuk tipe tes

bakat, yaitu 0.96.

Jika suatu tes digunakan untuk melakukan individual judgement

maka tes tersebut harus lebih reliabel daripada tes yang digunakan untuk

membuat keputusan kelompok ataupun penelitian. Oleh karena itu, perlu

standart atau kriteria koefisien reliabilitas yang tinggi (Steiner & Norman,

1995).

2. Validitas Tes

Validitas adalah salah satu syarat penting bagi sebuah alat tes. Alat

tes yang valid akan dapat memberikan informasi yang dapat dipercaya

sehingga nantinya dapat diambil keputusan yang tepat sesuai dengan

tujuan yang dikehendaki. Oleh karena itu, perlu adanya usaha untuk

mengembangkan parameter ini. Saat ini, konsep mengenai validitas sudah

mengalami evolusi sehingga akan terlihat perpedaan antara konsep yang

lama dan yang baru (Azwar, 1997, Santoso, 2010).

Secara garis besar, konsep validitas yang lama mengacu pada

(40)

tidaknya alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki

dengan tepat. Dengan pengertian tersebut, maka diperoleh hasil yaitu suatu

alat tes yang valid dan alat tes yang tidak atau kurang valid. Sedangkan

konsep validitas yang baru menjelaskan bahwa validitas adalah suatu

rangkuman dari bukti-bukti yang dihasilkan. Maksudnya adalah suatu alat

tes tidak mungkin mempunyai kebenaran mutlak sehingga perlu adanya

bukti-bukti yang mendukung interpretasi dan kegunaan skor. Oleh karena

itu, validitas tidak bersifat diskrit, yaitu valid atau tidak valid, namun

memiliki makna tingkatan sehingga validitas merupakan suatu proses yang

tidak pernah berhenti (AERA, 1999, Santoso, 2010). Sumber-sumber

validitas didapatkan berdasarkan (AERA, 1999):

a. Isi Tes

Bukti validitas ini dapat diperoleh dari analisis hubungan antara

isi tes dan konstruk dari tes itu sendiri. Analisis tersebut dapat

menjelaskan apakah isi merepresentasikan domain materi dari suatu alat

tes serta relevansi domain materi dalam menginterpretasi skor tes.

Analisis ini dapat berasal dari penilaian ahli (expert judgement)

mengenai hubungan antara bagian-bagian tes dan konstruknya.

b. Proses Respon

Analisis teoritik dan empirik dari proses respon dapat

memberikan bukti dalam hal kecocokan antara konstruk dan

performansi atau respon alami yang sebenarnya dilakukan oleh testee.

(41)

tes mengenai strategi performansi atau responnya terhadap suatu aitem.

Cara lainnya adalah dengan melakukan observasi untuk merekam atau

mengevaluasi performansi testee. Oleh karena itu, validasi termasuk

studi empiris mengenai bagaimana observer dan judges (penilai)

mengevaluasi data dengan menganalisis kesesuaian antar proses dengan

interpretasi atau definisi konstruk.

c. Struktur Internal

Analisis ini dapat memberikan informasi apakah aitem-aitem

dalam suatu tes sesuai atau dapat mengungkap konstruk yang hendak

diukur (AERA, 1999, Azwar, 1997). Analisis ini dapat dilakukan

dengan menggunakan teknik analisis faktor. Teknik ini merupakan

kumpulan prosedur matematik yang kompleks guna menganalisis saling

hubungan variabel-variabel dan menjelaskan saling hubungan tersebut

dalam bentuk kelompok variabel yang terbatas yang disebut dengan

faktor (Azwar, 1997). Kegunaan dari analisis faktor ini adalah:

1) Mereduksi atau mengurangi variabel dengan tetap mempertahankan

informasi yang terkandung didalamnya.

2) Mengidentifikasi dimensi laten yang mendasari variabel-variabel.

3) Konfirmasi struktur dari suatu set variabel atau konstruk.

Menurut Hair, Anderson, Tattham dan Black (dalam

(42)

1) Confirmatory

Analisis Faktor yang bertujuan untuk mengevaluasi tingkat

keakurasian prediksi faktor-faktor yang ada dalam sebuah tes. Cara

yang digunakan dalam analisis adalah mengkonfirmasikan apakah

skor hasil tes dan variabel yang ada dalam tes memiliki kesesuain

dengan konstruk teori yang ingin diungkap.

2) Exploratory

Analisis ini akan membuat faktor yang dihasilkan lebih

sedikit dibandingkan dengan varibel yang ada dalam suatu tes.

d. Hubungan dengan Variabel Lain

Sumber validitas yang lainnya adalah analisis hubungan skor tes

dengan variabel atau kriteria eksternal. Suatu kriteria adalah variabel

perilaku yang akan diprediksikan oleh skor tes. Oleh karena itu, perlu

adanya komputasi korelasional antar skor tes dengan skor kriteria

(AERA, 1999, Azwar, 1997).

e. Konsekuensial

Menurut Messick (dalam Santoso, 2010) ada 2 aspek dari

validitas konsekuensial, yaitu:

1) Terkait dengan interpretasi dari hasil tes, maksudnya adalah

validitas konsekuensial merupakan suatu penilaian terhadap suatu

makna dari nama konstruk yang dipilih. Hal lain yang terkait

adalah teori yang mendasari interpretasi skor tes dan ideologi yang

(43)

2) Terkait dengan penggunaan tes, maksudnya adalah validitas

konsekuensial merupakan penilaian mengenai konsekuensi sosial

yang nyata dari pengguna tes dan penerapan tindakan berdasarkan

hasil tes.

3. Analisis Aitem

Analisis aitem merupakan prosedur kerja dalam melakukan

pengujian seluruh aitem tes yang didasarkan pada data empirik

(Suryabrata, 1999). Ada berbagai aitem statistik yang dapat dihitung

dengan berbagai teknik perhitungan. Ada 3 teknik perhitungan yang

biasanya sering digunakan, yaitu taraf kesukaran aitem, diskriminasi

aitem dan efektivitas distraktor. Teknik tersebut biasanya digunakan untuk

tes kemampuan (pilihan ganda), namun dua dari teknik tersebut, yaitu taraf

kesukaran aitem dan diskriminasi aitem dapat digunakan untuk

menganalisis jawaban pendek, essay dan juga tes kepribadian, minat dan

sikap.

Berikut adalah penjelasan dari ketiga teknik yang biasa digunakan

dalam proses analisis aitem :

a. Taraf Kesukaran Aitem

Suatu tes dirancang untuk menilai seakurat mungkin tingkat

pencapaian individu dalam kemampuan tertentu. Oleh karena itu, perlu

dilakukan pengukuran taraf kesukaran aitem yang bertujuan untuk

memilih aitem dengan tingkat kesukaran yang sesuai. Jika ada suatu

(44)

dengan benar oleh semua testee, maka aitem tersebut tidak dapat

memberikan informasi apa pun tentang perbedaan-perbedaan individu.

Selain itu, aitem tersebut juga tidak memberikan sumbangan reliabilitas

ataupun validitas pada tes itu (Anastasi, 1997).

Taraf kesukaran aitem dinyatakan dalam harga p yang

mempunyai proporsi yang bervariasi antara 0.0 dan 1.0. Jika harga p

mendekati 0.0 maka tidak ada seorang pun yang menjawab benar aitem

tersebut (terlalu sulit). Apabila harga p mendekati 1.0 maka banyak

orang yang menjawab dengan benar aitem tersebut, maka tidak ada

perbedaan individu dalam yang disumbangkan oleh aitem-aitem

tersebut. Biasanya digunakan batasan antara 0.30 sampai dengan 0.70

untuk menentukan apakah suatu aitem memiliki taraf kesukaran yang

baik atau tidak (Gregory, 1996)

Teknik ini cocok untuk tes yang mengukur performansi

maksimal seseorang seperti tes prestasi dan tes bakat. Hal ini

dikarenakan aitem tes yang dianalisis adalah yang memiliki jawaban

benar atau salah.

b. Analisis Diskriminasi Aitem

Berbeda dengan analisis taraf kesukaran aitem, analisis ini

cocok digunakan pada hampir semua jenis tes. Analisis ini

menunjukkan tingkat perbedaan tipe individu yang menjawab sebuah

(45)

Ada 2 pendekatan yang digunakan untuk mengevaluasi

diskriminasi aitem, yaitu (Friedenberg, 1995):

1) Indeks Diskriminasi Aitem

Indeks diskriminasi merupakan indeks statistik yang

menyatakan seberapa efisien suatu aitem dapat membedakan antara

individu-individu yang memperoleh skor tinggi dan rendah dalam

suatu tes. Indeks diskriminasi disimbolkan dengan huruf d.

Formula dari indeks diskriminasi adalah (Gregory, 1996):

d: (U - L) / N

Ket:

U: jumlah peserta tes bagian atas yang menjawab benar.

L: jumlah peserta tes bagian bawah yang menjawab benar.

N: jumlah total peserta tes.

Suatu aitem dikatakan memiliki daya diskriminasi yang

tinggi apabila aitem tersebut dapat dijawab dengan benar oleh

semua atau sebagian besar subjek kelompok atas (Kelompok

Tinggi - 27% dari skor tertinggi) dan tidak dapat dijawab dengan

benar oleh semua atau sebagaimana besar subjek kelompok bawah

(Kelompok Rendah – 27% dari skor terendah). Semakin besar

perbedaan proporsi penjawab benar dari Kelompok Tinggi dan

Kelompok Rendah, semakin besar pula daya diskriminasi suatu

(46)

Tinggi dan Kelompok Rendah tersebut sama, maka aitem tersebut

tidak mampu membedakan subjek yang memiliki kemampuan

tinggi dan rendah. Terlebih lagi, jika proporsinya terbalik dimana

penjawab benar dari Kelompok Tinggi lebih sedikit dibanding

penjawab benar dari Kelompok Rendah (Murphy & Davidshofer,

1991).

Ebel (dalam Azwar, 1997) menyarankan kriteria evaluasi

indeks diskriminasi dalam empat kategori:

Tabel 1. Kriteria Evaluasi Indeks Diskriminasi

Indeks Diskriminasi Evaluasi

0.4 atau lebih Bagus sekali 0.30 – 0.39 Cukup baik tapi perlu

peningkatan

0.20 – 0.29 Belum memuaskan, perludiperbaiki Kurang dari 0.20 Jelek dan harus dibuang

2) Korelasi Aitem Total

Korelasi aitem total adalah konsistensi atau keselaran

antara aitem dengan tes secara keseluruhan. Dasar kerja yang

digunakan adalah memilih aitem yang mengukur hal yang sama

dengan apa yang diukur oleh tes secara keseluruhan. Pengujian

tersebut dilakukan dengan cara mengkomputasi koefisien korelasi

antara distribusi skor pada setiap aitem dengan skor total itu

(47)

Semakin tinggi korelasi positif antara skor aitem dengan

skor tes berarti semakin tinggi konsistensi antar aitem tersebut

dengan tes keseluruhan. Sebaliknya, apabila semakin rendah

koefisien korelasi atau mendekati nol maka fungsi aitem tersebut

tidak cocok dengan fungsi ukur tes. Terlebih lagi bila koefisien

korelasi berharga negatif, artinya terdapat cacat serius pada aitem

yang bersangkutan. (Azwar, 1997). Koefisien rix yang kurang dari

0.3 biasanya dianggap kurang memuaskan (Azwar dalam Prakoso,

1998).

3) Analisis Efektifitas Distraktor

Efektifitas distraktor yang ada pada suatu aitem dianalisis

dari distribusi jawaban terhadap aitem yang bersangkutan pada

setiap alternatif jawaban yang disediakan. Efektifitas distraktor ini

dilakukan untuk melihat apakah semua distraktor yang tersedia

telah berfungsi sebagaimana mestinya, yaitu apakah

distraktor-distraktor tersebut telah dipilih oleh sebagian atau semua subjek

Kelompok Rendah, sedangkan subjek dari Kelompok Tinggi hanya

sedikit atau tidak ada yang memilihnya. Dengan kata lain distraktor

dibuat agar dianggap benar oleh subjek yang tidak tahu atau

Kelompok Rendah, sedangkan untuk Kelompok Tinggi diharapkan

dapat mengertahui kesalahan yang terdapat dalam distraktor

(48)

4. Norma

a. Definisi Norma

Skor kasar merupakan taraf informasi paling dasar yang

diberikan oleh tes psikologis (Supratiknya, 1998). Skor kasar adalah

total angka yang diperoleh subjek dalam menyelesaikan aitem secara

benar. Skor ini belum mempunyai makna atau tidak dapat digunakan

menginterpretasi. Skor kasar terlebih dahulu harus dibandingkan

dengan norma.

Norma adalah kerangka acuan yang disusun secara terpisah

dan diperoleh dari suatu sampel standarisasi (Supratiknya, 1998).

Norma disusun secara empiris dengan mengenakan tes pada sejumlah

besar subjek sebagai sampel. Sampel subjek harus bisa mencerminkan

populasi yang menjadi sasaran dari tes tersebut. Oleh karena itu, sampel

ini disebut kelompok norma atau sampel standardisasi (Friedenberg,

1995, Supratiknya, 1998). Norma akan menunjukkan posisi subjek

dalam suatu tes diantara subjek lain yang sebaya dalam hal usia, tingkat

pendidikan, jenis kelamin, dan sebagainya.

b. Teknik Tranformasi Skor Kasar

1) Persentil

Persentil menyatakan presentasi dari sekelompok subjek

dalam kelompok sample yang memiliki skor dibawah skor mentah

tertentu. Semakin tinggi persentil menunjukkan skor yang tinggi

(49)

dibandingkan dengan kelompok sampel dan tidak menjelaskan

tingkat keberhasilan subjek dalam menjawab pertanyaan (Gregory,

1996).

Persentil ke-50 (P50) dapat disamakan dengan median

yang merupakan ukuran tendensi sentral. Persentil di atas 50

menunjukkan kinerja atau performansi yang di atas rata-rata, begitu

pula sebaliknya jika persentil di bawah 50 maka kinerja atau

performansi subjek di bawah rata-rata. Skor persentil ini mudah

dihitung dan mudah dipahami. Selain itu, persentil dapat digunakan

untuk orang dewasa dan anak-anak serta cocok untuk semua jenis

tes, bail tes bakat maupun kepribadian (Anastasi & Urbina, 1998).

2) Skor Standart

Skor-skor standart mengungkap jarak individu dari

rata-rata berdasarkan simpangan baku distribusi. Skor ini dapat

diperoleh dengan transformasi linear atau non linear atas skor-skor

mentah yang orisinil (Anastasi & Urbina, 1998).

Skor standar dilambangkan dengan huruf z dan memiliki

penghitungan yang cukup sederhana dengan mengurangkan skor

mentah dengan skor rata-rata kemudian dibagi dengan skor standart

deviasi (Gregory, 1996).

3) Stanine

Stanine atau Standard Nine dikembangkan oleh United

(50)

satu bentuk skor standart yang membagi distribusi frekuensi

kedalam sembilan bagian (Azwar, 1998).

Dalam stanine, semua skor kasar diubah dalam satu digit

angka dengan rentang 1 sampai 9. Nilai rata-rata dalam skor

stanine selalu 5 dan standart deviasi selalu mendekati 2.

Pengubahan skor kasar ke skor stanine cukup mudah, yaitu skor di

susun dari rendah ke tinggi, kemudian 4% dari seluruh subjek akan

skor stanine 1, kemudian 7% dari seluruh subjek akan mendapat

skor stanine 2 dan seterusnya (Gregory, 1996).

Tabel 2. Distribusi Persentase dalam Pengubahan Skor Stanine

Presentase (%) 4 7 12 17 20 17 12 7 4

Stanine 1 2 3 4 5 6 7 8 9

4) Sten scale

Teknik ini diciptakan oleh Canfield (Gregory, 1996).

Penilaian dengan sten scale dilakukan dengan cara menentukan

terlebih dahulu persentil batasnya. Formulasi untuk menentukan

persentil batas adalah sebagai berikut:

Pn

=

+

Pn = persentil ke n, yaitu persentil batas tertentu

Bb= batas bawah nyata interval kelas yang mengandung Pn

(51)

1 0 0 = frekuensi kumulatif di bawah interval kelas yang

mengandung Pn

Fkb = frekuensi di bawah interval kelas yang mengandung Pn

fd = frekuensi interval yang mengandung Pn

i = lebar interval kelas

Setelah persentil batas ditentukan maka persentil batas

yang paling tinggi akan mendapat nilai sten scale 10 dengan

kualifikasi istimewa. Berikut adalah tabel pedoman untuk

penentuan persentil batas, nilaisten scaledan kualifikasinya:

Tabel 3. Pedoman Penentuan Persentil Batas, Nilai Sten scale dan Kualifikasinya

Persentil Batas NilaiSten scale Kualifikasi

99 10 Istimewa

95 9 Amat Tinggi

90 8 Tinggi

80 7 Lebih dari Cukup

60 6 Cukup

40 5 Ragu-ragu

20 4 Tidak Cukup

10 3 Rendah

5 2 Amat Rendah

1 1 Amat Sangat Rendah

5. Tes Paralel

Tes paralel adalah suatu tes lain yang memiliki kesamaan tujuan

ukurnya dan memiliki kesetaraan isi aitemnya baik secara kualitas maupun

(52)

yang sama, seperti tujuan ukur, batasan objek ukur, indikator-indikator

perilaku, banyaknya aitem, format aitem, taraf kesukaran aitem, dan

lain-lain. Secara empirik, kedua tes yang yang paralel harus menghasilkan

mean skor dan standart deviasi yang sama. Selain itu, tiap tes memiliki

korelasi yang sama dengan pengukuran lain serta skor murninya (Azwar,

1997, Gregory, 1996).

Tes paralel ini digunakan dalam skala Wechsler dengan

menggunakan skala yang diperpendek atau dipersingkat. Sasaran dari

skala yang diperpendek ini adalah mengurangi cukup banyak waktu

penyelenggaraan sambil mendapatkan IQ Skala Penuh yang diperkirakan

bisa dievaluasi menggunakan norma-norma yang telah diterbitkan. Cata

penyusunan bentuk pendek ini adalah dengan menghilangkan sejumlah

subtes dan skor-skor serupa di setiap skala. Cara lainnya adalah

mengurangi jumlah soal didalam subtes (Anastasi & Urbina, 1997).

C. Kerangka Penelitian

Dalam penelitian ini, peneliti akan melakukan:

1. Analisis Aitem

Teknik analisis aitem yang digunakan adalah taraf kesukaran

aitem, korelasi aitem total dan efektivitas distraktor. Suatu aitem dikatakan

baik apabila memiliki taraf kesukaran aitem (p) yang sedang yaitu 0,3 ≤p

(53)

analisis aitem ini akan terjadi penghilangan aitem yang tidak sesuai dengan

kriteria diatas namun perlu diperhatikan pula koefisien alfanya.

Oleh karena itu, tahap pertama yang perlu dilakukan adalah

mengecek koefisien korelasi total, apabila sesuai dengan kriteria maka

aitem tersebut dipertahankan. Namun apabila koefisien rix < 0,3 maka

perlu melihat koefisien alfanya, jika koefisien alfanya rendah maka aitem

tersebut dapat dipertahankan. Hal ini berarti bahwa jika aitem tersebut

dihilangkan maka akan membuat koefisien alfanya menjadi rendah

(Prakoso, 1998).

Suatu aitem dikatakan memiliki distraktor yang baik apabila

distraktor tersebut dipilih oleh sebagian besar subjek Kelompok Rendah

dan tidak dipilih atau sedikit dipilih oleh subjek Kelompok Tinggi.

2. Memperpendek Subtes TPA Plus

Tahap ini, peneliti menggunakan data hasil dari taraf kesukaran

aitem dan korelasi aitem total yang nantinya akan digunakan sebagai dasar

dalam melakukan pembelahan tes Matched-Random Subsets.Peneliti akan

membuat gambar dengan bantuan scater plot, sehingga terlihat sebaran

aitem-aitem. Aitem yang berdekatan akan dipilih salah satu karena setiap

aitem yang letaknya berdekatan akan memiliki karakteristik yang relatif

sama atau mirip satu sama lain (Azwar, 1997). Aitem-aitem tersebut akan

dipilih secara random untuk masuk ke dalam Form I atau Form II.

Sedangkan aitem-aitem yang letaknya berjauhan akan selalu ada dalam

(54)

3. Validitas

Sumber validitas yang akan dicari adalah menggunakan teknik

analisis faktor confirmatory. Form yang telah dibentuk dapat dinyatakan

memiliki validitas yang baik apabila data (skor hasil tes) sesuai dengan

model penelitian. Oleh karena itu, sebelum melakukan analisis, peneliti

membuat model penelitian terlebih dahulu.

Kesesuaian antara model penelitian dan data dapat diketahui

dengan melihat kriteria fit indeks seperti chi square χ2, SRMR dan

RMSEA. Nilai χ2

yang memiliki taraf signifikansi (p) > 0,05 dapat

dikatakan bahwa secara signifikan tidak ada perbedaan antara skor hasil

tes dengan model penelitian. Apabila dihasilkan nilai p < 0,05 maka perlu

dilihat hasil fit indeks yang lain yaitu SRMR dan RMSEA. Hal ini

dilakukan karena nilai χ2

peka terhadap jumlah subjek. Apabila jumlah

subjek banyak, maka χ2

akan menyatakan bahwa ada perbedaan yang

signifikan walaupun sebenarnya perbedaannya sangat kecil. Oleh karena

itu, jika SRMR kurang dari sama dengan 0.08 dan RMSEA kurang dari

0.06 maka dapat dikatakan bahwa ada kesesuaian atau model penelitian

didukung oleh data (Hu & Bentler, 1999).

4. Relibilitas

Tiap form yang dihasilkan akan dicek reliabilitasnya

menggunakan teknik cronbach’s alpha. Karena tes seleksi ini adalah untuk

keperluan individual judgement serta tes bakat ini termasuk dalam

(55)

yang tinggi. Koefisien reliabilitas menurut Kelley adalah 0.94,

Helmstadter 0,96, Murphy dan Davidshofer 0.90, sedangkan Weiner dan

Stewart 0.85 (Freidenberg, 1995; Murphy & Davidshofer, 1991; Steiner &

Norman, 1995).

5. Norma

Setelah alat tes dibuatshort formmaka perlu dibuat norma untuk

tiap short form-nya. Norma yang akan digunakan adalah menggunakan

teknik sten scale sehingga menghasilkan 10 kategori, yaitu kategori

Istimewa hingga kategori Amat Sangat Rendah.

D. Pertanyaan Penelitian

1. Bagaimana taraf kesukaran aitem TPA Plus yang dimiliki P2TKP

Universitas Sanata Dharma?

2. Bagaimana korelasi aitem total pada TPA Plus?

3. Bagaimana efektifitas distraktor pada TPA Plus?

4. Apakah jumlah aitem-aitem TPA Plus dapat dikurangi untuk

meningkatkan efisiensi?

5. Bagaimana reliabilitas dari TPA Plus setelah diperpendek?

6. Bagaimana validitas dari TPA Plus setelah diperpendek?

(56)

BAB III

METODE PENELITIAN

A. Jenis penelitian

Penelitian yang akan dilakukan bersifat Deskripttif karena hanya

menggambarkan parameter dari kualitas psikometrik tes penerimaan

mahasiswa baru tahun 2010 (TPA Plus) yang dimiliki oleh P2TKP

B. Identifikasi Variabel

Variabel dalam penelitian Tes Potensi Akademik Plus (TPA Plus) ini

adalah:

1. Skor aitem dari tiap subtes.

TPA Plus memiliki 5 subtes yaitu, Penalaran Verbal (40 aitem),

Kemampuan Numerik (40 aitem), Penalaran Mekanik (30 aitem),

Hubungan Ruang (30 aitem), Bahasa Inggris (40 aitem).

2. Skor total tiap subtes.

TPA Plus nantinya akan menghasilkan 5 skor total, yaitu skor total dari

subtes tes Penalaran Verbal, Kemampuan Numerik, Penalaran Mekanik,

Hubungan Ruang, Bahasa Inggris.

(57)

C. Definisi Operasional

1. Skor aitem diperoleh dengan mencocokan antara jawaban subjek dengan

kunci jawaban. Skor 1 akan diberikan pada jawaban yang sesuai dengan

kunci jawaban dan skor 0 untuk jawaban salah.

2. Skor total untuk tiap subtes diperoleh dengan menjumlahkan jawaban

yang benar dari tiap subjek.

D. Subjek Penelitian

Subjek yang digunakan dalam penelitian ini adalah calon mahasiswa

yang mengikuti Seleksi Penerimaan Mahasiswa Baru Universitas Sanata

Dharma tahun 2010 Gelombang Pertama yang berjumlah 998 orang.

E. Metode Pengambilan Data

Metode pengambilan data yang digunakan dalam penelitian ini adalah

metode dokumentasi. Data dokumentasi tersebut diperoleh dari Pusat

Pelayanan Tes dan Konseling Psikologi (P2TKP) Universitas Sanata Dharma.

F. Metode Analisis Data

Penelitian ini akan melakukan evaluasi psikometrik yaitu analisis

aitem, reliabilitas, validitas serta akan membuat bentuk pendek (short form)

(58)

1. Analisis aitem yang akan dilakukan adalah:

a. Taraf kesukaran aitem, secara teori analisis ini diperoleh dengan cara

membagi banyaknya subjek yang dapat menjawab benar suatu aitem

dengan banyaknya subjek yang menjadi sampel penelitian. Namun,

pada penelitian ini akan digunakan program SPSS 16 untuk

menganalisisnya.

b. Korelasi aitem total, diperoleh dengan cara mengkorelasikan distribusi

skor pada aitem dengan skor total dari test tersebut. Program SPSS 16

akan digunakan untuk menganalisis data yang telah diperoleh.

c. Efektivitas distraktor, diperoleh dengan membuat 2 kelompok yaitu

upper dan lower group terlebih dahulu kemudian dengan memberikan

formulasi pada program Excel 2007, maka nanti akan diperoleh

berapa jumlah jawaban untuk tiap pilihan jawaban pada

masing-masing kelompok.

2. Membuat short form TPA Plus. Cara ini tentunya dilakukan dengan

bantuan program SPSS 16 dengan memasukan data p (taraf kesukaran

aitem) dan rix (korelasi aitem total) dan meminta program untuk

memasangkan aitem.

3. Reliabilitas akan diestimasi menggunakan teknik Cronbach Alpha.

Analisis ini akan dibantu dengan menggunakan program SPSS 16. Teknik

analisis ini dikenakan pada subtes yang telah diperpendek.

4. Validitas yang akan dilakukan menggunakan teknik analisis faktor dengan

(59)

membuat model penelitian untuk tiap form yang dapat dibuat. Inti dari

model tersebut adalah aitem-aitem yang tersusun dalam suatu form dapat

mengungkap konstruk yang diukur. Model penelitian ini dapat dilihat

pada Lampiran 2.

5. Membuat norma TPA Plus yang baru setelah dimodifikasi dengan

(60)

BAB IV

HASIL PENELITIAN

A. Persiapan dan Pelaksanaan Penelitian

Sebelum penelitian, peneliti meminta ijin kepada Kepala P2TKP untuk

proses pengambilan data. Setelah ijin didapat, peneliti menanyakan kepada

staff P2TKP letak lembar jawab TPA Plus Angkatan 2010/2011 Gelombang

Pertama. Data yang telah didapat kemudian dipindahkan ke dalam komputer

secara manual oleh peneliti sendiri dibantu dengan asisten P2TKP.

Proses pengambilan data ini memakan waktu hampir 3 bulan, mulai

dari pengumpulan data hingga pemindahan data ke komputer. Proses ini

terhitung dari bulan Desember 2010 hingga Maret 2011.

Pada bulan Desember, peneliti juga melakukan wawancara dengan

Kepala Humas Universitas Sanata Dharma, Bp. Budi Setya Handana. Hal ini

dilakukan atas saran dosen pembimbing dan Kepala P2TKP untuk dijadikan

salah satu acuan membuat latar belakang.

B. Hasil Penelitian dan Pembahasan

1. Subtes Penalaran Verbal

a. Analisis Aitem

Hasil analisis aitem menunjukkan bahwa:

(61)

Tabel 4. Daftar Aitem berdasarkan Korelasi Aitem Total (rix) dan Taraf Kesukaran Aitem (p)

0,3≤p≤0,7 p < 0,3 p > 0,7 rix≥0,3 1, 2, 7, 17, 18,

19, 10, 25, 27 31 4, 8, 36 rix < 0,3 15, 37 10, 16 12, 23, 33 rix < 0,3 namun

meningkatkan

Tabel 5.Daftar Distraktor Yang Perlu Direvisi

No. Efektivitas Distraktor No. Aitem (Distraktor) 1 Proporsi Kelompok Tinggi

(KT) lebih besar daripada Kelompok Rendah (KR)

1 (A dan B), 2 (A dan E), 4 (B), 5

2 Proporsi KT sama dengan KR (tidak dipilih sama sekali)

5(D) dan 26 (A)

Berdasarkan hasil analisis yang telah dipaparkan di atas, maka dapat

diketahui:

1) Aitem-aitem yang memiliki kualitas baik

Aitem nomor 1, 2, 7, 17, 18, 19, 20, 25 dan 27 tergolong dalam

(62)

korelasi aitem total diatas 0.3 serta taraf kesukaran aitem yang

sedang (0.3≤p≤0.7) (Azwar, 1997; Gregory, 1996).

Aitem-aitem nomor 11, 13, 22, 24, 28, 30 dan 32 memiliki

koefisien korelai aitem total yang kurang dari 0.3 Namun apabila

aitem-aitem tersebut dihilangkan maka akan menurunkan nilai

koefisien alpha (Prakoso, 1998). Oleh karena itu, aitem-aitem

tersebut masih dikatakan baik dengan taraf kesukaran aitem yang

sedang.

Namun semua aitem tersebut perlu perbaikan distraktor karena

terdapat distraktor yang banyak dipilih oleh subjek Kelompok

Tinggi, yaitu aitem nomor 1 (A dan B), 2 (A dan E), 7 (C), 11 (A

dan E), 13 (B), 17 (B dan D), 19 (C), 20 (D), 22 (E), 24 (A), 25 (C),

27 (D), 28 (B dan D) dan 32 (A). Distraktor-distraktor tersebut

banyak dipilih oleh subjek Kelompok Tinggi.Ini dapat diakibatkan

distraktor-distraktor ini mengandung kebenaran. Oleh karena itu,

perlu adanya evaluasi apakah distraktor-distraktor tersebut

mengandung kebenaran atau tidak. Apabila mengandung kebenaran

maka distraktor-distraktor tersebut perlu diganti.

Selain itu, ada pula distraktor yang memiliki proporsi yang

sama, baik pada Kelompok Tinggi maupun Kelompok Rendah, yaitu

aitem nomor 1 (C), 13 (E), 17 (E), 18 (A dan E), 19 (D), 20 (C), 22

(A dan D), 24 (E) dan 30 (A). Distraktor-distraktor ini tidak berguna

(63)

(Azwar, 1996). Oleh karena itu, perlu adanya revisi pada distraktor

semacam ini sehingga distraktor dapat berfungsi dengan baik.

2) Aitem-aitem yang perlu direvisi

Aitem-aitem nomor 4, 8, 31, dan 36 memiliki koefisien

korelasi aitem total yang baik yaitu diatas 0.3 namun memiliki taraf

kesukaran yang terlalu mudah (p > 0.7) atau terlalu sulit (p < 0.3).

Oleh karena itu, aitem nomor 4, 8 dan 36 perlu direvisi dengan

membuat aitem menjadi sulit, sedangkan aitem no 31 perlu direvisi

dengan membuat aitem menjadi mudah.

Aitem-aitem nomor 3, 5, 6, 9, 14, 21, 26, 29, 34, 35, 38, 39 dan

40 memiliki koefisien korelasi aitem total kurang dari 0.3, namun

apabila aitem-aitem tersebut tidak disertakan dalam perhitungan

estimasi alpha maka koefisien alphanya akan mengalami penurunan

(Prakoso, 1998). Oleh karena itu, aitem-aitem ini masih

dipertahankan dengan melakukan revisi berdasarkan taraf kesukaran

aitemnya. Aitem-aitem nomor 3, 5 dan 26 perlu direvisi dengan

membuat aitem menjadi sulit, sedangkan aitem-aitem nomor 6, 9,

14, 21, 29, 34, 35, 38, 39 dan 40 perlu direvisi dengan membuat

aitem menjadi mudah. Tindakan ini nantinya diharapkan dapat

meningkatkan nilai koefisien korelasi aitem total.

Aitem-aitem tersebut perlu juga dilakukan perbaikan

distraktor. Hal ini dikarenakan ada beberapa distraktor yang kurang

(64)

14 (C), 21 (C dan D), 26 (D), 29 (A, B dan D), 34 (C dan D), 35 (B

dan E), 36 (D), 38 (A, D dan E), 39 (B dan C) dan 40 (A) memiliki

distraktor yang banyak dipilih oleh subjek Kelompok Tinggi

dibandingkan dengan subjek Kelompok Rendah. Hal ini mungkin

dikarenakan distraktor-distraktor tersebut mengandung kebenaran.

Oleh karena itu, perlu adanya evaluasi apakah distraktor-distraktor

tersebut mengandung kebenaran atau tidak. Apabila mengandung

kebenaran maka distraktor-distraktor tersebut perlu diganti.

Ada pula distraktor yang memiliki proporsi yang sama baik

pada Kelompok Tinggi maupun Kelompok Rendah, yaitu aitem

nomor 3 (A, B dan D), 6 (E), 26 (C), 31 (A), 36 (C) dan 40 (C).

Distraktor-distraktor ini tidak berguna dalam membedakan antara

Kelompok Tinggi dan Kelompok Rendah (Azwar, 1996).

Selain itu, terdapat pula aitem yang memiliki distraktor yang

sama sekali tidak dipilih oleh subjek Kelompok Tinggi

maupunKelompok Rendah. Distraktor tersebut terdapat pada aitem

nomor 5 (D) dan 26 (A). Distraktor-distraktor ini dikatakan tidak

berfungsi karena jelas tidak ada pemilihnya. Hal ini dapat

dikarenakan isinya yang tidak relevan sehingga terlihat sebagai

pilihan yang salah, baik oleh subjek Kelompok Tinggi apalagi