• Tidak ada hasil yang ditemukan

Evaluasi kualitas psikometrik Differential Aptitude Test (DAT) laboratorium psikologi Universitas Sanata Dharma - USD Repository

N/A
N/A
Protected

Academic year: 2019

Membagikan "Evaluasi kualitas psikometrik Differential Aptitude Test (DAT) laboratorium psikologi Universitas Sanata Dharma - USD Repository"

Copied!
179
0
0

Teks penuh

(1)

   

EVALUASI KUALITAS PSIKOMETRIK

DIFFERENTIAL APTITUDE TEST (DAT)

LABORATORIUM PSIKOLOGI UNIVERSITAS SANATA DHARMA

Skripsi

Diajukan untuk Memenuhi Salah Satu Syarat Memperoleh Gelar Sarjana Psikologi

Program Studi Psikologi

Oleh :

Flavia Norpina Sungkit

089114099

PROGRAM STUDI PSIKOLOGI JURUSAN PSIKOLOGI

FAKULTAS PSIKOLOGI

UNIVERSITAS SANATA DHARMA

YOGYAKARTA

(2)
(3)
(4)

iv  

There is nothing impossible

(5)
(6)

vi  

EVALUASI KUALITAS PSIKOMETRIK DIFFERENTIAL APTITUDE

TEST (DAT)

LABORATORIUM PSIKOLOGI UNIVERSITAS SANATA DHARMA

Flavia Norpina Sungkit

ABSTRAK

Penelitian ini bertujuan untuk 1) melakukan estimasi reliabilitas tiga subtes DAT, 2) melakukan estimasi validitas tiga subtes DAT, 3) melakukan estimasi kualitas item pada tiga subtes DAT, dan 4) melakukan perhitungan norma tiga subtes DAT, yang ada di Laboratorium Fakultas Psikologi Universitas Sanata Dharma. Subjek yang dilibatkan dalam penelitian ini ialah subjek yang menjadi testee dalam praktikum Tes Bakat mahasiswa Psikologi pada tahun 2008, 2009, dan 2010, Universitas Sanata Dharma, sebanyak 683 orang. Data yang digunakan ialah skor item dan skor total tiap subtes pada tiap subjek. Data dianalisis dengan menggunakan 1) pendekatan konsistensi internal, yaitu teknik α-Cronbach untuk mengestimasi reliabilitas, 2) validitas konstruk dengan teknik analisis faktor konfirmatori untuk mengestimasi validitas, 3) indeks kesukaran item, indeks daya diskriminasi item, efektivitas distraktor, dan koefisien reliabilitas apabila item dihapus untuk menentukan kualitas item, dan 4) teknik pengubahan skor dengan persentil untuk memperbarui norma. Hasil penelitian menunjukkan bahwa 1) Tes Berhitung dan Tes Penalaran memiliki reliabilitas yang baik, sedangkan Tes Pengertian Mekanik memiliki reliabilitas yang buruk, 2) Tes Penalaran memenuhi validitas konstruk, sedangkan Tes Berhitung dan Tes Pengertian Mekanik tidak memenuhi validitas konstruk, 3) Tes Berhitung, Tes Pengertian Mekanik, dan Tes Penalaran memiliki masalah dalam item-itemnya sehingga item-item tersebut perlu diperbaiki untuk meningkatkan kualitas tes dan ada pula item-item yang disarankan untuk digugurkan, namun ada pula beberapa item pada subtes-subtes tersebut yang telah memenuhi kriteria kualitas item yang baik, dan 4) norma pada Tes Berhitung dan Tes Penalaran memiliki standar skor yang lebih tinggi dibandingkan dengan norma lama, sedangkan norma pada Tes Pengertian Mekanik memiliki standar skor yang lebih rendah dibandingkan dengan norma lama.

(7)

vii  

EVALUATION OF PSYCHOMETRIC PROPERTIES TOWARD DIFFERENTIAL APTITUDE TEST (DAT)

LABORATORY OF PSYCHOLOGY SANATA DHARMA UNIVERSITY

Flavia Norpina Sungkit

ABSTRACT

This research aimed to 1) determine the reliability estimation toward three of DAT’s subtests, 2) determine the validity estimation toward three of DAT’s subtests, 3) determine the item statistics estimation toward three of DAT’s subtests, and 4) calculate the norm for three of DAT’s subtests, which were presented in Laboratory of Faculty of Psychology, Sanata Dharma University. Subjects were 683 people who became the subjects of Sanata Dharma University Psychology’s students in 2008, 2009, and 2010 Aptitude Test’s practicum. Data were score of each item and total score of each subtest for each subject. Data were analyzed by 1) internal consistency approach with α-Cronbach technique for the reliability estimation, 2) construct validity with confirmatory factor analysis technique for validity estimation, 3) item difficulty index, item discrimination index, distractor effectivity, and reliability coefficient if item deleted for determine the item statistics, and 4) score alteration technique with percentile for renew the norms. The result showed that 1) Numerical Ability and Abstract Reasoning had a good reliability, whereas Mechanical Reasoning had a bad reliability, 2) Abstract Reasoning fulfilled the construct validity, whereas Numerical Ability and Mechanical Reasoning did not fulfill the construct validity, 3) Numerical Ability, Mechanical Reasoning, and Abstract Reasoning had problems in their items so the items need to be repaired for the test quality’s improvement and there were some items which were suggested to be deleted, but there were some items which has fulfilled the criteria of the good items, and 4) the score standard of Numerical Ability’s norm and Abstract Reasoning’s norm were higher than theirs own previous norm, whereas the score standard of Mechanical Reasoning’s norm was lower than its own previous norm.

(8)
(9)

ix  

KATA PENGANTAR

Skripsi yang berjudul “Evaluasi Kualitas Psikometrik Differential Aptitude Test (DAT) Laboratorium Psikologi Universitas Sanata Dharma” ini

bertujuan untuk melakukan evaluasi terhadap salah satu tes bakat yang banyak dipakai di Indonesia, yaitu Differential Aptitude Test (DAT). Penulis berharap agar hasil penelitian ini dapat menjadi masukan yang berguna bagi pengguna maupun peneliti selanjutnya bahwa evaluasi terhadap tes perlu dilakukan secara berkala agar hasil tes benar-benar dapat dipercaya. Selain itu, evaluasi berkala terhadap tes juga menunjukkan bahwa kita juga turut andil dalam pengembangan tes tersebut, tidak hanya sebagai pengguna semata.

Banyak hal yang dihadapi oleh penulis dalam proses penyelesaian penelitian ini, baik hal yang menyenangkan maupun tidak menyenangkan. Semua hal tersebut dapat peneliti lalui dengan baik berkat tuntunan dan kasih sayang Tuhan Yesus Kristus dan semua orang yang selalu mendukung peneliti. Oleh karena itu, secara khusus peneliti ingin berterima kasih kepada:

1. Dr. Christina Siwi H., M.Si., selaku Dekan Fakultas Psikologi Universitas

Sanata Dharma Yogyakarta.

2. Y. Agung Santoso, M.A., selaku dosen pembimbing dalam penyelesaian

skripsi yang selalu memberikan waktu, nasehat, semangat, saran, ilmu, serta kesabaran dari awal proses penyusunan skripsi hingga selesai.

(10)

x  

4. Titik Kristiyani, M.Si., selaku Kepala Program Studi Fakultas Psikologi yang

telah membantu penulis terkait dengan hal-hal teknis pendaftaran ujian skripsi. 5. Y. Heri Widodo, M.Psi., selaku dosen penguji yang telah memberikan banyak saran dan kritik yang membangun kepada penulis dalam proses penyusunan skripsi ini.

6. P. Henrietta P.D.A.D.S., M.A., selaku dosen penguji yang telah memberikan

banyak saran dan kritik yang membangun kepada penulis dalam proses penyusunan skripsi ini.

7. Semua Dosen Fakultas Psikologi Universitas Sanata Dharma Yogyakarta yang

telah memberikan banyak ilmu dan arahan.

8. Segenap karyawan di Fakultas Psikologi Universitas Sanata Dharma

Yogyakarta yang membantu penulis dalam mengurus proses administrasi selama perkuliahan yang cukup panjang ini: Mas Gandung, Mas Doni, Pak Gie, dan Mbak Nani. Buat Mas Muji: terima kasih banyak atas kesediaannya menyiapkan data-data penelitian yang sangat banyak itu.

9. Semua subjek penelitian yang datanya dipakai oleh penulis.

10. Papa dan Ie Ie atas kasih sayang, dukungan, kesabaran, kepercayaan, doa,

bantuan, dan semangat yang selalu diberikan untuk penulis.

11. Mama di surga, yang selalu menjadi motivasi penulis setiap kali jatuh. I wish

you could see all of my efforts, mom. This is the way that I could do to make

(11)

xi  

12. Kakak-kakak terhebat, Robertus Hengky Sungkit dan Yohanes Taufan

Sungkit, atas dukungan dan candaan kalian yang selalu membuat penulis menyadari bahwa hidup ini menyenangkan dan menantang.

13. Keluarga-keluarga, yang selalu membimbing dan mendukung penulis selama

ini.

14. Welly Sanjaya, atas kasih sayang dan dukungan selama ini.

15. Sahabat-sahabat terbaik: Vivi, Chike, Stella, atas semangat, dukungan,

bantuan, dan semua kegilaan kalian yang menemani penulis selama kuliah di Fakultas Psikologi Universitas Sanata Dharma.

16. Sahabat-sahabat lain: Chatrine, Julyana, Yuri, Sari, Edrea, Livianti, Grace,

Glery, Retno, Felix, atas dukungan kalian yang selalu menyemangati penulis. 17. Saudara-saudara di Difa, para unni: Galih, Dini, Livi, Tiwi, Grace, Ayu, Ayu

Tegal, Putri, Oki, Ita, Eka, Evina, Yenny, Dara, Jesty, Sari, dan para dongsaeng: Rizza, Melan, Devi, Lenny, Septi, Gemah, Debby, Ista, Kezia, Cecil, Made, Lia, Ika, Tari, atas kebersamaan dan kegilaan yang menyenangkan. What a wonderful thing that I have an opportunity to live with all of you.

18. Teman-teman di Fakultas Psikologi 2008: Pauline, Dian, Lita, Dita, Noni,

Devi, Bora, Selly, Valle, Kak Grace, dan semuanya yang tidak dapat disebut satu persatu. Terima kasih atas dukungan dan doa kalian.

(12)

xii  

20. Semua pihak yang tidak dapat disebutkan satu persatu yang telah mendukung

untuk terselesaikannya skripsi ini.

Penulis menyadari bahwa karya ini masih jauh dari sempurna. Penulis juga meminta maaf apabila ada kata-kata yang kurang berkenan di hati para pembaca. Penulis berharap karya ini dapat bermanfaat bagi pengembangan tes psikologis, khususnya tes bakat di Indonesia.

Penulis

(13)

xiii   DAFTAR ISI

Halaman

HALAMAN JUDUL ... i

HALAMAN PERSETUJUAN PEMBIMBING ... ii

HALAMAN PENGESAHAN ... iii

HALAMAN PERSEMBAHAN ... iv

PERNYATAAN KEASLIAN KARYA ... v

ABSTRAK ... vi

ABSTRACT ... vii

HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH ... viii

KATA PENGANTAR ... ix

DAFTAR ISI ... xiii

DAFTAR TABEL ... xvi

DAFTAR LAMPIRAN ... xvii

BAB I. PENDAHULUAN ... 1

A. Latar Belakang ... 1

B. Masalah Penelitian ... 11

C. Tujuan Penelitian ... 11

D. Manfaat Penelitian ... 12

BAB II. LANDASAN TEORI ... 13

A. Differential Aptitude Test (DAT) ... 13

1. Tes Bakat ... 13

(14)

xiv  

3. Subtes – Subtes Differential Aptitude Test (DAT)... 16

4. Penelitian-Penelitian tentang Differential Aptitude Test (DAT) Versi Adaptasi Universitas Gajah Mada ... 19

B. Syarat Tes yang Baik ... 25

1. Perancangan dan Administrasi ... 25

2. Kualitas Psikometrik ... 28

3. Norma tes ... 45

C. Kerangka Penelitian ... 49

D. Pertanyaan Penelitian ... 51

BAB III. METODE PENELITIAN ... 52

A. Jenis Penelitian ... 52

B. Identifikasi Variabel ... 52

C. Batasan Operasional Variabel ... 53

D. Subjek Penelitian ... 54

E. Prosedur Penelitian ... 54

F. Metode Pengumpulan Data ... 55

G. Metode Analisis Data ... 56

BAB IV. HASIL PENELITIAN DAN PEMBAHASAN ... 60

A. Orientasi Kancah ... 60

B. Persiapan Penelitian ... 60

C. Pelaksanaan Penelitian ... 61

D. Deskripsi Subjek Penelitian ... 62

(15)

xv  

1. Tes Berhitung ... 63

2. Tes Pengertian Mekanik ... 70

3. Tes Penalaran ... 80

F. Keterbatasan Penelitian ... 87

BAB V. KESIMPULAN DAN SARAN ... 88

A. Kesimpulan ... 88

B. Saran ... 89

DAFTAR PUSTAKA ... 92

(16)

xvi  

DAFTAR TABEL

Tabel 1. Kategori Evaluasi Indeks Daya Diskriminasi Item ... 44

Tabel 2. Pedoman Persentase Stanine ... 49

Tabel 3. Kriteria dan Alasan Penggunaan Model Fitness ... 57

Tabel 4. Deskripsi Subtes DAT dalam Tes Bakat ... 60

Tabel 5. Deskripsi Subjek DAT dalam Tes Bakat ... 62

Tabel 6. Analisis Faktor Konfirmatori Tes Berhitung ... 64

Tabel 7. Hasil Kualitas Item Tes Berhitung ... 66

Tabel 8. Norma Lama dan Norma Pembaruan Tes Berhitung ... 69

Tabel 9. Analisis Faktor Konfirmatori Tes Pengertian Mekanik ... 71

Tabel 10. Hasil Kualitas Item Tes Pengertian Mekanik ... 74

Tabel 11. Norma Lama dan Norma Pembaruan Tes Pengertian Mekanik ... 79

Tabel 12. Analisis Faktor Konfirmatori Tes Penalaran ... 81

Tabel 13. Hasil Kualitas Item Tes Penalaran ... 82

(17)

xvii  

DAFTAR LAMPIRAN

Tes Berhitung

Lampiran 1. Reliabilitas ... 96

Lampiran 2. Validitas – Uji Normalitas ... 97

Lampiran 3. Validitas – Analisis Faktor Konfirmatori ... 98

Lampiran 4. Validitas – Hasil Analisis Faktor Konfirmatori... 99

Lampiran 5. Kualitas Item – Koefisien α Apabila Item Dihapus ... 101

Lampiran 6. Kualitas item – Indeks Diskriminasi Item, Indeks Kesukaran Item, Efektivitas Distraktor ... 105

Lampiran 7. Norma ... 108

Tes Pengertian Mekanik Lampiran 8. Reliabilitas ... 113

Lampiran 9. Validitas – Uji Normalitas ... 114

Lampiran 10. Validitas – Analisis Faktor Konfirmatori ... 115

Lampiran 11. Validitas – Hasil Analisis Faktor Konfirmatori ... 116

Lampiran 12. Kualitas Item – Koefisien α Apabila Item Dihapus ... 118

Lampiran 13. Kualitas item – Indeks Diskriminasi Item, Indeks Kesukaran Item, Efektivitas Distraktor ... 133

Lampiran 14. Norma ... 138

Tes Penalaran Lampiran 15. Reliabilitas ... 143

(18)

xviii  

Lampiran 17. Validitas – Analisis Faktor Konfirmatori ... 145 Lampiran 18. Validitas – Hasil Analisis Faktor Konfirmatori ... 146 Lampiran 19. Kualitas Item – Koefisien α Apabila Item Dihapus ... 148 Lampiran 20. Kualitas item – Indeks Diskriminasi Item, Indeks Kesukaran Item,

(19)

BAB I

PENDAHULUAN

A. Latar Belakang

Tes bakat ialah sebuah tes yang mengukur kemampuan yang bersifat khusus dan spesifik sehingga dapat memprediksi jalur keberhasilan seseorang di bidang tertentu. Tes bakat berbeda dengan tes yang mengukur kemampuan umum, yaitu tes inteligensi. Tes bakat dirancang sedemikian rupa agar orang-orang dapat mengetahui kemampuan khas yang mereka miliki sehingga mereka dapat mengambil keputusan untuk mengembangkan diri sesuai bakat yang dimiliki dan dapat memprediksi keberhasilan, baik dalam bidang akademis maupun pekerjaan (Anastasi & Urbina, 1997; Gregory, 2000; Cohen & Swerdlik, 2005).

Tes bakat mempunyai dua fungsi, yaitu fungsi diagnosis dan fungsi prediksi. Fungsi diagnosis ialah fungsi tes bakat untuk menentukan potensi dalam diri individu secara spesifik sehingga dapat diberi perlakuan yang dapat meningkatkan potensi tersebut. Fungsi prediksi tes bakat ialah fungsi tes bakat untuk memprediksi kemungkinan kesuksesan atau kegagalan seseorang dalam bidang tertentu di masa depan (Friedenberg, 1995; Cohen & Swerdlik, 2005).

(20)

dan dipublikasikan pada tahun 1947. DAT dibentuk untuk menemukan potensi khas dalam diri seseorang yang berguna dalam pendidikan dan penuntun pencarian kerja untuk para murid dari tingkat pendidikan 7 hingga 12. DAT juga sangat berguna untuk memberi informasi dalam konseling para murid dan seleksi karyawan (Gregory, 2000).

DAT memiliki delapan subtes, yaitu Verbal Reasoning (VR),

Numerical Ability (NA), Abstract Reasoning (AR), Clerical Speed and Accuracy (CSA), Mechanical Reasoning (MR), Space Relation (SR),

Language Usage (LU) yang terdiri dari Spelling dan Sentences. Tiap subtes dapat berdiri sendiri sehingga dapat dipergunakan secara terpisah (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Penggunaan DAT sebagai tes bakat cukup populer di Indonesia. Hal ini dilatarbelakangi oleh sebuah anggapan bahwa kemampuan seseorang tidak cukup jika hanya ditentukan oleh satu faktor, yaitu inteligensi. Oleh karena itu, diperlukan tes yang dapat menentukan kemampuan seseorang lewat banyak faktor. Indonesia mengadaptasi lima subtes dari delapan subtes yang ada dalam DAT. Tiga subtes yang lain dianggap bias terhadap budaya sehingga sulit untuk mengadaptasinya. Subtes-subtes yang diadaptasi ialah Numerical Ability menjadi Tes Berhitung (A5) oleh Dra. Murtini, Abstract Reasoning menjadi Tes Penalaran (A3) oleh Drs. Moch Bachroni, Space Relation menjadi Tes Pola (B3 / C5) oleh Drs. Supidjo Ronodikoro, Mechanical Reasoning

(21)

Clerical Speed and Accuracy menjadi Tes Cepat Teliti (D4) oleh Dra. M. G. Adiyanti (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Masing-masing subtes tersebut memiliki domain tersendiri. Tes Berhitung dirancang untuk mengukur kemampuan berpikir dengan angka dan penguasaan hubungan numerik. Tes Penalaran dirancang untuk mengukur penalaran yang bersifat non-verbal, yaitu kemampuan untuk memahami hubungan yang logis dari gambar-gambar abstrak atau prinsip-prinsip desain non-verbal. Tes Pola dirancang untuk mengungkap kemampuan mengenal barang-barang konkrit melalui indera penglihatan, khususnya secara tiga dimensi. Tes Pengertian Mekanik dirancang untuk mengukur daya penalaran di bidang mekanis dan prinsip-prinsip fisika. Tes Cepat Teliti dirancang untuk mengukur respon subjek terhadap tugas-tugas atau pekerjaan yang menyangkut kecepatan persepsi (dari stimulus yang bersifat sederhana), kecepatan respon terhadap kombinasi huruf dan angka, serta ingatan yang sifatnya tidak lama (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

(22)

harus selalu diperhatikan. Norma yang digunakan harus ditinjau dan diperbarui secara berkala karena bisa tidak sesuai lagi jika dipakai dalam jangka waktu tertentu (Supratiknya, 1998A; AERA, APA, NCME, 1999).

Kualitas psikometrik merupakan karakteristik lain dari sebuah tes yang baik, meliputi reliabilitas, validitas, dan kualitas item. Tes yang reliabel berarti sebuah tes sebisa mungkin harus terhindar dari faktor-faktor yang mengakibatkan skor tes menjadi tidak murni. Apabila ada perbedaan skor antar individu, diharapkan perbedaan tersebut memang diakibatkan perbedaan individu. Perbedaan bukan diakibatkan hal-hal seperti administrasi, skoring, dan interpretasi yang seharusnya bisa tidak menimbulkan perbedaan apabila dikoreksi lebih lanjut (Friedenberg, 1995; Anastasi & Urbina, 1997; Supratiknya, 1998A).

(23)

Penelitian subtes-subtes DAT di Indonesia memiliki data-data yang berkaitan dengan norma dan kualitas psikometrik. Subtes yang bersangkutan ialah Tes Berhitung, Tes Penalaran, Tes Pola, Tes Pengertian Mekanik, dan Tes Cepat Teliti. Pemilihan subtes ini berdasarkan semua subtes DAT yang telah diadaptasi di Indonesia (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Penelitian yang berkaitan dengan reliabilitas Tes Berhitung dilakukan dengan menggunakan metode test re-test dan menghasilkan koefisien reliabilitas sebesar 0,709 yang tergolong sangat signifikan (Kuwato, dalam Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984). Penelitian lain tentang reliabilitas Tes Berhitung dilakukan dengan menggunakan teknik analisis varian dari Hoyt dan menghasilkan koefisien reliabilitas sebesar 0,977 yang tergolong sangat signifikan (Suhapti & Martani, 1992). Penelitian-penelitian tentang validitas Tes Berhitung menggunakan metode validitas berdasarkan kriteria. Salah satunya menggunakan prestasi belajar sebagai kriteria dan menghasilkan koefisien validitas sebesar 0,51 yang tergolong sangat signifikan (Budoyo, dalam Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

(24)

Konsultasi Fakultas Psikologi UGM (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984). Selain itu, ada pula norma Tes Berhitung yang dibuat dalam bentuk standard eleven dan berdasarkan sampel di Biro Konsultasi Fakultas Psikologi UGM (Suhapti & Martani, 1992).

Ada dua penelitian reliabilitas Tes Penalaran yang menggunakan metode single trial dan dianalisis dengan teknik analisis varian dari Hoyt. Penelitian pertama menghasilkan koefisien reliabilitas sebesar 0,928 yang tergolong sangat signifikan (Suramto, Harjito, dan Kumara, 1996) dan penelitian kedua menghasilkan koefisien reliabilitas sebesar 0,929 yang tergolong sangat signifikan pula (Suhapti, 1991). Dua penelitian lain tidak menyebutkan metode yang digunakan dalam menguji reliabilitas Tes Penalaran. Hasil koefisien reliabilitas pada dua penelitian tersebut ialah 0,765 dan 0,783 (Adisubroto, dalam Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

(25)

pengguguran satu item dari 50 item (Suhapti, 1991). Norma Tes Penalaran dibuat dalam bentuk persentil dan diadaptasi oleh Biro Konsultasi Fakultas Psikologi UGM (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984). Suramto, Harjito, dan Kumara (1996) membuat norma dalam bentuk standard eleven dalam penelitian mereka, yang memperbarui norma standard eleven oleh Suhapti (1991).

Perhitungan reliabilitas Tes Pola menggunakan metode split half

dan dibedakan berdasarkan jenis kelamin. Koefisien reliabilitas pada perempuan sebesar 0,86 – 0,92, sedangkan pada laki-laki sebesar 0,92 – 0,94. Validitas Tes Pola diuji dengan menggunakan metode validitas berdasarkan kriteria. Norma untuk Tes Pola belum ada, bahkan hasil adaptasi juga belum ada. Maka dari itu, subtes ini belum digunakan dalam pelaksanaan tes bakat (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Reliabilitas Tes Pengertian Mekanik dihitung dengan metode split half dan dibedakan berdasarkan jenis kelamin. Koefisien reliabilitas pada laki-laki sebesar 0,81 – 0,86, sedangkan pada perempuan sebesar 0,69 – 0,73. Validitas pada Tes Pengertian Mekanik menggunakan metode validitas berdasarkan kriteria. Norma dibuat dalam bentuk persentil dan diadaptasi oleh Biro Konsultasi Fakultas Psikologi UGM (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

(26)

perempuan sebesar 0,84 – 0,91. Penggunaan metode dalam perhitungan reliabilitas tidak disebutkan. Validitas Tes Cepat Teliti diuji dengan menggunakan metode validitas berdasarkan kriteria. Salah satunya menggunakan prestasi kerja sebagai kriteria dan menunjukkan bahwa hasilnya signifikan (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984). Selain itu, ada pula penelitian lain yang menggunakan peranan usia sebagai kriteria dan menunjukkan bahwa hasilnya signifikan (Sukarti, 1995). Norma Tes Cepat Teliti dibuat dalam bentuk persentil yang terdiri dari norma asli dan norma adaptasi (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Ada beberapa permasalahan dalam penelitian-penelitian subtes-subtes DAT dari data-data tersebut. Estimasi reliabilitas subtes-subtes DAT sebagian besar dilakukan dengan metode split half. Metode split half

didasarkan pada pembelahan tes yang kemudian dikorelasikan. Metode ini mempunyai kelemahan, yaitu cara pembelahan item yang berbeda akan menghasilkan koefisien reliabilitas yang berbeda pula. Hal ini dapat menyebabkan underestimasi atau overestimasi koefisien reliabilitasnya. Metode split half tidak mengupayakan perhitungan rata-rata koefisien reliabilitas terhadap setiap kemungkinan pembelahan item yang bisa

dilakukan. Oleh karena itu, penggunaan metode α-Cronbach yang

(27)

Penelitian validitas pada subtes-subtes DAT sebagian besar menggunakan metode validitas berdasarkan kriteria. Hal ini menunjukkan bahwa penggunaan metode dalam penelitian tentang validitas pada subtes-subtes DAT kurang bervariasi. Penggunaan metode yang tidak variatif tersebut tidak memadai untuk menyatakan validitas sebuah tes. Sementara itu, penggunaan metode yang bervariasi akan memperkuat bukti-bukti validitas tes. Validitas dapat diuji dengan beberapa metode, yaitu validitas isi, validitas berdasarkan kriteria, dan validitas konstruk. Validitas berdasarkan kriteria dan validitas konstruk merupakan proses validasi yang bersifat empirik dan melibatkan perhitungan secara statistik. Selain melakukan validasi lewat teknik validitas berdasarkan kriteria, teknik validitas konstruk pun penting untuk dilakukan dalam mendukung informasi validitas sebuah tes. Oleh karena itu, penggunaan metode lain dalam pengukuran validitas subtes-subtes DAT perlu dilakukan agar bukti validasi subtes-subtes DAT lebih kuat dan tidak hanya terpaku pada satu metode saja (Supratiknya, 1998A; Santoso, 2010).

(28)

penelitian untuk melakukan evaluasi terhadap DAT untuk melihat apakah fungsi-fungsi tersebut masih dapat dijalankan dengan baik. Informasi ini kemudian dapat digunakan untuk memperbarui atau memperbaiki tes jika dibutuhkan.

Berkaitan dengan norma, ada subtes yang tidak mempunyai norma sama sekali, yaitu Tes Pola. Ada pula yang masih memakai norma asli padahal faktor budaya mungkin perlu diperhitungkan. Norma yang telah diadaptasi dan disesuaikan dengan situasi Indonesia juga tidak diperbarui secara berkala, padahal norma tersebut terus dipakai dan dipercaya oleh para pengguna maupun pengetes (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Dari beberapa permasalahan tersebut, dibutuhkan suatu penelitian yang dapat memberikan informasi terkini tentang keadaan DAT saat ini, meliputi kualitas psikometrik dan norma yang digunakan. Penelitian ini bertujuan untuk mengevaluasi subtes-subtes DAT, meliputi estimasi reliabilitas dengan teknik α-Cronbach yang lebih stabil, estimasi validitas

dengan menggunakan metode lain yaitu analisis faktor, estimasi kualitas item untuk mengetahui kelayakan item-item dalam subtes-subtes DAT, dan perhitungan norma. Penelitian ini akan memberi informasi terkini mengenai kualitas psikometrik DAT yang dapat digunakan untuk perbaikan tes.

(29)

Psikologi di Universitas Sanata Dharma (USD), Yogyakarta. Subtes-subtes tersebut terdiri dari Tes Berhitung, Tes Pengertian Mekanik, dan Tes Penalaran versi adaptasi Universitas Gajah Mada. Pemilihan subtes-subtes tersebut berdasarkan pertimbangan bahwa subtes-subtes-subtes-subtes tersebut telah diadaptasi di Indonesia, memiliki norma, penggunaannya menyebar sebagai tes bakat di Indonesia, dan memiliki data yang memadai terlaksananya evaluasi tes.

B. Masalah Penelitian

1. Bagaimana reliabilitas tiga subtes DAT yang ada di Laboratorium

Fakultas Psikologi USD?

2. Bagaimana validitas tiga subtes DAT yang ada di Laboratorium

Fakultas Psikologi USD?

3. Bagaimana kualitas item tiga subtes DAT yang ada di Laboratorium

Fakultas Psikologi USD?

4. Bagaimana standar norma untuk tiga subtes DAT yang dipakai di

Laboratorium Fakultas Psikologi USD?

C. Tujuan Penelitian

(30)

2. Melakukan estimasi validitas tiga subtes DAT yang ada di Laboratorium Fakultas Psikologi USD untuk melihat apakah alat tes sudah mengukur hal yang tepat.

3. Melakukan estimasi kualitas item pada tiga subtes DAT yang ada di

Laboratorium Fakultas Psikologi USD.

4. Melakukan perhitungan norma tiga subtes DAT yang ada di

Laboratorium Fakultas Psikologi USD agar sesuai dengan keadaan saat ini.

D. Manfaat Penelitian

1. Manfaat teoritik

Hasil yang diperoleh dalam penelitian ini diharapkan dapat memberikan informasi dan bahan pertimbangan yang bermanfaat untuk penelitian mengenai kualitas Differential Aptitude Test.

2. Manfaat praktis

Penelitian ini dapat memberi masukan pada Laboratorium Fakultas Psikologi dan Pusat Pelayanan Tes dan Konsultasi Universitas Sanata Dharma tentang reliabilitas, validitas, dan kualitas item tiga subtes

(31)

13  BAB II

LANDASAN TEORI

A. Differential Aptitude Test (DAT)

1. Tes Bakat

Tes bakat ialah sebuah tes yang mengukur kemampuan yang bersifat khusus dan spesifik sehingga dapat memprediksi jalur keberhasilan seseorang di bidang tertentu (Anastasi & Urbina, 1997; Gregory, 2000; Cohen & Swerdlik, 2005). Tes bakat mempunyai dua fungsi, yaitu fungsi diagnosis dan fungsi prediksi. Fungsi diagnosis ialah fungsi tes bakat untuk menentukan potensi dalam diri individu secara spesifik sehingga dapat diberi perlakuan yang dapat meningkatkan potensi tersebut. Fungsi prediksi tes bakat ialah fungsi tes bakat untuk memprediksi kemungkinan kesuksesan atau kegagalan seseorang dalam bidang tertentu di masa depan (Friedenberg, 1995; Cohen & Swerdlik, 2005).

Tes bakat terdiri atas dua macam, yaitu multiple aptitude test batteries dan single aptitude test. Multiple aptitude test batteries

(32)

jenis tes yang mengukur satu jenis bakat saja. Contoh single aptitude test ialah Tes Sensori, Tes Artistik, Tes Clerical, Tes Kreativitas, Tes Kraeplin, Tes Pauli, dan lain-lain (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

Differential Aptitude Test (DAT) termasuk dalam kategori

multiple aptitude test batteries karena terdiri dari sekelompok subtes. Hasil dari DAT dapat digunakan untuk menentukan potensi yang ada dalam diri individu serta memprediksi keberhasilan individu. Oleh karena itu, DAT sebagai salah satu tes bakat telah memiliki fungsi yang sesuai dengan fungsi semestinya (Friedenberg, 1995; Gregory, 2000; Cohen & Swerdlik, 2005).

(33)

2. Sejarah Differential Aptitude Test (DAT)

DAT disusun oleh G. Bennett, H.G. Seashore, dan A.E. Wesman pada tahun 1947. DAT diperuntukkan bagi murid tingkat 7 – 12 untuk keperluan bimbingan pendidikan dan pekerjaan. DAT mengalami revisi pada tahun 1963 dan 1973. DAT disusun berdasarkan teori kelompok faktor kecerdasan model Primary Mental Ability (PMA) dari Thurstone (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999; Gregory, 2000).

Penyusunan DAT memiliki beberapa tujuan, yaitu untuk mendapatkan prosedur penilaian yang ilmiah, terintegrasi, dan terstandardisasi, untuk bimbingan pendidikan dan vokasional siswa, serta untuk penempatan karyawan dan promosi jabatan. DAT merupakan salah satu multiple aptitude test batteries yang paling banyak digunakan untuk mencapai tujuan-tujuan tersebut (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; Gregory, 2000).

(34)

3. Subtes – Subtes Differential Aptitude Test (DAT)

DAT memiliki delapan subtes yang masing-masing berdiri sendiri dan dapat digunakan secara terpisah. Subtes-subtes DAT berupa power test, yaitu tes yang mengukur kemampuan maksimal seseorang, kecuali Tes Cepat Teliti yang merupakan speed test, yaitu tes yang mengukur kemampuan seseorang lewat penentuan waktu. Selain itu, DAT dibagi menjadi kelompok tes verbal dan kelompok tes non verbal. Kelompok tes verbal terdiri dari Verbal Reasoning, Language Usage, Tes Berhitung,dan Tes Cepat Teliti. Kelompok tes non verbal terdiri dari Tes Penalaran, Tes Pola, dan Tes Pengertian Mekanik (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

Numerical Ability atau Tes Berhitung dirancang untuk mengukur kemampuan berpikir dengan angka dan penguasaan hubungan numerik. Hasil tes ini digunakan untuk memprediksi kesuksesan seseorang di bidang matematika, fisika, kimia, teknik, akuntan, statistik, laboran, dan lain-lain. Tes ini dapat dipadukan dengan Verbal Reasoning untuk mengukur kemampuan pembelajaran umum (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

(35)

prinsip-prinsip desain non-verbal. Hasil tes ini digunakan untuk memprediksi kesuksesan seseorang di bidang pendidikan yang membutuhkan pemahaman hubungan antar benda. Tes ini dapat digunakan untuk memahami penalaran seseorang apabila testi mengalami kesulitan berbahasa (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

Space Relation atau Tes Pola dirancang untuk mengungkap kemampuan mengenal barang-barang konkrit melalui indera penglihatan, khususnya secara tiga dimensi. Hasil tes ini digunakan untuk memprediksi kesuksesan seseorang di bidang perencanaan tata ruang, desainer, arsitektur, seni, dan dekorasi (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

Mechanical Reasoning atau Tes Pengertian Mekanik dirancang untuk mengukur daya penalaran di bidang mekanis dan prinsip-prinsip fisika. Hasil tes ini digunakan untuk memprediksi kesuksesan seseorang di bidang mekanik, perakitan, pertukangan kayu, dan sebagainya (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

(36)

sederhana), kecepatan respon terhadap kombinasi huruf dan angka, serta ingatan yang sifatnya tidak lama. Hasil tes ini digunakan untuk memprediksi kesuksesan seseorang di bidang administrasi (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

Verbal Reasoning dirancang untuk mengukur kemampuan berpikir abstrak, generalisasi, dan konstruktif dengan memahami konsep verbal. Hasil tes ini digunakan untuk memprediksi kesuksesan seseorang dalam bidang pemahaman verbal (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

Language Usage I, yaitu Spelling, dirancang untuk mengukur kemampuan dalam hal pengejaan. Language Usage II, yaitu Sentences, dirancang untuk mengukur kemampuan membedakan tata bahasa yang baik dan buruk dalam Bahasa Inggris, serta memahami penggunaan tanda baca dan pemakaian kata yang tepat dalam Bahasa Inggris (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984; “Pelatihan Psikodiagnostika,” 1999).

(37)

4. Penelitian – Penelitian tentang Differential Aptitude Test (DAT) versi adaptasi Universitas Gajah Mada

Penelitian subtes-subtes DAT versi adaptasi Universitas Gajah Mada memiliki data-data yang berkaitan dengan norma dan kualitas psikometrik. Subtes yang bersangkutan ialah Tes Berhitung, Tes Penalaran, Tes Pola, Tes Pengertian Mekanik, dan Tes Cepat Teliti (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Penelitian yang berkaitan dengan reliabilitas Tes Berhitung pernah dilakukan di SMPN 1, Yogyakarta. Penelitian ini menggunakan metode test re-test pada 84 murid kelas dua SMP. Koefisien reliabilitas yang dihasilkan sebesar 0,709 dan disebutkan bahwa hasil tersebut sangat signifikan (Kuwato, dalam Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984). Penelitian lain tentang reliabilitas Tes Berhitung dilakukan dengan menggunakan teknik analisis varian dari Hoyt (N=347) dan menghasilkan koefisien reliabilitas sebesar 0,977 yang tergolong sangat signifikan (Suhapti & Martani, 1992).

(38)

Koefisien validitas yang dihasilkan ialah 0,51 dan disebutkan bahwa hasil tersebut sangat signifikan (Budoyo, dalam Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Penelitian tentang kualitas item pada Tes Berhitung menghasilkan pengguguran satu item dari 40 item dengan subjek sebanyak 347 orang (Suhapti & Martani, 1992). Penelitian lainnya yang melibatkan subjek sebanyak 298 orang mengatakan bahwa 80% dari jumlah item Tes Berhitung telah berfungsi dengan baik (Azwar, 1992A). Norma Tes Berhitung dibuat dalam bentuk persentil dan berdasarkan sampel di Biro Konsultasi Fakultas Psikologi UGM (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984). Selain itu, ada pula norma Tes Berhitung yang dibuat dalam bentuk

standard eleven dengan subjek sebanyak 347 orang (Suhapti & Martani, 1992).

(39)

Hoyt yang menghasilkan koefisien reliabilitas sebesar 0,929 (N=497) dan tergolong sangat signifikan. Selain itu, penelitian lain tentang reliabilitas tes ini juga pernah dilakukan oleh Suramto, Harjito, dan Kumara. Subjek yang digunakan berasal dari data dokumentasi di Biro Psikologi Pengembangan SDM Fakultas Psikologi UGM, yaitu data tes terhadap calon karyawan dan karyawan dari berbagai instansi yang terdiri dari 155 pria dan 58 wanita dengan tingkat pendidikan SMA sebanyak 24 orang, sarjana muda sebanyak 44 orang, dan sarjana sebanyak 145 orang. Reliabilitas dihitung dengan metode single trial

dan dianalisis dengan teknik analisis varian dari Hoyt. Koefisien reliabilitas yang dihasilkan sebesar 0,928 (Suramto, Harjito, dan Kumara, 1996).

(40)

dengan menggunakan indeks korelasi. Hasil yang diperoleh ialah satu item gugur dari 50 item (Suramto, Harjito, dan Kumara, 1996).

Norma Tes Penalaran dibuat dalam bentuk persentil dan dibedakan berdasarkan jenis kelamin, yaitu laki-laki dan perempuan pada tingkat pendidikan 8 hingga 12. Norma tersebut diadaptasi oleh Biro Konsultasi Fakultas Psikologi UGM lewat hasil tes siswa kelas tiga SMA dalam bentuk standard five dan dibedakan berdasarkan jenis kelamin (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984). Suramto, Purba Harjito, dan Amitya Kumara membuat norma dalam bentuk standard eleven dalam penelitian mereka (Suramto, Harjito, dan Kumara, 1996), yang memperbarui norma

standard eleven sebelumnya (Suhapti, 1991).

(41)

Reliabilitas Tes Pengertian Mekanik dihitung dengan metode

split half dan dibedakan berdasarkan jenis kelamin. Koefisien reliabilitas pada laki-laki sebesar 0,81 – 0,86, sedangkan pada perempuan sebesar 0,69 – 0,73. Validitas Tes Pengertian Mekanik dibedakan berdasarkan jenis kelamin dan menggunakan mata pelajaran sebagai kriteria, meliputi matematika, ilmu pengetahuan alam, ilmu sosial, dan sejarah. Norma dibuat dalam bentuk persentil dan dibedakan berdasarkan jenis kelamin, yaitu laki-laki dan perempuan pada tingkat pendidikan 8 hingga 12. Norma diadaptasi oleh Biro Konsultasi Fakultas Psikologi UGM lewat hasil tes siswa kelas tiga SMA dalam bentuk standard five dan dibedakan berdasarkan jenis kelamin (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

Reliabilitas Tes Cepat Teliti dibedakan berdasarkan jenis kelamin. Koefisien reliabilitas pada laki-laki sebesar 0,77 – 0,93, sedangkan pada perempuan sebesar 0,84 – 0,91. Penggunaan metode dalam perhitungan reliabilitas tidak disebutkan (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

(42)

yang tinggi pada Tes Cepat Teliti, namun skor subtes lain harus tinggi. Ada sebuah penelitian oleh Buntaran (1972 – Skripsi) tentang hubungan Tes Cepat Teliti (dan subtes lain) dengan prestasi kerja bagian rajut dan finishing di sebuah perusahaan wig di Yogyakarta. Hasil penelitian tersebut menyebutkan bahwa korelasi keduanya signifikan. Penelitian lain oleh Sukarti (1995) menggunakan peranan usia sebagai kriteria untuk perhitungan validitas Tes Cepat Teliti. Penelitian tersebut melibatkan subjek sebanyak 205 orang yang berusia 20-50 tahun. Hasil korelasinya ialah 0,453 yang tergolong signifikan sehingga dapat disimpulkan bahwa pertambahan usia menurunkan kemampuan kecepatan dan ketelitian seseorang.

Norma Tes Cepat Teliti dibuat dalam bentuk persentil yang terdiri dari norma asli dan norma adaptasi. Norma adaptasi menggunakan siswa kelas tiga SMA sebagai subjek yang dibedakan berdasarkan jenis kelamin dan dipilah dalam lima kategori, meliputi kurang sekali hingga baik sekali (Sugiyanto, Haryanto, Kuwato, Nuryoto, Retnowati, & Wulan, 1984).

(43)

waktu pengerjaan selama 6 menit. Tiap subtes memiliki standar pemberian nilai yang beda dan jumlah soal yang berbeda-beda. Selain itu, tiap subtes memiliki petunjuk pengerjaan dan contoh pengerjaan. Norma DAT yang digunakan di Laboratorium Psikologi di Universitas Sanata Dharma ialah norma hasil adaptasi Fakultas Psikologi Universitas Gajah Mada yang telah digunakan selama lebih dari 20 tahun.

B. Syarat Tes yang Baik

Tes memiliki beberapa persyaratan agar dapat menjalankan fungsinya dengan baik. Proses pembuatan tes harus memperhatikan syarat-syarat tersebut, meliputi perancangan dan administrasi, serta kualitas psikometrik. Tes yang memenuhi perancangan dan administrasi yang baik ialah tes yang memiliki tujuan pengukuran yang jelas, prosedur yang terstandardisasi, serta norma yang selalu diperbarui dalam jangka waktu tertentu. Kualitas psikometrik sebuah tes dikatakan baik apabila tes tersebut memiliki reliabilitas, validitas, serta kualitas item yang baik (Friedenberg, 1995; Supratiknya, 1998B; Gregory 2000). Oleh karena itu, syarat tes yang baik dapat dibagi menjadi dua bagian, meliputi:

1. Perancangan dan Administrasi

(44)

a. Tujuan yang Jelas

Sebuah tes harus memiliki domain yang akan diukur. Domain tes terdiri dari pengetahuan, keahlian, dan karakteristik kepribadian dari seseorang. Domain tes harus ditentukan terlebih dahulu sebelum merancang sebuah tes. Tes prestasi memiliki domain pengetahuan, tes bakat memiliki domain keahlian, dan tes kepribadian memiliki domain karakteristik kepribadian (Azwar, 1987; Friedenberg, 1995; Gregory 2000).

Selain domain tes, penentuan sasaran subjek tes juga merupakan hal yang penting. Subjek dapat dibedakan berdasarkan umur, misalnya anak-anak dan orang dewasa. Tes untuk anak-anak seharusnya dirancang berbeda dengan tes untuk orang dewasa. Apabila tes untuk anak-anak sama dengan tes untuk orang dewasa, maka tes tidak memiliki batasan pengukuran kemampuan untuk tiap jenjang usia (Friedenberg, 1995; Gregory 2000).

(45)

b. Isi yang Spesifik dan Terstandardisasi

Tes dikatakan baik apabila juga memiliki isi yang spesifik dan terstandardisasi. Tes yang spesifik ialah tes yang sesuai dengan domain yang akan diukur, yaitu berupa domain pengetahuan, keahlian, atau karakteristik kepribadian. Tes yang terstandardisasi merujuk pada semua subjek dites pada atribut yang sama. Tes juga sebaiknya memiliki seperangkat prosedur administrasi yang terstandardisasi, yaitu semua subjek yang mengerjakan tes mendapatkan instruksi, bahan, serta waktu pengerjaan tes yang sama (Friedenberg, 1995; Gregory 2000).

c. Prosedur Skoring yang Terstandardisasi

Syarat lain dari tes yang baik ialah memiliki prosedur skoring yang terstandardisasi. Prosedur skoring yang terstandardisasi merujuk pada semua subjek yang mengerjakan tes mendapatkan cara pemberian skor yang sama dan sesuai dengan norma tes yang telah ditentukan. Ketentuan ini terutama berlaku untuk tes-tes objektif yang memiliki kunci jawaban dan standar penyekoran (Friedenberg, 1995; Gregory 2000).

d. Norma Tes

(46)

karena itu, norma yang digunakan harus ditinjau dan diperbarui secara berkala karena bisa tidak sesuai lagi jika dipakai dalam jangka waktu tertentu (AERA, APA, NCME, 1999; Gregory 2000). Salah satu tahap proses pembuatan tes ialah pembuatan rancangan dan administrasi tes. Isi dari rancangan dan administrasi tes meliputi tujuan tes, isi tes, prosedur skoring, serta norma tes. Setiap isi dari rancangan dan administrasi tes memiliki kriteria masing-masing yang menghasilkan tes yang baik.

2. Kualitas Psikometrik

Kualitas psikometrik merupakan syarat yang terkait dengan karakteristik tes setelah tes disusun yang harus dipenuhi untuk memperoleh tes yang baik. Karakteristik ini meliputi reliabilitas, validitas, dan kualitas item. Tes yang memiliki reliabilitas, validitas, serta kualitas item yang baik menjadikan sebuah tes memenuhi standar kualitas psikometrik, yang dijelaskan sebagai berikut (Friedenberg, 1995; Anastasi & Urbina, 1997; Supratiknya, 1998B):

a. Reliabilitas

(47)

pengetesan menunjukkan bahwa sebuah tes tidak dapat dipercaya atau tidak reliabel. Namun, reliabilitas tes tidak harus diuji dengan pengetesan beberapa kali. Ada teknik – teknik perhitungan reliabilitas yang dapat menggunakan hasil satu kali pengetesan (Azwar, 1986; 1992B).

Koefisien reliabilitas ditunjukkan dengan korelasi. Angka atau koefisien korelasi yang menunjukkan reliabilitas disebut koefisien reliabilitas (rxx), yang merupakan rasio varians true score

dengan varians skor total (Supratiknya, 1998A; Gregory 2000). Ada tiga pendekatan estimasi reliabilitas, meliputi: 1) Pendekatan Tes Retest

Pendekatan ini didasarkan pada pelaksanaan tes yang sama sebanyak dua kali dalam waktu yang berbeda terhadap subjek yang sama. Hasil kedua pelaksanaan tes tersebut dikorelasikan sehingga menunjukkan koefisien reliabilitasnya. Jika korelasi sempurna, maka reliabilitas tes itu adalah 1,00. Panjang pendeknya selang waktu kedua tes ditentukan oleh keyakinan kita tentang kestabilan sifat yang diukur (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A).

Kelemahan pendekatan ini adalah adanya kemungkinan

(48)

Overestimasi terjadi apabila jawaban pada pengetesan kedua mengulang jawaban pada pengetesan pertama sehingga korelasi antara kedua pengetesan menjadi tinggi. Underestimasi pada koefisien reliabilitas terjadi jika ada practice effect, dimana kinerja testi meningkat pada pengetesan ulang karena proses belajar. Peningkatan kinerja ini akan mempertinggi skor pada pengetesan kedua sehingga korelasi antara pengetesan pertama dan pengetesan kedua menjadi rendah (Azwar, 1986; Supratiknya, 1998A).

Selain itu, kelemahan lain dari pendekatan tes retest ialah tenggang waktu antara tes pertama dan tes kedua. Tenggang waktu yang singkat akan mengakibatkan carry-over effect, yaitu testi masih mengingat jawabannya pada pengetesan pertama. Sebaliknya, tenggang waktu yang lama akan dapat mempengaruhi perubahan jawaban dan suasana hati, misalnya pada tes-tes kepribadian (Allen & Yen, 1979).

2) Pendekatan Bentuk Paralel

(49)

hasil pengukuran yang sama apabila sampel perilakunya merepresentasikan populasi (Azwar, 1987; Supratiknya, 1998A; Gregory, 2000).

Pendekatan ini akan menghasilkan estimasi reliabilitas yang baik apabila kedua tes memiliki fungsi pengetesan yang sama. Selain itu, tidak adanya pengaruh carry-over effect juga akan menghasilkan korelasi reliabilitas yang baik karena soal-soal kedua tes berbeda. Akan tetapi, pendekatan ini juga dapat menghasilkan estimasi reliabilitas yang buruk. Hal tersebut diakibatkan oleh kemungkinan bahwa kedua tipe tes mengukur hal yang berbeda (Nunnally, 1978; Allen & Yen, 1979).

3) Pendekatan Konsistensi Internal

Pendekatan konsistensi internal mengacu pada rata-rata korelasi antara item-item tes (Nunnally, 1978). Pendekatan ini dapat mengatasi masalah-masalah yang berkaitan dengan pengulangan tes, misalnya carry-over effect dan practice effect

dan hanya menggunakan skor satu kali tes. Teknik-teknik untuk melakukan pendekatan konsistensi internal ialah (Allen & Yen, 1979):

a) Koefisien α(α-Cronbach)

(50)

pada tes yang memiliki item-item yang ekuivalen. Maka dari itu, koefisien α kurang tepat apabila diterapkan pada tes-tes yang bersifat heterogen, yang mengukur berbagai macam aspek, karena akan menghasilkan underestimasi pada koefisien reliabilitas (Allen & Yen, 1979; Supratiknya, 1998A).

b) Split Half

Teknik ini dilakukan dengan membagi dua kelompok item tes yang ekuivalen, lalu dikorelasikan satu sama lain (Allen & Yen, 1979; Azwar, 1987, Supratiknya 1998A). Kelemahan teknik ini ialah besar koefisien korelasi yang bergantung pada pembagian item-item (Nunnally, 1978). Macam-macam cara pembagian item-item tes ialah (Azwar, 1987; Supratiknya, 1998A):

(1) Metode Penggal Tengah

(51)

daripada bagian belahan pertama karena tes tidak selesai dikerjakan atau soal bagian tengah kedua lebih sulit (Azwar, 1987; Supratiknya, 1998A).

(2) Metode Gasal Genap

Metode ini dilakukan dengan membelah tes lewat mengambil nomor item ganjil dan nomor item genap. Selanjutnya, skor nomor item ganjil dan nomor item genap dikorelasikan. Akan tetapi, hal ini memungkinkan hanya apabila jumlah item tes genap agar pembagiannya merata (Azwar, 1987; Supratiknya, 1998A).

(3) Metode Matched Random Subsets

Metode ini dilakukan dengan menghitung rit

(korelasi biserial antara skor item dan skor total tes) dan p (taraf kesukaran item). Setelah itu, skor diplot dengan mengelompokkan tiap dua skor yang berdekatan dan ditentukan skor atas dan skor bawah. Koefisien reliabilitas didapatkan dengan mengkorelasikan skor atas dan skor bawah (Azwar, 1986; Supratiknya, 1998A).

Koefisien korelasi yang didapat dari pendekatan

(52)

item-item ekuivalen, maka perlu dilakukan lagi perhitungan koefisien keseluruhan tes berdasarkan koefisien split-halfnya dengan Spearman Brown Formula (Allen & Yen, 1979; Azwar, 1987; Supratiknya, 1998A).

b. Validitas

Pengertian validitas telah berevolusi dari waktu ke waktu. Pengertian awal mengenai validitas ialah mengukur apa yang seharusnya diukur. Namun, perkembangan konsep validitas memandang bahwa validitas merupakan usaha mencari bukti-bukti empiris untuk menentukan kelayakan penggunaan sebuah tes (Santoso, 2010; Supratiknya, 1998A).

Ada tiga cara estimasi validitas, meliputi (Allen & Yen, 1979; Nunnally, 1978; Azwar, 1986; Supratiknya, 1998A; Gregory, 2000; Santoso, 2010):

1) Validitas Isi

(53)

Ada dua tipe validitas isi, yaitu (Azwar, 1986; Supratiknya, 1998A):

a) Validitas Muka

Validitas ini diselidiki dengan cara menemukan kesimpulan bahwa tes mengukur sifat yang relevan lewat pendapat orang-orang. Orang yang diminta menilai bisa siapa saja, mulai dari para ahli sampai subjek yang dites, bahkan orang awam (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A).

b) Validitas Logis

(54)

2) Validitas Berdasarkan Kriteria

Tipe validitas ini menunjukkan bahwa sebuah tes berfungsi secara efektif apabila dapat mengestimasi performansi testi, yang dikenal sebagai kriteria. Validitas berdasarkan kriteria ini dinyatakan dalam suatu koefisien korelasi, yakni korelasi antara skor tes dan skor kriteria. Maka dari itu, validitas ini bisa digunakan apabila skor tes dapat dihubungkan dengan kriteria (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A; Gregory, 2000).

Ada dua cara mengestimasi validitas berdasarkan kriteria (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A; Gregory, 2000):

a) Validitas Prediktif

(55)

b) Validitas Konkuren

Validitas ini digunakan jika skor tes dan skor kriteria dikumpulkan pada saat yang bersamaan. Kemudian, kedua skor tersebut dikorelasikan untuk mendapatkan koefisien validitasnya. Validitas konkuren lebih tepat digunakan untuk mengestimasi kriteria yang konkuren dibandingkan memprediksi perilaku (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A; Gregory, 2000).

3) Validitas Konstruk

Validasi konstruk menunjuk pada sejauh mana suatu tes mengukur konstruk teoritis atau sifat yang hendak diukur. Apabila didapatkan bukti empiris yang menunjukkan korelasi yang seharusnya antara skor tes dengan konstruk-konstruk, maka validitas konstruk tes tersebut tercapai (Azwar, 1986; Supratiknya, 1998A; Gregory, 2000).

Ada dua metode validitas konstruk (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A; Gregory, 2000):

a) Multisifat – Multimetode

(56)

digunakan (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A).

Ada dua tipe validitas multisifat – multimetode (Allen & Yen, 1979):

(1) Validitas Konvergen

Validitas konvergen ditunjukkan ketika skor tes sifat yang mengukur sifat yang sama berkorelasi tinggi dengan metode yang berbeda. Korelasi yang tinggi menunjukkan bahwa tes sejalan dengan sifat (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A; Gregory, 2000).

(2) Validitas Diskriminan

Validitas diskriminan ditunjukkan dengan korelasi rendah antara skor tes sifat yang mengukur sifat yang berbeda. Korelasi yang rendah menunjukkan bahwa tes mendiskriminasikan sifat yang berbeda (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A; Gregory, 2000).

b) Validitas Faktorial

(57)

tersebut dalam faktor. Faktor ialah variabel hipotesis yang mempengaruhi skor pada subtes-subtes. Hasil dari analisis faktor berupa matriks korelasi antar subtes. Ketika faktor-faktor tidak berkorelasi satu sama lain, muatannya akan ditampilkan sebagai korelasi antara tes dan faktor. Ketika faktor berkorelasi satu sama lain, muatannya tidak berkorelasi namun dapat diinterpretasi seakan-akan berkorelasi, kecuali faktor-faktor yang berinterkorelasi tinggi (Allen & Yen, 1979; Azwar, 1986; Supratiknya, 1998A; Gregory, 2000).

Analisis faktor memiliki dua bentuk, yaitu (Hair, Anderson, Tatham, & Black, 1995):

(1) Analisis Faktor Konfirmatori

(58)

(2) Analisis Faktor Eksploratori

Analisis faktor eksploratori digunakan untuk mencari struktur kesalinghubungan antara variabel. Selain itu, analisis ini juga berfungsi sebagai metode untuk mengurangi jumlah data yang dianalisis. Jumlah faktor yang dihasilkan biasanya lebih sedikit dibandingkan dengan jumlah variabel yang diteliti (Hair, Anderson, Tatham, & Black, 1995).

c. Kualitas Item

Tes yang baik ialah tes yang memiliki item-item yang berkualitas. Item-item yang berkualitas menunjukkan bahwa item-item tersebut telah melalui proses penyusunan yang berdasarkan petunjuk penulisan item yang semestinya. Item-item yang berkualitas tinggi walaupun jumlahnya sedikit lebih baik daripada item-item berkualitas rendah dengan jumlah banyak. Pengujian terhadap kualitas item-item akan membawa kesimpulan terhadap setiap item, meliputi item dapat digunakan, item dapat diperbaiki, atau item harus dibuang (Azwar, 1987; Supratiknya, 1998B).

Pengujian terhadap kualitas item menggunakan parameter-parameter sebagai berikut:

1) Koefisien α

(59)

baik ketika item tersebut menurunkan koefisien α apabila dihapus. Sebaliknya, suatu item dinilai buruk ketika item tersebut meningkatkan koefisien α apabila dihapus (Prakosa, 1998).

Kelemahan metode ini ialah berkurangnya item juga dapat menurunkan koefisien α, walaupun item tersebut meningkatkan koefisien α apabila dihapus. Oleh karena itu, penggunaan parameter ini sebagai analisis terhadap kualitas item sebaiknya mengikuti prosedur iteratif, seperti: menghitung terus-menerus koefisien α dengan menggugurkan item yang menurunkan koefisien α hingga tidak ada lagi item yang menurunkan koefisien α (Prakosa, 1998).

2) Indeks Kesukaran Item

(60)

Item yang baik ialah item yang memiliki tingkat kesukaran yang tidak terlalu rendah dan tidak terlalu tinggi. Oleh karena itu, p yang baik berada di kisaran 0,3 – 0,7 (Allen & Yen, 1979; Azwar, 1987; Supratiknya, 1998B).

3) Indeks Daya Diskriminasi Item

Indeks daya diskriminasi item merupakan kemampuan item dalam memperlihatkan kesesuaian fungsinya dengan fungsi tes. Perhitungan indeks daya diskriminasi item dapat dilakukan dengan dua cara, meliputi (Allen & Yen, 1979; Supratiknya, 1998B; Azwar, 1999):

a) Korelasi Item Total

(61)

fungsi tes (Azwar, 1987; Supratiknya, 1998B; Azwar, 1999).

b) Pembagian Kelompok Tinggi dan Kelompok Rendah

(62)

Tinggi dan Kelompok Rendah (Azwar, 1987; Supratiknya, 1998B).

Daya diskriminasi item yang baik berkisar antara 0,4 – 0,6 yang menunjukkan bahwa item tidak terlalu mudah dan tidak terlalu sulit. Berikut kriteria penentuan kategori evaluasi indeks daya diskriminasi item adalah:

Tabel 1.

Kategori Evaluasi Indeks Daya Diskriminasi Item (Azwar, 1987; Supratiknya, 1998B)

Daya Diskriminasi Item Kategori

0,40 ≤ baik sekali

0,30 – 0,39 lumayan baik dan perlu peningkatan 0,20 – 0,29 belum memuaskan dan perlu diperbaiki < 0,20 buruk dan harus dibuang

4) Efektivitas Distraktor

Efektivitas distraktor menunjukkan pilihan jawaban selain kunci, yang disebut distraktor, telah berfungsi sebagaimana mestinya atau tidak. Distraktor yang baik ialah distraktor yang dapat mengecoh Kelompok Rendah, namun tidak dapat mengecoh Kelompok Tinggi. Efektivitas distraktor dilihat melalui dua kriteria, yaitu:

a) Jumlah pemilih distraktor pada Kelompok Rendah lebih

banyak daripada Kelompok Tinggi. Kriteria ini berkaitan dengan daya diskriminasi item.

b) Ada pemilih untuk setiap alternatif jawaban. Distraktor

(63)

tersebut tampak jelas sebagai pilihan yang salah (Azwar, 1987; Supratiknya, 1998B).

Kualitas psikometrik terdiri dari tiga karakteristik, meliputi reliabilitas, validitas, dan kualitas item. Ketiga karakteristik tersebut harus terpenuhi dalam sebuah tes agar tes memenuhi standar kualitas psikometrik. Reliabilitas dan validitas memiliki beberapa teknik estimasi yang masing-masing memiliki kelebihan dan kekurangan. Penggunaan teknik estimasi reliabilitas dan validitas dapat disesuaikan dengan kebutuhan dan ketersediaan data. Kualitas item-item tes dapat diuji dengan menggunakan beberapa parameter. Hasil pengujian tersebut akan memperlihatkan item-item yang layak pakai dan tidak layak pakai.

3. Norma Tes a. Pengertian

(64)

mencantumkan banyaknya data dalam tiap interval kelas tersebut (Azwar, 1987; Gregory 2000).

b. Pedoman Pembuatan Norma

Norma yang efektif ialah norma yang dibuat berdasarkan pedoman pembuatan norma yang baik. Pedoman umum dalam pembuatan norma ialah:

1) Karakteristik yang diukur oleh tes dapat menentukan urutan

subjek dari skala rendah ke skala tinggi.

2) Tes mencerminkan karakteristik definisi operasional.

3) Distribusi skor tes mengukur karakteristik psikologis yang

sama.

4) Menggunakan subjek yang sesuai dengan tujuan tes.

5) Data dapat digunakan untuk kelompok-kelompok lain yang

relevan (Suryobroto, 1987; Gregory 2000). c. Langkah-Langkah Pengembangan Norma

Langkah-langkah pengembangan norma tes, meliputi: 1) Membuat distribusi skor tes dari kelompok norma atau sampel

terstandardisasi.

2) Membuat tendensi sentral dan variabilitas distribusi skor tes. 3) Mengubah skor-skor tes lewat teknik-teknik pengubahan skor

(65)

d. Teknik Pengubahan Skor

Skor yang dihasilkan lewat pengetesan merupakan skor mentah. Skor mentah akan dapat diinterpretasikan apabila telah diubah ke dalam skor norma (Gregory, 2000). Beberapa teknik pengubahan skor ialah:

1) Skor dengan Persentil

Salah satu cara membuat norma ialah penyekoran lewat persentil. Persentil ditampakkan lewat tingkat persentase seseorang dalam sampel terstandardisasi yang skornya berasal dari skor mentah. Persentil juga dapat dilihat sebagai rangking dalam kelompok yang terdiri dari 100 orang. Norma persentil dibuat dengan menentukan batasan norma terlebih dahulu, misalnya pemberian nilai A, B, C, D, dan E. Selanjutnya, distribusi skor kelompok dapat dihitung menjadi batasan norma. Distribusi skor kelompok meliputi sebaran skor terendah hingga skor tertinggi. Apabila skor persentil telah ditemukan, maka skor mentah dapat diterjemahkan ke dalam batasan norma yang telah ditentukan sebelumnya (Azwar, 1987; Gregory 2000).

2) Skor dengan Skor Standar

(66)

distribusi skor kelompok. Batasan norma juga ditentukan terlebih dahulu. Perhitungan rerata dan deviasi standar skor kelompok disesuaikan dengan batasan norma yang digunakan sehingga ditemukan norma penilaian dapat digunakan (Azwar, 1987; Gregory 2000).

3) Skor T

Skor T biasanya digunakan dalam norma tes kepribadian, misalnya MMPI. Skor T ialah skor yang memiliki rerata sebesar 50 dan sebuah deviasi standar sebesar 10. Cara mendapatkan skor T ialah dengan merubah skor mentah lewat sebuah formula, yaitu:

50 10 +

= z

T , zialah skor standar (Gregory, 2000). 4) Skor dengan Stanine

(67)

Tabel 2.

Pedoman Persentase Stanine (Azwar, 1987)

Stanine 1 2 3 4 5 6 7 8 9

Persentase 4% 7% 12% 17% 20% 17% 12% 7% 4%

Norma tes berfungsi untuk memberikan petunjuk pemberian nilai pada hasil tes. Pembuatan norma tes yang baik didasarkan pada pedoman dan langkah-langkah pembuatan norma. Perhitungan dalam norma biasanya didasarkan pada teknik-teknik pengubahan skor mentah. Setiap teknik pengubahan skor memiliki proses perhitungan masing-masing.

C. Kerangka Penelitian

Penelitian ini akan mengevaluasi subtes-subtes DAT yang dipergunakan dalam tes bakat yang ada di Laboratorium Fakultas Psikologi di Universitas Sanata Dharma, Yogyakarta. Subtes-subtes tersebut terdiri dari Tes Berhitung, Tes Pengertian Mekanik, dan Tes Penalaran. Parameter yang dievaluasi meliputi estimasi reliabilitas dengan teknik α-Cronbach, estimasi validitas dengan menggunakan metode

analisis faktor konfirmatori, estimasi kualitas item, dan perhitungan norma.

(68)

& Yen, 1979; Supratiknya, 1998A). Estimasi reliabilitas lewat teknik koefisien α-Cronbach digunakan untuk mengatasi kelemahan metode split half, yaitu cara pembelahan item yang berbeda akan menghasilkan koefisien reliabilitas yang berbeda pula. Teknik α-Cronbach mengupayakan perhitungan rata-rata koefisien reliabilitas terhadap setiap kemungkinan pembelahan item sehingga estimasinya lebih stabil dibandingkan metode split half (Cronbach, dalam Gregory, 2000).

Estimasi validitas dilakukan dengan menggunakan validitas konstruk dengan teknik analisis faktor konfirmatori. Validitas konstruk digunakan agar bukti validitas terhadap Tes Berhitung, Tes Pengertian Mekanik, dan Tes Penalaran bertambah dan tidak hanya berasal dari validitas berdasarkan kriteria. Hal tersebut dikarenakan penggunaan metode yang bervariasi akan memperkuat bukti-bukti validitas tes (Santoso, 2010).

(69)

Perhitungan norma dilakukan dengan menggunakan teknik pengubahan skor dengan persentil. Perhitungan norma perlu dilakukan karena Laboratorium Fakultas Psikologi Universitas Sanata Dharma masih menggunakan norma adaptasi yang tidak pernah dievaluasi selama lebih dari 20 tahun, padahal norma harus ditinjau dan diperbarui secara berkala (AERA, APA, NCME, 1999).

D. Pertanyaan Penelitian

1. Bagaimana reliabilitas tiga subtes DAT yang ada di Laboratorium

Fakultas Psikologi USD?

2. Bagaimana validitas tiga subtes DAT yang ada di Laboratorium

Fakultas Psikologi USD?

3. Bagaimana kualitas item tiga subtes DAT yang ada di Laboratorium

Fakultas Psikologi USD?

4. Bagaimana standar norma untuk tiga subtes DAT yang dipakai di

(70)

52  BAB III

METODE PENELITIAN

A. Jenis Penelitian

Penelitian ini adalah penelitian kuantitatif deskriptif. Penelitian deskriptif dilakukan dengan menyajikan data, menganalisis, serta menginterpretasinya (Narbuko & Achmadi, 1991). Peneliti akan menggambarkan kualitas psikometrik tiga subtes Differential Aptitude Test

(DAT) di Laboratorium Fakultas Psikologi Universitas Sanata Dharma, yaitu Tes Berhitung, Tes Pengertian Mekanik, dan Tes Penalaran.

B. Identifikasi Variabel

Variabel dalam penelitian DAT ini adalah: 1. Reliabilitas

2. Validitas 3. Kualitas Item

a. Koefisien α

b. Indeks Daya Diskriminasi Item c. Indeks Kesukaran Item

(71)

C. Batasan Operasional Variabel

1. Reliabilitas

Prinsip reliabilitas ialah sejauhmana hasil suatu pengetesan dapat dipercaya (Azwar, 1986). Reliabilitas diperoleh dengan menggunakan pendekatan konsistensi internal lewat teknik koefisien α-Cronbach.

2. Validitas

Validitas ialah usaha mencari bukti-bukti empiris untuk menentukan kelayakan penggunaan sebuah tes (Santoso, 2010). Bukti validitas yang disajikan dalam penelitian ini didapatkan melalui teknik analisis faktor konfirmatori.

3. Kualitas Item

Kualitas item merujuk pada item yang telah melalui proses penyusunan berdasarkan petunjuk penulisan item yang semestinya (Azwar, 1987). Kualitas item ditentukan oleh empat hal berikut:

a. Koefisien α

Koefisien α diperoleh dengan melakukan perhitungan α

-Cronbach if Item Deleted. b. Indeks Kesukaran Item

(72)

c. Indeks Daya Diskriminasi Item

Indeks daya diskriminasi item diperoleh dengan menghitung korelasi item-total. Korelasi item-total diperoleh dengan cara mengkorelasikan distribusi skor setiap item dengan skor total pada tes. d. Efektivitas Distraktor

Efektivitas distraktor dilihat melalui pilihan jawaban pada setiap item. Efektivitas distraktor ditentukan melalui dua kriteria, meliputi:

1) Jumlah pemilih distraktor pada Kelompok Rendah lebih banyak

daripada Kelompok Tinggi.

2) Ada pemilih untuk setiap alternatif jawaban. 4. Norma

Norma disusun menggunakan teknik pengubahan skor dengan persentil.

D. Subjek Penelitian

Subjek yang dilibatkan dalam penelitian ini ialah semua testee praktikum Tes Bakat mahasiswa Psikologi pada tahun 2008, 2009, dan 2010, Universitas Sanata Dharma. Jumlah subjek yang dilibatkan ialah 683 orang.

E. Prosedur Penelitian

(73)

1. Mengurus perijinan untuk menggunakan data yang ada di Laboratorium Fakultas Psikologi Universitas Sanata Dharma.

2. Mengambil data subtes-subtes DAT mengenai skor item dan skor total tiap subjek. Data berupa hasil praktikum Tes Bakat pada tahun 2008, 2009, dan 2010.

3. Memasukkan data berupa skor item dan skor total setiap subjek ke dalam

Microsoft Excel 2007.

4. Menganalisis data dengan teknik-teknik yang telah ditentukan sebelumnya

untuk melihat reliabilitas dan validitas, menentukan kualitas item, serta menghitung norma tiga subtes DAT.

F. Metode Pengumpulan Data

Metode pengumpulan data yang digunakan dalam penelitian ini adalah metode dokumentasi. Data dokumentasi tersebut diperoleh dari Laboratorium Fakultas Psikologi Universitas Sanata Dharma, Yogyakarta.

Dokumen yang dibutuhkan dalam penelitian ini yaitu skor subtes-subtes DAT meliputi skor Tes Berhitung, skor Tes Pengertian Mekanik, dan skor Tes Penalaran dari hasil praktikum Tes Bakat pada tahun 2008, 2009, dan 2010. Dokumen tersebut terdiri dari:

(74)

G. Metode Analisis Data

Data dari hasil tes akan diolah untuk memperoleh estimasi tentang kualitas psikometrik tes yang meliputi reliabilitas, validitas, kualitas item, dan norma. Hasil estimasi tersebut kemudian dipaparkan secara deskriptif menggunakan tabel. Metode-metode analisis data yang digunakan ialah:

1. Reliabilitas

Reliabilitas dihitung dengan menggunakan pendekatan konsistensi internal, yaitu teknik α-Cronbach. Perhitungan koefisien α-Cronbach dilakukan dengan membandingkan performansi subjek pada setiap item dan performansinya pada keseluruhan item (Allen & Yen, 1979; Supratiknya, 1998A). Standar koefisien reliabilitas ideal untuk bentuk

aptitude test berada di atas standar koefisien reliabilitas ideal untuk bentuk

standardized achievements tests, yaitu 0,85 (Murphy & Davidshofer, 2005). Subtes-subtes DAT yang akan dievaluasi dikatakan memiliki reliabilitas yang baik apabila memenuhi syarat tersebut. Perhitungan koefisien reliabilitas tersebut dilakukan dengan program SPSS 15.

2. Validitas

(75)

konstrak teoritisnya (Hair, Anderson, Tatham, & Black, 1995). Penelitian ini menggunakan analisis faktor konfirmatori lewat model fitness yang menunjukkan selisih antara nilai korelasi yang dihasilkan dari model dan korelasi yang didapatkan dari data. Semakin kecil selisih model, maka model dan data semakin fit. Sebaliknya, semakin besar selisih model, maka model dan data semakin tidak fit (Santoso, 2011B). Model fitness

yang digunakan untuk penelitian ini ialah Root Mean Square Error of Approximation (RMSEA), Normed Fit Index (NFI), Non-Normed Fit Index (NNFI), Comparative Fit Index (CFI), dan Incremental Fit Index

(IFI). Subtes-subtes DAT yang akan dievaluasi dikatakan valid apabila memenuhi kriteria paling tidak tiga model fitness yang digunakan tersebut. Tabel berikut menunjukkan kriteria model fitness yang digunakan serta alasan penggunaannya.

Tabel 3.

Kriteria dan Alasan Penggunaan Model Fitness (Hu & Bentler, 1998)

No. Model Fitness Kriteria Alasan Penggunaan

1.

Root Mean Square Error of Approximation

(RMSEA)

< 0,06 − Tidak sensitif pada jumlah sampel

− Sensitif pada model estimasi, namun hanya pada jumlah sampel kecil

− Tidak sensitif pada distribusi sampel

2. Normed Fit Index (NFI) ≥ 0.95 − Tidak sensitif pada distribusi sampel

3. Non-Normed Fit Index (NNFI)

≥ 0.95 − Hanya sedikit sensitif pada jumlah dan distribusi sampel 4. Comparative Fit Index

(CFI)

≥ 0.95 − Tidak sensitif pada jumlah dan distribusi sampel

5. Incremental Fit Index (IFI)

Gambar

Tabel 1. Kategori Evaluasi Indeks Daya Diskriminasi Item (Azwar, 1987; Supratiknya,
Tabel 2. Pedoman Persentase Stanine (Azwar, 1987)
Tabel berikut menunjukkan kriteria model fitness yang digunakan serta
Tabel 4. Deskripsi Subtes DAT dalam Tes Bakat
+7

Referensi

Dokumen terkait

Penelitian ini bertujuan untuk mengetahui pengaruh kualitas, merek, promosi, harga, kelompok acuan dan ketersediaan terhadap minat beli ulang konsumen produk pasta gigi