EVALUASI KUALITAS PSIKOMETRIK PADA TES PENJURUSAN SMA PUSAT PELAYANAN TES DAN KONSULTASI PSIKOLOGI
UNIVERSITAS SANATA DHARMA
Skripsi
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Psikologi
Program Studi Psikologi
Oleh :
Laurensia Anggi Dini Riama
079114079
PROGRAM STUDI PSIKOLOGI
JURUSAN PSIKOLOGI
FAKULTAS PSIKOLOGI
UNIVERSITAS SANATA DHARMA
SKRIPSI
EVALUASI KUALITAS PSIKOMETRIK PADA TES
PENJURUSAN SMA PUSAT PELAYANAN TES DAN
KONSULTASI PSIKOLOGI UNIVERSITAS SANATA
DHARMA
Dipersiapkan dan ditulis oleh :
Laurensia Anggi Dini Riama
079114079
Telah dipertahankan di depan panitia penguji
pada tanggal 17 Januari 2012
dan dinyatakan memenuhi syarat
Susunan Panitia Penguji
Nama Penguji Tanda Tangan
Penguji I Y. Agung Santoso, M.A. ……….
Penguji II Prof. Dr. A. Supratiknya ……….
Penguji III Dr. T. Priyo Widiyanto, M.Si. ……….
HALAMAN MOTTO
Ketika bebanmu terasa BERAT,
HALAMAN PERSEMBAHAN
Skripi ini kupersembahkan kepada :
1.
Yesusku yang baik
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini
tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan
dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.
Yogyakarta, 14 Februari 2012
Penulis
EVALUASI KUALITAS PSIKOMETRIK PADA TES PENJURUSAN SMA PUSAT PELAYANAN TES DAN KONSULTASI PSIKOLOGI
UNIVERSITAS SANATA DHARMA
Laurensia Anggi Dini Riama
ABSTRAK
Pusat Pelayan Tes dan Konsultasi Psikologi (P2TKP) Universitas Sanata Dharma memiliki rangkaian Differential Aptitude Test (DAT) yang diadaptasikan menjadi rangkaian tes penjurusan untuk siswa Sekolah Menengah Atas (SMA). Penelitian ini bertujuan untuk mendeskripsikan kualitas psikometrik dari tes penjurusan. Tes penjurusan terdiri dari enam subtes yaitu Analogi Verbal ( Verbal Reasoning), Vokabuler (Language Usage), Kemampuan Numerik (Numerical Reasoning), Penalaran Mekanik (Mechanical Reasoning), Berpikir Abstrak (Abstract Reasoning), Hubungan Ruang (Space Relations). Evaluasi ini perlu dilakukan untuk mengetahui sejauh mana alat tes ini memenuhi standar yang berlaku dan dapat terpercaya dalam menjalankan fungsinya. Penelitian ini menggunakan data dokumentasi sebanyak 204 siswa-siswi yang pernah memakai jasa P2TKP. Analisis kualitas item menggunakan taraf kesukaran item, korelasi item total dan efektifitas distraktor. Analisis Validitas menggunakan program Lisrel 8.80 untuk mengetahui tingkat validitas subtes penjurusan. Data dianalisis reliabilitasnya menggunakan formula alpha dalam SPSS 17.0. Peneliti juga memberikan acuan untuk memperbaharui norma dengan mengikuti aturan norma lama P2TKP. Hasil penelitian menyatakan bahwa setiap subtes penjurusan memilikiitem-item yang perlu direvisi untuk meningkatkan kualitas item dan reliabilitas tes. Koefisien reliabilitas yang didapat berkisar antara 0.641 sampai dengan 0.933. Validitas yang dihasilkan ke empat tes dikatakan baik karena item-item yang menyusun subtes tersebut dapat mengungkap suatu konstruk teori. Namun untuk subtes Penalaran Mekanik dan Tanggap Ruang ditemukan memiliki validitas yang kurang menyakinkan. Pembuatan norma dilakukan dengan menggunakan aturan yang berlaku di P2TKP. Peneliti membuat norma umum, norma untuk kelompok laki-laki dan norma untuk kelompok perempuan dengan 16 klasifikasi. Namun terdapat beberapa kelompok norma yang hanya memiliki 15 dan 14 klasifikasi saja.
EVALUATION OF THE PYCHOMETRICAL QUALITY IN THE SENIOR HIGH SCHOOL’S MAJORING TEST
OF THE CENTER FOR PSYCHOLOGICAL TESTING AND CONSULTATION SERVICE
OF SANATA DHARMA UNIVERISTY
Laurensia Anggi Dini Riama
ABSTRACT
The Center for Psychological testing and Consultation service of Sanata Dharma University (Pusat Pelayanan Tes dan Konsultasi Psikologi Universitas Sanata Dharma – P2TKP) owns the battery of Differential Aptitude Test (DAT) which is adapted into the course of majoring test for Senior High’s students. This research aims to describe psychometrical quality of the mentioned test above. This majoring test consists of six sub-tests, i.e. Verbal Reasoning, Language Usage, Numerical Ability, Mechanical Reasoning, Abstract Reasoning and Space Relation. This evaluation is needed to investigate how far this testing instrument in accord with current standard and fuctioning properly. This research uses the documentations of 204 students who have used the service of P2TKP. The quantitative analyses of each item includes the level of difficulties of items, tatal corelation of items and the distractorical-efectivity. The analyses of its validity use the Lisrel 8.80 program in order to investigate the level of validity for each majoring sub-test. The reliability of data is analyzed using the alpha formula in SPSS 17.0. The researcher gives also some guidelines to renew the norm referring to the old one of P2TKP. The result of this research claims that every level of the majoring sub-test has the certain items that needs to be revised, in order to improve the quality and the reliability of those items. The reliabilty-coeficience of this test reached the number of 0.641 to 0.9333. The validity resulted by the for sub-test is concluded as good since the items costructing the test are able to dislcosure the theoretical construction. Yet, for the Mechanical Reasoning and Spatial Reasoning subtests, the researcher found that the number of validity is still low. The norm-making refers to the present norm of P2TKP. The reseracher makes a kind of general norm: both for male and female in 16 classfications, but there also some groups with only 15 and 14 classifications intended.
LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma:
Nama : Laurensia Anggi Dini Riama
NIM : 079114079
Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan
Universitas Sanata Dharma Yogyakarta, karya ilmiah saya yang berjudul:
“EVALUASI KUALITAS PSIKOMETRIK PADA TES PENJURUSAN SMA PUSAT PELAYANAN TES DAN KONSULTASI PSIKOLOGI
UNIVERSITAS SANATA DHARMA”
beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan
kepada Perpustakaan Universitas Sanata Dharma Yogyakarta hak untuk
menyimpan dan mengalihkan dalam bentuk media lain, mengelolanya dalam
bentuk pangkalan data, mendistribusikan secara terbatas, dan mempublikasikan di
internet atau media lain untuk kepentingan akademis tanpa harus meminta ijin
dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan
nama saya sebagai penulis.
Demikian pernyataan ini saya buat dengan sebenarnya
Dibuat di Yogyakarta
Pada tanggal : 14 Februari 2012
Yang menyatakan,
KATA PENGANTAR
Penelitian ini merupakan usaha untuk mengevaluasi kualitas psikometrik
dari Tes Bakat yang digunakan oleh Pusat Pengembangan Tes dan Konsultasi
Psikologi (P2TKP) Universitas Sanata Dharma dalam Tes Penjurusan siswa-siswi
SMA. Harapan peneliti, penelitian ini dapat memberikan informasi dan bahan
pertimbangan untuk evaluasi psikometrik alat tes selanjutnya.
Penelitian ini dapat terselesaikan atas berkah dan kasih Tuhan Yesus
Kristus yang senantiasa menyertai. Kasih Tuhan juga terpancar dari setiap orang
yang membimbing, membantu, menyemangati dan memberi saran dalam
penelitian ini.
Oleh karena itu, Peneliti mengucapkan terimakasih kepada :
1. Bapak Agung Santoso, MA. Selaku Dosen Pembimbing Skripsi yang telah
dengan sabar membimbing dalam penelitian ini dari awal sampai akhir.
Terimakasih banyak, Pak. ☺
2. Bapak Y. Heri Widodo selaku kepala P2TKP yang telah memberikan izin
untuk melakukan penelitian ini.
3. Bapak C. Adi Wijaya Nugroho dengan pemberian program LISREL untuk
analisis dalam penelitian ini.
4. Bapak Antonius Soesilastanto, Mbak Diana Pujihastuti dan asisten P2TKP
untuk semua kebahagiaan yang kita alami bersama, Puji Tuhan yaa.
Especially untuk Desse, Nina, Ita Mbott, Oppie, Ina Inut, Ana Maria Galo
5. Segenap Dosen Fakultas Psikologi yang telah berbagi ilmu dan memberikan
kenangan terbaik dalam hidup saya.
6. Mas Gandung, Bu Nani, Mas Muji, Mas Doni, Pak Gie. Maturnuwun untuk
kesabarannya dalam proses administrasi, pengetesan, asistensi, peminjaman
buku dan keramahannya.
7. Emak tercinta dan Bapak tersayang yang selalu menunjukkan penerimaan
tanpa syarat khusus untuk aku anakmu. Terimakasih untuk Cinta dan Kasih
yang tidak terbatas. Anakmu sarjana, PakMak.. Mas Tersayang Frater Maruli,
Scj.. aku sarjana duluan yaaa.. ☺
8. Romo Silverius Tobe Namang, ss.cc yang sudah banyak membantu
kelancaran studi, memotivasi dan menertawakan saya.. Terimakasih ya..
9. Yuyuk, Mira, Lelek.. Aku bisa baca, tulis, makan enak dan belajar masak
karena kesabaran Yuyuk, bisa merasakan punya adik karena Yuyuk dan
Lelek.. Maturnuwun nggih..
10. Teman-teman stress sesuatu : Ita Mbott, Nenist Cheerly Lova#ehemm, Mba
Evrin, Mba Diah, Mba Jessi, Nenek Reny, Hetty don’t miss me, Nanoz
Leunca, Tante Keket, Oom Muhlis, Enyak Putri..Puji Tuhan yaaa,, sarjana
nih sesuatu..
11. Teman-teman Rotaract Club of Yogya Tugu untuk semua proses yang kita
lewati bersama.
Yogyakarta, 14 Februari 2012
DAFTAR ISI
HALAMAN JUDUL ... i
HALAMAN PERSETUJUAN DOSEN PEMBIMBING ... ii
HALAMAN PENGESAHAN ... iii
HALAMAN PERSEMBAHAN ... iv
HALAMAN MOTTO ... v
PERNYATAAN KEASLIAN KARYA ... vi
ABSTRAK ... vii
ABSTRACT ... viii
HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH ... ix
KATA PENGANTAR ... x
DAFTAR ISI ... xii
DAFTAR TABEL ... xv
DAFTAR LAMPIRAN ... xvii
BAB I. PENDAHULUAN ... 1
A.Latar Belakang ... 1
B.Rumusan Masalah ... 5
C.Tujuan Penelitian ... 5
D.Manfaat Penelitian ... 6
BAB II. LANDASAN TEORI ... 7
A.Tes Psikologis ... 7
1. Definisi ... 7
3. Klasifikasi Tes Psikologis ... 11
4. DAT untuk penjurusan di P2TKP ... 13
B.Kualitas Psikometrik ... 15
1. Validitas Alat Tes ... 15
2. Reliabilitas Alat Tes ... 19
3. Analisis Item ... 23
C.Norma ... 26
D.Kerangka Penelitian ... 30
E.Pertanyaan Penelitian ... 31
BAB III. METODE PENELITIAN ... 33
A.Jenis Penelitian ... 33
B.Identifikasi Variabel ... 33
C.Definisi Operasional ... 33
D.Populasi dan Sampel ... 35
E.Metode Pengambilan Data ... 35
F. Analisis Data ... 36
BAB 1V. HASIL PENELITIAN DAN PEMBAHASAN ... 38
A.Orientasi Kancah ... 38
B.Persiapan Penelitian ... 38
C.Pelaksanaaan Penelitian ... 39
D.Hasil Penelitian dan Pembahasan ... 40
1. Analogi Verbal III A1 (AV IIIA1) ... 40
3. Kemampuan Numerik (KN) ... 51
4. Penalaran Mekanik (PM) ... 57
5. Berpikir Abstrak (BA) ... 62
6. Hubungan Ruang (HR) ... 67
BAB V. KESIMPULAN DAN SARAN ... 73
A.Kesimpulan ... 73
B.Saran ... 74
DAFTAR PUSTAKA ... 77
LAMPIRAN – LAMPIRAN ... 79
DAFTAR TABEL
Tabel 1. Kriteria Evaluasi Indeks Diskriminasi ... 25
Tabel 2. Persentase pengubahan skor stanine ... 29
Tabel 3. Pedoman Penentuan Persentil dan Lambang angka ... 30
Tabel 4. Daftar tes yang akan dievaluasi ... 38
Tabel 5. Klasifikasi item-item pada subtes Analogi Verbal ... 42
Tabel 6. Klasifikasi item-item yang perlu direvisi ... 42
Tabel 7. Hasil Fit Indeks ... 44
Tabel 8. Perbandingan Norma baru dan norma P2TKP ... 45
Tabel 9. Klasifikasi item-item pada subtes Vokabuler ... 47
Tabel 10. Klasifikasi item-item yang perlu direvisi ... 47
Tabel 11. Hasil Fit Indeks ... 49
Tabel 12. Perbandingan Norma baru dan norma P2TKP ... 50
Tabel 13. Klasifikasi item-item dalam subtes Kemampuan Numerik ... 51
Tabel 14. Klasifikasi item-item yang perlu direvisi ... 52
Tabel 15. Hasil Fit Indeks ... 53
Tabel 16. Perbandingan Norma baru dan norma P2TKP ... 55
Tabel 17. Klasifikasi item-item subtes Penalaran Mekanik ... 57
Tabel 18. Klasifikasi item-item yang perlu direvisi ... 57
Tabel 19. Hasil Fit Indeks ... 59
Tabel 20. Perbandingan Norma baru dan norma P2TKP ... 60
Tabel 21. Klasifikasi item-item subtes Berpikir Abstrak ... 62
Tabel 23. Hasil Fit Indeks ... 64
Tabel 24. Perbandingan Norma baru dan norma P2TKP ... 65
Tabel 25. Klasifikasi item-item subtes Tanggap Ruang ... 67
Tabel 26. Klasifikasi item-item yang perlu direvisi ... 68
Tabel 27. Hasil Fit Indeks ... 70
Tabel 28. Perbandingan Norma baru dan norma P2TKP ... 71
Tabel 29. Rincian item dalam analisis item ... 73
Tabel 30. Rincian Reliabilitas dan Validitas tiap subtes ... 74
DAFTAR LAMPIRAN
Lampiran 1. Verbatim Wawancara Prof. Dr. Supratiknya ... 79
Lampiran 2. Verbatim Wawancara Y. Heri Widodo, M.Psi. ... 81
Lampiran 3. Analogi Verbal III A1 (AV III A1) ... 84
Lampiran 4. Vokabuler III ... 94
Lampiran 5. Kemampuan Numerik (KN) ... 109
Lampiran 6. Penalaran Mekanik (PM) ... 116
Lampiran 7. Berpikir Abstrak (BA) ... 125
Lampiran 8. Hubungan Ruang (HR) ... 132
BAB I
PENDAHULUAN
A. LATAR BELAKANG
Sekolah Menengah Atas (SMA) adalah masa-masa penentuan
prestasi dan bakat dari masing-masing siswa. Ketika seorang siswa
memasuki jenjang pendidikan SMA, siswa dihadapkan pada
pilihan-pilihan untuk mengembangkan bakatnya. Tingkat pendidikan SMA,
umumnya memiliki 3 jurusan yaitu Ilmu Pengetahuan Sosial (IPS), Ilmu
pengetahuan Alam (IPA) dan Bahasa. Siswa memasuki tahap penjurusan
pada saat siswa memasuki kelas XI. Penjurusan ini ditujukan untuk
mengembangkan prestasi dan bakat dari siswa-siswanya.
Beberapa sekolah berinisiatif memfasilitasi siswa-siswanya
dengan penyelenggaraan tes penjurusan dalam rangka menunjang
penentuan prestasi dan bakat. Siswa-siswa akan mengerjakan serangkaian
tes bakat dalam proses penjurusan tersebut. Hasil tes akan menghasilkan
estimasi tentang bakat mereka yang dapat digunakan sebagai acuan dan
bahan pertimbangan bagi pihak sekolah dan siswa dalam memilih jurusan
yang sesuai. Hasil tes yang berisi kemampuan siswa dapat memberi
motivasi kepada mereka untuk berusaha meningkatkan kemampuannya.
Tes penjurusan ini merupakan sarana untuk membimbing siswa
sehingga dapat menemukan lingkungan yang cocok untuk
(1995) menyatakan salah satu fungsi tes adalah penempatan. Penempatan
ini dilakukan dengan cara mengevaluasi kemampuan seseorang dalam
bidang akademik dan memprediksikan lingkungan mana yang tepat untuk
perkembangan kemampuannya. Misalnya seorang siswa mendapatkan
nilai yang tinggi dalam sub tes Kemampuan Numerik dan Penalaran
Mekanik diprediksikan akan lebih mudah mengembangkan bakatnya pada
jurusan IPA. Sebaliknya siswa yang memiliki skor yang kurang dalam
Kemampuan Numerik dan Penalaran Mekanik akan mengalami kesulitan
dalam belajar di kelas IPA.
Sekolah bekerja sama dengan lembaga luar dalam melaksanakan
tes penjurusan, sebagai contoh lembaga yang bernaung di bawah
Universitas Sanata Dharma (USD) yaitu Pusat Pelayanan Tes dan
Konsultasi Psikologi (P2TKP). Lembaga ini bergerak dalam bidang
asesmen psikologis.
Tes yang umumnya dipakai oleh lembaga P2TKP dalam tes
penjurusan adalah tes bakat diferensial (Differential Aptitude Test). Tes ini
pertama dipublikasikan pada tahun 1947 dengan tujuan tes sebagai
bimbingan karir siswa kelas VIII sampai kelas XII. Tes DAT terdiri dari
delapan tes sebagai berikut : Penalaran Verbal, Penalaran Numerik,
Penalaran Abstrak, Kecepatan dan Kecermatan Persepsi, Penalaran
Mekanik, Hubungan Ruang (Spatial), Ejaan dan Penggunaan Bahasa
(Anastasi, 2003). Sedangkan Tes Penjurusan ini terdiri 6 subtes bakat
Numerik, Analogi Verbal, Vokabuler dan Penalaran Mekanik. Keenam
sub tes yang digunakan sebagai Tes Penjurusan tersebut ditetapkan
berdasarkan relevansinya dengan kebutuhan pendidikan di SMA,
maksudnya adalah kemampuan yang wajib dimiliki oleh siswa agar dapat
masuk dalam program penjurusan tertentu (Supratiknya, Komunikasi
Pribadi 22 Agustus 2011). Setiap sub tes dalam tes DAT dapat dipakai
secara terpisah dan mandiri sesuai dengan kebutuhan atau tujuan tesnya
(Etikawati, 2004).
Kualitas suatu alat tes harus dipahami terlebih dahulu sebelum
menggunakannya. Alat tes yang berkualitas akan menghasilkan gambaran
tentang kemampuan diri seseorang sebenarnya. Alat tes yang berkualitas
adalah alat tes yang memiliki item-item berkualitas seperti memiliki
tingkat kesulitan item dan korelasi item total sesuai standar dan memiliki
distraktor yang efektif. Alat tes tersebut harus pula memiliki reliabilitas
dan validitas yang termasuk dalam kategori baik. Evaluasi juga
dimaksudkan untuk mengecek kualitas psikometrik yang terdiri dari
reliabilitas alat tes, validitas alat tes dan kualitas item yang baik
(Friedenberg, 1995). Hal ini ditujukan agar hasil tes dapat dipercaya
untuk memberi informasi mengenai kemampuan siswa dalam bidang
akademis. Siswa akan dengan tepat memilih jurusan tertentu dan
memperdalam kemampuannya tersebut di kelas XI dan kelas XII. Siswa
yang mengikuti tes bakat akan mengerti karir mereka jika memasuki
dipercaya, maka tes ini akan menghasilkan prediksi kemampuan siswa
yang tidak akurat dan merugikan siswa yang menjadikan hasil tes
penjurusan sebagai patokan untuk menentukan karir.
Tes penjurusan dipergunakan oleh lembaga P2TKP sejak tahun
1997 untuk melaksanakan tes penjurusan di berbagai sekolah. Selama ini
tes penjurusan hanya pernah di evaluasi satu kali oleh Novita (2005).
Novita mencoba meneliti reliabilitas, validitas dan perbaikan norma pada
tes penjurusan dalam skripsinya. Pengecekan tersebut berlangsung lima
tahun yang lalu. Sedangkan perkembangan siswa dari masa ke masa dalam
segi tata bahasa, kemampuan intelektual, kepribadian dan minat sudah
pasti berbeda, sehingga evaluasi tes penjurusan sangat penting dilakukan
Saat ini P2TKP sedang mengadakan evaluasi tes psikologis. Setiap
tes wajib mendapatkan pengecekan kualitas setiap kurun waktu. Evaluasi
alat tes penjurusan meliputi validitas, reliabilitas, analisis item dan norma.
Program ini untuk menjaga kualitas tes dan kualitas P2TKP dihadapan
klien supaya klien yang menggunakan tes tertentu menjadi yakin akan
hasil tes yang klien ikuti (Widodo, Komunikasi pribadi 26 Oktober 2010).
Oleh karena itu, peneliti akan mengevaluasi salah satu tes yang ada di
P2TKP yaitu tes penjurusan. Evaluasi yang akan peneliti lakukan pada tes
penjurusan yang ada di P2TKP ini adalah evaluasi kualitas psikometri.
Kualitas psikometri sendiri meliputi pengecekan reliabilitas, validitas,
analisis item dan norma yang dipakai dalam tes penjurusan tersebut.
P2TKP maupun sekolah-sekolah dalam memberikan informasi bagi
penjurusan siswa-siswa.
B. RUMUSAN MASALAH
1. Bagaimana kualitas item dalam subtes penjurusan SMA?
2. Bagaimana reliabilitas dari tes penjurusan SMA ini sehingga dapat
memprediksi kemampuan subjek di kemudian hari?
3. Bagaimana validitas tes penjurusan SMA ini?
4. Bagaimana norma yang dipakai di P2TKP sehingga bisa
menggambarkan setiap subtesnya dengan nilai yang sama?
C. TUJUAN PENELITIAN
Penelitian ini bertujuan untuk:
1. Mengetahui kualitas item dari tes penjurusan SMA
2. Mengetahui estimasi reliabilitas untuk menentukan kelayakan dari
pemakaian tes penjurusan di P2TKP
3. Mengetahui validitas dari tes penjurusan SMA agar dapat menentukan
kelayakan pemakaian tes ini di P2TKP.
4. Memperbaharui norma agar semakin dapat menggambarkan
D. MANFAAT PENELITIAN
1. Manfaat Teoretik
Hasil yang ditemukan dalam penelitian ini diharapkan bisa menjadi
sumber informasi dan bahan pembanding bagi penelitian lain yang
berkaitan dengan alat tes dan kualitas psikometrik.
2. Manfaat Praktis
Hasil penelitian ini juga diharapkan bisa sebagai langkah awal dari
evaluasi alat-alat tes di P2TKP. Hasil tes ini juga bisa dimanfaatkan
sebagai sumber informasi berkaitan dengan kualitas psikometrik setiap
BAB II
LANDASAN TEORI
A. TES PSIKOLOGIS
1. Definisi
Anastasi (1997), Friedenberg (1995) serta Cronbach (1960)
menyebutkan bahwa tes psikologis sebagai alat ukur yang objektif,
sistematis dan baku untuk mendapatkan informasi atas perilaku tertentu
dari manusia. Informasi tersebut biasanya telah diubah dalam bentuk
angka atau skor. Tes psikologis yang dipakai berarti telah dibakukan dan
memiliki standardisasi tertentu. Standardisasi adalah keseragaman dalam
pelaksanaan dan penskoran tes. Jika standardisasi yang dilakukan efektif,
maka seseorang akan mendapatkan skor yang sama walaupun dalam
situasi yang berbeda. Selain prosedur yang terstandardisasi, alat tes juga
memiliki sampel perilaku, skor atau kategori, norma dan prediksi dari
perilaku.
Dari berbagai macam batasan mengenai tes dapatlah ditarik
berbagai kesimpulan pengertian (Azwar, 1998) yaitu:
a. Tes memiliki prosedur tertentu. Tes memiliki proses administrasi
yang baku, standar skoring sampai intepretasi kepada klien. Setiap
klien juga wajib mendapatkan perlakuan yang sama dalam proses
b. Suatu tes berisi sampel perilaku. Kelayakan suatu tes ditentukan
dari item-item tesnya. Item tes yang mewakili tujuan tes akan
mendukung kelayakan tes tersebut.
c. Suatu tes mengukur perilaku. Item-item di dalam tes yang dijawab
subjek akan mengungkapkan tentang hal yang diketahui subjek
atau yang telah dipelajari subjek.
2. Tujuan Tes Psikologis
Tujuan utama pengetesan pada saat ini umumnya adalah
mengevaluasi perilaku, kecakapan kognitif, ciri kepribadian, karakteristik
individu dan kelompok lainnya untuk membantu membuat penilaian,
prediksi dan keputusan tentang manusia. Gregory (1996) menuliskan lima
tujuan penggunaan tes yaitu sebagai berikut :
a. Klasifikasi
Klasifikasi berarti menempatkan seseorang individu pada kategori
tertentu berdasarkan kemampuannya. Di dalam klasifikasi terdapat
beberapa jenis lainnya berdasarkan tujuan yang berbeda untuk
menempatkan individu pada kategori tertentu yaitu sebagai berikut :
1)Placement
Placement artinya mengklasifikasikan subjek ke dalam kelompok yang
berbeda sesuai dengan kebutuhan atau kemampuan yang dimiliki.
mengidentifikasi siswa yang memiliki kemampuan di bidang kalkulus
atau aljabar.
2) Screening
Screening adalah proses tes yang cepat dan simple atau prosedur yang
dapat mengidentifikasi seseorang memerlukan karakteristik khusus
atau kebutuhan khusus. Contoh : Screening berguna untuk
mengidentifikasikan anak-anak yang memiliki kebutuhan khusus
dalam belajar atau anak-anak yang memiliki kemampuan luar biasa
dalam belajar.
3) Certification dan selection
Kedua proses di atas menghasilkan kualitas lulus atau gagal. Ketika
seseorang lulus dalam sertifikasi, hal tersebut memberikan
keistimewaan tersendiri. Misalnya seseorang yang mendapatkan Surat
Ijin Mengemudi (SIM), hal itu menandakan bahwa orang tersebut
memiliki kemampuan yang cukup dalam mengemudi. Seleksi menjadi
mirip dengan sertifikasi karena dalam hal ini keduanya memberikan
hal istimewa. Misalnya seleksi masuk perusahaan, jika seseorang lulus
maka berhak mendapatkan sebuah jabatan dalam perusahaan.
b. Diagnosis dan Treatment Planning
Diagnosis ditujukan untuk mengidentifikasi sifat alami dan sumber
perilaku abnormal. Contoh perilaku tersebut kemudian diidentifikasikan
ke dalam sistem diagnostik tertentu. Diagnosis sebagai awal untuk
peranan penting di dalam diagnosis dan treatment planning. Contoh : Tes
intelegensi sangat penting didalam penentuan retardasi mental dan tes
kepribadian sangat membantu untuk mengidentifikasi sifat alami dan
luasnya gangguan kepribadian.
c. Self Knowledge
Seseorang yang membaca hasil tes kemampuan diri dapat memperoleh
pengertian baru tentang kemampuan dirinya dan meningkatkan
kesadarannya terhadap kemampuannya.
d. Program evaluation
Dalam tes prestasi dapat digunakan untuk membuat keputusan dengan
evaluasi pada kemampuan siswa. Misalnya saja setelah siswa
melaksanakan tes prestasi, mereka akan mendapatkan hasil
kemampuannya atau evaluasi dari hasil belajar.
e. Research
Tes menjadi pemeran utama dalam penelitian psikologis. Melalui tes,
penelitian dapat selalu berjalan karena antara tes dan penelitian dalam
prakteknya adalah hal yang tidak dapat dipisahkan.
Berdasarkan penjelasan diatas, dapat disimpulkan bahwa tes
psikologis memiliki tujuan yang kompleks. Seorang psikolog dapat
3. Klasifikasi Tes Psikologis
Sementara itu, Gregory (2000) menjelaskan tes psikologis sebagai
berikut :
a. Group Tests adalah proses pengukuran dengan sekumpulan orang yang
akan diuji dalam waktu bersamaan.
b. Individual test adalah alat yang dari tujuan dan desainnya harus
disampaikan antara satu penguji dan satu subjek. Pengukuran ini
memiliki kelebihan yaitu penguji dapat sekaligus melakukan observasi
perilaku subjek ketika tes berlangsung.
Jenis-jenis tes kemudian dibagi kedalam sembilan kategori berbeda :
1) Intelligence Tests adalah tes yg didesain khusus untuk melihat
kemampuan dalam bekerja dan mengestimasi level kecerdasan
individu secara umum.
2) Aptitude Tests adalah tes yang pada dasarnya digunakan untuk menguji
kemampuan khusus dari subjek. Tes bakat biasanya digunakan dalam
memprediksikan tingkat keberhasilan dalam pekerjaan, kursus dan
dunia pendidikan. Tes ini memiliki dua macam tes yaitu single
aptitude test yang secara jelas hanya menilai satu kemampuan khusus
saja dan multiple aptitude test batteries dimana tes ini menampilkan
sejumlah tes yang mengukur kemampuan yang berbeda dan hasilnya
berupa profil kemampuan subjek dalam bidang yang berbeda.
3) Achievement Tests adalah tes yang mengukur keberhasilan seseorang
Tujuan tes ini adalah untuk mengetahui seberapa banyak bahan yang
telah diserap atau dikuasai subjek.
4) Creativity Tests adalah mengukur kemampuan subjek dalam
menemukan ide baru, insight atau kreasi artistik yang dapat diterima,
memiliki nilai sosial, estetika dan nilai ilmiah. Pengukuran kreatifitas
ditekankan pada keaslian dan originalitas dalam solusi untuk suatu
permasalahan yang rumit atau dalam menghasilkan karya yang artistik.
5) Personality Tests adalah tes yang mengukur ciri, kualitas atau perilaku
pada seseorang sebagai pribadi. Informasi dari tes ini membantu untuk
memprediksi perilaku di masa depan.
6) Interest Inventories mengukur pilihan subjek dalam beberapa aktivitas
atau topik dengan demikian diharapkan akan membantu dalam
menentukan pilihan pekerjaan.
7) Behavioral procedures dapat digunakan dalam mengumpulkan
anteseden dan konsekuensi dari perilaku termasuk metode checklist,
rating scales, interview dan observasi yang terstruktur.
8) Neuropsychological Test digunakan untuk mengumpulkan informasi
dari subjek yang mengalami disfungsi otak atau subjek yang masih
dalam dugaan. Neuropsikolog menggunakan tes dan prosedur ini untuk
melihat konsekuensi dari kerusakan otak.
Dapat disimpulkan bahwa tes psikologis dapat berupa group tests
atau individual tests. Tes Bakat yang dipakai sebagai Tes Penjurusan SMA
4. DAT untuk Penjurusan di P2TKP
DAT adalah tes bakat yang digunakan sebagai tes penjurusan di
SMA oleh P2TKP. Tes bakat ini mengukur performansi maksimal dari
subjeknya. Fungsi dari tes bakat ini adalah penempatan (placement),
normatif, diagnostik dan sumatif (Azwar, 1998). Fungsi yang paling
nampak dalam tes bakat sebagai tes penjurusan adalah penempatan
(placement). Fungsi placement adalah penggunaan hasil tes prestasi belajar
untuk klasifikasi individu kedalam bidang atau jurusan yang sesuai dengan
kemampuan yang telah diperlihatkannya pada hasil belajar yang telah lalu.
Tes DAT untuk penjurusan yang dipakai P2TKP terdiri dari 6
subtes yang mengukur kemampuan yang berbeda (Bennet, Seashore dan
Wesman, 1966). Subtes tersebut adalah sebagai berikut :
a. Subtes Hubungan Ruang (HR)
Tes ini mengukur kemampuan berpikir yaitu pemahaman terhadap
susunan (struktur) benda-benda tiga dimensi dan bagian-bagiannya.
Kemampuan ini amat diperlukan untuk mendalami bidang teknik pada
umumnya (seperti mesin, pertukangan, dsb).
b. Subtes Berpikir Abstrak (BA)
Tes ini mengukur kemampuan berpikir tidak dengan kata-kata.
Kemampuan ini mencerminkan kemahiran dalam menangkap hubungan
dan membuat kesimpulan tentang persoalan-persoalan yang dirumuskan
tidak dengan kata-kata, melainkan dengan aneka pola. Kemampuan ini
c. Subtes Kemampuan Numerik (KN)
Tes ini mengukur kemampuan berpikir khususnya dalam memahami
konsep-konsep bilangan dan kefasihan dalam memecahkan aneka
persoalan yang berkaitan dengan konsep bilangan atau angka.
Kemampuan ini sangat diperlukan dalam bidang Ilmu Pengetahuan Alam
dan Ilmu Pengetahuan Sosial Kuantitatif.
d. Subtes Analogi Verbal (AV)
Tes ini mengukur kemampuan berpikir verbal, khususnya dalam
memahami relasi-relasi antara pengertian-pengertian yang dinyatakan
secara verbal. Kemampuan ini amat diperlukan dalam setiap bidang
ilmu dan dalam komunikasi pengajaran.
e. Subtes Vokabuler (VOK)
Tes ini mengukur pengetahuan bahasa, khususnya perbendaharaan kata
Bahasa Indonesia. Kemampuan ini amat diperlukan dalam bidang
bahasa.
f. Subtes Penalaran Mekanik (PM)
Tes ini mengukur kemampuan berpikir, khususnya memahami
prinsip-prinsip mekanika dan fisika dalam aneka situasi sehari-hari. Kemampuan
ini mencerminkan kefasihan seseorang dalam mempelajari cara kerja
aneka peralatan dan piranti. Tes ini sesuai untuk memprediksi
keberhasilan di bidang yang menuntut pemahaman tentang
Keenam subtes tersebut dikerjakan oleh subjek dalam satu waktu. Hasil dari
subtes itu akan dikemukakan dalam penilaian yang mengacu kepada norma.
B. KUALITAS PSIKOMETRIK
1. Validitas Alat Tes
` Azwar (2008) dan Santoso (2010) mengungkapkan informasi yang
saling melengkapi tentang validitas. Pengukuran yang valid adalah bagian
terpenting dari usaha untuk mendapatkan asesmen yang handal. Validitas
adalah suatu ukuran yang mengetahui ketepatan dan kecermatan suatu alat
ukur dalam melakukan fungsi ukurnya. Suatu alat ukur yang valid mampu
mengungkapkan data yang akurat. Alat tersebut juga memberikan
gambaran yang cermat mengenai data tersebut sehingga dapat memenuhi
kebutuhan informasi yang dikehendaki. Suatu alat ukur yang valid juga
akan menghasilkan skor kemampuan yang tidak jauh berbeda dari
kemampuan subjek sesungguhnya.
Gregory (1996) mengungkapkan cara-cara yang berbeda untuk
mengakumulasi bukti validitas dikelompokkan menjadi tiga kategori
sebagai berikut :
a. Validitas isi
Gregory (1996) menyatakan validitas isi itu ditentukan oleh
sejauh mana item-item dalam tes mewakili sederet perilaku yang
diteliti. Dalam Friedenberg (1995) dan Azwar (2008) dikemukakan
memperbandingkan item tes dengan rincian tujuan pengetesan atau hal
yang akan diukur. Hal itu dilakukan lewat analisis rasional atau lewat
professional judgement.
Validitas isi terbagi pula menjadi dua tipe yaitu face validity dan
logical validity.
1) Face Validity (validitas tampang)
Validitas ini tercapai apabila pemeriksaan terhadap
penampilan item tes memberikan kesan mampu mengungkap
apa yang hendak diukur. Validitas tampang adalah tentang
penerimaan sosial.
2) Logical Validity (validitas logik)
Validitas ini dicapai saat setiap item tes dirancang
sesuai tujuan ukurnya. Suatu objek yang akan diukur harus pula
mendapatkan batasan yang jelas supaya menghasilkan
item-item yang relevan.
b. Validitas Konstruk
Validitas konstruk muncul untuk melengkapi kekurangan dua
tipe validitas yang lainnya yaitu validitas isi dan validitas berdasarkan
kriteria. (Santoso, 2010). Validitas konstruk adalah tipe validitas yang
menunjukkan sejauh mana tes mengungkap suatu trait atau konstruk
teoritik yang hendak diukurnya (Allen & Yen, 1979). Validitas
konstruk sangat berbeda dengan validitas yang lain karena
pengujian relasi (Kerlinger, 2006). Dua pendekatan yang banyak
dilakukan dalam pengujian validitas konstruk antara lain adalah
pendekatan multitrait-multimethod dan pendekatan factor analysis.
Dalam penelitian ini, akan menggunakan pendekatan factor
analysis. Kerlinger (2006) menyatakan bahwa factor analysis
merupakan cara untuk meringkas, mengurangi sejumlah besar data
menjadi sejumlah ukuran yang tidak terlalu banyak. Caranya adalah
dengan mengorganisir data-data tersebut yang disebut faktor.
Faktor-faktor diorganisir dengan melihat apakah mengukur hal yang sama.
Menurut Hair, Anderson, Tattham dan Black (1995) factor analysis
merupakan sekumpulan prosedur matematik yang kompleks guna
menganalisis saling hubungan diantara variabel-variabel dan
menjelaskan saling hubungan tersebut dalam bentuk variabel yang
terbatas yang disebut faktor.
Menurut Hair, Anderson, Tattham dan Black (1995) analisis
faktor memiliki 2 bentuk, yaitu:
1) Confirmatory
Hair, Anderson, Tattham, dan Black (1998)
mengungkapkan bahwa analisis faktor adalah sebuah metode dari
statistika multivariat yang tujuan utamanya adalah menemukan
struktur yang mendasari dalam sebuah matriks data yang didapat
seperangkat dimensi yang mendasari veriabel-variabel tersebut,
yang disebut sebagai faktor.
2) Exploratory
Analisis ini bertujuan mencari hubungan antara variabel.
Dalam proses, variabel-variabel akan di seleksi dan mengurangi
jumlah data yang dianalisis.
c. Validitas berdasarkan kriteria
Menurut Sireci, 2008 dan Kane, 2006 (Santoso,2010)
validitas kriteria adalah korelasi antara skor tes dengan kriteria yang
lain. Untuk melihat tingginya validitas berdasarkan kriteria dilakukan
komputasi korelasi antara skor tes dan skor kriteria. AERA, APA, &
NCME (Gregory, 1996) mengungkapkan poin penting dalam penentuan
kriteria bahwa semua kriteria yang mengukur harus dijelaskan secara
akurat dan alasan untuk memilih kriteria yang dianggap relevan tersebut
harus secara eksplisit. Prosedur validitas berdasarkan kriteria
menghasilkan dua macam pendekatan (Gregory, 1996) yaitu sebagai
berikut :
1) Validitas prediktif yaitu ketika pengambilan skor kriteria tidak
bersamaan dengan pengambilan skor tes, biasanya satu bulan atau
satu tahun setelah skor tes didapatkan.
2) Validitas konkuren yaitu apabila skor tes dan skor kriteria dapat
mendiagnosa pasiennya akan menjadi sesuai dengan pengukuran
kriteria untuk menghasilkan validitas dari tes.
Santoso (2010), validitas saat ini merupakan penilaian
bersifat evaluatif yang terintegratif. Penilaian tersebut bukan lagi
kepada alat tesnya yang dikenal dengan kata valid atau tidak valid,
tetapi lebih kepada tindakan yang diambil berdasarkan hasil tes yang
dimiliki subjek. Validasi tidak cukup dengan hanya menampilkan satu
bukti dari tipe validitas. Bukti-bukti validitas tes tersebut yang
nantinya berguna dalam mendukung tindakan yang diambil
berdasarkan hasil tes.
2. Reliabilitas Alat Tes
Reliabilitas merupakan penerjemahan dari kata reliability
yang mempunyai asal kata rely dan ability. Reliabilitas alat ukur
dinyatakan dalam koefisien korelasi (r).
Ide pokok yang terkandung dalam konsep reliabilitas
adalah sejauhmana hasil suatu pengukuran dapat dipercaya. Hasil
pengukuran dapat dipercaya hanya apabila dalam beberapa kali
pelaksanaan pengukuran terhadap kelompok subjek yang sama
diperoleh hasil yang relatif sama selama aspek yang diukur dalam diri
subjek memang belum berubah (Azwar,2008). Menurut Croncbach
(1960), reliabilitas sama dengan konsistensi dalam suatu pengukuran.
reliabilitas itu mengindikasikan kemampuan suatu alat tes untuk
menghasilkan skor yang konsisten.
Estimasi terhadap tingginya reliabilitas dapat dilakukan
melalui berbagai metode pendekatan (Friedenberg, 1995) yaitu :
a. Pendekatan Tes Ulang
Pendekatan tes ulang dilakukan dengan menyajikan tes dua kali
pada suatu kelompok subjek dengan tenggang waktu diantara
kedua penyajian tersebut. Friedenberg (1995) menyebutkan tes
re-tes juga dapat digunakan untuk mengevaluasi eror yang
berhubungan dengan administrasi tes dalam dua waktu yang
berbeda. Suryabrata (1999) mnyebutkan bahwa tes ulang memiliki
kelemahan yaitu adanya pembelajaran oleh subjek, pengalaman
dan perubahan motivasi. Hal ini memungkinkan berubahnya hasil
tes yang didapat oleh subjek.
b. Pendekatan bentuk Paralel
Dalam bentuk ini, tes yang akan diestimasi reliabilitasnya harus
ada paralelnya, yaitu tes lain yang sama tujuan ukurnya dan setara
isi itemnya baik secara kualitas ataupun kuantitas. Friedenberg
(1995) menyebutkan bahwa alternate form diberikan dengan cara
satu kelompok dites dengan 2 versi soal yang berbeda dan tingkat
kesulitan yang sama juga pada waktu yang sama. Ketika satu
kelompok diberikan dua form ini dan menunjukkan hasil tes yang
Suryabrata (1999) menambahkan bahwa dalam penelitian
pendekatan ini tidak banyak digunakan karena akan sangat sulit
menentukan paralel yang harus sepadan.
c. Pendekatan Konsistensi Internal
Pendekatan ini dilakukan dengan menggunakan satu bentuk tes
yang dikenakan hanya sekali saja pada kelompok subjek (
single-trial administration). Pendekatan reliabilitas konsistensi internal
bertujuan melihat konsistensi antar item atau antar bagian dalam
tes itu sendiri. Pengujian reliabilitas dalam penelitian ini
menggunakan metode satu rangkaian yang biasa disebut internal
consistency atau pendekatan homogenitas. Suatu tes yang secara
internal consistency baik berarti semua item mengukur bidang
pengetahuan atau sifat kepribadian yang sama (Supratiknya, 1998).
Ada tiga cara yang setidaknya perlu diketahui dalam mengestimasi
reliabilitas dengan teknik konsistensi internal (Suryabrata, 1999)
yaitu :
1) Formula Alpha
Penemunya adalah Cronbach pada tahun 1951. Teknik ini
dilakukan dengan membelah tes kedalam beberapa bagian.
Setiap belahan harus berisi item yang jumlahnya seimbang
sehingga dalam perhitungannya dapat menghasilkan
Rumus formula Alpha sebagai berikut :
α = [ n ] [ 1- ∑Vi ]
[n-1 ] [ Vt]
Keterangan :
α = Koefisien reliabilitas
n = banyaknya bagian (potongan tes)
Vi = Varians tes bagian I yang panjangnya tidak ditentukan Vt = Varians skor total (perolehan)
2) Teknik Belah Dua
Teknik ini dilakukan dengan cara memberikan satu
perangkat tes kepada sekelompok subjek sebanyak satu
kali. Lalu skor tes subjek dibagi menjadi dua kelompok
yang setara. Sekelompok skor bernomor genap dan
sekelompok skor bernomor ganjil. Estimasi reliabilitasnya
dicari dengan cara menghitung korelasi skor pada belahan
pertama dengan skor pada belahan kedua.
3) Teknik Analisis Varians
Terdapat banyak cara untuk mengestimasi relibilitas
melalui analisis varians. Salah satunya adalah yang
dikemukakan oleh Hoyt (1941). Dalam karyanya, varians
total dianalisis menjadi proporsi yang berasal dari peserta
tes, proporsi yang berasal dari soal-soal tes dan sisanya.
Setelah diketahui cara-cara untuk mengestimasi reliabilitas,
kita juga perlu mengetahui standar koefisien reliabilitas yang dapat
koefisien reliabilitas yang baik adalah 0.90. Helmstadter (Friedenberg,
1995) mengemukakan koefisien reliabilitas berdasarkan tujuan tesnya
yaitu tes bakat, reliabilitasnya rata-rata harus 0.88. Dalam Suryabrata
(1999) sebuah tes yang hasilnya akan dijadikan bahan dasar membuat
suatu keputusan, koefisien reliabilitasnya hendaknya mendekati 0.90.
3. Analisis Item
Isi tes tidak lain dari sekumpulan item berupa pertanyaan
tentang suatu hal yang hendak diukur. Sehingga kualitas tes tersebut
ditentukan oleh kualitas itemnya. Oleh karena itu, untuk mengetahui
suatu tes berisi item yang baik atau kurang baik, kita perlu melakukan
analisis item. Friedenberg (1995) menyebutkan bahwa analisi item
sangat penting dan revisi terhadap item yang kurang baik dapat
meningkatkan validitas dan reliabilitas suatu tes. Dalam pengujian
item tes, terdapat tiga perhitungan yang paling sering digunakan yaitu:
a. Indeks kesukaran item (p)
Indeks kesukaran item merupakan rasio antara penjawab
item dengan benar dan banyaknya penjawab item. Indeks
kesukaran item disimbolkan dengan huruf p. Nilai p yang semakin
besar menandakan item itu mudah dijawab dan nilai p yang
semakin kecil menandakan bahwa item tersebut sukar ditemukan
Nilai p bergerak dari 0.0 sampai 1.0. Jika nilai p mendekati
0.0, maka berarti tidak seorangpun dapat menjawab item tersebut
dengan benar. Jika nilai p mendekati 1.0 maka setiap subjek dapat
menjawab item tersebut dengan benar. Pada umumnya nilai p
yang berada disekitar 0,30 sampai 0.70 yang dianggap baik
(Gregory,1996). Level optimal dari nilai p tersebut sesuai
digunakan dalam tes penjurusan ini karena akan mengukur
performansi maksimal setiap subjek.
b. Analisis diskriminasi item (d)
Daya diskriminasi item adalah kemampuan item dalam
membedakan kelompok yang memiliki kemampuan tinggi dan
kelompok yang memiliki kemampuan rendah. Indeks diskriminasi
item disimbolkan dengan huruf d (Azwar, 1998).
Untuk menganalisis diskriminasi item dalam Friedenberg
(1995) dikatakan dapat dengan menghitung Indeks Diskriminasi
item (d) dan menghitung korelasi item total (rix). Gregory (1996)
menyatakan daya diskriminasi tercapai dengan baik jika kelompok
yang memiliki kemampuan tinggi dapat menjawab benar item
tersebut sedangkan kelompok rendah tidak satu pun menjawab
dengan benar. Cara menghitung (d) sendiri yaitu :
d = (U-L)/N
Ket :
d : Indeks diskriminasi item.
Ebel (dalam Azwar, 1997) menyarankan kriteria evaluasi
indeks diskriminasi dalam empat kategori:
Tabel 1. Kriteria Evaluasi Indeks Diskriminasi
Indeks Diskriminasi Evaluasi
0.40 atau lebih Bagus sekali
0.30 --- 0.39 Lumayan bagus tetapi perlu peningkatan
0.20 --- 0.29 Belum memuaskan, perlu diperbaiki Kurang dari 0.20 Jelek dan harus dibuang
Selain itu, memilih item yang baik juga dapat
berdasarkan korelasi item total (rix). Korelasi item total
memperlihatkan konsistensi antara fungsi item dengan fungsi
tes sebagai alat untuk mengungkapkan perbedaan individual.
Azwar (2009) menyatakan item yang baik koefisien korelasi
item totalnya semakin mendekati angka 1.0. Namun biasanya
digunakan batasan rix ≥ 0.30. Ketika sebuah item memiliki rix
yang mencapai standar tersebut, item tersebut dianggap
memiliki daya pembeda yang memuaskan.
c. Efektifitas Distraktor
Friedenberg (1995) menyatakan bahwa tes prestasi dan tes
bakat umumnya menggunakan format soal pilihan ganda.
Alternatif pilihan salah dalam format pilihan ganda disebut
distraktor. Pilihan ganda yang dirancang dengan tepat memiliki
dua karakteristik. Pertama, subjek yang memiliki pengetahuan
yang kurang memiliki pengetahuan yang diujikan memilih
alternatif jawaban yang tersedia. Azwar (1998) mengatakan
analisis efektifitas distraktor digunakan untuk melihat apakah
alternatif jawaban selain kunci sudah berfungsi sebagaimana
mestinya artinya distraktor-distraktor dipilih lebih banyak (atau
semua) siswa kelompok rendah sedangkan kelompok tinggi hanya
sedikit (atau tidak ada) yang memilihnya. Distraktor-distraktor
yang efektif adalah distraktor yang secara rata dipilih oleh subjek
yang berasal dari kelompok rendah.
C. NORMA
1. Definisi
Cronbach (1960) menyebutkan bahwa norma berguna untuk
membandingkan kemampuan seseorang dalam kelompoknya. Norma
atau kriteria yang akan digunakan untuk melakukan klasifikasi tersebut
harus relevan dengan tujuan tesnya dan distribusi kelas (Azwar, 1998).
Hasil tes seseorang biasanya berupa skor mentah. Skor mentah yang
telah dikonversikan dalam norma atau kriteria dapat digunakan untuk
melihat posisi seseorang dalam kelompok tertentu.
Penilaian terhadap hasil belajar data digolongkan menjadi dua
pendekatan (Azwar,1998) yaitu :
a. Penilaian yang mengacu pada kriteria (criterion-referenced
Tes yang disusun berdasarkan suatu kriteria tertentu memiliki
tujuannya untuk mengukur sejauh mana pemahaman terhadap
materi yang dimiliki subjek. Penilaian ini akan menginformasikan
kemampuan subjek secara independen.
b. Penilaian yang mengacu kepada norma (norm-referenced
evaluation)
Tipe penilaian yang mengacu kepada norma digunakan tes prestasi
dan tes bakat untuk memberikan informasi mengenai perbedaan
kemampuan subjek. Kemampuan-kemampuan individu
diklasifikasikan kedalam kelompoknya masing-masing artinya
kemampuan seorang subjek dapat diperbandingkan dengan subjek
yang lain.
Penelitian ini menggunakan penilaian yang mengacu kepada
norma karena hasil tes subjek akan diperbandingkan dalam
kelompoknya. Selanjutnya akan dibahas lebih lanjut mengenai norm
referenced evaluation.
2. Penilaian yang mengacu kepada norma
Jenis-jenis tranformasi skor antara lain :
b. Presentil
Gregory (2000) mengatakan presentil itu mengungkapkan
persentase kemampuan seseorang pada sampel yang baku yang
transformasi skor mentah yang paling umum digunakan. Norma
ini mudah dipahami dan dapat digunakan untuk tes dengan tujuan
yang bermacam-macam.
c. Skor standar
Tes-tes umumnya memakai skor-skor standar yang dapat
diperoleh dengan transformasi linear atau non linear atas
skor-skor mentah yang orisinil. Proses perhitungan skor-skor standar
dituliskan dalam Gregory (2000) yaitu dengan mengurangi mean
dari norma kelompok dengan skor mentah dan dibagi dengan
standar deviasi dari norma kelompok. Ketika skor mentah
beberapa tes diubah menjadi skor standar maka kita dapat melihat
hasil tes-tes tersebut dengan skala yang umum. Dengan catatan,
jika distribusi skor tes - tes tersebut memiliki bentuk yang sama
maka perbandingan skor mentah yang telah diubah menjadi skor
standar dapat dilakukan. Jika distribusi tes - tes tersebut berbeda,
maka perbandingan dengan skor standar tidak dapat dilakukan
karena dapat menyesatkan pengguna tes.
c. Sten Scale
Penilaian dengan Sten scale pertama-tama diciptakan oleh
Canfield(1951) yang terbagi dalam sepuluh klasifikasi dengan
lima klasifikasi berada di bawah dan lima klasifikasi berada di
d. Stanine (standar nine)
Dalam stanine scale (Gregory, 2000), semua skor mentah
dikonversikan ke dalam satu digit sistem dari skor yang
terentang antara 1 sampai dengan 9. Mean dari skala ini selalu 5
dan standar deviasinya sekitar 2. Proses transformasi dari stanine
sangat simple yaitu pertama, skor mentah di ranking dari yang
terendah sampai yang tertinggi. Nilai terendah, sebanyak 4% dari
skor dikonversikan menjadi skala stanine 1, proses selanjutnya
dapat dilihat dalam tabel :
Tabel 2. Persentase pengubahan skor stanine
Percentage 4% 7% 12% 17% 20% 17% 12% 7% 4%
Stanine 1 2 3 4 5 6 7 8 9
d. Norma P2TKP
Pada penelitian ini, peneliti menggunakan pedoman norma yang
telah ada di P2TKP. P2TKP menggunakan angka 1-10 sebagai
pedoman dan terbagi menjadi 16 klasifikasi.
Tabel 3. Pedoman Penentuan Persentil dan Lambang angka
Lambang Angka Persentil
16 99.8 15 99 14 98 13 95 12 90 11 80 10 73 9 64 8 54 7 43 6 34 5 25 4 16 3 10 2 3 1 1
D. KERANGKA PENELITIAN
Dalam penelitian ini, peneliti ingin melihat kualitas psikometrik
dari Tes Penjurusan yang terdapat di P2TKP. Tes Penjurusan terdiri dari
tes Hubungan Ruang, tes Berpikir Abstrak, tes Kemampuan Numerik, tes
Analogi Verbal, tes Vokabuler, tes Penalaran Mekanik. Peneliti
melakukannya dengan teknik analisis reliabilitas, analisis validitas,
analisis item dan norma yang dipakai.
Analisis item adalah metode yang dipakai untuk melihat kualitas
item yang akan diteliti. Analisis item dilakukan dengan tiga cara yaitu
dengan melihat korelasi item total, taraf kesukaran item dan efektifitas
item-
item yang membutuhkan revisi, item yang membutuhkan revisi berat dan
item yang memenuhi standar.
Analisis reliabilitas adalah metode yang digunakan untuk melihat
tingkat konsistensi suatu tes. Untuk penelitian ini menggunakan bantuan
program SPSS statistics 17.0 for windows. Setelah data yang akan
dianalisis lengkap, program dapat segera dijalankan dan akan langsung
terlihat hasilnya.
Analisis validitas adalah metode yang digunakan untuk meringkas
variabel-variabel dengan cara mencari korelasi dalam variabel tersebut
dalam bentuk seperangkat dimensi yang mendasari variabel-variabel
tersebut, yang disebut sebagai faktor (Hair, Anderson, Tattham, dan Black
,1998).
Norma dipakai untuk membandingkan kemampuan seseorang
dengan kemampuan kelompoknya. Analisis norma ini dilakukan agar
kemampuan seseorang benar-benar telah tepat posisinya dalam
kelompoknya.
E. PERTANYAAN PENELITIAN
1. Bagaimana kualitas item jika dilihat dari indeks kesukaran item dan
indeks daya diskriminasi item ?
2. Bagaimana reliabilitas Tes Bakat dan seberapa besar hasil pengukuran
reliabilitas tes ini sehingga dapat dipercaya berkaitan dengan
3. Bagaimana validitas Tes Bakat dan seberapa besar hasil
pengukurannya sehingga alat tes ini benar-benar mengukur variable
yang ditentukan ?
4. Bagaimana standar norma yang digunakan oleh P2TKP sehingga bisa
BAB III
METODE PENELITIAN
A. JENIS PENELITIAN
Jenis penelitian ini bersifat kuantitatif deskriptif. Peneliti akan
melakukan evaluasi psikometrik yang meliputi validitas dan reliabilitas
Tes Penjurusan SMA.
B. IDENTIFIKASI VARIABEL
Variabel dalam penelitian ini adalah :
1. Performance subjek pada item
2. Performance subjek pada tes :
a. Performance subjek pada tes Hubungan Ruang
b. Performance subjek pada tes berpikir abstrak
c. Performance subjek pada tes kemampuan numerik
d. Performance subjek pada tes analogi verbal
e. Performance subjek pada tes vokabuler
f. Performance subjek pada tes penalaran mekanik
C. DEFINISI OPERASIONAL
1. Performance subjek pada item adalah performance yang didapat dari
setiap item. Performance subjek pada item setiap subtes bergerak dari
bernilai 1, jika dijawab salah maka bernilai 0. Tes penjurusan ini
memiliki enam subtes yaitu Hubungan Ruang (200 item), Berpikir
Abstrak (50 item), Kemampuan Numerik (40 item), Analogi Verbal III
A1 (50 item), Vokabuler (50 item), dan Penalaran Mekanik (68 item).
2. Performance subjek pada tes :
a. Subtes Hubungan Ruang
Performance subjek pada tes ini didapat dari menjumlahkan item
yang dijawab salah oleh subjek dan mengurangkannya dari
jumlah opsi yang benar dari setiap item dari subtes tersebut.
Kriteria item dijawab salah apabila subjek melingkari opsi yang
salah dan atau subjek tidak melingkari jawaban benar. Kriteria
dijawab benar apabila subjek melingkari jawaban benar menurut
kunci jawaban.
b. Subtes Berpikir Abstrak
Performance subjek pada tes ini didapat dari menjumlahkan item
yang dijawab benar oleh subjek.
c. Subtes Kemampuan Numerik
Performance subjek pada tes ini didapat dari menjumlahkan item
yang dijawab benar oleh subjek.
d. Subtes Analogi Verbal
Performance subjek pada tes ini didapat dari menjumlahkan item
e. Subtes Vokabuler
Performance subjek pada tes ini didapat dari menjumlahkan item
yang dijawab benar oleh subjek.
f. Subtes Penalaran Mekanik
Performance subjek pada tes ini didapat dari menjumlahkan item
yang dijawab benar oleh subjek.
D. POPULASI dan SAMPEL
Performance subjek pada tes yang akan digunakan dalam
penelitian ini berasal dari siswa-siswi SMA. Siswa-siswi tersebut
tersebar di Yogyakarta dan Bandar lampung yang pernah memakai jasa
P2TKP dalam Tes Penjurusan. Jumlah subjek sebanyak 204 siswa yang
terdiri dari 45 siswa laki-laki dan 159 siswa perempuan. Sekolah tersebut
adalah SMA Stella Duce I Yogyakarta, SMA Stella Duce II Yogyakarta,
SMA Fransiskus Xaverius Pringsewu, dan SMA Fransiskus Xaverius
Bandar Lampung.
E. METODE PENGUMPULAN DATA
Pengambilan data dalam penelitian ini menggunakan metode
dokumentasi. Peneliti mengambil data skor individu-individu pada
F. ANALISIS DATA
Data yang telah diperoleh tersebut akan diproses sebagai berikut :
1. Kualitas item
Analisis kualitas item ini akan dilakukan dengan korelasi item
total, taraf kesukaran item dan efektifitas distraktor. Tujuan
akhir dari analisis ini adalah melihat item yang baik dan kurang
baik dalam setiap subtes. Setiap subtes akan memiliki item
yang harus direvisi, dapat dipertahankan atau item dengan
revisi berat. Item yang dinyatakan baik dari segi korelasi item
totalnya yang memiliki nilai ≥ 0.30. Item yang dinyatakan baik
dari segi taraf kesukaran item yang memiliki nilai ≥ 0.30
sampai dengan 0.70. Kriteria distraktor yang efektif adalah
distraktor –distraktor yang dipilih secara merata oleh kelompok
bawah dan lebih banyak kelompok bawah yang memilih
distraktor –distraktor tersebut daripada kelompok atas.
2. Reliabilitas alat tes
Reliabilitas alat tes ini akan dicari menggunakan teknik
Cronbach Alpha. Analisis ini menggunakan bantuan program
SPSS statistic 17.0 for windows. Tes bakat yang baik menurut
Helmstadter (Friedenberg, 1995) memiliki reliabilitas tes
3. Validitas alat tes
Validitas alat tes ini akan diukur dengan menggunakan metode
analisis faktor. Jika tes ini terbukti valid adalah dengan
terdapatnya 6 faktor dari 6 subtes yang diteliti. Analisis ini
dibantu dengan program Lisrel 8.80 for windows. Peneliti
mengambil tiga kriteria nilai yang harus dapat dipenuhi agar
alat tes bisa disebut valid. Tiga criteria dan nilai yang harus
dipenuhi sebagai berikut : Standardized RMR (SRMR) ≤ 0.08,
Comparative Fit Index (CFI) ≥ 0.95 dan Root Mean Square
Error of Approximation (RMSEA) < 0.06.
4. Norma
Analisis norma Tes Penjurusan yang dipakai di P2TKP akan
direplikasi dengan acuan norma yang digunakan P2TKP yang
memiliki 16 klasifikasi. Peneliti akan membandingkan antara
norma lama dan norma yang dibuat peneliti. Tujuannya untuk
melihat apakah norma lama P2TKP masih layak dipakai dan
masih dapat mengklasifikasikan kemampuan subjek pada
BAB IV
HASIL PENELITIAN DAN PEMBAHASAN
A. ORIENTASI KANCAH
Data yang digunakan dalam penelitian ini merupakan hasil Tes
Penjurusan SMA yang berasal dari P2TKP USD. Tes Penjurusan sendiri
terdiri dari enam subtes. Subtes-subtes tersebut sebagai berikut :
Tabel 4. Daftar tes yang akan dievaluasi
No Nama Tes Jumlah Item Skor
1 Analogi Verbal III A1 (AV III A1) 50 50 2 Vokabuler III B1 (Vok III B1) 50 50 3 Kemampuan Numerik (KN) 40 40 4 Penalaran Mekanik (PM) 68 68 5 Berpikir Abstrak (BA) 50 50 6 Hubungan Ruang (HR) 200 100
Data tersebut diambil pada tahun 2010 dan terdiri dari empat
sekolah yang berbeda. Setiap sekolah menyumbang hasil tes siswa yang
dipilih secara acak agar data bervariasi. Subjek dalam penelitian ini
berjumlah 204 siswa yang terdiri dari 159 siswa perempuan dan 45 siswa
laki-laki. Total keseluruhan data yang dimiliki adalah 1224 data.
B. PERSIAPAN PENELITIAN
Pada awalnya, Peneliti memohon izin kepada pihak P2TKP USD
selaku lembaga yang akan memfasilitasi peneliti dalam penelitian ini,
Setelah mendapatkan izin, peneliti mulai mencari data-data yang
diperlukan secara lengkap di gudang penyimpanan data P2TKP. Peneliti
menemukan data dari berbagai sekolah yang memakai jasa lembaga
P2TKP dalam Tes Penjurusan. Kriteria data lengkap ketika seseorang
siswa mengikuti mengikuti keenam subtes secara lengkap.
C. PELAKSANAAN PENELITIAN
Pelaksaan penelitian dimulai pada bulan Oktober 2011. Pada saat
itu, Peneliti telah mendapatkan izin dari pimpinan P2TKP. Peneliti mulai
berburu data yang diperlukan dalam penelitian. Data yang diperlukan
adalah skor item dan skor total tes dari tiap subjek. Setelah mendapatkan
data, peneliti mulai memasukkan data tersebut menggunakan program
Microsoft Excel.
Proses memasukkan data tersebut memakan waktu satu bulan yaitu
mulai pertengahan bulan November sampai pertengahan bulan Desember
2010.
Pada saat analisis norma dari subtes HR, peneliti mengalami
kesulitan. Kesulitan ini bersumber dari skoring subtes HR yang bergerak
dari minus (-)100 sampai dengan plus (+) 100 dan data norma yang ada di
P2TKP nilai minus (-) 100 sampai dengan plus (+) 15 diklasifikasikan
dalam kelompok norma 1. Nilai minus didapat oleh subjek ketika subjek
mengisi jawaban tidak pada kuncinya. Setelah mencari beberapa bukti,
nilai 100 untuk menghilangkan efek hukuman. Hal ini ditujukan agar tidak
ada lagi nilai minus pada subjek dan nilai minus sangat merugikan subjek.
Hal ini dikarenakan subjek yang memiliki nilai minus (-) 2 belum tentu
tidak dapat menjawab semua soal HR dengan benar.
D. HASIL PENELITIAN dan PEMBAHASAN
1. Analogi Verbal III A1 (AV IIIA1)
a. Analisis Item
Analisis item ini ditujukan untuk melihat kualitas item.
Analisis item dilakukan dengan menghitung taraf kesukaran item
(p), daya diskriminasi item (d) dan efektifitas distraktor dari setiap
item dari setiap subtes yang diteliti.
Dalam penelitian ini telah dilakukan pemilahan item yang
dilihat dari ketiga hal dalam analisis item tersebut. Pemilahan item
dibagi menjadi tiga kategori yang berbeda yaitu :
1) Item yang dapat dipertahankan, penjelasannya sebagai berikut :
a) Taraf kesukaran item berkisar antara 0.30 – 0.70 (Gregory,
1996).
b) Korelasi item total diatas 0.30 (Azwar, 1995).
c) Memiliki efektifitas distraktor yang efektif (Friedenberg,
1995).
Distraktor adalah alternatif jawaban yang tidak
melihat apakah alternatif jawaban selain kunci sudah
berfungsi sebagaimana mestinya artinya
distraktor-distraktor dipilih lebih banyak (atau semua) siswa
kelompok rendah sedangkan kelompok tinggi hanya sedikit
(atau tidak ada) yang memilihnya. Distraktor-distraktor
yang efektif adalah distraktor yang secara rata dipilih oleh
subjek yang berasal dari kelompok rendah.
d) Memiliki alfa if item deleted yang tidak melebihi indeks
reliabilitas tes.
2) Item yang perlu direvisi, penjelasannya sebagai berikut :
Item yang perlu direvisi adalah item yang tidak memenuhi satu
kriteria item yang dapat dipertahankan.
3) Kategori item dengan revisi berat, penjelasannya sebagai
berikut :
a) Taraf kesukaran item dibawah 0.30 atau diatas 0.70.
b) Korelasi item total dibawah 0.30.
c) Memiliki efektifitas distraktor yang tidak efektif
Kriterianya adalah distraktor-distraktor dipilih lebih
banyak (atau semua) siswa kelompok tinggi sedangkan
kelompok rendah hanya sedikit (atau tidak ada) yang
memilihnya. Distraktor-distraktor yang tidak efektif adalah
distraktor yang tidak rata dipilih oleh subjek yang berasal
d) Memiliki alfa if item deleted melebihi indeks reliabilitas
tes.
Dengan demikian, peneliti dapat menguraikan analisis item
Analogi Verbal yang telah dilakukan di dalam tabel sebagai berikut :
Tabel 5. Klasifikasi item-item pada subtes Analogi Verbal
No Klasifikasi Nomor Item Total
1 Item yang dapat
Dari 19 item yang perlu direvisi maka item-item itu terbagi dalam
beberapa klasifikasi yang perlu direvisi dan dijabarkan sebagai berikut :
Tabel 6. Klasifikasi item-item yang perlu direvisi
No Klasifikasi Nomor item Total
1 (p) 12, 13, 17, 29, 38, 43. 6
b. Reliabilitas
Program SPSS 17 for windows digunakan dalam perhitungan
reliabilitas subtes Analogi Verbal ini. Koefisien reliabilitas
awalnya adalah 0.902 dengan jumlah soal sebanyak 50 item.
Kemudian setelah melewati dua kali proses seleksi dan membuang
7 item yang tergolong dalam klasifikasi gugur, maka koefisiennya
naik menjadi 0.912 dengan soal sebanyak 43 item. Helmstadter
(Friedenberg, 1995) menyatakan bahwa kofisien reliabilitas subtes
analogi verbal yaitu 0.912 termasuk dalam kategori sangat
terpercaya dalam mengukur kemampuan berpikir verbal,
khususnya dalam memahami relasi-relasi antara
pengertian-pengertian yang dinyatakan secara verbal.
c. Validitas
Analisis validitas dilakukan menggunakan analisis faktor
confirmatory dengan melakukan perbandingan antara model
penelitian dengan data yang dimiliki. Model penelitian yang
digunakan oleh peneliti adalah item-item yang terdapat dalam
subtes Analogi Verbal yang dapat mengungkap kemampuan
berpikir verbal, khususnya dalam memahami relasi-relasi antara
pengertian-pengertian yang dinyatakan secara verbal.
Analisis dimulai dengan uji asumsi untuk mengetahui normalitas
data. Hasil uji normalitas menunjukkan bahwa semua variabel
asymptotic covariance matrix untuk mengatasi ketidaknormalan
data. Analisis faktor confirmatory menghasilkan nilai fit indeks
sebagai berikut:
Tabel 7. Hasil Fit Indeks
No Fit Indeks Subtes AV
1 Chi-Square X
2= 1289.48 (p < 0,05)
2 Standardized RMR (SRMR) 0.059
3 CFI (Comparative Fit Index) 0.98
4 Root Mean Square Error of
Approximation (RMSEA) 0.022
Pada subtes Analogi verbal, nilai χ2 yang didapat menunjukan
bahwa ada perbedaan yang signifikan antara model penelitian dan
skor hasil tes. Namun, χ2 sangat peka dengan jumlah subjek.
Apabila jumlah subjek banyak, maka χ2 akan menyatakan bahwa
ada perbedaan yang signifikan walaupun sebenarnya perbedaannya
sangat kecil (Hu & Bentler, 1998). Oleh karena itu diperlukan nilai
fit indeks yang lainnya seperti Standardized RMR (SRMR),
Comparative Fit Index (CFI) dan Root Mean Square Error of
Approximation (RMSEA).
Nilai ideal SRMR adalah sama dengan atau lebih rendah dari 0.08
sedangkan RMSEA adalah kurang dari 0,06 dan nilai ideal CFI
adalah ama dengan atau lebih tinggi dari 0.95 (Hu & Bentler,
1999). Suatu data (skor hasil tes) dikatakan sesuai dengan model
validitas subtes Analogi Verbal seperti dapat dilihat pada tabel
diatas menghasilkan fit indeks yang memuaskan. Fit indeks
memuaskan karena ketiganya dapat memenuhi nilai ideal.
Sehingga peneliti dapat memiliki bukti validitas bahwa subtes
Analogi Verbal ini memang dapat mengungkap kemampuan
berpikir verbal, khususnya dalam memahami relasi-relasi antara
pengertian-pengertian yang dinyatakan secara verbal.
d. Norma
Tabel 8. Perbandingan Norma baru dan norma P2TKP
Kelompok Norma
Dalam subtes Analogi Verbal ini, berdasarkan tabel perbandingan