• Tidak ada hasil yang ditemukan

Evaluasi kualitas psikometrik pada tes penjurusan SMA pusat pelayanan tes dan konsultasi psikologi Universitas Sanata Dharma - USD Repository

N/A
N/A
Protected

Academic year: 2019

Membagikan "Evaluasi kualitas psikometrik pada tes penjurusan SMA pusat pelayanan tes dan konsultasi psikologi Universitas Sanata Dharma - USD Repository"

Copied!
170
0
0

Teks penuh

(1)

EVALUASI KUALITAS PSIKOMETRIK PADA TES PENJURUSAN SMA PUSAT PELAYANAN TES DAN KONSULTASI PSIKOLOGI

UNIVERSITAS SANATA DHARMA

Skripsi

Diajukan untuk Memenuhi Salah Satu Syarat

Memperoleh Gelar Sarjana Psikologi

Program Studi Psikologi

Oleh :

Laurensia Anggi Dini Riama

079114079

PROGRAM STUDI PSIKOLOGI

JURUSAN PSIKOLOGI

FAKULTAS PSIKOLOGI

UNIVERSITAS SANATA DHARMA

(2)

   

SKRIPSI

EVALUASI KUALITAS PSIKOMETRIK PADA TES

PENJURUSAN SMA PUSAT PELAYANAN TES DAN

KONSULTASI PSIKOLOGI UNIVERSITAS SANATA

DHARMA

Dipersiapkan dan ditulis oleh :

Laurensia Anggi Dini Riama

079114079

Telah dipertahankan di depan panitia penguji

pada tanggal 17 Januari 2012

dan dinyatakan memenuhi syarat

Susunan Panitia Penguji

Nama Penguji Tanda Tangan

Penguji I Y. Agung Santoso, M.A. ……….

Penguji II Prof. Dr. A. Supratiknya ……….

Penguji III Dr. T. Priyo Widiyanto, M.Si. ……….

(3)
(4)

 

HALAMAN MOTTO

Ketika bebanmu terasa BERAT,

(5)

HALAMAN PERSEMBAHAN

Skripi ini kupersembahkan kepada :

1.

Yesusku yang baik

(6)

 

PERNYATAAN KEASLIAN KARYA

Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini

tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan

dalam kutipan dan daftar pustaka, sebagaimana layaknya karya ilmiah.

Yogyakarta, 14 Februari 2012

Penulis

(7)

EVALUASI KUALITAS PSIKOMETRIK PADA TES PENJURUSAN SMA PUSAT PELAYANAN TES DAN KONSULTASI PSIKOLOGI

UNIVERSITAS SANATA DHARMA

Laurensia Anggi Dini Riama

ABSTRAK

Pusat Pelayan Tes dan Konsultasi Psikologi (P2TKP) Universitas Sanata Dharma memiliki rangkaian Differential Aptitude Test (DAT) yang diadaptasikan menjadi rangkaian tes penjurusan untuk siswa Sekolah Menengah Atas (SMA). Penelitian ini bertujuan untuk mendeskripsikan kualitas psikometrik dari tes penjurusan. Tes penjurusan terdiri dari enam subtes yaitu Analogi Verbal ( Verbal Reasoning), Vokabuler (Language Usage), Kemampuan Numerik (Numerical Reasoning), Penalaran Mekanik (Mechanical Reasoning), Berpikir Abstrak (Abstract Reasoning), Hubungan Ruang (Space Relations). Evaluasi ini perlu dilakukan untuk mengetahui sejauh mana alat tes ini memenuhi standar yang berlaku dan dapat terpercaya dalam menjalankan fungsinya. Penelitian ini menggunakan data dokumentasi sebanyak 204 siswa-siswi yang pernah memakai jasa P2TKP. Analisis kualitas item menggunakan taraf kesukaran item, korelasi item total dan efektifitas distraktor. Analisis Validitas menggunakan program Lisrel 8.80 untuk mengetahui tingkat validitas subtes penjurusan. Data dianalisis reliabilitasnya menggunakan formula alpha dalam SPSS 17.0. Peneliti juga memberikan acuan untuk memperbaharui norma dengan mengikuti aturan norma lama P2TKP. Hasil penelitian menyatakan bahwa setiap subtes penjurusan memilikiitem-item yang perlu direvisi untuk meningkatkan kualitas item dan reliabilitas tes. Koefisien reliabilitas yang didapat berkisar antara 0.641 sampai dengan 0.933. Validitas yang dihasilkan ke empat tes dikatakan baik karena item-item yang menyusun subtes tersebut dapat mengungkap suatu konstruk teori. Namun untuk subtes Penalaran Mekanik dan Tanggap Ruang ditemukan memiliki validitas yang kurang menyakinkan. Pembuatan norma dilakukan dengan menggunakan aturan yang berlaku di P2TKP. Peneliti membuat norma umum, norma untuk kelompok laki-laki dan norma untuk kelompok perempuan dengan 16 klasifikasi. Namun terdapat beberapa kelompok norma yang hanya memiliki 15 dan 14 klasifikasi saja.

(8)

 

EVALUATION OF THE PYCHOMETRICAL QUALITY IN THE SENIOR HIGH SCHOOL’S MAJORING TEST

OF THE CENTER FOR PSYCHOLOGICAL TESTING AND CONSULTATION SERVICE

OF SANATA DHARMA UNIVERISTY

Laurensia Anggi Dini Riama

ABSTRACT

The Center for Psychological testing and Consultation service of Sanata Dharma University (Pusat Pelayanan Tes dan Konsultasi Psikologi Universitas Sanata Dharma – P2TKP) owns the battery of Differential Aptitude Test (DAT) which is adapted into the course of majoring test for Senior High’s students. This research aims to describe psychometrical quality of the mentioned test above. This majoring test consists of six sub-tests, i.e. Verbal Reasoning, Language Usage, Numerical Ability, Mechanical Reasoning, Abstract Reasoning and Space Relation. This evaluation is needed to investigate how far this testing instrument in accord with current standard and fuctioning properly. This research uses the documentations of 204 students who have used the service of P2TKP. The quantitative analyses of each item includes the level of difficulties of items, tatal corelation of items and the distractorical-efectivity. The analyses of its validity use the Lisrel 8.80 program in order to investigate the level of validity for each majoring sub-test. The reliability of data is analyzed using the alpha formula in SPSS 17.0. The researcher gives also some guidelines to renew the norm referring to the old one of P2TKP. The result of this research claims that every level of the majoring sub-test has the certain items that needs to be revised, in order to improve the quality and the reliability of those items. The reliabilty-coeficience of this test reached the number of 0.641 to 0.9333. The validity resulted by the for sub-test is concluded as good since the items costructing the test are able to dislcosure the theoretical construction. Yet, for the Mechanical Reasoning and Spatial Reasoning subtests, the researcher found that the number of validity is still low. The norm-making refers to the present norm of P2TKP. The reseracher makes a kind of general norm: both for male and female in 16 classfications, but there also some groups with only 15 and 14 classifications intended.

(9)

LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN AKADEMIS

Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma:

Nama : Laurensia Anggi Dini Riama

NIM : 079114079

Demi pengembangan ilmu pengetahuan, saya memberikan kepada Perpustakaan

Universitas Sanata Dharma Yogyakarta, karya ilmiah saya yang berjudul:

“EVALUASI KUALITAS PSIKOMETRIK PADA TES PENJURUSAN SMA PUSAT PELAYANAN TES DAN KONSULTASI PSIKOLOGI

UNIVERSITAS SANATA DHARMA”

beserta perangkat yang diperlukan (bila ada). Dengan demikian saya memberikan

kepada Perpustakaan Universitas Sanata Dharma Yogyakarta hak untuk

menyimpan dan mengalihkan dalam bentuk media lain, mengelolanya dalam

bentuk pangkalan data, mendistribusikan secara terbatas, dan mempublikasikan di

internet atau media lain untuk kepentingan akademis tanpa harus meminta ijin

dari saya maupun memberikan royalti kepada saya selama tetap mencantumkan

nama saya sebagai penulis.

Demikian pernyataan ini saya buat dengan sebenarnya

Dibuat di Yogyakarta

Pada tanggal : 14 Februari 2012

Yang menyatakan,

(10)

 

KATA PENGANTAR

Penelitian ini merupakan usaha untuk mengevaluasi kualitas psikometrik

dari Tes Bakat yang digunakan oleh Pusat Pengembangan Tes dan Konsultasi

Psikologi (P2TKP) Universitas Sanata Dharma dalam Tes Penjurusan siswa-siswi

SMA. Harapan peneliti, penelitian ini dapat memberikan informasi dan bahan

pertimbangan untuk evaluasi psikometrik alat tes selanjutnya.

Penelitian ini dapat terselesaikan atas berkah dan kasih Tuhan Yesus

Kristus yang senantiasa menyertai. Kasih Tuhan juga terpancar dari setiap orang

yang membimbing, membantu, menyemangati dan memberi saran dalam

penelitian ini.

Oleh karena itu, Peneliti mengucapkan terimakasih kepada :

1. Bapak Agung Santoso, MA. Selaku Dosen Pembimbing Skripsi yang telah

dengan sabar membimbing dalam penelitian ini dari awal sampai akhir.

Terimakasih banyak, Pak. ☺

2. Bapak Y. Heri Widodo selaku kepala P2TKP yang telah memberikan izin

untuk melakukan penelitian ini.

3. Bapak C. Adi Wijaya Nugroho dengan pemberian program LISREL untuk

analisis dalam penelitian ini.

4. Bapak Antonius Soesilastanto, Mbak Diana Pujihastuti dan asisten P2TKP

untuk semua kebahagiaan yang kita alami bersama, Puji Tuhan yaa.

Especially untuk Desse, Nina, Ita Mbott, Oppie, Ina Inut, Ana Maria Galo

(11)

5. Segenap Dosen Fakultas Psikologi yang telah berbagi ilmu dan memberikan

kenangan terbaik dalam hidup saya.

6. Mas Gandung, Bu Nani, Mas Muji, Mas Doni, Pak Gie. Maturnuwun untuk

kesabarannya dalam proses administrasi, pengetesan, asistensi, peminjaman

buku dan keramahannya.

7. Emak tercinta dan Bapak tersayang yang selalu menunjukkan penerimaan

tanpa syarat khusus untuk aku anakmu. Terimakasih untuk Cinta dan Kasih

yang tidak terbatas. Anakmu sarjana, PakMak.. Mas Tersayang Frater Maruli,

Scj.. aku sarjana duluan yaaa.. ☺

8. Romo Silverius Tobe Namang, ss.cc yang sudah banyak membantu

kelancaran studi, memotivasi dan menertawakan saya.. Terimakasih ya..

9. Yuyuk, Mira, Lelek.. Aku bisa baca, tulis, makan enak dan belajar masak

karena kesabaran Yuyuk, bisa merasakan punya adik karena Yuyuk dan

Lelek.. Maturnuwun nggih..

10. Teman-teman stress sesuatu : Ita Mbott, Nenist Cheerly Lova#ehemm, Mba

Evrin, Mba Diah, Mba Jessi, Nenek Reny, Hetty don’t miss me, Nanoz

Leunca, Tante Keket, Oom Muhlis, Enyak Putri..Puji Tuhan yaaa,, sarjana

nih sesuatu..

11. Teman-teman Rotaract Club of Yogya Tugu untuk semua proses yang kita

lewati bersama.

Yogyakarta, 14 Februari 2012

(12)

  DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PERSETUJUAN DOSEN PEMBIMBING ... ii

HALAMAN PENGESAHAN ... iii

HALAMAN PERSEMBAHAN ... iv

HALAMAN MOTTO ... v

PERNYATAAN KEASLIAN KARYA ... vi

ABSTRAK ... vii

ABSTRACT ... viii

HALAMAN PERSETUJUAN PUBLIKASI KARYA ILMIAH ... ix

KATA PENGANTAR ... x

DAFTAR ISI ... xii

DAFTAR TABEL ... xv

DAFTAR LAMPIRAN ... xvii

BAB I. PENDAHULUAN ... 1

A.Latar Belakang ... 1

B.Rumusan Masalah ... 5

C.Tujuan Penelitian ... 5

D.Manfaat Penelitian ... 6

BAB II. LANDASAN TEORI ... 7

A.Tes Psikologis ... 7

1. Definisi ... 7

(13)

3. Klasifikasi Tes Psikologis ... 11

4. DAT untuk penjurusan di P2TKP ... 13

B.Kualitas Psikometrik ... 15

1. Validitas Alat Tes ... 15

2. Reliabilitas Alat Tes ... 19

3. Analisis Item ... 23

C.Norma ... 26

D.Kerangka Penelitian ... 30

E.Pertanyaan Penelitian ... 31

BAB III. METODE PENELITIAN ... 33

A.Jenis Penelitian ... 33

B.Identifikasi Variabel ... 33

C.Definisi Operasional ... 33

D.Populasi dan Sampel ... 35

E.Metode Pengambilan Data ... 35

F. Analisis Data ... 36

BAB 1V. HASIL PENELITIAN DAN PEMBAHASAN ... 38

A.Orientasi Kancah ... 38

B.Persiapan Penelitian ... 38

C.Pelaksanaaan Penelitian ... 39

D.Hasil Penelitian dan Pembahasan ... 40

1. Analogi Verbal III A1 (AV IIIA1) ... 40

(14)

 

3. Kemampuan Numerik (KN) ... 51

4. Penalaran Mekanik (PM) ... 57

5. Berpikir Abstrak (BA) ... 62

6. Hubungan Ruang (HR) ... 67

BAB V. KESIMPULAN DAN SARAN ... 73

A.Kesimpulan ... 73

B.Saran ... 74

DAFTAR PUSTAKA ... 77

LAMPIRAN – LAMPIRAN ... 79

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(15)

DAFTAR TABEL

Tabel 1. Kriteria Evaluasi Indeks Diskriminasi ... 25

Tabel 2. Persentase pengubahan skor stanine ... 29

Tabel 3. Pedoman Penentuan Persentil dan Lambang angka ... 30

Tabel 4. Daftar tes yang akan dievaluasi ... 38

Tabel 5. Klasifikasi item-item pada subtes Analogi Verbal ... 42

Tabel 6. Klasifikasi item-item yang perlu direvisi ... 42

Tabel 7. Hasil Fit Indeks ... 44

Tabel 8. Perbandingan Norma baru dan norma P2TKP ... 45

Tabel 9. Klasifikasi item-item pada subtes Vokabuler ... 47

Tabel 10. Klasifikasi item-item yang perlu direvisi ... 47

Tabel 11. Hasil Fit Indeks ... 49

Tabel 12. Perbandingan Norma baru dan norma P2TKP ... 50

Tabel 13. Klasifikasi item-item dalam subtes Kemampuan Numerik ... 51

Tabel 14. Klasifikasi item-item yang perlu direvisi ... 52

Tabel 15. Hasil Fit Indeks ... 53

Tabel 16. Perbandingan Norma baru dan norma P2TKP ... 55

Tabel 17. Klasifikasi item-item subtes Penalaran Mekanik ... 57

Tabel 18. Klasifikasi item-item yang perlu direvisi ... 57

Tabel 19. Hasil Fit Indeks ... 59

Tabel 20. Perbandingan Norma baru dan norma P2TKP ... 60

Tabel 21. Klasifikasi item-item subtes Berpikir Abstrak ... 62

(16)

 

Tabel 23. Hasil Fit Indeks ... 64

Tabel 24. Perbandingan Norma baru dan norma P2TKP ... 65

Tabel 25. Klasifikasi item-item subtes Tanggap Ruang ... 67

Tabel 26. Klasifikasi item-item yang perlu direvisi ... 68

Tabel 27. Hasil Fit Indeks ... 70

Tabel 28. Perbandingan Norma baru dan norma P2TKP ... 71

Tabel 29. Rincian item dalam analisis item ... 73

Tabel 30. Rincian Reliabilitas dan Validitas tiap subtes ... 74 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(17)

DAFTAR LAMPIRAN

Lampiran 1. Verbatim Wawancara Prof. Dr. Supratiknya ... 79

Lampiran 2. Verbatim Wawancara Y. Heri Widodo, M.Psi. ... 81

Lampiran 3. Analogi Verbal III A1 (AV III A1) ... 84

Lampiran 4. Vokabuler III ... 94

Lampiran 5. Kemampuan Numerik (KN) ... 109

Lampiran 6. Penalaran Mekanik (PM) ... 116

Lampiran 7. Berpikir Abstrak (BA) ... 125

Lampiran 8. Hubungan Ruang (HR) ... 132

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(18)

 

BAB I

PENDAHULUAN

A. LATAR BELAKANG

Sekolah Menengah Atas (SMA) adalah masa-masa penentuan

prestasi dan bakat dari masing-masing siswa. Ketika seorang siswa

memasuki jenjang pendidikan SMA, siswa dihadapkan pada

pilihan-pilihan untuk mengembangkan bakatnya. Tingkat pendidikan SMA,

umumnya memiliki 3 jurusan yaitu Ilmu Pengetahuan Sosial (IPS), Ilmu

pengetahuan Alam (IPA) dan Bahasa. Siswa memasuki tahap penjurusan

pada saat siswa memasuki kelas XI. Penjurusan ini ditujukan untuk

mengembangkan prestasi dan bakat dari siswa-siswanya.

Beberapa sekolah berinisiatif memfasilitasi siswa-siswanya

dengan penyelenggaraan tes penjurusan dalam rangka menunjang

penentuan prestasi dan bakat. Siswa-siswa akan mengerjakan serangkaian

tes bakat dalam proses penjurusan tersebut. Hasil tes akan menghasilkan

estimasi tentang bakat mereka yang dapat digunakan sebagai acuan dan

bahan pertimbangan bagi pihak sekolah dan siswa dalam memilih jurusan

yang sesuai. Hasil tes yang berisi kemampuan siswa dapat memberi

motivasi kepada mereka untuk berusaha meningkatkan kemampuannya.

Tes penjurusan ini merupakan sarana untuk membimbing siswa

sehingga dapat menemukan lingkungan yang cocok untuk

(19)

(1995) menyatakan salah satu fungsi tes adalah penempatan. Penempatan

ini dilakukan dengan cara mengevaluasi kemampuan seseorang dalam

bidang akademik dan memprediksikan lingkungan mana yang tepat untuk

perkembangan kemampuannya. Misalnya seorang siswa mendapatkan

nilai yang tinggi dalam sub tes Kemampuan Numerik dan Penalaran

Mekanik diprediksikan akan lebih mudah mengembangkan bakatnya pada

jurusan IPA. Sebaliknya siswa yang memiliki skor yang kurang dalam

Kemampuan Numerik dan Penalaran Mekanik akan mengalami kesulitan

dalam belajar di kelas IPA.

Sekolah bekerja sama dengan lembaga luar dalam melaksanakan

tes penjurusan, sebagai contoh lembaga yang bernaung di bawah

Universitas Sanata Dharma (USD) yaitu Pusat Pelayanan Tes dan

Konsultasi Psikologi (P2TKP). Lembaga ini bergerak dalam bidang

asesmen psikologis.

Tes yang umumnya dipakai oleh lembaga P2TKP dalam tes

penjurusan adalah tes bakat diferensial (Differential Aptitude Test). Tes ini

pertama dipublikasikan pada tahun 1947 dengan tujuan tes sebagai

bimbingan karir siswa kelas VIII sampai kelas XII. Tes DAT terdiri dari

delapan tes sebagai berikut : Penalaran Verbal, Penalaran Numerik,

Penalaran Abstrak, Kecepatan dan Kecermatan Persepsi, Penalaran

Mekanik, Hubungan Ruang (Spatial), Ejaan dan Penggunaan Bahasa

(Anastasi, 2003). Sedangkan Tes Penjurusan ini terdiri 6 subtes bakat

(20)

 

Numerik, Analogi Verbal, Vokabuler dan Penalaran Mekanik. Keenam

sub tes yang digunakan sebagai Tes Penjurusan tersebut ditetapkan

berdasarkan relevansinya dengan kebutuhan pendidikan di SMA,

maksudnya adalah kemampuan yang wajib dimiliki oleh siswa agar dapat

masuk dalam program penjurusan tertentu (Supratiknya, Komunikasi

Pribadi 22 Agustus 2011). Setiap sub tes dalam tes DAT dapat dipakai

secara terpisah dan mandiri sesuai dengan kebutuhan atau tujuan tesnya

(Etikawati, 2004).

Kualitas suatu alat tes harus dipahami terlebih dahulu sebelum

menggunakannya. Alat tes yang berkualitas akan menghasilkan gambaran

tentang kemampuan diri seseorang sebenarnya. Alat tes yang berkualitas

adalah alat tes yang memiliki item-item berkualitas seperti memiliki

tingkat kesulitan item dan korelasi item total sesuai standar dan memiliki

distraktor yang efektif. Alat tes tersebut harus pula memiliki reliabilitas

dan validitas yang termasuk dalam kategori baik. Evaluasi juga

dimaksudkan untuk mengecek kualitas psikometrik yang terdiri dari

reliabilitas alat tes, validitas alat tes dan kualitas item yang baik

(Friedenberg, 1995). Hal ini ditujukan agar hasil tes dapat dipercaya

untuk memberi informasi mengenai kemampuan siswa dalam bidang

akademis. Siswa akan dengan tepat memilih jurusan tertentu dan

memperdalam kemampuannya tersebut di kelas XI dan kelas XII. Siswa

yang mengikuti tes bakat akan mengerti karir mereka jika memasuki

(21)

dipercaya, maka tes ini akan menghasilkan prediksi kemampuan siswa

yang tidak akurat dan merugikan siswa yang menjadikan hasil tes

penjurusan sebagai patokan untuk menentukan karir.

Tes penjurusan dipergunakan oleh lembaga P2TKP sejak tahun

1997 untuk melaksanakan tes penjurusan di berbagai sekolah. Selama ini

tes penjurusan hanya pernah di evaluasi satu kali oleh Novita (2005).

Novita mencoba meneliti reliabilitas, validitas dan perbaikan norma pada

tes penjurusan dalam skripsinya. Pengecekan tersebut berlangsung lima

tahun yang lalu. Sedangkan perkembangan siswa dari masa ke masa dalam

segi tata bahasa, kemampuan intelektual, kepribadian dan minat sudah

pasti berbeda, sehingga evaluasi tes penjurusan sangat penting dilakukan

Saat ini P2TKP sedang mengadakan evaluasi tes psikologis. Setiap

tes wajib mendapatkan pengecekan kualitas setiap kurun waktu. Evaluasi

alat tes penjurusan meliputi validitas, reliabilitas, analisis item dan norma.

Program ini untuk menjaga kualitas tes dan kualitas P2TKP dihadapan

klien supaya klien yang menggunakan tes tertentu menjadi yakin akan

hasil tes yang klien ikuti (Widodo, Komunikasi pribadi 26 Oktober 2010).

Oleh karena itu, peneliti akan mengevaluasi salah satu tes yang ada di

P2TKP yaitu tes penjurusan. Evaluasi yang akan peneliti lakukan pada tes

penjurusan yang ada di P2TKP ini adalah evaluasi kualitas psikometri.

Kualitas psikometri sendiri meliputi pengecekan reliabilitas, validitas,

analisis item dan norma yang dipakai dalam tes penjurusan tersebut.

(22)

 

P2TKP maupun sekolah-sekolah dalam memberikan informasi bagi

penjurusan siswa-siswa.

B. RUMUSAN MASALAH

1. Bagaimana kualitas item dalam subtes penjurusan SMA?

2. Bagaimana reliabilitas dari tes penjurusan SMA ini sehingga dapat

memprediksi kemampuan subjek di kemudian hari?

3. Bagaimana validitas tes penjurusan SMA ini?

4. Bagaimana norma yang dipakai di P2TKP sehingga bisa

menggambarkan setiap subtesnya dengan nilai yang sama?

C. TUJUAN PENELITIAN

Penelitian ini bertujuan untuk:

1. Mengetahui kualitas item dari tes penjurusan SMA

2. Mengetahui estimasi reliabilitas untuk menentukan kelayakan dari

pemakaian tes penjurusan di P2TKP

3. Mengetahui validitas dari tes penjurusan SMA agar dapat menentukan

kelayakan pemakaian tes ini di P2TKP.

4. Memperbaharui norma agar semakin dapat menggambarkan

(23)

D. MANFAAT PENELITIAN

1. Manfaat Teoretik

Hasil yang ditemukan dalam penelitian ini diharapkan bisa menjadi

sumber informasi dan bahan pembanding bagi penelitian lain yang

berkaitan dengan alat tes dan kualitas psikometrik.

2. Manfaat Praktis

Hasil penelitian ini juga diharapkan bisa sebagai langkah awal dari

evaluasi alat-alat tes di P2TKP. Hasil tes ini juga bisa dimanfaatkan

sebagai sumber informasi berkaitan dengan kualitas psikometrik setiap

(24)

  BAB II

LANDASAN TEORI

A. TES PSIKOLOGIS

1. Definisi

Anastasi (1997), Friedenberg (1995) serta Cronbach (1960)

menyebutkan bahwa tes psikologis sebagai alat ukur yang objektif,

sistematis dan baku untuk mendapatkan informasi atas perilaku tertentu

dari manusia. Informasi tersebut biasanya telah diubah dalam bentuk

angka atau skor. Tes psikologis yang dipakai berarti telah dibakukan dan

memiliki standardisasi tertentu. Standardisasi adalah keseragaman dalam

pelaksanaan dan penskoran tes. Jika standardisasi yang dilakukan efektif,

maka seseorang akan mendapatkan skor yang sama walaupun dalam

situasi yang berbeda. Selain prosedur yang terstandardisasi, alat tes juga

memiliki sampel perilaku, skor atau kategori, norma dan prediksi dari

perilaku.

Dari berbagai macam batasan mengenai tes dapatlah ditarik

berbagai kesimpulan pengertian (Azwar, 1998) yaitu:

a. Tes memiliki prosedur tertentu. Tes memiliki proses administrasi

yang baku, standar skoring sampai intepretasi kepada klien. Setiap

klien juga wajib mendapatkan perlakuan yang sama dalam proses

(25)

b. Suatu tes berisi sampel perilaku. Kelayakan suatu tes ditentukan

dari item-item tesnya. Item tes yang mewakili tujuan tes akan

mendukung kelayakan tes tersebut.

c. Suatu tes mengukur perilaku. Item-item di dalam tes yang dijawab

subjek akan mengungkapkan tentang hal yang diketahui subjek

atau yang telah dipelajari subjek.

2. Tujuan Tes Psikologis

Tujuan utama pengetesan pada saat ini umumnya adalah

mengevaluasi perilaku, kecakapan kognitif, ciri kepribadian, karakteristik

individu dan kelompok lainnya untuk membantu membuat penilaian,

prediksi dan keputusan tentang manusia. Gregory (1996) menuliskan lima

tujuan penggunaan tes yaitu sebagai berikut :

a. Klasifikasi

Klasifikasi berarti menempatkan seseorang individu pada kategori

tertentu berdasarkan kemampuannya. Di dalam klasifikasi terdapat

beberapa jenis lainnya berdasarkan tujuan yang berbeda untuk

menempatkan individu pada kategori tertentu yaitu sebagai berikut :

1)Placement

Placement artinya mengklasifikasikan subjek ke dalam kelompok yang

berbeda sesuai dengan kebutuhan atau kemampuan yang dimiliki.

(26)

 

mengidentifikasi siswa yang memiliki kemampuan di bidang kalkulus

atau aljabar.

2) Screening

Screening adalah proses tes yang cepat dan simple atau prosedur yang

dapat mengidentifikasi seseorang memerlukan karakteristik khusus

atau kebutuhan khusus. Contoh : Screening berguna untuk

mengidentifikasikan anak-anak yang memiliki kebutuhan khusus

dalam belajar atau anak-anak yang memiliki kemampuan luar biasa

dalam belajar.

3) Certification dan selection

Kedua proses di atas menghasilkan kualitas lulus atau gagal. Ketika

seseorang lulus dalam sertifikasi, hal tersebut memberikan

keistimewaan tersendiri. Misalnya seseorang yang mendapatkan Surat

Ijin Mengemudi (SIM), hal itu menandakan bahwa orang tersebut

memiliki kemampuan yang cukup dalam mengemudi. Seleksi menjadi

mirip dengan sertifikasi karena dalam hal ini keduanya memberikan

hal istimewa. Misalnya seleksi masuk perusahaan, jika seseorang lulus

maka berhak mendapatkan sebuah jabatan dalam perusahaan.

b. Diagnosis dan Treatment Planning

Diagnosis ditujukan untuk mengidentifikasi sifat alami dan sumber

perilaku abnormal. Contoh perilaku tersebut kemudian diidentifikasikan

ke dalam sistem diagnostik tertentu. Diagnosis sebagai awal untuk

(27)

peranan penting di dalam diagnosis dan treatment planning. Contoh : Tes

intelegensi sangat penting didalam penentuan retardasi mental dan tes

kepribadian sangat membantu untuk mengidentifikasi sifat alami dan

luasnya gangguan kepribadian.

c. Self Knowledge

Seseorang yang membaca hasil tes kemampuan diri dapat memperoleh

pengertian baru tentang kemampuan dirinya dan meningkatkan

kesadarannya terhadap kemampuannya.

d. Program evaluation

Dalam tes prestasi dapat digunakan untuk membuat keputusan dengan

evaluasi pada kemampuan siswa. Misalnya saja setelah siswa

melaksanakan tes prestasi, mereka akan mendapatkan hasil

kemampuannya atau evaluasi dari hasil belajar.

e. Research

Tes menjadi pemeran utama dalam penelitian psikologis. Melalui tes,

penelitian dapat selalu berjalan karena antara tes dan penelitian dalam

prakteknya adalah hal yang tidak dapat dipisahkan.

Berdasarkan penjelasan diatas, dapat disimpulkan bahwa tes

psikologis memiliki tujuan yang kompleks. Seorang psikolog dapat

(28)

  3. Klasifikasi Tes Psikologis

Sementara itu, Gregory (2000) menjelaskan tes psikologis sebagai

berikut :

a. Group Tests adalah proses pengukuran dengan sekumpulan orang yang

akan diuji dalam waktu bersamaan.

b. Individual test adalah alat yang dari tujuan dan desainnya harus

disampaikan antara satu penguji dan satu subjek. Pengukuran ini

memiliki kelebihan yaitu penguji dapat sekaligus melakukan observasi

perilaku subjek ketika tes berlangsung.

Jenis-jenis tes kemudian dibagi kedalam sembilan kategori berbeda :

1) Intelligence Tests adalah tes yg didesain khusus untuk melihat

kemampuan dalam bekerja dan mengestimasi level kecerdasan

individu secara umum.

2) Aptitude Tests adalah tes yang pada dasarnya digunakan untuk menguji

kemampuan khusus dari subjek. Tes bakat biasanya digunakan dalam

memprediksikan tingkat keberhasilan dalam pekerjaan, kursus dan

dunia pendidikan. Tes ini memiliki dua macam tes yaitu single

aptitude test yang secara jelas hanya menilai satu kemampuan khusus

saja dan multiple aptitude test batteries dimana tes ini menampilkan

sejumlah tes yang mengukur kemampuan yang berbeda dan hasilnya

berupa profil kemampuan subjek dalam bidang yang berbeda.

3) Achievement Tests adalah tes yang mengukur keberhasilan seseorang

(29)

Tujuan tes ini adalah untuk mengetahui seberapa banyak bahan yang

telah diserap atau dikuasai subjek.

4) Creativity Tests adalah mengukur kemampuan subjek dalam

menemukan ide baru, insight atau kreasi artistik yang dapat diterima,

memiliki nilai sosial, estetika dan nilai ilmiah. Pengukuran kreatifitas

ditekankan pada keaslian dan originalitas dalam solusi untuk suatu

permasalahan yang rumit atau dalam menghasilkan karya yang artistik.

5) Personality Tests adalah tes yang mengukur ciri, kualitas atau perilaku

pada seseorang sebagai pribadi. Informasi dari tes ini membantu untuk

memprediksi perilaku di masa depan.

6) Interest Inventories mengukur pilihan subjek dalam beberapa aktivitas

atau topik dengan demikian diharapkan akan membantu dalam

menentukan pilihan pekerjaan.

7) Behavioral procedures dapat digunakan dalam mengumpulkan

anteseden dan konsekuensi dari perilaku termasuk metode checklist,

rating scales, interview dan observasi yang terstruktur.

8) Neuropsychological Test digunakan untuk mengumpulkan informasi

dari subjek yang mengalami disfungsi otak atau subjek yang masih

dalam dugaan. Neuropsikolog menggunakan tes dan prosedur ini untuk

melihat konsekuensi dari kerusakan otak.

Dapat disimpulkan bahwa tes psikologis dapat berupa group tests

atau individual tests. Tes Bakat yang dipakai sebagai Tes Penjurusan SMA

(30)

  4. DAT untuk Penjurusan di P2TKP

DAT adalah tes bakat yang digunakan sebagai tes penjurusan di

SMA oleh P2TKP. Tes bakat ini mengukur performansi maksimal dari

subjeknya. Fungsi dari tes bakat ini adalah penempatan (placement),

normatif, diagnostik dan sumatif (Azwar, 1998). Fungsi yang paling

nampak dalam tes bakat sebagai tes penjurusan adalah penempatan

(placement). Fungsi placement adalah penggunaan hasil tes prestasi belajar

untuk klasifikasi individu kedalam bidang atau jurusan yang sesuai dengan

kemampuan yang telah diperlihatkannya pada hasil belajar yang telah lalu.

Tes DAT untuk penjurusan yang dipakai P2TKP terdiri dari 6

subtes yang mengukur kemampuan yang berbeda (Bennet, Seashore dan

Wesman, 1966). Subtes tersebut adalah sebagai berikut :

a. Subtes Hubungan Ruang (HR)

Tes ini mengukur kemampuan berpikir yaitu pemahaman terhadap

susunan (struktur) benda-benda tiga dimensi dan bagian-bagiannya.

Kemampuan ini amat diperlukan untuk mendalami bidang teknik pada

umumnya (seperti mesin, pertukangan, dsb).

b. Subtes Berpikir Abstrak (BA)

Tes ini mengukur kemampuan berpikir tidak dengan kata-kata.

Kemampuan ini mencerminkan kemahiran dalam menangkap hubungan

dan membuat kesimpulan tentang persoalan-persoalan yang dirumuskan

tidak dengan kata-kata, melainkan dengan aneka pola. Kemampuan ini

(31)

c. Subtes Kemampuan Numerik (KN)

Tes ini mengukur kemampuan berpikir khususnya dalam memahami

konsep-konsep bilangan dan kefasihan dalam memecahkan aneka

persoalan yang berkaitan dengan konsep bilangan atau angka.

Kemampuan ini sangat diperlukan dalam bidang Ilmu Pengetahuan Alam

dan Ilmu Pengetahuan Sosial Kuantitatif.

d. Subtes Analogi Verbal (AV)

Tes ini mengukur kemampuan berpikir verbal, khususnya dalam

memahami relasi-relasi antara pengertian-pengertian yang dinyatakan

secara verbal. Kemampuan ini amat diperlukan dalam setiap bidang

ilmu dan dalam komunikasi pengajaran.

e. Subtes Vokabuler (VOK)

Tes ini mengukur pengetahuan bahasa, khususnya perbendaharaan kata

Bahasa Indonesia. Kemampuan ini amat diperlukan dalam bidang

bahasa.

f. Subtes Penalaran Mekanik (PM)

Tes ini mengukur kemampuan berpikir, khususnya memahami

prinsip-prinsip mekanika dan fisika dalam aneka situasi sehari-hari. Kemampuan

ini mencerminkan kefasihan seseorang dalam mempelajari cara kerja

aneka peralatan dan piranti. Tes ini sesuai untuk memprediksi

keberhasilan di bidang yang menuntut pemahaman tentang

(32)

 

Keenam subtes tersebut dikerjakan oleh subjek dalam satu waktu. Hasil dari

subtes itu akan dikemukakan dalam penilaian yang mengacu kepada norma.

B. KUALITAS PSIKOMETRIK

1. Validitas Alat Tes

` Azwar (2008) dan Santoso (2010) mengungkapkan informasi yang

saling melengkapi tentang validitas. Pengukuran yang valid adalah bagian

terpenting dari usaha untuk mendapatkan asesmen yang handal. Validitas

adalah suatu ukuran yang mengetahui ketepatan dan kecermatan suatu alat

ukur dalam melakukan fungsi ukurnya. Suatu alat ukur yang valid mampu

mengungkapkan data yang akurat. Alat tersebut juga memberikan

gambaran yang cermat mengenai data tersebut sehingga dapat memenuhi

kebutuhan informasi yang dikehendaki. Suatu alat ukur yang valid juga

akan menghasilkan skor kemampuan yang tidak jauh berbeda dari

kemampuan subjek sesungguhnya.

Gregory (1996) mengungkapkan cara-cara yang berbeda untuk

mengakumulasi bukti validitas dikelompokkan menjadi tiga kategori

sebagai berikut :

a. Validitas isi

Gregory (1996) menyatakan validitas isi itu ditentukan oleh

sejauh mana item-item dalam tes mewakili sederet perilaku yang

diteliti. Dalam Friedenberg (1995) dan Azwar (2008) dikemukakan

(33)

memperbandingkan item tes dengan rincian tujuan pengetesan atau hal

yang akan diukur. Hal itu dilakukan lewat analisis rasional atau lewat

professional judgement.

Validitas isi terbagi pula menjadi dua tipe yaitu face validity dan

logical validity.

1) Face Validity (validitas tampang)

Validitas ini tercapai apabila pemeriksaan terhadap

penampilan item tes memberikan kesan mampu mengungkap

apa yang hendak diukur. Validitas tampang adalah tentang

penerimaan sosial.

2) Logical Validity (validitas logik)

Validitas ini dicapai saat setiap item tes dirancang

sesuai tujuan ukurnya. Suatu objek yang akan diukur harus pula

mendapatkan batasan yang jelas supaya menghasilkan

item-item yang relevan.

b. Validitas Konstruk

Validitas konstruk muncul untuk melengkapi kekurangan dua

tipe validitas yang lainnya yaitu validitas isi dan validitas berdasarkan

kriteria. (Santoso, 2010). Validitas konstruk adalah tipe validitas yang

menunjukkan sejauh mana tes mengungkap suatu trait atau konstruk

teoritik yang hendak diukurnya (Allen & Yen, 1979). Validitas

konstruk sangat berbeda dengan validitas yang lain karena

(34)

 

pengujian relasi (Kerlinger, 2006). Dua pendekatan yang banyak

dilakukan dalam pengujian validitas konstruk antara lain adalah

pendekatan multitrait-multimethod dan pendekatan factor analysis.

Dalam penelitian ini, akan menggunakan pendekatan factor

analysis. Kerlinger (2006) menyatakan bahwa factor analysis

merupakan cara untuk meringkas, mengurangi sejumlah besar data

menjadi sejumlah ukuran yang tidak terlalu banyak. Caranya adalah

dengan mengorganisir data-data tersebut yang disebut faktor.

Faktor-faktor diorganisir dengan melihat apakah mengukur hal yang sama.

Menurut Hair, Anderson, Tattham dan Black (1995) factor analysis

merupakan sekumpulan prosedur matematik yang kompleks guna

menganalisis saling hubungan diantara variabel-variabel dan

menjelaskan saling hubungan tersebut dalam bentuk variabel yang

terbatas yang disebut faktor.

Menurut Hair, Anderson, Tattham dan Black (1995) analisis

faktor memiliki 2 bentuk, yaitu:

1) Confirmatory

Hair, Anderson, Tattham, dan Black (1998)

mengungkapkan bahwa analisis faktor adalah sebuah metode dari

statistika multivariat yang tujuan utamanya adalah menemukan

struktur yang mendasari dalam sebuah matriks data yang didapat

(35)

seperangkat dimensi yang mendasari veriabel-variabel tersebut,

yang disebut sebagai faktor.

2) Exploratory

Analisis ini bertujuan mencari hubungan antara variabel.

Dalam proses, variabel-variabel akan di seleksi dan mengurangi

jumlah data yang dianalisis.

c. Validitas berdasarkan kriteria

Menurut Sireci, 2008 dan Kane, 2006 (Santoso,2010)

validitas kriteria adalah korelasi antara skor tes dengan kriteria yang

lain. Untuk melihat tingginya validitas berdasarkan kriteria dilakukan

komputasi korelasi antara skor tes dan skor kriteria. AERA, APA, &

NCME (Gregory, 1996) mengungkapkan poin penting dalam penentuan

kriteria bahwa semua kriteria yang mengukur harus dijelaskan secara

akurat dan alasan untuk memilih kriteria yang dianggap relevan tersebut

harus secara eksplisit. Prosedur validitas berdasarkan kriteria

menghasilkan dua macam pendekatan (Gregory, 1996) yaitu sebagai

berikut :

1) Validitas prediktif yaitu ketika pengambilan skor kriteria tidak

bersamaan dengan pengambilan skor tes, biasanya satu bulan atau

satu tahun setelah skor tes didapatkan.

2) Validitas konkuren yaitu apabila skor tes dan skor kriteria dapat

(36)

 

mendiagnosa pasiennya akan menjadi sesuai dengan pengukuran

kriteria untuk menghasilkan validitas dari tes.

Santoso (2010), validitas saat ini merupakan penilaian

bersifat evaluatif yang terintegratif. Penilaian tersebut bukan lagi

kepada alat tesnya yang dikenal dengan kata valid atau tidak valid,

tetapi lebih kepada tindakan yang diambil berdasarkan hasil tes yang

dimiliki subjek. Validasi tidak cukup dengan hanya menampilkan satu

bukti dari tipe validitas. Bukti-bukti validitas tes tersebut yang

nantinya berguna dalam mendukung tindakan yang diambil

berdasarkan hasil tes.

2. Reliabilitas Alat Tes

Reliabilitas merupakan penerjemahan dari kata reliability

yang mempunyai asal kata rely dan ability. Reliabilitas alat ukur

dinyatakan dalam koefisien korelasi (r).

Ide pokok yang terkandung dalam konsep reliabilitas

adalah sejauhmana hasil suatu pengukuran dapat dipercaya. Hasil

pengukuran dapat dipercaya hanya apabila dalam beberapa kali

pelaksanaan pengukuran terhadap kelompok subjek yang sama

diperoleh hasil yang relatif sama selama aspek yang diukur dalam diri

subjek memang belum berubah (Azwar,2008). Menurut Croncbach

(1960), reliabilitas sama dengan konsistensi dalam suatu pengukuran.

(37)

reliabilitas itu mengindikasikan kemampuan suatu alat tes untuk

menghasilkan skor yang konsisten.

Estimasi terhadap tingginya reliabilitas dapat dilakukan

melalui berbagai metode pendekatan (Friedenberg, 1995) yaitu :

a. Pendekatan Tes Ulang

Pendekatan tes ulang dilakukan dengan menyajikan tes dua kali

pada suatu kelompok subjek dengan tenggang waktu diantara

kedua penyajian tersebut. Friedenberg (1995) menyebutkan tes

re-tes juga dapat digunakan untuk mengevaluasi eror yang

berhubungan dengan administrasi tes dalam dua waktu yang

berbeda. Suryabrata (1999) mnyebutkan bahwa tes ulang memiliki

kelemahan yaitu adanya pembelajaran oleh subjek, pengalaman

dan perubahan motivasi. Hal ini memungkinkan berubahnya hasil

tes yang didapat oleh subjek.

b. Pendekatan bentuk Paralel

Dalam bentuk ini, tes yang akan diestimasi reliabilitasnya harus

ada paralelnya, yaitu tes lain yang sama tujuan ukurnya dan setara

isi itemnya baik secara kualitas ataupun kuantitas. Friedenberg

(1995) menyebutkan bahwa alternate form diberikan dengan cara

satu kelompok dites dengan 2 versi soal yang berbeda dan tingkat

kesulitan yang sama juga pada waktu yang sama. Ketika satu

kelompok diberikan dua form ini dan menunjukkan hasil tes yang

(38)

 

Suryabrata (1999) menambahkan bahwa dalam penelitian

pendekatan ini tidak banyak digunakan karena akan sangat sulit

menentukan paralel yang harus sepadan.

c. Pendekatan Konsistensi Internal

Pendekatan ini dilakukan dengan menggunakan satu bentuk tes

yang dikenakan hanya sekali saja pada kelompok subjek (

single-trial administration). Pendekatan reliabilitas konsistensi internal

bertujuan melihat konsistensi antar item atau antar bagian dalam

tes itu sendiri. Pengujian reliabilitas dalam penelitian ini

menggunakan metode satu rangkaian yang biasa disebut internal

consistency atau pendekatan homogenitas. Suatu tes yang secara

internal consistency baik berarti semua item mengukur bidang

pengetahuan atau sifat kepribadian yang sama (Supratiknya, 1998).

Ada tiga cara yang setidaknya perlu diketahui dalam mengestimasi

reliabilitas dengan teknik konsistensi internal (Suryabrata, 1999)

yaitu :

1) Formula Alpha

Penemunya adalah Cronbach pada tahun 1951. Teknik ini

dilakukan dengan membelah tes kedalam beberapa bagian.

Setiap belahan harus berisi item yang jumlahnya seimbang

sehingga dalam perhitungannya dapat menghasilkan

(39)

Rumus formula Alpha sebagai berikut :

α = [ n ] [ 1- ∑Vi ]

[n-1 ] [ Vt]

Keterangan :

α = Koefisien reliabilitas

n = banyaknya bagian (potongan tes)

Vi = Varians tes bagian I yang panjangnya tidak ditentukan Vt = Varians skor total (perolehan)

2) Teknik Belah Dua

Teknik ini dilakukan dengan cara memberikan satu

perangkat tes kepada sekelompok subjek sebanyak satu

kali. Lalu skor tes subjek dibagi menjadi dua kelompok

yang setara. Sekelompok skor bernomor genap dan

sekelompok skor bernomor ganjil. Estimasi reliabilitasnya

dicari dengan cara menghitung korelasi skor pada belahan

pertama dengan skor pada belahan kedua.

3) Teknik Analisis Varians

Terdapat banyak cara untuk mengestimasi relibilitas

melalui analisis varians. Salah satunya adalah yang

dikemukakan oleh Hoyt (1941). Dalam karyanya, varians

total dianalisis menjadi proporsi yang berasal dari peserta

tes, proporsi yang berasal dari soal-soal tes dan sisanya.

Setelah diketahui cara-cara untuk mengestimasi reliabilitas,

kita juga perlu mengetahui standar koefisien reliabilitas yang dapat

(40)

 

koefisien reliabilitas yang baik adalah 0.90. Helmstadter (Friedenberg,

1995) mengemukakan koefisien reliabilitas berdasarkan tujuan tesnya

yaitu tes bakat, reliabilitasnya rata-rata harus 0.88. Dalam Suryabrata

(1999) sebuah tes yang hasilnya akan dijadikan bahan dasar membuat

suatu keputusan, koefisien reliabilitasnya hendaknya mendekati 0.90.

3. Analisis Item

Isi tes tidak lain dari sekumpulan item berupa pertanyaan

tentang suatu hal yang hendak diukur. Sehingga kualitas tes tersebut

ditentukan oleh kualitas itemnya. Oleh karena itu, untuk mengetahui

suatu tes berisi item yang baik atau kurang baik, kita perlu melakukan

analisis item. Friedenberg (1995) menyebutkan bahwa analisi item

sangat penting dan revisi terhadap item yang kurang baik dapat

meningkatkan validitas dan reliabilitas suatu tes. Dalam pengujian

item tes, terdapat tiga perhitungan yang paling sering digunakan yaitu:

a. Indeks kesukaran item (p)

Indeks kesukaran item merupakan rasio antara penjawab

item dengan benar dan banyaknya penjawab item. Indeks

kesukaran item disimbolkan dengan huruf p. Nilai p yang semakin

besar menandakan item itu mudah dijawab dan nilai p yang

semakin kecil menandakan bahwa item tersebut sukar ditemukan

(41)

Nilai p bergerak dari 0.0 sampai 1.0. Jika nilai p mendekati

0.0, maka berarti tidak seorangpun dapat menjawab item tersebut

dengan benar. Jika nilai p mendekati 1.0 maka setiap subjek dapat

menjawab item tersebut dengan benar. Pada umumnya nilai p

yang berada disekitar 0,30 sampai 0.70 yang dianggap baik

(Gregory,1996). Level optimal dari nilai p tersebut sesuai

digunakan dalam tes penjurusan ini karena akan mengukur

performansi maksimal setiap subjek.

b. Analisis diskriminasi item (d)

Daya diskriminasi item adalah kemampuan item dalam

membedakan kelompok yang memiliki kemampuan tinggi dan

kelompok yang memiliki kemampuan rendah. Indeks diskriminasi

item disimbolkan dengan huruf d (Azwar, 1998).

Untuk menganalisis diskriminasi item dalam Friedenberg

(1995) dikatakan dapat dengan menghitung Indeks Diskriminasi

item (d) dan menghitung korelasi item total (rix). Gregory (1996)

menyatakan daya diskriminasi tercapai dengan baik jika kelompok

yang memiliki kemampuan tinggi dapat menjawab benar item

tersebut sedangkan kelompok rendah tidak satu pun menjawab

dengan benar. Cara menghitung (d) sendiri yaitu :

d = (U-L)/N

Ket :

d : Indeks diskriminasi item.

(42)

 

Ebel (dalam Azwar, 1997) menyarankan kriteria evaluasi

indeks diskriminasi dalam empat kategori:

Tabel 1. Kriteria Evaluasi Indeks Diskriminasi

Indeks Diskriminasi Evaluasi

0.40 atau lebih Bagus sekali

0.30 --- 0.39 Lumayan bagus tetapi perlu peningkatan

0.20 --- 0.29 Belum memuaskan, perlu diperbaiki Kurang dari 0.20 Jelek dan harus dibuang

Selain itu, memilih item yang baik juga dapat

berdasarkan korelasi item total (rix). Korelasi item total

memperlihatkan konsistensi antara fungsi item dengan fungsi

tes sebagai alat untuk mengungkapkan perbedaan individual.

Azwar (2009) menyatakan item yang baik koefisien korelasi

item totalnya semakin mendekati angka 1.0. Namun biasanya

digunakan batasan rix ≥ 0.30. Ketika sebuah item memiliki rix

yang mencapai standar tersebut, item tersebut dianggap

memiliki daya pembeda yang memuaskan.

c. Efektifitas Distraktor

Friedenberg (1995) menyatakan bahwa tes prestasi dan tes

bakat umumnya menggunakan format soal pilihan ganda.

Alternatif pilihan salah dalam format pilihan ganda disebut

distraktor. Pilihan ganda yang dirancang dengan tepat memiliki

dua karakteristik. Pertama, subjek yang memiliki pengetahuan

(43)

yang kurang memiliki pengetahuan yang diujikan memilih

alternatif jawaban yang tersedia. Azwar (1998) mengatakan

analisis efektifitas distraktor digunakan untuk melihat apakah

alternatif jawaban selain kunci sudah berfungsi sebagaimana

mestinya artinya distraktor-distraktor dipilih lebih banyak (atau

semua) siswa kelompok rendah sedangkan kelompok tinggi hanya

sedikit (atau tidak ada) yang memilihnya. Distraktor-distraktor

yang efektif adalah distraktor yang secara rata dipilih oleh subjek

yang berasal dari kelompok rendah.

C. NORMA

1. Definisi

Cronbach (1960) menyebutkan bahwa norma berguna untuk

membandingkan kemampuan seseorang dalam kelompoknya. Norma

atau kriteria yang akan digunakan untuk melakukan klasifikasi tersebut

harus relevan dengan tujuan tesnya dan distribusi kelas (Azwar, 1998).

Hasil tes seseorang biasanya berupa skor mentah. Skor mentah yang

telah dikonversikan dalam norma atau kriteria dapat digunakan untuk

melihat posisi seseorang dalam kelompok tertentu.

Penilaian terhadap hasil belajar data digolongkan menjadi dua

pendekatan (Azwar,1998) yaitu :

a. Penilaian yang mengacu pada kriteria (criterion-referenced

(44)

 

Tes yang disusun berdasarkan suatu kriteria tertentu memiliki

tujuannya untuk mengukur sejauh mana pemahaman terhadap

materi yang dimiliki subjek. Penilaian ini akan menginformasikan

kemampuan subjek secara independen.

b. Penilaian yang mengacu kepada norma (norm-referenced

evaluation)

Tipe penilaian yang mengacu kepada norma digunakan tes prestasi

dan tes bakat untuk memberikan informasi mengenai perbedaan

kemampuan subjek. Kemampuan-kemampuan individu

diklasifikasikan kedalam kelompoknya masing-masing artinya

kemampuan seorang subjek dapat diperbandingkan dengan subjek

yang lain.

Penelitian ini menggunakan penilaian yang mengacu kepada

norma karena hasil tes subjek akan diperbandingkan dalam

kelompoknya. Selanjutnya akan dibahas lebih lanjut mengenai norm

referenced evaluation.

2. Penilaian yang mengacu kepada norma

Jenis-jenis tranformasi skor antara lain :

b. Presentil

Gregory (2000) mengatakan presentil itu mengungkapkan

persentase kemampuan seseorang pada sampel yang baku yang

(45)

transformasi skor mentah yang paling umum digunakan. Norma

ini mudah dipahami dan dapat digunakan untuk tes dengan tujuan

yang bermacam-macam.

c. Skor standar

Tes-tes umumnya memakai skor-skor standar yang dapat

diperoleh dengan transformasi linear atau non linear atas

skor-skor mentah yang orisinil. Proses perhitungan skor-skor standar

dituliskan dalam Gregory (2000) yaitu dengan mengurangi mean

dari norma kelompok dengan skor mentah dan dibagi dengan

standar deviasi dari norma kelompok. Ketika skor mentah

beberapa tes diubah menjadi skor standar maka kita dapat melihat

hasil tes-tes tersebut dengan skala yang umum. Dengan catatan,

jika distribusi skor tes - tes tersebut memiliki bentuk yang sama

maka perbandingan skor mentah yang telah diubah menjadi skor

standar dapat dilakukan. Jika distribusi tes - tes tersebut berbeda,

maka perbandingan dengan skor standar tidak dapat dilakukan

karena dapat menyesatkan pengguna tes.

c. Sten Scale

Penilaian dengan Sten scale pertama-tama diciptakan oleh

Canfield(1951) yang terbagi dalam sepuluh klasifikasi dengan

lima klasifikasi berada di bawah dan lima klasifikasi berada di

(46)

 

d. Stanine (standar nine)

Dalam stanine scale (Gregory, 2000), semua skor mentah

dikonversikan ke dalam satu digit sistem dari skor yang

terentang antara 1 sampai dengan 9. Mean dari skala ini selalu 5

dan standar deviasinya sekitar 2. Proses transformasi dari stanine

sangat simple yaitu pertama, skor mentah di ranking dari yang

terendah sampai yang tertinggi. Nilai terendah, sebanyak 4% dari

skor dikonversikan menjadi skala stanine 1, proses selanjutnya

dapat dilihat dalam tabel :

Tabel 2. Persentase pengubahan skor stanine

Percentage 4% 7% 12% 17% 20% 17% 12% 7% 4%

Stanine 1 2 3 4 5 6 7 8 9

d. Norma P2TKP

Pada penelitian ini, peneliti menggunakan pedoman norma yang

telah ada di P2TKP. P2TKP menggunakan angka 1-10 sebagai

pedoman dan terbagi menjadi 16 klasifikasi.

(47)

Tabel 3. Pedoman Penentuan Persentil dan Lambang angka

Lambang Angka Persentil

16 99.8 15 99 14 98 13 95 12 90 11 80 10 73 9 64 8 54 7 43 6 34 5 25 4 16 3 10 2 3 1 1

D. KERANGKA PENELITIAN

Dalam penelitian ini, peneliti ingin melihat kualitas psikometrik

dari Tes Penjurusan yang terdapat di P2TKP. Tes Penjurusan terdiri dari

tes Hubungan Ruang, tes Berpikir Abstrak, tes Kemampuan Numerik, tes

Analogi Verbal, tes Vokabuler, tes Penalaran Mekanik. Peneliti

melakukannya dengan teknik analisis reliabilitas, analisis validitas,

analisis item dan norma yang dipakai.

Analisis item adalah metode yang dipakai untuk melihat kualitas

item yang akan diteliti. Analisis item dilakukan dengan tiga cara yaitu

dengan melihat korelasi item total, taraf kesukaran item dan efektifitas

(48)

item- 

item yang membutuhkan revisi, item yang membutuhkan revisi berat dan

item yang memenuhi standar.

Analisis reliabilitas adalah metode yang digunakan untuk melihat

tingkat konsistensi suatu tes. Untuk penelitian ini menggunakan bantuan

program SPSS statistics 17.0 for windows. Setelah data yang akan

dianalisis lengkap, program dapat segera dijalankan dan akan langsung

terlihat hasilnya.

Analisis validitas adalah metode yang digunakan untuk meringkas

variabel-variabel dengan cara mencari korelasi dalam variabel tersebut

dalam bentuk seperangkat dimensi yang mendasari variabel-variabel

tersebut, yang disebut sebagai faktor (Hair, Anderson, Tattham, dan Black

,1998).

Norma dipakai untuk membandingkan kemampuan seseorang

dengan kemampuan kelompoknya. Analisis norma ini dilakukan agar

kemampuan seseorang benar-benar telah tepat posisinya dalam

kelompoknya.

E. PERTANYAAN PENELITIAN

1. Bagaimana kualitas item jika dilihat dari indeks kesukaran item dan

indeks daya diskriminasi item ?

2. Bagaimana reliabilitas Tes Bakat dan seberapa besar hasil pengukuran

reliabilitas tes ini sehingga dapat dipercaya berkaitan dengan

(49)

3. Bagaimana validitas Tes Bakat dan seberapa besar hasil

pengukurannya sehingga alat tes ini benar-benar mengukur variable

yang ditentukan ?

4. Bagaimana standar norma yang digunakan oleh P2TKP sehingga bisa

(50)

  BAB III

METODE PENELITIAN

A. JENIS PENELITIAN

Jenis penelitian ini bersifat kuantitatif deskriptif. Peneliti akan

melakukan evaluasi psikometrik yang meliputi validitas dan reliabilitas

Tes Penjurusan SMA.

B. IDENTIFIKASI VARIABEL

Variabel dalam penelitian ini adalah :

1. Performance subjek pada item

2. Performance subjek pada tes :

a. Performance subjek pada tes Hubungan Ruang

b. Performance subjek pada tes berpikir abstrak

c. Performance subjek pada tes kemampuan numerik

d. Performance subjek pada tes analogi verbal

e. Performance subjek pada tes vokabuler

f. Performance subjek pada tes penalaran mekanik

C. DEFINISI OPERASIONAL

1. Performance subjek pada item adalah performance yang didapat dari

setiap item. Performance subjek pada item setiap subtes bergerak dari

(51)

bernilai 1, jika dijawab salah maka bernilai 0. Tes penjurusan ini

memiliki enam subtes yaitu Hubungan Ruang (200 item), Berpikir

Abstrak (50 item), Kemampuan Numerik (40 item), Analogi Verbal III

A1 (50 item), Vokabuler (50 item), dan Penalaran Mekanik (68 item).

2. Performance subjek pada tes :

a. Subtes Hubungan Ruang

Performance subjek pada tes ini didapat dari menjumlahkan item

yang dijawab salah oleh subjek dan mengurangkannya dari

jumlah opsi yang benar dari setiap item dari subtes tersebut.

Kriteria item dijawab salah apabila subjek melingkari opsi yang

salah dan atau subjek tidak melingkari jawaban benar. Kriteria

dijawab benar apabila subjek melingkari jawaban benar menurut

kunci jawaban.

b. Subtes Berpikir Abstrak

Performance subjek pada tes ini didapat dari menjumlahkan item

yang dijawab benar oleh subjek.

c. Subtes Kemampuan Numerik

Performance subjek pada tes ini didapat dari menjumlahkan item

yang dijawab benar oleh subjek.

d. Subtes Analogi Verbal

Performance subjek pada tes ini didapat dari menjumlahkan item

(52)

 

e. Subtes Vokabuler

Performance subjek pada tes ini didapat dari menjumlahkan item

yang dijawab benar oleh subjek.

f. Subtes Penalaran Mekanik

Performance subjek pada tes ini didapat dari menjumlahkan item

yang dijawab benar oleh subjek.

D. POPULASI dan SAMPEL

Performance subjek pada tes yang akan digunakan dalam

penelitian ini berasal dari siswa-siswi SMA. Siswa-siswi tersebut

tersebar di Yogyakarta dan Bandar lampung yang pernah memakai jasa

P2TKP dalam Tes Penjurusan. Jumlah subjek sebanyak 204 siswa yang

terdiri dari 45 siswa laki-laki dan 159 siswa perempuan. Sekolah tersebut

adalah SMA Stella Duce I Yogyakarta, SMA Stella Duce II Yogyakarta,

SMA Fransiskus Xaverius Pringsewu, dan SMA Fransiskus Xaverius

Bandar Lampung.

E. METODE PENGUMPULAN DATA

Pengambilan data dalam penelitian ini menggunakan metode

dokumentasi. Peneliti mengambil data skor individu-individu pada

(53)

F. ANALISIS DATA

Data yang telah diperoleh tersebut akan diproses sebagai berikut :

1. Kualitas item

Analisis kualitas item ini akan dilakukan dengan korelasi item

total, taraf kesukaran item dan efektifitas distraktor. Tujuan

akhir dari analisis ini adalah melihat item yang baik dan kurang

baik dalam setiap subtes. Setiap subtes akan memiliki item

yang harus direvisi, dapat dipertahankan atau item dengan

revisi berat. Item yang dinyatakan baik dari segi korelasi item

totalnya yang memiliki nilai ≥ 0.30. Item yang dinyatakan baik

dari segi taraf kesukaran item yang memiliki nilai ≥ 0.30

sampai dengan 0.70. Kriteria distraktor yang efektif adalah

distraktor –distraktor yang dipilih secara merata oleh kelompok

bawah dan lebih banyak kelompok bawah yang memilih

distraktor –distraktor tersebut daripada kelompok atas.

2. Reliabilitas alat tes

Reliabilitas alat tes ini akan dicari menggunakan teknik

Cronbach Alpha. Analisis ini menggunakan bantuan program

SPSS statistic 17.0 for windows. Tes bakat yang baik menurut

Helmstadter (Friedenberg, 1995) memiliki reliabilitas tes

(54)

 

3. Validitas alat tes

Validitas alat tes ini akan diukur dengan menggunakan metode

analisis faktor. Jika tes ini terbukti valid adalah dengan

terdapatnya 6 faktor dari 6 subtes yang diteliti. Analisis ini

dibantu dengan program Lisrel 8.80 for windows. Peneliti

mengambil tiga kriteria nilai yang harus dapat dipenuhi agar

alat tes bisa disebut valid. Tiga criteria dan nilai yang harus

dipenuhi sebagai berikut : Standardized RMR (SRMR) ≤ 0.08,

Comparative Fit Index (CFI) ≥ 0.95 dan Root Mean Square

Error of Approximation (RMSEA) < 0.06.

4. Norma

Analisis norma Tes Penjurusan yang dipakai di P2TKP akan

direplikasi dengan acuan norma yang digunakan P2TKP yang

memiliki 16 klasifikasi. Peneliti akan membandingkan antara

norma lama dan norma yang dibuat peneliti. Tujuannya untuk

melihat apakah norma lama P2TKP masih layak dipakai dan

masih dapat mengklasifikasikan kemampuan subjek pada

(55)

BAB IV

HASIL PENELITIAN DAN PEMBAHASAN

A. ORIENTASI KANCAH

Data yang digunakan dalam penelitian ini merupakan hasil Tes

Penjurusan SMA yang berasal dari P2TKP USD. Tes Penjurusan sendiri

terdiri dari enam subtes. Subtes-subtes tersebut sebagai berikut :

Tabel 4. Daftar tes yang akan dievaluasi

No Nama Tes Jumlah Item Skor

1 Analogi Verbal III A1 (AV III A1) 50 50 2 Vokabuler III B1 (Vok III B1) 50 50 3 Kemampuan Numerik (KN) 40 40 4 Penalaran Mekanik (PM) 68 68 5 Berpikir Abstrak (BA) 50 50 6 Hubungan Ruang (HR) 200 100

Data tersebut diambil pada tahun 2010 dan terdiri dari empat

sekolah yang berbeda. Setiap sekolah menyumbang hasil tes siswa yang

dipilih secara acak agar data bervariasi. Subjek dalam penelitian ini

berjumlah 204 siswa yang terdiri dari 159 siswa perempuan dan 45 siswa

laki-laki. Total keseluruhan data yang dimiliki adalah 1224 data.

B. PERSIAPAN PENELITIAN

Pada awalnya, Peneliti memohon izin kepada pihak P2TKP USD

selaku lembaga yang akan memfasilitasi peneliti dalam penelitian ini,

(56)

 

Setelah mendapatkan izin, peneliti mulai mencari data-data yang

diperlukan secara lengkap di gudang penyimpanan data P2TKP. Peneliti

menemukan data dari berbagai sekolah yang memakai jasa lembaga

P2TKP dalam Tes Penjurusan. Kriteria data lengkap ketika seseorang

siswa mengikuti mengikuti keenam subtes secara lengkap.

C. PELAKSANAAN PENELITIAN

Pelaksaan penelitian dimulai pada bulan Oktober 2011. Pada saat

itu, Peneliti telah mendapatkan izin dari pimpinan P2TKP. Peneliti mulai

berburu data yang diperlukan dalam penelitian. Data yang diperlukan

adalah skor item dan skor total tes dari tiap subjek. Setelah mendapatkan

data, peneliti mulai memasukkan data tersebut menggunakan program

Microsoft Excel.

Proses memasukkan data tersebut memakan waktu satu bulan yaitu

mulai pertengahan bulan November sampai pertengahan bulan Desember

2010.

Pada saat analisis norma dari subtes HR, peneliti mengalami

kesulitan. Kesulitan ini bersumber dari skoring subtes HR yang bergerak

dari minus (-)100 sampai dengan plus (+) 100 dan data norma yang ada di

P2TKP nilai minus (-) 100 sampai dengan plus (+) 15 diklasifikasikan

dalam kelompok norma 1. Nilai minus didapat oleh subjek ketika subjek

mengisi jawaban tidak pada kuncinya. Setelah mencari beberapa bukti,

(57)

nilai 100 untuk menghilangkan efek hukuman. Hal ini ditujukan agar tidak

ada lagi nilai minus pada subjek dan nilai minus sangat merugikan subjek.

Hal ini dikarenakan subjek yang memiliki nilai minus (-) 2 belum tentu

tidak dapat menjawab semua soal HR dengan benar.

D. HASIL PENELITIAN dan PEMBAHASAN

1. Analogi Verbal III A1 (AV IIIA1)

a. Analisis Item

Analisis item ini ditujukan untuk melihat kualitas item.

Analisis item dilakukan dengan menghitung taraf kesukaran item

(p), daya diskriminasi item (d) dan efektifitas distraktor dari setiap

item dari setiap subtes yang diteliti.

Dalam penelitian ini telah dilakukan pemilahan item yang

dilihat dari ketiga hal dalam analisis item tersebut. Pemilahan item

dibagi menjadi tiga kategori yang berbeda yaitu :

1) Item yang dapat dipertahankan, penjelasannya sebagai berikut :

a) Taraf kesukaran item berkisar antara 0.30 – 0.70 (Gregory,

1996).

b) Korelasi item total diatas 0.30 (Azwar, 1995).

c) Memiliki efektifitas distraktor yang efektif (Friedenberg,

1995).

Distraktor adalah alternatif jawaban yang tidak

(58)

 

melihat apakah alternatif jawaban selain kunci sudah

berfungsi sebagaimana mestinya artinya

distraktor-distraktor dipilih lebih banyak (atau semua) siswa

kelompok rendah sedangkan kelompok tinggi hanya sedikit

(atau tidak ada) yang memilihnya. Distraktor-distraktor

yang efektif adalah distraktor yang secara rata dipilih oleh

subjek yang berasal dari kelompok rendah.

d) Memiliki alfa if item deleted yang tidak melebihi indeks

reliabilitas tes.

2) Item yang perlu direvisi, penjelasannya sebagai berikut :

Item yang perlu direvisi adalah item yang tidak memenuhi satu

kriteria item yang dapat dipertahankan.

3) Kategori item dengan revisi berat, penjelasannya sebagai

berikut :

a) Taraf kesukaran item dibawah 0.30 atau diatas 0.70.

b) Korelasi item total dibawah 0.30.

c) Memiliki efektifitas distraktor yang tidak efektif

Kriterianya adalah distraktor-distraktor dipilih lebih

banyak (atau semua) siswa kelompok tinggi sedangkan

kelompok rendah hanya sedikit (atau tidak ada) yang

memilihnya. Distraktor-distraktor yang tidak efektif adalah

distraktor yang tidak rata dipilih oleh subjek yang berasal

(59)

d) Memiliki alfa if item deleted melebihi indeks reliabilitas

tes.

Dengan demikian, peneliti dapat menguraikan analisis item

Analogi Verbal yang telah dilakukan di dalam tabel sebagai berikut :

Tabel 5. Klasifikasi item-item pada subtes Analogi Verbal

No Klasifikasi Nomor Item Total

1 Item yang dapat

Dari 19 item yang perlu direvisi maka item-item itu terbagi dalam

beberapa klasifikasi yang perlu direvisi dan dijabarkan sebagai berikut :

Tabel 6. Klasifikasi item-item yang perlu direvisi

No Klasifikasi Nomor item Total

1 (p) 12, 13, 17, 29, 38, 43. 6

(60)

  b. Reliabilitas

Program SPSS 17 for windows digunakan dalam perhitungan

reliabilitas subtes Analogi Verbal ini. Koefisien reliabilitas

awalnya adalah 0.902 dengan jumlah soal sebanyak 50 item.

Kemudian setelah melewati dua kali proses seleksi dan membuang

7 item yang tergolong dalam klasifikasi gugur, maka koefisiennya

naik menjadi 0.912 dengan soal sebanyak 43 item. Helmstadter

(Friedenberg, 1995) menyatakan bahwa kofisien reliabilitas subtes

analogi verbal yaitu 0.912 termasuk dalam kategori sangat

terpercaya dalam mengukur kemampuan berpikir verbal,

khususnya dalam memahami relasi-relasi antara

pengertian-pengertian yang dinyatakan secara verbal.

c. Validitas

Analisis validitas dilakukan menggunakan analisis faktor

confirmatory dengan melakukan perbandingan antara model

penelitian dengan data yang dimiliki. Model penelitian yang

digunakan oleh peneliti adalah item-item yang terdapat dalam

subtes Analogi Verbal yang dapat mengungkap kemampuan

berpikir verbal, khususnya dalam memahami relasi-relasi antara

pengertian-pengertian yang dinyatakan secara verbal.

Analisis dimulai dengan uji asumsi untuk mengetahui normalitas

data. Hasil uji normalitas menunjukkan bahwa semua variabel

(61)

asymptotic covariance matrix untuk mengatasi ketidaknormalan

data. Analisis faktor confirmatory menghasilkan nilai fit indeks

sebagai berikut:

Tabel 7. Hasil Fit Indeks

No Fit Indeks Subtes AV

1 Chi-Square X

2= 1289.48 (p < 0,05)

2 Standardized RMR (SRMR) 0.059

3 CFI (Comparative Fit Index) 0.98

4 Root Mean Square Error of

Approximation (RMSEA) 0.022

Pada subtes Analogi verbal, nilai χ2 yang didapat menunjukan

bahwa ada perbedaan yang signifikan antara model penelitian dan

skor hasil tes. Namun, χ2 sangat peka dengan jumlah subjek.

Apabila jumlah subjek banyak, maka χ2 akan menyatakan bahwa

ada perbedaan yang signifikan walaupun sebenarnya perbedaannya

sangat kecil (Hu & Bentler, 1998). Oleh karena itu diperlukan nilai

fit indeks yang lainnya seperti Standardized RMR (SRMR),

Comparative Fit Index (CFI) dan Root Mean Square Error of

Approximation (RMSEA).

Nilai ideal SRMR adalah sama dengan atau lebih rendah dari 0.08

sedangkan RMSEA adalah kurang dari 0,06 dan nilai ideal CFI

adalah ama dengan atau lebih tinggi dari 0.95 (Hu & Bentler,

1999). Suatu data (skor hasil tes) dikatakan sesuai dengan model

(62)

 

validitas subtes Analogi Verbal seperti dapat dilihat pada tabel

diatas menghasilkan fit indeks yang memuaskan. Fit indeks

memuaskan karena ketiganya dapat memenuhi nilai ideal.

Sehingga peneliti dapat memiliki bukti validitas bahwa subtes

Analogi Verbal ini memang dapat mengungkap kemampuan

berpikir verbal, khususnya dalam memahami relasi-relasi antara

pengertian-pengertian yang dinyatakan secara verbal.

d. Norma

Tabel 8. Perbandingan Norma baru dan norma P2TKP

Kelompok Norma

Dalam subtes Analogi Verbal ini, berdasarkan tabel perbandingan

Gambar

Tabel 23. Hasil Fit Indeks  ..............................................................................
Tabel 1. Kriteria Evaluasi Indeks Diskriminasi
Tabel 2. Persentase pengubahan skor stanine
Tabel 3. Pedoman Penentuan Persentil dan Lambang angka
+7

Referensi

Dokumen terkait