• Tidak ada hasil yang ditemukan

KOMPARASI KETEPATAN ESTIMASI KOEFISIEN RELIABILITAS TEORI SKOR MURNI KLASIK. TESIS untuk memenuhi sebagian persyaratan mencapai derajat magister

N/A
N/A
Protected

Academic year: 2021

Membagikan "KOMPARASI KETEPATAN ESTIMASI KOEFISIEN RELIABILITAS TEORI SKOR MURNI KLASIK. TESIS untuk memenuhi sebagian persyaratan mencapai derajat magister"

Copied!
228
0
0

Teks penuh

(1)

1

KOMPARASI KETEPATAN ESTIMASI KOEFISIEN RELIABILITAS TEORI SKOR MURNI KLASIK

TESIS

untuk memenuhi sebagian persyaratan mencapai derajat magister

Program Studi Psikologi Minat Utama Psikometri Kelompok Bidang Ilmu-Ilmu Sosial

Diajukan Oleh :

Wahyu Widhiarso (21766/IV-2/1046/04)

Kepada

PROGRAM MAGISTER PSIKOLOGI FAKULTAS PSIKOLOGI UNIVERSITAS GADJAH MADA

YOGYAKARTA 2008

(2)

KOMP ARASI KETEPATAN ESTIMASI KOEFISIEN RELIABILIT AS TEORI SKOR MURNI KLASIK

Dipersiapkan dan disusun oleh

Wahyu Widhiarso

telah dipertahankan di depan Dewan Penguji Pada tanggal 04 Juli 2008

Susunan Dewan Penguji

Pembimbing

Prof. Djemari Mardapi, Ph.D

Anggota Dewan Penguji

Prof. Masrun, Ph.D

Prof. Dr. Asmadi Alsa

Tesis ini telah diterima sebagai salah satu persyaratan untuk memperoleh gelar Magister

Tanggal.

??~'

r. Faturochman

'-~,...

(3)

Yang bertanda tangan di bawah ini, Saya, Wahyu Widhiarso dengan disaksikan oleh tim penguji tesis, dengan ini menyatakan bahwa tesis ini adalah karya sendiri dan belum pernah diajukan untuk memperoleh derajat kesarjanaan di suatu perguruan tinggi manapun. Dan sepanjang pengetahuan saya tidak terdapat karya atau pendapat yang pernah ditulis/diterbitkan oleh orang lain, kecuali yang secara tel1ulis diacu dalam naskah ini dan disebutkan dalam daftar pustaka. Jika terdapat hal-hal yang tidak sesuai dengan isi pernyataan ini, maka saya bersedia derajat kesarjanaan saya dicabut.

Y ogyakarta, 04 Agustus 2008 Yang menyatakan,

(4)

ii

Kado Sederhana

(5)

iii

KATA PENGANTAR

Puji syukur kehadirat Alloh SWT yang memberikan tenaga dan kesempatan untuk menyelesaikan penelitian ini. Hanya dengan kuasanya penelitian ini dapat dijalankan dan hanya dengan izinnya penelitian ini dapat terselesaikan oleh penulis.

Pengambilan tema ini berawal dari kegelisahan penulis mengenai prosedur evaluasi reliabilitas hasil pengukuran dalam bidang psikologi. Penulis banyak menjumpai banyak kasus peneliti menggunakan satu koefisien reliabilitas secara tiba-tiba tanpa memperhatikan asumsi yang harus dipenuhi untuk menggunakan koefisien reliabilitas tersebut. Peneliti kemudian lantas bertanya apa yang terjadi ketika sebuah asumsi dilanggar dalam penggunaan koefisien reliabilitas dan seberapa jauh bias estimasi yang terjadi.

Sebagai staf pengajar dalam bidang psikometri, peneliti banyak mendapatkan pertanyaan dari para mahasiswa mengenai koefisien reliabilitas mana yang perlu dipakai dari sekian banyak koefisien reliabilitas yang dikembangkan oleh para ahli. Meskipun telah memberikan jawaban yang telah memuaskan keingintahuan mahasiswa, dalam hati peneliti masih terpendam pertanyaan koefisien mana yang memiliki ‘kesaktian’ untuk mengestimasi skor murni yang tidak diketahui secara nyata dan sesatan yang bersifat acak dan independen.

Peneliti lantas bersyukur karena kegelisahan tersebut akhirnya memudar dengan terselesaikannya penelitian ini sehingga pertanyaan yang berkecamuk telah terjawab. Peneliti mengucapkan terima kasih kepada beberapa pihak baik yang telah membantu pelaksanaan penelitian maupun yang memompa semangat untuk menyelesaikan penelitian ini.

Ucapan terima kasih penulis sampaikan kepada Dekan Fakultas Psikologi Universitas Gadjah Mada, Prof. Dr. M. Noor Rochman Hadjam, SU dan Koordinator

(6)

iv

Pengelola Program Studi Magister Psikologi Fakultas Psikologi Universitas Gadjah Mada, Prof. Dr. Faturochman, MA yang telah memberikan kesempatan, fasilitas dan perizinan kepada penulis untuk menyelesaikan penelitian ini.

Penulis merasa bangga dan mengucapkan rasa terima kasih karena mendapat kesempatan untuk menjadi bimbingan pelaksanaan penelitian bersama Prof. Dr. Djemari Mardapi, M.Pd. yang sabar dalam membimbing penulis menyelesaikan penelitian ini. Penulis juga mengucapkan terima kasih kepada Prof. Dr. Masrun, MA dan Prof. Dr. Asmadi Alsa, SU yang memberikan masukan penting demi kesempurnaan hasil penelitian.

Terima kasih penulis ucapkan kepada Prof. Tenko Raykov yang masukan yang sangat berharga pada awal-awal masa penulisan proposal penelitian ini, kepada Prof. Leonard Feldt yang mengirimkan artikel-artikel ilmiah yang sangat penting dalam penulisan dasar teori, kepada Prof. Yurdugul yang membantu kemudahan penulisan syntax Program LISREL yang cukup rumit, dan kepada Prof. Rolf Steyer yang memberikan masukan kepada peneliti mengenai peluang penelitian lanjutan pada tema ini.

Ucapan terima kasih penulis ucapkan kepada dosen-dosen Fakultas Psikologi Universitas Gadjah Mada yang memberikan masukan maupun dukungan kepada penulis melalui diskusi yang mencerahkan serta dukungan moral yang menyemangatkan seperti Dr. Kwartarini W.Y M.Med.Sc., Drs. Fauzan H.S, M.Si, Drs. Nida Ul Hasanat, M.Si., Haryanta, S.Psi, Psi, Yuli Fajar, M.Si, Psi., Ridwan Saptoto, S.Psi, Psi. Semoga karya kecil ini bermanfaat.

Yogyakarta, 6 Juni 2008

Wahyu Widhiarso

(7)

v

DAFTAR ISI

HALAMAN PENGESAHAN... i

KATA PENGANTAR... iii

DAFTAR ISI... v

DAFTAR TABEL ... viii

DAFTAR GAMBAR... x

ABSTRAK ... xii

ABSTRACT... xiii

BAB I ... 1

A. LATAR BELAKANG MASALAH ... 1

B. KEASLIAN PENELITIAN... 7

C. PERUMUSAN MASALAH... 10

D. TUJUAN PENELITIAN ... 11

E. MANFAAT PENELITIAN ... 12

BAB II ... 13

A. RELIABILITAS DAN VALIDITAS ... 13

1. Reliabilitas ... 13

2. Validitas Pengukuran... 17

B. TEORI SKOR MURNI KLASIK... 18

a. Skor Tampak ... 19

b. Skor Murni ... 20

c. Sesatan Pengukuran... 22

1. Pendekatan Estimasi Reliabilitas Teori Skor Murni Klasik ... 24

a. Pendekatan Tes Ulang ... 24

b. Pendekatan Tes Paralel ... 26

b. Pendekatan Konsistensi Internal... 27

2. Koefisien Estimasi Reliabilitas... 30

a. Koefisien Lambda Guttman ... 30

b. Koefisien Alpha Cronbach... 32

c. Koefisien Alpha Terstratifikasi ... 39

d. Koefisien Reliabilitas Komposit Mosier... 40

e. Koefisien Reliabilitas Komposit Wang... 41

f. Koefisien Feldt... 42

(8)

vi

h. Koefisien Theta Armor ... 47

i. Koefisien Omega McDonald ... 48

j. Koefisien Omega Heise-Bohrnstedt... 50

k. Koefisien Reliabilitas Maksimal ... 54

n. Koefisien Reliabilitas Konstrak ... 56

3. Koefisien Reliabilitas dan Model Pengukuran ... 58

D. MODEL PENGUKURAN ... 66

1. Model Tes Paralel ... 67

2. Model Tes Kesetaraan Esensi Nilai Tau (Essentially Tau-Equivalent)... 69

3. Model Tes Konjenerik ... 72

4. Model Keterkaitan Antar Sesatan ... 74

E. MODEL PERSAMAAN STRUKTURAL (SEM) ... 78

1. Komponen Model Persamaan Struktural... 80

a. Konstrak Model... 81

b. Parameter Estimasi Model ... 82

c. Sub Model Sesatan (error model) ... 83

2. Model Pengukuran dalam Model Persamaan Struktural ... 84

3. Uji Ketepatan Model Persamaan Struktural ... 85

F. LANDASAN TEORI PENYUSUNAN HIPOTESIS... 89

1. Perbandingan Ketepatan Estimasi Antar Koefisien Reliabilitas ... 89

2. Perbandingan Ketepatan Model Antar Model Teori Skor Murni Klasik ... 90

2. Perbandingan Ketepatan Model Antar Dimensi Pengukuran... 92

G. HIPOTESIS PENELITIAN... 93

BAB III... 95

A. Identifikasi Variabel Penelitian... 95

B. Operasionalisasi Variabel Penelitian... 96

C. Desain Penelitian... 97 1. Skenario Pertama... 97 2. Skenario Kedua ... 98 D. Data Penelitian ... 99 1. Data Simulasi... 99 2. Data Empirik ... 102 E. Instrumen Penelitian ... 102

F. Validitas dan Reliabilitas... 102

G. Teknik Analisis Data ... 103

BAB IV ... 106

A. Penyusunan Data Simulasi ... 106

(9)

vii

C. Estimasi Reliabilitas Murni ... 111

D. Hasil Estimasi Koefisien Reliabilitas... 114

1. Model Tes Paralel... 115

2. Model Kesetaraan Nilai Tau... 120

3. Model Tes Konjenerik... 123

4. Model Korelasi Antar Sesatan... 126

5. Model Multidimensi ... 129

E. Uji Statistik Perbandingan Ketepatan Estimasi Reliabilitas... 134

1. Uji Analisis Varian Faktorial Antar Koefisien Reliabilitas... 134

2. Uji Post-Hoc Antar Koefisien Reliabilitas ... 137

3. Rangkuman Hasil Uji Perbandingan Ketepatan Estimasi ... 142

F. Uji Statistik Perbandingan Ketepatan Model Teori Skor Murni Klasik... 144

1. Data Simulasi... 146

2. Data Empirik ... 148

3. Rangkuman Hasil Uji Statistik Perbandingan Ketepatan Model ... 150

G. Uji Statistik Perbandingan Ketepatan Model Dimensi Pengukuran ... 150

1. Data Simulasi... 151

2. Data Empirik ... 152

3. Rangkuman Hasil Uji Statistik Perbandingan Ketepatan Model ... 153

H. Koefisien Alpha Dan Multidimensionalitas Data ... 153

I. Pembahasan ... 156

1. Perbandingan Ketepatan Estimasi Reliabilitas... 156

2. Perbandingan Ketepatan Model Antar Model Teori Skor Murni Klasik. ... 160

3. Perbandingan Ketepatan Model Unidimensi dan Multidimensi ... 163

4. Keterbatasan Penelitian ... 164

BAB V... 166

A. KESIMPULAN ... 166

B. SARAN ... 168

(10)

viii

DAFTAR TABEL

Tabel 2.1 Perbandingan Koefisien Reliabilitas Berdasarkan Model Pengukuran

yang Dapat Diaplikasikan... 59

Tabel 2.2 Perbandingan Antar Koefisien Reliabilitas ... 60

Tabel 2.3. Properti Psikometris Model Tes Paralel... 68

Tabel 2.4. Properti Psikometris Model Tes Kesetaraan Nilai Tau ... 70

Tabel 2.5. Properti Psikometris Model Congeric ... 72

Tabel 2.6. Struktur di dalam Model yang disusun... 83

Tabel 2.7. Indeks Ketepatan dan Rentang Diterimanya Sebuah Model... 86

Tabel 2.8. Model Pengukuran yang Dianalisis... 89

Tabel 3.1 Contoh Pengkondisian Berdasarkan Model Pengukuran ... 101

Tabel 4.1 Statistik Deskripsi Data Model Paralel, Kesetaraan Nilai Tau dan Konjenerik ... 108

Tabel 4.2 Statistik Deskripsi Data Model Korelasi Antar Sesatan... 108

Tabel 4.3 Matriks Korelasi Antar Skor Data Model Paralel ... 109

Tabel 4.4 Matriks Korelasi Antar Skor Data Model Kesetaraan Nilai Tau ... 109

Tabel 4.5 Matriks Korelasi Antar Skor Data Model Konjenerik ... 110

Tabel 4.6 Matriks Korelasi Antar Skor Data Model Korelasi Antar Sesatan... 110

Tabel 4.7 Contoh Data Simulasi... 111

Tabel 4.8 Prosedur Analisis Tiap Koefisien Reliabilitas... 112

Tabel 4.9 Perbandingan Estimasi Data Model Paralel ... 116

Tabel 4.10 Perbandingan Estimasi Data Model Kesetaraan Nilai Tau ... 116

Tabel 4.11 Perbandingan Estimasi Data Model Model Konjenerik... 117

Tabel 4.12 Perbandingan Estimasi Data Model Korelasi Antar Sesatan ... 117

Tabel 4.13 Perbandingan Ketepatan Estimasi (Model Paralel)... 118

Tabel 4.14 Perbandingan Ketepatan Estimasi (Model Tau Equivalent) ... 121

Tabel 4.15 Perbandingan Ketepatan Estimasi (Model Konjenerik) ... 124

Tabel 4.16 Perbandingan Ketepatan Estimasi (Model Korelasi Antar Sesatan) 127 Tabel 4.17 Perbandingan Estimasi Data Model Multidimensional (a) ... 130

Tabel 4.18 Perbandingan Estimasi Data Model Multidimensional (b) ... 131

Tabel 4.19 Perbandingan Estimasi Data Model Multidimensional (c) ... 131

Tabel 4.20 Perbandingan Estimasi Data Model Multidimensional (d) ... 131

Tabel 4.22 Deskripsi Perbandingan Ketepatan Estimasi (Model Multidimensi)132 Tabel 4.23. Hasil Uji Anava Faktorial Perbandingan Ketepatan Estimasi Antar Koefisien Reliabilitas ... 134

(11)

ix

Tabel 4.24 Pengelompokan Koefisien Reliabilitas Berdasarkan Kesetaraan Bias

Estimasi dari Hasil Uji Tukey pada Model Tes Paralel ... 138

Tabel 4.25 Pengelompokan Koefisien Reliabilitas Berdasarkan Kesetaraan Ketepatan Estimasi Model Tes Kesetaraan Nilai Tau... 139

Tabel 4.26 Pengelompokan Koefisien Reliabilitas Berdasarkan Kesetaraan Ketepatan Estimasi Model Tes Konjenerik... 140

Tabel 4.27 Pengelompokan Koefisien Reliabilitas Berdasarkan Kesetaraan Ketepatan Estimasi Korelasi Antar Sesatan ... 141

Tabel 4.28 Pengelompokan Koefisien Reliabilitas Berdasarkan Kesetaraan Ketepatan Estimasi Model Multidimensional ... 142

Tabel 4.30. Perbandingan Nilai Ketepatan Model antar Model Pengukuran... 147

Tabel 4.31. Hasil Uji Statistik Perbandingan Antar Model Pengukuran... 147

Tabel 4.32. Perbandingan Nilai Ketepatan Model Data CSEI ... 149

Tabel 4.33. Hasil Uji Statistik Perbandingan Antar Model Pengukuran CSEI ... 149

Tabel 4.36. Perbandingan Ketepatan Model Dimensi Pengukuran (Data Simulasi)151 Tabel 4.37. Perbandingan Ketepatan Model Dimensi Pengukuran (Data CSEI) 153 Tabel 4.39. Hasil Uji Statistik Perbandingan Antar Model Pengukuran... 154

(12)

x

DAFTAR GAMBAR

Gambar 2.1. Model Pendekatan Tes Ulang... 26

Gambar 2. Model Pendekatan Tes Paralel ... 26

Gambar 2.5. Penjabaran Koefisien Alpha Cronbach ... 34

Gambar 2.4. Penjabaran Rumus Angof-Feldt ... 42

Gambar 2.6. Hubungan Antara Skor Murni dan Skor Komposit... 51

Gambar 2.7. Hasil Estimasi Reliabilitas Model Pengukuran Paralel Satu Faktor .. 69

Gambar 2.8. Hasil Estimasi Reliabilitas Model Tau Equivalent Satu Faktor ... 71

Gambar 2.9. Hasil Estimasi Reliabilitas Model Pengukuran konjenerik Satu Faktor74 Gambar 2.10. Model Pengukuran dengan Hubungan antar Sesatan ... 76

Gambar 2.11. Diagram Persamaan Model Struktural ... 81

Gambar 2.12. Model Analisis Faktor Konfirmatori Tes Paralel ... 87

Gambar 2.13. Model Analisis Faktor Konfirmatori Tes kesetaraan esensi nilai tau. 87 Gambar 2.14. Model Analisis Faktor Konfirmatori Tes Konjenerik ... 88

Gambar 2.15. Model Analisis Faktor Konfirmatori Hubungan antar Sesatan ... 88

Gambar 4.1 Prosedur Penyusunan Data Simulasi pada Model Unidimensi ... 113

Gambar 4.2 Model Unidimensi Data Simulasi ... 113

Gambar 4.3 Prosedur Penyusunan Data Simulasi pada Model Multidimensi ... 114

Gambar 4.4 Model Multidimensi Data Simulasi... 114

Gambar 4.5 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Paralel Pada Semua Ukuran Sampel ... 118

Gambar 4.6 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Paralel Berdasarkan Ukuran Sampel ... 119

Gambar 4.7 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Kesetaraan Nilai Tau Pada Semua Ukuran Sampel ... 122

Gambar 4.8 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Kesetaraan Nilai Tau Pada Berdasarkan Ukuran Sampel ... 122

Gambar 4.9 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Konjenerik Pada Semua Ukuran Sampel ... 125

Gambar 4.10 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Konjenerik Berdasarkan Ukuran Sampel ... 125

Gambar 4.11 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Korelasi Antar Sesatan Pada Semua Ukuran Sampel... 128

Gambar 4.12 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Korelasi Antar Sesatan Pada Semua Ukuran Sampel Berdasarkan Ukuran Sampel ... 128

Gambar 4.13 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Multidimensi Pada Semua Ukuran Sampel Berdasarkan Ukuran Sampel ... 133

(13)

xi

Gambar 4.14 Perbandingan Bias Estimasi Antar Koefisien Reliabilitas Model Multidimensi Pada Semua Ukuran Sampel Berdasarkan Ukuran

Sampel ... 133 Gambar 4.16. Hasil Analisis Faktor Konfirmatori Perbandingan Antar Model

Pengukuran pada Data Simulasi... 148 Gambar 4.17. Hasil Analisis Faktor Konfirmatori Perbandingan Antar Model

Pengukuran pada Data Simulasi... 148 Gambar 4.18. Hasil Analisis Faktor Konfirmatori Perbandingan Antar Model

Dimensi dan Multidimensi pada Data Simulasi ... 152 Gambar 4.19 Perbandingan Estimasi Koefisien Alpha pada Jumlah Butir dan

(14)

xii

KOMPARASI KETEPATAN ESTIMASI

KOEFISIEN RELIABILITAS TEORI SKOR MURNI KLASIK

Oleh : Wahyu Widhiarso ABSTRAK

Penelitian ini bertujuan untuk membandingkan ketepatan estimasi koefisien reliabilitas serta membandingkan ketepatan model pengukuan dalam Teori Skor Murni Klasik. Penelitian ini terdiri dari dua tahap pelaksanaan, antara lain pada tahap pertama 18 koefisien reliabilitas dibandingkan ketepatannya untuk mengestimasi reliabilitas murni yang ditetapkan melalui data simulasi. Data simulasi disusun berdasarkan kondisi yang ditetapkan, yaitu skor murni dan sesatan terdistribusi distribusi normal, data sesatan bersifat acak, korelasi antar sesatan dan korelasi antara sesatan dan skor murni mendekati nol. Besarnya reliabilitas murni, jumlah butir, ukuran sampel dan model pengukuran di dalam data dikombinasikan. Tahap kedua penelitian diarahkan pada uji perbandingkan ketepatan model yang dilakukan dengan analisis faktor konfirmatori terhadap empat model pengukuran, yaitu model paralel, kesetaraan nilai tau, konjenerik dan korelasi antar sesatan. Uji perbandingan ketepatan juga dilakukan terhadap model unidimensi dan multidimensi. Data yang digunakan pada tahap kedua adalah hasil pengukuran melalui Skala Harga Diri adaptasi dari Coopersmith Self

Esteem Inventori (CSEI) yang dikenakan kepada 2183 subjek. Temuan

dari penelitian ini yaitu pada kasus data terdistribusi normal, didapatkan: a) perbedaan ketepatan estimasi antar koefisien reliabilitas, b) model kesetaraan nilai tau dan model konjenerik memiliki nilai ketepatan model lebih tinggi dibanding dengan model paralel den model kesetaraan nilai tau, c) model multidimensi memiliki nilai ketepatan yang lebih tinggi dibanding dengen model unidimensi.

(15)

xiii

THE COMPARISON OF RELIABILITY COEFFICIENTS ESTIMATION AMONG PSYCHOMETRICS CLASSICAL THEORY

Oleh : Wahyu Widhiarso ABSTRACT

The aim of this research is to examine estimation precisely among reliability coefficients and goodness of fit of models in classical theory. There are two scenarios in this research. First, comparing reliability estimation through 18 estimators on simulation data. Simulation data is generated by author that contain various combination along with true reliability value, sample sizes and measurement models also normal distribution data condition. The second scenario is comparing goodness fit of test four measurement models in classical theory (e.g parallel, tau equivalent, congeneric and error correlated) on simulation data and real data. The real data was collected on 2183 participant with Coopersmith Self Esteem Inventori (CSEI) that adapted on Indonesian version. This research found that, a) there are significance estimation difference emong reliability estimation among estimator in classical theory, b) goodness of fit of congeneric and error correlated model is higher than parallel and essentially tau equivalent model, c) goodness of fit of multidimensional model is higher than unidimensional model.

Key word : Reliability, Reliability Estimation Precision, Goodness of Fit Model

(16)

BAB I

PENGANTAR

A. LATAR BELAKANG MASALAH

Masalah pengukuran memegang peranan penting dalam pengembangan psikologi. Tepat tidaknya gambaran mengenai manusia tergantung dari kualitas pengukuran. Salah satu konsep yang berkaitan dengan kualitas pengukuran adalah konsep reliabilitas yang menjadi salah satu pilar dalam menentukan kualitas pengukuran. Dengan mengetahui reliabilitas pengukuran maka peneliti akan mengetahui sejauh mana hasil pengukurannya dapat dipercaya untuk menggambarkan atribut ukur. Dengan mengetahui reliabilitas hasil pengukuran peneliti mengetahui sejauh mana hasil pengukurannya terbebas dari kontaminasi sesatan. Estimasi terhadap reliabilitas hasil pengukuran diharapkan memiliki ketepatan yang memuaskan karena reliabilitas membatasi pemaknaan terhadap effect size hubungan antar variabel yang diteliti. Meskipun effect size hubungan antar variabel cukup tinggi namun hasil tersebut disangsikan apabila hasil pengukuran menghasilkan reliabilitas yang kurang memuaskan. Di sisi lain, Kegagalan dalam hasil pengukuran yang memuaskan juga menyebabkan keputusan hasil penelitian sulit untuk diverifikasi oleh peneliti lain.

Reliabilitas menentukan kekuatan hubungan variabel-variabel, karena adanya bias dalam mengestimasi reliabilitas menyebabkan hubungan antar dua skor murni kedua variabel menjadi rendah. Sebagai contoh, jika reliabilitas dua variabel penelitian kurang memuaskan maka hubungan kedua skor murni kedua variabel tersebut menjadi rendah. Hal ini terlihat dari hasil penghitungan koreksi terhadap efek atenuasi akan

(17)

menjadi kecil. Isu koreksi terhadap efek atenuasi korelasi antar skor komposit yang disebabkan oleh pengukuran yang kurang reliabel adalah salah satu tema kajian dalam konteks psikometri. Dasar dari teknik koreksi ini adalah korelasi antara variabel X dan Y perlu dikoreksi karena kedua variabel didapatkan dari pengukuran yang diasumsikan mengandung sesatan pengukuran yang bersifat acak. Crocker dan Algina (1986) menjelaskan bahwa adanya sesatan pengukuran dapat menyebabkan penarikan kesimpulan yang menyimpang mengenai hubungan dua variabel.

Kajian mengenai reliabilitas diperlukan pada semua penelitian yang menggunakan pengukuran. Oleh karena itu pemahaman mengenai teori reliabilitas penting bagi para peneliti agar peneliti terbebas dari analisis properti kualitas pengukuran yang tidak tepat dalam penelitian (Hopkins, 2000). Setiap penelitian yang menggunakan pengukuran psikologis diharapkan mengkaji reliabilitas dan validitas pengukuran yang dipakai untuk mendapatkan data tersebut dengan tepat. Meskipun penelitian tersebut tidak berfokus pada kajian psikometri yang membedah properti psikometris instrumen ukur namun properti psikometris instrumen yang digunakan perlu diestimasi sesuai kaidah psikometri dan dilaporkan dalam penulisan laporan (Thompson, 1994).

Wacana mengenai reliabilitas masih menjadi kajian yang hangat di kalangan peneliti karena masih ada beberapa permasalahan yang perlu diatasi. Permasalahan pertama yang muncul adalah minimnya konsensus terhadap penerapan teori tes pada tataran yang lebih praktis (Slaney, 2006). Saat ini belum ada frame kerja yang logis (logical framework) bagaimana memilih teknik yang tepat dalam mengevaluasi hasil pengukuran. Kajian psikometris yang ada, masih belum diimbangi dengan implikasi yang aplikatif dalam penerapannya membedah properti psikometris sebuah tes.

(18)

Ungkapan senada juga dilontarkan oleh Krippendorff (2004) yang mengatakan bahwa belum ada konsensus mengenai koefisien reliabilitas antar dari peneliti. Berbeda dengan masalah metodologi penelitian yang relatif sudah jelas, penggunaan koefisien dalam mengestimasi reliabilitas antar satu peneliti dengan peneliti lain masih berbeda. Banyak formula ditawarkan untuk mengestimasi reliabilitas, namun konsensus belum juga tercapai. Bahkan ada formula yang ditawarkan akan tetapi tujuan utamanya mulai bergeser kepada kemudahan dalam pengoperasiannya dibanding dengan keakuratannya sehingga Weiss dan Davison (1981) mengatakan bahwa teori skor murni klasik telah kehilangan tujuannya dalam mengkaji reliabilitas.

Minimnya konsensus para ahli tersebut menunjukkan bahwa estimasi reliabilitas masih mengandung ketidakjelasan. Fairchild (inpress) melihat bahwa ketidakjelasan mengenai konsep reliabilitas menyebabkan reliabilitas yang merupakan salah satu konsep dalam pengukuran masih belum memberikan penetrasi yang efektif dalam penelitian. Konsep reliabilitas masih belum dikenali dengan baik di luar literatur yang membahas masalah pengukuran. Hal ini diperparah dengan peneliti yang dinilai cukup kompeten masih banyak yang kurang tepat dalam melaporkan reliabilitas hasil pengukuran mereka (Thompson, 1994).

Permasalahan kedua yang muncul adalah penggunaan koefisien reliabilitas oleh peneliti secara monoton tanpa mempertimbangkan asumsi yang mendasari koefisien tersebut. Ferketich (1990) mengatakan bahwa seharusnya kajian dan pengujian reliabilitas tidak hanya terpaku pada satu koefisien saja melainkan juga melibatkan koefisien lain yang kemungkinan menggambarkan hasil yang lebih optimal. Socan (2000) mengatakan bahwa banyak di antara para peneliti yang hanya terpaku pada penggunaan koefisien Alpha Cronbach dalam mengestimasi reliabilitas. Banyak juga

(19)

diantara para peneliti yang tidak menyadari bahwa koefisien alpha menghendaki asumsi tertentu yang tidak mudah untuk dipenuhi. Jika asumsi ini tidak dipenuhi maka koefisien reliabilitas yang dihasilkan adalah nilai di batas estimasi terendah (underestimate).

Pemilihan formula estimasi reliabilitas secara monoton tersebut dapat diakibatkan oleh dua sebab, pertama minimnya pemahaman peneliti mengenai koefisien reliabilitas yang dapat menjadi alternatif, kedua, minimnya keberadaan program komputasi (program package) yang dapat mengelaborasi model pengukuran yang mereka susun dengan mudah. Feldt et.al (1987) mengatakan bahwa popularitas Koefiesien Alpha lahir karena beberapa faktor, yaitu: 1) teknik komputasinya relatif mudah, karena hanya memerlukan informasi berupa varian butir dan varian skor total, 2) distribusi sampling sudah diketahui sehingga penentuan interval kepercayaan pada populasi sangat dimungkinkan.

Koefisien alpha juga banyak dipakai pada banyak literatur karena merupakan estimator yang moderat dalam mengestimasi reliabilitas. Peneliti beralasan keputusan yang diambil berkaitan dengan penelitian tidak menimbulkan resiko yang besar sehingga adanya bias estimasi reliabilitas dapat dimaklumi dan ditambah lagi dengan alasan bahwa hasil estimasi yang dipilih adalah estimasi batas terendah (lower bound

estimatior). Kondisi tersebut menjadi bermasalah karena banyak peneliti yang tidak

menyadari bahwa reliabilitas yang di bawah estimasi akan menyebabkan koreksi atenuasi terhadap hubungan dua skor murni menjadi terlalu besar (overestimated) (Lord dan Novick, 1974).

Permasalahan ketiga adalah berkaitan dengan asumsi yang menjadi syarat dalam mengestimasi reliabilitas. Pada tataran praktis selain persyaratan adanya sifat paralel,

(20)

persyaratan tau-equivalent merupakan tantangan yang cukup berat bagi peneliti dalam menyusun instrumen pengukuran. Keterangan ini didukung oleh Kamata et.al (2003) yang mengatakan Asumsi kesetaraan daya diskriminasi antar tiap komponen tes dan unidimensionalitas pengukuran merupakan hal relatif sulit dicapai. Jika asumsi

essentially tau-equivalent tidak dapat dipenuhi maka Koefisien Alpha menghasilkan

nilai reliabilitas yang sangat kecil, sehingga Koefisien Alpha di bawah estimasi (underestimated).

Tidak hanya asumsi model pengukuran saja yang kemudian menjadi keberatan bagi peneliti. Asumsi independensi sesatan pengukuran (uncorrelated error) juga ditanyakan kembali keabsahannya oleh peneliti. Lee dan Song (2001) menemukan bahwa dari kombinasi beberapa model yang disusunnya, ditemukan bahwa model yang mengasumsikan independensi sesatan pengukuran memiliki ketepatan model yang lemah (worse model fit) dibanding dengan model keterkaitan antar sesatan pengukuran. Kano (2002) menjelaskan bahwa dalam banyak kasus, peneliti banyak menemukan adanya faktor unik (unique factor) dari pengukuran yang dilakukan. Peneliti kemudian menyimpulkan adanya masalah multidimensi, sehingga mereka melakukan memecah komponen ukur menjadi dimensi-dimensi baru atau sub skala. Permasalahan baru yang muncul adalah pemecahan menjadi dimensi-dimensi ukur tersebut kemudian menjadi tetap menyisahkan adanya faktor unik yang masih tidak dapat dijelaskan oleh dimensi yang terbentuk. Pada konteks inilah kemudian muncul perspektif baru untuk melihat adanya potensi adanya sesatan pengukuran yang memiliki keterkaitan (correlated error) sehingga asumsi teori skor murni klasik tidak banyak berlaku.

Permasalahan keempat dalam wacana pengukuran adalah masalah unidimensionalitas pengukuran. Unidimensionalitas adalah konsep penting dalam

(21)

mengestimasi reliabilitas murni (true reliability). Formula reliabilitas yang dikenakan pada pengukuran yang multidimensi akan menghasilkan bias estimasi yang akan menjadi masalah yang serius dalam sebuah penelitian (Osburn, 2000). Dalam menyusun sebuah instrumen pengukuran penyusun tes biasanya memecah domain konstrak yang hendak diukur dalam bagian-bagian yang dinamakan dengan komponen atau aspek berdasarkan teori yang baku atau ditetapkan oleh penyusun melalui kajian literatur.

Unidimensi hasil pengukuran menjadi tantangan penyusun alat tes karena aspek dalam alat ukur berpotensi mengukur domain berbeda satu sama lain sehingga alat ukur yang disusun menjadi multidimensi. Osborn (2000) menjelaskan bahwa jika dipakai pada instrumen yang multidimensi, beberapa koefisien reliabilitas yang sensitif terhadap kesetaraan nilai tau akan mendapatkan hasil yang bias. Oleh karena itu diperlukan studi pelacakan untuk mendeteksi seberapa jauh ketepatan ataupun bias tiap formula dalam mengestimasi instrumen yang multidimensi.

Hasil pengukuran psikologis yang bersifat unidimensi sangat sulit dicapai, terutama dalam konteks domain kepribadian yang kebanyakan memuat area varian-varian trait yang luas. Socan (2000) melihat bahwa hasil analisis faktor yang dilakukan dari beberapa penelitian, banyak menemui kasus multidimensi dibanding dengan unidimensi. Adanya multidimensionalitas ini kemudian menyebabkan besarnya korelasi antar butir dan skor total menjadi terbatas. Hal serupa juga diungkapkan oleh Krippendorff (1992) yang mengatakan bahwa koefisien reliabilitas yang disusun didasarkan pada asumsi yang sulit dipenuhi oleh para peneliti. Pernyataan ini juga setara dengan pernyataan Vehkahlati (2000) yang mengatakan bahwa asumsi yang cukup tidak realistis pada teori skor murni klasik adalah asumsi unidimensionalitas skor murni yang secara praktis sulit dibuktikan. Meskipun masalah unidimensi bukan menjadi asumsi

(22)

yang dipakai untuk menyusun model konsistensi internal, namun masalah ini menjadi bahan kajian banyak peneliti yang mengkaji reliabilitas. Kajian multidimensi pengukuran muncul ke permukaan karena banyak kasus ditemui bahwa korelasi antar butir di dalam dimensi tersebut terkadang lebih tinggi dibanding dengan korelasi antar butir dengan tes.

Permasalahan yang telah dipaparkan di atas menunjukkan adanya kebutuhan bagi penyusun tes untuk mengetahui perbandingan ketepatan estimasi antar formula reliabilitas sehingga mereka dapat memilih formula mana yang paling akurat. Keakuratan tersebut ditunjukkan dengan kesamaan hasil estimasi reliabilitas formula dengan reliabilitas murni. Dalam kajian psikometri telah dikenal banyak formula yang masing-masing disusun berdasarkan asumsi, model dan pendekatan yang berbeda-beda. Adanya teknik analisis faktor konfirmatori telah memberikan sejumlah kemudahan bagi peneliti untuk mengidentifikasi model pengukuran yang sesuai dengan hasil pengukuran yang didapatkan. Analisis faktor konfirmatori juga telah menjadi dasar penyusunan berbagai model psikometris. Model konjenerik maupun berbagai model alternatif, misalnya model pengukuran dengan korelasi antar sesatan (correlated error), model pengukuran dengan faktor berjenjang (hierarchical model) maupun model indikator formatif-reflektif (formative-reflective indicator) dapat dianalisis dan yang lebih penting adalah model pengukuran yang dihipotesiskan dapat di ketahui.

B. KEASLIAN PENELITIAN

Beberapa peneliti sudah melakukan studi perbandingan antar formula reliabilitas baik yang menggunakan data simulasi maupun data empirik. Dalam literatur yang diterbitkan di Indonesia, penulis belum menemukan penelitian yang membandingkan antar koefisien reliabilitas. Minimnya program bantu kalkulasi, misalnya program

(23)

komputer, membatasi peneliti untuk mengidentifikasi koefisien reliabilitas yang tidak tersedia pada program tersebut. Di sisi lain, adanya asumsi yang berbeda pada tiap koefisien reliabitas memperlihatkan bahwa tiap koefisien reliabilitas tidak berada pada kontinum untuk dibandingkan. Namun eksplorasi tetap perlu dilakukan untuk menunjukkan bahwa penerapan koefisien reliabilitas yang bukan pada model pengukuran yang diasumsikan akan menghasilkan koefisien reliabilitas yang bias.

Dari studi literatur yang dilakukan penulis, perbandingan model pengukuran sudah dilakukan oleh banyak peneliti. Studi perbandingan model pengukuran diawali oleh Votaw yang menggunakan English Composition Examination pada 126 siswa yang dianalisis dengan menggunakan pendekatan SEM. Dengan melakukan perbandingan model pengukuran tes parallel, tau-equivalent dan congeneric didapatkan kesimpulan bahwa tes yang bersangkutan lebih menunjukkan model konjenerik dibanding dengan model pengukuran yang lain (Joreskog dan Sorbom, 1988).

Fleishman dan Benson (1987) menggunakan model LISREL untuk mengevaluasi model pengukuran dan reliabilitas pengukuran. Beberapa model teori skor murni klasik diaplikasikan termasuk model konjenerik yang dikembangkan Joreskog. Hasilnya adalah asumsi uncorrelated error banyak dilanggar dalam penelitian psikometris secara praktis. Reuterberg dan Gustafson (1992) mengkombinasikan analisis faktor konformatori dengan estimasi reliabilitas alpha pada model pengukuran konjenerik. Bacon et.al (1995) membandingkan koefisien omega dan koefisien theta dalam konteks model persamaan struktural. Mereka menunjukkan bahwa nilai koefisien omega lebih besar dibanding dengan koefisien alpha. Ferketich (1990) dengan menggunakan data dari 10 butir skala kepribadian yang diberikan kepada 590 subjek. Berasar hasil penelitian, Ferketich lebih menyarankan untuk menggunakan koefisien

(24)

theta atau omega ketika mengestimasi reliabilitas konsistensi internal jika kondisi penelitian tidak memungkinkan untuk menggunakan koefisien alpha.

Raykov (1997) pernah menyusun pendekatan secara aljabar untuk menentukan seberapa rendah hasil estimasi koefisien alpha dari reliabilitas sesungguhnya, namun pendekatan tersebut memerlukan pendekatan model persamaan struktural (SEM). Socan (2000) pernah melakukan studi perbandingan tiga koefisien reliabilitas, yaitu Koefisien Alpha dari Cronbach, pendekatan Analysis Congeneric Measure (ACM) dari Joreskog, dan Greatest Lower Bound Reliability (GLB) dari Jackson dan Aguwamba. Studi tersebut dilakukan dengan menggunakan data simulasi dan data empirik berupa Big

Five Test Personality. Hasil yang didapatkan dari penelitian tersebut adalah sebagai

berikut. Pada data simulasi yang dibagi menjadi model congeneric dan model non

congeneric didapatkan kesimpulan bahwa ketiga koefisien memiliki ketepatan estimasi

yang besar (>95%) jika dikenakan pada model konjenerik. Di sisi lain, jika diterapkan pada non congeneric ketiga koefisien memiliki ketepatan estimasi yang lebih rendah (87%-92%). Pada empat data empirik didapatkan kesimpulan bahwa estimasi koefieisn alpha paling rendah diantara ketiga teknik sedangkan koefisien GLB estimasinya paling besar.

Yurdugül (2006) pernah membandingkan lima koefisien reliabilitas, yaitu antara Koefisien Alpha Cronbach (α ), Koefisien Armor Theta (θ), Koefisien Omega (Ω) dari Heise dan Bohrnstedt, Koefisien Omega (ω ) dari McDonald, dan Koefisien Beta (β) dari Revelle. Dengan menggunakan data yang didapat dari penelitian Traub (1994) didapatkan keterangan bahwa pada kondisi pengukuran yang paralel, kelima koefisien tersebut adalah setara (α=θ=β=Ω=ω). Di sisi lain, pada kondisi pengukuran konjenerik didapatkan bahwa nilai reliabilitas yang didapatkan dari koefisien omega dari

(25)

McDonald lebih besar dibanding dengan keempat koefisien lainnya (α=θ=β=Ω<ω). Hasil ini konsisten dengan penjelasan teoritik Carmines dan Zeller (1979) yang mengatakan bahwa dalam pengukuran paralel, Koefisien Alpha (α), Koefisien Thete (θ) dan Koefisien Omega (Ω) nilainya setara.

C. PERUMUSAN MASALAH

Di kalangan peneliti masih terdapat ketidaksepakatan dalam menggunakan koefisien reliabilitas dalam mengevaluasi hasil pengukuran (Slaney, 2006). Antara satu ahli dengan ahli lainnya merekomendasikan penggunaan reliabilitas yang berbeda-beda. Permasalahan yang telah dipaparkan menunjukkan adanya kebutuhan bagi penyusun tes untuk mengetahui perbandingan ketepatan estimasi antar formula reliabilitas sehingga mereka dapat memilih formula mana yang paling akurat. Oleh karena itu diperlukan sebuah penelitian yang mampu mengungkap ketepatan estimasi terhadap reliabilitas murni dari formula-formula yang dikembangkan oleh para ahli psikometri.

Permasalahan lain yang muncul adalah penggunaan koefisien reliabilitas oleh peneliti secara monoton tanpa mempertimbangkan asumsi yang mendasari koefisien tersebut. Sebagai contoh, banyak peneliti langsung memutuskan menggunakan koefisien Alpha Cronbach tanpa menguji data hasil pengukuran yang dilakukan, padahal penggunaan koefisien tersebut memerlukan asumsi-asumsi tertentu. Oleh karena itu diperlukan sebuah penelitian yang mampu mengidentifikasi seberapa jauh bias estimasi terhadap reliabilitas murni ketika asumsi penggunaan sebuah koefisien reliabilitas dilanggar. Salah satu asumsi yang banyak dilanggar oleh peneliti dalam mengestimasi reliabilitas adalah asumsi mengenai unidimensionalitas data. Data dalam bidang pengukuran psikologi lebih berpotensi pada data yang bersifat multidimensi

(26)

dibandingkan dengan sifat unidimensi. Hal ini terlihat dari proses penyusunan alat ukur yang diawali dari memecah konstrak ukur menjadi komponen-komponen yang sangat memungkinkan dapat membentuk dimensi-dimensi baru. Penelitian mengenai sejauh mana pelanggaran pengujian asumsi dimensionalitas data dalam kaitannya dengan estimasi terhadap reliabilitas dalam hal ini sangat dibutuhkan.

D. TUJUAN PENELITIAN

Tujuan utama penelitian ini adalah untuk membandingkan ketepatan estimasi formula reliabilitas pendekatan teori skor murni klasik. Tujuan ini dijabarkan menjadi beberapa tujuan spesifik.

1. Membandingkan keakuratan estimasi reliabilitas antar formula reliabilitas.

Tujuan ini diimplementasikan pada perbandingan ketepatan formula reliabilitas dalam mengestimasi reliabilitas murni (true reliability) sesuai dengan asumsi yang melandasi formula.

2. Membandingkan ketepatan model antar model pengukuran teori skor murni klasik, yaitu model parallel, essentially tau equivalent dan congeneric dan correlated error. Tujuan ini diimplementasikan pada perbandingan ketepatan model masing-masing model teori skor murni klasik (parallel, essentially tau equivalent dan congeneric,

correlated error) dengan menggunakan analisis faktor konfirmatori pada

pendekatan model persamaan struktural (SEM).

3. Membandingkan ketepatan model antara model unidimensi dan multidimensi

Tujuan ketiga penelitian ini diaplikasikan dalam perbandingan ketepatan model masing-masing model dengan menggunakan analisis faktor konfirmatori melalui pendekatan model persamaan struktural (SEM).

(27)

E. MANFAAT PENELITIAN

1. Manfaat terhadap Pengembangan Alat Ukur Psikologi.

a. Reliabilitas adalah salah satu properti psikometris yang penting sehingga perlu dipahami dengan baik sehingga peneliti dapat menggunakan estimator yang tepat untuk mengevaluasi alat ukur yang disusunnya. Penelitian ini memberikan manfaat mengenai bagaimana memilih teknik estimasi reliabilitas yang tepat jika dikenakan pada pengukuran yang dilakukan.

b. Penelitian ini bermanfaat bagi penyusun yang hendak mengevaluasi alat ukur dalam bidang psikologi dengan menunjukkan seberapa jauh bias estimasi terhadap reliabilitas pengukuran ketika asumsi mengenai skor dilanggar oleh peneliti. Pelanggaran mengenai asumsi skor diharapkan dapat diminimalisir setelah peneliti mengetahui dampak yang diakibatkan.

c. Wacana mengenai model pengukuran congeneric dan correlated error masih sedikit dieksplorasi di kancah penelitian di Indonesia. Penelitian ini memberikan wawasan baru kepada pengembangan alat ukur di Indonesia.

2. Manfaat terhadap Pengolaan Data Kuantitatif.

a. Penggunaan Teknik Persamaan Model Struktural (SEM) dalam bidang psikometri belum banyak dilakukan oleh peneliti di Indonesia. Beberapa kelebihan yang ada pada teknik ini perlu dieksplorasi lebih lanjut karena lebih integratif dalam memandang sebuah konstrak dalam bidang psikologi. Penelitian ini memberikan contoh mengenai aplikasi SEM dalam hal pengolahan data.

(28)

BAB II

TINJAUAN PUSTAKA

A. RELIABILITAS DAN VALIDITAS

Reliabilitas pengukuran merupakan salah satu properti psikometris yang memegang peranan penting untuk mengevaluasi sebuah alat ukur. Sub bab berikut ini akan memaparkan mengenai pengertian reliabilitas, pendekatan dalam mengestimasi reliabilitas dalam psikometri dan paparan mengenai beberapa formula koefisien reliabilitas yang banyak digunakan oleh peneliti.

1. Reliabilitas

Kata reliabilitas diperkenalkan pertama kali oleh Spearman pada tahun 1910 melalui karyanya yang di muat dalam Journal British of Psychology (Slaney, 2004). Spearman mendefinisikan reliabilitas sebagai koefisien yang menunjukkan hubungan antara dua buah belahan tes yang mengukur hal yang sama. Dicontohkan olehnya bahwa sebuah tes yang dibelah menjadi dua buah belahan dengan belahan pertama berisi item-item genap dan belahan yang lain berisi item-item ganjil.

Reliabilitas hasil pengukuran dapat dilihat melalui berbagai perspektif sehingga ada beberapa terminologi dikaitkan dengan reliabilitas. Tonigan (2000) mengatakan ada tiga terminologi yang menggambarkan reliabilitas hasil pengukuran, yaitu stabilitas (stability), kesetaraan (equivalency), dan konsistensi internal (internal item consistency). Knapp (2002) mengatakan bahwa terminologi yang menggambarkan konsistensi hasil pengukuran bukan hanya pada kata reliabilitas saja melainkan ada kata lain seperti

(29)

akurasi (accuracy), presisi (precision), kesepakatan (agreement), ketergantungan (dependability), reproduksibilitas (reproducibility), pengulangan (repeatability). Meskipun digambarkan dengan terminologi yang bermacam-macam namun para ahli memiliki kesepakatan bahwa apa yang dikaji oleh reliabilitas adalah konsistensi hasil pengukuran antar butir dengan butir lainnya, konsistensi hasil penilaian antara rater dengan rater lainnya, konsistensi hasil antara waktu satu dengan waktu lainnya dan konsistensi antara pengukuran satu dengan lainnya.

Beberapa ahli menitik beratkan pengertian reliabilitas dari sisi konsistensi pengukuran yang dikenakan pada situasi dan kondisi berbeda. Lewis (1999) misalnya, mengatakan bahwa reliabilitas adalah informasi mengenai seberapa jauh konsistensi hasil pengukuran jika diterapkan pada kondisi yang berbeda. Asumsi yang dipakai dalam mendefinisikan reliabilitas tersebut adalah proses pengukuran tidak mempengaruhi fluktuasi konstrak yang diukur. Devit et.al (1998) mendefinisikan reliabillitas sebagai konsistensi yang artinya jika pengukuran dilakukan pada situasi yang berbeda, hasil yang didapatkan adalah setara. Reliabilitas ini akan mempengaruhi validitas pengukuran sehingga untuk mendapatkan pengukuran yang valid syarat utama yang perlu dipenuhi adalah pengukuran yang reliabel. Sebaliknya pengukuran dapat saja kurang reliabel meskipun validitas pengukuran tersebut memuaskan. Tidak hanya konsisten pada situasi dan kondisi yang berbeda, reliabilitas juga dinyatakan sebagai ukuran konsistensi pada sampel dan populasi yang sama. The Standards for Educational

and Psychological Testing mendefinisikan reliabilitas hasil pengukuran yang konsisten

jika diterapkan pada populasi individu yang sama.

Pengertian mengenai reliabilitas juga ditinjau oleh para ahli melalui sisi kendali terhadap sesatan pengukuran yaitu dengan melihat reliabilitas sebagai informasi

(30)

mengenai keacakan hasil yang diakibatkan pengukuran. Apigian et.al (2005) misalnya, mendefinisikan reliabilitas sebagai indikasi seberapa jauh operasionalisasi pengukuran terbebas dari sesatan acak dan mengukur konstrak dalam pola yang konsisten. Sebuah pengukuran dikatakan terpercaya jika terbebas dari pengaruh faktor lain yang sifatnya acak, baik terkait dengan instrumen maupun kondisi selama pengukuran berlangsung. Beberapa ahli lain mendefinisikan reliabilitas secara operasional yang dapat menggambarkan persamaan matematisnya. Becker (2000) misalnya, mengatakan bahwa reliabilitas adalah perbandingan antara varian temporer di dalam skor tes dengan varian tes secara keseluruhan.

Reliabilitas tidak berkaitan dengan instrumen atau konstrak tes akan tetapi lebih berkaitan dengan pengukuran atau skor hasil ukur. Crocker dan Algina (1986) mengatakan bahwa data dapat bersifat reliabel atau tidak reliabel sedangkan alat ukur tidak berkaitan dengan reliabel atau tidak reliabel. Reliabilitas adalah properti dari skor pada populasi yang dikenai tes. Reliabilitas lebih berkaitan pada data atau skor dan tidak berkaitan dengan alat ukur. Pernyataan tersebut didukung oleh Capraro et.al (2001) yang mengatakan bahwa reliabilitas berkaitan dengan data yang didapatkan dari alat ukur, bukan berkaitan dengan alat ukurnya. Konsep yang tepat dikaitkan dengan reliabilitas adalah skor tes (test score) dan pengukuran (measurement), dan bukan kata tes (test) atau alat ukur (instrument). Leech et.al (2005) mengatakan reliabilitas adalah informasi mengenai pengukuran atau asesmen satu dengan lainnya yang mengukur hal yang sama dan seberapa jauh pengukuran atau asesmen tersebut terbebas dari sesatan pengukuran.

Faktor karakteristik sampel mempengaruhi besarnya koefisien reliabilitas. Thompson (1994) mengatakan bahwa pengukuran yang sama jika dikenakan pada

(31)

subjek yang homogen dan subjek yang heterogen memungkinkan untuk menghasilkan nilai koefisien reliabilitas yang berbeda. Reliabilitas tergantung pada karakteristik sampel yang diuji sehingga dapat diartikan bahwa reliabilitas adalah konsistensi hasil pengukuran ketika sebuah tes diberikan kepada sebuah populasi hipotetik individu atau kelompok. Estimasi terhadap reliabilitas turut berubah jika dikenakan pada populasi yang berbeda. Hal ini menjelaskan bahwa reliabilitas adalah fungsi dari skor tes bukan pada instrumen tes yang dipakai.

Pengertian bahwa reliabilitas merupakan properti dari sampel bertentangan dengan pengertian reliabilitas sebagai properti dari atribut ukur. Rudner dan Schafer (2001) mengatakan bahwa reliabilitas adalah seberapa jauh hasil yang diinformasikan oleh sebuah tes sebagai hasil dari atribut yang hendak dianalisis. Ditambahkan oleh ahli tersebut bahwa pengertian reliabilitas yang melibatkan informasi mengenai sampel (group of test takers) kurang lengkap karena memungkinkan adanya variasi hasil pengukuran secara sistematis dan kurang dapat diulangi (repeatable).

Beragam pengertian mengenai reliabilitas dikemukakan oleh para penulis. Kesimpulan mengenai pengertian reliabilitas yang dapat diangkat dari paparan di atas adalah reliabilitas merupakan properti dari ketepatan mengukur atribut ukur dan properti dari populasi yang dikenai tes. Reliabilitas menjelaskan pengulangan perilaku individu yang dibuktikan dengan pengulangan respon individu yang dibangun oleh tes dan nilai skor tes yang setara. Reliabilitas terkait dengan populasi secara spesifik. Tidak seperti validitas yang memiliki kriteria eksternal yang dapat dijadikan acuan (gold standard) untuk melihat kualitas hasil sebuah estimasi, reliabilitas tidak memiliki acuan utama karena kualitas pengukurannya tergantung secara relatif pada skor yang didapatkan dari pengukuran itu sendiri (Lewis, 1999)

(32)

2. Validitas Pengukuran

Konsep validitas pertama kali diperkenalkan oleh Guilford yang menjelaskan bahwa tes dapat dikatakan valid jika memiliki korelasi dengan sesuatu yang berkaitan dengannya (Guilford, 1954). Pengertian tersebut dinilai masih terlalu umum sehingga muncul pengertian-pengertian dari para ahli, namun pengertian yang ditandaskan oleh Guilford tersebut secara tidak langsung menjelaskan bahwa konsep validitas tidak mengkaji properti karakteristik instrumen pengukuran akan tetapi lebih menjelaskan pada orientasi dan tujuan pengukuran. Tes yang valid dapat dikatakan telah memenuhi tujuan yang hendak dicapai.

Dari literatur psikometri dikenal pembagian jenis validitas menjadi tiga kategori yaitu validitas isi (content validity), validitas kriteria (criterion-related validity) dan validitas konstrak (contruct validity). Meskipun dibagi menjadi tiga kategori namun pembagian tersebut tidak menunjukkan pandangan yang berbeda mengenai orientasi instrumen pengukuran namun perbedaan tersebut terletak pada standar yang dipakai untuk menentukan instrumen pengukuran tersebut valid ataukah tidak. Pernyataan tersebut didasari oleh pernyataan Cronbach (1990) yang mengatakan bahwa semua validasi adalah satu. Cronbach (1990) menambahkan bahwa validitas konstrak dapat dipakai untuk menjelaskan instrumen pengukuran apabila validitas isi dan validitas kriteria kurang memiliki kekuatan (power) untuk mengklaim validitas.

Pendekatan yang lebih kontemporer lebih mengkaji validitas berdasarkan makna dan interpretasi pengukuran sebagai bentuk lain dari properti psikometris pengukuran. Proses validasi pengukuran harus didasari oleh teori dan objek validasi adalah skor tes. Validitas adalah evaluasi keputusan yang integratif (integrated evaluative judgment) pada seberapa jauh bukti dan rasionalisasi teoritis mendukung kepatutan dan ketepatan

(33)

keputusan yang diambil berdasarkan hasil pengukuran. Pengertian tersebut menunjukkan bahwa uji validitas adalah pengujian seberapa jauh kesimpulan (inferences) mengenai hasil pengukuran yang sesuai dengan kondisi yang dihadapi. Paparan yang lebih praktis dapat melihat paparan Landy (1986) yang mengatakan bahwa responden memiliki sejumlah atribut psikologis tertentu sehingga kesimpulan hasil pengukuran dapat dikatakan valid jika mampu menggambarkan atribut psikologis tersebut. Landy (1986) menambahkan bahwa kesimpulan hasil pengukuran tersebut terdiri dari berbagai jenis, misalnya X adalah bagian dari Y, X adalah pendekatan dari Y atau X adalah indikator dari Y. Dengan demikian proses validasi tidak sekedar pada apakah instrumen penguran menggambarkan atribut yang diukur saja.

B. TEORI SKOR MURNI KLASIK

Lord dan Novick (1974) mengatakan bahwa teori skor murni klasik dibangun berdasarkan beberapa asumsi yaitu, (a) sesatan antar pengukuran bersifat independen, (b) sesatan pengukuran tidak memiliki hubungan dengan skor tampak. Asumsi dipakai untuk membangun model tes paralel. Dapat dijelaskan bahwa skor tampak individu menggambarkan kemampuan individu untuk merespon dengan tepat butir di dalam tes. Hasil yang sama didapatkan kembali jika kedua tes adalah paralel.

Marradi (1990) mengatakan bahwa ada tiga asumsi dasar yang dipakai dalam teori skor murni klasik yaitu, (a) terdapat status murni (true state) di dalam objek yang diukur yang ingin diamati oleh peneliti, (b) status murni tersebut tidak berubah secara drastis selama interval pengamatan pertama dan pengamatan kedua, (c) status murni tersebut tidak berubah oleh adanya pengamatan. Dengan adanya asumsi ini maka perbedaan antara hasil pengamatan dan status murni tersebut diakibatkan adanya sesatan pengamatan.

(34)

Pusat kajian dari teori reliabilitas klasik adalah dekomposisi aditif skor tampak menjadi skor murni dan sesatan. Dalam teori klasik, butir dengan skor Xi dapat

direpresentasikan dalam persamaan Xi =Ti+Ei dan hubungan antar varian dijabarkan

dalam persamaan 2 E 2 T 2 E T 2 X σ σ σ

σ = + = + . Berikut ini penjelasan mengenai ketiga elemen teori skor murni klasik , yaitu skor murni, skor tampak dan sesatan pengukuran.

a. Skor Tampak

Setiap pengukuran menghasilkan nilai bersifat kuantitatif berupa skor. Skor menjelaskan nilai penghargaan yang diterima oleh seorang subjek yang dikenai tes karena respon yang diberikan memiliki nilai yang lebih. Skor tampak (observed score) adalah nilai kuantitatif yang diperoleh subjek secara langsung dari pengukuran. Besaran skor tampak dapat diketahui dengan jelas karena merupakan fungsi aditif dari skor tiap item. Fouladi (1999) mengatakan bahwa skor ini sulit untuk diinterpretasikan karena belum menjelaskan atribut yang diukur dengan tepat.

Skor tampak merupakan komposit dari komponen-komponen tes (Crocker dan Algina, 1986). Gerbing dan Anderson (1988) mengatakan bahwa skor komposit adalah skor yang didapatkan responden melalui sebuah alat ukur yang merupakan skor yang belum dibobot dan mendukung estimasi terhadap konstrak yang diukur.

Skor tampak dapat diwujudkan dalam skor komposit yang merupakan total dari skor-skor lain yang setara (Bentler, 1968). Misalnya skor komposit X merupakan

penjumlahan dari kunit komponen yang terbobot maupun tidak terbobot (X =X1+X2 +X3...Xk). Skor komposit merupakan skor yang didapatkan dari item-item di dalam tes. Reliabilitas konsistensi internal menggambarkan kualitas skor komposit sebagai faktor dari item-item yang dimuat. Skor komposit memiliki

(35)

keterkaitan dengan skor murni dan sesatan pengukuran dalam skor murni klasik (Xi =Ti+Ei), varian umum dan varian unik dalam analisis faktor (Xi =Ci +Ui) atau faktor ekstrak dengan sesatannya (XiiF+Ei). Dalam kajian teori skor murni klasik, skor tampak memuat dua elemen, yaitu skor murni dan sesatan pengukuran. Dengan demikian dapat disimpulkan bahwa skor tampak belum menunjukkan atribut ukur dengan tepat karena masih mengandung sesatan pengukuran.

Gambar 1. Hubungan Antara Skor Murni, Skor Tampak dan sesatan Pengukuran

b. Skor Murni

Steenbergen (2000) mengatakan bahwa skor murni adalah kuantitas yang dikehendaki oleh peneliti dan terbebas dari pengaruh sesatan. Zumbo (1999) mengatakan bahwa skor murni adalah skor teoritik yang merupakan skor harapan muncul dari pelaksanaan pengukuran. Fairchild (inpress) mengatakan bahwa skor murni tidak dapat diketahui dengan pasti namun dapat diprediksi dan diestimasi melalui operasi psikometrika. Pengertian tersebut sesuai dengan pernyatan Steyer (1989) yang mengatakan bahwa skor murni adalah parameter psikometris yang keberadaannya diakui akan tetapi nilai pastinya tidak dapat diketahui dengn jelas.

Skor murni adalah rata-rata yang didapatkan oleh individu pada pengukuran berulangkali yang tak terbatas dengan asumsi tidak ada faktor kelelahan dan faktor

SKOR MURNI Skor Tampak 1 Eror Eror Eror Skor Tampak 2 Skor Tampak 3

(36)

belajar pada individu (Meyer, 1997). Dalam pengulangan pengukuran yang setara maupun oleh komponen tes yang setara pula, nilai skor murni yang dihasilkan dapat berbeda karena beberapa pengaruh. Pengaruh tersebut dapat bersumber dapat bersumber dari adanya sesatan pengukuran maupun ketidaksetaraan komponen tes dalam menjangkau atribut ukur yang diterjemahkan dalam skor murni. Masalah kesetaraan komponen tes dalam menjelaskan atribut ukur ini kemudian menjadi kajian dari dimensionalitas dan model pengukuran (Gruijter dan Kamp, 2005). Keterangan tersebut menunjukkan bahwa reliabilitas yang memuaskan terlihat dari kecilnya deviasi antar pengulangan pengukuran. Skor murni adalah nilai harapan yang muncul melalui skor tampak (Socan, 2000).

Skor murni bersifat laten karena besarannya tidak dapat diketahui secara pasti. Skor murni dapat diprediksi melalui indikator-indikator manifes yang ditunjukkan oleh komponen tes. Dalam perspektif persamaan model struktural sebarapa jauh indikator dapat menjaskan skor murni dievaluasi melalui uji ketepatan model (Borsboom et.al, 2003).

Tarkonen (inpress) mengatakan bahwa struktur skor murni terdiri dari dimensi, matriks dan kovarian antar skor murni. Rumusan dasar struktur skor murni adalah

ε τ + Β =

X , τ adalah informasi mengenai skor murni yang merupakan vektor. Persamaan tersebut kemudian diturunkan menjadi hubungan antar varian, yaitu

Ψ + ΒΦΒ = ' ) (X

Cov , φ menunjukkan varian dari skor murni τ . Dalam banyak kasus skor murni distandarisasi tanpa kehilangan generalisasinya sehingga dapat dijabarkan menjadi φ=1 sehingga Φ adalah matiks korelasi yang dinotasikan dengan P . Dengan τ

adanya asumsi bahwa skor murni yang tidak berkorelasi tidak berkorelasi maka disimpulkan bahwa Cov(τ)=Φd atau Cov(τ)=I.

(37)

Dalam perspektif teori skor murni klasik, skor murni tidak memiliki keterkaitan dengan sesatan pengukuran karena sesatan pengukuran yang ditekankan adalah sesatan acak. Skor murni merupakan konstrak yang sifatnya laten karena tidak dapat diketahui nilainya dengan pasti dan hanya diketahui melalui indikator yang manifes. Fluktuasi skor murni dalam kajian reliabilitas tergantung pada model pengukuran yang dipakai, misalnya dalam model tes paralel nilai skor murni diasumsikan konstan antar pengukuran sedangkan dalam model konjenerik hubungannya sesuai persamaan linier. c. Sesatan Pengukuran

Setiap pengukuran selalu mengandung sesatan sehingga kajian mengenai reliabilitas tidak terlepas dari sesatan pengukuran. Kajian mengenai reliabilitas berkaitan dengan sesatan pengukuran, karena reliabilitas diartikan sejauh mana hasil pengukuran terbebas dari sesatan pengukuran. Sesatan pengukuran merupakan salah satu sumber yang mempengaruhi variasi skor. Vautier dan Jmel (2003) mengatakan untuk mengestimasi reliabilitas peneliti perlu mengenali besarnya varian skor murni dan varian sesatan. Pengenalan terhadap sesatan pengukuran memiliki dua fungsi. Pertama, untuk melihat sejauh mana sesatan pengukuran mempengaruhi data yang didapatkan. Kedua, untuk mengetahui sejauh mana sesatan pengukuran akan membatasi besarnya

effect size data hubungan antar variabel.

Sesatan pengukuran dapat disebabkan oleh dua sebab utama yaitu, sesatan sistematik dan sesatan acak (random error). Capraro et.al (2001) menjelaskan bahwa sesatan varian adalah acak, bersifat tidak sistematik dan berkaitan dengan ketidakreliabelan, sedangkan varian spesifik bersifat non-acak, sistematik, reliabel dan berkaitan dengan pemilihan variabel yang dilakukan oleh peneliti. Munculnya varian sesatan acak disebabkan oleh beberapa hal antara lain: faktor lain diluar respon subjek

(38)

terhadap aitem dalam alat ukur (non-response), desain kuesioner (badly designed

questionnaires) yang buruk, bias responden dalam merespon (respondent bias) dan

sesatan proses (processing errors) (Abbasi, tanpa tahun). Di sisi lain munculnya varian sesatan sistematis berkaitan dengan deviasi terhadap domain yang hendak diukur yang lebih bersifat menetap.

Henson (2001) melihat bahwa sesatan pengukuran mempengaruhi keputusan dari sebuah penelitian. Sesatan pengukuran mempengaruhi peluang untuk membuktikan hipotesis penelitian. Di sisi lain, sesatan pengukuran dapat juga merusak interpretasi skor dan fungsi alat tes. Diskrepansi antara fakta dan harapan ini perlu diatasi agar penelitian dapat menghasilkan kesimpulan yang tepat.

Dalam kajian psikometri besarnya variasi sesatan pengukuran biasanya diekspresikan melalui sesatan pengukuran standar (standard error of measurement). Sesatan standar berguna untuk mengestimasi skor murni individu. Sesatan standar merupakan salah satu dasar yang dipakai untuk melihat kepercayaan terhadap koefisien reliabilitas. Azwar (2004) mengatakan bahwa sebuah koefisien reliabilitas yang sama belum tentu memiliki tingkat kepercayaan yang sama pula jika sesatan standarnya berbeda. Kajian mengenai sesatan standar kemudian diperluas menjadi sesatan standar pengukuran terkondisi (conditional standard error of measurement) yang biasa disingkat CSEM yaitu deviasi standar dari sesatan pengukuran yang mempengaruhi skor subjek pada level skor tes yang spesifik. Varian sesatan pengukuran terkondisi adalah varian pengukuran yang mempengaruhi skor subjek pada level skor tes yang spesifik. Secara matematik, varian sesatan pengukuran terkondisi adalah sesatan standar pengukuran terkondisi. CSEM mendukung estimasi terhadap reliabilitas pada kondisi kemampuan tertentu. Secara matematik, CSEM mendukung estimasi reliabilitas pada

(39)

skor tertentu. Karena terdapat informasi mengenai skor individu secara tipikal pada interval daerah tengah distribusi skor, maka nilai CSEM biasanya sangat rendah pada interval ini.

1. Pendekatan Estimasi Reliabilitas Teori Skor Murni Klasik

Tonigan (2000) mengatakan ada tiga terminologi yang menggambarkan reliabilitas hasil pengukuran, yaitu stabilitas (stability), kesetaraan (equivalency), and dan konsistensi internal (internal butir consistency). Stabilitas adalah kesamaan hasil pengukuran melalui pengulangan pengukuran, kesetaraan adalah hasil yang sama dari dua alat tes paralel dan konsistensi internal adalah konsistensi hasil skor tiap komponen tes. Leech et.al (2005) mengatakan bahwa reliabilitas dapat diestimasi jika komponen yang diukur adalah sebanding (comparable). Bentuk perbandingan tersebut adalah perbandingan antar waktu yang diturunkan menjadi pendekatan tes ulang, perbandingan antar bentuk tes yang diturunkan menjadi pendekatan paralelisme, dan perbandingan antar komponen tes yang diturunkan menjadi pendekatan konsistensi internal.

a. Pendekatan Tes Ulang

Relabilitas tes ulang diestimasi melalui koefisien korelasi antara skor dari tes yang sama. Jika diberikan kepada individu dari populasi yang sama maka diharapkan akan mendapatkan koefisien reliabilitas sebesar 1 (ρxx’=1). Karena tidak ada

pengukuran yang kosisten secara mutlak karena sesatan pengukuran akan selalu muncul maka koefisien reliabilitas sebesar 1 tidak mungkin didapatkan. Pada model ini koefisien reliabilitas didapatkan melalui korelasi pada level skor tes, bukan level skor subtes atau level skor butir (Wu, in press). Kovarian antar pada tataran skor tes lebih ditekankan dibanding kovarian antar butir.

(40)

Tonigan (inpress) mengatakah bahwa teknik statistik yang digunakan untuk menghitung reliabilitas tes ulang adalah korelasi moment tangkar (product momment) dan korelasi antar kelas (interclass correlation). Meskipun dapat dikenakan pada model tes ulang akan tetapi perspektif dalam melihat stabilitas hasil pengukuran antar kedua teknik ini berbeda. Teknik korelasi melihat melalui kesamaan urutan kedua pengukuran pada distribusi yang dimiliki sedangkan korelasi antar kelas melihat melalui pembagian varian pada beberapa komponen. Dalam kancah penelitian, teknik korelasi lebih banyak dipakai dibanding korelasi antar kelas.

Azwar (2004) melihat kelemahan estimasi reliabilitas pada tipe ini berkaitan dengan Isu efek bawaan (carry over) dan kontaminasi setelah individu dikenai tes kedua. Isu efek bawaan dan kontaminasi telah merusak apa yang diasumsikan oleh teori klasik yang menyatakan bahwa sesatan kedua tes tidak memiliki korelasi. Adanya efek bawaan menyebabkan sesatan pengukuran kedua tes menjadi berkaitan. Hopkins (2000) melihat bahwa reliabilitas tes ulang sensitif terhadap heterogenitas sampel yang dipakai. Semakin heterogen sampel yang dipakai maka semakin besar potensi adanya diskrepansi hasil antar dua pengukuran

. SKOR MURNI Skor Tampak 1 Eror Skor

Tampak 2 Tampak 3 Skor

Eror Eror SKOR MURNI Skor Tampak 1 Eror Skor

Tampak 2 Tampak 3 Skor

Eror Eror

Tes Waktu Pertama Tes Waktu Kedua

(41)

Gambar 2.1. Model Pendekatan Tes Ulang b. Pendekatan Tes Paralel

Tipe reliabilitas tes ulang disusun untuk mengatasi permasalahan yang ada pada tipe reliabilitas tes paralel berkaitan dengan isu efek bawaan atau kontaminasi. Dengan adanya pembedaan kisi-kisi butir tes maka isu tersebut dapat diatasi. Crocker dan Algina (1986) mengatakan bahwa reliabilitas tes paralel disebut juga dengan reliabilitas form pengganti (alternate form). Nilai reliabilitas pada tipe ini didapatkan dari korelasi antar skor yang didapatkan dari kedua tes. Semakin besar korelasi skor maka semakin besar reliabilitas skor yang didapatkan. Pemakaian teknik korelasi tersebut didasarkan pada asumsi teori klasik yang mengatakan bahwa kedua tes mengukur pola skor murni yang sama dan memiliki muatan sesatan yang sama pula.

Gambar 2. Model Pendekatan Tes Paralel

Tonigan (2000) mengatakan bahwa reliabilitas tes paralel mengkaji seberapa jauh dua hasil pengukuran dari tes paralel menghasilkan skor yang setara. Statistik yang digunakan dalam mengkaji adalah korelasi product moment dan koefisien ICC. Potensi

SKOR MURNI Skor Tampak 1 Eror Skor

Tampak 2 Tampak 3 Skor

Eror Eror SKOR MURNI Skor Tampak 1 Eror Skor

Tampak 2 Tampak 3 Skor

Eror Eror

Tes Form A Tes Form B

(42)

bias muncul lebih dikarenakan ingatan individu yang dikenai tes dapat direduksi pada model ini. Tipe estimasi reliabilitas dengan tes paralel memunculkan beberapa isu tentang ketepatan dalam mengestimasi reliabilitas. Isu tersebut yaitu, pertama adalah isu mengenai penyusunan tes paralel yang relatif sulit. Meskipun didasarkan pada blue print penyusunan alat ukur yang sama namun dapat dimungkinkan muatan yang dikandung oleh kedua tes tidak serta merta menghasilkan skor murni yang setara pada tataran empirik. Hopkins (2000) memberikan contoh bahwa individu yang sama dikenai pengukuran berbeda oleh penguji yang berbeda akan sesatan pengukuran akan meningkat yang terkait kalibrasi dengan kalibrasi skor yang didapat. Dapat disimpulkan bahwa isu yang muncul dalam pengujian dengan tes paralel adalah isu kesetaraan dua form alat tes yang di pakai.

b. Pendekatan Konsistensi Internal

Schmitt (1996) mengatakan bahwa konsistensi intenal adalah keterkaitan antar butir dalam sebuah tes. Konsistensi membutuhkan adanya homogenitas antar item, namun syarat ini tidak cukup kuat untuk mendukung tingginya konsistensi internal. Azwar (2004) mengatakan bahwa konsistensi internal adalah metode penyajian tunggal yang melihat konsistensi antar bagian di dalam sebuah tes. Reliabel dalam pengertian ini berarti adalah konsistensi hasil antara satu bagian tes dengan bagian lainnya yang membentuk tes secara keseluruhan. Sebuah hasil pengukuran dikatakan konsisten secara internal jika antara butir satu dan butir yang lain memiliki keterkaitan yang tinggi. Keuntungan menggunakan pendekatan ini lebih pada masalah ekonomis karena cukup dengan sekali pengukuran (single trial) maka reliabilitas sudah dapat diestimasi.

Beberapa ahli melihat konsitensi secara operasional ditunjukkan dengan adanya homogenitas butir di dalam tes. Nunnally (1980) misalnya, melihat bahwa pendekatan

(43)

konsistensi internal mendasarkan pada homogenitas item. Ditambahkan juga bahwa pada pendekatan ini sumber sesatan tidak berkaitan dengan sampling sesatan saja tetapi berkaitan dengan sampling faktor situasional yang menyertai administrasi tes. Lewis (2004) juga menitikberatkan pengertian konsistensi internal pada homogenitas butir di dalam tes.

Konsep konsistensi internal dan reliabilitas dapat memiliki makna yang berbeda dalam aplikasinya. Sebuah butir dapat memiliki konsistensi yang tinggi jika dikaitkan dengan butir lainnya, akan tetapi memungkinkan memiliki reliabilitas yang rendah. Memaksimalkan nilai reliabilitas belum tentu meningkatkan konsistensi internalnya. Dua komponen tes dikatakan konsisten secara internal apabila korelasi keduanya sama besarnya dengan korelasi dengan konstraknya. Selain homogenitas, konsistensi internal ditunjukkan dengan hubungan yang erat antara satu butir dan butir lainnya di dalam sebuah alat ukur. Dalam penelitian ini penulis tidak membedakan reliabilitas dan konsistensi internal seperti yang dikatakan oleh Ping (2004). Penulis melihat bahwa konsistensi internal merupakan salah satu pendekatan untuk mengestimasi reliabilitas.

Strickland (1999) mengatakan bahwa konsistensi internal didasarkan pada

domain-sampling model, yaitu butir yang dilibatkan dalam analisis terkait secara

konseptual antara satu dengan lainnya. Secara operasional keterkaitan tersebut ditampakkan dalam korelasi antar butir yang tinggi. Pendapat ini sesuai dengan Baker (2004) yang mendefinisikan konsistensi internal adalah seberapa jauh skor dari pengukuran berkorelasi dengan skor murni berdasarkan pada semua butir yang memungkinkan untuk dilibatkan pada alat ukur yang dipakai. Devit et.al (1998) mengatakan bahwa konsistensi internal adalah ukuran seberapa jauh item-item dalam

(44)

sebuah alat ukur memiliki kesamaan dalam mengukur sebuah atribut. Internal konsistensi mengevaluasi variasi performansi item-item yang berbeda pada sebuah tes.

Devit et.al (1998) menambahkan bahwa untuk mencapai konsistensi internal, setiap skor yang diperoleh individu harus dinilai melalui jenjang yang sama agar dapat dibandingkan dengan skor subjek lainnya. Konsistensi internal terlihat dari jika subjek satu memperoleh skor pada butir kesatu lebih tinggi dibanding dengan butir kedua, maka subjek yang lain diharapkan skornya sesuai dengan pola tersebut. Skor yang didapatkan tidak harus sama akan tetapi memiliki pola (pattern of scores) yang sama. Pengertian yang dijelaskan oleh Leech et.al (2005) mendukung pernyataan tersebut bahwa reliabilitas dapat diestimasi jika hasil pengukuran satu dengan lainnya, atau satu komponen dengan komponen lainnya adalah sebanding (comparable). Lucke (2005) mengatakan bahwa reliabilitas adalah konsistensi internal yang ditambah dengan deviasi relatif dari kesetaraan skor murni. Internal konsistensi menjadi informasi sebuah reliabilitas pengukuran jika butir dan skor murni bersifat homogen.

Berdasarkan paparan di atas dapat disimpulkan bahwa pendekatan reliabilitas konsistensi internal melihat sejauh mana komponen yang termuat di dalam tes berkaitan antara satu dengan lainnya. Setiap komponen di dalam tes dilihat sebagai sebuah tes tersendiri dan hubungan antar tes ini menjadi perhatian untuk menentukan koefisien reliabilitas. Penentuan jenis komponen ini bervariasi, mulai dari penentuan berdasarkan level butir hingga level dimensi (teslet). Jumlah komponen yang diuji juga bervariasi, mulai dari pembelahan tes menjadi dua belahan (split-half), tiga komponen, maupun sebanyak butir tersebut atau sejumlah k komponen.

(45)

2. Koefisien Estimasi Reliabilitas

Para ahli mengkuantifikasikan reliabilitas hasil pengukuran dengan banyak cara, tergantung pada persepektif dan asumsi yang dipakai. Sudut pandang teori skor murni klasik menunjukkan ada banyak koefisien reliabilitas dikembangkan oleh para ahli. Prosedur dan parameter yang dipakai oleh koefisien tersebut berbeda antara satu dengan lainnya. SPSS (2004) membagi bahwa formula estimasi reliabilitas dilihat dari dua jenis, yaitu metode yang menekankan pada matrik kovarian dan metode yang tidak menekankan matrik kovarian.

Koefisien alpha dari Cronbach adalah formula yang paling populer berdasarkan kuantitas literatur yang memakainya dalam penelitian yang dilakukan. Sejumlah formula alternatif dari Koefisien Alpha juga dikembangkan, namun tidak banyak peneliti yang menggunakannya. Pada sub bab ini akan dipaparkan koefisien alpha dan beberapa koefisien yang banyak dipakai oleh peneliti. Pada bahasan ini koefisien reliabilitas ditekankan pada pengujian reliabilitas model konsistensi internal dari sudut pandang teori skor murni klasik.

a. Koefisien Lambda Guttman

Pada tahun 1945 Louis Guttman mencoba menyatukan beberapa konsep mengenai cara mengestimasi reliabilitas dengan menekankan pada reliabilitas skor komposit (Knapp, 2002). Hasilnya adalah enam formula reliabilitas yang dapat dikenakan pada beberapa situasi yang umumnya dikenakan melalui administrasi tunggal (single trial administration).

Dari keenam formula di atas, Guttman menemukan λ1 menghasilkan nilai yang lebih rendah dibanding λ2 dan λ3, dengan hubungan λ13 ≤λ2. Dapat dikatakan bahwa formula pertama merupakan estimasi reliabilitas pada batas interval terendah.

Referensi

Dokumen terkait

Pada pasien dengan dermatitis stasis, dapat kita perhatikan pada bagian betis, karena cedera pada sistem vena karena trauma atau pembedahan adalah faktor umum yang

d) Selama pemanasan, level boiler drum akan bergejolak. Jika level boiler drum terlalu tinggi dapat dibuang melalui blowdown valve. e) Tutup secara perlahan main steam drain

Analisis terhadap potensi wilayah secara teknis dapat dilakukan dengan memanfaatkan Sistem Informasi Geografis (SIG) untuk memberikan penilaian terhadap

Tujuan Penelitian berjudul Visualisasi Pembangkitan Supercontinuum Dalam Spektrum Ultraviolet dengan Perubahan Nilai pada Daya Maksimal Pulsa Masukan dan

Pada penelitian ini penulis menggunakan studi pustaka dengan melakukan pengumpulan data yang berhubungan dengan penelitian yaitu membaca sumber-sumber

Eτσι με έργα του Zέρι Mουταφιάν (1907- 1980) έχουμε τους τύπους του φωβι- σμού, του Eντουάρ Iσαμπεκιάν (1914) χαρακτηριστικά

Hasil penelitian ini menunjukkan bahwa dalam penanaman nilai-nilai kejujuran para guru MTs Negeri Sampit dengan cara menyisipkan pendidikan kejujuran pada setiap

Program dari gerakan UT Go Green adalah pengurangan penggunaan kertas sebagai sarana kerja, efisiensi penggunaan energy listrik, penghematan penggunaan air,