ANALISIS KARAKTERISTIK PSIKOMETRI SUBTES ZAHLEN REINHEN (ZR) PADA INTELLIGENZ STRUKTUR TEST (IST) SKRIPSI. Diajukan untuk Memenuhi Persyaratan

(1)

SKRIPSI

Diajukan untuk Memenuhi Persyaratan Ujian Sarjana Psikologi

Disusun Oleh:

ANDRIANI BUATON 131301104

FAKULTAS PSIKOLOGI UNIVERSITAS SUMATERA UTARA

2017

(2)

(3)

(4)

Intelligenz Struktur Test (IST) Andriani Buaton¹ dan Etti Rahmawati²

ABSTRAK

Tujuan dari penelitian ini adalah untuk melengkapi kajian karakteristik psikometri subtes ZR pada Intelligenz Struktur Test (IST). Proses yang dilakukan dalam penelitian ini meliputi analisis indeks kesukaran aitem, indeks daya diskriminasi aitem, analisis reliabilitas, dan analisis validitas dengan bukti konkuren. Penelitian ini menggunakan data primer yang diperoleh dengan memberikan tes secara klasikal kepada 167 sampel dengan rentang usia 17 sampai dengan 20 tahun. Berdasarkan hasil analisis indeks kesukaran aitem dan indeks daya diskriminasi aitem, ditemukan bahwa 15 dari 20 aitem memiliki kualitas aitem yang baik. Hasil estimasi reliabilitas tes dan validitas berdasarkan bukti konkuren menunjukkan bahwa subtes ZR masih valid namun tidak reliabel dalam mengukur tujuan pengukuran subtes ZR pada sampel dengan rentang usia 17 sampai 20 tahun.

Kata Kunci : Karakteristik Psikometri, Bukti Konkuren, Intelligenz Struktur Test (IST), Subtes ZR

1

1 Mahasiswa Fakultas Psikologi Universitas Sumatera Utara

2 Dosen Departemen Umum dan Eksperimen Fakultas Psikologi Universitas Sumatera Utara

(5)

Andriani Buaton¹ and Etti Rahmawati² ABSTRACT

The purpose of this study is to complete the analysis of pyschometric characteristic of subtes ZR of Intelligenz Struktur Tes (IST). The processes undertaken in this study includes the analysis of item-difficulty, item discrimination, analysis of reliability and validity with concurrent evidence. This study used primary data obtained by giving a classical tes to 167 samples with the age range from17 to 20 years. Based on the the result of the analysis of item- difficulty and item discrimination, it was found that 15 of the 20 items had good item quality. The estimation of test reliability and validity based on concurrent evidence showed that subtest ZR subtes is valid but not reliable in assessing the purpose of measuring subtest ZR. But, the result of this study is limited to the sample with an age range of 17 to 20 years.

Keywords : Psychometric Characteristic, Concurrent Evidence, Intelligenz Struktur Test (IST), Subtest ZR

2

1 Student of Faculty of Psychology, University of North Sumatera

2 Lecturer of Departement of General and Experimental Psychology, University of North Sumatera

(6)

Puji dan syukur peneliti ucapkan kepada Tuhan Yang Maha Kuasa karena atas karunia dan berkat rahmat-Nya maka peneliti dapat menyelesaikan penyusunan skripsi ini dengan baik dan tepat. Penyusunan skripsi yang berjudul “Karakteristik Psikometri Subtes Zahlen Reinhen (ZR) Pada Intelligenz Struktur Test (IST)”

merupakan salah satu syarat untuk dapat menyelesaikan ujian sarjana Psikologi di Fakultas Psikologi Universitas Sumatera Utara Medan. Maksud penelitian ini adalah untuk menggambarkan karakteristik psikomteri subtes ZR.

Peneliti menyadari bahwa dalam menyelesaikan penyusunan skripsi ini, peneliti menerima banyak bantuan dan bimbingan dari berbagai pihak. Oleh karena itu, dalam kesempatan ini, peneliti ingin mengucapkan terima kasih kepada:

1. Bapak Zulkarnain, Ph.D, Psikolog, selaku Dekan Fakultas Psikologi Universitas Sumatera Utara.

2. Ibu Etti Rahmawati, M. Si. selaku dosen pembimbing yang banyak membantu peneliti dengan membagi ilmu, memberi masukan dan dorongan, dan memberikan waktu untuk membimbing peneliti sehingga peneliti dapat menyelesaikan penyusunan skripsi ini.

3. Ibu Debby Anggareni, M.Psi, psikolog selaku dosen pembimbing akademik yang senantiasa membimbing peneliti dalam proses perkualiahan.

4. Ibu Ika Sari Dewi, M.Pd, Psikolog, Kak Dina Nazriani, MA dan Kak Amalia Meutia M.Psi, psikolog yang merupakan dosen di Departemen Umum dan Eksprimen yang memberikan masukan dan bantuan serta bersedia

(7)

5. Ibu Yossie, Ibu Rodiatul Hasanah, Pak Ferry Novliadi, dan Kak Dian Ulfasari yang bersedia membantu peneliti untuk dapat melakukan pengambilan data di kelas Mahasiswa Psikologi USU Angkatan 2016.

6. Bapak, mama, bang Rio, Yanuari, Rohani, dan Apriani yang senantiasa mendukung peneliti dan memberikan motivasi serta perhatian bagi peneliti untuk dapat menyelesaikan skripsi ini.

7. Keluarga Besar Pomparan Op. Rumondang, Op. Melda, dan Op. Sarma yang juga turut andil dalam memberikan dukungan dan perhatian kepada peneliti selama proses penyusunan skripsi.

8. Bapa Uskup Keuskupan Sibolga, Mgr. Ludovicus Simanullang, OFM.Cap dan Romo Blasius Super Yesse, pr yang telah memberikan motivasi rohani dan mendukung peneliti.

9. KITA (Pebri, Pesta, Ira), ACITAW (Dina, Cia, Iyo, Tari, dan Widiya), dan Wasti Simanjuntak yang senantiasa menjadi tempat sharing peneliti selama proses pengerjaan skripsi.

10. Teman-teman satu perjuangan skripsi di Departemen Umum dan Eksperimen khususnya mahasiswa bimbingan bu Etti (Kak Mida, Sinta, Nurul, dan Lila) yang turut membantu peneliti dalam menyelesaikan skripsi ini.

11. Ester, Bang Rodho, Kak Dika, Kak Ester yang bersedia menjadi tester untuk membantu peneliti dalam pengambilan data.

12. Adik-adik Mahasiswa Psikologi USU Angkatan 2016 yang bersedia membantu peneliti dalam proses pengambilan data.

(8)

skripsi ini.

Peneliti menyadari bahwa masih banyak kekurangan dalam skripsi ini.

Oleh karena itu, peneliti mengharapkan segala kritik, saran dan masukan untuk kesempurnaan skripsi ini. Akhir kata, peneliti mengucapkan terima kasih dan semoga penelitian ini dapat bermanfaat bagi berbagai pihak.

Medan, 03 Agustus 2017

Andriani Buaton 131301104

(9)

ABSTRACT ... ii

KATA PENGANTAR ... iii

DAFTAR ISI ... vi

DAFTAR TABEL... ix

DAFTAR RUMUS ... x

DAFTAR LAMPIRAN ... xi

BAB I PENDAHULUAN ... 1

A. Latar Belakang ... 1

B. Rumusan Masalah ... 10

C. Tujuan Penelitian ... 11

D. Manfaat Penelitian ... 11

1. Manfaat Teoritis ... 11

2. Manfaat Praktis ... 11

E. Sistematika Penulisan... 12

F. Kerangka Berpikir ... 13

BAB II TINJAUAN PUSTAKA ... 14

A. Intelligenz Struktur Tes (IST) ... 14

1. Sejarah Intelligenz Struktur Tes (IST) ... 14

2. Subtes-subtes dalam Intelligenz Struktur Tes (IST) ... 15

3. Penelitian Terdahulu Subtes ZR... 15

4. Kriteria Tes Lain yang Relevan dengan Subtes ZR ... 17

B. Karakteristik Psikometri ... 17

1. Validitas ... 18

a. Definisi validitas ... 18

b. Sumber Bukti Validitas ... 19

c. Faktor-Faktor yang Mempengaruhi Validitas ... 23

d. Interpretasi Koefisien Validitas... 27

2. Reliabilitas... 29

a. Definisi reliabilitas ... 29

b. Metode Estimasi Reliabilitas... 29

(10)

3. Indeks Kesukaran Aitem ... 35

4. Indeks Daya Diskriminasi Aitem ... 37

C. Analisis Karakteristik Psikometri Subtes ZR Pada IST ... 38

BAB III METODE PENELITIAN ... 43

A. Jenis Penelitian ... 43

B. Subjek Penelitian ... 43

1. Populasi dan sampel penelitian ... 43

2. Teknik Pengambilan Sampel ... 44

C. Data Penelitian ... 45

D. . Prosedur Pelaksanaan Penelitian ... 45

1. Pembuatan Proposal ... 45

2. Persiapan Izin Penelitian ... 45

3. Pelaksanaan Penelitian ... 45

4. Analisis Data ... 46

E. Metode Pengumpulan Data ... 46

F. Analisis Data ... 46

1. Analisis Validitas ... 46

2. Analisis Reliabilitas ... 47

3. Analisis Indeks Kesukaran Aitem ... 48

4. Analisis Indeks Daya Diskriminasi Aitem ... 48

BAB IV HASIL DAN PEMBAHASAN... 50

A. Deskripsi Umum Data Penelitian... 50

B. Deskripsi Hasil Penelitian ... 51

1. Hasil Analisis Indeks Kesukaran Aitem ... 51

2. Hasil Analisis Indeks Daya Diskriminasi Aitem ... 51

3. Seleksi Aitem Berdasarkan Indeks Daya Diskriminasi Aitem dan Indeks Kesukaran Aitem... 53

4. Hasil Analisis Validitas Berdasarkan Bukti Konkuren ... 54

5. Hasil Analisis Reliabilitas ... 54

6. Analisis Tambahan TKD 6... 54

(11)

c. Seleksi Aitem Berdasarkan Indeks Daya

Diskriminasi Aitem dan Indeks Kesukaran Aitem... 56

d. Hasil Analisis Reliabilitas ... 57

C. Pembahasan... 57

BAB V KESIMPULAN DAN SARAN ... 66

DAFTAR PUSTAKA ... 68

LAMPIRAN ... 70

(12)

Tabel 1. Kategori Batasan Nilai p ... 36

Tabel 2. Evaluasi Indeks Diskriminasi Aitem ... 38

Tabel 3. Proporsi Sampel Penelitian Berdasarkan Usia ... 50

Tabel 4. Proporsi Sampel Penelitian Berdasarkan Jenis Kelamin ... 50

Tabel 5. Hasil Analisis Indeks Kesukaran Aitem Subtes ZR ... 51

Tabel 6. Rangkuman Analisis Indeks Kesukaran Aitem Subtes ZR ... 51

Tabel 7. Hasil Analisis Indeks Daya Diskriminasi Aitem Subtes ZR ... 52

Tabel 8. Rangkuman Analisis Indeks Daya Diskriminasi Aitem Subtes ZR ... 52

Tabel 9. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya Diskriminasi Aitem Subtes ZR ... 53

Tabel 10. Rangkuman Analisis Aitem Subtes ZR ... 54

Tabel 11. Hasil Analisis Indeks Kesukaran Aitem TKD 6 ... 55

Tabel 12. Rangkuman Analisis Indeks Kesukaran Aitem TKD 6... 55

Tabel 13. Hasil Analisis Indeks Daya Diskriminasi Aitem TKD ... 55

Tabel 14. Rangkuman Analisis Indeks Daya Diskriminasi Aitem TKD 6... 56

Tabel 15. Seleksi Aitem Berdasarkan Indeks Kesukaran Aitem dan Indeks Daya Diskriminasi Aitem TKD 6 ... 56

Tabel 16. Rangkuman Analisis Aitem TKD 6 ... 57

(13)

Rumus 1. Koefisien korelasi Pearson-Product Moment ... 46

Rumus 2. KR-20 ... 47

Rumus 3. Indeks Kesukaran Aitem ... 48

Rumus 4. Indeks Daya Diskriminasi Aitem ... 48

(14)

Lampiran 1 Output Analisis Korelasi Subtes ZR Dan TKD 6 ... 70 Lampiran 2 Hasil Analisis Reliabilitas Subtes ZR Dengan Formula KR-20 ... 71 Lampiran 3 Hasil Analisis Reliabilitas TKD 6 Dengan Formula KR-20... 72

(15)

A. Latar Belakang

Psikologi adalah ilmu yang mempelajari perilaku dan proses mental (Lahey, 2012). Pada masa sekarang ini, ilmu psikologi semakin berkembang dalam masyarakat umum. Penerapan dari ilmu psikologi ini banyak ditemukan dari banyaknya jasa pelayanan psikologi yang dapat dipergunakan oleh masyarakat saat ini. Salah satu diantaranya adalah penggunaan tes psikologi. Saat ini, hampir dalam setiap bidang kehidupan manusia banyak yang menggunakan tes psikologi. Tes psikologi oleh Urbina (2004) didefinisikan sebagai prosedur sistematis untuk memperoleh sampel perilaku yang relevan dengan fungsi kognitif maupun afektif, dan untuk penilaian serta evaluasi sampel yang sesuai dengan standar yang berlaku.

Tes psikologi digunakan untuk mengukur perbedaan antar individu maupun mengukur perbedaan reaksi individu yang sama dalam kondisi yang berbeda (Anastasi & Urbina, 1997). Respon maupun hasil pengukuran individu tersebut dapat memberikan suatu kesimpulan. Kesimpulan inilah yang menjadi dasar dalam pengambilan keputusan (Osterlind, 2010). Pengambilan keputusan biasanya dilakukan dalam proses seleksi, klasifikasi, dan diagnosa baik pada individu, kelompok, organisasi, maupun program tertentu (Urbina, 2004). Dengan adanya fungsi tersebut, tes psikologi harus mampu untuk mengungkap aspek- aspek psikologis dalam diri individu terkait pengambilan keputusan.

Menurut Kaplan & Saccuzzo (2009), tes psikologi terbagi menjadi dua

(16)

mengukur trait ataupun temperamen individu. Tes kemampuan digunakan untuk mengukur keahlian individu dalam hal kecepatan dan ketepatan. Tes kepribadian terbagi atas dua jenis, yaitu tes objektif dan tes proyektif. Sedangkan tes kemampuan terbagi menjadi tiga, yaitu tes prestasi, tes bakat, dan tes inteligensi.

Tes kepribadian dan tes kemampuan telah digunakan dalam berbagai konteks kehidupan manusia seperti pendidikan, pekerjaan, dan klinis. Dalam konteks pendidikan, digunakan untuk mengidentifikasi kecepatan belajar seseorang, mengklasifikasi individu berdasarkan kemampuan dalam menyerap informasi, pemilihan jurusan, dan seleksi masuk sekolah dan perguruan tinggi.

Dalam konteks pekerjaan, digunakan untuk menyeleksi dan mengklasifikasi sumber daya manusia serta promosi karyawan. Dalam konteks klinis, digunakan untuk mengidentifikasi individu yang memiliki keterbelakangan mental maupun gangguan psikologis. Dari ketiga konteks yang telah dijelaskan sebelumnya, yaitu konteks pendidikan, pekerjaan, dan klinis, tes yang umumnya dipakai adalah tes inteligensi (Anastasi & Urbina, 1997).

Secara khusus, tes inteligensi sering dipakai dalam proses seleksi pada konteks pendidikan dan pekerjaan. Tes inteligensi digunakan sebagai penyaringan tahap awal dalam proses seleksi. Hal ini dibuktikan dengan kutipan wawancara yang dilakukan peneliti kepada psikolog Industri dan Organisasi yang mengatakan bahwa dalam proses seleksi, tes inteligensi biasanya diberikan di awal rangkaian pelaksanaan tes (Komunikasi Personal, 25 November 2016). Dalam proses seleksi, tes inteligensi umumnya digunakan untuk memprediksi kinerja pekerjaan individu dan kemampuannya tehadap bidang yang dilamar (Anastasi & Urbina, 1997). Hal ini didukung dengan pernyataan Kaplan & Sacuzzo (2009) bahwa tes

(17)

inteligensi mengukur potensi yang dimiliki individu dalam pemecahan masalah, kemampuan beradaptasi dengan perubahan suatu kondisi dan kemampuan untuk belajar dari pengalaman. Potensi dan kemampuan yang diukur dengan tes inteligensi menjadi bagian penting dalam menyeleksi individu. Dengan demikian, kualitas dari tes inteligensi penting untuk diperhatikan.

Beberapa contoh tes inteligensi yang masih digunakan untuk penyeleksian ialah Advanced Progressive Matrices, Culture Fair Intelligence Test (CFIT), Tes Kemampuan Dasar (TKD), dan Intelligenz Struktur Test (IST). Tes-tes inteligensi ini juga masih dipakai di beberapa biro psikologi di Kota Medan (Biro A, B, C, dan D). Namun, tes inteligensi yang sering digunakan digunakan perusahaan maupun beberapa biro psikologi di Kota Medan untuk proses seleksi ialah IST.

IST merupakan tes psikologi yang dikembangkan pertama kali oleh Rudolf Amthaeur di Jerman pada tahun 1953. Di Indonesia, tes ini diadaptasi oleh Fakultas Psikologi Universitas Padjajaran (selanjutnya disebut UNPAD) pada tahun 1973. Selain mengukur inteligensi, tes ini juga dapat digunakan untuk melihat bakat (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Di Indonesia, IST digunakan untuk seleksi dan promosi karyawan dalam konteks pekerjaan. IST disusun berdasarkan teori Thurstone tentang kemampuan mental dasar (primary mental abilities). Kemampuan mental dasar terdiri dari tujuh faktor yaitu faktor verbal (V), number (N), perceptual (P), spasial (S), word fluency (W), memory (M), dan reasoning (R) yang menghasilkan multiple intelligence. Adapun kecerdasan yang dihasilkan dari penggunaan IST adalah kecerdasan verbal, angka, figural, dan ingatan (LPSP3 UI, 2012). Dengan diperolehnya multiple intelligence dari aspek pengukuran IST inilah yang menjadi

(18)

alasan mengapa IST saat ini masih banyak dipakai dalam seleksi pekerjaan oleh perusahaan-perusahaan. Hal ini dapat dibuktikan dengan wawancara yang dilakukan dengan tester di beberapa biro psikologi di Kota Medan yang mengatakan bahwa dengan hanya menggunakan IST, dapat diperoleh hasil secara keseluruhan yang tidak dimiliki tes inteligensi lainnya (Komunikasi Personal, 23 Januari 2017). Selain itu dikatakan juga bahwa untuk seleksi biasanya memang menggunakan IST karena IST terdiri dari 9 subtes. Kesembilan subtesnya ini mampu menggambarkan inteligensi lebih lengkap dibandingkan tes inteligensi lainnya (Komunikasi Personal, 09 September 2017).

Berdasarkan hasil pengamatan oleh peneliti, IST sudah tersebar di internet.

Hal ini dibuktikan peneliti dengan ditemukannya beberapa website yang memuat aitem dalam IST hanya dengan sekali pencarian. Tentunya kebocoran soal ini akan berdampak pada penggunaan tes itu sendiri. Masyarakat yang telah mengetahuinya juga dapat mengalami proses belajar dan proses mengingat terhadap aitem-aitem, cara penyelesaian beserta jawaban yang ada di dalam IST tersebut. Hal demikian tentu akan menyebabkan semua aitem menjadi mudah untuk dikerjakan oleh individu. Murphy & Davidshofer (2005) menyatakan bahwa ketika suatu aitem dalam sebuah tes tergolong mudah maka kemampuannya untuk membedakan kelompok yang atributnya diukur menjadi diragukan, sehingga dapat dikatakan bahwa kualitas aitem tersebut tidak baik.

Kualitas aitem yang tidak baik akan menyebabkan validitas dan reliabilitas suatu alat tes menjadi terganggu.

IST terdiri atas sembilan subtes, yaitu Satzergaenzung (SE), Wortauswahl (WA), Analogien (AN), Gemeinsamkeiten (GE), Merkaufgaben (ME),

(19)

Rechenaufgaben (RA), Zahlenreinhen (ZR), Figurenauswahl (FA), dan Wuerfelaufgaben (WU). Kesembilan subtes ini dapat digunakan secara keseluruhan maupun hanya satu subtes saja (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Berdasarkan pengamatan peneliti terhadap IST, kesembilan subtes IST telah dianalisis karakteristik psikometrinya dengan uji validitas bukti struktur internal dengan pendekatan Item Response Theory (IRT) dan metode multitrait-multimethod (MTMM). Dari analisis yang telah dilakukan, ditemukan bahwa IST memiliki karakteristik psikometri yang kurang baik.

Penelitian dengan pendekatan IRT dilakukan oleh Rahmawati (2014). Dari hasil analisis IRT dengan menggunakan kriteria peluang tebakan, indeks kesukaran aitem, dan indeks daya diskriminasi, ditemukan bahwa hanya 45,625%

dari 160 aitem IST yang masih memiliki karakteristik psikometri yang dianggap baik. Penelitian yang menggunakan metode MTMM dilakukan pada tahun 2011.

Dalam penelitian dengan metode ini, peneliti mengkorelasikan antar subtes pada IST. Hal ini tampak dalam penelitian yang dilakukan oleh Sirait & Garliah (2011), subtest WA dikorelasikan dengan kedelapan subtest lainnya dengan nilai korelasinya berada di atas 0.25. Nilai ini menunjukkan bahwa subtes WA sudah tidak sesuai lagi dengan tujuan awal pengukurannya. Adapun karakteristik dari IST menurut Polhaupessy (dalam Diktat Kuliah IST UNPAD, 2009) ialah korelasi antar subtesnya rendah dengan r = 0.25. Koefisien reliabilitas yang diperoleh dalam penelitian ini sebesar 0.650. Nilai ini menunjukkan bahwa subtes WA sebagai bagian dari IST tidak reliabel untuk digunakan sebagai tes inteligensi.

Penelitian yang dilakukan oleh Siregar & Rahmawati (2011) juga menemukan bahwa subtest AN memiliki korelasi yang tinggi dengan subtest

(20)

lainnya. Nilai korelasi subtest AN dengan kedelapan subtes lainnya berkisar dari antara 0.410 sampai dengan 0.676. Hal ini juga menunjukkan bahwa subtest AN sudah tidak sesuai lagi dengan tujuan awal pengukurannya. Koefisien reliabilitas yang diperoleh dalam penelitian ini sebesar 0.728. Nilai ini menunjukkan bahwa subtes AN sebagai bagian dari IST tidak reliabel untuk digunakan sebagai tes inteligensi.

Penelitian yang dilakukan oleh Sari & Rahmawati (2011) menemukan bahwa subtest RA memiliki korelasi yang cukup tinggi dengan kedelapan subtes lainnya yaitu berkisar dari 0,417 sampai dengan yang paling tinggi yaitu 0,999.

Penelitian pada subtes SE dilakukan oleh Elvira & Rahmawati (2011) yang menemukan bahwa terdapat korelasi yang cukup tinggi antara subtest SE dengan subtes lainnya dalam IST, dengan kisaran nilai korelasi sebesar 0.379 sampai 0,676. Hal ini juga menunjukkan bahwa subtest RA dan SE sudah tidak sesuai lagi dengan tujuan awal pengukurannya. Koefisien reliabilitas yang diperoleh dalam penelitian subtes RA sebesar 0.851 dan subtes SE sebesar 0.73. Nilai ini menunjukkan bahwa subtes RA dan SE sebagai bagian dari IST tidak reliabel untuk digunakan sebagai tes inteligensi.

Pada tahun 2011, subtes ZR juga dilakukan uji validitasnya oleh Princen &

Rahmawati. Hasil yang ditemukan ialah koefisien validitas dari uji validitas konvergen yang dilakukan dengan mengkorelasikan subtest ZR dengan subtes RA sebesar 0.758. Uji validitas diskriminannya dilakukan dengan mengkorelasikan subtest ZR dengan subtest WU dan hasil yang diperoleh sebesar 0.372. Hal ini juga menunjukkan bahwa subtest ZR sudah tidak sesuai lagi dengan tujuan awal pengukurannya. Koefisien reliabilitas yang diperoleh dalam penelitian ini sebesar

(21)

0.882. Nilai ini menunjukkan bahwa subtes ZR sebagai bagian dari IST tidak reliabel untuk digunakan sebagai tes inteligensi.

Berdasarkan analisis IST yang telah dilakukan, maka penting untuk dilakukan analisis lebih lanjut pada IST mengingat tes ini masih digunakan hingga saat ini. Oleh karena itu, peneliti tertarik untuk menganalisis karakteristik psikometri dari IST namun berfokus kepada satu subtes saja, yaitu subtest ZR.

Peneliti memilih subtes ZR karena dari pengamatan yang dilakukan oleh peneliti, peneliti menemukan bahwa deret angka (aitem subtes ZR) telah dipelajari sejak SMP. Aitem-aitem berbentuk deret angka juga dapat ditemukan di berbagai sumber. Hal tersebut dapat menimbulkan adanya proses belajar yang dilakukan individu terhadap aitem subtest ZR.

Selain itu, peneliti juga menemukan bahwa subtes ZR pada umumnya lebih sering digunakan dibandingkan subtes IST lainnya ketika subtes dalam IST digunakan secara terpisah. Seperti yang dijelaskan oleh Polhaupessy (dalam Diktat Kuliah IST UNPAD, 2009), kesembilan subtes dalam IST dapat digunakan secara keseluruhan maupun hanya satu subtes saja. Pada analisis subtest ZR yang dilakukan dengan pendekatan IRT, ditemukan bahwa keseluruhan aitem tersebut memiliki kriteria peluang tebakan dibawah 0.35. Dari 20 aitem, hanya 10 aitem yang indeks daya diskriminasinya berada dibawah 2,00 dan hanya 19 aitem yang tingkat kesukarannya lebih besar dari -2,00 (Rahmawati, 2014).

Berdasarkan analisis MTMM pada subtest ZR, ditemukan koefisien validitas konvergennya (dikorelasikan dengan RA) sebesar 0.758 dan validitas diskriminannya (dikorelasikan dengan WU) sebesar 0.372. Koefisien reliabilitas dari subtes ini sebesar 0,882. Dari analisis indeks diskriminasi aitemnya, 19 dari

(22)

20 aitem dinilai sangat baik dengan nilai indeks diskriminasi aitemnya diatas 0,4.

Dari analisis indeks kesukaran aitem, hanya 6 aitem yang memiliki nilai p dibawah 0,3. Berdasarkan analisis yang dilakukan, secara keseluruhan aitem subtes ZR memiliki kualitas aitem yang baik, namun validitas dan reliabilitasnya sebagai tes inteligensi masih belum cukup baik untuk digunakan (Princen, 2011).

Selain dengan uji validitas konstrak, subtes ZR juga memiliki analisis karakteristik psikometri yang cukup lengkap dengan dianalisisnya subtes ZR menggunakan validitas bukti prediktif. Hasil analisisnya menunjukkan bahwa subtes ZR tidak mampu untuk membedakan kemampuan IPA dan IPS pada siswa SMA kelas X (Tiarsarani, 2008).

Berdasarkan alasan yang telah dipaparkan sebelumnya, maka peneliti tertarik untuk melanjutkan menganalisis subtes ZR. Analisis ini penting dilakukan untuk memberikan informasi apakah subtes ZR masih valid dan reliabel untuk digunakan. Hal yang membedakan penelitian ini dari penelitian lain sebelumnya adalah peneliti menganalis validitas subtest ZR menggunakan bukti konkuren yang dalam hal ini dilakukan dengan mengkorelasikan subtes ZR dengan tes yang sejenis yaitu TKD 6.

Peneliti memilih untuk menguji validitas kriteria dengan bukti konkuren karena metode pengujiannya yang praktis dan waktu pelaksanaannya yang singkat untuk dilakukan (Murphy & Davidshofer, 2005). Selain itu, analisis dalam metode ini mudah dilakukan karena dengan mengkorelasikan skor subtes ZR dengan skor TKD 6 sebagai kriteria maka akan diperoleh koefisien validitas dari suatu tes yang dapat dipercaya.

(23)

Selain itu, dengan dilakukannya analisis menggunakan validitas dengan bukti konkuren dapat memberikan kajian subtes ZR yang lebih komprehensif setelah dilakukannya berbagai analisis karakteristik psikometri dengan sumber validitas berdasarkan struktur internal dan validitas dengan bukti prediktif. Hal ini didukung dengan pernyataan dalam Osterlind (2010) bahwa validitas itu harus dibuktikan dari berbagai sumber yang ada. Dalam uji validitas dengan bukti konkuren, setiap hasil ukur yang relevan dengan tujuan tes dapat dijadikan sebagai kriteria (Azwar, 2012). Maka dalam penelitian ini, uji validitas dilakukan dengan mengorelasikan subtes ZR dengan tes inteligensi lainnya yang mengukur atribut yang sama dengan subtes ZR.

Tes inteligensi yang dinilai memiliki tujuan tes yang relevan dengan subtes ZR ialah Tes Kemampuan Dasar (TKD) 6. TKD 6 dipilih dengan alasan tes ini mengukur atribut yang sama dengan subtest ZR, yaitu deret angka. TKD 6 sebagai bagian dari TKD juga disusun berdasarkan teori kemampuan mental dasar Thurstone. Oleh karena itu, dengan adanya kesamaan ini, maka TKD 6 tepat untuk dijadikan kriteria. Jika ditemukan korelasi yang tinggi antara subtes ZR dengan TKD 6 maka dapat dikatakan bahwa kedua tes tersebut mengukur hal yang sama dan subtes ZR memiliki validitas konkuren yang baik.

Selain menganalisis dengan menggunakan sumber validitas yang lain, perbedaan penelitian yang dilakukan oleh peneliti dengan penelitian yang dilakukan oleh peneliti-peneliti sebelumnya ialah penelitian ini menggunakan data primer yang diperoleh langsung dari pelaksanaan tes pada mahasiswa Psikologi USU 2016. Dengan pengambilan data secara langsung, maka proses pelaksanaan tes yang dilakukan dalam penelitian ini dapat dikontrol oleh peneliti.

(24)

Berdasarkan pemaparan yang telah dijelaskan sebelumnya, peneliti memilih untuk mengevaluasi karakteristik psikometri subtes ZR pada IST dengan cara mengestimasi indeks kesukaran aitem dan indeks daya diskriminasi aitem, mengestimasi koefisien reliabilitas, dan memvalidasi berdasarkan bukti hubungan dengan variabel lain dan. Hal ini penting dilakukan untuk mengetahui apakah subtes ZR pada IST masih memiliki kualitas aitem yang baik atau tidak. Azwar (2012) menyatakan bahwa sebuah tes akan dinilai baik jika aitem dalam tes tersebut baik dan aitem yang baik akan menghasilkan pengukuran yang baik.

Selain itu, penelitian ini penting dilakukan untuk mengetahui apakah hasil subtes ZR pada IST masih valid dan reliabel sesuai dengan tujuan pengukurannya, Dengan demikian, evaluasi karakteristik psikometri subtes ZR pada IST yang dilakukan dapat memberikan informasi apakah IST masih layak untuk digunakan atau tidak.

B. Rumusan Masalah

Peneliti melihat perlunya dilakukan pengujian terhadap indeks kesukaran aitem, indeks daya diskriminasi aitem, reliabilitas, dan validitas meskipun pengujian ini sudah pernah dilakukan oleh peneliti sebelumnya. Validasi pada penelitian sebelumnya dilakukan berdasarkan bukti struktur internal. Pengujian dengan bukti validitas yang lain penting dilakukan untuk memberikan kajian yang komprehensif mengenai IST apakah tes ini masih baik digunakan hingga saat ini.

Hal tersebut perlu dilakukan dengan pertimbangan tes ini telah bocor namun tes ini masih digunakan hingga saat ini. Berdasarkan permasalahan tersebut, peneliti merumuskan empat pertanyaan, yaitu :

(25)

1. Berapa indeks kesukaran aitem subtes ZR pada IST?

2. Berapa indeks daya diskriminasi aitem subtes ZR pada IST?

3. Berapa koefisien reliabilitas subtes ZR pada IST?

4. Apakah subtes ZR pada IST terbukti valid digunakan ditinjau berdasarkan hubungan dengan TKD 6?

C. Tujuan Penelitian

Tujuan penelitian ini ialah untuk mendapatkan informasi apakah IST khususnya subtes ZR masih berfungsi sesuai dengan tujuan pengukuran subtes ZR dengan cara mengestimasi indeks kesukaran aitem dan indeks daya diskriminasi aitem, mengestimasi koefisien reliabilitas, dan memvalidasi berdasarkan bukti hubungan dengan variabel lain.

D. Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan manfaat teoritis maupun praktis, sebagai berikut :

1. Manfaat Teoritis

Hasil dari penelitian ini diharapkan dapat bermanfaat bagi ilmu psikologi mengenai pengkajian alat ukur dan untuk memberikan data empiris mengenai karakteristik psikometri IST khususnya subtest ZR apakah masih berfungsi sesuai dengan tujuan awalnya.

2. Manfaat Praktis

Hasil dari penelitian ini diharapkan mampu memberikan informasi yang menjadi pertimbangan penting bagi para praktisi yang memakai IST khususnya subtes ZR sebagai alat dalam pengambilan keputusan.

(26)

E. Sistematika Penelitian

Sistematika penulisan dalam penelitian ini adalah : Bab I : Pendahuluan

Bab ini berisikan latar belakang, rumusan masalah, tujuan penelitian, manfaat penelitian, sistematika penelitian dan kerangka berpikir.

Bab II : Tinjauan Pustaka

Bab ini berisikan teori mengenai IST, Subtes ZR, TKD 6 dan teori mengenai validitas, reliabilitas, indeks kesukaran aitem dan indeks daya diskriminasi aitem, serta analisis karakteristik psikometri subtes ZR.

Bab III : Metode Penelitian

Bab ini berisikan mengenai metode penelitian yaitu jenis penelitian, subjek penelitian, data penelitian, prosedur pelaksanaan penelitian, metode pengumpulan data dan analisis data.

Bab IV : Hasil dan Pembahasan

Bab ini berisikan gambaran subjek penelitian, deskripsi hasil analisis validitas, reliabilitas, indeks kesukaran aitem, dan indeks diskriminasi aitem serta pembahasan mengenai seluruh hasil yang diperoleh dalam penelitian ini.

Bab V : Kesimpulan dan Saran

Bab ini berisikan kesimpulan mengenai hasil yang diperoleh dari analisis data, saran metodologis untuk penelitian berikutnya dan saran praktis bagi para praktisi yang mau menggunakan IST.

(27)

KERANGKA BERPIKIR

Tes Prestasi

Tes Bakat Tes

Intelegensi

Intelligenz Struktur Test (IST)

validitas konstraknya baik Hasil analisis ITR :

a. peluang tebakan

<0.35

b. tingkat kesukaran

>-2.00 c. indeks daya

diskriminasi <2.00 Hasil analisis MTMM a. pxix2 <0.9

b. d >0.4 c. p<0.3

ZR

RA WA SE

Tes Psikologi

AN

Tes Kepribadian

GE ME

Tes Kemampuan

FA WU

Analisis Karakteristik Psikometri Subtes ZR pada IST

Dilakukan dengan TKD 6 karena adanya kesamaan seperti:

- Disusun

berdasarkan teori kemampuan mental dasar oleh L.L Thurstone

- mengukur atribut yang sama yaitu kemampuan berpikir dengan angka

Pengujian dengan sumber bukti validitas yang lain,

yaitu bukti validitas berdasarkan hubungan dengan variabel yang lain

Pernah dilakukan uji validitas berdasarkan struktur internal

(28)

A. Intelligenz Struktur Test (IST)

Tes yang digunakan dalam penelitian ini adalah IST. Dalam bab ini akan dijelaskan berbagai hal tentang IST, yaitu sejarah IST dan subtes-subtes dalam IST. Dalam penelitian ini, peneliti akan berfokus kepada satu subtes saja yaitu subtes ZR. Penjelasan subtes ZR dalam bab ini meliputi deskripsi dan penelitian terdahulu subtes ZR. Selain itu, dalam bab ini juga akan dijelaskan tentang kriteria tes lain yang relevan dengan subtes ZR yaitu TKD 6. TKD 6 merupakan tes yang akan dikorelasikan dengan subtes ZR dalam pengujian validitas.

1. Sejarah Intelligenz Struktur Test (IST)

IST merupakan salah satu tes inteligensi yang dikembangkan oleh Rudolf Amthauer pada tahun 1953 di Jerman dengan berlandaskan teori L.L Thurstone mengenai kemampuan mental dasar (LPSP3UI, 2012). Inteligensi didefinisikan oleh Amthauer sebagai keseluruhan struktur dari kemampuan-kemampuan jiwa dan rohani manusia yang memberikan kemampuan bagi manusia untuk bertindak sebagai pelaksana dalam dunianya. Inteligensi dapat diketahui lebih jelas melalui prestasi yang dicapai individu atau hasil suatu tes yang mengukur inteligensi (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Dengan adanya pemikiran tersebut, Amthauer menyusun sebuah tes yang dapat mengukur inteligensi, yaitu IST dengan hipotesis kerja sebagai berikut :

“Komponen dalam struktur tersebut tersusun secara hierarkis;

maksudnya bidang yang dominan kurang lebih akan berpengaruh pada bidang-bidang yang lain; kemampuan yang dominan dalam struktur inteligensi akan menentukan dan mempengaruhi kemampuan yang lainnya.”

(29)

Amthauer menyusun IST sebagai baterai tes yang terdiri dari 9 subtes (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009). Karakteristik dari baterai tes Amthauer ditunjukkan dengan interkorelasi yang rendah antar subtesnya (r=0.25) dan korelasi antara satu subtes dengan keseluruhan subtes yang rendah pula (r=0.60) (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009).

Di Indonesia, IST yang digunakan adalah IST hasil adaptasi Fakultas Psikologi UNPAD Bandung. Adaptasi dilakukan kepada IST-70. Tes ini pertama kali digunakan oleh Psikolog Angkatan Darat Bandung, Jawa Barat (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009).

2. Subtes-subtes dalam Intelligenz Struktur Test (IST)

IST terdiri dari sembilan subtes yang memiliki batas waktu yang berbeda- beda dan diadministrasikan dengan menggunakan buku manual (LPSP3UI, 2012).

Sembilan subtes dalam IST adalah Satzergaenzung (SE), Wortauswahl (WA), Analogien (AN), Gemeinsamkeiten (GE), Merkaufgaben (ME), Rechenaufgaben (RA), Zahlenreinhen (ZR), Figurenauswahl (FA), dan Wuerfelaufgaben (WU) (Polhaupessy dalam Diktat Kuliah IST UNPAD, 2009)

3. Penelitian Terdahulu Subtes ZR

Penelitian tentang subtes ZR pernah dilakukan oleh Tiarsarani (2008) untuk menguji validitas konstrak dan validitas bukti prediktif serta reliabilitasnya mengingat tes ini sering dipakai terutama dalam proses seleksi mahasiswa baru.

Hasil yang ditemukan oleh peneliti menunjukkan bahwa ada empat aitem dalam subtes ZR memiliki indeks daya diskriminasi aitem yang tidak baik, validitas konstraknya baik namun validitas prediktifnya tidak baik, dan subtes ZR dinilai reliabel.

(30)

Penelitian tentang subtes ZR pernah dilakukan oleh Princen & Rahmawati (2011) dengan alasan norma yang digunakan dalam IST belum pernah diperbaharui, belum pernah dilakukannya evaluasi terhadap IST sejak IST diadaptasi di Indonesia pada tahun 1973, dan kebocoran yang mungkin terjadi karena IST telah digunakan selama bertahun-tahun tanpa adanya revisi.

Hasil penelitian yang diperoleh oleh Princen & Rahmawati (2011) ialah indeks kesulitan aitem subtes ZR memuaskan dengan rincian 6 aitem tergolong sulit, 9 aitem tergolong sedang, dan 5 aitem tergolong mudah. Namun, penyusunan aitemnya masih belum sesuai dengan urutan penyajian (dari aitem mudah ke aitem sulit). Berdasarkan analisis indeks diskriminasi aitem, ditemukan bahwa kualitas aitemnya baik yang ditunjukkan dengan 19 aitemnya memiliki indeks diskriminasi yang baik (diatas 0.4) dan hanya 1 aitem yang indeks diskriminasinya kurang baik (dibawah 0.4).

Hasil dari seleksi aitem berdasarkan indeks kesukaran aitem dan indeks diskriminasi aitem ditemukan bahwa 19 aitemnya layak diterima dan 1 aitem membutuhkan revisi. Dari analisis reliabilitas yang dilakukan, ditemukan bahwa subtes ZR tidak reliabel jika digunakan sebagai tes inteligensi dikarenakan nilai koefisien reliabilitas yang diperoleh sebesar 0.82. Dari analisis MTMM pada subtest ZR, ditemukan koefisien validitas konvergennya (dikorelasikan dengan RA) sebesar 0.758 dan validitas diskriminannya (dikorelasikan dengan WU) sebesar 0.372 (Princen & Rahmawati, 2011).

Penelitian tentang subtes ZR juga dilakukan oleh Rahmawati (2014) untuk melengkapi analisis IST dengan menggunakan pendekatan Item Response Theory (IRT). Hasil penelitian yang diperoleh ialah seluruh aitem memiliki kriteria

(31)

peluang tebakan dibawah 0.35, 19 aitem memiliki tingkat kesukaran diatas -2.00 dan 10 aitem memiliki indeks daya diskriminasi dibawah 2.00 (Rahmawati, 2014).

4. Kriteria Tes Lain yang Relevan dengan Subtes ZR

Pengujian validitas yang dilakukan dalam penelitian ini adalah uji validitas berdasarkan hubungan dengan variabel lain. Dalam uji validitas ini diperlukan tes lain yang menjadi kriteria pengukurannya. Menurut Gregory (2004), karakteristik dari kriteria yang digunakan adalah kriteria yang dipilih harus reliabel, relevan (mengukur hal yang mirip atau identik dengan tes yang divalidasi) dan bebas dari kontaminasi. Tes lain yang dinilai oleh peneliti relevan dengan subtes ZR adalah Tes Kemampuan Diferensial (TKD) 6. Dikatakan relevan karena baik subtes ZR maupun TKD 6 mengukur hal yang sama dan aitem yang disajikan juga sama yaitu deret angka.

TKD 6 merupakan salah satu subtes dari TKD. TKD dikonstrak berdasarkan teori L.L Thurstone tentang kemampuan mental dasar yang terdiri dari 7 faktor kemampuan mental primer, yaitu kemampuan verbal, kemampuan kelancaran kata, kemampuan numerik, kemampuan keruangan, kemampuan ingatan, kecepatan persepsi, dan kemampuan menalar (LPSP3UI, 2011). Dengan demikian, adanya kesamaan teori penyusun tes yaitu kedua tes sama-sama dikonstrak dengan teori L.L Thurstone tentang kemampuan mental dasar maka dapat dikatakan bahwa TKD 6 relevan menjadi kriteria bagi subtes ZR.

B. Karakteristik Psikometri

Metode psikometri merupakan perhitungan matematis dengan statistika tentang rancangan alat tes dan pengukuran psikologi. Metode psikometri

(32)

dilakukan untuk membuat interpretasi terhadap hasil tes lebih valid. Validitas dari suatu tes juga terkait dengan reliabilitas suatu tes (Osterlind, 2010). Oleh karena itu, dalam bagian ini akan disajikan data yang berkaitan dengan validitas dan reliabilitas.

Metode psikometri juga berlaku untuk mengukur proses mental, maka konstrak yang diukur dikuantifikasikan melalui variabel dan dinyatakan melalui aitem dari suatu tes (Osterlind, 2010). Dengan demikan, analisis tentang aitem dari suatu tes juga akan dibahas dalam bagian ini. Murphy & Davidshofer (2005) menyatakan bahwa dalam analisis aitem ada tiga informasi yang disajikan, yaitu analisis indeks kesukaran aitem, indeks daya diskriminasi aitem, dan efektivitas distraktor. Namun yang akan dibahas dalam penelitian ini hanya dua saja yaitu analisis indeks kesukaran aitem dan indeks diskriminasi aitem.

1. Validitas

a. Definisi Validitas

Pada tahun 1973, Garret (dalam Osterlind, 2010) menyatakan bahwa validitas sebuah tes ditunjukkan ketika tes tersebut mampu mengukur apa yang seharusnya diukur. Namun, definisi validitas yang dikemukakan oleh Garret dinilai mengabaikan aspek psikologis. Oleh Osterlind (2010), validitas didefinisikan dengan sejauh mana informasi yang diperoleh dari hasil tes tersebut tepat, bermakna, dan berguna dalam pengambilan keputusan yang merupakan tujuan dari suatu pengukuran mental dan didukung dengan berbagai bukti.

Definisi validitas oleh Osterlind didukung dengan pernyataan Azwar (2012) yang menjelaskan bahwa validitas mengacu kepada ketepatan dan kecermatan alat tes dalam melakukan fungsi ukurnya. Jadi, validitas yang dikemukakan oleh

(33)

Azwar ditentukan oleh ketepatan dan kecermatan hasil pengukuran. Apabila alat tes tersebut mampu menjalankan fungsi ukurnya atau memberikan hasil tes yang sesuai dengan maksud dilakukannya pengukuran tersebut, maka tes tersebut dikatakan valid. Coaley (2010) pun menyatakan hal yang sama, yaitu suatu tes dikatakan valid apabila tes tersebut mampu mengukur apa yang seharusnya diukur. Dari definisi yang dikemukakan oleh Coaley, dapat dikatakan juga bahwa validitas dari suatu tes ditunjukkan ketika tes mampu memberikan hasil sesuai dengan tujuan dilakukannya suatu pengukuran. Hal ini sesuai dengan pernyataan Landy (dalam Coaley, 2010) bahwa orientasi validitas ialah hasil dari tes tersebut.

b. Sumber Bukti Validitas

Pengujian validitas dilakukan dengan mengumpulkan bukti-bukti dari berbagai sumber. Sumber yang dikumpulkan tersebut menyajikan informasi mengenai tingkat kepercayaan untuk membuat kesimpulan skor yang terdapat dalam berbagai situasi spesifik (Osterlind, 2010).

1) Bukti validitas berdasarkan konten tes

Evaluasi bukti validitas dilakukan dengan menggunakan informasi terkait konten pengukuran seperti konten domain (dalam tes berbasis domain) ataupun konstrak (dalam tes yang mengungkap latent trait). Adanya blueprint tes juga menjadi hal yang sangat penting dalam melakukan evaluasi bukti validitas berdasarkan konten tes. Selain itu, adanya penilai yang kompeten, bukti berdasarkan teori, dan spesifikasi lainnya menjadi sumber penting dalam pengumpulan informasi yang ada. Validasi dengan bukti berdasarkan konten tes dilakukan dengan professional judgment mengevaluasi blueprint tes (Osterlind, 2010).

(34)

2) mBukti validitas berdasarkan proses respon

Pengujian proses mental atau kognitif penerima tes merupakan salah satu cara dalam membuktikan validitas. Validasi dengan bukti proses respon penting dilakukan untuk mengetahui respon subjek terhadap stimulus dalam suatu pengukuran. Validasi ini juga memberikan informasi apakah peserta tes memberikan respon sesuai dengan pemahaman yang dimaksudkan oleh tes. Proses respon dapat diteliti melalui metode sederhana dan kompleks. Ada beberapa metode yang dapat dipergunakan untuk menganalisis bukti validitas berdasarkan proses respon seperti Structural Equation Modeling (SEM), Hierarchical Linear Models (HLM), dan Path Analysis (Osterlind, 2010).

SEM merupakan metode multivariasi yang dapat digunakan untuk mengukur dan menganalisis dimensi laten dalam data psikologis. Dimensi laten tersebut yang menyebabkan suatu peristiwa yang diamati terjadi. Selain itu, SEM juga dapat digunakan untuk menguji keseluruhan struktur tes (Osterlind, 2010).

Selanjutnya, metode HLM merupakan salah satu teknik dalam analisis multilevel.

Maksud dari analisis multilevel ialah analisis dilakukan dengan menggunakan seluruh data dari berbagai tingkatan dan dengan prosedur estimasi yang berbeda- beda sehingga standar error yang diperoleh lebih realistis. Metode ini tepat digunakan untuk mengolah data yang berstruktur atau memiliki hirarki. Metode yang terakhir, yaitu path analysis dikembangkan untuk mempelajari dan menjelaskan pengaruh langsung dan tidak langsung dari variabel penyebab terhadap variabel akibat. Metode ini dapat digunakan apabila secara teori dihadapkan pada masalah yang berhubungan dengan sebab-akibat (Pedhazur, 1997).

(35)

3) Bukti validitas berdasarkan struktur internal

Struktur internal suatu tes terkait dengan pembuatan kesimpulan yang tepat dan reliabel terhadap konstrak yang dinilai. Hal ini dilakukan dengan menguji dasar teori yang digunakan (Osterlind, 2010). Dalam Azwar (2012), bukti validitas berdasarkan struktur internal dikenal dengan istilah validitas konstrak.

Validitas ini menunjukkan sejauh mana tes mengungkap trait yang diukur.

Konsep validitas konstrak berguna pada tes yang trait pengukurannya tidak memiliki kriteria eksternal.

Validasi berdasarkan struktur internal dapat dilakukan dengan beberapa metode, salah satunya adalah model faktor umum. Dalam model faktor umum dijelaskan bahwa aitem-aitem dalam suatu tes memiliki kesamaan dan pengaruh yang unik. Namun, kesamaan tersebut tidak menyebar secara merata. Dalam model faktor umum juga dikenal istilah muatan faktor yang menggambarkan kontribusi varians item terhadap konstrak yang diukur. Penjumlahan dari muatan faktor individu menunjukkan homogenitas suatu tes. Model faktor umum ini diuji dengan analisis faktor atau principal components analysis (PCA) (Osterlind, 2010).

Selain model faktor umum, Item Response Theory (IRT) models juga dapat digunakan untuk memvalidasi berdasarkan struktur internal. IRT models digunakan dengan melakukan uji asumsi unidimensionalitas, indeks diskriminasi yang sama, investigasi fenomena tebakan, dan meneliti analisis waktu dengan membandingkan varians skor antara tes dengan batasan waktu dan tanpa batasan waktu. Dalam IRT models, model diidentifikasi dengan jumlah karakteristik stimulus tes yang diestimasi (Osterlind, 2010).

(36)

Metode lainnya yang juga dapat digunakan dalam validasi struktur internal adalah Multitrait-Multimatrix Method (MMTM). Metode ini digunakan untuk menganalisis hubungan dan menentukan pola antar data dari sebuah tes. Dalam metode ini akan dicari persamaan dan perbedaan antar data dari dua alat tes, baik yang mengukur atribut yang sama maupun yang berbeda. Dalam metode ini, suatu tes dikatakan valid ketika alat tes yang diuji konvergen dengan alat tes lainnya yang mengukur atribut yang sama. Selain itu, alat tes yang diuji tersebut divergen dengan alat tes lainnya yang mengukur atribut berbeda (Osterlind, 2010).

4) Bukti validitas berdasarkan hubungan dengan variabel lain

Hubungan antara skor tes dengan variabel lain dapat menjadi sumber bukti validitas. Variabel lain ini disebut dengan kriteria. Pengujian terhadap hubungan antara skor tes dengan kriteria dilakukan dengan bukti prediktif atau bukti konkuren (Osterlind, 2010). Dalam Azwar (2012), validitas dengan bukti prediktif atau bukti konkuren disebut dengan validitas prediktif atau validitas konkuren.

Kedua bukti ini sama-sama menunjukkan hubungan antara tes dan kriteria eksternal. Perbedaan kedua bukti tersebut terletak pada rentang waktu diberikannya tes dan kriteria.

Pada bukti prediktif, validasi dilakukan dengan perbandingan antara tes yang diuji dengan kriteria administrasi posttestnya (setelah tes diberikan) (Osterlind, 2010). Dapat dikatakan juga bahwa hasil tes berfungsi sebagai prediktor bagi performansi di masa yang akan datang. Oleh karena itu, pengujian validitasnya baru bisa dilakukan di masa mendatang setelah skor kriterianya diperoleh (Azwar, 2012). Sedangkan pada bukti konkuren, validasi dilakukan dengan perbandingan antara tes dengan kriteria kontemporer. Kriteria kontemporer yang dimaksud ialah

(37)

tes paralel yang diadministrasikan baik setelah maupun sebelum tes yang diuji diberikan (Osterlind, 2010). Dapat dikatakan juga bahwa skor tes dan skor kriteria diperoleh dalam waktu yang bersamaan (Azwar, 2012).

Estimasi koefisien validitas dengan bukti validitas berdasarkan hubungan dengan variabel lain baik bukti prediktif maupun bukti konkuren dilakukan dengan mengkorelasikan skor tes dengan skor kriteria. Korelasi yang dapat digunakan ialah korelasi Pearson Product-Moment (variabel bersifat kontinyu) dan korelasi point-biserial (variabel bersifat kategorikal atau dikotomi) (Azwar, 2012).

5) Bukti validitas berdasarkan pertimbangan eksternal

Pertimbangan eksternal yang menjadi bukti validitas adalah validitas tampang (face validity). Namun, validitas tampang ini tidak dapat diukur dengan menggunakan metode statistik. Dalam hal ini, pengujian validitas dilakukan dengan menunjukkan alat tes kepada subjek. Selain validitas tampang, validitas generalisasi (validity generalization) juga menjadi pertimbangan eksternal lainnya yang dijadikan sebagai bukti validitas. Yang dimaksud dengan validitas generalisasi adalah sejauh mana bukti validitas berdasarkan kriteria dapat digeneralisasi pada situasi baru tanpa harus dilakukan pengujian validitas lagi (Osterlind, 2010).

c. Faktor-faktor yang mempengaruhi validitas

Pengujian validitas terkait dengan pengumpulan bukti-bukti validitas. Ketika perubahan waktu terjadi, bukti validitas harus berkembang untuk mendukung perubahan tersebut. Dengan demikian, interpretasi validitas juga menjadi rentan berubah. Oleh karena itu, pengujian validitas harus tetap dipantau dan

(38)

diperbaharui (Osterlind, 2010). Selain perubahan waktu, terdapat juga berbagai faktor lain yang dapat menjadi sumber kesalahan pada suatu pengukuran dan dapat mengganggu nilai dari validitas tersebut. Faktor-faktor tersebut adalah sebagai berikut (Coaley, 2010):

1) Batasan jangkauan data

Keterbatasan jangkauan data disebabkan oleh peserta tes memiliki skor yang mirip sehingga variasi dari pengukuran tersebut rendah. Variasi yang tidak terlalu rendah dari suatu pengukuran dapat menghasilkan koefisien validitas yang lebih tinggi. Jumlah batasan dari berbagai pengujian akan bervariasi sehingga korelasi yang diperoleh juga akan bervariasi. Batasan jangkauan data ini juga dapat terjadi ketika suatu kelompok memiliki karakteristik yang lebih homogen seperti usia, jenis kelamin, dan trait kepribadian. Karakteristik yang homogen ini akan mempersempit rentang skor yang ada (Coaley, 2010).

2) Pengurangan sampel

Berkurangnya jumlah sampel dalam suatu pengukuran dapat mempersempit batasan jangkauan data. Namun, suatu formula dan program tertentu dapat digunakan untuk menghitung koefisien validitas jika batasan jangkauan data maupun pengurangan sampel terjadi (Coaley, 2010).

3) Ukuran sampel

Jumlah sampel dalam suatu tes mempengaruhi validitas tes tersebut. Semakin kecil ukuran sampel dalam suatu tes, maka semakin besar kesalahan yang dihasilkan dalam pengukuran. Semakin besar ukuran sampelnya, maka semakin kecil pula kesalahan yang terjadi dalam tes tersebut. Selain itu, sampel kecil

(39)

dalam statistik dikatakan tidak stabil karena korelasi dua sampel dengan ukuran sampel yang sama-sama kecil menghasilkan hasil yang berbeda (Coaley, 2010).

4) Atenuasi

Jika reliabilitas dari pengukuran kriteria rendah, hal tersebut dapat mengurangi koefisien validitas dari sebuah tes. Nilai maksimum dari validitas dibatasi oleh reliabilitas. Dapat dikatakan juga bahwa koefisien validitas tidak pernah bisa melebihi koefisien reliabilitas. Hal inilah yang disebut dengan atenuasi (Coaley, 2010). Efek atenuasi ini dapat menghasilkan underestimasi terhadap validitas tes (Azwar, 2012).

5) Kontaminasi kriteria

Kontaminasi kriteria ini mencakup bias dalam skor kriteria dan variasi dalam berbagai tipe pengukuran yang digunakan sebagai kriteria. Hal tersebut dapat mengurangi koefisien validitas. Ketika pengaruh dari berbagai faktor lainnya tidak berkaitan ataupun kaitannya dapat diminimalisir, maka validitasnya akan menjadi lebih tinggi (Coaley, 2010).

6) Keterpenuhan Asumsi

Ada beberapa asumsi yang mempengaruhi koefisien validitas. Asumsi pertama ialah adanya hubungan linear antara variabel yang digunakan dalam suatu pengukuran. Asumsi kedua terkait dengan struktur faktor dari suatu tes.

Maksudnya ialah alat tes yang berbeda dapat mengukur hal yang serupa meskipun atribut pengukuran dari tes tersebut tidak identik. Sedangkan asumsi ketiga berfokus kepada panjang tes (Coaley, 2010).

Pengujian validitas dalam penelitian ini dilakukan dengan menggunakan data yang diperoleh dari pelaksanaan tes psikologi. Pelaksanaan tes psikologi dapat

(40)

dipengaruhi oleh banyak faktor. Faktor-faktor ini akan mempengaruhi hasil tes psikologi meskipun penguji telah memastikan agar hasil tes yang diperoleh mencerminkan secara tepat kemampuan yang diukur (Gregory, 2013). Hal ini juga dapat mempengaruhi validitas dari hasil tes. Adapun faktor-faktor yang dapat mempengaruhi hasil tes menurut Gregory (2013) adalah :

1) Prosedur standar dalam pelaksanaan tes

Pengukuran yang dilaksanakan sesuai dengan kondisi standar yang diuraikan pada panduan tes dari penerbit dapat menghasilkan interpretasi tes psikologi dengan validitas yang tinggi.

2) Prosedur pelaksanaan tes

Komponen penting yang perlu diperhatikan dalam pelaksanaan tes adalah para penguji harus familiar dan paham dengan material tes dan petunjuk tes yang ada.

Selain itu, penguji harus memahami prosedur yang tepat untuk dilakukan jika terjadi situasi yang tidak biasa selama tes berlangsung.

3) Sensitivitas terhadap keterbatasan

Sensitivitas penguji terhadap keterbatasan yang dimiliki peserta tes seperti kelemahan pendengaran, penglihatan, wicara dan motorik merupakan salah satu unsur dari pelaksanaan tes yang valid. Peserta tes yang memiliki keterbatasan membutuhkan tes khusus untuk mendapatkan hasil pengukuran yang valid.

4) Penetapan waktu

Penetapan waktu dalam suatu tes yang menggunakan batas-batas waktu menjadi hal yang penting untuk diperhatikan. Para penguji harus menetapkan waktu yang digunakan selama pelaksanaan tes mulai dari persiapan, pembacaan instruksi hingga pelaksanaan tes yang sesungguhnya. Pengurangan maupun

(41)

penambahan waktu dalam suatu tes dapat mengakibatkan norma tes menjadi tidak valid dan dapat menyebabkan skor sebagian besar subjek dalam kelompok menjadi turun.

4) Kemampuan penguji

Penguji harus mampu menjelaskan petunjuk tes dengan jelas kepada peserta tes. Jika ada peserta tes yang belum memahami instruksi tes, penguji dapat menjelaskan poin-poin dari instruksi tes secara perorangan.

5) Pengaruh penguji

Penguji dalam pelaksanaan tes harus mampu menciptakan lingkungan tes yang ramah untuk menghasilkan tes yang valid. Kegagalan penguji dalam menjalin hubungan dapat mendistorsi hasil tes. Selain itu, jenis kelamin, ras, dan pengalaman penguji juga menjadi unsur yang mempengaruhi peserta tes meskipun tidak memiliki pengaruh yang begitu signifikan.

6) Pengalaman dan motivasi peserta tes

Pengalaman yang dimiliki oleh peserta tes dapat mempengaruhi hasil tes ketika tes tersebut sudah pernah diikuti sebelumnya oleh peserta tes. Pengalaman yang dimiliki oleh peserta tes menyebabkan adanya proses pembelajaran peserta tes terhadap tes psikologi. Selain pengalaman, peserta tes yang memiliki motivasi untuk berbohong juga bisa menyebabkan hasil tes menjadi tidak valid. Motivasi peserta tes untuk berbohong umumnya terjadi ketika peserta tes ingin mendapatkan hasil yang baik dari pelaksanaan tes yang diadakan suatu institusi.

d. Interpretasi koefisien validitas

Ketika hubungan korelasional antara ukuran dan standar relevansi eksternal digunakan sebagai bukti kriteria yang terkait pada evaluasi validitas, itu

(42)

diasumsikan sebagai validitas. Koefisien validitas umumnya diperoleh dengan korelasi Pearson. Terdapat juga korelasi lainnya namun jarang digunakan, seperti Spearman rho (disimbolkan rs), koefisien Phi (ɸ), the tetrachoric correlation, ataupun koefisien kontigensi (C). Selain itu, korelasi biserial dan point-biserial juga dapat digunakan untuk memperoleh koefisien validitas meskipun kedua korelasi ini umumnya digunakan untuk analisis aitem selama konstruksi tes dan review tes. Namun, kedua korelasi tersebut biasanya tidak digunakan untuk evaluasi validitas bukti kriteria (Osterlind, 2010).

Interpretasi koefisien validitas bersifat relatif. Maksudnya ialah tidak ada batasan mutlak mengenai koefisien terendah agar validitas dinyatakan memuaskan. Suatu validitas dianggap memuaskan tergantung kepada penguji validitas dan pengguna tes (Azwar, 2012). Dalam estimasi validitas, tidak dapat dituntut koefisien yang tinggi sekali seperti dalam interpretasi koefisien reliabilitas (Azwar, 2012).

Estimasi validitas dalam penelitian ini dilakukan dengan validitas bukti kriteria. Coaley (2010) menyatakan bahwa koefisien validitas untuk validitas kriteria cenderung lebih rendah jika dibandingkan dengan koefisien validitas konstrak. Hal ini dapat disebabkan oleh ketidakkonsistenan kriteria ketika dilakukan evaluasi validitas. Koefisien validitas dikatakan sangat baik ketika koefisien korelasinya diatas 0.54 dan dikatakan baik ketika koefisien korelasinya diantara 0.45-0.54 Pernyataan oleh Coaley ini didukung juga dengan pernyataan dalam Murphy & Davidshofer (2005) bahwa dalam pengujian validitas dengan bukti kriteria, koefisien validitas yang diperoleh umumnya sekitar 0.3 dan 0.4, dan koefisien tertinggi yang dapat dicapai sekitar 0.5 dan 0.6.

(43)

2. Reliabilitas

a. Definisi reliabilitas

Reliabilitas mengacu kepada ketepatan dalam penilaian mental. Ketepatan ini ditentukan oleh konsistensi hasil pengukuran paralel yang dilakukan secara berulang (Osterlind, 2010). Konsistensi tersebut dapat diketahui dengan membandingkan skor individu ketika diberikan tes dalam waktu yang berbeda.

Konsistensi ini menunjukkan keakuratan tes (Coaley. 2010). Semakin konsisten hasil pengukurannya, maka semakin besar reliabilitasnya. Semakin reliabel suatu pengukuran maka semakin sedikit kesalahan yang terdapat dalam hasil pengukurannya. Hal ini tentu meningkatkan kepercayaan terhadap hasil pengukuran yang ada (Osterlind, 2010).

Lord & Norvick (dalam Osterlind, 2010) menyatakan bahwa reliabilitas dalam teori tes klasik didefinisikan sebagai kuadrat korelasi antara skor tampak dengan skor murni. Dalam Coaley (2010) dijelaskan bahwa rentang antara skor tampak dan skor murni disebut dengan error. Semakin kecil rentang antara skor tampak dan skor murni, maka semakin sedikit error dalam pengukuran tersebut dan reliabilitas pengukurannya semakin besar. Semakin besar rentang antara skor tampak dan skor murni, maka semakin banyak error dalam pengukuran tersebut dan reliabilitas pengukurannya semakin kecil.

b. Metode Estimasi Reliabilitas

Reliabilitas suatu pengukuran dapat diketahui dengan melakukan pengukuran paralel secara berulang. Pada awalnya, pengujian reliabilitas dilakukan dengan peserta tes diminta untuk berpartisipasi kembali dalam tes yang sama dan administrasi tesnya identik. Namun, metode tersebut dinilai sulit dilakukan karena

(44)

ketiadaan peserta tes ketika dilakukan tes secara berulang. Oleh karena itu, para ahli psikometri mengemukakan beberapa metode pengukuran paralel yang dapat dilakukan untuk mengestimasi reliabilitas (Osterlind, 2010). Metode yang berbeda menghasilkan estimasi yang berbeda karena masing-masing metode memiliki sensitivitas tehadap sumber error (Coaley, 2010).

1) Metode Tes Ulang (Test-retest)

Metode tes ulang merupakan pengukuran paralel yang dilakukan dengan cara memberikan tes yang sama dengan administrasi yang sama dan kondisi pelaksanaan tes yang dibuat serupa namun dalam waktu yang berbeda (Osterlind, 2010). Hasil pengukuran pertama dan pengukuran kedua dikorelasikan dan menghasilkan koefisien reliabilitas test-retest atau koefisien stabilitas. Jika interval waktu pelaksanaan tes pertama dengan kedua tidak begitu lama, hasil korelasinya disebut dengan coefficient of dependability (Coaley, 2010). Korelasi antara hasil pengukuran pertama dan kedua pada metode ini dilakukan dengan korelasi Pearson (Osterlind, 2010).

Metode ini tidak dapat digunakan untuk semua pengukuran karena tidak semua trait benar-benar stabil sepanjang waktu. Reliabilitas semakin rendah jika interval waktu pelaksanaan tes yang pertama dengan yang kedua semakin lama (Coaley, 2010). Hal ini dapat disebabkan karena terjadinya perubahan aspek psikologis yang diukur pada individu yang mendapatkan tes. Selain itu, dapat disebabkan oleh perubahan suasana hati, motivasi dan sikap subjek ketika menerima skala untuk pengukuran berulang (Azwar, 2012). Namun, interval waktu yang singkat juga akan mempengaruhi respon individu ketika diberikan tes yang sama untuk kedua kalinya. Respon yang terjadi dapat berupa partisipan

(45)

menghindar ketika akan diberikan tes lagi maupun individu masih mengingat jawaban ketika dilakukan pengukuran awal (Coaley, 2010). Ingatan individu terhadap respon di pengukuran awal disebut dengan efek bawaan (carry-over effect). Hal ini dapat menyebabkan overestimasi koefisien reliabilitas (Azwar, 2012).

2) Metode Bentuk tes alternatif

Metode bentuk tes alternatif merupakan pengukuran paralel yang tepat digunakan ketika tes hanya dapat dilakukan sekali saja. Metode ini dilakukan dengan menggunakan tes yang telah dikembangkan dengan asumsi tes tersebut memiliki spesifikasi konten tes yang sama dan prosedur konstruksi tes yang identik (Osterlind, 2010). Metode ini dilakukan dengan membagi satu kelompok menjadi dua bagian dan administrasi tes dilakukan dalam dua sesi (Coaley, 2010).

Sesi pertama pada metode bentuk tes alternatif dilakukan dengan tes A diadministrasikan pada kelompok pertama dan tes B diadministrasikan pada kelompok kedua. Sesi kedua dilakukan dengan tes A diadministrasikan pada kelompok kedua dan tes B diadministrasikan pada kelompok pertama (Coaley, 2010). Selanjutnya, kedua tes dikorelasikan dengan korelasi Pearson untuk mengestimasi reliabilitas dan menghasilkan koefisien reliabilitas bentuk alternatif yang disebut dengan koefisien ekuivalen (Osterlind, 2010).

Metode bentuk tes alternatif dapat mengurangi efek bawaan (subjek mengingat aitem tes yang diberikan) pada tes berulang dikarenakan aitem tes yang dihadapi individu di kedua sesi pelaksanaan tes berbeda (Coaley, 2010). Namun, metode ini juga memiliki kekurangan yaitu tes yang dijadikan sebagai tes alternatif tidak tersedia (Osterlind, 2010). Hal demikian terjadi dikarenakan

(46)

sulitnya untuk membuat aitem dengan konten dan tingkat kesulitan yang sama di dua tes yang berbeda. Selain itu, metode ini membutuhkan waktu yang lama untuk pelaksanaannya. Berbagai kekurangan tersebut dapat mengurangi koefisien reliabilitas (Coaley, 2010).

3) Metode Konsistensi internal

Metode konsistensi internal merupakan metode yang digunakan ketika alat tes tidak memiliki bentuk alternatif. Dengan metode ini, pengukuran paralel dapat dilakukan pada tes yang hanya mempunyai satu bentuk saja, yaitu dengan membagi tes menjadi dua bagian (split-halves) (Osterlind, 2010) atau dengan membagi tes menjadi tiga bagian maupun membagi sebanyak jumlah aitem (Azwar, 2012). Pada tes yang dibagi dua, estimasi reliabilitasnya dilakukan dengan mengkorelasikan hasil pengukuran kedua bagian (Kaplan, 2009). Korelasi pada metode ini dilakukan dengan korelasi Pearson dan menghasilkan reliabilitas split-half (Osterlind, 2010).

Pembagian tes dalam metode ini dapat dilakukan dengan mengelompokkan aitem berangka ganjil ke dalam satu bagian dan aitem berangka genap ke bagian lainnya. Pembagian tes juga dapat dilakukan secara acak ataupun dengan menggunakan kriteria lainnya. Namun, pemilihan cara untuk pembagian tes dalam metode ini penting untuk diperhatikan agar pembagian tesnya ekuivalen sehingga tidak menganggu estimasi reliabilitas dengan metode ini. Metode ini juga tidak direkomendasikan untuk tes yang aitemnya sedikit dikarenakan estimasi reliabilitas umumnya lebih rendah pada tes yang singkat.

Adanya kelemahan yang ditemukan dalam metode ini membuat para ahli psikometri merumuskan sejumlah formula dalam mengestimasi reliabilitas ketika

(47)

akan menggunakan metode konsistensi internal (Osterlind, 2010). Pemilihan formula dalam metode ini ditentukan oleh jenis pembagian tes yang digunakan (Azwar, 2012). Salah satu formula yang dapat dipergunakan dalam metode ini ialah formula Spearman-Brown. Formula ini digunakan untuk tes yang dibagi dua dengan masing-masing bagian memenuhi asumsi paralel (memiliki distribusi normal dan standar deviasi yang sama) (Osterlind, 2010).

Selain formula Spearman-Brown, terdapat formula Kuder-Richardson (KR) yang dapat digunakan ketika pembagian tes dilakukan sebanyak jumlah aitem dikarenakan jumlah aitem dalam tesnya sedikit (Osterlind, 2010) dan ketika aitem tesnya diberi skor dikotomi (Azwar, 2012). Dalam penggunaannya, formula KR terbagi menjadi KR-20 (tingkat kesulitan aitem tes berbeda) dan KR-21 (tingkat kesulitan aitem tes sama) (Osterlind, 2010). Formula lainnya yang dapat digunakan dalam metode ini ialah formula Koefisien Aplha, digunakan ketika dalam pembagian tesnya asumsi paralel tidak terpenuhi namun asumsi π- equivalent terpenuhi. Ketika tes yang dibagi dua tidak memenuhi asumsi paralel dan π-equivalent, maka tes dibelah menjadi tiga bagian dan formula yang digunakan adalah formula Kristof (Azwar, 2012).

c. Faktor-faktor yang mempengaruhi reliabilitas

Ada berbagai faktor yang mempengaruhi reliabilitas menurut Osterlind (2010), yaitu :

1) Atenuasi

Reliabilitas terbagi atas dua yaitu indeks dan koefisien. Indeks reliabilitas menggambarkan manifestasi teori reliabilitas. Koefisien reliabilitas merupakan pengujian statistik terhadap reliabilitas. Pengujian dilakukan dengan

(48)

mengkorelasikan skor tampak dari tes paralel. Namun, skor tampak yang diperoleh dari suatu pengukuran tidak benar-benar utuh dalam menggambarkan konstrak yang diukur dan terdapat error dalam pengukuran tersebut. Hal tersebut dapat merendahkan korelasi antar konstrak yang diukur dan inilah yang disebut dengan atenuasi. Adanya atenuasi inilah yang menyebabkan koefisien reliabilitas selalu lebih kecil daripada indeks reliabilitas (Osterlind, 2010).

2) Panjang Tes

Panjang tes ialah banyaknya aitem dalam sebuah tes. Semakin banyak aitem dan semakin panjang tes maka reliabilitasnya juga akan meningkat. Aitem merupakan sampel informasi tentang konstrak. Oleh karena itu, semakin banyak sampel informasi maka keseluruhan konstrak dapat digambarkan lebih utuh (Osterlind, 2010). Azwar (2007) menyatakan bahwa penambahan aitem dalam suatu tes akan meningkatkan reliabilitas tes jika aitem yang ditambahkan tersebut memiliki kualitas yang setara dengan aitem yang sudah ada.

3) Heterogenitas kelompok

Variabilitas dalam kelompok menjadi pertimbangan penting dalam estimasi reliabilitas. Heterogenitas kelompok mempengaruhi variabilitas yang juga memiliki pengaruh kuat terhadap reliabilitas. Semakin heterogen kelompok maka koefisien reliabilitasnya semakin tinggi. Semakin homogen kelompok maka koefisien reliabilitasnya semakin rendah. Hal ini disebabkan oleh adanya variabilitas dalam kelompok (Osterlind, 2010).

d. Interpretasi koefisien reliabilitas

Interpretasi koefisien reliabilitas bersifat relatif. Tidak ada batasan mutlak dari nilai terendah koefisien reliabilitas yang harus dicapai agar dapat dikatakan