INSTRUMEN APA YANG AKAN ANDA GUNAKAN UNTUK MENGUMULKAN DATA?

Coba bayangkan anda akan mengumpulkan data-data berkaitan dengan kinerja, sikap atau pengamatan. Bentuk-bntuk pengumpulan data ini akan meliatkan penggunaan instrumen. Instrumn apa yang akan anda gunakan untuk mengumpulkan data-data anada? Apakah anda menemukan satu instrumen yang akan digunakan atau apakah anda harus mengembangkannya sendiri? Apabila anda mencari sebuah instrumen untuk digunakan, bagaiaman anda mencarinya? Sekali anda menemukan instrumen tersebut, kriteria apa yang anda gunakan untuk menentukan apakah instrumen itu bagus?

Mencari atau mengembangkan sebuah Instrumen

Ada tiga pilihan untuk mendapatkan sebuah instrumen yang akan digunakan. Anda bisa mengembangkannya sendiri, mencari sebuah instrumen dan kemudan memodifikasinya, atau mencarinya dan menggunakannya langsung secara

keseluruhan. Dari pilihan-pilihan ini, mencari sebuah intsrumen untuk digunakan (apakah dengan memodifikasinya atau menggunakannya seperti aslinya) merupakan cara atau pendekatan yang paling mudah. Akan jauh lebih sulit mengembangkannya sebuah instrumen ketimbang menemukan satu instrumen kemudian memodifikasinya untuk penelitian kita. Modifying an instrument (memodifikasi sebuah instrumen) berarti mencari sebuah instrumen yang sudah ada, minta izin untuk mengubahnya, dan membuat perubahan di sana sini untuk menyesuaikan dengan kebutuhan kita. Biasanya, penulis dari instrumen asli akan minta versi yang sudah anda modifikasi dan hasil dari penelitian anda sebagai imbalan dari penggunaan instrumen itu oleh anda.

Instrumen yang akan anda gunakan untuk mengukur variabel-variabel penelitian anda boleh jadi tidak ditemukan dalam literatur ataupun secara komersial. Apabila ini terjadi, anda harus mengembangkan sendiri instrumen anda, yang merupakan sebuah proses panjang dan arduous. Pengembangan sebuah instrumen terdiri dari beberapa langkah, seperti mengidentifikasi tujuan dari instrumen tersebut, mengkaji kepustakaan yang ada, menuliskan pertanyaan-pertanyaan, menguji coba pertanyaan-pertanyaan tersebut kepada individu-individu yang kira-kira sama karakteristiknya dengan individu-individu yang ingin diteliti. Empat fase pengembangan, seperti disarankan oleh Benson dan Clark (1983) dan diperlihatkan dalam Diagram 6.8, mengilustrasikan langkah-langkah perencanaan, pengkonstruksian, pengevaluasian, dan pengecekan untuk melihat apakah pertanyaan-pertanyaan tersebut efektif ((memvalidasi instrumen). Dalam proses ini. Langkah dasarnya terdiri dari kajian kepustakaan, mengajukan pertanyaan-pertanyaan umum kepada kelompok sasaran, mengembangkan pertanyaan-pertanyaan untuk mendapatkan setumpuk butir-butir pertanyaan, dan uji coba butir-butir pertanyaan tersebut. Prosedur-prosedur statistik guna menghitung reliabilitas dan analisis butir tersedia dalam bentu perangkat lunak (program) komputer dan akan dibicrakan secara rinci pada bab 7.

Pencarian Instrumen

Apabila anda memtuskan untuk menggunakan instrumen yang sudah ada, penerbit atau penulis akan minta fee (bayaran) kepada anda untuk penggunaan instrumen dimaksud. Menemukan sebuah instrumen yang baik yang akan mengukur variabel-variabel independen, dependen, dan kontrol tidaklah mudah. Nyatanya, anda boleh

jadi perlu merakit sebuah instrumen baru yang berasal dari bahagian-bahagian dari instrumen yang sudah ada. Apakah anda ncari sebuah instrumen atau beberapa instrumen untuk anda gunakan, beberapa strategi mungkin bisa membantu pencarian anda:

 Cari di dalam artikel-artikel jurnal yang dipublikaskan.Sering penulis artikel-artikel jurnal melaporkan dan memberikan beberapa contoh butir pertanyaan sehingga anda b isa melihat materi dasar yang dicantumkan di dalam instrumen tersebut. Teliti referensi-referensi yang dicantumkan dalam artikel-artikel jurnal yang dipublikasikan yang mengutip instrumen-instrumen tertentu dan mengontak para penulisnya untuk mendapatkan inspection copy (contoh). Sebelum anda menggunakan instrumen tersebut, minta izin dari penulisnya. Dengean keterbatasan halaman di dalam jurnal, para pengarang mencantumkan hanya beberapa contoh dari butir-butir instrumennya atau beberapa bahagian dari instrumennya.

 Lakukan pencarian dengan menggunakan ERIC data base. Gunakan istilah instruments dan topik dari penelitian anda untuk mencari sebuah instrumen dengan menggunakan sistem ERIC. Gunakan proses pencaharan on-line melalui ERIC data base (lihat bab 4). Gunakan prosedur pencaharan yang sama untuk mencari abstrak dari artikel-artikel di mana para penulis menyebutkan instrumen-instrumen yang mereka gunakan dalam artikel mereka.

 Cermati petunjuk-petunjuk berkenaan dengan tes dan instrumen yang tersedia secara komersial. Cermati the Mental Measurement Yearbook (MMY; Impara & Plake, 1999) atau Test in Print (TIP; Murphy, Impara, & Plake, 1999), yang kedua-duanya tersedia melalui Buros Institute of Mental Measurements (www.unl.edu/buros/). Lebih dari 400 perusahaan komersial mengembangkan instrumen yang tersedia secara komersial bagi individu dan lembaga. Diterbitan semenjak tahun 1938, buku-buku pentunjuk ini berisikan informasi yang lengkap tentang tes dan pengukuran yang tersedia bagi penggunaan penelitian pendidikan. Anda bisa mencari tinjauan dan deskripsinya dalam tes-tes yang dipublikasikan secara komersial dalam bahasa Inggeris dalam MMY, yang tersedia dalam bentuk CD-ROM data bases di banyak perpustakaan akademik.

Kriteria untuk Memilih Instrumen yang Baik

Sekali anda enemukan sebuah instrumen, beberapa kriteria bisa digunakan untuk menilai apakah instrumen tersebut merupakan instrumen yang baik untuk anda gunakan. Tanyakalah kepada diri anda sendiri:

 Apakah instrumen terebut baru saja dikembangkan oleh penulisnya, dan bisakah anda mendapatkan versi yang terbaru? Dengan peatnya perkembangan ilmu dalam penelitian pendidikan, instrumen-instrumen yang berumur lebih dari 5 tahun boleh jadi sudah ketinggalan (outdated). Untuk tetap terkini, para penulis biasanya mengupdate instrumen mereka secara periodik, dan anda perlu menemukan versi yang paling terkini.

 Apakah instrumen tersebut dikutip secara luas oleh penulis-penulis lain? Penggunaannya oleh pafra peneliti lain akan memberikan indikasi tentang endorsement-nya oleh orang-orang lain. Penggunaannya oleh para peneliti lain akan memberikan bukti tentang apakah pertanyaan-pertanyaan dalam instrumen tersebut memberikan ukuran-ukuran yang baik dan konsisten.

 Apakah terdapat tinjauan terhadap instrumen tersebut? Cari tinjauan tentang instrumen yang sudah dipublikasikan di dalam MMY atau di dalam jurnal seperti Measurement and Evaluation in Counseling and Development. Apabila tinjauan tersebut ada, ini berarti bahwa penelii-peneliti lain telah memperlakukan instrumen tersebut secara serius dan berupaya mendokumentasikan manfaatnya.

 Aakah terdapat informasi tentang reliabilitas dan validitas dari skor di masa lalu tentang instrumen dmaksud?

 Apakah prosedur merekam data-data sesuai dengan

pertanyaan-pertanyaan/hipotesis di dalam penelitian anda?

 Apakah instrumen tersebut berisikan skala-skala pengukuran yang terterima? Karena pentingnya tiga kriteria terakhir ---reliabilitas dan validitas, perekaman informasi, dan skala pengukuran --- pembicaraan akan diarahkan pada penelusuran tentang hal ini secara lebih mendalam.

Apakah skor pada penggunaan instrumen sebelumnya reliabel dan valid ?

Anda tentu mau memilih instrumen yang melaporkn skor-skor individu yang reliabel dan valid. Reliability (reliabilitas) bermakna skor-skor dari sebuah instrumen stabil dan konsisten adanya. Skor-skor tersebut hampir-hampir sama ketika para peneliti menggunakan instrumen itu berkali-kali pada waktu yang berbeda. Juga,

skor-skor tersebut harus juga konsisten. Apabila seseorang menjawab pertanyaan-pertanyaan tertentu dengan sesuatu cara tertentu, orang yang sama seharusnya akan menjawab dengan cara yang hampir sama pula pertanyaan-pertanyaan lain yang terkait. Walaupun demikian, validity (vaiditas) bermakna bahwa skor-skor individu dari sebuah instrumen masuk akal, memiliki arti/makna, dan memungkinkan anda, sebagai seorang peneliti, untuk mengambil suatu kesimpulan (generalisasi) yang baik dari sampel yang anda langsung teliti terhadap populasi. Defenisi ini konsisten dengan Standards for Educational and Psychological Testing yang dirumuskan bersama-sama oleh AERA, APA, dan the National Council on Measurement in Education (1999).

Reliabilitas dan validitas terpadu satu sama lain dengan cara-cara kompleks. Kedua istilah ini kadang-kadang tumpang tindih dan pada waktu yang lain keduanya mutually exclusive (tidak bisa dipersamakan). Validitas bisa dipandang sebagai istilah yang lebih luas dan lebih mencakup apabila anda ingin menilai pilihan terhadap sebuah instrumen. Reliabilitas biasanya lebih mudah difahami karena ia merupakan ukuran dari konsistensi. Untuk bisa memahami kedua konsep ini secara utuh, perlu hubungan keduanya dipisah. Apabila skor tidak reliabel, skor itupun tidak valid; skor-skor perlu stabil dan konsisten terlebih dahulu sebelum skor-skor-skor-skor tersebut memiliki makna. Tambahan lagi, makin reliable satu set skor dari sebuah instrumen, akan makin validlah skor itu jadinya (walaupun demikian, skor-skor itu bisa saja tidak mengukur konstruk tertentu dan boleh jadi tetap tidak vaid). Situasi yang ideal adalah apabila skor-skor itu tudak hanya reiabel tapi juga vaild. Dari kedua konsep tersebut, reiabilitas dan validitas, reliabilitas lebih mudah difahami dan akan kita mulai dengan mengidentifikasi bentuk pengujian stabilitas dan konsistensi. Sebagai tambahan, makin reliabel skor-skor dari sebuah instrumen, akan makin valid skor-skor tersebut. Sor-skor pelu stabl dan konsisten sebelum skor-skor itu memiliki makna. Dengan cara begini, validitas merupakan istilah yang lebih luas dan lebih mencakup apabila anda menilai pilihan terhadap sebuah instrumen.

Reliabilitas. Tujuan dari penelitian yang baik adalah untuk mendapatkan pengukuran atau observasi yang reliabel. Beberapa faktor bisa menghasilkan data-data yang tidak reliabel, termasuk apabila:

 Pertanyaan-pertanyaan atau instrumen-instrumennya bermakna ganda atau tidak jelas

 Para partisipan lelah, gugup, salah faham terhadap pertanyaan-pertanyaan, atau menerka-nerka ketika menjawab pertanyaan

(Rudner, 1993)

Para peneliti bisa menggunakan salah satu atau lebih prosedur dari lima prosedur yang ada dalam menentukan reliabilitas sebuah instrumen, seperti diperlihatkan oleh Tabel 6.3. Anda bisa membedakan prosedur-prosedur ini dari jumlah instrumen itu digunakan, jumlah versi dari instrumen yang digunakan oleh para peneliti, dan jumlah individu yang melakukan penilaian terhadap informasi.

Prosedur test-retest reliability mengkaji sejauh mana skor dari satu sampel stabil atas dasar perbedaan waktu antara satu pelaksanaan ke pelaksanaan tes yang lain. Untuk menentukan bentuk reliabilitas seperti ini, si peneliti melaksanakan tes pada dua waktu yang berbeda kepada para partisipan yang sama dengan interval waktu yang memadai. Apabila skor-skornya reliable, maka skor-skor tersebut berhubungan (atau berkorelasi) secara positif dengan tingkat yang lumayan tinggi, misalnya 0.6 (lihat tes statistik korelasi pada bab 7, “Memilih Program Statistik”). Pendekatan ini memiliki kelebihan yakni ia mengharuskan adanya instrumen yang sama (satu); walaupun demikian, skor-skor individu pada pelaksanaan tes pertama bisa jadi berpengaruh terhadap skor-skor yang diperoleh pada pelaksanaan tes yang kedua. Perhatikan contoh berikut:

Seorang peneliti mengukur sebuah karakteristik yang stabil, misalnya kreativitas, untuk murid kelas enam SD pada awal tahun pelajaran. Diukur kembali pada akhir tahun, si peneliti mengasumsikan bahwa skor-skor akan stabil selama siswa duduk di kelas enam. Apabila skor-skor pada awal dan pada ahir tahun berhubungan, ada bukti bagi test-retest reliability.

Pendekatan yang lain adalah alternative forms reliability. Ini mencakup penggunaan dua buah instrumen, dua-duanya mengukur variabel yang sama dan mengaitkan (mengkorelasikan) skor-skor untuk satu kelompok individu yang sama sebagai hasil dari kedua buah instrumen. Dalam praktek, kedua instrumen itu hars sama, misalnya isinya sama, tingkat kesukaran sama, dan tipe skalanya sama. Dengan demikian, butir-butr pada kedua instrumen itu mewakili populasi butir yang sama. Kelebihannya, pendekatan ini memungkinkan kita melihat apakah skor-skor yang diperoleh dari satu instrumen ekivalen dengan skor-skor yang diperoleh dari instrumen yang lain, karena kedua instrumen itu dirancang untuk mengukur variabel yang sama. Tentu saja kesukarannya terletak pada apakah kedua instrumen itu benar-benar sama.

Apabila kita asumsikan “ya”, para peneliti mengaitkan atau mengkorelasikan butir-butir dari satu instrumen dengan instrumen yang ekivalen tersebut. Cermati contoh beriut:

Sebuah instrumen dengan butir-butir perbendaharaan kata-kata sebanyak 45 buah menghasilkan skor-skor untuk siswa kelas satu SD. Peneliti membandingkan skor-skor ini dengan skor-skor dari instrumen yang lain yang juga mengukur satu set butir perbendaharaan kata-kata yang sama yang juga berjumlah 45 buah. Kedua buah instrumen berisikan butir-butir yang tingkat kesulitannya kira-kira sama. Apabila si peneliti menemukan bahwa butir-butir tersebut berhubungan atau berkorelasi secara positif, kita percaya bahwa skor-skor dari instrumen pertama memiliki akurasi atau reiabilitas.

Bentuk alternatif dan test-retest reliablity merupakan sebuah variasi dari dua jenis reliabilitas yang dibicarakan sebelumnya. Dalam pendekatan ini, si peneliti melakukan pengujian dua kali dan menggunakan sebuah bentuk alternatif dari tes yan berbeda antara pelaksanaan tes pertama dan pelaksanaan tes kedua. Tipe relaibilitas ini memiliki kelebihan tidak hanya meguji stabilitas skor antar waktu tapi juga memiliki ekivalensi butir-butir dari populasi butir yang potensial. Pendekatan ini juga memiliki semua kelemahan yang dimiliki oleh relaibilitas tipe test-retest dan reiabilitas tipe alternate forms. Skor-skor bisa saja memperlihatkan perbedaan-perbedaan dalam hal isi (materi) atau dalam tingkat kesulitas atau dalam perubahan antara waktu. Perhatikan contoh berikut:

Si peneliti melakukan pengujian dengan menggunakan tes perbendaharaan kata-kata yang berjumlah 45 butir kepda siswa kelas satu SD dua kali pada waktu yang berbeda, dan tes yang digunakan itu merupakan tes yang ekivalen dalam hal isi dan tingkat kesulitan. Si peneliti mengkorelasikan skor-skor yang diperoleh dari kedua pengujian tersebut dan menemukan bahwa skor-skor tersebut berkorelasi secara psoitif dan tinggi. Skor-skor yang diperoleh pada pengujian pertama (dengan menggunakan instrumen pertama) dikatakan reliabel

Interrater reliability (reliabilitas antar penilai) adalah sebuah prosedur yang digunakan ketika melakukan observasi terhadap tingkah laku. Ini mencakup observasi yang dilakukan oleh dua atau lebih individu terhadap tingkah laku seseorang atau beberapa orang individu. Si pengamat merekam hasil pengamatan mereka tehadap tingkah laku tersebut dan kemudian membandingkan apakah skor-skor yang diperoleh sama atau berbeda. Karena metoda ini memperoleh skor pengamatan dari dua atau lebih individu, ia memiliki kelebihan berupa meniadakan bias yang berkemungkinan dibawa seseorang individu kedalam proses penskoring. Iapun memiliki kelemahan berupa keharusan bagi si peneliti untuk melatih pengamat (rater) dan mengharuskan si pengamat menegosiasikan hasil pengamatannya dan mengkompromiskan perbedaan-perbedaan yang terdapat dalam hasil pengamatan mereka, sesuatu yang berkemungkinan tidak mudah dilakukan. Berikut adalah contohnya:

Dua orang pengamat melakukan pengamatan terhadap anak -anak pra-sekolah yang sedang bermain pada suatu taman (pusat) kegiatan anak-anak. Mereka mengamati spatial skills dari anak-anak tersebut dan merekam hasil pengamatan mereka pada sebuah checklist berkali-kali ketika masing-masing anak membangun sesuatu di pusat kegiatan dimaksud. Setelah pengamatan itu, para pengamat membandingkan checklist mereka untuk menentukan tingkat kesamaan skor-skor yang mereka peroleh selama pengamatan tersebut. Dengan asumsi bahwa skor-skor mereka itu mirip, mereka kemudian mengambil rata-rata skor dan menyimpulkan bahwa penilaian mereka memperlihatkan interrater reliability (reliabilitas antar penilai).

Skor-skor dari sebuah instrumen dikatakan reliabel dan akurat apabila skor-skor secara individual memiliki internal konsistensi (internally consistent) antar butir di dalam instrumen tersebut. Apabila seseorang menjawab butir-butir dalam sesuatu instrumen pda awal instrumen itu dengan cara tertentu (misalnya berpandangan positif terhadap efek negatif dari tembakau), ia harus menjawab butir-butir pertanyaan dalam instrumen itu selanjutnya dengan cara yang sama (berpandangan positif terhadap efek-efek tembakau terhadap kesehatan).

Konsistensi dari jawaban dapat diuji dengan beberapa cara. Salah satu cara adalah membelah dua tes tersebut dan mengaitkan atau mengkrelasikan butir-butir tes tersebut. Tes ini disebut Kuder-Richardson split half test (KR-20, KR-21) and digunakan apabila (a) butir-butir dalam instrumen itu diberi skor atas dasar jawaban “benar-salah” sebagai skor kategorikal, (b) jawaban tidak terpengaruh oleh kecepatan, dan (c) butir-butir mengukur faktor yang sama. Karena tes “belah-dua” mengandalkan informasi dari hanya sebelah saja dari instrumen, sebuah modifikasi dari prosedur ini adalah menggunakan Spearman-Brown formula, yang menaksir reliabilitas tes secara utuh dengan menggunakan semua pertanyaan yang ada di dalam instrumen. Ini penting karena reliabilitas sebuah instrumen akan meningkat ketika si peneliti menambah lebih banyak butir ke dalam instrumen. Akhirnya, coefficient alpha digunakan untuk menguji internal konsistensi (Cronbach, 1984). Apabila butir-butir tes diberi skor sebagai variabel kontinum (misalnya sangat setuju sampai pada sangat tidak setuju), koefisien alpha-nya akan merupakan koeffisien taksiran terhadap konsistensi skor-skor yang ada di dalam instrumen. Perhitungan terhadap Kuder-Richardson split half, rumus Spearman-Brown, dan coefficient alpha tersedia di dalam Thorndike (1997b).

Validitas. Disamping reliabilitas, anda sebaiknya mencermati juga apakah instrumen yang anda pilih untuk digunakan melaporkan skor-skor yang valid. Apakah para

penulisnya melaporkan penilaian terhadap validitas instrumen? Sebuah penelitian boleh memiliki skor-skor yang tidak valid karena:

 Penelitan yang rancangnya jelek

 Partisipan mengalami kelelahan, stres, dan salah faham terhadap pertanyaan-pertanyaan yang ada di dalam instrumen

 Ketidakmampuan membuat prediksi yang bermanfaat dari skor-skor yang diperoleh

 Pertanyaan-pertanyaan ataupun pengukuran variabel-variabel yang dirancang kurang baik

 Informasi yang kurang manfaat dan aplikasinya

Para peneliti boleh jadi juga mlaporkan bentuk validitas yang berbeda, seperti diperlihatkan oleh Taaabel 6.4. Perspekstif tradisional tentang validitas biasanya terkait dengan tiga bentuk: isi, criterion-reference 9kriteria), dan validitas konstruk. Terakhir, para ahli dalam hal pengukuran telah mulai melihat validitas sebuah konsep tunggal (unitary concept) (Thorndike, 1997b) dan mempertahankan bahwa skor-skor dikatakan valid apabila sor-skor itu memiliki manfaat dan membawa konsekuensi-konsekuansi sosial yang positif (Hubley & Zumbro, 1996; Messick, 1980). Pembicaraan berikut akan berkaitan dengan konsepsi yang tradisional dan yang terkini tentang validitas.

Content validity (validitas isi) adalah sejauh mana pertanyaan-pertanyaan yang ada di dalam instrumen dan skor-skor yang diperoleh dari pertanyaan-pertanyaan tersebut merupakan representasi dari semua pertanyaan yang mungkin diajukan oleh si peneliti berkenaan dengan isi atau ketrampilan. Para peneliti mengevaluasi validitas isi dengan jalan meneliti rancangan dan prosedur yang digunakan untuk mengembangkan instrumen. Mereka mencermati informasi tentang tujuan dibuatnya instrumen, lingkup isi (materi), dan tingkat kesulitan pertanyaan-pertanyaan. Biasanya para peneliti membawa hal ini pada sebuah panel para ahli dan minta mereka mengidentifikasi apakah pertanyaan-pertanyaan tersebut valid adanya. Bentuk validitas ini bermanfaat apabila kemungkinan-kemungkinan pertanyaan (misalnya tes-tes prestasi dalam pendidikan sain) dikenal secara baik dan mudah diidentifikasi. Ia akan kurang bermanfaat dalam menilai kepribadian dan sikap (misalnya the Standard-binet IQ test), apabila pertanyaan-pertanyaan yang mungkin bisa diajukan kurang jelas atau pasti.

Ketimbang mencermati pertanyaan-pertanyan khusus yang ada di dalam sebuah instrumen, bentuk lain dari validitas adalah untuk melihat apakah skor-skor bisa memprediksi sesuatu yang diharapkan akan bisa diprediksinya. Criterion-related

validity menentukan apakah skor-skor yang ada di dalam sebuah instrumen merupakan sebuah prediktor yang baik terhadap sesuatu hal (kriteria) yang diharapkan bisa diprediksinya. Ada dua tipe criterion-related validity, prediktif dan konkuren (Thorndike, 2005). Validitas prediktif menggunakan skor tes yang ada di dalam instrumen untuk memprediksi sesuatu outcome. Tes tersebut diimplimentasikansebelum informasi tentang kriteria dikumpulkan. Sebuah contoh dari pengukuran validitas prediktif adalah Graduate Reconrd Examination (GRE). Skor-skor dari penilaian ini seharusnya memprediksi kriteria – yakni kinerja di program pasca sarjana. Sebuah contoh yang lain, penilaian portofolio dan ujian konvesional (dengan pensil dan kertas) kedua-duanya seharusnya bisa memprediksi kemampuan mahasiswa memahami isi dari mata kuliah Metoda Pengajaran Bahasa Inggeris (outcome). Dalam kedua kasus ini, si peneliti akan mengaitkan skor-skor yang ada di dalam instrumen pada sesuatu penelitian dengan outcome (kriteria) untuk menentukan apakah keduanya berhubungan. Korelasi yang tinggi sebesar 0.6 atau lebih tinggi mengindikasikan adanya hubungan positif. Bentuk validitas ini secara khusus bermanfaat untuk memprediksi outcome, akan tetapi ia mengharuskan si peneliti mengidentifikasi secara jelas apa outcome-nya yang tepat.

Validitas konkuren sama dengan validitas prediktif, di mana test and criterion measure (skor tes dan skor kriteria) dikumpulkan pada waktu yang sama (Mertens, 2005); tidak sebaliknya, yakni skor kriterianya (atau outcome) dikumpulkan setelah beberapa waktu kemudian. Para peneliti yang mengukur tipe validitas sejenis ini berkeinginan menilai informasi terkini (berkaitan dengan pengetahuan, ketrampilan, minat, atau karakteristik kepribadian). Validitas konkuren dapat digunakan untuk menilai apakah shortened instrument (instrumen yang disingkatkan) atau instrumen baru vaid adanya. Untuk mengurangi biaya atau menyederhanakan prosedur pengujian, para peneliti boleh jadi menguji validitas konkuren dari tes yang disingkatkan dengan validitas dari instrumen yang lebih panjang dalam rangka mengukur konstruk yang sama. Para peneliti bisa menghitung validitas konkuren dari dua set skor dengan jalan mengkorelasikan keduanya: korelasi yang tinggi mengindikasikan tingginya validtas konkuren. Tambahan lagi, para peneliti juga bisa menguji validitas konkuren dari sebuah instrumen baru dengan jalan mengkrelasikan skor-skor dari instrumen tersebut dengan skor-skor dari instrumen yang sudah ada.

Bentuk validitas ketiga, validitas konstruk, adalah yang paling rumit karena ia dinilai dengan meggunakan statistik dan prosedur-prosedur praktis. Construct validity

Dalam dokumen BAB 6 MENGUMPULKAN DATA-DATA KUANTITATIF - BAB 6. Mengumpulkan data kuantitatif OKocx (Halaman 22-39)