Chapter 9
Measurement: Scaling, Reliability, Validity
Untuk mendapatkan respon sikap suatu subyek terhadap obyek, peristiwa, atau individu, dilakukan metode scaling. Ada 2 metode dalam mengukur sikap: skala rating & skala ranking
1. Skala Rating
a. Dichotomous Scale
Memperoleh jawaban YA atau TIDAK. Tipe skala: skala nominal
Contoh: apakah Anda memiliki rekening bank? YA TIDAK b. Category Scale
Memilih satu dari beberapa pilihan Tipe skala: skala nominal
Contoh: Dimanakah tempat tinggal Anda? __Jakarta __Bandung __Surabaya __Lainnya
c. Likert Scale
Melihat tingkat setuju seseorang terhadap sesuatu dengan menggunakan 5 titik skala
Tipe skala: skala interval 1. Sangat tidak setuju 2. Tidak setuju
3. Netral 4. Setuju
5. Sangat setuju
d. Semantic Differential Scale
Terdapat 2 kutub (bipolar) sebagai skala yang menunjukkan sikap responden terhadap suatu obyek, peristiwa, atau individu.
Contoh: Baik-Buruk Kuat-Lemah Panas-Dingin e. Numerical Scale
Serupa dengan semantic scale namun menggunakan 5 titik atau 7 titik skala, dan terdapat 2 kata sifat bipolar (pada titik terendah dan tertinggi).
Tipe skala: skala interval
Contoh: Seberapa puaskah Anda dengan Pekerjaan Anda?
f. Itemized Rating Scale
Responden memberi angka sesuai dengan penilaiannya pada tiap pertanyaan berdasarkan range skala yang ditentukan (4,5,7,9, dsb).
Tipe skala: skala interval Contoh:
Skala rating seimbang dan memiliki titik netral
1 2 3 4 5
Sangat Tidak Mungkin
Tidak
Mungkin Netral Mungkin
Sangat Mungkin 1. Saya akan mengganti pekerjaan dalam 12 bulan ke depan ___ 2. Saya akan keluar dari organisasi dalam waktu dekat ___ Skala rating tidak seimbang dan tidak memiliki titik netral
1 2 3 4 Sangat Tidak Penting Sedikit Penting Cukup Penting Sangat Penting
Menurut Anda, seberapa penting 1 2 3 4 manager melakukan evaluasi performansi kerja ?
Sangat
Puas 1 2 3 4 5 6 7
SangatTidak Puas
g. Fixed or Constant Sum Scale
Responden mendistribusikan nilai yang telah ditentukan pada tiap pertanyaan. Tipe skala: skala ordinal
Contoh:
Berikan nilai tingkat kepentingan pada 5 aspek sebagai bahan pertimbangan dalam memilih universitas dengan total nilai 100.
Popularitas Universitas ____ Akreditasi ___ Fasilitas ___ Biaya kuliah ___ Letak kampus ___ Total 100 h. Stapel Scale
Skala ini mengukur arah (arah positif dan negatif) dan intensitas sikap. Tipe skala: skala interval
Karakteristik yang ditanyakan ditempatkan di tengah-tengah range skala numerik yang ditempatkan pada kedua sisi.
Contoh :
Berikan nilai tentang kemampuan manajer Anda dalam karakteristik-karakteristik di bawah ini. Lingkari yang sesuai.
+3 +3 +3 +2 +2 +2 +1 +1 +1 Mengadopsi Teknologi Modern Inovasi Produk Kemampuan Interpersonal -1 -1 -1 -2 -2 -2 -3 -3 -3
i. Graphic Rating Scale
Pertanyaan berupa gambar atau grafis. Responden memberi tanda pada yang dipilihnya.
Contoh: Dalam skala 1-10, berikan nilai tentang perasaan Anda terhadap kondisi kerja saat ini
1 5 10 Sempurna Cukup Sangat Buruk j. Consensus Scale
Skala juga dibuat berdasarkan konsensus, di mana panel juri memilih
item
tertentu, mengukur konsep yang menurut mereka releva.
Item
dipilih
terutama berdasarkan ketepatan atau relevansinya dengan konsep. Skala
konsensus (
consensus scale
) tersebut dibuat setelah
item
terpilih
diperiksa dan diuji validitas dan keandalannya.
k. Skala lainnya ………
2. Skala Ranking
a. Paired Comparison b. Forced Choice
Responden memberi peringkat pada tiap objek. Satu objek relatif terhadap objek lain.
Contoh: beri peringkat pada berbagai merek handphone di bawah ini (skala 1-5) nilai 1 yang paling disukai sampai nilai 5 paling tidak disukai
BlackBerry ___ Nokia ___ Siemens ___ Motorola ___ iPhone ___ c. Comparative Scale
Memberikan suatu benchmark (referensi/tolak ukur) sebagai perbandingan untuk menilai sikap terhadap objek, peristiwa, atau situasi yang akan diteliti. Contoh:
Goodness of Measures.
Menilai seberapa baik alat ukur yang digunakan.
Memastikan bahwa cara mengukur yang dilakukan sudah mengukur variabel yang diukur secara akurat.
Skala pengukuran tidak sempurna, akan selalu memiliki error dalam menilai sikap.
Cara memastikan alat ukur sudah bagus: Item Analysis
Melihat apakah pertanyaan-pertanyaan yang diajukan sudah sesuai. Tiap pertanyaan diperiksa 1 per 1 untuk melihat kemampuannya dalam membedakan ……….……….
Melakukan pengujian t-value……..……….
1. Reliability
Mengukur seberapa konsisten alat ukur mengukur hal yang diukur, dan dapat mengukur tanpa bias.
Kestablian Pengukuran Dapat diuji dengan 2 cara: Test-Retest Reliability
Besarnya reliabilitas bisa didapatkan dengan melakukan pengukuran secara berulang. Kuesioner diberikan kepada responden pada satu waktu, lalu beberapa waktu kemudian kuesioner yang sama diberikan kembali. Korelasi antar nilai pertama dan terahir disebut koefisien test-retest. Makin besar koefisien test-retest, reliabilitas makin besar.
a. Parallel-form Reliability
Memberikan 2 kuesioner yang inti pertanyaannya sama, hanya dibedakan urutan pertanyaan atau mengambilan kata-katanya. Apabila hasil memiliki korelasi yang tinggi berarti alat ukur telah reliable.
Konsistensi Internal Pengukuran
Bertujuan melihat konsistensi antaraitem atau antarbagian dalam tes itu sendiri.
Interitem Consistency Reliability
Adalah menguji konsistensi jawaban responden terhadap pertanyaan yang diajukan. Yang terkenal: Cronbach’s coefficient alpha (digunakan untuk multipoint scale items); dan Kuder-Richardos formulas (digunakan untuk item dichotomous). Semakin besar koefisien yang didapat, berarti semakin baik alat ukur.
a. Split Half Reliability
Dua skor didapatkan untuk setiap orang dengan membagi tes menjadi 2 yang ekuivalen.
……… …….
2. Validitas
Sejauh mana isi tes mencerminkan ciri atribut yang hendak diukur Content validity
Meyakinkan bahwa pengukuran telah sesuai dan menggambarkan hal-hal yang ingin diukur
Face Validity= paling rendah signifikansinya karena hanya didasarkan pada penilaian terhadap format penampilan (appearance) tes. Apabila penampilan tes telah meyakinkan dan memberikan kesan mampu mengungkap apa yang hendak diukur maka dapat dikatakan bahwa validitas muka telah terpenuhi.
Criterion-Related Validity
Melakukan pengukuran untuk membedakan kriteria individu-individu, dimana kriteria sudah diprediksikan sebelumnya (Ada kriteria yang dijadikan dasar pengujian skor tes). Dilakukan dengan 2 cara:
- Concurrent validity= apabila skor tes dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor merupakan koefisien validitas konkruen.
- Predictive validity= tes dimaksudkan untuk memprediksi performansi yang berbeda-beda diwaktu yang akan datang. Contoh: dilakukan tes kemampuan
terhadap pekerja baru untuk melihat perbedaan performansi pekerja tersebut di masa yang akan datang. Yg skornya rendah akan menunjukkan performansi buruk. Yg skornya tinggi akan menunjukkan performansi baik.
a. Construct Validity
Melihat kesesuaian hasil yang didapat dari alat ukur yang kita gunakan terhadap teori. Dinilai dengan 2 cara:
- Convergent Validity= dipakai ketika nilai yang dihasilan dari 2 instrumen berbeda yang mengukur konsep yang sama memiliki korelasi tinggi.
- Discriminant validity= dipakai bila, berdasarkan teori, 2 variabel diprediksikan tidak berkorelasi dan nilai yang dihasilkan memang didapatkan demikian.
Kini setelah kita mengetahui empat tipe skala yang dapat dipakai untuk mengukur dimensi dan
elemen variable (
variable
) yang didefinisikan secara operasional adalah perlu untuk menelaah
metode penskalaan (yaitu, menentukan nomor dan simbol) untuk memperoleh respons sikap
subjek terhadap objek, peristiwa atau orang. Terdapat dua kategori utama skala sikap (jangan
dikacaukan dengan empat
tipe skala
) – skala peringkat dan skala ranking. Skala peringkat (rating
scale) memiliki beberapa kategori respons dan digunakan untuk mendapatkan respons yang
terkait dengan objek, peristiwa, atau orang yang dipelajari. Skala ranking (rating scale), di sisi
lain, membuat perbandingan antara objek, peristiwa, atau orang, dan mengungkap pilihan yang
lebih disukai dan merangkingnya. Kedua skala tersebt dibahas di bawah ini.
SKALA PERINGKAT
Skala peringkat berikut ini sering dipakai dalam penelitian organisasional :
Skala dikotomi
Skala kategori
Skala likert
Skala numerikal
Skala diferensial semantik
Skala peringkat terperinci
Skala peringkat jumlah konstan atau tetap
Skala stapel
Skala peringkat grafik
Skala konsensus
Skala Dikotomi
Skala dikotomi (
dichotomous scale
) digunakan untuk memperoleh jawaban Ya atau Tidak,
seperti dalam contoh di bawah ini. Perhatikan bahwa skala nominal (
nominal scale
) dipakai
untuk mengungkap respons.
Skala Kategori
Skala kategori (
categori scale
) menggunakan banyak item untuk mendapatkan respons
tunggal seperti dalam contoh berikut. Contoh ini juga menggunakan skala nominal.
Skala Likert
Skala Likert (
Likert scale
) didesain untuk menelaah seberapa kuat subjek setuju atau tidak
setuju dengan pernyataan pada skala 5 titik dengan susunan berikut :
Skala Diferensial Semantik
Beberapa atribut berkutub dua (
bipolar
) diidentifikasi pada skala ekstrem, dan responden
diminta untuk menunjukkan sikap mereka pada hal yang bisa disebut sebagai jarak semantik
(
semantic space
) terhadap individu, objek atau kejadian tertentu pada masing-masing atribut.
Kata sifat berkutub dua yang digunakan misalnya akan berupa istilah tertentu, seperti
Baik-Buruk; Kua-Lemah; Panas-Dingin. Skala diferensial semantik (
semantic differential scale
)
dipakai untuk menilai sikap responden terhadap merek, iklan, objek atau orang tertentu.
Skala Numerikal
Skala numerikal (
numerical scale
) mirip dengan skala diferensial semantik, dengan
perbedaan dalam hal nomor pada skala 5 titik atau 7 titik disediakan dengan kata sifat
berkutub dua pada ujung keduanya. Ini juga merupakan skala interval.
Skala Peringkat Terperinci
Pada skala peringkat terperinci (
itemized rating scale
), skala 5 titik atau 7 titik dengan titik
panduan atau jangkar (
anchor
), sesuai keperluan, disediakan untuk tiap
item
dan responden
menyatakan nomor yang tepat di sebelah masing-masing
item
, atau melingkari nomor yang
relevan untuk tiap
item
, seperti dalam contoh berikut ini. Respons terhadap
item
kemudian
disajikan. Hal ini menggunakan skala interval.
Skala Jumlah Konstan atau Tetap
Disin responden diminta untuk mendistribusikan sejumlah poin yang diberikan ke berbagai
item
seperti dalam contoh di bawah. Skala jumlah konstan atau tetap (
fixed or constan sum
scale
) lebih bersifat skala ordinal (
ordinal scale
).
Skala Stapel
Skala staple (
staple scale
) secara simultan mengukur arah dan intensitas sikap terhadap
item
yang dipelajari. Karakteristik minat terhadap studi ditempatkan di bagian tengah dengan
jarak skala numerik, katakanlah, dari +3 ke -3, pada tiap sisi
item
seperti diilustraikan di
bawah. Skala ini memberikan ide mengenai seberap dekat atau jauh respons individu
terhadap stimulus, sebagaimana ditunjukkan dalam contoh berikut. Karena skala ini tidak
memiliki titik nol absolut, skala ini adalah skala interval.
Skala Peringkat Grafik
Gambaran grafis membantu responden untuk menunjukkan pada skala peringkat grafik
(
graphic rating scale
) jawaban mereka untuk pertanyaan tertentu dengan menempatkan tanda
pada titik yang tepat pada garis, seperti dalam contoh berikut. Ini merupakan skala ordinal,
meskipun contohb erikut mungkin membuatnya terlihat seperti skala interval.
Skala Konsensus
Skala juga dibuat berdasarkan konsensus, di mana panel juri memilih
item
tertentu,
mengukur konsep yang menurut mereka releva.
Item
dipilih terutama berdasarkan ketepatan
atau relevansinya dengan konsep. Skala konsensus (
consensus scale
) tersebut dibuat setelah
item
terpilih diperiksa dan diuji validitas dan keandalannya.
Skala Lainnya
Ada juga beberapa metode penskalaan yang sudah sangat maju atau rumit (
advance
) seperti
penskalaan multidimensional
(
multidimensional scaling
), di mana objek, orang, atau
kedua-duanya, diskalakan secara visual, dan dilakukan analisis gabungan (
conjoint
). Hal
tersebut memberikan gambar visual mengenai hubungan yang ada dianara dimensi sebuah
konsep
(
construct
).
Perbandingan Berpasangan
Skala Perbandingan Berpsangan (
paired comparison
) digunakan ketika diantara sejumlah
kecil objek, responden diminta untuk memilih antara dua objek pada satu waktu. Hal ini
membantu untuk menilai preferensi.
Skala Komparatif
Skala komparatif (
comparative scalei) memberikan standar (benchmark
) atau poin referensi
untuk menilai sikap terhadap objek, kejadian, atau situasi saat ini yang diteliti.