Penetbit
HIMPUNAN EVALUASI PENDIDIKAN INDONESIA bekerfa sama dengan .
PROGRAM PASCASARJANA UNIYERSITAS NEGERI YOGYAKARTA Betdasarkan MOU Nornor 1958/J.35.17
/'l-K/04
Penanggungjawab Ketua
Sekretaris
Penyunting
Djemari Matdapi Moch
Alip
Heri Retnawati Badrun (Srtowagqran Sudiyatno
Aman
Samsul Hadi
Janan Hzryadt Suhardi Sudiyono Penyunting Bahasa
Koordinator:
Nuchron Setting: Rohmat PurwokoSEMUA TIJIISANI YANG ADA DAIAM JURNAL PENELITIAN DAN EVALUASI PET.{EIDIK,dN
BUKAN MERIJPAKA}I EERMINAN SIKAP DAN ATALN PENDAPAT DESTAN REDAKSI TANGGIiI'{GJAITAB TERHADAP rSI DAN ATAU ,{KIBAT DARI TUI-}S,{N
Junal Penelitian dan Eualuai pendidikan
PENSKAI-AAN TEORI KLASIK INSTRUMEN
MALTIPLE INTELLIGENCE
STIPE THURSTONE DAN
LIKERT
' ) F ari da Agw s S e ti aw a ti, 2 ) Dj e m ari Mardap
i
I ) S afu ddin Ayu art, aUniversita
s N egeri Y o gy akarta, 3)
Universit zs G ajah Mada 1)faridaagus
@yahoo.co.id, z)dj emad madapi@yahoo.co.id, u) si,fazw ar@ugm.ac.id.
Abstrak
Penelitian
ini
bertujuanuntuk:
1) mengetahui hasil penskalaan instrumen nuttipte intelligences (A4I) pada tipe Thurstone danLikert
dengan pendekatan klasik, 2) mengetahui karakteiistik instrumentMI
pada tipe Thurstone danLikert
pada data aslidan
data yang diskalakan, 3) membandingkan karakteristikpsikometrik pada
keduatipe
dat^y^ng
sudah diskalakan. Penelitianini
menggunakan pendekatankuantitatif
yang pelaksafiaannyaterdiri dari
empat baglan yang saling terkait, yaitu penelitian pengembangan instrumen, penskalaan pada datahasil
ujicoba, analisis karakteristik psikometrikinstumen,
dan
perbandingan karaktedstik psikomettik instrumen, Instrumen dikembangkan menggunakantipe
Thurstone danUkert
pada konstruk yang sama. Perbandingan karaktedstik
psikometrik
kedua instrumen dilakukan secaradiskriptif. Hasil
penskalaan dengan metode paired comparison didapatkan urutan skor stimulus darl yang terendah yaitu: logika matemattka, musik, Iinguistik, kinestetik, naturalis, visual, interpersonal, eksistensial dan intrapetsonal. Penskaiaan dengan metode sannated rating dihasiikanskot
terstandardan yang
rendah hinggatirggt
pada
tiap
respons. Terdapai perubahanskot,
varian, reliabilitasdan
kesalahanbaku
pengukuran(SEN! dari
data aslidengan data yang diskalakan. I(oefisien teliabilitas dan SEM instrumen tipe Thurstone lebih rendah dibanding tipe Likert.
Kata kunci: penskalaan, nuln'ple intelligences, tipe Tburstonq tbe Likert
SCALING
CLASSICALTHEORY
OF
MULTIP.LE INTELLIGENCES
CI.ASSICAL
INSTRUMENT
TYPE
THURSTONE AND
LIKERT
Abstract
The
study aimedto:
1) resultthe
scaling dataof
multiple intelligence(44!
instrumentsof
Thurstone
and Likert
typesusing
the
classical approach,2)
reveal
the
psychometric characteristicsof
Thurstone andLikert
typesin
the odginal
dataand the
scaled dzta, 3) comparethe
psychometric characteristicsof
the
two
typesof
data.The
study used the quantitative research apptoach. The activity consisted of: developing instruments, processing the data scaling, analyzing the psychometric characteristics of the instruments,and
comparing the psychometnc chanctedsticsof
them. The instrument was developed usingThurctor.
,rd
Likert
typesin
the same constructs. The comparisonof
psychometric characteristicsof
twotypes
of
data
was
anilyzedby
descriptive statistic.The
result
of
scalingusing
paired comparison method arethe
sequential scoresfrom
alow to
high
on
mathematicA-iogi.a, musical,linguistic,
kinesthetic, natutal, visual, inteqpersonal, existential and intrapersonal inteligence.The
scaling using summated rating produce scoresthzt
varyin
eacht.rporrr".
There are changes
of
variants and standarderror
of
measurement(SEtr!
after transformeddata. The reliabiJiry and SEM of the Thurstone
We
arclowerthan
that ofLikett
type. Keywotds: scaling nultipk intelligenn instrument, Thurstone fitpe, Likert flpeJumal Penelitian dan Eualuai Pendidikan
Pendahuluan
Pengukuran
aspek
nonkognitif
di-tandai denganmemberi
skor atau
angka pada hasil pengukuran. Skot menunjukkan kualifikasiattibut
yang diukut. Makna skor hasil pengukutan dapat dibedakan darl, leael of measurement ata:u level pengukuran (Lord&
Novick,
7968, pp.20-21,Allen
&
Yen,1,979,
pp.7-9, Cohen
&
Swerdlik,
2009, pp.73-7fi. Ada empat level pengukuran,yai-tu
nominal, ordinal, intewal dan rasio. Skor hasil pengukuran instrumen tipe Thurstone danLiket
merupakan dataordinal
Analisisdzta ordinal, hanya
dapat
menggunakan modus dan median dan tidak dapat meng-gunakan mean dan SD. Keterbat^sn
peng-ukuran dengan menggunakan data tetsebuttidak
memenuhi asumsi pata-metrik yangterkait dengan data. Glenbetg (1988, p.1,aa)
menyatakan bahwa asumsi
dalam
analisis parametrik adalah data yzng diperoleh ber-ada pber-ada levelinterval
dan tasio. Dengan demikian d^t^ p^da level ordinal tidak dapat dianalisis, dengan statistik parametrik dan analisisy^ng
dilakukan zdalah
nonpa;.a-metrik.
Penggunaan data
ordinal
dalamana-lisis
datz
parametnk menimbulkan
per-debatan panjang danpan
ahli. Hingga saatini
halitu
belum mendapatkan kesepakatan.James Carifto
&
Rocco Peda (2008, p.1150) menyatakanhal
yang samaterkait
dengan adanya petdebatan panjanghingga 50 tahun tentang datz yang didapatkan pada model pengukuran Likert. Jamieson Q004, p.1,21,2) memberi inforinasi bahwa karakteristik data pada skalaLiket
merupakan karakteristik dataotdtnal,
ztav rank order data, sehinggaharus dianalisis dengan nonparametrik, yang kurang sensitif
dan
kurang powerfuldiban-ding
parametrik. Suryabtata, (1998, p.1,a6) menyatakanbahwa dzta yang
diperoleh dalam pengukuran psikologi belum benar-benar dataintervzl,
tetapi dipedakukanse-bagu
data interval. Salah satu upayl- untuk membuatdata
menjads. datzintefial
padahasil
pengukuranpsikologi
adalah dilaku-kannya proses penskalaan, sehingga prosespenskalaan pada dztz ordinal dapat menjadi
salah satu alternatif pemecahan perdebatan paniang tersebut.
Proses penskalaan merupakan :upay^
untuk
menempatlsri
atribut
atau
katak-tedstik pada suatu rentang kontinum, yang didalamnya melibatkan perubahan nilar atautransfornasi
skor baik
berupa transfonnasilinear maupan
nonlinear(Brennan,
2006, p.155). Dalam penelitianini
penskalaan di-kaitkan dengan :up^yauntuk
menempatkanatribut
psikologi
dengan mengubah ataumentransformasi data yang semula
berben-tuk
dataordinal
yangtidak memiliki
unit pembanding yang sama menjadi datainter-val
atau rasio yangmemiiiki
saruan pem-banding yangsama.Betbagai macam
c
ta
ata.a metode dilakukan dalam vp^y^ untukmentransfor-masi
datamenjadi data interval.
Metode penskalaantidak
terlepasdati
pendekatan yang digunakan. Terkait dengan pengukuran aspekpsikologi, Torgerson (1958,
p.46) mengelompokkan metode penskalaanda-lam
:dga metode, yaitu: (1) metode penska-laan yang berpusat pada stimulus; (2) meto-de penskalaan yarLg berpusat pada respons;dan (3)
metode penskalaan yang berpusat pada subjek.Metode penskalaan berbasis stimulus merupakan metode penskalaan dengan
me-nempatkan
serangkaianstimulus
dalam suatukontinum
poin.
Metode penskalaanberpusat pada respons merupakan metode penskalaan dimana respons subjek dibuat dalam suatu rentang
poin
tertentu. Metodeini
disusun
berdasar
distribusi
resrlons subjek. Salah satu contoh metodeid
alahh
skala
Likert.
Respons
subjek
diberikan dalam taraf kesetujuan ataa ketidaksetujuandalam
berbagai vztiasinya.Pada
metode penskalaan yang berpusat pada subjek, pe-nyusun tes meietakkan subjek atau individu yangakan dihadapi pada poin yang berbeda secarakontinum. Metode
ini
banyak di-gunakan, misalnya dalam pengelompokan siswa menggunakan skorz,
persentil, skor rQ.Pada 70 tahun terakhir ini, pengukur-an aspek psikis manusia kembali berfokus
pada
metode yarry
awalnyasudah
kembang sejak tahun 1.930-an, yaitu metode yang rent^n
untuk
dijawab tidakiuiur
ataufaking
(Chernyshenko, et.al., 2009, p.1'06).Salah satu metode yang digunakan adalah
perbandingan belpasangan yang dipelopori oleh Thurstone (1.927, p.383). Dalam me-tode
ini
disajikan 2 stimulus pada tiap butiruntuk
dipilih
yang
palng
sesuai dengan keadaansubjek.
Metode
ini
selaniutnya menjadi dasat pengukuran force-cboice,yaiw
metode
pengukurany^flg
mengharuskan subjekmemilih
satu
pernyataandart
be-berapa
pernya;t^n
yang
disediakanQVIc-Donald,
1.999,p.24).
Pemilihan satu dari beberapa pernyata;n
dalam paired compaison menyebabkan tipeini
memiliki karakteristik yang berbeda dengantipe
instrumen yang menyajikan sebuah pernyat^^n denganber-bagai tespons.
Penskalaan
pada
tip.
irri
berbasis stimulus.Dalam
metode
ini
serangkaian stimulus dipetbandingkanuntuk
direspons sesuai dengan kondisi subjek. Dengan demi-kian,tipe
instrumenini
memberrkan alter' nattf pada responden memberikan responsyang berbeda-beda pada betbagai stimulus
yang
disajikan, sehinggaakan
didapatkan respons yang bervariasi pada berbagai sti-mulus yang disajikan. Halini
sejalan denganpendapat Olivares
&
Btown
Q01,0, p.935) yang menyebutkan bahwa tipeini
terhindardari
jawabanyang
sama ata:u adanya biasdalam membeti respons seperti
responspersetuiuan yang ekstrim, atau
kelemahan-nya
dalam pemberian respons yang tidak bervariasi ataa halo-ffict.Instumen ttpe force+boice memitl<t ke-lebihan terkait dengan respons subjek yang cenderung terhindat dair social desirabiliry dan
faking
(t\.{cDonald, 1.999,p.24,
Cherny-shenko, et. al, 2009, p.108). Social desirabiliryyutv
pernyataan bersifatumum
yangme-miliki
kecenderungan untuk direspons sub-jek dengan tidakjujut,
sehingga sulit untuk mengetahui pendapatsubjek
sebenarnya.Sementara ttu faking adalah kecenderungan subjek
memilih
respons yangtidak
sesuai dengan karakteristik dirinya atau dengan se-ngaja mengubah responsnyauntuk
men-Jumal Penelitian dan Eaaluasi Pendidikan
dapatkan dtnnya pada kelompok yang di-hanpkzn.
Metode paired
contparison memiliki kelemahanterkait
dengan beban kerjanya yang banyak akibatdad
setiapbutit
yang harus mendapat kesempatanuntuk
beqpa-sangan denganbutit
dari aspek lain (Kwan&
Chiu,
2007,
p.an).
Kelemahan lain
model
ini
menurut
Mclver
&
Carmines(1986,
p.21)
adalah dipengaruhi oleh karak-terisnk jadgwenLHal
ini
disebabkan katena proses penskalaan modelini
terkait dengan orang y ang akan membedka nj
u dgm e n t, makakatakteristik judgnent juga akzn
mempenga-ruhi
hasil penskalaan. Betbagai kelemahan dalarntipe
ini
dapat dtatzsi dengan model pengukuran yzng berbasis respons subjek. Metode yang sering digunakan dan sangatterkenal dalam
pengembangan instrumen pada penelitian sosial adalah metode yang digunakan dalam instrumen tipe Likert.Instrumen
tipe
Likert
muncul dalam jurnal Arcbiues of Pycbolog yang yang ber-judrfl, Techniguefor
Measurement of Attitudu. Penskalaantipe
Likert
dikembangkan olehRensis Linkert untuk mengukur sikap sosial. Pengukutan
tipe
ini
peft^m
kali
dibuatunfuk
mengukur sikap atau pendapatsese-orang
tethadap hubungan
internasional yangterkait
di
dalamnyaadilah
berbagaiopini
tentang hubungan Amerika terhadap perdamaian dankonflik
dengan negara Iain, sikap tethadap keg1atan militer Amerika dan sikap terhad^p orz;ng kulit hitam atau Negro(Likert,
1.932, pp.15-20). Meskipun instru-menini
digunakanuntuk
mengukur sikap,namun lebih lanjut ia |uga
menyatakanbah-wa
tipe
pengukuranini
tidak
hanya dapat digunakanuntuk
mengukur pendapat atausikap tetapi juga digunakan untuk mengukur persepsi
dan
berbagaikarakteistik
psikis atza trait manusia serta dalam pengukurankepdbadian
(Likert,
1.932,p.7).
Davies (2008,p13\
juga menyatakan bahwa ins-trumen tipe Likertini
berkembang luas dan digunakantidak
hanya dalam
mengukut sikap danopini
tetapi juga mengukur pet-formansi dan kemampuan manusia.Model
ini
disusun berdasar distdbusi respons subjek yang betbeda dengan modelPenskalaan Teori Kasik Instrunen Multiple Intelligences
-
261Jumal Penelitian dan Eaaluai Pendidikan
Thurstone dalam proses penskalaan. Dalam tipe ini respons subjek diberikan dalam
tanf
kesetujuan,misalkan:
sangatsetuiu
atau stronfu approue,setuiu
atarv apprzae, tidaktentu
atau undecided,tidak
setuiu atau dis'approue, dan sangat tidak setuju atau shongfi disapproue
pikert,
1.932, p.14).Dalam
per-kembangan selanjutnya, respons subjekini
tidak
hanya betbentuk
taraf
kesetuiuan, tetapi berkembang dalam berbagai format, misalnya: taraf kesesuaian, tataf keyakinan, frekuensi, ketetarikan dan skala ratinglun-nya y^ng menggambatkan aktivitas,
perasa-afl
^ta;r- situasi
tertentu
(A4assof, 2004, p.382). Jurntah respons dalam
tipe
ini
juga berkembangdan
bervariasi,yang
semulatipe
ini
menggunakan5
tespons, berkem-bang menjadi 7 respons (Van Zanten, et,al.,2006,
p.521).
Ptoses penskalaan tipeUkert
dikenakan pada respons subjek dengan ber-bagai variasinya, atau kriteria yang diguna-kan dalam penskalaan adalah respons, maka
penskalaan
model
ini
dapat dikatakan se-bagai proses penskalaan dengan pendekatan fespons.Tipe
Likert
memiliki
beberapake-lebihan
dan
kelemahan.Kelebihan
tip"
Likett
terkait dengan kesederhanaarrnya dan kemudahannya dalam pen)'usunan dan in-teqpretasiinstrumen
(Laethoven,
Zaag-Loonen,
Derkx,
2004,p.
830).
Namun,ktitik
terhadaptipe
rm
adalah adanya ke-terkaitanatau
korelasi yangtirggr
afitatasatu butir dengan butir-butir
lun
atau artarabutit
dengan total. Korelasitirgs
ini
akanberpengaruh pada skor kekuatan
butir
yangdigunakan dalam pertimbangan seleksi butir (X4clvet
&
Carmines, 1986, p.30). Kelemah-an la:n dari tipeini
adalah memungkinkan responden untuk melakukan fokios.Kebet-adaan -fnkios
ini
memungkinkan diperolehskot
instrumen yangtidak
sesuai dengankondisi sebenarnya.
Penskalaan merupakan bagpan yang mendasar dalam proses pembentukan teori pengukuran
[.ord
&
Novick,
1968, p.22). Penskalaan dengan teori klasik yang terkenal dilakukan oleh Thutstone dan Likert. Thur-stone melakukan proses penskalaan denganmenggunakan metode paired conparison
de-ngan mengabaikan asumsi distribusi variasi subjek
^tav
caseV
(Guilford,1954,
p.156).Sementara
itu,
Likert
(1923,p.21)
meng-gunakan metode Sigma dalam proses pen-skalaannya.Dalam
metodeini
setiapres-pons
pada setiap
petnyat^a
dibed
skor dengan berasumsi pada distribusi normal. Penggunaan distdbusi normalini
dilakukan agarsetiap
skor dapat
diperbandingkan. Selanjutnya metodeini
disebut juga dengansunnated rating (Shaw
&
Jack, 1,967, p.24,Azwat,
2004,p.704,
Dunn-Rarrl<tn, et.al., 2004, p.105). Proses penskalaan Thurstonedan Likert dilakukan dengan dengan prinsip yang sama yaitu mengkonversi
skor
kasaryang didapatkan dengan skor z yang meng-gunakan distribusi normal. Dengan proses penskalaan ini jatak antarskor menggunakan satuan yang sama, sehingga data yang di-dapatkan menjadi data interval.
Pengembangan instrumen ilmu-ilmu sosial terutama psikologi banyak mengguna-kan tipe Thurstone ataupun
Likert.
Begitupula
dengan instrumen nultiple intelligences (NIDyrng
dikembangkan dalam peneJitiandisertasi
ini.
Di
beberapa negata instrumen nultipk intelligences sudah dibuat dan dikem-bangkan dalam berbagai penelitian. Pada tahun 2007, peneliti juga sudahmengem-bangkan instrumen
nultiple
intelligences, namun instrumen yang sudah dikembang-kanini
dalam analisisnya belum dilakukan proses penskalaan.Di
samping itu, terdapat bebetapabutir
yang
muatanfaktor
yang tendah sehingga pedudiperbaiki.
Dengan demikian,pedu
dilakukan penelitian lebihlanjut untuk
mengembangkan instrumenyarrg sudah
dibuat
dengan
melakukanproses penskalaan pada data hasil penelitian.
Istilah
karakteristikpsikometrik
ter-kait
denganatribut tes
psikologi.
Karak-teristik
psikometrik
merupakan berbagai karakteristikyang terkait
dengan
atribut tentang tes (Furr&
Bachanch, 2008, p.8).Berbagai atribut tentang tes psikologi ^nt^ra lain:
tipe
data atza skor hasil pengukuran, reliabilitas data hasil pengukuran, danvali-ditas data hasil
pengukuran.Dalam
pen-dekatan
teori
kiasik atribut
tes
banyak dijelaskan dad konsep tentang reliabilitas.\
I(onsep reliabilitas muncul dad asum-si dalam teori tes klasik yang terkait dengan skor tampak
8q,
skormurni
(f),
dan skor kesalahan pengukuran(E).
KonseP utama dalamt"ori
ini
adalahX
=
T
*
E, atau skortampak
merupakan gabungandari
skot rnottri dan kesalahan pengukuran. Berdasarasumsi tersebut, konsep tentang varian skor
tampak
atau total aarianceyang
dihasilkan merupakan gabungan dari vadan skor murniatau trae uaiance dan varian skor kesalahan
^t^u
etrur aariarce. Asumsi tersebut dibuatdalam formula
o!-
o!+o"2 (Gulliksen, 1950,p.34,Lord
&
Novick, 1968, pp.56-57, Allen& Y"tt,
1.979,p.61,Thissen&
Wainer,2001, pp.26-27).Reliabilitas
terkait
dengan kesalahan pengukuranpada
datahasil
pengukuran. Mardapi (2008, P.32), menyatakan kesalahanpengukuran merupakan komponen
ketidak-ieliabilan yang
banyakdikaii
dalam ilmu sosial. Berdasar konsepskor
dalam teoriklasik,
reliabilitas data
hasil
pengukuran dapat dijelaskandari vaian
skor. Adanya ketetkaitanantatl
vatian skor sebagaimanadisebutkan dalam asumsi teori klasik dapat
digunakan untuk menielaskan definisi relia-bilitas yang meruPakan lntetaksi varian ke-salahan dan
vaian
skor
tampak. Konseptentang reliabilias
dapat
diformulasikansebagai Q*,,
=
7'
o"2/
o*',
yang besarnya reiiabilitas dipengaruhi oleh variankesalah-an
dan varLan skor yang tampak. Berdasarformula
tersebut, dapat diielaskan bahwa semakin besar varian kesalahan akansema-kin
kecil teliabilitas yang dihasilkan dan se-baliknya.Istilah
vaian
kesalahan sedng disebut sebagai standarderor
of measurernent (SEI\Qatau kesalahan
baku
pengukuran. Fotmula SEM ini lebih sering dituliskan sebapi SEM at^v oe=
o,{1-
g**,. BesarnyaSEM
mem-pengaruhi reliabilitas maka dapat dikatakanbahwa
ketepatanhasil
pengukuran dapatdilihat
dari
besarnyaSEM.
Semakin kecilSEM
pengukuran
akan
semakin
tePat,reliabel
dan
dapat
dipercayahasil
peng-ukurannya.Reliabilitas suatu alat
ukur
diketahuidari
koefisien reliabilitas
yang
diukurJunal Penelitian dan Eaahai Pendidikan
dengan berbagai metode atuu
c
ra, Secataumum
ada3
carauntuk
mengukur relia-bilitas instnrmen,yaitu: (1)
tes ulang atautest-retest, (2) tes paralel
ataaparalhlfom
dan(3)
konsistensiinternal
atau ifltetndl consis-tenE, Dalam pendekatan tes ulang alat tes diberikan pada sekelompok subiek dua kaii,dengan
selangwaktu tertentu,
misalnya selangdua
minggu. Koefisien
reliabilitasdiukur
dari korelasi skor pada tes pertama dan tes kedua. Kotelasi antarskot pada tespertama
dan
tes
kedua dapat
dihitung dengan rumus kotelasi pmdurt moment Pen-dekatan tes ulang mengandung kelemahan katena kondisi subiek pada tes pertama dan kedua bisa berubah karenaunsur
belaiat, pengalamandan
motivasi
yang
berbeda. Meskipun demikian, pendekatanini
cocok digunakanuntuk
pengukuran-pengukuran keterampilan, terutama ketetampilan fi sik.Reliabilitas pada pendekatan tes
pan-lel
didapatkandengan cata
memberikan pengukuran dengan menggunakan dua pe-rangkat tes yang paralel, misalnya perangkat pertama dan kedua diberikan padasekelom-pok
subjek. Koefisien reliabilitas tes diukur dengan menghitungkorelasi
^rtarl
skotperangkat pertama
dan
kedua. Koefisien korelasijuga
dapatdiukur
dengan meng-gunakan korelasi prcduct monent. Metodeini
memiliki
keterbatasan karena sulitnya me-nyusun perangkat tes yang paralel.Pada pendekatan konsistensi internal,
pengukuran
diberikan pada
sekelompok subiek sekali,lalu
dengan cara teftentu di-hitung koefisien reliabilitas tes tersebut. Ada berbagaiformula
yang
digunakan dalammenghitung reliabilitas. Salah
satu
cata menghitung koefisien retabilitas dilakukan dengan menganalisisvarian skor
denganmenggunakan fotmula alpha dari Cronbach. Perhitungan reliabilitas dengan mengguna-kan koefisien alpha lebih banyak digunakan dibanding perhitungan dengan
teknik
lain.Teknik
ini
memiliki
kelebihanpada
ke-mudahannya dalam mendapatkan skor dancara analisisnya.
Betdasar p^Paliarn latat belakang Pene-litian yang diielaskan sebelumnya, penelitian
ini
bertufuan sebagaiberikut (1)
menge-Penskalaan Teori Klasik lttst*nen Mtln'ph Intelligences
-
263Jumal Penelitian dan Eaahrail Pendidikan
tahui hasil
penskalaaninstrumen
m,iltiple intelligenns padatipe
Thurstone dan Likert dengan pendekatan klasik;(2)
mengetahui karakteristikinstrumen
naltipk
intelligences padatipe
Thurstone danLikert
pada dztaasli dan
data yang diskalakan;(3)
mem-bandingkan karakteristik psikometrik padakedua
tipe
data yang sudah diskalakan de-nganmenggunakan pendekatan kiasikMetode
Penelitian
Secara
umum
penelitianini
meng-gunakan pendekatan penelitian kuantitatif yang dalam pelaksanaannyaterdiri
dad be-berapa bagSan penelitian yang saling terkait, yaitu: penelitian pengembangan instrumen, proses penskalaan pada data hasiluji
coba,analisis karakteristik psikometrik instrumen, dan perbandingan karakteristik psikometdk instfumeri.
BagSan
pefi^m^
adalah penelitian pe-ngembangan. Pada penelitianpengembang-^n
dibuat instrumen
multiple intelligennsdengan menggunakan
dua tipe, yaitu
tipeThurstone
dan tipe Likert.
Setelah diuji validitasisi
dadahli
selanjutnya diperbaiki. Instrumen yang sudah teruji validitas isinya selanjutnya diujicobakan dilapangan. Bagian berikutnya adalah melakukan proses pen-skalaan. Proses penskalaan dilakukan padadata
hasil
uji
coba
di
lapangan denganmenggunakan pendekatan klasik. Setelah di-skalakan zkan dianahsis karakteristik
psiko-metrik
keduatipe
instrumen. Bagianter-akhir
dalam
peneJitianini
adalah mem-bandingkan karakteristik psikometrik keduatipe instrumen secara diskriptif.
Subjek dalam
penelitianini
adalahmahasiswa Universitas
Negeri
Yogyakarta(tJN!.
Pengambilan data dilakukan dengantwo stage cluster sampling atau pengambilan sample dengan
2
trngkat. Dalam penelitianirn
ada2
ingkatan
kluster
yaitu
tingkat fakultas dan tingkat program studi. Ada 454mahasiswa yang tedibat dalam penelitian
ini
yang berasal dati 6 Fakulas dan 1.2 program studi
di UNY. Dari
454 subjek penelitian, terdapzt 11 orangyang datanya ndak dapat dianalisis karenz tidak lengkap dalampeng-isian
instrumen, sehinggay^ng
data yang berhasil dianalisis sebanyak 443 orzng.Setelah dilakukan proses penskalaan, selanjutnya
dianalisis karaktedstik
keduatipe
instrumen berdasar koefisien reliabili-tias. Pada penelitianini
reliabilitasinstru-men tipe
Thurstone dianalisis dengan duac
ra.
Reliabilitashasil
pengukuran setiap dimensi dianalisis dengan.o-o,
alphadai
reliabilitas data seca,ra keseluruhan dihitung berdasar koefisien reliabilitas
internal
dari I(endall dan Smith (7940,p.330). Perhitung-an rrltabittas instrumen tipeLikert
dilaku-kan dengan fumus alpha. Karena instrumen pada penelitianini
memiliki
beberapa di-mensi, maka analisis reliabilitasmengguna-kan
reliabilitaskomposit
dari
alpha. Per-bandingan reliabilitas kedua tipe instrumen dilakukan secara diskdptif.Hasil Penelitian
dan PembahasanPenelitian
ini
memaparkan prosespenskalaan
y^ng dimulai dari
men)'usun instrumen, mengubahskor
hingga meng-analisis karakteristis psikometrik hasilpen-skalaan dengan pendekatan klasik.
Penskala-an
dilakukan dengan menggunakaninstru-men
multiple intelligence yang butir-butirnyasudah
dibuat
dan
diseleksi,
selanjutnyabutir-butir
yang
sudah terseleksi disusun kembali sebagai instrumen dengan format atautipe
Thurstonedan
Liker,
sehinggakedua
tip.
instrumen tersebut
memiliki konstuk danbutir-butir
yang sama namun tipe instrumeflnya yang berbeda.Penyrsunan
butir
ata;u petnyat^zninstrumen
tipe
Thurstone
mengacu pada metode paired compaison atau perbandingan berpasangan. Setiapbutir
berpasangande-ngan
butir lain
dandipilih
salah satu butiryang
paling
sesuai.Dalam
peneiitianini
dipasangkan satu
butir
pada satu dimensi dipasangkan dengan butir pada dimensi lain.Ada
9
dimensi yang diungkap pada instru-men nultiple intelligenceini,
untuk
itu
setiapbutir
pada satu dimensi selalu berpasangandengan
butir pada
dimensi yang lain. Oleh karena ada9
dimensimaka
diperlukan 36 pasangbutir,
sehingga jumlah keseluruhanada72 butir. Setiap dimensi diwakili
oieh
8 butir. Penentuanbutir-butir
yangakanber
pasa;ngan dengan
butir-butir
dimensi laindilakukan
secatarandom.
Pembuatan in-strumentipe
Thurstone dengan membuatpasangan butir dengafl car^ merandom
butit
setiap
p^sanganditeliti juga
melaloi
p"-nelitian
uji coba
dan didapatkan data yang cenderung s m^^t^a
identik.
Hasil uji cobaini
digunakan sebagai dasar penl'usunan instrumentipe
Thurstone dalam penelitianini
yang butir-butirnya disusun secara acakpada setiap dimensinya
untuk
dipasangkan pada butir-butir di di-rnensiyanglun
Instrumen tipe Likert disusun dengan
membuat sejumlah pernyataan yang
memi-liki
konstruk yang sama dengan instrumentipe
Thurstone. Setiapbutir
disajikande-ngan
sebuah pernyataandan
5
alternatif respons yang beradadi
sampingnya.Alter-natif
respons dibuat sec raurut
dari sangattidak mampu hingga sangat mampu. Sangat
tidak
mampudiberi skor L, tidak
mampu diskor 2,ngt-taga
diskot 3, mampu diskor4
dans
rLgat mampu diskor 5. Oleh karcnajumlah
butir
pada instrumen
tipe
Likert menyesuaikan dengan instrumen tipe Thur-stone, setiap dimensipada
instrumen tipeini jug
diwakili oleh
8
butir,
sehinggajumlah keselutuhannya ada 7 2
buir.
Kedua bentuk instrumen
ini
selanjut-nya
diujikan
pada mahasiswaUNY
yangmenjadi
subjek penelitian.Data
yang
di-dapatkan selanjutnya dianalisis dengan pen-dekatan klasik. Penskalaan dengan pende-katan klasik dilakukan dengan metode paired conparison pada instrumentipe
Thurstone dan metode summated rating pada instrumen tipeLiket.
Penskalaan Paired Comparison
Proses
penskalaandilakukan
padaskor
hasil penelitian sebanyak443
subjek. Perhitungandilakukan
secara. manual de-ngan bantuan program MicrwortExnl
de-ngan mengikuti
langkah-langkah sebagai bedkut:(1)
Membuat matrik frekuensi(f
yangme-muat iumlah
frekuensipilihan
subjekJamal Penelitian dan Eaaluati Pendidikan
terhadap masing-masing pasangan sti-mulus
Q)
Mengurutkan stimulusdari
yang
ter-kecil hingga terbesar(3)
Mengubah nilai frekwensi menjadi nilai proporsi (p),p=
f/N
(4)
Mengkonversikan haryap
dalamben-tuk
skor z yang merupakan deviasi daritata-rata pada distribusi normal
(5)
Menghitung rata+:a;t^ skorz
pada aap dimensi(6)
Membuaturutan stimulus
dariz
ter-kecil hingga besarBerdasar perhitungan menggunakan Iangkah-langkah sebagaimana dijelaskan di
atas,
didapatkanskor hasil
transformasiuntuk
logika
matematika0,
musik
0,376,Iinguistik
0,429, kinestetik 0,575, natumlis0,668,
visual
0,774, interpersonal
7,031., eksistensial 1,065 dan intrapersonaL'1,541.. Hasil tersebut menunjukkan bahwa dengan menggunakankriteria
skor
z,
sembilanbentuk
kecetdasandi
atas,jika
diurutkan dalam rentangskor
dari
terendah hingga tertinggi didapatkan nilai skala yang berbeda beda. Dibanding kecerdasan yang lain, ke-cerdasanlogika
matemaika
merupakan kecerdasan terendah.Hal
ini
menuniukkan bahwa masih banyaknya mahasiswa yangmenganggap soal-soal yang
terkait
denganlogika
matematikalebih sulit
dibanding dengan matapelajaran yang lain.Penskalaan S anmated Rating
Ptoses
penskalaaninstrumen tip.
Ukert
dilakukan denganmetode
summated rating. Perhitungan penskalaan dilakukan dengan bantuan programMicrosoft
Excel. Perhitungan penskalaan dilakukan denganmenggunakan langkah-langkah sebagai be-rikut:
(1)
Menghitung
jumlah
frekuensi
(0 respons subjek di tiap kriteria pada aap butir.A)
Skor
frekuensiini
selanjutnya diubah menjadi skor propotsi (p) dan proporsi kumulatif.Skor proporsi dihitung
de-nga;nc
rz
membagi frekwensi(0
d.-nganbanyaknya responden (Nf .
Pentkalaan Teori Kksik Instrunex Milh'ple Innlligenm
-
265Jumal Penelitian dan Eualuai pendidikan
(3)
MgnShitunSProporsi
kumulatif
(pk),didapatkan
dari proporsi
pada
ilapkategori ditambah
proporsi
kategoiisebelumnya.
(4)
Proses berikutnya menghitungpk
te_ ngah yaitutitik
tengah proporsi L,rmo_lalj,f
yangdihitung dari
setengah pro_ porsi dalam kategod ditambah denganpk
kategori
sebelumnya,^tau
dapatdirumuskan sebagai berikut; pk+engah
='/"p
+ pkb.(5)
Prosesselanjutnya
menghitung nilaideviasi
(z)
dengan mengkonversi skorpk-tengah
menjadi slcor
z
denganmengacu pada tabel z kurve normal. Contoh perhitungan penskalaan wm_
(!!!d
*tlug
pada
salahsatu
butir
dapat dilihat pada Tabel 1.Tabel
1.
Perhitungan penskalaan SumnatedRatingpadz Salah Satu Butir
skor
3
berubah
menjadi
l,7gl,
skor berubah menjadi 2,714dan.kor
d beruba.menjadi 3,352.
Dengan
melihat
kedua proses penskalaan
instrumen
dengankedo,
m.tod, yang telah dijelaskan dtatas dapat diketahubahwa
penskalaan instromen'tipe
Uker
dengan metode sum mate d rating paia hzl<tkat nya adilah proses penskalaan
t.rg".,
p.r,
dekatan respons, sedangkan penskiaan tipe Thurstone dengan
*rid,
fi;rA
nmpa_rint merupakan penskalaandengn
penjekatan stimulus. Dalam aplikasinya insttrrmen tipeT*.,,*:
d.
jy.gu digunak"n untuk meng_ukur karakteristik psikologi seseorang yang dasar pengukuran
dan
iralisi.ry,
'-.rrg_
gunakan respons subjek. Sehinggamodil
instrumen
tipe
Thurstone
ini
?skalakanjuga.dengan pendekatan respons.
Dalam pe_ nelitian.
ini
upayauntuk
membandingkan keduatipe
instrumen dengan menganaliris penskalaan instrumentipe
ThurstJne
de_:91"
menggunakan pendekatan respons. Pada teod klasik kedua instrumendiuriairi.
dengan
menggunakanmetode
summated rating.Deskripsi Data Kemampuan
(0)
Subiek Penelitian Sebelum dan SetelairDitransformasi
.
-Deskdpsi data hasil penelitian disaji_ kan dalam dua bentuk,y^itu
data sebelum diskalakan yang masih berupa skor asli dandatl
-yanp sudah diskalakar atau data yang sudah ditransformasi dalam
skor
,.
b.r_
kripsi. dzta yang disajikan pada setiap di_ mensi atau bentuk kecerdasan. Data &saji_ fal.dalam _r atz-tata (mean), simpangan baku(SD),
.median (A4d),
skor terendif,
CfW"llT..,tk"t
terringgr Crvlr*).Deskripsi
datadrsa,rkan telprsah setiap bentuk instrumen. Data hasil penelitian dingan menggunakan
Tr.qT."
tipe
Thurstone
disaji6n
prdaTabel
2.
dan deskripsi data hasilp.rr.firirn
1:ngr"
menggunakan insrrumen tipeUkert
disajikan padaTabeI3.
Butir 1 Respons
t
p
4
0,009
pk
0,009pk
tengah
0,005z
-2,61.7z+
0,00036 120
2290,091 0,277
0,5170,090
0,361. 0,9790,047 0,204
0,547 -1,671 -0,926 0,1030,940
1,795 2,714 540,1.22 1,000
0,77'1,
0,741
3,352
.
_Hasil penskalaan sunnated rating dt-dapatkanskor
z
tiap
responspada
tiapbutir. Hasil
tersebut menunjukkan bahwa dengan proses penskalaan didapatkansror
responspada
:.iLapbutir
berbeda dengan skor respons tanpa penskalaan. Skor hasii penskalaan menunjukkanjatak skor
antar responspada
masing_masingbutir
tidaktet^p
atau sama dengan 1. Skor pada res_pons
1
berubah menjadi -2,61,1,, respons 2 betubah menjadi -1.,671",,"rporr, 3 berubah menjadi -0,826, respons4
berubah meniadi 2r,71! dan respons 5 berubah menjadi 0,741.Apabila
skor
terendahdiubah
meniadi 0 maka maka skor2
berubah menjadi'0.940. [image:10.595.8.586.56.822.2]Jurnal Penelitian dan Eualuai pendidikan
Tabel2.
Deskripsi Data Penelitian dengan Menggunakan Instrumen Tipe Thurstone ThurstoneDimensi Data Asli Data setelah ditransformasi
Mean
SD Md Min
MaxMean
SD Md
Min MaxLinguistik
3,255
1,427
3
0 Logika-matemaika2,047
1.,872
23,41.3
7,415
3,399 0
7,61,746 1,509
1,,634
0
6,539 4,37'1.7,676
4,492 0
9,2292,841.
1,,91,32,62 0
7,2363,696
'1,,46
3,646 0
7,7758,996 7,773 9,905
2,602
71.,36,314 1,577
6,499 0
9,4994,727
7,63
4,797 0
9,0496,184
1,,6356,367
7,13
9,405 Visual-spasialMusik Kinestetik
Intrapersonal Inteqpersonal Naturalis
3,966
1,625
4
02,995
2,77 3
03,623
7,497
4
06,296
1,292
6
24,916
1,306
5
03,885
7,625
4
0Eksistensial
5,016
7,409
5
1Tabel3.
DeskdpsiData Penelitian dcngan Menggunakan Instrumen Tipe LikertDimensi
Likert
Data Asli Data setelah ditansformasi Mean
SD Md Min
Max Mean
SD Md
MinLinguistik
29,84 Logika-matematika 28,36Visual-spasial
28,84Musik
26Kinestetik
29,74Intrapersonal
32,332Intelpersonal
37,478Naturalis
29,790Eksistensial
32-341,3,027
30 15 40
30,31 2,969 30,56
15,03
37,94,605
29 12 40
30,76
4,068
30,85
14,75
39,474,045
29 16 40
30,12
3,4
30,6
19,41
39,125,064
26 12 40
30,09 3,949
30,33
1,9,2
39,333,293
30 16 40
30,15 2,975 30,34 77,64
37,773,437
32 12 40
30,26
3,19
30,52
77,7
36,533,768
31 11 4A
30,27
3,039 30,42 10,12
37,093,993
29 15 40
30,19
3,53
30,41.
16,46
39,093,440
32 g 40
30,41,3,371 30,75
9,279
36,66Tabel
2
dan3
menunjukkankarak-teristik
data pada berbagai dimensi yang ditunjukkandari skor
tata-tata, simpangan baku,medizn
danskor
terendah danter-tirggt.
Dimensi
intrapersonal merupakan skor rata rata tertinggi pada instrumen tipe Thurstone, sedangkan pada instrumen tipeLikert
tata-tatatetinggi
dicapai
dimensi kecerdasan eksistensial, y^ngmemiliki
seli-sih yang sangat kecil dengan dimensi
intra-personal.
Skor
terendah
adalah dimensi logika matemaika baik pada instrumen tipe Thurstone maupun Likert. Pada kedua tipeinstrumen
variasi tertinggi
dimiliki
oleh dimensi kecerdasan musikTerdapat
perubahan kecenderungan sentraldan
variasi data
setelahdata
di-transfomasi ke dalam skorz.
Skornta
tatadan
median pada kedua
tipe
instrumen mengalami peningkatan setelah data ditrans-formasi. Simpangan baku juga mengalamiperubahan
pada
masing-masing dimensi. Simpanganbaku pada dimensi
linguistik, logika-matematika, visual-spasial, musik dan kinestetik mengalami penurunan pada ins-trumen tipe Thurstone, sedangkan pada di-mensi intrapersonal, interpersonal, naturalis dan eksistensial mengalami peningkatan se-telah ditranformasike
dalamskor
z.
Sim-p^ngarL baku pada semua dimensi instrumen tipeLikert
mengalami penurunan.Analisis Reliabilitas
Salah
satu
karakteristik psikometrikyang
sering digunakan dalam pendekatan teori klasik adalah reliabilitas. Dalampene-litian
ini,
perhitungan reliabilitas instrumenpada tipe Thurstone dihitung dengan rumus koefisien reliabilitas
internal
dari
Kendalldan Smith
(1,940, p.330), sementara per-hitungan reliabilitastiap
dimensi yangdi-PenskalaarTeoi Klasik Inshaner Mnlk'ple Ifielligences
-
267Jurnal Penelitian dat Eualuasi Pendidikan
lakukan dengan mmus alpha cronbacb. Hasil
perhitungan reliabilitas
instrumen
secara keseluruhan didapatkan koefi sien reliabilitas sebesar 0,64.Hasil
tersebut menuniukkan instrumenini
cukup reliabel secara intetnal'Pethitungan teliabilitas setiap dimensi
pada instrumen
tipe
Thurstone
dihitung dengan mengelompokkanbutir-butit
yang mengukur dimensi yangs
ma.Hasil
per-hitungan teliabilitas tiap dimensi dibedakan pada perhitungan reliabilitas pada data zslt dan perhitungan reliabilitas pada data yang sudah ditransformasi. Hasil perhitungan re-liabilitas kedua dzta dapat dilihat pada Tabel 4.Tabel4.
Reliabilitas Tiap Dimensi Instrumen Tipe ThurstoneData
Asli
Data skor yang ditransformasi Dimensitidak tedihat jelas dalam grafik. Sedangkan
pada dimensi intrapersonal dan eksistensial
tanpak jelas mengalami peningkatan. Hasil tersebut menunjukkan pada dimensi instru-men yang memiliki reliabilitas cukup bagus SEMnya mengalami penurunan
pzda
data yang ditransformasi, namun penurunanitu
tidak
terjadi terutama pada data
y^rrg memiliki reliabilitas sangat rendah.Perhitungan reliabilitas instrumen tipe
[image:12.595.6.586.37.815.2]Likert
jug
dihitung
pada
tirp
dimensi dengan menggunakanrumus
alpba. Hastl perhitungan reliabilitastiap
dimensi dapat dilihat pada Tabel 5.Tabel5.
Reliabilitas Tiap Dimensi Instrumen Tipe LikertDimensi
Data
Asli
Data skor yang ditransformasi Relia-SEM Relia-
SEMbilitas
bilitas Relia- SEMbilitas
Relia-
SEM bilitasLinguistik
0,267 Logika-matematika 0,651Visual-spasial
0,383Musik
0,7Kinestetik
0,236lntrapersonal
0,25Intelpersonal
0,763Naturalis
0,376Eksistensial 0,195 1.,264
0,203
1,460Hasil
perhitungan teliabilitas
padatiap
dimensi dengan menggunakan nlmusalpha
didapapatkan reliabilitas instrumenpada
tirp
dimensi
tidak
mengalamtpe-rbedaan
yang
bermakna
pada
data
aslimaupun
datayang
sudah ditransformasi.Hasil
tersebut menunjukkan bahwa tidakada perbedazn rchabilttas pada data asli dan
data yang
ditransfotmasi dengan denganskor
z.
Namun,
zpabtladilihat
dari
ke-salahan baku pengukuran
(SEX!
dari kedua data,SEM
pada data yang ditransformasimengalami
penurunan tervtzme-
pada dimensi kecerdasan logika matematika danmusik. Pada dimensi linguistik,
visual-spasial,kinestetik
dan
naturalis, tefdapatpetubahan
kesalahanbaku
pengukuran, namun perubahannya sng
t
kecil sehinggaLinguistik
Logika-matematika Visual-spasial Musik Kinestetik
Intrapersonal Inteqpersonal Naturalis Eksistensial
0,700 1.,654
0,690
1,598 0,887 1,5460,888
7,359 0,783 1,8850,775
7,673 0,856 7,9250,852
1.,5170,639 1,990 0,636' 1,734 0,793
r,563 0,775
1,508 0,749 1,5880,735
1,565 0,825 1.,670 0,81.7 1,510 0,861 1,2840,842
1.,338Reliabilitas
tiap
dimensi
instrumentip.
Likert
sebelumdan
setelah prosespenskalaan
juga
tidak
banyak perubahan, meskipunreliabilitas
pada data asli sedikit lebih tinggi darr data yang sudah diskalakan,namun
perubahannyasangat
kecil
dan kurang bermakna.Namun,
apabrla dilihatdari
kesalahanbaku
pengukuran (SEXQ, ternyata.SEM
pada datz
yang sudah di-skalakan cenderunglebih
rendah, kecuali padadimensi
eksistensial yang mengalami sedikit peningkatan.Setelah didapatkan
reliabilitas
pada tiap dimensi, selanjutnya dihitung teliabilitas instrumen tipeLikert
dengan menggunakan rumus reliabilitas komposit alpha berstrata (Cronbach, Schoneman,Mc Kie,
1,965,p.293, Widhiatso,
2009, p.42,43).
Hasilperhitungan
reliabi.litasinstrumen
secara 1,222 0,2657,071 0,638 7,277 0,344 7,756 0,687 7,308 0,203
7,72
0,256 1,195 0,181 7,283 0,3477,21.4
0,908
1,309 1,070
7,303 7,529 r,422
1,317
keseluruhan dengan menggunakan rumus
tersebut didapatkan
koefisien
reliabilitas sebesar 0,939 denganSEM
sebesar 8,422pada data asli dan reliabilitas sebesar 0,796
dengan
SEM
4,594 pada data yang sudahditransformasi ke dalam skor z.
Hasil
analisisreliabilitas
skor
hasil pengukuran, didapatkan adanya penurunan koefisien teliabilitas setelah data ditransfor-masi dalam skot z, meskipun penutunanini
sangat
kecil
sehinggatidak
cukup
jelas perbedaannya,Namun,
setelahskor
hasilpengukuran
dianalisislebih lanjut
padaSEM,
terjadi
penunmanSEM
pada
datayang dittansformasi. Penurunan
ini
tedihat cukuptirgg
terutama pada instrumen yang memiliki reliabilitas yang tinggi.Hasil tersebut menunjukkan transfor-masi data dari level ordinal ke level interval
tidak
meningkatkanskor
reliabiltas, tetapi menurunkanSEM.
Penggunaan data padalevel ordinil.
dapat mengurangi kesalahan pengukuran apabrla dilakukan prosespen-skalaan menjadi data intewal. Hasil peneliti-an
ini
sesuai dengan yang pendapat Salkind Q073, p.31) yang menyebutkanbah'wz datapada
level
pengukuranyang
lebih
tinggrakan meningkatkan ketepatan dan membed-kan informasi yang
lebih
bagus dibanding level di bawahnya.fumal Penetitian dan Eaalaasi pendidikan
Instrumen
tipe
Thurstone
memiliki karaktedstik yang berbeda denganinstru-men tipe
Ukert.
Meskipun keduanyame-miliki
konstruk
yang sama, katena dibuat dengan format berbeda dan metode peng-ukuran yang digunakan juga berbedamem-berikan
hasil
reliabilitas
dan SEM
yang berbedapula.
Meskipun datahasil
peng-ukurandari
keduatipe
instrumenini
ber-beda tetapi hasil pengukuran dari kedua tipeinstrumen
ini
saling
berhubungan. Hasilperhitungan korelasi
kemampuan
padasetiap dimensi dengan menggunakan instru-men tipe Thurstone dan Likert dapat dilihat pada Tabel 6.
Pada Tabel
6
terlihat adanya korelasi pada dimensi yang sama dengan tipe instru-men yang berbeda (p<
0,01). Korelasiter-tinggi
terdapat pada dimensi musik,selan-jutnya berturut-turut logika-matematika,
na-turalisme, visual-spasial, kinestetik,
linguis-tik,
inteqpersonal intrapersonaldan
paling rendah adilah dimensi eksistensial.Di
sam-ping
itu,
didapatkan ptJLa adanya korelasiyang tinggr pada dimensi yang
berbeda,yaitu
dimensi eksistensial dengan interper-sonal, intrapersonal dengan interpersonaldan intrapersonal dengan kinestetik.
Tabel
6.
Hasil Perhitungan Korelasi anrardimensi pada KeduaTipe
instrumenLing Log
Visual
MusikKines Intra
Inter
Natur
ExistLitg
,317** 0Log
0,011 0,821.Visual
-0,03 0,533Musik
-,14'7**0,002
Kines
-,704' 0,029Intraps
-,1,34**0,005
Inteqps
0,0450,347
Natur
-0,070,1.42
Exist
-0,0510,282
-,311**
-,770**0,006
0,486**
-,190**00
-0.08
,374**0,094
0-,1.56**
0,0570,001
0,233-0,034
-,r32**0,474
0,005-0,027
0,0290,573
0,562-0.093
0,0510,051
0,293-0,011
-0,0160,823
0,741-,377**
0,0090,005
0,973-,746**
-,0090,002
0,96i-,276**
,720,0
0,01.2-0,092
,1.07.0,052
0,025,533**
-,L24*"0
0,009-0,089
,315**0,062
0-0,084
,1.1.2**0,078
0,0190,05
0,0670,297
0,1.57,L37**
,101.0,004
0,034-0,014
-0,0410,762
0,38s,'1,1,7.
0,0660,0i3
0,'166-0,062
-,150**0,19
0,0020,008
-0,0340,874
0,474-,226**
-,732**0
0,005-,L36**
-0,0280,004
0,559,334*"
,1.23**0
0,009,L26**
,31.6**0,009
00,002
0,0230,966
0,633,176.
0,065-0,016
0,090,74
0,094-0,048
-0,0360,315
0,456-0,08
-0,0610,094
0,203-,238**
-,1.25**0
0,009-,r02'
-,726**0,032
0,0090,051
,1"32**0,283
0,0050,029
0,090,555
0,059,497*
-0,0320
0,5060,042
,211**0.014 0,r72 0,379
PenskalaanTeoi K,lasik Intrunen Multiple Intelligences
-
269 [image:13.595.10.571.39.820.2]T
L
Jurnal Penelitian dan Eualaasi Pendidikan
insffumen tipe Thurstone instrumen tipe Likert ada korelasi dengan p < 0,01
ada korelasi dengan p antara 0,01 hingga 0,5
Adanya korelasi atau hubungan pada dimensi
yang
sama dengan menggunakan instrumen dengantipe
yang betbedame-nunjukkan
adanyaketerkaitan data
hasil pengukuran. Halini
disebabkan karcna datatersebut diambil
dad
konstruk yang sama, meskipun metode pengukurannya dengancara berbeda. Demikian pula adanya kore-lasi yang tirggr pada dimensi yang berbeda,
yaitu
dimensi
eksistensialdengan
inter-personal, intrapersonal denganinteqperso-naI dan
intrapersonal dengan kinestetik, menunjukkan bahwa ketiga konstruk dalaminstrumen
ini
memiliki
keterkaitan
satudengan yanglatn.
Perbandingan reliabilitas kedua tipe instrumen dilakukan secata deskdptif. Ber-dasar perhitungan reliabilitas
yang
sudahdisajikan pada tabel
4
dan 5 diketahuibah-wa
pada semua dimensi reliabilitas instru-men tipeLikert
lebih tinggi dari instrumen tipe Thurstone, namun lebih jelasnya data reliabilitas keduatipg
instrumen disajikanpada Gambar 1.
o'9o o.sg
o34
o.€g
o,5G
G"4O
o,"3{t
o,20
o,10
s.oo
t--*,lu*.it*u"rion*il*t
t a
e,-*F RELUKfETSC/!Lf
Gambar 1. Reliabilitas Instrumen Tipe Thurstone dan Likert pada
Sembilan Kecerdasan
SEM pada skor hasil pengukuran ins-trumen
tipe
Thurstone
lebih
rendah dariSEM
padaskor
hasil pengukuran denganinstrumen
tipe Likert,
meskipun reliabiltasinstrumen
tipe
Uker
lebih
tinggi dariins-trumen tipe
Thurstone. Rendahnya varian instrumentipe
Thurstoneini
yang menye-babkan reliabilitas dan SEM-nya jugarcn-dah.
Dengan demikian,
perbedaan yangmendasar pada reliabilitas
dan SEM
pada keduatipe
instrumen yang dikembangkan dalam penelitian ini lebih disebabkan karenapet-bedaan vadan dad keduanya.
Gambar 1. menuniukkan bahwa
ter-dapat
perbedaan reliabilitasyang
tedihat jelas pada instrumentipe
Thurstone
danUket.
Reliabilitas instumen tipeUker
jauhlebih tinggi dari reliabilias
instrumen tipe Thumtone. Meskipun demikian, SEM padainstrumen
tip.
Thurstone
lebih
rendah dibanding instrumen tipeLikert.
Informasi lebih jelas dapat dilihat pada Gambar 2.r::il:,Tff*"-Gambar 2.
SEM
Instrumen Tipe Thurstonedan
Likert padaSembilan Kecerdasan
Hasil penelitian
ini
menunfukkan re-liabilitasinstrumen pzda
datatipe
Thur-stone
lebih
rendah dibandingtipe
Likert.Data
hasil pengukuran dengan mengguna-kan instrumen tipe Thurstone lebih rendah konsistennya dibandingtipe Likert.
Salahsatu faktor yang
menyebabkan ketidak-konsistenan hasil pengukuran denganins-trumen
tipe
Thurstone
ini
karena setiap butir pada instrumenini
selalu dipasangkandengan butir lain, sehingga skor sebuah pet-nyataan akan betgantung dengan seberapa
besar pengaruh
butir
yang menjadipasang-^nnya. Olivares
&
B6ckenholt (2005, p.265) menyebutkan,untuk
mendapatkan respons yang konsisten padabutir-butir
yang [image:14.595.0.587.63.814.2]pasangan
ini
diperlukan kondisi yanghanst-tif, yuw
sebuahkondisi
apabrla terdapat 3 variabelA,B,C,
dimanaA>B, B>C,
makaA>C.
Namun,
apabtla tetnyataA<C
makayang
terjadi
adilah kondisi yang
tidak transitif al<tbat respons yang tidak konsisten secarainternal.
Kondisi
yang
transitifIn
tidak
mudah
didapatkan apabrla variabel yang dibandingkan cukup banyak.Reliabilitas instrumen berdasar kon-sistensi
intemal terkait
dengan simpanganbaku
atau vanan data
hasil
pengukuran.Besar kecilnya reliabilitas
terkait
denganvariabilitas atau
v^rian skor hasil
peng-ukuran. Begitupula
dalam memaknai danmembandingkan
reliabilitas
hasil
peng-ukuran, pedu dipertimbangkan pula varianskor
pada
data
y^ng
diperbandingkan.Dengln
menggunakan formula SEM atau o"=
o,tr1-g*'
dapat diprediksi besarnya suatureliabilitas
apabtla diasumsikanSEM
danvaian
kedua kelompok sama besarnya.Jumal Penelitian dan Eaaluasi Pendidikan
Dengan
mengasumsikan keduains-trumen memiliki
SEM
yang
sama dapatdihitung
reliabilitas
instrumen
y^ng
di-prediksi berdasar data pada kelompoksam-pel
yang berbedaatau
heterogen. Azwar (1999;72)memberikan
persamaan untuk memperoleh prediksi reliabilitas pada data yang diasumsikan memiliki varian yangber-beda sebagaimana disajikan pada formula pw,= 1- or2 (1-
p*ll/
or2keterangan:
Pw,
=
teliabilitas data yang diprediksi or2=
vadan pada datayang ditetapkanpr*,
=
reliabilitas data yang sudah ditetapkan oyz=
varian datayangakan diprediksiDengan
menggunakanformula
ter-sebut
dapat dihitung
prediksi
reliabilitasThurstone
berdasar
varlan
sebagaimanadata pada instrumen tipe
Likert.
Hasilper-hitungan
prediksi
reliabilitas
kedua
datzdiatas disajikan pada Tabel 7 .
Tabel
T.
Prediksi Reliabilitas Instrumen Tipe Thutstone apabilaYaiannya Diasumsikan Sama' dengan TipeLikett
Reliabilitas Semula Prediksi reliabiltas Thurstone Dimensi
Thurstone Likert Thurstone Likert Linguistik
Logika-matematika
Visual-spasial Musik I(inestetik
Intrapersonal
Inteqpersonal Naturalis
Eksistensial
0,265
0,638
0,344 0,687 0,203
0,256
0,181
0,347 0,203
0,69 0,888
0,775 0,852
0,636 0,775 0,735
0,817 0,842
2,002
2,274
2,671 3,660
2,132 3,144
2,468
2,657
2,673
8,237
16,549 11,560 15,595
8,266 10,172
9,236
12,467 t|,364
0,821
0,950 0,952
0,926 0,794
"
0,769
0,781 0,861 0,81.2
Tabel 7 menunjukkan bahwa prediksi reliabilitas data pada instrumen
tipe
Thur-stone menjadi
tiflggi
apabrlz
variannya dibuat sama dengan varian data tipe Likert.Kondisi
ini
disebabkan karenavaian
datatip.
Thurstone
y^ng
semula
kecil
ata;u rendah menjadi meningkat. Dengan kondisi demikian, rendahnya reliabilitas data semulapada
instrumen
tipe Thurstone disebabkan karena vaiannya yang rendah dan tingginya reliabilitas instrumen tipeLiket
disebabkan karena variannya yang tinggi.Lebih
lanjut, SEM pada instrumen tipe Thurstone dapatpula
diprediksi berdasarvaian
data pada instrumen tipe Likert, hasil analisis prediksi SEM tersebut dapat dilihat pada Tabel 8.Jumal Penelitian dan Evafuad Pendidikan
Tabel
8.
Prediksi SEM Tipe Thurstone apabrlaYaianDatanya Sama dengan Tipe Likert.Dimensi Reliabilitas
Semula
YarianThurstone
Likert
Thurstone
LikertSEM
Semula
Prediksi reliabiltasThurstone
Likert
ThurstoneUnguistik Logika-matematika Visual-spasial Musik Kinestetik Intrapersonal Intelpersonal Naturalis Eksistensial 0,265 0,638 0,344 0,687 0,203 0,256 0,181
o 747
0,203 0,69 0,888 o7'7q 0,852 0,636 0,775 0,735 0,817 0,842 2,002 2,274 2,611. 3,660 2,132 3,L44 2,468 2,657 2,673 8,237 1.6,549 11,560 15,595 8,266 70,112 9,236 12,461 77,364 7,273 0,907 1,309 1,070 1.,304 1.,529 1.,422 1,317 1.,460 1.,597 7,361 1,61.3 1.,51.9 1,508 1,564 1,510 7,340 0,821 0,950 0,852 0,926 0,794 0,769 0,781 0,861 0,81.2
Tabel
8
menunjukkan didapatkannya prediksiSEM
pada instrumentipe
Thur-stone yang semakintittgs
dibanding SEMsemula. Meningkatnya SEM pada instrumen tipe
Tipe
Thurstoneini
disebabkan karcna vairznnya disamakan dengan varra;ntip.
Likert.
Dengan demikian, rendahnya SEM data semula pada instrumen tipe Thurstoneini
dipengaruhi oleh rendahnyavaian
datatipe
Thurstone,dan
tingginyaSEM
padadata tipe
Likert
juga dipengaruhi oleh lebih tingginya SEM pada data tipe Likert.Berdasarkan keterangan
di
atas, besarkecilnya varian
turut
mempengaruhi besar kecilnya reliabilitasdan SEM.
Perbedaanbesarnya
vzizn
pada kedua tipe instrumenpada penelitian
ini
mengakibatkan hasilperhitungan
SEM
pzda
penelitian
irritampak.tidak
konsisten.SEM
pada
skor hasil pengukutan instrumen tipe ThurstoneIebih rendah datt SEM
pada
skot
hasil pengukuran dengan instrumentipe
Likert, meskipun reliabilitas instrumentipe
Liket
lebih tinggi dari instrumen tipe Thurstone. Rendahnya vartan instrumen tipe Thurstone
ini
yang
menyebabkanreliabilitas
danSEMnya
juga
rendah.Dengan
demikian, perbedaan yang mendasat pada reliabilitas dan SEM pada kedua tipe instrumen yang dikembangkan daJam penelitianini
lebih disebabkan kzrena perbedaanvarian
dartkeduanya.
Ebel
&
Frisble (1986, p.83) menyata-kan bahwa reliabilitas akan lebih tinggi padakelompok yang memiliki rentang kemampu-^nya;nglebih luas dibanding kelompok yang
memiliki
rentang kemampuan yang sempitatau
homogen.Azwar
(1999,p.72)
|ugumenjelaskan
bahwa
kondisi
heterogenitas menyebabkan overestimasi terhadap reliabi-litas dan kondisi yang homogen akanmen-jadi
underestimasi. Format instrumen tipe Thurstonememiliki
variasi jawaban lebih kecil dibanding tipe Likert. Sedikitnyav^rr^-si
jawabaninstrumen
tipe
Thurstone ini
mengakibatkan simpangan baku dan varian skor hasil pengukuran yang rendah sehingga mempengatuhi
pula
terhadap pethitungan reliabilitasinstrumen
dan
kesalahan baku pengukuran. I(ondisi yang sama juga ditelitioleh
Barclay&
lWraver (1962, p.119) de-ngan membandingkan reliabilitas skala sikaptipe Thurstone yang memiliki 2
vaiasikate-gori
skor dan
Likert
5
variasi
kategori. Didapatkan reliabilitastipe
Thurstone
se-besar0,66 dan
Likert
sebesar0,97,
ataa reliabilitastipe Likert lebih
tinggidari
tipe Thurstone.Simpulan
Berdasar hasil peneliazn yang
disaji-kan
padabab
4,
ada beberapahil
yang dapat disimpulkan sebagai bedkut. [image:16.595.31.567.61.824.2]Penskalaan
nultipk
intelligence pada pendekatanklasik
didapatkanskor
yang telah ditransformasike
dalam skorz.
De_ngan
menggunakan metode paired compa_ rison pada tipe Thurstone didapatkan urutan skor dari yang rendah adatai logika mate_maika,
musik, linguistik,
kinestetik, natu-ralis, visual, intelpersonal, eksistensial danyang pzkng
inggi
adalah intrapersonal. De_ngan menggunakan metode sammated rating pada instrumen
tipe
Thurstone danLiker
dihasilkan skorz
dari yang rendah hinggatirggt
pada aap respons.Terdapat perubahan
rarian,
reliabili_ tas dan kesalahan baku pengukuran(SEi\!
dari data asli dengan
daa
rang ditransfor-masi menggunakan skor z pada penskalaanteori
klasik. Reliabilitas data sebelum dan setelah transformasi tidak terjadi peningkat_an, namun SEM pada data vang ditranifor_ masi cenderung mengalami penurunan.
Karakteristik psikometrik dalam ben_
tuk
koefisien reliabilitas instrumen
tip.
Thurstone
lebih
rendah
dibanding
,ib.
L.ikert,
baik
pada keseluruhan data niarrpun data aap dimensi, begitu pula dalam SEM-nya.SEM
pada instrumentipe
Thurstone lebih rendah dibanding tipe Likert. Rendah_nya
reliabilitasdan
SEM
pada insrrumentipe
Thurstone
disebabkan karena variasitipe Thurstofle yang lebih rendah.
Saran
1.
Proses penskalaan pada teori klasik pe_ nelitianini
terbatas menggunakan me_tode
paired
comparisondan
summatedra li ng. P engganaan metode-metode lain
seperti metode interval tampak setara,
^
sln,antik dffirential, dan metode Lainnya.2.
Reiiabilitas yang rendah pada beb.rapacumensl lnstrumen tipe Thurstone pef_
lu.
.
dikaji
lagi
faktor
penvebabnr_a,sehingga dapat diantisipasi
pada
pe_ngemb arrgan instrumen.
3.
Dalam
membahasdan
membanding_kan
konsep reJiabilitasdan
kesalahan baku- pengukuranpedu
mempertim_bangkan besarnya
vaian
insirumentersebut.
Jumal Penelitian dat Eua/uai pendidikan
Daftat pustaka
Allen,
M.J.,
&
yen,
W.M.
(1979). Introduc_tion
*
*:n:ry!ot
tbeory. Monterey : Brooks /Cole publishing Co_p"rry. Azwar,_S.
(1999).
Daur_dasar psikometri.yogyakatta: pustaka pelajat
bff.t.
AzwarJ.
Q012). peryusunanskala psikologis @,disi 2). yogyakafta: pustak-a pelalar
Offset.
BarcLay,J.E.
&
$(/eaver,H.B.
(1962).Com_
parative reiiabilities and ease
of
cons_ tructionof
Thurstone andLikert
atti_tude scales. Tlte Joamal of Social psjtcbo-logy, 58,109_120.
Brennan,
R.L.
(2006) . Educational meastlre_ ment (4"d Edition). S7esporcAn
Im_of
GreenwooJ
publishing Group.Inc.Carifio, J.
&
peda, R. (200g). Resolving the 5O-yeardebate
around using
andmisusing
Likert
scales.Med;it
ndu_ cation. 42, 1, 1. 50_1, 1. 52.Chernyshenko,
O.
S., Stark,S., prewett, M., Gray, A.A., Stilson, F. R.,& Tuttle,M.D.
(2009).
Normative scoring
of
multidimensional pairwise preference
personality
scales
using
IRT:empirical
comparison.
*ith
otherformats. Haman perforzann,
22,
1.05_ 127.Cohen,
R
J.,
&
Swerdlik,M.
E.
(2005). Pycltological testing and nsressmr)l,An
introduction to tests and measurement (6"dEdition).
New
york:
The
McGraw_Hill
Companies, fnc.Cronbach,
L. J.,
Schcinemann,p.,
&
Mc Kie,D.,
(1965). Aipha coefficientsfor
stratified_parallel tests. Edacational and P g, ch o logi cal Measure m e nt,
25,29 1 _312.
Dar-ies, R.S. (2008). Designing
a
responsescale
to
improve
avetagegroup
res_ ponse reliability.Evaluatioi
"r,i
R._search in
Education,2l,
134. Dunn-Rankin,p.,
I(nezek,G.
A.,
$Vallace,
l,^f
lhzng,
S. (2004). Scaling metbods,(2"'
Edition).
Mahwah
,
Il"*r.rr..
Edbaum Associates. Inc.
Julal Penelitian dar Eualuasi Pendidikan
Ebel, R.
L.
&
Frisbie,D.
A.
(1986).Essen-tials
of
educationa/ neasarenenh New Jersey: Ptentice Hall, Inc.Furr, R. M.,
&
Bachatach,V.
R.
(2008).Psjtcbonetrics an introduction. Los Ange-less: Sage Publications
Glenberg, A. M.(1988).l-eamingfron data, an introduction
to
statistical reasoning. SanDiego: Harcoutt
Btace Jovanovich, Publishers.Guilford,
J. P.
(1954). Pycbonehic Methods(2"0
Edition). Tokyo:
K6gakusha company,ltd.Gulliksen,
H.,
(1950). Tbeory of nental tests,New
York
John Wiley and Sons. Inc. Jamieson , S. (2004).Likert
scales:How
touse them. Medical Edacation, 38, L212 Kendall,
M. G.
&
Smith,B.B.
(1940). Onthe
method
of
paired
comparisons. Bio m etri ka 31,, 324-345.Mardapi, Djemari. (2008). Teknik peryilsuilan
instrumen tes
dan
nontes. Yogyaka*a: Mitra Cendekian Offset.Kwan,
Y.K.
&
Chiu,L.L.
Q007).Modifi-cation and
siplication
of
thutstonescalling
method
and
its
demons-ffationwith
crime seriousnessassess-ment.
Tbe Hong
Politecnic Uniuersi\tResearcb
Connij.
Laerhoven
H,
van
der Zaag-I-nonenHJ.,
&Derkx B.H.F. Q004).
A
compadsonof
Likert
scaleand
visualanalogue scalesas
resporlseoptions
in
chil-dren's
questionaires.Acta
Padiatrik, 93, 830-835.Likert,
R.
(1932). Techniguefor
the
mea-sufement
of
attitudes.
New
York
City: Archiuu of Pslcbology.
Lotd, F.M.
&
Novick,
M.R.
(1,974).Statistical theories
of
nental test scores.New
York
Addison-Wesley Publish-ing Company,Inc.Massof,
R.\f.
(2004).Likert
and Guttman scalingof
visual function rating scale27
4 -
Jumal Penelitian dan Eaahrasi Pendidikan Tahan 77 ,Nomot 2, 2013questionnaites. Opbtbalrzic Epiderrniolo-9,77,381,-399
McDonald, R.P.
(1999).
TestTheory
: A
unified threament. London: Lawrence Edbaum Associates
Mclver, J.P.
&
Carmines,E.G.
(1986). Uni-dinensional scaling. London: Sage Publi-cations. IncOlivares,
A.M.
&
Bo"ckenholt,U.
(2005).Structural equation modeling
of
pait-ed-comparison and ranking data. Py-cbological Methods, 1.0, 285-304Salkind, N. J. (2013). Test and measurement
for
peoplewho
hate tests and mea-sufement.Los
Angels:SAGE
Publi-cation, Inc.Shaw, M.E.
&
Wright, J.M. (1967). Scalesfor tbe meamrenent of attitudes.New
York: McGraw-Hill Book CompanySuryabrata, S. (2002). Pengerubangan alat ukur
psikologis. Yogyakarta: Penerbit
Andi
Offset
Thissen,
&
Weiner,
D.
H.
(2001).
Test voring.Matwah:
Lawrence Erbaum Associated.Thurstone,L.L.
(1927).A
Law
of
comparative judgment.Pslclto-logi cal Re ui e w, 34, 27 3 -286
Torgerson,
W.
S. (1958). Theorl and nethodsof valing.New
York
Wiley.Thurstone,
L.L.
(1,927).Method
of
paired comparisonfor
social valaes. Jounal of Abnorrual and S ocial Pgcbolog, 21,384-400
Yan Zanten,
V.,
Chiba,N.,
Arsmtrong, D., Barkuns,A.
N.,
Thomson,
A.B.R., Mann, V., Escobedo, S., ChaLrobort/, B.&
Nevin,K.
(2006). Validationof
a
7
point global
overall
symptomscale
to
measurethe
severity
of
dyspepsia symptoms
in
clinical trials.Joumal Conpilation, 23, 527-529.
Widhiarso,
nf.
(2009). Koefisien reliabilias