-$,*oN E?4u_ .!-- ?.=
S
Swe6a
iaa 6-,.",-.*/Le
&
{T{E
;*u'*r*u,urrorr$t
rlaer
Penerbit
HIMPUNAN
EVALUASI
PENDIDIKAN INDONESIA
bekerja sama dengan
PROGRAM PASCASARJANA UNIVERSITAS
NEGERI YOGYAKARTA
Berdasatkan
MOU Nomor
1,958/J.35.1.7/LK/04
Penanggungjawab Ketua
Sekretaris
Penyunting
Djemari Mardapi
Moch
Alip
Heri Retnawati Badrun I(artowagfuan Sudiyatno
Aman
Samsul Hadi Janan Haryadt Sudiyono
Penyunting Bahasa
Kootdinator
Jurnal PPsUNY
AshadiSekretadat
Rohmat Purwoko
Syarief Fajaruddin
SEMUA TULISAN YANG ADA DAIAMJURNAL PENELITIAN DAN EVALUASI PENDIDIKAN
BUKAN MERUPAKAN CERMINAN SIKAP DAN ATAU PENDAPAT DEWAN REDAKSI TANGGUNGJAWAB TERFIADAP ISI DAN ATAU AKIBAT DARITULISAN
Ennl lW/a1anti,
Mmdilarto
HniRetnawati
Sahraini, Smtarsih Mo@a SamsulHadi,
K
Ina knara,Efendie Tanunibardja
S e b astia n us lYidan afio P, Djenari MardEi,
Budfiono
Sadi1afio,
Badrun Kafiowagiran,
Mnfuadi
Sqkardi, Soenarto
Vidla Nooiana Noor,
Aman
Yojton Sarlono,
Puji Yanti Fauryiab
Ali
Saukah, Agus Eko CablonoJanal Penelitian dar Eaabasi Pendidikatt
DAFTAR
ISI
Pengembangan Instrumen Asesmen
Diri
danTeman
729-744Sejawat Kompetensi Bidang Studi pada Mahasiswa
Petbandingan Estimasi Kemampuan Laten Arttara
Metode
745-755Maksimum Likelihood dan Metode Bayes
Model Evaiuasi Intemal Kompetensi Guru Bahasa
Inggds
756-767(Adodel-EIKGBD SMA
Pengembangan Sistem Tes Diagnostik Kesulitan
Belajat
768-775Kompetensi Dasar Kejuman Siswa
SMI(
Perbandingan Estimasi Kesalahan Pengukuran S tandard
S ettingdalam Penilaian I(ompetensi Akuntansi
SMI(
Pengemb angan Model .4 s s e s t m e n t a s I-e am i ng P emb elajann
Akuntansi di SMK
Asesmen Instalatur Listrik Berbasis Kebutuhan Industri
Jasa I{onstruksi Ketenagalistrikan
Evaluasi Penyeienggaraan Laihan Ujian Nasional Bahasa
Inggris SMA Svrasta Ex-RSBI
Model Pendidikan Karakter bagi Anak melalui "Sekolah
Ibr:ri' Nonfor:nal di Pedesaan
National Exam in Indanesia and Its Inplications to tbe Teaching and l-eamingof English
176-188
189-207
202-216
277-229
230-242
243-255
jurnal
FeneLitian dan Evaluasi Pendidikan Volume i.9, No 2, Desembet 2015 (175-188)Tercedia Online: http://journal.uny.ac.id/index.php/jpep
PERtsAhTD
IN GAN
E ST TMASI KESAI-A}{&N
PENGUKUR.&N
S
TAI{DARD
S E TTTN
GDAI.A},{
I'ENILAI,{N
KOMP ET ENST AK{JhTTANSI
SMK
1 )
S e b asti an u s Wi da n arto P ijaw u n ta to,') Dj e m
ai
M ardapi,r )
B a dit o n o
')Universitas Sanata Dhamna, ')Universitas Negeri Yogyakarta, ')Universitas Neged Surakarta /)sr.vidanartop@gmail. com, 2)dj
emarim adapi@gnail.com, r)bud@uns.ac.id
Abstrak
Penelitian ini bertujuan untuk mengestimasi kesaiahan pengukuran pada metode Angoff, Ebe1,
dan Bookmark dalam penij.aian kompetensi Akuntnasi jenjang
SMK
di DIY
yang digunakanstandard
vtter
dalam menentukan cut score. Penelitianini
merupakan penelitian kuantitatif.Sumber data dalam penelitian
ini
adalah respon pesertaUjian
Nasional Praktik AkuntansiPaket 2 ta}aun ajann 2011/2012 dengan 338 siswa. Guru-gunr yang terlibat dalam Focus Group
Discussion (trGD) berjumlah sembilan orang yang terdiri dari tujuh wanita dan dua pria. Teknik
analisis daiam peneiitian
ini
dibagi dalam uga tahap yaitu:(i)
persiapan, (2)FGD,
(3) estrmasi kesalahan pengukutan dengan menggunakan Bootstr@. Hasil penelitian menunjukkan bah-wa cutscore unllik metode
Angoff
sebesar 67,809, Ebei sebesar 59,034, dan Bookmark sebesar 57,022.Metode
Angoff
memi.hki
estj.masi kesalahanpengukuan
yang paiing
hecil
Q,1,02)dibandingkan dengan metode
Ebei
(4,004; dan metode Bookruark (4,042). Oleh karena itu,metode
Angoff
mempahan metode yang tepatuntuk
mengestimasi kesalahan pengukuranpada standard sethng.
Kata
kunci:
Esttruasi kesalahan pengukaran, Bootstrap, Cut ScoreESTIMATION
OF
STANDARD SETTING
ERR.CRMEASUR,EMENT
NNACCOUNTING COMPETENCY
A.SSESSMENTIN
VO CATXONA{-
S CHO OLS1 )
S e b astian us Wi dan arto P
ij
o wu n ta to, 2 ) Dje nt
ai
M ardapi, o)B a d4 o n o
')Universitas Sanata Dharma, ')Universitas Negeri Yogyakarta, 3)Universitas Negeri Surakarta /)swidanartop
@gmaii. co
m,'
) diemanrnadapt@grnai1.com, rbud@uns.ac.idAbstract
This
research aimsto
estjmate the measuremerit emorin
theAngof,
EbeL, and Bookmarkmethods
in
Accounting Competency Assessmentin
Vocational Schoolsin DIY
used by standard settersin
deciding a cut score. This research is quantitative research. Data sor-rrcein
this
study was the cut scoreof
seven vocational schoolsin
Yogyakarta that wete randomlyestablished.
The
reseach datawete
students' alrswefsto
the
National
Examinauonin
Accounting Subject
of
Package 2in
the academic yearof
2A11/201,2with
338 students. Theteachers
who
engagedin
the Focus Group Discussion (FGD) were nine teachers, consistingof
seven wornen andtwo
men.The
technical anaiysis was dividedinto
three
stages. 1)preparation, 2)
FGD,
3) estimated error measurementby
using the Bootstrap method. Thetesults show that the cui score
for
theAngoff
method is 67.809, Ebel method is 59.034, and Bookmatk method is 57.022. TheAngoff
method has the least estimation of the measurement errors Q.1,02) as comparedwith
the Ebel rnethod (4.004) and the Bookmark rnethod (4.042).Thetefore,
the
Angoff
methodis
the
right
methodfor
estimatingerror
measurement onstandard setting.
X(eywotds: Estintation of error measureruent, Bootstrap, Cut S core
jumal
Penelitian dan Evaluasi FendidikalrPendahuluan
Pembangunan
di
bidang pendidikanmenjadi perhatian utarna
dari
pemerintah.Pembangunan
di
bidang pendidikanini
ti-dak hanya mencakup aspek fisik seperti
ge-dung-gedung, penyedia^n
szr^fl
dan
pra-sararta sekolah namun juga aspek
non
fisikseperti kurikulum, dan hualitas tenaga
pen-didik.
Pembangunanini
betujuan
untukmeningkatkan kuaiitas pendidikan
di
Indo-nesia.
Terkait
dengan kualitas pendidikan,pemerintah
telah
mengeluarkan standarpendidikan yang mencakup standar isi,
stan-dat kompetensi lulusan, standar satana
dat
pr
saran,
standar pengelolaan, standarpe-nilaian, standar proses, standar pembiayaan,
standar
pendidik
dan tenaga kependidikanyang mencakup standar pengawas sekolah,
standat hepala sekolah, standar kualifikasi
akademik
dan
kompetensiguru.
Standar-standar tersebut
di
atas merupakan standaryang harus
dipatuhi oleh
sekolah-sekolah.Pemedntah
pedu
menetapkan standar dibidang pendidikan karena standar dapat di-gunakan sebagai kriteria atau pembanding.
I(riteria
atau pembanding digunakanuntuk meningkatkan dan menyamakan
kr.ra-litas pendidikan.
Hal ini
mengingat bahwaIndonesia memiliki wiiayah yang cukup luas
dan setiap daerah di wiiayah Indonesia
me-miliki
karakteristik yang berbeda-beda.Per-bedaan karakteristik wilayah di Indonesia
ini
menjadi salah satufaktor
penghambatda-lam meningkatkan kualitas pendidikan.
De-ngan kata
lain,
masing+nasing daerah di wilayah Indonesia memiliki kualitaspendidi-^n y^ng berbeda-be da. P ada umufirnya, pen-didikan di daerah perkotaan lebih maju
dari-pada pendidikan
di
daerah pedalaman.Pe-melintah perlu menyikapi perbedaan
kuali-tas pendidikan tersebut secara bijahsana.
Di
sisi
lain,
dalam berbagai bidangkehidupan, standar
memiliki
peran
yangpenting. Standar digunakan oieh masyarakat
untuk
menentukanbaik
atauburuk
suatuproduk.
L'icensure, credentialing dan institusiakademik mencari pendekatan
inovatif
da-larn s ta n d a rd s e tli ng :ont;J<. menilai komp
eten-si
ptofesional (David, 2A00, p.1.20).Di
bi-Junul Pemlitiu dan Ewlaasi Peudidikan
dang
keseharan, masyatakat memedukanangka kecukupan
gizi untuk
menentukanminimal
gpziyzng diperlukan agar
dapathidup
sehat. Angka hecutriupan gSziini
di-cantumkan dalam berbagai kemasan
makan-an mauprm minummakan-an. Dalam bidmakan-ang
peker-jaan, institusi
memer'lukan standar untukmenentukan seseorang diterima atau tidak
dalam
pekerjaanteltentu. Dalani
bidangpsikologi, standat dipedukan
untuk
meng-golongkan seseorang daiam kecerdasan
(in-te llige nce qu otie
nl
tertentu. Bidang pendidikanmemedukan standar
untuk
menentukanseseorang
bethasil atau
gagal dalamme-nempuh pendidikan tertenru. Standar
pen-didikan diperlukan iuga untuk menyamakan
kualitas pendidikan
di
seluruh
wilayah Indonesia.Perkembangan standar pendidikan
di-tandai dengan banyaknya
penelitian-peneli-tian yang tetkait dengan $andard
vltingbak
pembandingan metode
((offler,
1980, p.6;Saundets,
Ryan,
&
Huynh,
1980,
p.2;Alsmadi,
2007,
p.479;
Skaggs,Flein, &
Awuor, 2007, p.409; Retnawati, 2008, p.31;
Premastud
201,0, p.225), metode standard setting Q{aruntonis&
Sileci, 2006, p.4),me-tode
analisis (Chesser, et.al., 2004, p.825),estimasi standard
eror
Q{ane,&
\X/ilson, 1984,p.1,07;Yin
&
Sconing, 2008,p.26;Le,2000, p.605), validasi kinerja dengan meng-gunakan passing score
({ane,
1994, p.a26).Perkemb an gan s ta n d a rd s e lti ng terus b erlanjut
seiring dengan pelkembangan di bidang
tek-nologi informasi.
Sampai saat
ini,
terdapat kurang lebih50 metode yang digunahan untuk
merientu-kan standard wtting @erk,1986, p.137).
Me-nurlit
Retnawati (2008 , p.20), pada dasarrryametode-metode yang digunakan dalam
stan-dard selting dapat digolongkan menjadi
em-pat golongan yaitu standard setting
berdasar-kan pada materi,
butir/tes
yang digunakan,peserta tes (examinee), dan kebijakan jndgt ruenfi. Sernentara
itu,
Livingstone&
Ziel<y(1,982,
p.10)
mengklasi.fikasikan standard settingke
dalamlima
kelompok
yaitu
(1)metode yang
berdasatkan pertanyaan tes(misalnya, The Angof method, TheAngof Mean
Estimation Method, The
Angof
Yesor
NoPerbandingan Ettitnasi Kesalahan Pergukuran Standard... - 1,77
Jurnal Penelitiar da,n Eaaluai Pendidikan
Method, The l{edelsklt Metbod, The Bookmark
Metbod, the ltem Desniptor Matching Methody,
(2)
metode yang berdasarkan padaptofiI
skot (misalnya, the Perforrnance Profile Method,the Dominant
Prlfk
Method), (3) metode yangberdasatkan
pada petimbangan
orang-orang atau
ptoduk
(misal-nya, the BorderlineGroup Method, the Contrasting CrorQs Metbod, the Up and Down Modfrcation of the Contrasting Groap Metbod, the Anafitic Judgment Metho$, (4) metode yang betdasarkan pada
perum-bangan
kelompok
pesertates
(misalnya, Judgment abouta
Reference Croup, Judgmentabout Tao Reference Croups), (5) Metode yang
betdasarkan pada
komprori
antzrapertim-bangan absolut dan
normaif
(misalnya, theBeuk Method, the Hofsne MethoS.
Penggo-longan metode standard setting tersebut di
atas dilakukan berdasatkan sudut pandang
masing-masing ahli.
Cutscore merupakan salah satu isu yang penting dalam standard selting. Menurut
Nu-dell
(2008), penentuari cut score buhan ha1yang mudah. Standat kompetensi minimal
yang harus dicapai oleh seorang peserta tes
harus ditentukan
tedebih dahulu
sebelum menenttrkan cat score. Apabila peseta dapatmelampaui
standarkompetensi
minimal, maka peserta mencapai standar kompetensiyang dipersyaratkan
untuk
tujuan tertentu.Cutscore yang ditetapkan harus dapat
men-cerminkan ketercapaian kompetensi
mini-mal yang harus dicapai oleh peserta tes.
I(etepatan dalam penefltuan standard setting dapat dilihat dari besar kecilnya error
dalam penentuan standard setting. Semakin besar eror maka dapat dikatakan bahwa
pe-nentuan cutscore
tidak
tepat. Sebaliknyase-makin
keciT enor maka penentuan cutscoresemalrin tepat. Livingstone
&
Zieky
Q006,p.10) menyebutkan bahwa kemungkinan
ke-salahan menggunakan cut score tedetak pada
reliabilitas tes dan metode cat sclre yang di-gunakan. Dalam tes, tidak ada tes yang
sa-ngat reliabel. Tes yang sangat reliabei dapat
ditunjukkan dengan
nilai
alpha Cronbachsebesar 1 (satu). Demikian juga dengan me-tode cut score, adak ada metode cut score yang
sempnma.
Btla
catterlalu tinggi, maka
ditentukan
sehanrsnya
lulus
meniaditidak
lulus. Demikian
pula sebaliknya,bila
cut .nora ditentukan tetlalutendah, maka siswa yang seharusnya tidak lulus meniadi lulus. Cut score dapat dinaikkan
maupufl diturunkan. I(onsekuensi dari
me-naikkan atau menurunkan cut score
dapatme-nyebabkan emor serrrakin membesar atau
mengecil.
Metode
Bootstr@ digunakan untukmengestimasi kesalahan pada pengukuran.
Metode
Bootstr@ banyak diterapkan padailmu
statistik untuk mengestimasi kesalahanpada populasi yang kecil atau populasi yang
jumlahnya
tidak
diketahui.Asumsi
yangmendasari metode Bootstr@ adalah
keinde-pendenan datanya (Guan, 2003, p.72).
Me-tode Bootstr@ dilakukan dengan mengambil
sampel dari populasi dengan pengembalian. Penelitian
ini
dilakukan untuk mengestimasikesalahan pengukuran dengan
mengguu-kan metode Bootstr@.
Di
sisi
lain,
pendidikanSMI(
me-nyiapkan peserta didikuntuk
siapte{un
didunia usaha sesuai dengan standar
pendidik-^rLyarug ada. Peningkatan kualitas
pendidik-an
di
SMK
ProgtamStudi
I(eahlianKe-uangan Kompetensi Keahlian Akuntansi di
samping mengikuti standar pendidikan yang
sudah ditetapkan,
juga mengikuti
StandarI{ompetensi
I(e{a
Nasional Indonesia. Bagipendidikan
di
SMK
I(eahlian
Akuntansi, penetapan standar ini penting karena bidangpeke{aan iulusan
SMI(
I(eahlian Akuntansidiatahkan
di
bidang keuangan. I(esalahanyang
te{adi
dalam menginput satu transaksisaja akan mengakibatkan kesalahan pada
lapotan keuangan yang menjadi salah satu
pertimbangan
bagl
perusahaan maupunstakeholder dalar";, pengambilan keputusan.
I(onsekuensinya,
kudkulum
pendidikanSMI(
i(eahlian
Keuanganini
disusunde-ngan
memperhatikan standar pendidikandan standar dunia usaha.
Dihatapkan, lulusan SMI( dapat
lang-sung beketja
di
dunia usaha sesuai dengankompetensi yang dimiliki. Flal
ini
didukungoleh pola
pendidikandi
SMK
yang lebihbanyak menekankan pada
praktik
ketjain-dustti
di
samping mendapatkanmateri
dikelas. Praktik kerja industri bertujuan"
^g
r
$ore y?ng siswa yang
siswa
memiliki
bekal dalam memptaktikan materi-materi yang diperolehdi
kelas.Per-masalahan
yang
dihadapi dalam
praktikke{a
industri
adalahtidak
banyak industrimau
memberikan pelatihan kepada siswa sesuai dengan bidang keatrliannya.Permasalahafl
yang dihadapi
dalamdunia pendidikan
di
Indonesia adalahpe-fletapan cutscore sebagai penentu kelulusan
belum
didasarkan atas salah satu metodestandard setting dan belum pernah diestimasi
besarnya kesalahan penentuan cat sclre.
I(esalahan pengukulan muncul ketika
kerangka konseptuai yang menganggap
bah-wa
konstruk
yangdiukur
adalah invarianatas beberapa
kondisi
pengamatan (I{ane,201A,p.7). Dengan kata lain dapat dikatakan
bahwa terdapat deviasi dari sesuatu diukur
dengan konstrrrk yang men)'usrlnnya. Teori
pengukuran berkaitan dengan
pengembang-an tolok ukur atau instrumen dengan
bantu-an seorang analis sistem atau peneliti yang
dapat mengukur atribut suatu
entitas/feno-mena/sistem
yang
diteliti
(Chadha, 2009,p.5). Dalam pengukuran, tidak semua
atri-but
yangdiukur/diwakili
secara sempuma mewakili konstruknya.Setiap
pengukuranyang
dilakukanakan
memiliki
kesalahan(eno).
Mardapi(2008,
p.2)
mengungkap bahwa kesalahanvang terjadi pada
pengukurandi
bidangilmu
alam
lebih
sederhana dibandingkandengan
ilmu
sosial. I(esalahan pengukuranpada ilmu alam lebih disebabkan karcna alat
ukurnya, sedangkan kesaiahan pengukuran
pada
ilmu
sosial dapat diakibatkan karenaalat ukurnya,
c tz
pengukurannya, danob-jek yang diukur.
Senada dengan Mardapi (2008, p.2),
Nichols, Twing,
&
Mueller Q0L0, p.15)me-n1'atakan
bahwa
masalahyang
dihadapiproses pengukuran dalam ilmu sosial adalah
tidak adanya indikator )rang langsung dapat
mengukur
atribut
yang ahandiukut.
OIehkarena
itu, ilmu
sosial menggunakanstruk-tur
data
unruk
mengukur
atribut
laten.Untuk
memecahkan masalahini,
makaNichols,
Twing,
&
Mueller,
(2010, p.15)mengajukan tiga pendek^tanya;ltr (1) sabject-;entered approacb, (2) stiruulus-centered approach,
Jtrnal Penelitian dan Eulaasi Pendidikatt
dan (3) re sp o n s e - ce n te re d app ro a c lt. S u bj e c t- ce n le re d
@proach bertujuan rintuk menskalakan orang
sehubungan dengan attribut laten.
Stimulus-centered approach bertujuan
unnrk
menskala-kan tangsangan. Sedangkan respon.re-centered approach bertujuan untuk menskalakan orang, stimuli atau keduanya.
I(esalahan pengukuran dapat diterima apabila kesalahan pengukuran tersebut
me-rupakan
kesaiahanyang paling
minimal.I(esalahan yang paling
kecil
menunjukkanbahwa objek yang diukur memiliki
kesesuai-an dengan konstruknya dar. dapat dikatakan
bahwa alat
ukur
tersebut handal.Alat
ukuryang handal akan memberikan hasil yang
konsisten apablla
alat
tersebut digunakan berulang-ulang.Cohen,I(ane,
&
Crooks (1,999, p.359)menyebutkan
bahwa
kesalahan dalarn cut.nara bersumber
pada
dua
hal yattt
error inherent in tbe estimatian of the equating relationsdan the sampling enor associated with the selection
oJ rater.
Error
inherentin
the estitnation of lheequating relations teriadi ketika proses
pene-tapan
standar dilakukan secaraberuiang-uiang oleh penilai
yang sarna. Setiap kaliperuiangan
penilaian,
penilai
beristirahat sejenak dan mendiskusikan hasil penilaian-nya. tsLalini
menyebabkan hasil penilaianbedkutnya tidak independen karena penilai
telah
terpenganrholeh
hasii
diskusi yang dilakukan. The sampling error assodated with the selection of rater terjadi ketika rater berbeda menilai peketjaan siswa. Hasil penilatan rateryang satu akan berbeda dengan penilaian hasil rater yang lainnya. Selanjutnya, Cohen,
Kane,
&
Ctooks (1999, p.360) merumuskanstandard erylr lneaswement
(SEN\
sebagai de-ngan mmus sebagai berikut.sEM(q
=
+
'li
C
adalahcut
scoreke C,
6.
merupakandeviasi standar estimasi dan
n
merupakanbanyaknya replikasi cut score.
Estimasi error pengtrktxan dapat di-lakukan dengan mendasarkan pada
gefiera-liTed analtsis of couaiance stnrcture model yang
dikembangkan oleh Joreskog (1.974, dalam
\Mhitely, 1,97 9, p.1. 44). Pada dasarny a, model
Joreskog berusaha
untuk
mereproduksiPerbanditryan E.stimasi Kesalahan Pergukaraa Staadard... - 779
Jarnal Pemlitian dan Eaaluati Pendidikan
matfiks kovarians dengan rumus struktural
X
=
l(D,t' + V2.
Dalam model
kovariansulnum, ururtan dari A,
@,
dany
lebih kecilatau sama dengan urutan
dafi
I.
Tiga tipedan panmeter mungkin terkandung dalam
tetbatas. Patametet
tetap
dan
tetbatas adalah spe sifikasi model.Feldt, Steffen,
&
Gupta (1985, p.353)mengajukan
lima
macam metode
untukmengestimasi kesalahan baku yaitu sebagai
berikut.
Pertama
teod
klasik yangdikemuka-kan oleh Lord
&
Novic. Estirnasi kesalahanbaku dengan menggurlakan
teori
klasikdi-peroleh dengan menggunakan rumus
seba-gai berikut:
sr =sr(1 -r**,)7/2.
I(edua, Pendekatan Thotndike.
Pend-ekatan Thorndike mendasarkan pada teori
tes klasik. Estimasi kesalahan baku dengan
menggunakan pendekatan Thomdike
diper-oleh
dengan menggulakanrumus
sebagiberikut.
Xr=TrlEr-I(etiga,
Pendekatan Polinomial.De-ngan menggunakan pendekatan ini,
kesalah-an estimasi diperoleh dengkesalah-an menggunakkesalah-an rurnus sebagai berikut:
? = ao + ar(x)
*
a2(xz)*
a3(x3)*
aa(xa).I{eempat, Pendekatan binomial Lotd:
modifcation l(eats. Pada pendekatan ini, indi-vidual
i
dipandang mampu menjawabpro-porsi
tettentu,
@, dari keseluruhan butir.Dengan konseptualiasi
ini,
skot
examineei
pada satu bentuk tes analog dengan
pethi-hrngan frekuensi dari kejadian fenomena Q
dalam random sample dad unit-unit ,€. Rumus
s,
=
[(1=)
(frf)]'/'
d'go,, k^nuntukmengestimasi kesalahan pengukuran.
I(elima,
Pendekatanbinomial
Lord:compound binomial. Formula yang digunakan
dalam pendekatan ini adalah sebagai berikut.
Se(i):
lZ'n=r@]'/'
Cowel,
\7.R.
(1991, p.2) menguraikanempat metode untuk mengestimasi
kesalah-180
-
Volume 19, Nomot 2, Desember 2015an baku pada pengukutan. I(eempat metode
tersebut adaiah
(7)
Macbedhalf
*st
(splithalues), Q) Inm response theory
(KI),
Q)Roo-donfi
parallelforns
(binoruial),(4)
Matched paralk Ifom
(conpound binonial).Estimasi errlr pengukutan juga dapat
dilakukan dengan mendasatkan pada
genera-liryd anafiis of coaaiance struclure model yang dikembangkan oleh Joreskog (7974, dalam
\7hitely, 1979,p.1,43). Pada dasarnya, model
Joreskog
berusaha
untuk
mereproduksimatriks kovartan dengan rrlmus struktural:
X
=Ao
'+
l{2Estimasi effzr pengt)kuran juga dapat
didekati dengan metoda Bootstr@. Bootstr@
merupakan pendekatan noflparametrik yang
mengijinkan seseorang
untuk
menghindar dari perhitungan teoritis (Guan, 2003,p.72).Hal
ini
berdasatan asumsi bahwa sampelyangada merupakan representasi dari
popu-lasi. Dengan menggunakar Bootstr@,
estima-tor
bias, varians, dan statistik latnnya dapatdihitung.
Can
yang dilakukan untukmeng-estimasi
populasi
dengan
menggunakanBootstr@ adalah dengan mengambil sampel
dan data asli dan mengembalikannya lagi.
I(esalahan
baku pada
metodeBoot-strap dapat
dicari
dengan
menggunakan rumus sebagai berikut (Efton,&
Tibshirani,1,993.
p.a\.
1 B .l/z
tHl
\b=1 )
Dengan
P*=
parameterpopulasi,
B =bany akny a r e s amp el y ang
dilakukan,
dan6.(')
:
Z!u=ri.(D/B
merupakan nilai meansederhana dar, 6. 711, 0- (z) ... 0. @)
Dalam penelitian ini, metode Bootstr@
digunakan
untuk
mereplikasi cut score yang diperoleh melalui metode Angoff, Ebei, danBookmark. Cut score mempakan
fokus
da-lam
penetapan standar.I(neria
seseorangakan selalu dikaitkan dengan standat
rnini-mal yang ditetapkan. Seperti kelulusan ujian,
penerimaan pegawai, penerimaan kredit, dan sebagainya. Dapat dikatakan bah.wa cut
Jclre merupakan
titik
batas
y^fig
dapatmenggolongkan peserta tes ke dalam bebe-rapa golongan seperti lulus atau tidak iulus,
Penggolong-an examinee irri tergantung pada kepentingan dan tujuan diselenggarakannya tes. Dengan
demikian setiap bidang, setiap negara
me-miliki
cilt score yang tidak sama.Bejar
(2008,p.2)
mendefrtistkan catscore sebagai
skor
yang mengklasifikasikansiswa yang belum mencapai scorelevel1 dan
siswa yang memiliki skor
di
atas L. Cut scoreyang digunakan untuk memisahkan
kemam-puan
siswa merupakanhasii dari
Standardutting. Dalam konteks standard setting cat Jczr€
mempakan salah satu komponen kunci.
Metode
Penelitian
Penelitian
ini
merupakan penelitiankuantitatif. Sumber data yang
digunakan dalam penelitianini
adalah respon pesertadidik SMK
daiamUjian
Nasional Praktik Akuntansi tahun pelaiaran 201,1,/2012seba-nyak 338 siswa
di
Daerah IstimewaYogya-karta.
Guru-guru
yang
dilibatkan
dalamFGD
be{umlah
sembilan orang yang me-menuhi persyaratan sebagaiberikut
(1) ahiidalam bidang yang
berhubungan denganujian;
Q)
terbiasa dengan metode-metodeulian; (3)
dapat memecahkan masalahde-ngan baik; (4) terbiasa dengan 1eve1
kandr-dat; dan
(5)
tertarik
dengan pendidikanG*);
(6) telah mengajar minimal 5 tahun;(7) mengajar
di
kelas 1,2 dan 8) lulusan dariprogram studi Ekonomi/Akuntansi. Teknik
analisis dalam penelitian
ini
dibagi ke dalamtiga tahap. Tahap pertama yaitu persiapan.
I(egiatan pada tahap irri mencakup
penyap-an
data, penggolonganSMI(,
dan menelitikaraktedstik
butir
dengan
menggunakan program Quest dengan L parameter logistik(lPL).
Tahap keduayaitu
FGD.
Sebelumdilakukan
FGD,
guru-guru
dilatih
dalam menentukan cut score. Halini
bertujuan agarguru
memiliki
persepsiyang
sama dalammenentukan rut score.
FGD
dilakukan dalamdua putaran. Dalam putafan pertama,
pesef-ta
FGD
diberi pelatihan dalam menentukancttt
sczredengan
menggunakan metodeAngoff,
Ebel, dan Bookruark. Pada putarankedua, peserta
FGD
menentvk^ncut
Jclrsnamun
tidak
diberi
pelatihanlagi.
Tahapketiga yain: mengestimasi kesalahan
peng-ukutan dengan menggunakan Bootstr@.
Esu.-Jurnal Peulitian dan Eaahta:i Peilidikan
masi kesalahan pengukuran dilakukan de-ngafl. menggunakan ptogram R.
Hasil Penelitian
dan PembahasanTingkat kesulitan
butit
padapeneliti-an
ini
dianalisis dengan menggunakanprog-ram Quest. Tingkat kesulitan butir untuk 74
butit
(6
butir
jurnal,39
butir
buku
besar,dan
9
sjklus akuntansi) pada penelitianini
diperoleh
dengan menggunakan program puest.Tingkat
kesulitan pada output puest dapat dilihat pada DIFF. Hasil analisis puest untuk butir jurnai disajikan pada Tabel 1.Tabel
1.
Tingkat I(esulitan ButirJurnalKriteria No Butir
Jumlah
% Mudah (<-2)Baik
(-2 <x<2)
Sulit (>2)
Tingkat
kesulitan
butir
pada
buku besar diketahui terletakdi
antam-4
sampai4. Jurnlah soai yang tergolong mudah pada
butir
Buku
Besar adalah3
butir
Q,69o/o),butir
yang
tergolong
baik
berjumlah
32butir
(82,05o/o), danbutil
yang
termasukdalam golongan butir yang sulit berjumlah 4
butit
(10,26%). I(eseiuruhan tingkatkesulit-an butir disajikan padaTabelZ.
Tabel2.
Tingkat I{esulitan Butit BukuBesar
Kdteda
No Butir Jurnlah YoMudah (<-2)
Sedang (-2 <x<2)
2,10,23
1.,3, 5, 6,8,9,1.3, 14,75, 1.6,77,1.9,
19,21,22,24,26
4,'/ , 1.L,1,2,20,25
Jurrrlah
3
17
6
2(t
11,54 65,38
23,08 100
Sulit (>2)
Jurntah
17,23,33
07, 02, 04, 06, 07 ,
08, 09, 10,1.L,1.2,
73,1,4,15, 16, 18, 1,9,20,27,22,25,
26,27,28,29,30, 31,32,34,35,36,
38,39 03,05,24,37
J
32
7,69 82,05
1,0,26
100 4
39
Perl.tanditryar Estinati Kesalaban Pengukuran Slatdard
. -
181 [image:9.595.336.547.287.402.2]Jtnnal Penelitian dan Eulaati Pendidikan
Pada butir-butir siklus akuntansi tidak
tetdapat soal yang mudah.
Butir
yang ter-golong baik betjumlah 7 butir Q7,78Yo), darrsoal yang tetgolong sulit be{umlah
2 butir
Q2,22o/o). Tabel 3 menunjukkan rangkuman
butit menurut tingkat kesulitan butir.
Tabel3.
Tingkat I(esulitan Butir SiklusAkuntansi
Kdteda No
Butit
lundah %Tabel
4.
Data Cut ScorePutaran 1 Putatan2
Angoff EbeI Booknark Argoff Ebel Booknark
7
72,0058,48
51,30
72,00 58,53 51,002
68,0033,99 69,04
67,0037,00
69,L73
72,0068,05
73,33
73,00 69,25 76,584
73,0068,20
76,50
72,00 69,20 73,71.5
70,0069,80
78,50
70,00 69,00 78,506
64,0059,70
47,29
60,00 59,20 50,887
54,0050,90
59,00
60,00 53,10 59,008
73,A057,45
59,96
73,00 59,15 54,989
70,0070,4L 57,04
67,00 69,39 41,99Rerata 68,44
59,64
63,44
68,2260,20
67,63St.l
; _
6,1.3 1.7,7877,28
5,79
10,51
13,17oev
Tabel5.
Sampei Cut ScoreE
Putaran1
Pttaran2E, Angoff E,beI Booknark
Ar$off
E,bel Boobzark\
72,0058,48
51,30
72,0037,00
51,002
72,0068,05
69,04
73,00
69,20
69,173
70,00 68,2073,33
72,0069,00
73,774
64,00 59,7079,50
60,00 59,20
50,995
54,0050,80
47,29
60,0053,10
58,006
73,00 57,4558,00
73,00
59,75
54,987
70,0070,41
57,04
67,00
69,39
41,99Pengambilan sampei dengan
pengem-balian
(x-)
dilakukan pada masing-masingsampel cl,tt sczre
(x) untuk
masing-masingmetode. Pengambilan sampel tersebut di-Iakukan sebanyak 200 kali dan pada masing-masing pengambilan dicati standatd
deviasi-fiyz-. Bootstr@
tetsebut dilakukan
denganmenggunakan program
R
i386 3.0.0. Tabel6 memrnjukkan kesalahan pengukuran yang
te{adi ketika pengambilan sampel dilakukan
sebanyak 200kalt
Tabel
6.
I(esalahan PengukuranI{etetangan
Rata-rata
I{esalahan firtJCIw
Pengukuan(200
kali)
Bootutrap (200 kali)Mudah (<-2)
Sedang
01,02,03,04,(-2
<x<2)
05, 06, 07Sulit
(>2)
08,09 Jurnlah0
17,78o/o
)2 )ro/^ 100%
Pelaksanaan penentuan Cutscore
dia-wali
dengan memberik^flp^p^r^n
terkaitdengan pengertian dan tujuan standard setting
instrumen yang digunakan, dan analisis data
dengan menggunakan metode
Angof{ Ebel
dan Bookmark. Balnar-bahar, diskusi yang
dibagikan kepada peserta
terdid
dari
pen-jelasan tentang standard setting
rlund
dzwnstandard
ulting
lembar jawzban panelisun-tuk
masing-masing metode standard settingstandar kompetensi lulusan (SKL), soal
uji-an
ptaktik
kejuruan,rubrik
penilaian, danordered item booklet (OIB).
Setelah
penjelasantentang
materistandard setting peserta bedatih standard utting
di bawah bimbingan peneliti. Setelah
peser-ta berlatih, nilai-flipeser-tai yang ada disimulasikan
dengan menggunakan program Exceil.
Sete-lah bedatih standard setting,pesefia kemudian
meiakukan standard setting pataran pertama
dan putaran
keduauntuk
masing-masing metode.Cut score yang dif',etoleh dengan
meng-gunakan metode
Angoff, Ebel,
danBaok-mark tampak pada Tabel 4. Data pada tabel
4
kemudian dijadikan sebagai populasiun-ntk
Bootstr@. Sampel yangdiambil
secaradari
populasi
tersebutdi
atas berjumlahtujuh buah. Hasil pengambilan sampel tam-pak pada Tabei 5.
2
9
Putaran Angoff
1
EbelBookmark
Putaran Angoff
2
EbelBoakruark
67,903 67,960 67,960 67,809 59,034
57,022
2,429 2,419 4,267 2,702 4,004 4,042
[image:10.595.361.577.632.756.2]Cul score yang tinggi
ini
dapatmeng-gambatkan kemampuan/kompetensi siswa
yang
sebenarnya dalam mengelola akun-tansi. Halini
mengingat bahwa dalam driniausaha, akuntansi memegang peranafl yang
cukup penting. I(esaiahan yang terjadi pada
tahap-tahap akuntansi akan mengakibatkan
penrsahaan
merugi
batrkangulung
tikar.Demikian pula sebaliknya, ketepatan dalam
mengelola akuntansi menjadikan
perusaha-an
dapat menFrsun s'rrategi dengan baik,menggaji karyawan tepat waktu, melakukan
diversifikasi usaha, dan sebagainya.
Pencapaian
kompetcnsi
akuntansiyang tinggi tersebut menuntut perbaikan
pa-da kurikulum)
s^tarr
dan prasarana, prosespendidikan, kualitas guru.
I{urikulum
yangdigunakan dalam
SMI(
perlu mengacu padakebutuhan
dunia
usaha.I(onsep
link
andrtatch dalam pendidikan kejuruan
menyela-raskan kebutuhan dunia usaha dengan dunia
pendidikan.
Agar
konsep
link
and natchdapat berjalan dengan baik, maka perlu ada
komunikasi
^rrj:ar^ dunia usaha
dan
dunia pendidikan.Dalam
praktik,
terkadang terjadike-ri.dakselaras^n aflta;ra dunia usaha dan dunia
pendidikan. Sebagai
contoh,
ketika
siswamelakukan ptaktik kerja lapangan (PI(L)
ba-nyak dunia usaha yang mengalihkan siswa
program keahlian akuntansi ke bidang
lain-nya
seperti sekretariat, tenaga peIrusarandan
sebagainya. Banyak perusahan
y^ttg
menganggap bahwa keuangan menrpakan
rahasra perusahaan
dan tidak
boleh
sem-b arzng orang mengetahui.
Sarana dar' prasarana pendidikan yang
dimiliki oleh
sekolahperiu
ditingkatkan.Berdasarkan
suwei yang
diiakukan
oleh peneliti, banyak sekoiah yang tidak memilikisarafla dan prasarata yaflg memadai untuk
pembelajaran akuntansi.
Banyak
sekolahyang memiliki kelas terbatas yang
mengaki-batkan sekolah tidak memiliki laboratodum
akuntansi.
Di
sampingrt.t
alat-alatpembel-aiaran yang zda
di
sekolah kejuruan sangatminim.
Mintmnya s^rafla dan
prasarat
yafigada akan berakibat pada proses
pembelajar-^n
y^trg kurang
optimal dan
berdampakJurnal Penelitian dan Enlaai Pendidikan
pada rendahnya kualitas lulusan kejuruan.
Oleh
karenaitu,
di
samping guru dituntutlebih kreatif
dalam membelajarkanakun-tansi kepada si.swa, guru juga
pedu
mem-perkenalkan
praktik-praktik
akuntansi danmembawanya
di
dalam keias.Oleh
karenaitu,
kreativitas guruperiu
ditingkatkande-ngan memberikan pendidikan dan pelatihan
yang baik.
I(ondisi-kondisi tersebut
di
atas perlumenjadi perhatian
dan
pertimbangan pe-merintah meningkatkan kualitas pendidikan.Pemerintah hendaknya
perlu
membedkanperhatian lebih kepada sekolah-sekolah yang
kualitasnya masih di bawah standar.
I(esen-langan arrtzr? dunia usaha dan dunia
pen-didikan dapat diperkecil dengan adanya
ko-otdinasi
^rrtarz- kementerian
yang
terkait.Pemerintah juga perlu memberikan kontrol
terhadap sekolah-seholah khususnya
seko-lah kejuruan baik administrasi, tenaga
pen-didik dan kependidikan, proses pembelajar-an melalui dinas pendidikan
di
kabupaten/ kota.Besamya estimasi kesalahan
peng-ukuran
untuk
setiap metode standard seltingberbeda-beda. Pada putaran pertama untuk
200 kali Bootstrap, estimasi kesalahan
peng-ukuran pada metode
Angoff
sebesat 2,429dengan mean sebesar 67,903, metode Ebel
sebesar 2,41,9 dengan mean sebesar 61,960,
dan metode Bookmark sebesar 4,267 dengan
mean sebesar 61,960. Pada putaran kedua
rrntuk 200 kali Bootstrap, estimasi kesalahan
pengukuran pada metode
Angoff
sebesar2,1,02 dengari mean sebesar 67,809, metode
Ebel
sebesar 4,004 dengan mean sebesar 59,034, dan metode Bookmark sebesar 4,042 dengan mean sebesar 57,02L.Flasil penelitian
ini
berbeda denganpenelitian yang rlilakukan
oleh
Premastuti,N.B.
(2010, p.230) yang menyatakan bahwametode Bookruark lebih
akuat
dibandingkandengan
metode
Croup Contra.rl. MemrrutPremastuti Q01,0, p.230), metode Bookmark
lebih baik katena dalam prosedurnya
mem-pertimbangkan
(1)
parametertingkat
ke-sukaran
butir
dan (2) estimasi panelis dalammengestimasi tiap
butir
dengan responpro-babilitas tertentu.
Perbandingan Estimasi Kesalaltat Petgtkuran Standard... - 183
Jurnal Penelitian dan Etaluasi Pendidikan
Hasil penelitian
ini
juga berbedade-ngan penelitian
ylng
dilakukan oleh\7ida-yati
Q009, p.182).lTidayati
(2009, p.182)menyatakan
bahwa metode
teori
responbutit
merupakan metode yang paling tepatuntuk
mengestimasi kesalahan pengukuran perangkat soaluji
coba u]ian nasional matapelzjann
Biologi SMA tahun
pelajaran2007 /2008.
Ada
beberapa penyebab perbedaanhasil penelitian
ini
dengan dua penelitian di^t^s.
Pettama, penyebabyang
berkaitandengan sampel. Sampel dalam penelitian
yang dilakukan oleh Ptemastuti Q01,0,225)
dan Widayau Q009,p.192) merupakan
sam-pel yang diambil dad populasi. I(etika
sam-pei yang diambil besat, maka hasilnya dapat menggambatkan patameter populasi. Dalam
peneJitian ini, sampel yang digunakan bukan
diambii dad
populasi
melainkan resaruple(Efton
&
Tibshirati,
7993, p.45).I(esalah-an pengukuI(esalah-an
pada penelitianini
akanmenunjukkan
hasil yang betbeda
apabtTajurnlah sampel dan resampelnya ditambah.
Mengingat
jumlah
sampel yang digunakandalam penelitian
ini
tergolong sedikit, maka variasi resampelnya jugarelatif
sedikit. Jikasampel penelitian ditambah, maka
resample-nya akan sangat bervariasi dan
menghasil-kan kesalahan pengukuran yang berbeda.
Perbedaan besaran kesalahan
peng-uknran
pada metode Bootstr@ disebabkankarena jurnlah sampel yang digunakan relatif
sedikit. Jurnlah sampel akan sangat
mempe-ngaruhi variasi data dalam penelitian. Apa-bila sampei yangada dilakukan pengamApa-bilan ulang dengan pengemb ahan, maka data yang diperoleh tidak memiliki banyak vadasi.
Hasii
estimasi kesalahan pengukutandipetoleh dengan cara {rcrrg
mbil
sampel(x-)
dad
sampel asli (x). Resample tersebut dilakukan sebanyak 200 kali dengan bantuanprogtam R. Hasil resarQle
untuk
setiap kaliBootstr@ akan berbeda, namun hasil kesalah-an pengukuan tidak jauh berbeda.
I(edua, penyebab yang berkaitan
de-ngan penilai. Besar/keciirrya estimasi
kesa-lahan pengukuran tergantung pada kemam-puan penilai, dalam hal
ini
adalah guru,da-lam memprediksi kemampuan siswa.
Grru
184
-
Volume 19, Nomor 2, Desember 2015yang
memahami kemampuan siswa akandengan
mudah
memptediksi kemampuansiswa dengan tepat. Pemahaman
guru
ter-hadap kemampuan siswa terjadi ketika guru
sering berdiskusi dengan siswa tentangrn ta
pelajaran ataupun pengetahuan yang
lain-nya.
Hasil perhitungan estimasi kesalahan
pengukuran pada metode
Angoff
lebih kecildaipada metode
Ebel
dan Bookmark. Ha)ini
dikarenakanpenenttan
cut score padametode
Angoff
lebih mudah daripada duametode lainnya. Pada metode
Angoff,
gurudiminta untuk
mengestimasi kemampuansiswa dalam menjawab pett^rry^ rt yang
di-ujikan.
Pada metodeEbei, gurlr
dimintaunnrk memprediksi tingkat kesulitan,
ting-kat relevansi
butir
dan menentukanpropor-si siswa yang mampu menjawab
butir
padatiap se1. Sedangkan pada metode Bookmark,
guru
dimintauntuk
mengestimasikemam-puan siswa tetlebih dahulu sebelum
menen-hrkan batas kelulusan.
Metode penelitian yang dilakukan
!7i-dayati Q009, p.192) tidak melibatkan guru
dalam mengestimasi kesalahan pengukuran.
\Tidayati,
'S7. menggunakandata
berupa respon siswa terhadap perangkat soalBiolo-gi tahrrn pelajatan20AT /2008. Data tersebut
digunakan
unruk
mengestimasi kesalahanbaku
pengukuran dengan
menggunakanenam metode.
Dari
kedua penyebab tersebut didugamenyebabkan hasil yang betbeda
baik
da-lam pemilihan metode standard setting
rrrav
pun
dalam pemilihan metode
kesalahanpengukuran.
Untuk
membetikan dukunganbahwa metode Bootstr@ memberikan hasil
estimasi kesalahan pengukuran yang lebih
kecil, maka dilakukan pembandingan hasit
estimasi
kesalahan
pengukuan
denganmenggnnakan metode Keatl Modfication.
Hasil
estimasi kesalahan pengukuranpada beberapa metode standard selting
de-ngan menggulrakan metode Keats'
Madfica-tion tarnpak pada Tabel 7. Putatan pertlrna,
metode
Keats' Modfication menghasilkanestimasi
kesalahanpengukuran
metodeAngoff
sebesat 3,292 dengan meafi sebesarmean sebesar 61,,960, dan metode Bookmark sebesar 4,418 dengan mean sebesar 61.,960.
Pada
putaran
kedua,
estimasi kesalahanpengukuran pada metode
Angoff
sebesar3,314 dengarr mean sebesar 67,809, metode
Ebel
sebesar 4,809 dengan mean sebesar 59,034, dan metode Bookruark sebesar 5,033 dengan mean sebesar 57,022.Tabel
7.
Perbandingan I(esalahanPengukuran Bo otstrap dengan
I(eats' Modification
Kesalahan
I(esaiahanPenguliuran Penguliuran
t1'eterangan
siotrtrrp
K.u,.'
(200
kaii)
ModificationAnsoff
Putaran
Ebei
1.
Bookmark
Ansoff
Putaran
Ebel
2
Bookmark
.lnnal Petelitian dar Eyalaasi Pendidikan
berkaitan
dengandistribusi
sampel yangdiambil. Semakin banyak sampel yang di-ambil dari populasi maka distdbusi
sampel-nya akan mendekati normal. Pada metode
Bootstrap, semakin banyak Bootstr@
dilaku-kan,
makahadl
Bootslrap akan mendekati populasinya.Distribusi binomial merupakan
distri-busi dari
n
petcobaan bethasil/gagal yang saling bebas. Pada disuibusi binomial,umt-an observasi menrpakan kejadian
rndepen-den, dan probabilitas sukses dinyatakan
de-ngan
"p"
(Subiyakto, 1,995, p.45). Distribusibinomial
seringkali digunakanuntuk
me-modelkan jurntah keberhasilan pada jumiahsampel n dad populasi N.
Perhitungan estimasi kesalahan
peng-ukuran Keats' Modfication mempertimbang-kan probabilitas jawaban benar dan proba-bilitas jawaban salah.
Di
samping itu, mmusKeats' Modifcalion iuga mempertirnbangkan
reliabilitas soal.
Hal
ini
berbeda denganSEN{. Pada SEM,
ptoporsi
jawaban siswadan reiiabilitas soal tidak dipertimbangkan.
Namun
demikran, apabtladilihat
dari
ke-salahan pengukuran
yang
dihasilkan,me-tode Bootstr@ menghasilkan kesalahan
peng-ukuran yang
lebih kecil
dibandingkan de-ngan metode Keats' Nlodfication.Berdasarlian hasil estimasi kesalahan
pengukuran,
metode
Angoff
merLlpakanmetode yang lebih baik untuk menentukan
cat rczre dibandingkan metode Ebel maupun
Bookmark.
Hal
tersebutditunjukkan
olehhasil
estimasi kesalahan pengukuran padaAngoff lebih kecii
Q,1,02 denganmeng-gunakan Bootstrap, dan 3,314 dengan
meng-gunakan Keats' Modtfcatioru) dibandingkan
dengan metode
Ebel
(4,004 denganmeng-gunakan Bootstrap, dan 4,809 dengan
meng-gunakan l(eats'
Modtfcaliof marpun
Book-mark (4,042 dengan menggunakan Bootstr@,
dan 5,033 dengan menggunakan Keats'
Modi-fcation).
Hasii
ini
sejalan dengan pendapat dadAnto
&
Mardapi, (201.3, p.377) yangmenyatakan bahwa bias estimasi pada Yes/
No Angoff
lebih kecii dibandingkan denganmetode Ebel.
Di
sampingitu,
hasil
estimasike-salahan pengukuran, ketepatan penggunaan
Perbardingan Euiruasi Ketalaltan Petgukarar Standard ... - 185
Sebastianus Widaoarto P, Djemari N{ardapi, Budiyono
2,42ct
2,419 4,267
2,702 4,004
4,042
3,292
4,41,8 4,478 3,31,4
4,809 5,033
Pada putar2n
?,
metode Keats'Modi-fication menunjukkan bahwa rerata estimasi
kesalahan pengukuran pada metode
Angoff
lebih kecil
(3,314) danpada metode Ebel(4,809) dan metode Bookrnark (5,033). Oleh
karena
itu,
metodeAngoff
menunjukkanmetode yang lebih baik untuk menentukan
cut score karena memberikan estimasi
kes-alahan pengukuran yang
lebih
kecildiban-dingkan dengan meiode Ebei dan Bookmark.
Pada Tabel
7
tampak bahwa metodeB o o tstr@ dar, Ke a ts' Mo d
tf
ca tio n menunjukkanhasii yang
sama.I(edua
metode tersebutmenunjukkan bahwa metode
Angoff
me-rupakan metode standard setting yang lebih
tepat dibandingkan metode
Bbel
danBook-tnark
karena
menghasilkan standard erroryang paling kecil. Dengan demikian, kedua
metode dapat digunakan
untuk
mengesti-masi kesalahan pengukuran.
i(edua
metode
estimasi
kesalahanstandar tersebut menggunakan asumsi yang
berbeda.
Metode
Bootstr@ mendasarkanasumsi pada central
linit
theonn(CTL)
se-dangkan
metode
Keats' Modfication)
Err
Jtrnal Penelitian dan Emhasi Pendidikan
metode standard settingiuga ditunjukkan pada
kemudahan panelis dalam rnenentr;kan cut
score. Metode
Angoff
dan Boo kmarkmerupa-kan meode yang mudah
untuk
diterapkandibandingkan dengan metode
Ebel.
Padarnetode
Ebei,
panelis melakukan estimasiterkait dengan tingkat kesulitan
butit,
ting-kat
relevansi, dan tingkat kemampuanpe-serta tes. Banyaknya estimasi yang dilakukan
oleh
panelis dapat
menyebabkan tingkatkesalahan yang dilakukan semakin banyak.
Betbeda dengan metocie
Angoff
danBook-mark, pada kedua metode tersebut panelis
hanya
mengestimasitingkat
kemampuanpeserta tes. Namun demikian, pada metode
Bookmark,
ada
beberapaindikator
yang diestimasi dapat dikerjakan oleh siswa tidaktercakup dalam halaman Bookmark (R.ejeki,
Matdapi,
&
I(umaidi,
2014, p.94).Semen-tara pada metodeAngoff,
seluruh indikatorkemarnpuan diestimasi oleh panelis.
Sirnpulan dan Saran
Simpulan
Berdasatkan hasil penelitian dan
pem-bahasan yang teiah diungkapkan maka dapat
disampaiJ<an
beberapa
simpulan
sebagaibedkut.
Pettama,
c//.t sczrerr-;.Ia
pelalatanAkuntansi jenjang
SMK
di DIY
yang<ii-hasilkan dengan
menggunakan metodeAngoff
pada puta;ran 1 adalah 67,86meng-alami kenaikan yang
tidak
signifikan padaputaran
2
menjadt 68,1,4.I(edua,
cxtt yzrerrrata pelajatan Akuntansi jenjang
SMK
diDIY
yang dihasilkan dengan menggunakanmetode Ebel pada putaran
1
adalaln 61,87mengalami penurunan yang tidak signifikan
putaran
2
menjadi 59,15.I(etiga,
cut scoremata pelajatan Akuntansi jenjang
SMK
diDIY
yang dihasilkan dengan menggunakanmetode Bookmark pada
putaran
L
adalah62,07 rnengalami penurunan signifikan pada
putaran 2 menjadi 57,03.
I(eempat, kesalahan
pengtkuran
cutsclre llaata pelalann Akuntansi jenjang
SMI(
di
DIY
dengan rnenggunakan Bootstrap padametode
Angoff
pada putaran1
untuk
Uji
I(ompetensi
I(ejuruan Praktik
Akuntansii 86 - Volume 19, Nomot 2, Desembet 2015
sebesar 2,429. I(esalahan pengukuran pada
putafan pertama
mengalami
perulruIlan yang tidak signifihan sebesar 0,327 men)adt2,L02 pada putaran kedua. Sementara itu,
kesatrahan pengukuran dengan
mengguna-kan metode l(eats' Modification pada
meto-de
Angoff
putaran pertama sebesar 3,153rnengalami kenaikan yang
tidak
signifikansebesar 0,059 menjadt 3,212 pada putaran
kedua.
I(elima,
kesalahanpengukuran
cut sczr€ rn^t^ pelalarat Akr.rntansi Jenjang SI\{i(di
DIY
dengan menggunakan Bootstr@ oadametode
Ebel
pada putaran
1
untuk
Uji
Kompetensi
l(ejunran Fraktik
Akuntansisebesar 2,419. I{esalahan pengukuran pada
putaran pertama mengaiami kenaikan yang
tidak signifikan sebesar 1,586 menjadi 4,004
pada putatan
kedua. Sementaraitu,
ke-salahan pengrtlqv^r, dengan menggunakan
metode
I(eats' Modificaaon
pada metodeEbel putaran pertama sebesar 4,734 rneng-alarni penurunan yang
tidak
signifikanse-besar 0,072
menjad"i
4,663 pada putaraokedua.
I(eenam,
kesalahan pengukuran cul:clr€ tnat^ pelalann Ahuntansi Jenjang SMI( di
DIY
dengan menggunakan Bootstr@ pada rnetode Bookmark pada plrtaran 1 untukUji
I(ompetensi Kejruuan
Praktik
Akuntansrsebesat 4,267. I{esalairan pengukuran pada
putaran pertama
iru
mengalami pemrrunanyang tidak signifii<an sebesar 0,225 nenjadt 4,042 pada putaran kedua. Sementara itu,
kesalahan pengukuran dengan
mengguna-kan metode I(eats'Nlodification pada
meto-de Bookmark putaran pertama sebesar 4,187
mengalami kenaikan yang
tidak
signifikansebesar 0,280 menjadt 4,467 pada putaran
kedua.
I(etujuh,
estimasi
kesalahanpeng-ukuran
ctlt sczre yangpaling
tepat
adalahmetode
Angoff
karena memberikan rerataestimasi kesalahan pengukuran yang paling
kecil.
Saran
Berdasarkan hasil penelitian dan
be-berapa keterbatasan penelitian rnaka saran
Peftama,
penentuan
cut
score padapenelitian
ini
hanyaterkait
dengan UjianI(eterampilan
l(ejuruan
Ptaktik Akuntansi.Untuk memberikan gambaran yang
sesung-guhnya, maka penilaran sikap, proses,
ke-rapian, kecepatan dan kebersihan
perlu
di-masukkan dalam
standard setting. I(edua,perlu
dilakukan penelitianlebih lanjut
ter-kait dengan cut score tentang penguasaanma-teri
akuntansidi
sekolah menengahlie-juruan (aspek pengetahuan).
I(etiga, pedu dilakukan penelitian latn
dengan menggunakan metode standard selling
yang berbeda dan menambah panelis yang
berasal
dari
dunia
usaha/dunia
industrisehingga menghasilkan penelitian yang lebih
baik.
I(eempat, jumlah
panelisperlu
di-tambah lebih dari sembilan orang agar dapatmenggambarkan
utt
sczrey^fig lebih
baikmengingat
paneiis
dalam penelitian ini
berjumlah
9
orang.
I(elima, guru
perlumemberikan latihan-latihan
soal
praktikyang bervariasi dan teiprogram agar siswa
benat-benar dapat menguasai praktik
Akun-tansi
dan
meningkatkan kualitaspembel-ajaran dengan menggunakan berbagai
me-tode pembelajaran yang bervariasi.
Daftar
PustakaAlsmadi,
A.
A.
(2007).A
comparative studyof
two
standarci-setting technique.Social Behaaior and Personaliry,
38
(4), 479-
486.Anto,
S.,&
Mardapi,D.
Q01,3). Komparasi tnetode standard rctting untak penentuanKKNI mata pelE'aran Matematika kelas
Wil
SMP.
Jumal
Penelitian
danEvaluasi Pendidikan.
17 Q).
369
-388.
Beja4I.
I.
(2008). Standard serting: what isit? why
is
it
important?.RdyD
Con-nection,7,l
-5.
Berk,
R.A. 0986).
A
consumer's guide tosetting
performance standards
oncriterion-referenced
tests.
Reuiew ofEdwcational Research, 56, (1),1,37
-
1.72.Jarnal Penelitian dat Euahrai Pendidikan
Chadha,
N.K.
(2009). Applied pychometic.First
Publishing, India:Vivek
Mehrafot
Sage Publication.Chesser,
A. M.
S., Laing,M.
R.,
Miedzy-brodzka,
2.,
Brittenden,
J.,
et
aIQ004). Factor analysis can be a usefi.rl
standard setting
tooi
in
a high stakesOSCE assessment. Mediml Education,
38, 825
-
831.Cohen, A.S.,
I(ane,
M.T.,
&
Crooks,TJ.
(1.999).
A
generalizedexaminee-cen-teted method
for
setting standards onachievement tests. Applied Measurement
in Education,l2(4),343
-
366.Cowel,
W.R.
0991).
A
procedure for
estimatingthe
conditional
standatderror
of
measufemefl.tfor
GREgeneral and subject
test.
GRE BoardProfessional Report
No.
87-03P, ETSResearch Report, 91
-
25.David,
B.
(2000).AMEE
Guide
No.
18:Standard
setting
in
student
assess-ment, Medical Teacher,
22
(2),
1,20-130.
Efron,
B.,
&
Tibshirani,P.J.
(993). An
introduction to the bootstr@. New York:Chapman
&
Hall. Inc.Feldt, L.S.,
&
Steffen,M.,
&
Gupta C. N.(1985).
A
comparisonof
five methodsfor
estimatingthe
standardertor of
measurement at specific score model.
Applied Pynlogical Measurement,
9
(4),351-361.
Guan,
\7.
(2003). F'rom the help deskboot-stapped
standardefrors.
The StataJournal.3 (1), 71
-
80.I(ane, M.T.,
&
\7ilson,J.
(1984). Errorsof
measurement and standard setting
in
mastery
testing. Applied Pychological Measurement S 9 (1), 107 -11,5.I(ane,
M.T.
(1,994).Validating
the
per-forrnance standards associated
with
passingscore.
fuuiewof
Educational Reseach.64 (3), 425-
461,.Perbandirgan Estinasi Kesaloltar Petgukuran Stardard...
-
1,87Jrrnal Penelitian dan Eaahasi Pendidikan
I(ane,
M.T.
(2010).Ercar
of
measar€meutt, thearT, and pablicplliAL
Educational Testing Serwice.I(arantonis,
A,.
&
Sireci, S.G.
(2006), TheBookmark standard-setting method: a
]iteratut
review, Educational Measure-ment: I$iles and Practice, Spri.g, 4 - 12I(offlet,
S.L.
(1980).
A
Comparisonof
appoaches
for
setting
proficiencystandards, Jaurnal of Edacation
Measare-ment,1.7 (3),167
-
178.Lee,
G.
(2000,24
-
28 Aprrl).
Estimatingreliabiliry and standard error of
medsare-ment
for
complex reading comprehensiontests under generaliqabilifl theory model.
Paper presented
at the
AnnuaiMeeting
of
the Amedcan EducationalResearch
Association.
New Otleans,L{.
Livingstone, S.
A.,
&
Ziekv,M. J.
(1982).Passing sczre::
a
rnanaa/for
setting standards of perfonnance on educational andoccupational
tests,
Princeton,
NewJersey: Educational Testing Sen ice.
Livingstone, S.
4.,
&. Ziel<y,M. J. Q006).A
ruanua/ far setting standards of perfonuance
on edacational an occtrpational test:.
Prir,-ceton, Nerv Jersey: Educational Test-ing Service.
Mardapi,
D.
(2008). Teknik Penl/urunaninstru-men tes dan non tes. Cetal<an Perta-rna.Yogyakarta: Ivlitra Cendikia Press,
Nichols,
P.,
Twing,
J.,
&
Mueiler,
C.D.(2010). Standard-setting methods as
rneasrrrement
process.
Educationa/Mea.rurement: I$ues and Practice,
29
(1),I+
-
Z+.Nudell,
H.
(2008,Febnrary).
Making the cut-
the cut sczre, that is establishing apass/fail
scoteis
a
highly
technicalprocess.
ICSC
Certified Professionak i{ew.rletter.Premastuti,
N. B.
(2010). I{omparasistan-datd
setring metodaSoup
contrastdan
Bookmark
pada mata pelajannAkuntansi. Jurual Penelitian dan Euahr-asi Pendidikttn,l,4 (2), 225
-
245.Rejeki, S., Mardapi,
D.,
&
I(umaidi. Q01,4). Metode standard settinguntuk
ujian nasionaldi
sekolah dasat. JarnalPene-litian dan E ualuasi Pendidikan. /
I
(/ ), 8 9-
97.Retnarvati,
H.
(2008). Penentuan batat laht: (standard setling)ajian
nasional mata pelEaran Matematikadi
DIY.
LaporanPenelitran. UNIY: PKPSP LP.
Saundets,
J.C.,
Rvut,
J.P.,&
Huynh,
FI.(1980, March
5
-
9).A
corupaison a' two wals of setting passing scores based ot:the ncdelskjt procednre. Publication Senes
i:r
MasteryTesing.
Soutir Carolina:University
of
South CatoLina Coilegeof Education Colombia. this Article is
presented at the annual conference
of
the
Eastern Educational
ResearchAs sociation, Norfolk, Vitgrnia.
Skaggs, G., Hein, S.F.,
&
Awuor, R-. (2007).Setting passing Scores
on
passage-based test:
a
comparisonof
traditio-nal
and
single-passage Bookmatkmethod, Appli€d Measurement
In
Edu-cation.2A
(0,
405-
426.Subiyakto,
fi.
(i995). Statistika (inferen) untuk bisnis. F,dtsi ke-1. Cetakan ke-1. Yog-vakarta:Bagian
Penerbitan sekolahTinggi
llmu
Ekonomi.\7hiteiy,
S.E.
(i979). Estimatingmeasure-meflt error
on
highly
speeded tets.Applied Prychological Measurement,
3
(2), 1,4L-154.Widayad
\7.
(2009). i{omparasi beberapametode estimasi kesalahan
pengukut-an. Jarnal Penelitian dan Eualuasi
Pen-didikan. 13 (2). 182
-
797.Yfui,
P.,
&
Sconing,J.,
(2008). Estimating standatd errorsof
cut scofes for itemtating and
mapmatk ptocedure:
^ generaLizability theory approach. E,du-cational and Psltcho lagtcal Measurement, 68
(1).25
-
41.