Perbandingan estimasi kesalahan pengukuran standar setting dalam penilaian kompetensi akuntansi SMK.

(1)

(2)

-$,*oN E?4u_ .!-- ?.=

S

we6a

ia

a 6-,.",-.*/Le

&

{T{E

;*

u'*r*u,urrorr$t

rlaer

Penerbit

HIMPUNAN

EVALUASI

PENDIDIKAN INDONESIA

bekerja sama dengan

PROGRAM PASCASARJANA UNIVERSITAS

NEGERI YOGYAKARTA

Berdasatkan

MOU Nomor

1,958/J.35.1.7

/LK/04

Penanggungjawab Ketua

Sekretaris

Penyunting

Djemari Mardapi

Moch

Alip

Heri Retnawati Badrun I(artowagfuan Sudiyatno

Aman

Samsul Hadi Janan Haryadt Sudiyono

Penyunting Bahasa

Kootdinator

_JurnalPPs

UNY

Ashadi

Sekretadat

Rohmat Purwoko

Syarief Fajaruddin

SEMUA TULISAN YANG ADA DAIAMJURNAL PENELITIAN DAN EVALUASI PENDIDIKAN

BUKAN MERUPAKAN CERMINAN SIKAP DAN ATAU PENDAPAT DEWAN REDAKSI TANGGUNGJAWAB TERFIADAP ISI DAN ATAU AKIBAT DARITULISAN

(3)

Ennl lW/a1anti,

Mmdilarto

HniRetnawati

Sahraini, Smtarsih Mo@a SamsulHadi,

K

Ina knara,

Efendie Tanunibardja

S e b astia n us lYidan afio P, Djenari MardEi,

Budfiono

Sadi1afio,

Badrun Kafiowagiran,

Mnfuadi

Sqkardi, Soenarto

Vidla Nooiana Noor,

Aman

Yojton Sarlono,

Puji Yanti Fauryiab

Ali

Saukah, Agus Eko Cablono

Janal Penelitian dar Eaabasi Pendidikatt

DAFTAR

ISI

Pengembangan Instrumen Asesmen

Diri

dan

Teman

729-744

Sejawat Kompetensi Bidang Studi pada Mahasiswa

Petbandingan Estimasi Kemampuan Laten Arttara

Metode

745-755

Maksimum Likelihood dan Metode Bayes

Model Evaiuasi Intemal Kompetensi Guru Bahasa

Inggds

756-767

(Adodel-EIKGBD SMA

Pengembangan Sistem Tes Diagnostik Kesulitan

Belajat

768-775

Kompetensi Dasar Kejuman Siswa

SMI(

Perbandingan Estimasi Kesalahan Pengukuran S tandard

S ettingdalam Penilaian I(ompetensi Akuntansi

SMI(

Pengemb angan Model .4 s s e s t m e n t a s I-e am i ng P emb elajann

Akuntansi di SMK

Asesmen Instalatur Listrik Berbasis Kebutuhan Industri

Jasa I{onstruksi Ketenagalistrikan

Evaluasi Penyeienggaraan Laihan Ujian Nasional Bahasa

Inggris SMA Svrasta Ex-RSBI

Model Pendidikan Karakter bagi Anak melalui "Sekolah

Ibr:ri' Nonfor:nal di Pedesaan

National Exam in Indanesia and Its Inplications to tbe Teaching and l-eamingof English

176-188

189-207

202-216

277-229

230-242

243-255

(4)

jurnal

FeneLitian dan Evaluasi Pendidikan Volume i.9, No 2, Desembet 2015 (175-188)

Tercedia Online: http://journal.uny.ac.id/index.php/jpep

PERtsAhTD

IN GAN

E ST TMASI KE

SAI-A}{&N

PENG

UKUR.&N

S

TAI{DARD

S E TTT

N

G

DAI.A},{

I'ENILAI,{N

KOMP ET ENST AK{JhTTANS

I

SMK

1 ₎

S e b asti an u s Wi da n arto P ijaw u n ta to,') Dj e m

ai

M ardapi,

r )

B a dit o n o

')Universitas Sanata _{Dhamna, ')Universitas Negeri Yogyakarta, ')Universitas Neged}Surakarta /)sr.vidanartop@gmail. _com,2)dj

emarim adapi@gnail.com, r)bud@uns.ac.id

Abstrak

Penelitian ini bertujuan untuk mengestimasi kesaiahan pengukuran pada metode Angoff, Ebe1,

dan Bookmark dalam penij.aian kompetensi Akuntnasi jenjang

SMK

di DIY

yang digunakan

standard

vtter

dalam menentukan cut score. Penelitian

ini

merupakan penelitian kuantitatif.

Sumber data dalam penelitian

ini

adalah respon peserta

Ujian

Nasional Praktik Akuntansi

Paket 2 ta}aun ajann 2011/2012 dengan 338 siswa. Guru-gunr yang terlibat dalam Focus Group

Discussion (trGD) berjumlah sembilan orang yang terdiri dari tujuh wanita dan dua pria. Teknik

analisis daiam peneiitian

ini

dibagi dalam uga tahap yaitu:

(i)

persiapan, (2)

FGD,

(3) estrmasi kesalahan pengukutan dengan menggunakan Bootstr@. Hasil penelitian menunjukkan bah-wa cut

score unllik metode

Angoff

sebesar 67,809, Ebei sebesar 59,034, dan Bookmark sebesar 57,022.

Metode

Angoff

memi.hki

estj.masi kesalahan

pengukuan

yang paiing

hecil

Q,1,02)

dibandingkan dengan metode

Ebei

(4,004; dan metode Bookruark (4,042). Oleh karena itu,

metode

Angoff

mempahan metode yang tepat

untuk

mengestimasi kesalahan pengukuran

pada standard sethng.

Kata

kunci:

Esttruasi kesalahan pengukaran, Bootstrap, Cut Score

ESTIMATION

OF

STANDARD SETTING

ERR.CR

MEASUR,EMENT

NN

ACCOUNTING COMPETENCY

A.SSESSMENT

IN

VO CATX

ONA{-

S CHO OLS

1 ₎

S e b astian us Wi dan arto P

ij

o wu n ta to, 2 ) _Dj

e nt

ai

M ardapi, o)

B a d4 o n o

')Universitas Sanata _{Dharma, ')Universitas Negeri Yogyakarta,}3)Universitas Negeri Surakarta /)swidanartop

@gmaii. co

m,'

) diemanrnadapt@grnai1.com, rbud@uns.ac.id

Abstract

This

research aims

to

estjmate the measuremerit emor

in

the

Angof,

EbeL, and Bookmark

methods

in

Accounting Competency Assessment

in

Vocational Schools

in DIY

used by standard setters

in

deciding a cut score. This research is quantitative research. Data sor-rrce

in

this

study was the cut score

of

seven vocational schools

in

Yogyakarta that wete randomly

established.

The

reseach data

wete

students' alrswefs

to

the

National

Examinauon

in

Accounting Subject

of

Package 2

in

the academic year

of

2A11/201,2

with

338 students. The

teachers

who

engaged

in

the Focus Group Discussion (FGD) were nine teachers, consisting

of

seven wornen and

two

men.

The

technical anaiysis was divided

into

three

stages. 1)

preparation, 2)

FGD,

3) estimated error measurement

by

using the Bootstrap method. The

tesults show that the cui score

for

the

Angoff

method is 67.809, Ebel method is 59.034, and Bookmatk method is 57.022. The

Angoff

method has the least estimation of the measurement errors _{Q.1,02) as}compared

with

the Ebel rnethod (4.004) and the Bookmark rnethod (4.042).

Thetefore,

the

Angoff

method

is

the

right

method

for

estimating

error

measurement on

standard setting.

X(eywotds: Estintation of error measureruent, Bootstrap, Cut S core

jumal

Penelitian dan Evaluasi Fendidikalr

(5)

Pendahuluan

Pembangunan

di

bidang pendidikan

menjadi perhatian utarna

dari

pemerintah.

Pembangunan

di

bidang pendidikan

ini

ti-dak hanya mencakup aspek fisik seperti

ge-dung-gedung, penyedia^n

szr^fl

dan

pra-sararta sekolah namun juga aspek

non

fisik

seperti kurikulum, dan hualitas tenaga

pen-didik.

Pembangunan

ini

betujuan

untuk

meningkatkan kuaiitas pendidikan

di

Indo-nesia.

Terkait

dengan kualitas pendidikan,

pemerintah

telah

mengeluarkan standar

pendidikan yang mencakup standar isi,

stan-dat kompetensi lulusan, standar satana

dat

pr

saran

,

standar pengelolaan, standar

pe-nilaian, standar proses, standar pembiayaan,

standar

pendidik

dan tenaga kependidikan

yang mencakup standar pengawas sekolah,

standat hepala sekolah, standar kualifikasi

akademik

dan

kompetensi

guru.

Standar-standar tersebut

di

atas merupakan standar

yang harus

dipatuhi oleh

sekolah-sekolah.

Pemedntah

pedu

menetapkan standar di

bidang pendidikan karena standar dapat di-gunakan sebagai kriteria atau pembanding.

I(riteria

atau pembanding digunakan

untuk meningkatkan dan menyamakan

kr.ra-litas pendidikan.

Hal ini

mengingat bahwa

Indonesia memiliki wiiayah yang cukup luas

dan setiap daerah di wiiayah Indonesia

me-miliki

karakteristik yang berbeda-beda.

Per-bedaan karakteristik wilayah di Indonesia

ini

menjadi salah satu

faktor

penghambat

da-lam meningkatkan kualitas pendidikan.

De-ngan kata

lain,

masing+nasing daerah di wilayah Indonesia memiliki kualitas

pendidi-^n y^ng berbeda-be da. P ada umufirnya, pen-didikan di daerah perkotaan lebih maju

dari-pada pendidikan

di

daerah pedalaman.

Pe-melintah perlu menyikapi perbedaan

kuali-tas pendidikan tersebut secara bijahsana.

Di

sisi

lain,

dalam berbagai bidang

kehidupan, standar

memiliki

peran

yang

penting. Standar digunakan oieh masyarakat

untuk

menentukan

baik

atau

buruk

suatu

produk.

L'icensure, credentialing dan institusi

akademik mencari pendekatan

inovatif

da-larn s ta n d a rd s e tli ng :ont;J<. menilai komp

eten-si

ptofesional (David, 2A00, p.1.20).

Di

bi-Junul Pemlitiu dan Ewlaasi Peudidikan

dang

keseharan, masyatakat memedukan

angka kecukupan

gizi untuk

menentukan

minimal

gpzi

yzng diperlukan agar

dapat

hidup

sehat. Angka hecutriupan gSzi

ini

di-cantumkan dalam berbagai kemasan

makan-an mauprm minummakan-an. Dalam bidmakan-ang

peker-jaan, institusi

memer'lukan standar untuk

menentukan seseorang diterima atau tidak

dalam

pekerjaan

teltentu. Dalani

bidang

psikologi, standat dipedukan

untuk

meng-golongkan seseorang daiam kecerdasan

(in-te llige nce qu otie

nl

tertentu. Bidang pendidikan

memedukan standar

untuk

menentukan

seseorang

bethasil atau

gagal dalam

me-nempuh pendidikan tertenru. Standar

pen-didikan diperlukan iuga untuk menyamakan

kualitas pendidikan

di

seluruh

wilayah Indonesia.

Perkembangan standar pendidikan

di-tandai dengan banyaknya

penelitian-peneli-tian yang tetkait dengan $andard

vltingbak

pembandingan metode

((offler,

1980, p.6;

Saundets,

Ryan,

&

Huynh,

1980,

p.2;

Alsmadi,

2007,

p.479;

Skaggs,

Flein, &

Awuor, 2007, p.409; Retnawati, 2008, p.31;

Premastud

201,0, p.225), metode standard setting _Q{aruntonis

&

Sileci, 2006, p.4),

me-tode

analisis (Chesser, et.al., 2004, p.825),

estimasi standard

eror

_Q{ane,

&

\X/ilson, 1984,p.1,07;

Yin

&

Sconing, 2008,p.26;Le,

2000, p.605), validasi kinerja dengan meng-gunakan passing score

({ane,

1994, p.a26).

Perkemb an gan s ta n d a rd s e lti ng terus b erlanjut

seiring dengan pelkembangan di bidang

tek-nologi informasi.

Sampai saat

ini,

terdapat kurang lebih

50 metode yang digunahan untuk

merientu-kan standard wtting _@erk,1986,p.137).

Me-nurlit

Retnawati (2008 _,p.20), pada dasarrrya

metode-metode yang digunakan dalam

stan-dard selting dapat digolongkan menjadi

em-pat golongan yaitu standard setting

berdasar-kan pada materi,

butir/tes

yang digunakan,

peserta tes (examinee), dan kebijakan jndgt ruenfi. Sernentara

itu,

Livingstone

&

Ziel<y

(1,982,

p.10)

mengklasi.fikasikan standard setting

ke

dalam

lima

kelompok

yaitu

(1)

metode yang

berdasatkan pertanyaan tes

(misalnya, The Angof method, TheAngof Mean

Estimation Method, The

Angof

Yes

or

No

Perbandingan Ettitnasi Kesalahan Pergukuran Standard... _- _1,77

(6)

Jurnal Penelitiar da,n Eaaluai Pendidikan

Method, The l{edelsklt Metbod, The Bookmark

Metbod, the ltem Desniptor Matching Methody,

(2)

metode yang berdasarkan pada

ptofiI

skot (misalnya, the Perforrnance Profile Method,

the Dominant

Prlfk

Method), (3) metode yang

berdasatkan

pada petimbangan

orang-orang atau

ptoduk

(misal-nya, the Borderline

Group Method, the Contrasting CrorQs Metbod, the Up and Down Modfrcation of the Contrasting Groap Metbod, the Anafitic _JudgmentMetho$, (4) metode yang betdasarkan pada

perum-bangan

kelompok

peserta

tes

(misalnya, Judgment about

a

Reference Croup, Judgment

about Tao Reference Croups), (5) Metode yang

betdasarkan pada

komprori

antzra

pertim-bangan absolut dan

normaif

(misalnya, the

Beuk Method, the Hofsne MethoS.

Penggo-longan metode standard setting tersebut di

atas dilakukan berdasatkan sudut pandang

masing-masing ahli.

Cutscore merupakan salah satu isu yang penting dalam standard selting. Menurut

Nu-dell

(2008), penentuari cut score buhan ha1

yang mudah. Standat kompetensi minimal

yang harus dicapai oleh seorang peserta tes

harus ditentukan

tedebih dahulu

sebelum menenttrkan cat score. Apabila peseta dapat

melampaui

standar

kompetensi

minimal, maka peserta mencapai standar kompetensi

yang dipersyaratkan

untuk

tujuan tertentu.

Cutscore yang ditetapkan harus dapat

men-cerminkan ketercapaian kompetensi

mini-mal yang harus dicapai oleh peserta tes.

I(etepatan dalam penefltuan standard setting dapat dilihat dari besar kecilnya error

dalam penentuan standard setting. Semakin besar eror maka dapat dikatakan bahwa

pe-nentuan cutscore

tidak

tepat. Sebaliknya

se-makin

keciT enor maka penentuan cutscore

semalrin tepat. Livingstone

&

Zieky

_Q006,

p.10) menyebutkan bahwa kemungkinan

ke-salahan menggunakan cut score tedetak pada

reliabilitas tes dan metode cat sclre yang di-gunakan. Dalam tes, tidak ada tes yang

sa-ngat reliabel. Tes yang sangat reliabei dapat

ditunjukkan dengan

nilai

alpha Cronbach

sebesar 1 (satu). Demikian juga dengan me-tode cut score, adak ada metode cut score yang

sempnma.

Btla

cat

terlalu tinggi, maka

ditentukan

sehanrsnya

lulus

meniadi

tidak

lulus. Demikian

pula sebaliknya,

bila

cut .nora ditentukan tetlalu

tendah, maka siswa yang seharusnya tidak lulus meniadi lulus. Cut score dapat dinaikkan

maupufl diturunkan. I(onsekuensi dari

me-naikkan atau menurunkan cut score

dapatme-nyebabkan emor serrrakin membesar atau

mengecil.

Metode

Bootstr@ digunakan untuk

mengestimasi kesalahan pada pengukuran.

Metode

Bootstr@ banyak diterapkan pada

ilmu

statistik untuk mengestimasi kesalahan

pada populasi yang kecil atau populasi yang

jumlahnya

tidak

diketahui.

Asumsi

yang

mendasari metode Bootstr@ adalah

keinde-pendenan datanya (Guan, 2003, p.72).

Me-tode Bootstr@ dilakukan dengan mengambil

sampel dari populasi dengan pengembalian. Penelitian

ini

dilakukan untuk mengestimasi

kesalahan pengukuran dengan

mengguu-kan metode Bootstr@.

Di

sisi

lain,

pendidikan

SMI(

me-nyiapkan peserta didik

untuk

siap

te{un

di

dunia usaha sesuai dengan standar

pendidik-^rLyarug ada. Peningkatan kualitas

pendidik-an

di

SMK

Progtam

Studi

I(eahlian

Ke-uangan Kompetensi Keahlian Akuntansi di

samping mengikuti standar pendidikan yang

sudah ditetapkan,

juga mengikuti

Standar

I{ompetensi

I(e{a

Nasional Indonesia. Bagi

pendidikan

di

SMK

I(eahlian

Akuntansi, penetapan standar ini penting karena bidang

peke{aan iulusan

SMI(

I(eahlian Akuntansi

diatahkan

di

bidang keuangan. I(esalahan

yang

te{adi

dalam menginput satu transaksi

saja akan mengakibatkan kesalahan pada

lapotan keuangan yang menjadi salah satu

pertimbangan

bagl

perusahaan maupun

stakeholder dalar";, pengambilan keputusan.

I(onsekuensinya,

kudkulum

pendidikan

SMI(

i(eahlian

Keuangan

ini

disusun

de-ngan

memperhatikan standar pendidikan

dan standar dunia usaha.

Dihatapkan, lulusan SMI( dapat

lang-sung beketja

di

dunia usaha sesuai dengan

kompetensi yang dimiliki. Flal

ini

didukung

oleh pola

pendidikan

di

SMK

yang lebih

banyak menekankan pada

praktik

ketja

in-dustti

di

samping mendapatkan

materi

di

kelas. Praktik kerja industri bertujuan"

^g

r

$ore y?ng siswa yang

(7)

siswa

memiliki

bekal dalam memptaktikan materi-materi yang diperoleh

di

kelas.

Per-masalahan

yang

dihadapi dalam

praktik

ke{a

industri

adalah

tidak

banyak industri

mau

memberikan pelatihan kepada siswa sesuai dengan bidang keatrliannya.

Permasalahafl

yang dihadapi

dalam

dunia pendidikan

di

Indonesia adalah

pe-fletapan cutscore sebagai penentu kelulusan

belum

didasarkan atas salah satu metode

standard setting dan belum pernah diestimasi

besarnya kesalahan penentuan cat sclre.

I(esalahan pengukulan muncul ketika

kerangka konseptuai yang menganggap

bah-wa

konstruk

yang

diukur

adalah invarian

atas beberapa

kondisi

pengamatan (I{ane,

201A,p.7). Dengan kata lain dapat dikatakan

bahwa terdapat deviasi dari sesuatu diukur

dengan konstrrrk yang men)'usrlnnya. Teori

pengukuran berkaitan dengan

pengembang-an tolok ukur atau instrumen dengan

bantu-an seorang analis sistem atau peneliti yang

dapat mengukur atribut suatu

entitas/feno-mena/sistem

yang

diteliti

(Chadha, 2009,

p.5). Dalam pengukuran, tidak semua

atri-but

yang

diukur/diwakili

secara sempuma mewakili konstruknya.

Setiap

pengukuran

yang

dilakukan

akan

memiliki

kesalahan

(eno).

Mardapi

(2008,

p.2)

mengungkap bahwa kesalahan

vang terjadi pada

pengukuran

di

bidang

ilmu

alam

lebih

sederhana dibandingkan

dengan

ilmu

sosial. I(esalahan pengukuran

pada ilmu alam lebih disebabkan karcna alat

ukurnya, sedangkan kesaiahan pengukuran

pada

ilmu

sosial dapat diakibatkan karena

alat ukurnya,

c tz

pengukurannya, dan

ob-jek yang diukur.

Senada dengan Mardapi (2008, p.2),

Nichols, Twing,

&

_{Mueller Q0L0, p.15)}

me-n1'atakan

bahwa

masalah

yang

dihadapi

proses pengukuran dalam ilmu sosial adalah

tidak adanya indikator _)ranglangsung dapat

mengukur

atribut

yang ahan

diukut.

OIeh

karena

itu, ilmu

sosial menggunakan

struk-tur

data

unruk

mengukur

atribut

laten.

Untuk

memecahkan masalah

ini,

maka

Nichols,

Twing,

&

Mueller,

(2010, p.15)

mengajukan tiga pendek^tanya;ltr (1) sabject-;entered approacb, (2) stiruulus-centered approach,

Jtrnal Penelitian dan Eulaasi Pendidikatt

dan (3) re sp o n s e - ce n te re d app ro a c lt. S u bj e c t- ce n le re d

@proach bertujuan rintuk menskalakan orang

sehubungan dengan attribut laten.

Stimulus-centered approach bertujuan

unnrk

menskala-kan tangsangan. Sedangkan respon.re-centered approach bertujuan untuk menskalakan orang, stimuli atau keduanya.

I(esalahan pengukuran dapat diterima apabila kesalahan pengukuran tersebut

me-rupakan

kesaiahan

yang paling

minimal.

I(esalahan yang paling

kecil

menunjukkan

bahwa objek yang diukur memiliki

kesesuai-an dengan konstruknya dar. dapat dikatakan

bahwa alat

ukur

tersebut handal.

Alat

ukur

yang handal akan memberikan hasil yang

konsisten apablla

alat

tersebut digunakan berulang-ulang.

Cohen,I(ane,

&

Crooks (1,999, p.359)

menyebutkan

bahwa

kesalahan dalarn cut

.nara bersumber

pada

dua

hal yattt

error inherent in tbe estimatian of the equating relations

dan the sampling enor associated with the selection

oJ rater.

Error

inherent

in

the estitnation of lhe

equating relations teriadi ketika proses

pene-tapan

standar dilakukan secara

beruiang-uiang oleh penilai

yang sarna. Setiap kali

peruiangan

penilaian,

penilai

beristirahat sejenak dan mendiskusikan hasil penilaian-nya. tsLal

ini

menyebabkan hasil penilaian

bedkutnya tidak independen karena penilai

telah

terpenganrh

oleh

hasii

diskusi yang dilakukan. The sampling error assodated with the selection of rater terjadi ketika rater berbeda menilai peketjaan siswa. Hasil penilatan rater

yang satu akan berbeda dengan penilaian hasil rater yang lainnya. Selanjutnya, Cohen,

Kane,

&

Ctooks (1999, p.360) merumuskan

standard erylr lneaswement

(SEN\

sebagai de-ngan mmus sebagai berikut.

sEM(q

=

+

'li

C

adalah

cut

score

ke C,

6.

merupakan

deviasi standar estimasi dan

n

merupakan

banyaknya replikasi cut score.

Estimasi error pengtrktxan dapat di-lakukan dengan mendasarkan pada

gefiera-liTed analtsis of couaiance stnrcture model yang

dikembangkan oleh Joreskog (1.974, dalam

\Mhitely, _1,97_9,_p.1._44)._Pada_{dasarny a,}_model

Joreskog berusaha

untuk

mereproduksi

Perbanditryan E.stimasi Kesalahan Pergukaraa Staadard... _- ₇₇₉

(8)

Jarnal Pemlitian dan Eaaluati Pendidikan

matfiks kovarians dengan rumus struktural

X

=

l(D,t' + V2.

Dalam model

kovarians

ulnum, ururtan dari A,

@,

_dan

y

_lebih_kecil

atau sama dengan urutan

dafi

I.

Tiga tipe

dan panmeter mungkin terkandung dalam

tetbatas. Patametet

tetap

dan

tetbatas adalah spe sifikasi model.

Feldt, Steffen,

&

Gupta (1985, p.353)

mengajukan

lima

macam metode

untuk

mengestimasi kesalahan baku yaitu sebagai

berikut.

Pertama

teod

klasik yang

dikemuka-kan oleh Lord

&

Novic. Estirnasi kesalahan

baku dengan menggurlakan

teori

klasik

di-peroleh dengan menggunakan rumus

seba-gai berikut:

sr =sr(1 -r**,)7/2.

I(edua, Pendekatan Thotndike.

Pend-ekatan Thorndike mendasarkan pada teori

tes klasik. Estimasi kesalahan baku dengan

menggunakan pendekatan Thomdike

diper-oleh

dengan menggulakan

rumus

sebagi

berikut.

Xr=TrlEr-I(etiga,

Pendekatan Polinomial.

De-ngan menggunakan pendekatan ini,

kesalah-an estimasi diperoleh dengkesalah-an menggunakkesalah-an rurnus sebagai berikut:

? = ao + ar(x)

*

a2(xz)

*

a3(x3)

*

aa(xa).

I{eempat, Pendekatan binomial Lotd:

modifcation l(eats. Pada pendekatan ini, indi-vidual

i

dipandang mampu menjawab

pro-porsi

tettentu,

@, dari keseluruhan butir.

Dengan konseptualiasi

ini,

skot

examinee

i

pada satu bentuk tes analog dengan

pethi-hrngan frekuensi dari kejadian fenomena _Q

dalam random sample dad unit-unit ,€. Rumus

s,

=

[(1=)

(frf)]'/'

d'go,, k^nuntuk

mengestimasi kesalahan pengukuran.

I(elima,

Pendekatan

binomial

Lord:

compound binomial. Formula yang digunakan

dalam pendekatan ini adalah sebagai berikut.

Se(i):

lZ'n=r@]'/'

Cowel,

\7.R.

(1991, p.2) menguraikan

empat metode untuk mengestimasi

kesalah-180

-

Volume 19, Nomot 2, Desember 2015

an baku pada pengukutan. I(eempat metode

tersebut adaiah

(7)

Macbed

half

*st

(split

halues), _{Q) Inm}response theory

(KI),

_Q)

Roo-donfi

parallel

forns

(binoruial),

(4)

Matched paralk I

fom

(conpound binonial).

Estimasi errlr pengukutan juga dapat

dilakukan dengan mendasatkan pada

genera-liryd anafiis of coaaiance struclure model yang dikembangkan oleh Joreskog (7974, dalam

\7hitely, 1979,p.1,43). Pada dasarnya, model

Joreskog

berusaha

untuk

mereproduksi

matriks kovartan dengan rrlmus struktural:

X

=A

o

'+

l{2

Estimasi effzr pengt)kuran juga dapat

didekati dengan metoda Bootstr@. Bootstr@

merupakan pendekatan noflparametrik yang

mengijinkan seseorang

untuk

menghindar dari perhitungan teoritis (Guan, 2003,p.72).

Hal

ini

berdasatan asumsi bahwa sampel

yangada merupakan representasi dari

popu-lasi. Dengan menggunakar Bootstr@,

estima-tor

bias, varians, dan statistik latnnya dapat

dihitung.

Can

yang dilakukan untuk

meng-estimasi

populasi

dengan

menggunakan

Bootstr@ adalah dengan mengambil sampel

dan data asli dan mengembalikannya lagi.

I(esalahan

baku pada

metode

Boot-strap dapat

dicari

dengan

menggunakan rumus sebagai berikut (Efton,

&

Tibshirani,

1,993.

p.a\.

1 B .l/z

tHl

\b=1 )

Dengan

P*

=

parameter

populasi,

B =

bany akny a r e s amp el y ang

dilakukan,

dan

6.(')

:

Z!u=ri.(D/B

merupakan nilai mean

sederhana dar, 6. 711, 0- (z) ... 0. _@)

Dalam penelitian ini, metode Bootstr@

digunakan

untuk

mereplikasi cut score yang diperoleh melalui metode Angoff, Ebei, dan

Bookmark. Cut score mempakan

fokus

da-lam

penetapan standar.

I(neria

seseorang

akan selalu dikaitkan dengan standat

rnini-mal yang ditetapkan. Seperti kelulusan ujian,

penerimaan pegawai, penerimaan kredit, dan sebagainya. Dapat dikatakan bah.wa cut

Jclre merupakan

titik

batas

y^fig

dapat

menggolongkan peserta tes ke dalam bebe-rapa golongan seperti lulus atau tidak iulus,

(9)

Penggolong-an examinee irri tergantung pada kepentingan dan tujuan diselenggarakannya tes. Dengan

demikian setiap bidang, setiap negara

me-miliki

cilt score yang tidak sama.

Bejar

(2008,

p.2)

mendefrtistkan cat

score sebagai

skor

yang mengklasifikasikan

siswa yang belum mencapai scorelevel1 dan

siswa yang memiliki skor

di

atas L. Cut score

yang digunakan untuk memisahkan

kemam-puan

siswa merupakan

hasii dari

Standard

utting. Dalam konteks standard setting cat Jczr€

mempakan salah satu komponen kunci.

Metode

Penelitian

ini

merupakan penelitian

kuantitatif. Sumber data yang

digunakan dalam penelitian

ini

adalah respon peserta

didik SMK

daiam

Ujian

Nasional Praktik Akuntansi tahun pelaiaran 201,1,/2012

seba-nyak 338 siswa

di

Daerah Istimewa

Yogya-karta.

Guru-guru

yang

dilibatkan

dalam

FGD

be{umlah

sembilan orang yang me-menuhi persyaratan sebagai

berikut

(1) ahii

dalam bidang yang

berhubungan dengan

ujian;

Q)

terbiasa dengan metode-metode

ulian; (3)

dapat memecahkan masalah

de-ngan baik; (4) terbiasa dengan 1eve1

kandr-dat; dan

(5)

tertarik

dengan pendidikan

G*);

(6) telah mengajar minimal 5 tahun;

(7) mengajar

di

kelas 1,2 dan 8) lulusan dari

program studi Ekonomi/Akuntansi. Teknik

analisis dalam penelitian

ini

dibagi ke dalam

tiga tahap. Tahap pertama yaitu persiapan.

I(egiatan pada tahap irri mencakup

penyap-an

data, penggolongan

SMI(,

dan meneliti

karaktedstik

butir

dengan

menggunakan program Quest dengan L parameter logistik

(lPL).

Tahap kedua

yaitu

FGD.

Sebelum

dilakukan

FGD,

guru-guru

dilatih

dalam menentukan cut score. Hal

ini

bertujuan agar

guru

memiliki

persepsi

yang

sama dalam

menentukan rut score.

FGD

dilakukan dalam

dua putaran. Dalam putafan pertama,

pesef-ta

FGD

diberi pelatihan dalam menentukan

cttt

sczre

dengan

menggunakan metode

Angoff,

Ebel, dan Bookruark. Pada putaran

kedua, peserta

FGD

menentvk^n

cut

Jclrs

namun

tidak

diberi

pelatihan

lagi.

Tahap

ketiga yain: mengestimasi kesalahan

peng-ukutan dengan menggunakan Bootstr@.

Esu.-Jurnal Peulitian dan Eaahta:i Peilidikan

masi kesalahan pengukuran dilakukan de-ngafl. menggunakan ptogram R.

Hasil Penelitian

dan Pembahasan

Tingkat kesulitan

butit

pada

peneliti-an

ini

dianalisis dengan menggunakan

prog-ram Quest. Tingkat kesulitan butir untuk 74

butit

(6

butir

jurnal,

39

butir

buku

besar,

dan

9

sjklus akuntansi) pada penelitian

ini

diperoleh

dengan menggunakan program puest.

Tingkat

kesulitan pada output puest dapat dilihat pada DIFF. Hasil analisis puest untuk butir jurnai disajikan pada Tabel 1.

Tabel

1.

Tingkat I(esulitan ButirJurnal

Kriteria No Butir

Jumlah

% Mudah (<-2)

Baik

(-2 <x<2)

Sulit (>2)

Tingkat

kesulitan

butir

pada

buku besar diketahui terletak

di

antam

-4

sampai

4. Jurnlah soai yang tergolong mudah pada

butir

Buku

Besar adalah

3

butir

_Q,69o/o),

butir

yang

tergolong

baik

berjumlah

32

butir

(82,05o/o), dan

butil

yang

termasuk

dalam golongan butir yang sulit berjumlah 4

butit

(10,26%). I(eseiuruhan tingkat

kesulit-an butir disajikan padaTabelZ.

Tabel2.

Tingkat I{esulitan Butit Buku

Besar

Kdteda

No Butir _Jurnlah Yo

Mudah (<-2)

Sedang (-2 <x<2)

2,10,23

1.,3, 5, 6,8,9,1.3, 14,75, 1.6,77,1.9,

19,21,22,24,26

4,'/ _,1.L,1,2,20,25

Jurrrlah

3

17

6

2(t

11,54 65,38

23,08 100

Sulit (>2)

Jurntah

17,23,33

07, 02, 04, 06, 07 ,

08, 09, 10,1.L,1.2,

73,1,4,15, 16, 18, 1,9,20,27,22,25,

26,27,28,29,30, 31,32,34,35,36,

38,39 03,05,24,37

J

32

7,69 82,05

1,0,26

100 4

39

Perl.tanditryar Estinati Kesalaban Pengukuran Slatdard

. -

₁₈₁ [image:9.595.336.547.287.402.2]

(10)

Jtnnal Penelitian dan Eulaati Pendidikan

Pada butir-butir siklus akuntansi tidak

tetdapat soal yang mudah.

Butir

yang ter-golong baik betjumlah 7 butir _{Q7,78Yo), darr}

soal yang tetgolong sulit be{umlah

2 butir

Q2,22o/o). Tabel 3 menunjukkan rangkuman

butit menurut tingkat kesulitan butir.

Tabel3.

Tingkat I(esulitan Butir Siklus

Akuntansi

Kdteda No

Butit

_lundah %

Tabel

4.

Data Cut Score

Putaran 1 Putatan2

Angoff EbeI Booknark Argoff Ebel Booknark

7

72,00

58,48

51,30

72,00 58,53 51,00

2

68,00

33,99 69,04

67,00

37,00

69,L7

3

72,00

68,05

73,33

73,00 69,25 76,58

4

73,00

68,20

76,50

72,00 69,20 73,71.

5

70,00

69,80

78,50

70,00 69,00 78,50

6

64,00

59,70

47,29

60,00 59,20 50,88

7

54,00

50,90

59,00

60,00 53,10 59,00

8

73,A0

57,45

59,96

73,00 59,15 54,98

9

70,00

70,4L 57,04

67,00 69,39 41,99

Rerata 68,44

59,64

63,44

68,22

60,20

67,63

St.l

; _

6,1.3 1.7,78

77,28

5,79

10,51

13,17

oev

Tabel5.

Sampei Cut Score

E

Putaran

1

Pttaran2

E, Angoff E,beI Booknark

Ar$off

E,bel Boobzark

\

72,00

58,48

51,30

72,00

37,00

51,00

2

72,00

68,05

69,04

73,00

69,20

69,17

3

70,00 68,20

73,33

72,00

69,00

73,77

4

64,00 59,70

79,50

60,00 59,20

50,99

5

54,00

50,80

47,29

60,00

53,10

58,00

6

73,00 57,45

58,00

73,00

59,75

54,98

7

70,00

70,41

57,04

67,00

69,39

41,99

Pengambilan sampei dengan

pengem-balian

(x-)

dilakukan pada masing-masing

sampel cl,tt sczre

(x) untuk

masing-masing

metode. Pengambilan sampel tersebut di-Iakukan sebanyak 200 kali dan pada masing-masing pengambilan dicati standatd

deviasi-fiyz-. Bootstr@

tetsebut dilakukan

dengan

menggunakan program

R

i386 3.0.0. Tabel

6 memrnjukkan kesalahan pengukuran yang

te{adi ketika pengambilan sampel dilakukan

sebanyak 200kalt

Tabel

6.

I(esalahan Pengukuran

I{etetangan

Rata-rata

I{esalahan firt

JCIw

Pengukuan

(200

kali)

Bootutrap (200 kali)

Mudah (<-2)

Sedang

01,02,03,04,

(-2

<x<2)

05, 06, 07

Sulit

(>2)

08,09 Jurnlah

0

17,78o/o

)2 )ro/^ 100%

Pelaksanaan penentuan Cutscore

dia-wali

dengan memberik^fl

p^p^r^n

terkait

dengan pengertian dan tujuan standard setting

instrumen yang digunakan, dan analisis data

dengan menggunakan metode

Angof{ Ebel

dan Bookmark. Balnar-bahar, diskusi yang

dibagikan kepada peserta

terdid

dari

pen-jelasan tentang standard setting

rlund

dzwn

standard

ulting

lembar jawzban panelis

un-tuk

masing-masing metode standard setting

standar kompetensi lulusan (SKL), soal

uji-an

ptaktik

kejuruan,

rubrik

penilaian, dan

ordered item booklet (OIB).

Setelah

penjelasan

tentang

materi

standard setting peserta bedatih standard utting

di bawah bimbingan peneliti. Setelah

peser-ta berlatih, nilai-flipeser-tai yang ada disimulasikan

dengan menggunakan program Exceil.

Sete-lah bedatih standard setting,pesefia kemudian

meiakukan standard setting pataran pertama

dan putaran

kedua

untuk

masing-masing metode.

Cut score yang dif',etoleh dengan

meng-gunakan metode

Angoff, Ebel,

dan

Baok-mark tampak pada Tabel 4. Data pada tabel

4

kemudian dijadikan sebagai populasi

un-ntk

Bootstr@. Sampel yang

diambil

secara

dari

populasi

tersebut

di

atas berjumlah

tujuh buah. Hasil pengambilan sampel tam-pak pada Tabei 5.

2

9

Putaran Angoff

1

Ebel

Bookmark

Putaran Angoff

2

Ebel

Boakruark

67,903 67,960 67,960 67,809 59,034

57,022

2,429 2,419 4,267 2,702 4,004 4,042

[image:10.595.361.577.632.756.2]

(11)

Cul score yang tinggi

ini

dapat

meng-gambatkan kemampuan/kompetensi siswa

yang

sebenarnya dalam mengelola akun-tansi. Hal

ini

mengingat bahwa dalam drinia

usaha, akuntansi memegang peranafl yang

cukup penting. I(esaiahan yang terjadi pada

tahap-tahap akuntansi akan mengakibatkan

penrsahaan

merugi

batrkan

gulung

tikar.

Demikian pula sebaliknya, ketepatan dalam

mengelola akuntansi menjadikan

perusaha-an

dapat menFrsun s'rrategi dengan baik,

menggaji karyawan tepat waktu, melakukan

diversifikasi usaha, dan sebagainya.

Pencapaian

kompetcnsi

akuntansi

yang tinggi tersebut menuntut perbaikan

pa-da kurikulum)

s^tarr

dan prasarana, proses

pendidikan, kualitas guru.

I{urikulum

yang

digunakan dalam

SMI(

perlu mengacu pada

kebutuhan

dunia

usaha.

I(onsep

link

and

rtatch dalam pendidikan kejuruan

menyela-raskan kebutuhan dunia usaha dengan dunia

pendidikan.

Agar

konsep

link

and natch

dapat berjalan dengan baik, maka perlu ada

komunikasi

^rrj:ar^ dunia usaha

dan

dunia pendidikan.

Dalam

praktik,

terkadang terjadi

ke-ri.dakselaras^n aflta;ra dunia usaha dan dunia

pendidikan. Sebagai

contoh,

ketika

siswa

melakukan ptaktik kerja lapangan (PI(L)

ba-nyak dunia usaha yang mengalihkan siswa

program keahlian akuntansi ke bidang

lain-nya

seperti sekretariat, tenaga peIrusaran

dan

sebagainya. Banyak perusaha

n

y^ttg

menganggap bahwa keuangan menrpakan

rahasra perusahaan

dan tidak

boleh

sem-b arzng orang mengetahui.

Sarana dar' prasarana pendidikan yang

dimiliki oleh

sekolah

periu

ditingkatkan.

Berdasarkan

suwei yang

diiakukan

oleh peneliti, banyak sekoiah yang tidak memiliki

sarafla dan prasarata yaflg memadai untuk

pembelajaran akuntansi.

Banyak

sekolah

yang memiliki kelas terbatas yang

mengaki-batkan sekolah tidak memiliki laboratodum

akuntansi.

Di

samping

rt.t

alat-alat

pembel-aiaran yang zda

di

sekolah kejuruan sangat

minim.

Mintmnya s^rafla dan

prasarat

yafig

ada akan berakibat pada proses

pembelajar-^n

y^trg kurang

optimal dan

berdampak

Jurnal Penelitian dan Enlaai Pendidikan

pada rendahnya kualitas lulusan kejuruan.

Oleh

karena

itu,

di

samping guru dituntut

lebih kreatif

dalam membelajarkan

akun-tansi kepada si.swa, guru juga

pedu

mem-perkenalkan

praktik-praktik

akuntansi dan

membawanya

di

dalam keias.

Oleh

karena

itu,

kreativitas guru

periu

ditingkatkan

de-ngan memberikan pendidikan dan pelatihan

yang baik.

I(ondisi-kondisi tersebut

di

atas perlu

menjadi perhatian

dan

pertimbangan pe-merintah meningkatkan kualitas pendidikan.

Pemerintah hendaknya

perlu

membedkan

perhatian lebih kepada sekolah-sekolah yang

kualitasnya masih di bawah standar.

I(esen-langan arrtzr? dunia usaha dan dunia

pen-didikan dapat diperkecil dengan adanya

ko-otdinasi

^rrtarz- kementerian

yang

terkait.

Pemerintah juga perlu memberikan kontrol

terhadap sekolah-seholah khususnya

seko-lah kejuruan baik administrasi, tenaga

pen-didik dan kependidikan, proses pembelajar-an melalui dinas pendidikan

di

kabupaten/ kota.

Besamya estimasi kesalahan

peng-ukuran

untuk

setiap metode standard selting

berbeda-beda. Pada putaran pertama untuk

200 kali Bootstrap, estimasi kesalahan

peng-ukuran pada metode

Angoff

sebesat 2,429

dengan mean sebesar 67,903, metode Ebel

sebesar 2,41,9 dengan mean sebesar 61,960,

dan metode Bookmark sebesar 4,267 dengan

mean sebesar 61,960. Pada putaran kedua

rrntuk 200 kali Bootstrap, estimasi kesalahan

pengukuran pada metode

Angoff

sebesar

2,1,02 dengari mean sebesar 67,809, metode

Ebel

sebesar 4,004 dengan mean sebesar 59,034, dan metode Bookmark sebesar 4,042 dengan mean sebesar 57,02L.

Flasil penelitian

ini

berbeda dengan

penelitian yang rlilakukan

oleh

Premastuti,

N.B.

(2010, p.230) yang menyatakan bahwa

metode Bookruark lebih

akuat

dibandingkan

dengan

metode

Croup Contra.rl. Memrrut

Premastuti _Q01,0,p.230), metode Bookmark

lebih baik katena dalam prosedurnya

mem-pertimbangkan

(1)

parameter

tingkat

ke-sukaran

butir

dan (2) estimasi panelis dalam

mengestimasi tiap

butir

dengan respon

pro-babilitas tertentu.

Perbandingan Estimasi Kesalaltat Petgtkuran Standard... _- ₁₈₃

(12)

Jurnal Penelitian dan Etaluasi Pendidikan

Hasil penelitian

ini

juga berbeda

de-ngan penelitian

ylng

dilakukan oleh

\7ida-yati

_Q009,p.182).

lTidayati

(2009, p.182)

menyatakan

bahwa metode

teori

respon

butit

merupakan metode yang paling tepat

untuk

mengestimasi kesalahan pengukuran perangkat soal

uji

coba u]ian nasional mata

pelzjann

Biologi SMA tahun

pelajaran

2007 /2008.

Ada

beberapa penyebab perbedaan

hasil penelitian

ini

dengan dua penelitian di

^t^s.

Pettama, penyebab

yang

berkaitan

dengan sampel. Sampel dalam penelitian

yang dilakukan _{oleh Ptemastuti Q01,0,225)}

dan _{Widayau Q009,p.192) merupakan}

sam-pel yang diambil dad populasi. I(etika

sam-pei yang diambil besat, maka hasilnya dapat menggambatkan patameter populasi. Dalam

peneJitian ini, sampel yang digunakan bukan

diambii dad

populasi

melainkan resaruple

(Efton

&

Tibshirati,

7993, p.45).

I(esalah-an pengukuI(esalah-an

pada penelitian

ini

akan

menunjukkan

hasil yang betbeda

apabtTa

jurnlah sampel dan resampelnya ditambah.

Mengingat

jumlah

sampel yang digunakan

dalam penelitian

ini

tergolong sedikit, maka variasi resampelnya juga

relatif

_{sedikit. Jika}

sampel penelitian ditambah, maka

resample-nya akan sangat bervariasi dan

menghasil-kan kesalahan pengukuran yang berbeda.

Perbedaan besaran kesalahan

peng-uknran

pada metode Bootstr@ disebabkan

karena jurnlah sampel yang digunakan relatif

sedikit. Jurnlah sampel akan sangat

mempe-ngaruhi variasi data dalam penelitian. Apa-bila sampei yangada dilakukan pengamApa-bilan ulang dengan pengemb ahan, maka data yang diperoleh tidak memiliki banyak vadasi.

Hasii

estimasi kesalahan pengukutan

dipetoleh dengan cara {rcrrg

mbil

sampel

(x-)

dad

sampel asli (x). Resample tersebut dilakukan sebanyak 200 kali dengan bantuan

progtam R. Hasil resarQle

untuk

setiap kali

Bootstr@ akan berbeda, namun hasil kesalah-an pengukuan tidak jauh berbeda.

I(edua, penyebab yang berkaitan

de-ngan penilai. Besar/keciirrya estimasi

kesa-lahan pengukuran tergantung pada kemam-puan penilai, dalam hal

ini

adalah guru,

da-lam memprediksi kemampuan siswa.

Grru

184

-

Volume 19, Nomor 2, Desember 2015

yang

memahami kemampuan siswa akan

dengan

mudah

memptediksi kemampuan

siswa dengan tepat. Pemahaman

guru

ter-hadap kemampuan siswa terjadi ketika guru

sering berdiskusi dengan siswa tentangrn ta

pelajaran ataupun pengetahuan yang

lain-nya.

Hasil perhitungan estimasi kesalahan

Angoff

lebih kecil

daipada metode

Ebel

dan Bookmark. Ha)

ini

dikarenakan

penenttan

cut score pada

metode

Angoff

lebih mudah daripada dua

metode lainnya. Pada metode

Angoff,

guru

diminta untuk

mengestimasi kemampuan

siswa dalam menjawab pett^rry^ rt yang

di-ujikan.

Pada metode

Ebei, gurlr

diminta

unnrk memprediksi tingkat kesulitan,

ting-kat relevansi

butir

dan menentukan

propor-si siswa yang mampu menjawab

butir

pada

tiap se1. Sedangkan pada metode Bookmark,

guru

diminta

untuk

mengestimasi

kemam-puan siswa tetlebih dahulu sebelum

menen-hrkan batas kelulusan.

Metode penelitian yang dilakukan

!7i-dayati Q009, p.192) tidak melibatkan guru

dalam mengestimasi kesalahan pengukuran.

\Tidayati,

'S7. menggunakan

data

berupa respon siswa terhadap perangkat soal

Biolo-gi tahrrn pelajatan20AT _{/2008. Data tersebut}

digunakan

unruk

mengestimasi kesalahan

baku

pengukuran dengan

menggunakan

enam metode.

Dari

kedua penyebab tersebut diduga

menyebabkan hasil yang betbeda

baik

da-lam pemilihan metode standard setting

rrrav

pun

dalam pemilihan metode

kesalahan

pengukuran.

Untuk

membetikan dukungan

bahwa metode Bootstr@ memberikan hasil

estimasi kesalahan pengukuran yang lebih

kecil, maka dilakukan pembandingan hasit

estimasi

kesalahan

pengukuan

dengan

menggnnakan metode Keatl Modfication.

Hasil

estimasi kesalahan pengukuran

pada beberapa metode standard selting

de-ngan menggulrakan metode Keats'

Madfica-tion tarnpak pada Tabel 7. Putatan pertlrna,

metode

Keats' Modfication menghasilkan

estimasi

kesalahan

pengukuran

metode

Angoff

sebesat 3,292 dengan meafi sebesar

(13)

mean sebesar 61,,960, dan metode Bookmark sebesar 4,418 dengan mean sebesar 61.,960.

Pada

putaran

kedua,

estimasi kesalahan

Angoff

sebesar

3,314 dengarr mean sebesar 67,809, metode

Ebel

sebesar 4,809 dengan mean sebesar 59,034, dan metode Bookruark sebesar 5,033 dengan mean sebesar 57,022.

Tabel

7.

Perbandingan I(esalahan

Pengukuran Bo otstrap dengan

I(eats' Modification

Kesalahan

I(esaiahan

Penguliuran Penguliuran

t1'eterangan

siotrtrrp

K.u,.'

(200

kaii)

Modification

Ansoff

Putaran

Ebei

1.

Bookmark

Ansoff

Putaran

Ebel

2

Bookmark

.lnnal Petelitian dar Eyalaasi Pendidikan

berkaitan

dengan

distribusi

sampel yang

diambil. Semakin banyak sampel yang di-ambil dari populasi maka distdbusi

sampel-nya akan mendekati normal. Pada metode

Bootstrap, semakin banyak Bootstr@

dilaku-kan,

maka

hadl

Bootslrap akan mendekati populasinya.

Distribusi binomial merupakan

distri-busi dari

n

petcobaan bethasil/gagal yang saling bebas. Pada disuibusi binomial,

umt-an observasi menrpakan kejadian

rndepen-den, dan probabilitas sukses dinyatakan

de-ngan

"p"

(Subiyakto, 1,995, p.45). Distribusi

binomial

seringkali digunakan

untuk

me-modelkan jurntah keberhasilan pada jumiah

sampel n dad populasi N.

Perhitungan estimasi kesalahan

peng-ukuran Keats' Modfication mempertimbang-kan probabilitas jawaban benar dan proba-bilitas jawaban salah.

Di

samping itu, mmus

Keats' Modifcalion _iugamempertirnbangkan

reliabilitas soal.

Hal

ini

berbeda dengan

SEN{. Pada SEM,

ptoporsi

jawaban siswa

dan reiiabilitas soal tidak dipertimbangkan.

Namun

demikran, apabtla

dilihat

dari

ke-salahan pengukuran

yang

dihasilkan,

me-tode Bootstr@ menghasilkan kesalahan

peng-ukuran yang

lebih kecil

dibandingkan de-ngan metode Keats' Nlodfication.

Berdasarlian hasil estimasi kesalahan

pengukuran,

metode

Angoff

merLlpakan

metode yang lebih baik untuk menentukan

cat rczre dibandingkan metode Ebel maupun

Bookmark.

Hal

tersebut

ditunjukkan

oleh

hasil

estimasi kesalahan pengukuran pada

Angoff lebih kecii

_Q,1,02dengan

meng-gunakan Bootstrap, dan 3,314 dengan

meng-gunakan Keats' Modtfcatioru) dibandingkan

dengan metode

Ebel

(4,004 dengan

meng-gunakan Bootstrap, dan 4,809 dengan

meng-gunakan l(eats'

Modtfcaliof marpun

Book-mark (4,042 dengan menggunakan Bootstr@,

dan 5,033 dengan menggunakan Keats'

Modi-fcation).

Hasii

ini

sejalan dengan pendapat dad

Anto

&

Mardapi, (201.3, p.377) yang

menyatakan bahwa bias estimasi pada Yes/

No Angoff

lebih kecii dibandingkan dengan

metode Ebel.

Di

samping

itu,

hasil

estimasi

ke-salahan pengukuran, ketepatan penggunaan

Perbardingan Euiruasi Ketalaltan Petgukarar Standard ... - ₁₈₅

Sebastianus Widaoarto P, Djemari N{ardapi, Budiyono

2,42ct

2,419 4,267

2,702 4,004

4,042

3,292

4,41,8 4,478 3,31,4

4,809 5,033

Pada putar2n

?,

metode Keats'

Modi-fication menunjukkan bahwa rerata estimasi

kesalahan pengukuran pada metode

Angoff

lebih kecil

(3,314) danpada metode Ebel

(4,809) dan metode Bookrnark (5,033). Oleh

karena

itu,

metode

Angoff

menunjukkan

metode yang lebih baik untuk menentukan

cut score karena memberikan estimasi

kes-alahan pengukuran yang

lebih

kecil

diban-dingkan dengan meiode Ebei dan Bookmark.

Pada Tabel

7

tampak bahwa metode

B o o tstr@ dar, Ke a ts' Mo d

tf

ca tio n menunjukkan

hasii yang

sama.

I(edua

metode tersebut

menunjukkan bahwa metode

Angoff

me-rupakan metode standard setting yang lebih

tepat dibandingkan metode

Bbel

dan

Book-tnark

karena

menghasilkan standard error

yang paling kecil. Dengan demikian, kedua

metode dapat digunakan

untuk

mengesti-masi kesalahan pengukuran.

i(edua

metode

estimasi

kesalahan

standar tersebut menggunakan asumsi yang

berbeda.

Metode

Bootstr@ mendasarkan

asumsi pada central

linit

theonn

(CTL)

se-dangkan

metode

Keats' Modfication

(14)

)

Err

Jtrnal Penelitian dan Emhasi Pendidikan

metode standard settingiuga ditunjukkan pada

kemudahan panelis dalam rnenentr;kan cut

score. Metode

Angoff

dan Boo kmark

merupa-kan meode yang mudah

untuk

diterapkan

dibandingkan dengan metode

Ebel.

Pada

rnetode

Ebei,

panelis melakukan estimasi

terkait dengan tingkat kesulitan

butit,

ting-kat

relevansi, dan tingkat kemampuan

pe-serta tes. Banyaknya estimasi yang dilakukan

oleh

panelis dapat

menyebabkan tingkat

kesalahan yang dilakukan semakin banyak.

Betbeda dengan metocie

Angoff

dan

Book-mark, pada kedua metode tersebut panelis

hanya

mengestimasi

tingkat

kemampuan

peserta tes. Namun demikian, pada metode

Bookmark,

ada

beberapa

indikator

yang diestimasi dapat dikerjakan oleh siswa tidak

tercakup dalam halaman Bookmark (R.ejeki,

Matdapi,

&

I(umaidi,

2014, p.94).Semen-tara pada metode

Angoff,

seluruh indikator

kemarnpuan diestimasi oleh panelis.

Sirnpulan dan Saran

Simpulan

Berdasatkan hasil penelitian dan

pem-bahasan yang teiah diungkapkan maka dapat

disampaiJ<an

beberapa

simpulan

sebagai

bedkut.

Pettama,

c//.t sczre

rr-;.Ia

pelalatan

Akuntansi jenjang

SMK

di DIY

yang

<ii-hasilkan dengan

menggunakan metode

Angoff

pada puta;ran 1 adalah 67,86

meng-alami kenaikan yang

tidak

signifikan pada

putaran

2

menjadt 68,1,4.

I(edua,

cxtt yzre

rrrata pelajatan Akuntansi jenjang

SMK

di

DIY

yang dihasilkan dengan menggunakan

metode Ebel pada putaran

1

adalaln 61,87

mengalami penurunan yang tidak signifikan

putaran

2

menjadi 59,15.

I(etiga,

cut score

mata pelajatan Akuntansi jenjang

SMK

di

DIY

yang dihasilkan dengan menggunakan

metode Bookmark pada

putaran

L

adalah

62,07 rnengalami penurunan signifikan pada

putaran 2 menjadi 57,03.

I(eempat, kesalahan

pengtkuran

cut

sclre llaata pelalann Akuntansi jenjang

SMI(

di

DIY

dengan rnenggunakan Bootstrap pada

metode

Angoff

pada putaran

1

untuk

Uji

I(ompetensi

I(ejuruan Praktik

Akuntansi

i 86 - Volume 19, Nomot 2, Desembet 2015

sebesar 2,429. I(esalahan pengukuran pada

putafan pertama

mengalami

perulruIlan yang tidak signifihan sebesar 0,327 men)adt

2,L02 pada putaran kedua. Sementara itu,

kesatrahan pengukuran dengan

mengguna-kan metode l(eats' Modification pada

meto-de

Angoff

putaran pertama sebesar 3,153

rnengalami kenaikan yang

tidak

signifikan

sebesar 0,059 menjadt 3,212 pada putaran

kedua.

I(elima,

kesalahan

pengukuran

cut sczr€ rn^t^ pelalarat Akr.rntansi _JenjangSI\{i(

di

DIY

dengan menggunakan Bootstr@ oada

metode

Ebel

pada putaran

1

untuk

Uji

Kompetensi

l(ejunran Fraktik

Akuntansi

sebesar 2,419. I{esalahan pengukuran pada

putaran pertama mengaiami kenaikan yang

tidak signifikan sebesar 1,586 menjadi 4,004

pada putatan

kedua. Sementara

itu,

ke-salahan pengrtlqv^r, dengan menggunakan

metode

I(eats' Modificaaon

pada metode

Ebel putaran pertama sebesar 4,734 rneng-alarni penurunan yang

tidak

signifikan

se-besar 0,072

menjad"i

4,663 pada putarao

kedua.

I(eenam,

kesalahan pengukuran cul

:clr€ tnat^ _{pelalann Ahuntansi Jenjang}SMI( di

DIY

dengan menggunakan Bootstr@ pada rnetode Bookmark pada plrtaran 1 untuk

Uji

I(ompetensi Kejruuan

Praktik

Akuntansr

sebesat 4,267. I{esalairan pengukuran pada

putaran pertama

iru

mengalami pemrrunan

yang tidak signifii<an sebesar 0,225 nenjadt 4,042 pada putaran kedua. Sementara itu,

kesalahan pengukuran dengan

mengguna-kan metode I(eats'Nlodification pada

meto-de Bookmark putaran pertama sebesar 4,187

mengalami kenaikan yang

tidak

signifikan

sebesar 0,280 menjadt 4,467 pada putaran

kedua.

I(etujuh,

estimasi

kesalahan

peng-ukuran

ctlt sczre yang

paling

tepat

adalah

metode

Angoff

karena memberikan rerata

estimasi kesalahan pengukuran yang paling

kecil.

Saran

Berdasarkan hasil penelitian dan

be-berapa keterbatasan penelitian rnaka saran

(15)

Peftama,

penentuan

cut

score pada

penelitian

ini

hanya

terkait

dengan Ujian

I(eterampilan

l(ejuruan

Ptaktik Akuntansi.

Untuk memberikan gambaran yang

sesung-guhnya, maka penilaran sikap, proses,

ke-rapian, kecepatan dan kebersihan

perlu

di-masukkan dalam

standard setting. I(edua,

perlu

dilakukan penelitian

lebih lanjut

ter-kait dengan cut score tentang penguasaan

ma-teri

akuntansi

di

sekolah menengah

lie-juruan (aspek pengetahuan).

I(etiga, pedu dilakukan penelitian latn

dengan menggunakan metode standard selling

yang berbeda dan menambah panelis yang

berasal

dari

dunia

usaha/dunia

industri

sehingga menghasilkan penelitian yang lebih

baik.

I(eempat, jumlah

panelis

perlu

di-tambah lebih dari sembilan orang agar dapat

menggambarkan

utt

sczre

y^fig lebih

baik

mengingat

paneiis

dalam penelitian ini

berjumlah

9

orang.

I(elima, guru

perlu

memberikan latihan-latihan

soal

praktik

yang bervariasi dan teiprogram agar siswa

benat-benar dapat menguasai praktik

Akun-tansi

dan

meningkatkan kualitas

pembel-ajaran dengan menggunakan berbagai

me-tode pembelajaran yang bervariasi.

Daftar

Pustaka

Alsmadi,

A.

(2007).

A

comparative study

of

two

standarci-setting technique.

Social Behaaior and Personaliry,

38

(4), 479

-

486.

Anto,

S.,

&

Mardapi,

D.

_Q01,3).Komparasi tnetode standard rctting untak penentuan

KKNI mata pelE'aran Matematika kelas

Wil

SMP.

Jumal

Penelitian

dan

Evaluasi Pendidikan.

17 Q).

369

-388.

Beja4I.

I.

(2008). Standard serting: what is

it? why

is

it

important?.

RdyD

Con-nection,7,l

-5.

Berk,

R.A. 0986).

A

consumer's guide to

setting

performance standards

on

criterion-referenced

tests.

Reuiew of

Edwcational Research, 56, (1),1,37

-

1.72.

Jarnal Penelitian dat Euahrai Pendidikan

Chadha,

N.K.

(2009). Applied pychometic.

First

Publishing, India:

Vivek

Mehra

fot

Sage Publication.

Chesser,

A. M.

S., Laing,

M.

R.,

Miedzy-brodzka,

2.,

Brittenden,

J.,

et

aI

Q004). Factor analysis can be a usefi.rl

standard setting

tooi

in

a high stakes

OSCE assessment. Mediml Education,

38, 825

-

831.

Cohen, A.S.,

I(ane,

M.T.,

&

Crooks,

TJ.

(1.999).

A

generalized

examinee-cen-teted method

for

setting standards on

achievement tests. Applied Measurement

in Education,l2(4),343

-

366.

Cowel,

W.R.

0991).

A

procedure for

estimating

the

conditional

standatd

error

of

measufemefl.t

for

GRE

general and subject

test.

GRE Board

Professional Report

No.

87-03P, ETS

Research Report, 91

-

25.

David,

B.

(2000).

AMEE

Guide

No.

18:

Standard

setting

in

student

assess-ment, Medical Teacher,

22

(2),

1,20

-130.

Efron,

B.,

&

Tibshirani,

P.J.

(993). An

introduction to the bootstr@. New York:

Chapman

&

Hall. Inc.

Feldt, L.S.,

&

Steffen,

M.,

&

Gupta C. N.

(1985).

A

comparison

of

five methods

for

estimating

the

standard

ertor of

measurement at specific score model.

Applied Pynlogical Measurement,

9

(4),

351-361.

Guan,

\7.

(2003). F'rom the help desk

boot-stapped

standard

efrors.

The Stata

Journal.3 (1), 71

-

80.

I(ane, M.T.,

&

\7ilson,

J.

(1984). Errors

of

measurement and standard setting

in

mastery

testing. Applied Pychological Measurement S _{9 (1), 107 -11,5.}

I(ane,

M.T.

(1,994).

Validating

the

per-forrnance standards associated

with

passing

score.

fuuiew

of

Educational Reseach.64 (3), 425

-

461,.

Perbandirgan Estinasi Kesaloltar Petgukuran Stardard...

-

_1,87

(16)

Jrrnal Penelitian dan Eaahasi Pendidikan

I(ane,

M.T.

(2010).

Ercar

of

measar€meutt, thearT, and pablic

plliAL

Educational Testing Serwice.

I(arantonis,

A,.

&

Sireci, S.

G.

(2006), The

Bookmark standard-setting method: a

]iteratut

review, Educational Measure-ment: I$iles and Practice, Spri.g, 4 - 12

I(offlet,

S.

L.

(1980).

A

Comparison

of

appoaches

for

setting

proficiency

standards, Jaurnal of Edacation

Measare-ment,1.7 (3),167

-

178.

Lee,

G.

(2000,

24

-

28 Aprrl).

Estimating

reliabiliry and standard error of

medsare-ment

for

complex reading comprehension

tests under generaliqabilifl theory model.

Paper presented

at the

Annuai

Meeting

of

the Amedcan Educational

Research

Association.

New Otleans,

L{.

Livingstone, S.

A.,

&

Ziekv,

M. J.

(1982).

Passing sczre::

a

rnanaa/

for

setting standards of perfonnance on educational and

occupational

tests,

Princeton,

New

Jersey: Educational Testing Sen ice.

Livingstone, S.

4.,

&. Ziel<y,M. _J._Q006).

A

ruanua/ _farsetting standards of perfonuance

on edacational an occtrpational test:.

Prir,-ceton, Nerv _Jersey:Educational Test-ing Service.

Mardapi,

D.

(2008). Teknik Penl/urunan

instru-men tes dan non tes. Cetal<an Perta-rna.Yogyakarta: Ivlitra Cendikia Press,

Nichols,

P.,

Twing,

J.,

&

Mueiler,

C.D.

(2010). Standard-setting methods as

rneasrrrement

process.

Educationa/

Mea.rurement: I$ues and Practice,

29

(1),

I+

-

Z+.

Nudell,

H.

(2008,

Febnrary).

Making the cut

-

the cut sczre, that is establishing a

pass/fail

scote

is

a

highly

technical

process.

ICSC

Certified Professionak i{ew.rletter.

Premastuti,

N. B.

(2010). I{omparasi

stan-datd

setring metoda

Soup

contrast

dan

Bookmark

pada mata pelajann

Akuntansi. Jurual Penelitian dan Euahr-asi Pendidikttn,l,4 (2), 225

-

245.

Rejeki, S., Mardapi,

D.,

&

I(umaidi. _Q01,4). Metode standard setting

untuk

ujian nasional

di

sekolah dasat. _Jarnal

Pene-litian dan E ualuasi Pendidikan. /

I

(/ _),8 9

-

97.

Retnarvati,

H.

(2008). Penentuan batat laht: (standard setling)

ajian

nasional mata pelEaran Matematika

di

DIY.

Laporan

Penelitran. UNIY: PKPSP LP.

Saundets,

J.C.,

Rvut,

_J.P.,

&

Huynh,

FI.

(1980, March

5

-

9).

A

corupaison a' two wals of setting passing scores based ot:

the ncdelskjt procednre. Publication Senes

i:r

Mastery

Tesing.

Soutir Carolina:

University

of

South CatoLina Coilege

of Education Colombia. this Article is

presented at the annual conference

of

the

Eastern Educational

Research

As sociation, Norfolk, Vitgrnia.

Skaggs, G., Hein, S.F.,

&

Awuor, R-. (2007).

Setting passing Scores

on

passage-based test:

a

comparison

of

traditio-nal

and

single-passage Bookmatk

method, Appli€d Measurement

In

Edu-cation.2A

(0,

405

-

426.

Subiyakto,

fi.

(i995). Statistika (inferen) untuk bisnis. F,dtsi ke-1. Cetakan ke-1. Yog-vakarta:

Bagian

Penerbitan sekolah

Tinggi

llmu

Ekonomi.

\7hiteiy,

S.

E.

(i979). Estimating

measure-meflt error

on

highly

speeded tets.

Applied Prychological Measurement,

3

(2), 1,4L-154.

Widayad

\7.

(2009). i{omparasi beberapa

metode estimasi kesalahan

pengukut-an. _JarnalPenelitian dan Eualuasi

Pen-didikan. 13 (2). 182

-

797.

Yfui,

P.,

&

Sconing,

J.,

(2008). Estimating standatd errors

of

cut scofes for item

tating and

mapmatk ptocedure:

^ generaLizability theory approach. E,du-cational and Psltcho lagtcal Measurement, 68

(1).25

-

41.