• Tidak ada hasil yang ditemukan

Kelompok 1 Pengantar Teori Klasik Dan Item Response Theory

N/A
N/A
Protected

Academic year: 2021

Membagikan "Kelompok 1 Pengantar Teori Klasik Dan Item Response Theory"

Copied!
15
0
0

Teks penuh

(1)

PENGUKURAN DALAM PENDIDIKAN

PENGUKURAN DALAM PENDIDIKAN

PENGANTAR TEORI PENGUKURAN DALAM

PENGANTAR TEORI PENGUKURAN DALAM

PENDIDIKAN

PENDIDIKAN

Pengertian dan sejarah

Pengertian dan sejarah perkembangan instrumen pengukuran dalam

perkembangan instrumen pengukuran dalam

pendidikan Teori Klasik dan

pendidikan Teori Klasik dan

Item Response Theory 

Item Response Theory 

Oleh:

Oleh:

Eddy

Eddy Fadillah

Fadillah Safardan

Safardan (No.Reg

(No.Reg 7816140554)

7816140554)

Gama

Gama Santosa

Santosa

(No.Reg

(No.Reg 7816140550)

7816140550)

Maria

Maria Ulfah

Ulfah

(No.Reg

(No.Reg 7816140563)

7816140563)

Ryka

Ryka Kaswati

Kaswati

(No.Reg

(No.Reg 7816140558)

7816140558)

 Wulan Sukmawati

 Wulan Sukmawati

(No.Reg 7816140551)

(No.Reg 7816140551)

PROGRAM PASCASARJANA

PROGRAM PASCASARJANA

PENELITIAN DAN EVALUASI PENDIDIKAN

PENELITIAN DAN EVALUASI PENDIDIKAN

UNIVERSITAS NEGERI JAKARTA

UNIVERSITAS NEGERI JAKARTA

2014/2015

2014/2015

(2)

KATA PENGANTAR 

Puji syukur penulis panjatkan ke hadirat Allah Swt, Tuhan Yang Maha Esa yang telah melimpahkan rahmat dan hidayah-Nya sehingga dapat menyusun makalah ini.

Makalah ini berupa pembahasan mengenai Pengantar Teori Pengukuran dalam Pendidikan: pengertian dan sejarah perkembangan instrumen pengukuran dalam pendidikan Teori Klasik dan Item Response Theory (pengenalan). Makalah ini disusun dalam rangka untuk memenuhi tugas mata kuliah Teori Tes Klasik program pasca sarjana, program studi Penelitian dan Evaluasi Pendidikan (PEP), Universitas Negeri Jakarta (UNJ).

Pembahasan dalam makalah ini penulis ambilkan dari berbagai sumber antara lain: buku-buku yang disarankan, jurnal artikel dan materi-materi dari hasil unduhan di media internet.

Penulis menyadari bahwa tersusunnya makalah ini atas bantuan berbagai pihak dan masih sangat sederhana, oleh karena itu pada kesempatan ini penulis menyampaikan penghargaan dan terima kasih kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam penulisan makalah ini dan semoga semua amal baik mereka menjadikan pahala dihadapan Allah Swt. Untuk itu saran dan kritik yang bersifat membangun sangat penulis harapkan guna penyempurnaan.

Akhirnya penulis berharap semoga makalah ini bermanfaat dan dapat memenuhi tugas dalam menempuh mata kuliah Pengukuran dalam Pendidikan.

(3)

BAB I PENDAHULUAN A. LATAR BELAKANG

Pengukuran dalam Pendidikan merupakan mata kuliah yang membahas teori, konsep, dan metodologi pengukuran dalam pendidikan untuk memahami, melatih keterampilan, mampu menggunakan dan mengembangkan pengetahuan serta membentuk sikap positif mahasiswa dalam pengukuran dalam pendidikan. Ruang lingkup pengukuran pendidikan meliputi pengukuran kognitif, nonkognitif/afektif dan psikomotorik.

Menurut Morgan dan Brown dalam Erawan (2009) tujuan utama dari suatu penilaian secara formatif adalah memberikan informasi kepada peserta tes tentang kekuatan (strengths) dan kelemahan (weaknesses) mereka. Penilaian formatif berfokus pada penyediaan umpan balik kepada peserta tes agar dapat memperbaiki cara belajar dan kinerja mereka. Penilaian formatif memiliki kemampuan untuk memperkaya pengalaman belajar serta memperbaiki kinerja peserta tes. Penyusunan tes pada umumnya menggunakan teori tes klasik (CTT=Classical Test Theory). Tetapi sejak awal tahun 1970 Item Response Theory (IRT) telah menggeser popularitas CTT.. Pengukuran kemampuan dengan menggunakan metode IRT lebih akurat dibandingkan dengan metode CTT karena tidak bergantung kepada kemampuan sampel peserta tes.

B. TUJUAN

Makalah ini disusun memiliki tujuan antara lain sebagai berikut:

1. Untuk meningkatkan kompetensi menulis makalah bagi mahasiswa program pascasarjana.

2. Untuk meningkatkan kompetensi bagi mahasiswa program pascasarjana mengenai Pengantar Teori Pengukuran dalam Pendidikan

3. Untuk memenuhi tugas menyusun makalah mata kuliah Pengukuran dalam Pendidikan program pascasarjana jurusan Penelitian dan Evaluasi Pendidikan (PEP) Universitas Negeri Jakarta (UNJ)

(4)

BAB II ISI

A. SEJARAH PENGUKURAN

Pada zaman dahulu orang menggunakan aanggota tubuh sebagai satuan pengukuran, misalnya jari, hasta, kaki , jengkal , depa, langkah dan lain-lain. Satuan-satuan tersebut bukan merupakan Satuan-satuan baku, sehingga akan menyulitkan bila digunakan dalam komunikasi. Contoh : Seorang A ingin memesan sebuah meja kepada pengrajin B dengan panjang 3 hasta dan tinggi 1 kaki. Apakah panjang hasta dan kaki pemesan A dan pengrajin B sama ?

Hasil pengukuran baru bermanfaat bila menggunakan satuan pengukuran yang baku, yaitu satuan pengukuran yang nilainya tetaqp dan disepakati oleh semua orang untuk dipakai sebagai pembanding.Contoh : galon, yard, inchi adalah beberapa contoh satuan ukuran dalam sistem Inggris. Setelah tahun 1700, sekelompok ilmuwan menggunakan sistem ukuran, dikenal dengan nama Sistem Metrik. Pada tahun 1960, sistem Metrik dipergunakan dan diresmikan sebagai Sistem Internasional (SI). Penamaan ini berasal dari bahasa Perancis Le Systeme Internationale d’Unites.Dalam satuan SI setiap jenis ukuran memiliki satuan dasar, contoh : panjang memiliki satuan dasar meter.

1. Sejarah Tes Intelegensi

Pada abad XIV, di cina, telah berlangsung usaha untuk mengukur kompetensi para pelamar jabatan pegawai negara. Untuk dapat diterima sebagai pegawai, para pelamar harus mengikuti ujian, ujian tertulis mengenai pengetahuan konvusion klasik dan mengenai kemampuan menulis puisi. Ujian ini berlangsung sehari semalam di tingkat distrik. Kurang dari 7% pelamar yang biasanya lulus tingkat distrik kemudian harus mengikuti ujian berikutnya yang berupa menulis prosa dan sajak. Dalam ujian ke 2 ini kurang dari 10% peserta yang lulus. Akhirnya barulah ujian tingkat akhir diadakan di Peking dimana diantara para peserta terakhir ini hanya lulus 3% saja. Lulusan ini kemudian diangkat menjadi mandarin dan bekerja sebagai pegawai negara. Dengan demikian dari ke 3 tahap ujian tersebut hanya 5 diantara 100.000 pelamar yang akhirnya menjadi mandarin.

Di Indonesia testing belum merupakan suatu gerakan nasional, testing sebagai suatu gerakan nasional dicontohkan dengan baik di Amerika Serikat. Di Amerika gerakan testing psikologis berkembang sejak awal abad 19, karena kebutuhan untuk adanya instrumen pengukuran kemampuan orang sebagai akibat dari perkembangan idustri. Dunia industri dan dunia usaha membutuhkan tenaga terampil dengan bakat dan kemampuan yang cocok untuk menjalankan

(5)

mesin-mesin dan melakukan pekerjaan-pekerjaan usaha modern demi efisiensi dan produktivitas. Perang dunia I juga memerlukan tenaga militer dengan kemampuan yang diidentifikasi secara cepat untuk ditempatkan atau menjadi tenaga di bagian-bagian yang ada seperti artileri, infantri, penerbang nakhoda, dan sebagainya.

Di Amerika, usaha pertama tersebut dimulai oleh tokoh pencetus istilah “tes mental”,James Mckeen Cattell(1860-1944), yang menerbitkan bukunya mental tes and measuremens di tahun 1890. buku ini berisi serangkaian tes intelegensi yang terdiri atas 10 jenis ukuran. Ke 10 macam ukuran tersebut adalah:

1. Dinamo meter peasure, yaitu ukuran kekuatan tangan menekan pegas yang dianggap sebagai indikator aspek psikofisiologis

2. Rate of movement, yaitu kecepatan gerak tangan dalam satuan waktu tertentu yang dianggap memiliki komponen mental didalamnya.

3. Sensation areas, yaitu pengukuran jarak terkecil diantara 2 tempat yang terpisah dikulit yang masih dapat dirasakan sebagai 2 titik berbeda.

4. Peasue caosing pain, yaitu pengukuran yamg dianggap berguna dalam diaknosis terhadap penyakit saraf dan dalam mempelajari status kesadaran abnormal.

5. Least noticabele difference in weight, yaitu pengukuran perbedaan berat yang terkecil yang masih dapat dirasakan seseorang.

6. Reaction time for sound, yang mengukur waktu antara pemberian stimulus dengan timbulnya reaksi tercepat.

7. Time for naming colors, yang dimaksudkan sebagai ukuran terhadap proses yang. lebih”mental”daripada waktu-reaksi yang dianggap reflektif.

8. Bisection of a 50-cm line, yang dianggap sebagai suatu ukuran terhadap akurasi “ space judgment’

9. Judgment of 10second time, yang dimaksudkan sebagai ukuran akurasi dalam ‘time judgment’( subyek diminta menghitung 10 detik tanpa bantuan apapun).

10. Number of latters repeated upon once hearing, yang dimaksudkan sebagai ukuran terhadap perhatian dan ingatan( subyek diminta mengulang huruf yang sudah disebutkan 1x)

2. Latar Belakang Tes Intelegensi

1. E. Seguin (1812 – 1880) disebut sebagai pionir dalam bidang tes intelegensi yang mengembangkan sebuah papan yang berbentuk sederhana untuk menegakkan diagnosis keterbelakangan mental. Kemudian usaha ini distandanisir olehHenry H. Goddard  (1906). E. Seguin digolongkan kepada salah seorang yang mengkhususkan diri pada pendidikan anak terkebelakang dan disebut juga bapak dari tes performansi.

(6)

2. Joseph Jasnow  (1863 – 1944) adalah merupakan salah satu dari beberapa orang yang pertama kali mengembangkan daftar norma-norma dalam pengukuran psikologis.

3. G.C. Ferrari(1896) mempublikasikan tes yang bisa dipakai untuk mendiagnosis keterbelakangan mental.

4. August Oehr mengadakan penelitian inhmetasi antara berbagai fungsi psikologis (h. 14).

5. E. Kraepelin, seorang psikotes menyokong usaha ini, empat macam tes yang dikembangkan, di antaranya yaitu: Koordinasi motoric , Asosiasi kata-kata , Fungsi persepsi , Ingatan

6. DanE. Kraepelinjuga mengembangkan tes intelegensi yang berkaiatan dengan tes penataran aritmatik dan kalkulasi sederhana tahun 1895. Di samping itu berkembang pula tes yang dipakai untuk kelompok (group). Hal ini diawali dengan tes verbal untuk seleksi tentara (wajib militer) yang disebut dengan Army Alpha. Untuk yang buta huruf atau tidak bisa berbicara bahasa Inggris dipergunakan Army Beta  sekitar tahun 1917 – 1918, tes ini dipakai hampir dua juta orang.

B. DEFINISI PENGUKURAN, PENILAIAN DAN EVALUASI

Dalam praktek pendidikan saat ini masih sering terjadi kerancuan dalam mendefinisikan istilah “evaluasi”, “ penilaian” dan “ pengukuran”. Hal ini terjadi karena ketiga istilah tersebut memang terkait satu sama lain. Berikut ini penjelasan mengenai evaluasi, penilaian dan pengukuran.

1. Pengukuran (Measurement )

Pengukuran yang dalam bahasa inggir dikenal dengan measurement   adalah suatu kegiatan yang dilakukan untuk mengukur dalam arti memberi angka terhadap sesuatu yang disebut objek pengukuran atau objek ukur. Mengukur pada hakekatnya adalah pemasangan atau ko respondensi 1-1 antara angka yang diberikan dengan fakta dan diberi angka atau diukur (Djali, 2007). Dapat diartikan juga sebagai proses memasang fakta – fakta suatu objek dengan satuan- satuan ukuran tertentu. Secara konseptual angka-angka hasil pengukuran pada dasarnya adalah kontinum yang bergerak dari satu kutub ke kutub yang lain misalnya dari angka 0 sampai 100 atau dari negatif ke positif. Evaluasi dan penilaian dapat bersifat kualitatif, maka pengukuran selalau bersifat kuantitatif. Alat yang dipergunakan dalam pengukuran dapat berupa alat yang baku secara internasional seperti meteran, timbangan dan sebagainya, serta dapat pula berupa alat yang dibuat dan dikembangkan sendiri dengan mengikuti proses pengembangan atau pembakuan instrumen.

(7)

2. Penilaian ( Assesment )

Penilaian merupakan suatu tindakan atau proses menentukan nilai suatu objek yang dapat dilakukan berdasarkan hasil pengukuran atau dapat pula dipengaruhi oleh hasil pengukuran. Penilaian adalah suatu proses membandingkan objek atau gejala dengan menggunakan patokan-patokan tertentu seperti baik tidak baik, memadai tidak memadai memenuhi syarat tidak memenuhi syarat dan sebagainya ( Djali, 2007 )

3. Evaluasi ( Evaluation )

Menurut Gorlun dalam Djali (2007) evaluasi adalah suatu proses yang sistematis untuk menentukan atau mengambil keputusan, sampai sejauh mana tujuan program telah tercapai. Pendapat yang sama juga dikemukakan oleh Wringstone dalam Djali ( 2007 ) bahwa evaluasi pendidikan adalah penaksiran terhadap pertumbuhan dan kemajuan siswa ke arah tujuan atau nilai-nilai yang telah ditetapkan kurikulum.

Evaluasi juga dapat di artikan sebagai proses menilai suatu berdasarkan kriteria atau tujuan yang telah di tetapkan yang selanjutnya diikuti dengan pengambilan keputusan atau objek yang dievaluasi ( Djali, 2007 ).

Berdasarkan beberapa pengertian evaluasi, penilaian dan pengukuran yang dikemukakan secara rinci penjelasan mengenai perbedaan pengukuran, penilaian dan evaluasi dapat dilihat dari tabel 1 berikut.

Tabel 1. Hasil Ujian Mata Kuliah Tes dan Pengukuran

Peserta Skor Nilai Keputusan

Lovi 87 A Lulus amat baik

Wanda 98 A Lulus amat baik

Gina 78 B Lulus baik

Amu 88 A Lulus amat baik

Keterangan

1. Skor merupakan hasil kegiatan pengukuran 2. Nilai adalah penilaian

3. Keputusan adalah hasil evaluasi

Objek-objek pengukuran dalam bidang pendidikan ialah a. Prestasi atau hasil belajar

b. Sikap c. Motivasi d. Intelegensi e. Bakat f. Kecerdasan emosional g. Minat h. Kepribadian

(8)

PENGERTIAN DAN JENIS-JENIS INSTRUMEN

Secara umum instrumen adalah suatu alat yang memenuhi persyaratan akademik, sehingga dapat dipergunakan sebagai alat untuk mengukur suatu objek ukur atau mengumpulkan data mengenai suatu variabel. Dalam bidang pennelitian, instrumen diartikan sebagai alat untuk mengumpulkan data mengenai variabel-variabel penelitian untuk kebutuhan penelitian, sednagkan dalam bidang pendidikan instrumen digunakan untuk mengukur prestasi belajar siswa, faktor-faktor yang diduga mempunyai hubungan atau berpengaruh terhadap hasil belajar, perkembangan hasil belajar siswa, keberhasilan proses belajar, perkembangan hasil belajar siswa, keberhasilan proses belajar mengajar guru dan keberhasilan pencapaian suatu program tertentu.

Pada dasarnya instrumen dapat dibagi dua yaitu tes dan non tes. 1. Tes

Secara umum tes diartikan sebagai alat yang di pergunakan untuk mengukur atau penugasan objek ukur terhadap seperangkat konten dan materi tertentu. Menurut sudijono (1996), tes adalah alat atau prosedur yang diperguanakan dalam rangka pengukuran dan penilaian. Menurut Djali ( 2007 ) fungsi tes adalah sebgai berikut :

- sebagai alat ukur unutk mengukur prestasi belajar siswa - motivator dalam pembelajaran

- untuk upaya perbaikan kualitas pembelajaran

- menentuka berhasil atau tidaknya siswa sebagai syarat untuk melanjutkan pendidikan pada jenjang yang lebih tinggi

2. Non Tes

Instrumen non tes dapat berupa wawancara, observasi, angket, pemerikasaan dokumen

C. TEORI TES KLASIK DAN TEORI RESPON BUTIR

Pengukuran dalam pendidikan tidak dapat dipisahkan dari pengukuran kemampuan peserta didik. Kemampuan peserta didik dapat diukur dengan menggunakan alat ukur (tes). Pengukuran dalam pendidikan meliputi pengukuran kemampuan peserta tes dan pengukuran karakteristik alat ukur yang digunakan. Ada dua teori pengukuran yang sampai saat ini masih dikembangkan, yaitu teori tes klasik dan teori tes modern. Teori tes klasik disebut juga classical test theory (CTT) , sedang teori tes modern disebut juga item response theory (IRT) .

a. Teori tes klasik / classical test theory (CTT) 1. Definisi

Teori tes klasik atau yang dalam bahasa inggrisnya adalah Classical Test Theory (CTT) disebut demikian karena unsur-unsur teori itu sudah dikembangkan dan diaplikasikan sejak lama, namun tetap bertahan. Oleh

(9)

karena itu teori ini dianggapsebagai hasil karya klasik. Teori tes klasik tidak tersusun sekali jadi, melainkan berkembang sedikit demi sedikit melalui unsur-unsur yang kemudian secara akumulatif merupakan bangunan teori yang utuh. Inti teori tes klasik itu berupa asumsi-asumsi yang dirumuskan secara matematis. Modelnya disebut model skor murni (true score model). Ada tujuh macam asumsi dalam teori tes klasik, seperti yang akan disajikan secara ringkas berikut ini, disarikan dari Allen & Yen (1979).

2. Asumsi-asumsi dalam Teori Tes Klasik

Asumsi 1:

 = 

+ 

... (1)

Skor perolehan atau skor tampak (



) terdiri dari skor murni (

∗) dan skor kesalahan (

). Jadi skor yang diperoleh dari sesuatu pengukuran pada umumnya tidak menunjukkan keadaan yang sebenarnya. Skor perolehan pada umumnya meleset dari menampilkan secara tepat besaran atribut yang diukur. Melesetnya skor perolehan dari keadaan yang sebenarnya yaitu skor murni merupakan kesalahan pengukuran (error of measurement). Skor murni dianggap tetap, sedang skor kesalahan terjadi secara rambang, baik ke atas maupun ke bawah. Sebenarnya yang diperlukan adalah skor murni, yaitu skor yang mencerminkan secara tepat besaran atribut yang diukur, namun pada umumnya tidak ada jalan untuk mengetahui skor murni itu secara langsung. Skor murni hanya dapat diketahui secara tidak langsung melalui galat (kesalahan) baku pengukuran (standard error of measurement).

Asumsi 2:

ε(

) = 

... (2)

Nilai harapan skor perolehan (

ε(

)

) sama dengan skor murni. Asumsi 2 ini merupakan definisi skor murni (

∗). Skor murni itu adalah nilai rata-rata skor perolehan teoretis sekiranya dilakukan pengukuran berulang-ulang sampai tak terhingga terhadapseseorang dengan menggunakan alat ukur yang sama. Syarat pokok dalam pengukuran ulang itu adalah hasil pengukuran yang satu harus bebas dari hasil pengukuran yang lain.

Asumsi 3:

ρ

 . ∗

0

... (3)

Skor murni dan skor kesalahan yang dicapai oleh suatu populasi subjek pada suatu tes tidak berkorelasi satu sama lain. Jadi tidak ada hubungan sistematik antara skor murni dan skor kesalahan. Subjek yang tinggi skor murninya tidak mesti mempunyai skor kesalahan baik positif maupun negatif yang lebih tinggi dibanding subjek yang rendah skor murninya.

(10)

Asumsi 4:

ρx



x



 = 0

... (4)

Skor-skor kesalahan pada dua tes yang dimaksud untuk mengukur dua hal yang sama, tidak saling berkorelasi. Asumsi ini akan tidak terpenuhi sekiranya skor perolehan dipengaruhi oleh kondisi testing, seperti misalnya kelelahan, efek latihan, suasana hati, atau faktor-faktor dari lingkungan. Universitas Sumatera Utara

Asumsi 5:

ρx



x

∗

 = 0

 ... (5)

Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama, maka skor-skor kesalahan pada tes 1 (

x

) tidak berkorelasi dengan skor-skor murni pada tes 2 (

x

∗).

Asumsi 6:

Jika dua perangkat tes yang dimaksudkan mengukur atribut yang sama mempunyai skor perolehan

x

  dan

x

yang memenuhi asumsi-asumsi 1 sampai 5, dan jika untuk setiap populasi subjek X*=X*’ dan

σ

,

σ

  maka kedua tes itu disebut tes paralel. Jadi dua perangkat tes akan merupakan tes paralel jika skor-skor suatu populasi yang menempuh kedua tes itu skor murninya sama (X*=X*’) dan varians skor-skor kesalahannya sama (

σ

,

σ

).

Asumsi 7:

Jika dua perangkat tes yang dimaksudkan untuk mengukur atribut yang sama mempunyai skor-skor perolehan

x

  dan

x

 yang memenuhi asumsi-asumsi 1 sampai 5, dan apabila untuk setiappopulasi subjek

x

∗

 = x

∗

+ C

, dimana

C

 adalah suatu konstanta, maka kedua perangkat tes itu disebut tes-tes yang setara (equivalent test).

Pada pengukuran klasik ciri yang unik diperlihatkan dari kenyataan bahwa kelompok butir tes atau kelompok angket (kuesioner) tidak dapat dipisahkan dari kelompok peserta tes atau kelompok yang mengisi angket. Artinya, kelompok butir tes/angket (kuesioner) yang sama harus dijawab oleh kelompok peserta tes yang sama. Jika kelompok tes yang sama dijawab kelompok peserta uji tes yang berbeda maka ciri karakteristik kelompok butir itu akan berubah, sehingga taraf kesukaran dan daya pembeda kelompok butir tes itu akan berubah semata-mata karena kelompok butir tes tersebut ditanggapi oleh kelompok peserta yang berbeda. Menurut Setiadi (1998: 6) bahwa dalam teori klasik, statistik soal, misalnya indeks kesukaran soal tergantung pada sampel pengikut ujian. Kalau tes tersebut dikerjakan oleh siswa yang pandai maka soal-soal itu sepertinya mudah atau tingkat kesukaran soalnya menjadi besar, dan sebaliknya kalau

(11)

dikerjakan oleh siswa yang kurang pandai maka soal itu sepertinya sukar atau tingkat kesukaran soal menjadi kecil. Jadi, soal-soal itu tidak konsisten atau berubah-ubah tergantung pada kemampuan kelompok sampel siswa yang menempuh ujian.

Kemampuan responden bergantung kepada taraf sukar butir. Mereka yang mengerjakan butir sukar akan tampak berkemampuan rendah sedangkan mereka yang mengerjakan butir mudah akan tampak berkemampuan tinggi. Teori pengukuran klasik (teori ujian klasik) tidak dapat digunakan untuk pencocokan kemampuan responden dengan taraf sukar butir (karena mereka dependen). Pada teori klasik, terdapat interdependensi di antara kemampuan responden dan taraf sukar butir. 3. Kelemahan dan Kelebihan Teori Klasik

Menurut para ahli, ada beberapa kelemahan yang ada pada pendekatan teori klasik. Beberapa di antaranya adalah Hambleton, dkk (1991) dan Lord (1980). Mereka menjelaskan bahwa kelemahan-kelemahan tes teori klasik adalah:

(1) statistik butir tes sangat tergantung pada karakteristik subjek yang dites; (2) taksiran kemampuan peserta tes sangat tergantung pada butir tes yang diujikan;

(3) kesalahan baku penaksir skor berlaku untuk semua peserta tes, sehingga kesalahan baku pengukuran tiap peserta dan butir soal tidak ada;

(4) informasi yang disajikan terbatas pada menjawab benar atau salah saja tidak memperhatikan pola jawaban peserta tes; dan (5) asumsi tes paralel susah dipenuhi.

Walaupun teoriklasik ini memiliki beberapa kelemahan namun masih banyak yang menggunakan karena mempunyai kelebihan yaitu tidak menuntut responden besar (lebih 100) dan mudah mengaplikasikannya (melakukan analisis butir dengan pendekatan klasik ini). Oleh karenanya, untuk pengukuran yang melibatkan responden kecil misal pada pengukuran melalui tes harian pada bidang pendidikan, atau pengukuran pada bidang psikologi pada umumnya masih menggunakan pendekatan teori tes klasik. b. Teori tes modern / item response theory (IRT)

Untuk mengatasi kelemahan -kelemahan yang ada pada teori klasik, para ahli pengukuran berusaha untuk mencari alternatif. Model yang diinginkan harus mempunyai sifat-sifat:

(1) karakteristik butir tidak tergantung kepada kelompok peserta tes yang dikenai butir soal tersebut,

(12)

(3) model dinyatakan dalam tingkatan (level) butir soal, tidak dalam tingkatan tes, (4) model tingkat tidak memerlukan tes paralel untuk menghitung koefisien reliabilitas, dan

(5) model menyediakan ukuran yang tepat untuk setiap skor kemampuan (Hambleton, Swaminathan, & Rogers, 1991: 5). Model alternatif yang dapat mempunyai ciri-ciri itu adalah model pengukuran yang disebut teori respon butir ( Item Response Theory).

1. Definisi

Teori tes modern atau biasa disebut dengan teori respon butir ( item response theory) dikembangkan oleh para ahli pengukuran bidang psikologi dan pendidikansebagai upaya meminimalkan kekurangan -kekurangan yang ada dalam teori tes klasik. Perhitungan dalam analisis butir berdasarkan teori ini dapat dilakukan denganmenggunakan bantuan program komputer. Sebagaimana halnya dalam teori klasik, dalam teori respon butir juga didasarioleh postulat dasar. Ada dua postulat dasar dari teori tes modern (Hambelton, Swaminathan &Rogers, 1991: 7), yaitu: (1) hasil kerja seorang peserta tes pada suatubutir soal dapat diprediksikan (atau dijelaskan) dari suatu jenis faktor -faktor yang disebut sifat-sifat, sifat –sifat laten, atau kemampuan; (2) hubungan antara hasil kerja peserta tespada suatu butir tes dengan sifat -sifat yang mendasarinya dapat dideskripsikan oleh fungsi yang meningkat yang bersifat monotonic yang disebut dengan fungsi karakteristikbutir (item characteristic function atau item charact eristic curve -ICC). Fungsi inimenje1askan, jika taraf sifat -sifat (kemampuan) meningkat, maka probabilitas menjawab benar pada suatu butir tes juga meningkat.

2. Asumsi-asumsi Teori Tes Modern

Sebagaimana halnya dalam teori tes klasik, dalam teori respon butir juga mengandung asumsi-asumsi yang mendasarinya, yaitu: (a) Unidemensionalitas, (b)Independensi lokal, dan (c) Fungsi karakteristik butir menyatakan hubungan yang sebenarnya antara variabel yang tak terobservasi (yaitu kemampuan) dengan variabel terobservasi (yaitu respon butir) (Hambleton., Swaminathan, & Rogers, 1991: 9; Surabrata, 2000: 28). Asumsi unidemensionalitas dan independensi lokal dapatdijelaskan sebagai berikut.

Asumsi unidemensionalitas menyatakan bahwa hanya satu kemampuan yangdiukur oleh sekumpulan butir -butir soal dalam suatu tes. Asumsi ini pada praktik sukar dipenuhi, sebab terdapat banyak faktor yang dapat mempengaruhi hasil suatu tes. Faktor -faktor tersebut antara lain tingkat motivasi, kecemasan, kemampuan untuk bekerja cepat, dan keterampilan kognitif lain diluar kemampuan yang diukur oleh sekumpulan butir soal dalam suatu tes. Hal yang dimaksud dengan unidemensionalitas dalam hal ini adalah adanya faktor faktor dominan yang mempengaruhi hasil suatu tes. Faktor -faktor dominanitulah yang disebut kemampuan yang diukur oleh suatu tes.

(13)

Asumsi independensi lokal menyatakan bahwa sikap kemampuan yangmempengaruhi suatu tes adalah konstan, maka respon peserta tes pada setiap pasang butirsoal adalah independen secara statistik. Dengan kata lain, asumsi independensi lokalmenyatakan bahwa tidak ada korelasi antara respon peserta tes pada butir soal yangberbeda. Hal ini juga berarti bahwa kemampuan yang dinyatakan dalam model adalahsatu-satunya faktor yang mempengaruhi respon peserta tes pada butir-butir soal.

Untuk mengatasi kelemahan pada pengukuran klasik, penggunaan IRT yakni untuk menganulir ketidakterpisahan antara kelompok peserta tes dengan kelompok butir tes. Artinya, prinsip pengukuran modern adalah penetapan ciri butir, walaupun ciri peserta tes berbeda. Dengan kata lain, ciri dari kelompok butir adalah tetap walaupun dijawab peserta tes yang berbeda. Dengan demikian berlaku pula bahwa ciri peserta akan tetap sama, walaupun mereka menjawab butir tes yang berbeda. Pada IRT, peluang jawaban benar yang diberikan siswa, ciri atau parameter butir, dan ciri atau parameter peserta tes dihubungkan melalui suatu model formula yang harus ditaati baik oleh kelompok butir tes maupun kelompok peserta tes (Hambleton & Rogers, 1991). Artinya, butir yang sama terhadap peserta tes yang berbeda harus tunduk pada aturan rumus itu, atau peserta tes yang sama terhadap butir tes yang berbeda juga harus patuh terhadap rumus tersebut. Dalam proses semacam ini terjadilah apa yang disebut invariansi di antara butir tes dan peserta tes. Pada pengukuran modern, taraf sukar butir tidak dikaitkan langsung dengan kemampuan responden.

3. Kelemahan dan kelebihan Teori Modern

Teori tes modern sudah berkembang dibeberapa negara yang sudah maju. Kemajuan teknologi seperti ditemukannya komputer telah memberikan dampak dalam pengembangan teori tes modern. K elebihannya antara lain :

1. Proses penghitungan hasil penskoran peserta tes dengan menggunakan teori tes modern lebih kompleks dari pada menggunakan tes klasik. 2. IRT merupakan teori pengukuran yang dikembangkan untuk

menjelaskan secara lebih lengkap mengenai bagaimana gambaran fungsi dari sebuah aitem

Berbeda dengan pendekatan teori tes klasik, kelemahan IRT adalah membutuhkan jumlah data yang besar dan sampel yang beragam dalam menerapkan model matematikanya untuk mengestimasi aitem (Embretson & Reise dalam Anastasi & Urbina, 2007).Hal ini menunjukkan kelemahan dari IRT yang tidak praktis dan model matematiknya rumit dibandingkan dengan teori tes klasik.

(14)

BAB III KESIMPULAN

 Pengukuran (measurement)  adalah suatu kegiatan yang dilakukan untuk

mengukur dalam arti memberi angka terhadap sesuatu yang disebut objek pengukuran atau objek ukur.

 Penilaian merupakan suatu tindakan atau proses menentukan nilai suatu objek

yang dapat dilakukan berdasarkan hasil pengukuran atau dapat pula dipengaruhi oleh hasil pengukuran.

 Evaluasi adalah suatu proses yang sistematis untuk menentukan atau

mengambil keputusan, sampai sejauh mana tujuan program telah tercapai.

 instrumen adalah suatu alat yang memenuhi persyaratan akademik, sehingga

dapat dipergunakan sebagai alat untuk mengukur suatu objek ukur atau mengumpulkan data mengenai suatu variabel. Instrumen dapat dibedakan menjadi tes dan non tes

 Inti teori tes klasik itu berupa asumsi-asumsi yang dirumuskan secara

matematis. Modelnya disebut model skor murni (true sco re model).

 Untuk mengatasi kelemahan pada pengukuran klasik, penggunaan IRT yakni

untuk menganulir ketidakterpisahan antara kelompok peserta tes dengan kelompok butir tes.

(15)

Daftar Pustaka

Allen, M.J. & Yen, W.M. 1979.Introduction to measurement theory . Monterey, CA: Brooks/Cole Publishing Company.

Badrun Kartowagiran. 2002. Pengantar Teori Klasik . Makalah. Disampaikan pada Pelatihan penulisan analisis butir dengan pendekatan TTK dan TRB, di UNY Yogyakarta, 11-12 April 2009.

Djali dan Muljono. 2007.Pengukuran dalam Bidang Pendidikan . Jakarta: Grasindo. Erawan, Lalang dan Santosa, Stefanus. Teknologi Informasi, Computer – Adaptive Test Dengan Pendekatan Item Response Theory Satu Parameter , Jurnal Teknologi Informasi Volume 5 Nomor 2, ISSN 1414-9999, 2009.

Gronlund, Norman. E. 1985.Measurement and Evaluation in Teaching. New York: Macmillan Publishing Company.

Hambleton, Ronald K; Swaminathan, H; dan Jane Rogers, H. 1991. Fundamentals of Item Response Theory. London: SagePublications.

Purnomo, Bambang. 2011. Teori Tes Klasik. Artikel. Sumber : http://karyatulisilmiahguru.blogspot.com/2011/11/teori-tes-klasik.html/  tanggal 19 September 2014

Sudaryono. 2013. Implementasi Teori Responsi Butir (Item Response Theory) Pada Penilaian Hasil Belajar Akhir di Sekolah. Artikel. Sumber : http://sudaryono.ilearning.me/2013/01/18/implementasi-teori-responsi-butir-item-response-theory-pada-penilaian-hasil-belajar-akhir-di-sekolah/  tanggal 19 September 2014.

Gambar

Tabel 1. Hasil Ujian Mata Kuliah Tes dan Pengukuran

Referensi

Dokumen terkait

Korelasi biserial berbeda dengan korelasi point biserial baik secara teori maupun perhitungan, akan tetapi jika digunakan untuk tujuan menganalisis butir, kedua teknik tersebut dapat

perusahaan kepada konsumen dari apa yang diberikan oleh produk pesaing.” Porter (1980) juga mengatakan bahwa keunggulan kompetitif adalah kemampuan perusahaan yang

Keterampilan pemecahan masalah membantu istri ODS dalam proses pendampingan ODS sehingga kesulitan pendampingan yang dialami dapat diatasi dengan cara yang tepat dan

Hasil penelitian harga diri narapidana ini jika ditinjau dari masing masing domain yang membentuk harga diri, didapatakan hasil bahwa pada domain harga diri

Izin operasi kegiatan angkutan orang dan/atau barang dengan kereta api umum untuk pelayanan angkutan antar kota dan perkotaan yang lintas pelayanannya melebihi satu

Penelitian ini dilaksanakan di kelompok A TK Manggis Kecamatan Bulango Selatan Kabupaten Bone Bolango. Ditinjau dari latar belakang sosial ekonomi diketahui bahwa

 pendeteksian bahasa asing yang masih menggunakan sistem yang sederhana, tidak adanya sistem cerdas yang mampu mendeteksi dan membedakan bahasa sehingga data

Menemukan fungsi sosial teks personal recount sederhana tulis terkait pengalaman pribadi diwaktu lampau secara benar dan sesuai dengan konteksnya dengan