MAKALAH
EVALUASI PEMBELAJARAN
“Analisis Butir Soal”
Dosen Pengampu : Dr. Apdoludin, S.Pd.I., M.Pd.I
Disusun Oleh Kelompok 5:
1. Nabilatul Fikro (221186206147) 2. Fina Yolyanda (221186206163)
3. Dewi Masruroh (221186206147)
PROGRAM STUDI PENDIDIKAN GURU SEKOLAH DASAR FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN UNIVERSITAS MUHAMMADIYAH MUARA BUNGO
2024
KATA PENGANTAR
Dengan menyebut nama Allah SWT Yang Maha Pengasih lagi Maha Penyayang, Kami panjatkan puja dan puji syukur atas kehadirat-Nya, yang telah melinpahkan rahmat, hidayah, dan inayah-Nya kepada kami, sehingga dapat menyelesaikan makalah kami.Alhamadulillah dengan izin dan kehendak dari Allah SWT sehingga makalah ini dapat penulis selesaikan tidak lupa kami ucapkan terimakasih kepada Bapak Dr. Apdoludin, S.Pd.I., M.Pd.I selaku dosen pengampu dan teman teman yang telah memberikan dukungan dalam menyelesaikan makalah ini. Dan harapan kami semoga makalah ini dapat menambah pengetahuan dan pengalaman bagi para pembaca, untuk kedepannya dapat memperbaiki bentuk maupun menambah isi makalah agar menjadi lebih baik lagi.Karena keterbatasan pengetahuan maupun pengalaman kami. Kami yakin masih banyak kekurangan dalam makalah ini. Oleh karena itu, kami sangat mengharapkan saran dan kritik yang membangun dari pembaca demi
kesempurnaan makalah ini.
Bungo, 24 Maret 2024
Penyusun
DAFTAR ISI
KATA PENGANTAR...i
DAFTAR ISI...ii
BAB I PENDAHULUAN...1
A. Latar Belakang Masalah...1
B. Masalah Rumusan...2
C. Tujuan Penlulisan...2
BAB II PEMBAHASAN...3
A. Analisis Butir Soal...3
B. Karakteristik Butir Soal ... 5 BAB III PENUTUP...11
A. Kesimpulan ...11
B. Saran ...11
Daftar Pustaka...12
BAB I PENDAHULUAN A. Latar Belakang
Tes adalah suatu pernyataan, tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang trait atau atribut pendidikan dan psikologi. Setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar. Tes dapat diklasifikasikan menurut bentuk, tipe dan ragamnya (Asmawi Zainul, dkk :1997). Pengukuran adalah pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal atau obyek tertentu menurut aturan atau formulasi yang jelas.
Karakteristik dari pengukuran adalah penggunaan angka atau skala tertentu dan menggunakan aturan atau formula tertentu (Asmawi Zainul, dkk :1997).
Penilaian adalah suatu proses untuk mengambil keputusan dengan
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakan instrumen tes atau non tes. Dengan kata lain, penilaian adalah pemberian nilai terhadap kualitas sesuatu.
Keterkaitan antara tes, pengukuran dan penilaian adalah penilaian hasil belajar baru dapat dilakukan dengan baik dan benar bila menggunakan
informasi yang diperoleh melalui pengukuran hasil belajar yang menggunakan tes sebagai alat ukurnya. Kegunaan tes, pengukuran dan penilaian dalam pendidikan antara lain adalah untuk seleksi, penempatan, diagnosa, remedial, umpan balik, memotivasi dan membimbing, perbaikan kurikulum, program pendidikan serta pengembangan ilmu. Perencanaan dalam pengujian sangat penting karena tes baru akan berarti bila terdiri dari butir-butir soal yang menguji tujuan yang penting dan mewakili ranah pengetahuan, kemampuan dan keterampilan secara representatif. Ada enam hal yang perlu
dipertimbangkan dalam perencanaan tes yaitu: pengambilan sampel dan pemilihan butir soal, tipe tes yang akan digunakan, aspek yang akan diuji,
format butir soal, jumlah butir soal dan distribusi tingkat kesukaran butir soal (Asmawi Zainul, dkk :1997)
Kelemahan butir soal tidak terletak pada bentuk atau tipe butir soal, tetapi lebih banyak ditentukan oleh butir soal yang dikonstruksi dengan baik atau tidak baik. Butir soal obyektif akan sama baiknya dengan butir soal uraian untuk mengukur keberhasilan belajar yang dikonstruksi secara baik. Bahkan dalam beberapa hal butir soal uraian jauh lebih besar resikonya daripada butir soal obyektif. Hal ini disebabkan mutu butir soal uraian tidak hanya terletak pada kemampuan siswa untuk menjawab soal tersebut, tetapi lebih banyak ditentukan oleh kemampuan dan obyektifitas pembuat soal dalam memberikan skor pada hasil tes tersebut.
B. Rumusan Masalah
Adapun rumusan masalah dari pembahasan tersebut adalah : 1. Bagaimana analisis butir soal?
2. Apa saja karakteristik butir soal?
C. Tujuan Penulisan
Setelah mempelajari materi tujuan penulisan ini adalah sebagai berikut:
1. Untuk mengetahui analisis butir soal 2. Untuk mengetahui karakteristik butir soal
BAB II PEMBAHASAN A. Analisis Butir Soal
Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis butir soal merupakan kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu. Tujuan kegiatan ini adalah:
1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan.
2. Meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif.
3. Mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah diajarkan.
Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai materi. Selanjutnya menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-masing memiliki keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah menggunakan atau
memadukan keduanya.
Penilaian terhadap butir soal pada dasarnya merupakan analisis butir soal, dan selama ini pada umumnya para ahli pengukuran mengatakan bahwa analisis butir soal maksudnya adalah penilaian terhadap soal. Telah diketahui bersama bahwa penyusunan tes sangat mempengaruhi kualitas butir soal.
Pendekatan untuk menganalisis butir soal yang berkembang saat ini terdiri dari dua pendekatan yaitu pendekatan klasik dan pendekatan modern. Kedua pendekatan ini masing-masing memiliki kelebihan dan kekurangan. Namun keduanya masih sering digunakan dalam analisis butir soal. Analisis butir soal
dengan pendekatan klasik diantaranya dapat dilakukan menggunakan Program Iteman. Dengan melihat beberapa persyaratan yang harus dipenuhi,
penyusunan tes dituntut untuk mengikuti pedoman penyusunan tes dan melakukan ujicoba. Kemudian berdasarkan hasil ujicoba, respon peserta dianalisis menggunakan Program Iteman untuk mendapatkan karakteristik butir soal.
Data hasil analisis dengan Program Iteman dianalisis kembali menggunakan instrumen penilaian butir soal yang memenuhi syarat sebagai alat ukur yang baik. Suryabrata (1999) menyatakan bahwa analisis butir soal mencakup telaah soal atau analisis kualitatif dan analisis terhadap data empirik hasil ujicoba atau analisis kuantitatif. Analisis butir soal secara kualitatif menekankan penilaian dari ketiga segi yaitu materi, konstruksi, dan bahasa.
Namun demikian dalam pembahasan ini dikhususkan untuk menjelaskan analisis butir soal secara kuantitatif. Analisis ini dilakukan berdasarkan data yang diperoleh secara empiris melalui ujicoba dari suatu perangkat tes. Analisis kuantitatif sering disebut dengan analisis item yang menghasilkan karakteristik atau parameter butir dan tes, yaitu: tingkat kesukaran, daya beda dan distribusi jawaban dan kunci setiap butir, serta reliabilitas dan kesalahan pengukuran (SEM) dalam tes. Telah disinggung di depan bahwa analisis soal antara lain bertujuan untuk mengadakan identifikasi soal-soal yang baik, kurang lebih atau sedang dan soal yang tidak baik.
Dengan analisis soal dapat diperoleh informasi tentang kekurangan sebuah soal tes dan “petunjuk” untuk mengadakan perbaikan. Dalam tes dan pengukuran, dikenal beberapa karakteristik butir soal. Untuk tes hasil belajar pada umumnya dipertimbangkan tiga karakteristik butir soal, yaitu : tingkat kesukaran, daya beda dan distribusi jawaban atau berfungsi tidaknya pilihan jawaban (distraktor). Ketiga karakteristik butir soal ini secara bersamasama akan menentukan mutu butir soal. Bila salah satu dari ketiga karakteristik ini tidak memenuhi persyaratan maka mutu butir soal akan turun.
Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal memiliki banyak manfaat, diantaranya yakni:
1. Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan, 2. Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk
siswa dikelas
3. Mendukung penulisan butir soal yang efektif, 4. Secara materi dapat memperbaiki tes di kelas, 5. Meningkatkan validitas soal dan reliabilitas.
Linn dan Gronlund (1995) dalam Suprananto (2012: 163), menambahkan bahwa pelaksanaan kegiatan analisis butir soal, biasanya didesain untuk menjawab pertanyaan-pertanyaan berikut:
1. Apakah fungsi soal sudah tepat?
2. Apakah soal telah memiliki tingkat kesukaran yang tepat?
3. Apakah soal bebas dari hal-hal yang tidak relevan?
4. Apakah pilihan jawabannya efektif?
Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal memberikan manfaat:
1. Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik, 2. Meningkatkan kesukaran, daya pembeda dan pengecoh soal,
3. Merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya anak yang tidak dapat menjawab butir soal tertentu.
B. Karakteristik Butir Soal
1. Tingkat Kesukaran (Difficulty level)
Menurut Asmawi Zainul, dkk (1997) tingkat kesukaran butir soal adalah proporsi peserta tes menjawab benar terhadap butir soal tersebut.
Tingkat kesukaran butir soal biasanya dilambangkan dengan p. Makin besar nilai p yang berarti makin besar proporsi yang menjawab benar terhadap butir soal tersebut, makin rendah tingkat kesukaran butir soal itu. Hal ini mengandung arti bahwa soal itu makin mudah, demikian pula sebaliknya.
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar.
Soal yang terlalu mudah tidak merangsang mahasiswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan
menyebabkan mahasiswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya (Suharsimi Arikunto : 2001).
Tingkat kesukaran butir soal tidaklah menunjukkan bahwa butir soal itu baik atau tidak. Tingkat kesukaran butir hanya menunjukkan bahwa butir soal itu sukar atau mudah untuk kelompok peserta tes tertentu. Butir soal hasil belajar yang terlalu sukar atau terlalu mudah tidak banyak memberi informasi tentang butir soal atau peserta tes (Asmawi Zainul, dkk : 1997).
Pada analisis butir soal secara klasikal, seperti yang dijelaskan oleh
Depdikbud (1997) tingkat kesukaran dapat diperoleh dengan beberapa cara antara lain : a). skala kesukaran linier; b). skala bivariat; c). indeks davis; d).
proporsi menjawab benar. Cara yang paling umum digunakan adalah proporsi menjawab benar atau proportion correct, yaitu jumlah peserta tes yang menjawab benar pada soal yang dianalisis dibandingkan dengan peserta tes seluruhnya.
Menurut Arifin (2009) perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar derajat kesukaran suau soal. Jika suatu soal memiliki tingkat seimbang (proposional), maka dapat dikatakan bahwa soal tersebut baik. Suatu soal tes hendaknya tidak terlalu sukar dan tidak pula terlalu mudah.
a. Menghitung Tingkat Kesukaran Soal Bentuk Objektif Untuk menghitung tingkat kesukaran soal bentuk obyektif dapat digunakan dengan cara, yaitu: menggunakan rumus tingkat kesukaran (TK): Keterangan:
WL = jumlah peserta didik yang menjawab salah dari kelompok bawah WH = jumlah peserta didik yang menjawab salah dari kelompok atas nL = jumlah kelompok bawah
nH = jumlah kelompok atas
1) Menyusun lembar jawaban peserta didik dari skor tertinggi sampai dengan skor terendah,
2) Mengambil 27% lembar jawaban dari atas yang selanjutnya disebut kelompok atas (higher group), dan 27% lembar jawaban dari bawah yang selanjutnya disebut kelompok bawah (lower group). Sisa sebanyak 46% disisihkan,
3) membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik, baik untuk kelompok atas maupun kelopok bawah. Jika jawaban peserta didik benar diberi tanda plus (+), sebaliknya jika jawaban peserta didik salah maka diberi
simbol minus (-). Contoh: 18 peserta didik SMA Negeri 1 Cilacap kelas XII IPA akan mengikuti ujian tengah semester dalam mata pelajaran kimia. Berdasarkan hasil ujian tersebut kemudian disusun lembar jawaban peserta didik dari yang mendapat skor tertinggi sampai dengan skor terendah. Selanjutnya diambil 27% dari kelompok atas sebanyak 5 anak, begitu pula 27% dari kelompok bawah sebanyak 5 anak. Setelah diketahui jumlah sampel kelompok atas dan bawah, kemudian membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik dalam kelompok tersebut.
2. Daya beda
Daya beda butir soal ialah indeks yang menunjukkan tingkat kemampuan butir soal membedakan kelompok yang berprestasi tinggi (kelompok atas) dari kelompok yang berprstasi rendah (kelompok bawah) diantara para peserta tes (Asmawi Zainul, dkk : 1997). Suryabrata (1999) menyatakan tujuan pokok mencari daya beda adalah untuk menentukan apakah butir soal tersebut memiliki kemampuan membedakan kelompok dalam aspek yang diukur, sesuai dengan perbedaan yang ada pada kelompok itu. Daya beda butir soal yang sering digunakan dalam tes hasil belajar adalah dengan menggunakan indeks korelasi antara skor butir dengan skor totalnya. Daya beda dengan cara ini sering disebut validitas internal, karena nilai korelasi diperoleh dari dalam tes itu sendiri.
Daya beda dapat dilihat dari besarnya koefisien korelasi biserial maupun koefesien korelasi point biserial. Dalam analisis ini digunakan nilai koefisien korelasi biserial untuk menentukan daya beda butir soal. Koefisien korelasi biserial menunjukkan hubungan antara dua skor, yaitu skor butir soal dan skor keseluruhan dari peserta tes yang sama. Koefisien daya beda berkisar antara –1,00 sampai dengan +1,00. Daya beda +1,00 berarti bahwa semua anggota kelompok atas menjawab benar terhadap butir soal itu, sedangkan kelompok bawah seluruhnya menjawab salah terhadap butir soal itu. Sebaliknya daya beda –1,00 berarti bahwa semua anggota kelompok atas menjawab salah butir soal itu, sedangkan kelompok bawah seluruhnya menjawab benar terhadap soal itu.
Daya beda yang dianggap masih memadahi untuk sebutir soal ialah apabila sama atau lebih besar dari +0,30. Bila lebih kecil dari itu, maka butir soal tersebut dianggap kurang mampu membedakan peserta tes yang
mempersiapkan diri dalam menghadapi tes dari peserta yang tidak
mempersiapkan diri. Bahkan bila daya beda itu menjadi negatif, maka butir soal itu sama sekali tidak dapat dipakai sebagai alat ukur prestasi belajar.
Oleh karena itu butir soal tersebut harus dikeluarkan dari perangkat soal.
Makin tinggi daya beda suatu butir soal, maka makin baik butir soal tersebut, dan sebaliknya makin rendah daya bedanya, maka butir soal itu dianggap tidak baik (Asmawi Zainul, dkk : 1997).
Daya pembeda item menurut Sudijono (1996), adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi (pandai) dengan testee yang berkemampuan rendah (kurang pandai), sedemikian rupa sehingga sebagian besar testee yang memiliki kemampuan tinggi untuk menjawab butir soal tersebut lebih banyak dapat menjawab dengan benar, sementara testee yang
berkemampuan rendah untuk menjawab butir soal tersebut sebagian besar tidak dapat menjawab dengan benar. Tujuan mengetahui daya pembeda
kalangan testee, karena pada dasarnya kemampuan antara satu testee dengan testee yang lain adalah berbeda-beda. Lebih lanjut menurut Sudijono (1996), daya pembeda dapat diketahui melalui angka indeks diskriminasi item.
Angka indeks diskriminasi (diberi lambing d besar = D) adalah sebuah angka atau bilangan yang menunjukkan besar kecilnya daya pembeda (discrimination power) yang dimiliki oleh sebutir item. Seperti halnya indeks kesukaran item, maka indeks diskriminasi item besarnya berkisar antara 0 (nol) sampai dengan 1 (satu). Namun di antara keduanya terdapat perbedaan yang mendasar yaitu angka indeks kesukaran item tidak mungkin mengenal tanda negatif (-) sedangkan pada daya pembeda dapat bertanda negatif (-). Apabila sebutir item memiliki tanda positif (+), maka butir item tersebut memiliki daya pembeda yang berarti testee yang termasuk kategori pandai lebih banyak dapat menjawab dengan benar butir soal yang
bersangkutan, sedangkan testee yang termasuk kategori kurang pandai lebih banyak menjawab salah. Apabila sebutir item memiliki angka indeks
diskriminasi = 0,00 (nihil), maka hal ini menunjukkan bahwa butir item yang bersangkutan tidak memiliki daya pembeda sama sekali, yang berarti bahwa jumlah testee kelompok atas yang menjawab benar (atau salah) sama dengan jumlah testee kelompok atas yang menjawab dengan benar. Jadi di antara kedua kelompok testee tersebut tidak ada perbedaannya sama sekali atau perbedaannya = 0. Apabila angka indeks diskriminasi item dan sebutir item bertanda negatif (-), maka butir item lebih banyak dijawab benar oleh testee kelompok bawah dari pada oleh kelompok atas, atau testee yang sebenarnya termasuk dalam kategori pandai lebih banyak menjawab salah sedangkan testee yang sebenarnya dalam kategori kurang panda lebih banyak yang menjawab dengan benar
3. Keberfungsian Pengecoh
Dilihat dari konstruksi butir soal terdiri dari dua bagian, yaitu pokok soal dan alternatif jawaban. Alternatif jawaban jawaban juga terdiri dari dua bagian, yaitu kunci jawaban dan pengecoh. Pengecoh dikatakan berfungsi apabila semakin rendah tingkat kemampuan peserta tes semakin
banyak memilih pengecoh, atau makin tinggi tingkat kemampuan peserta tes akan semakin sedikit memilih pengecoh. Hal demikian dapat ditunjukkan dengan adanya korelasi yang tinggi, rendah atau negatif pada hasil analisis.
Apabila proporsi peserta tes yang menjawab dengan salah atau memilih pengecoh kurang dari 0,025 maka pengecoh tersebut harus direvisi. Dan untuk pengecoh yang ditolak apabila tidak ada yang memilih atau proporsinya 0,00 (Depdikbud : 1997).
Proporsi alternatif jawaban masing-masing butir soal dapat dilihat pada kolom proportion endorsing pada hasil analisis iteman. Selain
memperhatikan fungsi daya tarik untuk dipilih oleh peserta tes, pengecoh soal juga perlu memperhatikan daya beda (koefisien korelasi) yang ditunjukkan oleh masing-masing alternatif jawaban. Setiap pengecoh diharapkan memiliki daya beda negatif, artinya suatu pengecoh diharapkan lebih sedikit dipilih oleh kelompok tinggi dibandingkan dengan kelompok bawah. Atau daya beda pengecoh tidak lebih besar dari daya beda kunci jawaban setiap butir soal.
Menurut Sudijono (2011: 411), mengungkapkan bahwa distractortelah dapat menjalankan fungsinya dengan baik apabila
distractortersebut telah dipilih sekurang-kurangnya 5% dari seluruh peserta tes. Menurut Arifin (2016: 279) Pada soal bentuk pilihan-ganda ada
alternatif jawaban (opsi) yang merupakan pengecoh. Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap baik bila jumlah peserta didik yang memilih penngecoh itu sama atau mendekati jumlah ideal.
BAB III PENUTUP
A. Kesimpulan
Perencanaan dalam pengujian sangat penting karena tes baru akan berarti bila terdiri dari butir-butir soal yang menguji tujuan yang penting dan mewakili ranah pengetahuan, kemampuan dan keterampilan secara
representatif. Ada enam hal yang perlu dipertimbangkan dalam perencanaan tes yaitu: pengambilan sampel dan pemilihan butir soal, tipe tes yang akan digunakan, aspek yang akan diuji, format butir soal, jumlah butir soal dan distribusi tingkat kesukaran butir soal Jadi jelaslah bahwa dibutuhkan adanya alat yang dapat dipercaya untuk mengukur apakah alat ukur (butir soal) yang digunakan memang dapat dijadikan dasar untuk menentukan keputusan yang bijaksana. Inilah peran yang harus dimainkan oleh analisis butir soal, yaitu mengukur butir soal yang akan digunakan. Butir soal yang ternyata terlalu lemah, akan sukar dipertanggungjawabkan untuk dijadikan sebagai dasar penentuan keputusan, terutama keputusan yang sifatnya individual.
B. Saran
Penulis menyadari bahwa tulisan ini jauh dari sempurna. Oleh karena itu diperlukan penelitian lanjutan, baik dengan pendekatan yang sama maupun pendekatan yang berbeda. Dengan demikian, diperoleh hasil yang sesuai dengan harapan semua pihak, terutama mereka yang menekuni bidang sintak.
DAFTAR PUSTAKA
Asmawi Zainul dan Noehi Nasoetion. 1997. Penilaian Hasil Belajar. Pusat Antar Universitas, Direktorat Jenderal Pendidikan Tinggi: Departemen Pendidikan Dan kebudayaan.
Anastasi, A. dan Urbina, S. (1997). Psychological Testing (Seven ed.). New Jersey: Prentice-Hall.
Arifin, Zaenal. 2009. Evaluasi Pembelajaran. Bandung: PT. Remaja Rosda Karya.
Arifin, Z. (2011). Evaluasi Pembelajaran.Bandung: PT Remaja Rosdakarya.
Dali, S Naga. 1992. Pengantar Teori Sekor Pada Pengukuran Pendidikan.
Gunadarma: Jakarta.
Departemen Pendidikan Dan Kebudayaan. 1997. Manual Item And Test Analysis (Iteman). Badan Penelitian dan Pengembangan Pendidikan dan Kebudayaan: Pusat Penelitian dan Pengembangan Sistem Pengujian.
Linn, Robert L. dan Gronlund, Norman E. (1995). Measurement and Assessment in teaching (Seventh Edition). Ohio: Merrill, an immprint of Prentice Hall.
Suharsimi Arikunto. 2001. Dasar-Dasar Evaluasi Pendidikan. Bumi Aksara:
Jakarta.
Suryabrata, S. 1999. Pengembangan Alat Ukur Psikologis. Direktorat jenderal Pendidikan Tinggi: Departemen Pendidikan dan Kebudayaan.