ANALISIS ITEM - FULL NOTA UPP

TUJUAN ANALISIS ITEM

1. Analisis item boleh membantu meningkatkan kefahaman kita tentang sesuatu ujian.

2. Analisis item boleh tunjuk pada kita kenapa sesuatu ujian itu adalah boleh dipercayai/ reliable (atau tidak boleh

dipercayai/reliable ) atau sah (valid).

3. Analisis item juga mencadangkan kepada kita cara-cara untuk memperbaiki ciri-ciri pengukuran sesuatu ujian.

 Item yang tidak baik atau soalan mengelirukan (trick ) boleh mempengaruhi tahap reliabiliti dan validiti sesuatu ujian.

 Maka, jika item yang tidak baik ini disingkirkan ia boleh meningkatkan tahap reliabiliti dan validiti ujian berkenaan.

Ciri-ciri Penting Item-item Ujian

 Persoalan yang perlu dijawab semasa menilai setiap item ujian adalah “Adakah sesuatu item itu mengukur seperti apa yang diukur oleh

item-item lain dalam ujian berkenaan”.

 Terdapat tiga(3) jenis ukuran yang boleh digunakan untuk menjawab persoalan di atas:

1. Ukuran distractor/ gangguan

“ Berapa orang memilih setiap respons”

 Menilai pola respon keseluruhan ke atas sesuatu item. 2. Ukuran kepayahan item

“Berapa orang yang menjawab dengan betul item itu”

 Analisis tentang kepayahan sesuatu item. 2. Ukuran diskriminasi

“Adakah respons ke atas sesuatu item itu berkaitan dengan respons ke atas item-item lain ujian itu”

 Analisis tentang diskriminasi item. ANALISIS DISTRACTOR

 Secara tipikalnya hanya terdapat satu jawapan betul atau satu pilihan yang dikehendaki bagi Item jenis pelbagai pilihan.

 Banyak maklumat berkenaan ujian yang boleh diperoleh dengan mengkaji kekerapan respon salah yang diberikan oleh kumpulan subjek. Rujuk contoh dalam Table 10-1 (Murphy & Davishofer, 2005, pg 204).

 Sesuatu item yang baik mempunyai dua ciri:

1. individu yang tahu jawapan akan sentiasa memilih respon yang betul.

2. Individu yang tidak tahu jawapan akan memilih secara random di antara respon-respon yang mungkin merupakan jawapan.

 Kenyataan/ciri ke 2 ini menunjukkan sesetengah orang menjawab betul kerana meneka. Ini juga bermakna kemungkinan subjek memberi respon salah ke atas setiap respon seharusnya adalah sama.

 Merujuk contoh dalam Jadual 10-1, respon a adalah jawapan betul sementara respons b, c dan d a dalah gangguan (distractor) .

 Hasil dalam Jadual 10-1 menunjukkan 55% daripada pelajar menjawab dengan betul item 42.

 Jika item ini adalah item yang baik, maka dijangkakan respon daripada baki 45% pelajar ke atas ketiga-tiga distractor itu haruslah sama (iaitu, 15% pelajar pilih b, 15% pelajar pilih c dan 15% pelajar pilih d).

Apa yang Dapat Diperhatikan Daripada Analisis Distractor

 Formula untuk mengira berapa orang yang dijangka memilih setiap distractor:

 Merujuk Jadual 10-1, terdapat 39 orang menjawab salah item 42, maka dijangkakan terdapat 13 orang memilih setiap distractor .

 Apabila jumlah individu yang memilih sesuatu distractor itu lebihi jumlah yang dijangkakan, dua kemungkinan berlaku iaitu:

 Pilihan itu (distractor ) menggambarkan sebahagian daripada pengetahuan.

 Item itu tidak baik kerana soalannya mengelirukan (trick).  Item yang mengandungi distractor yang sangat popular cenderung

menurunkan tahap reliabiliti dan validiti ujian.

 Item yang mengandungi distractor yang sangat tidak popular (jumlah individu memilih distractor ini kurang daripada yang dijangkakan) akan mengurangkan tahap kepayahan item berkenaan.

KEPAYAHAN ITEM

 Daripada item-item di bawah yang mana lebih payah? item 1. (6 x 3) + 4 = _________.

item 2. 9π[In (-3.68) x (1-In(+3.68)] = _________.

item 1. Siapa Sigmund Freud?

item 2. Siapa Daniel Gorman?

 Dari sudut psikometrik kepayahan item merujuk kepada jumlah individu atau berapa orangkah yang menjawab dengan betul sesuatu item itu.

 Jika semua orang memilih jawapan yang betul. It em itu dikatakan senang.  Sebaliknya, jika hanya seorang daripada 100 yang menjawab betul, item

itu dikatakan payah/susah.

Mengukur Kepayahan Item

 Ukuran umum kepayahan item ialah peratus subjek yang menjawab dengan betul sesuatu item itu (nilai p ).

 Nilai p item boleh dikira dengan formula berikut:

Kesan Kepayahan Item Ke Atas Skor Ujian

 Salah satu andaian asas pengukuran ialah terdapat perbezaan sistematik di antara individu-individu dalam sesuatu gagasan atau domain

kandungan yang diukur.

 Ujian merupakan satu metod yang boleh digunakan untuk menilai perbezaan di antara individu-individu berkenaan dalam gagasan atau domain kandungan yang diukur itu.

 sekiranya tiada individu yang menjawab dengan betul sesuatu item itu (nilai p = 0.0 ) atau semua orang menjawab dengan betul sesuatu item (nilai p = 1.0), ini menunjukkan tidak terdapat perbezaan antara individu dalam “skor” item berkenaan.

 Sesuatu Item yang nilai p = 0.0 atau nilai p = 1.0, menunjukkan:  Item itu tidak dapat mendiskriminasi antara individu baik dan

individu tidak baik.

 Item itu adalah satu item lemah.

 Item itu harus dibaiki atau disingkirkan dar ipada ujian.  Jika item itu disingkirkan ia tidak akan memberi kesan ke atas

urutan pemeringkatan atau saiz perbezaan skor di antara dua orang individu.

 Item ini akan mempengaruhi min skor ujian, tetapi  Ia tidak memberi kesan ke atas reliabiliti, validiti ujian atau

 Kesan kepayahan ke atas varians skor ujian adalah nyata sekiranya nilai p adalah ekstrim.

 Jika semua item dalam sesuatu ujian itu sangat payah, majoriti daripada mereka yang mengambil ujian itu akan mendapat skor ujian yang rendah.

 Jika semua item dalam sesuatu ujian itu sangat mudah, majoriti daripada mereka yang mengambil ujian itu akan mendapat skor ujian yang tinggi.

 Dalam kedua-dua keadaan ini, skor-skor ujian menunjukkan keperbezaan yang kecil (seragam). Ini menunjukkan nilai p yang ekstrim secara langsung akan menghadkan keperbezaan skor-skor ujian.

 Keperbezaan skor-skor ujian adalah maksima jika purata nilai p berkisar di sekitar 0.5 (optima). Atau semua item ujian itu berkisar di sekitar nilai p = 0.5.

DISKRIMINASI ITEM

 Setiap item dalam sesuatu ujian merupakan satu pemerhatian atau satu ujian.

 Jika sesuatu item itu mengukur seperti apa yang hendak diukur ujian itu maka dijangkakan:

1. individu yang mendapat skor tinggi dalam ujian itu menjawab dengan betul item berkenaan.

2. individu yang mendapat skor rendah dalam ujian itu menjawab salah item berkenaan.

3. Sesuatu item yang baik adalah item yang boleh

mendiskriminasi/membezakan individu yang menjawab dengan baik dalam sesuatu ujian dengan individu yang lemah dalam ujian berkenaan.

 Terdapat tiga (3) statistik yang boleh digunakan untuk mengukur kuasa diskriminasi sesuatu item:

1. Indeks diskriminasi

2. Korelasi item keseluruhan

3. Korelasi inter-item

Indeks Diskriminasi (D)

 Kuasa diskriminasi/membeza sesuatu item boleh diukur dengan membandingkan bilangan individu yang mendapat skor tinggi dalam sesuatu ujian yang menjawab betul item itu dengan bilangan inidividu yang mendapat skor rendah dalam ujian itu yang menjawab betul item yang sama.

 Jika sesuatu item itu boleh membeza di antara mereka yang skor tinggi dan mereka yang skor rendah, maka akan terdapat lebih ramai yang daripada kumpulan skor tinggi yang menjawab betul item berkenaan.

Langkah-langkah untuk mengira indeks diskriminasi (D) sesuatu item:

1. Pilih kumpulan tinggi (kumpulan yang mendapat skor tinggi dalam sesuatu ujian) dan kumpulan rendah (kumpulan yang mendapat skor rendah dalam sesuatu ujian).

 Kelley mencadangkan 27% daripada kumpulan tinggi dan 27% daripada kumpulan rendah.

 Maindozha mencadangkan 33%daripada kumpulan tinggi dan 33% daripada kumpulan rendah.

2. Kira berapa peratus individu dari kumpulan tinggi dan kumpulan rendah yang menjawab betul item itu.

@ Indeks diskriminasi item itu adalah perbezaan antara dua peratusan itu.

• Merujuk Jadual 7.1, item 1 dan item 2 nyata adalah lebih susah bagi kumpulan skor rendah berbanding kumpulan tinggi.

Logik Di Sebalik Statistik D

1. Secara definisi sesuatu ujian nyata adalah lebih payah bagi kumpulan skor rendah berbanding kumpulan skor tinggi.

2. Jika sesuatu item itu mengukur perkara yang sama diukur ujian. Maka, item itu juga adalah lebih payah bagi kumpulan skor rendah berbanding kumpulan skor tinggi.

 Item 3 kurang menunjukkan kuasa diskriminasi kerana nil ai D kecil.  Item 4 menunjukkan kuasa diskriminasi yang tinggi tetapi pada arah yang

salah.

• Index D negatif menunjukkan item itu adalah senang bagi mereka memperoleh skor rendah dalam ujian berkenaan dan payah bagi mereka yang memperoleh skor tinggi.

 Formula mengira D

 D = U - L

 nii ni

 U = Bilangan calon kumpulan yang mendapat skor tinggi yang menjawab betul item

 L = Bilangan calon kumpulan yang mendapat skor rendah yang menjawab betul item

 nii= Bilangan calon dalam kumpulan yang mendapat skor tinggi  ni= Bilangan calon dalam kumpulan yang mendapat skor

rendah

 D = U - L

 n

 n = nii= ni

Korelasi Item Keseluruhan

 Korelasi item keseluruhan (item-total correlation ) adalah satu statistik yang membekalkan maklumat berkenaan sejauh mana sesuatu item itu mengukur seperti apa yang diukur ujian.

 Statistik ini dijalankan dengan korelasi skor bagi sesuatu item dengan jumlah skor ujian.

 Tafsiran bagi korelasi item keseluruhan adalah lebih kurang sama dengan index diskriminasi item, D:

1. Korelasi positif item keseluruhan menunjukkan item itu boleh mendiskriminasi mereka yang menjawab dengan baik sesuatu ujian itu dengan mereka yang lemah dalam ujian berkenaan.

2. Korelasi positif item keseluruhan juga menunjukkan item itu mengukur perkara yang sama diukur ujian.

3. Korelasi item keseluruhan yang hampir dengan kosong (0) menunjukkan item itu tidak boleh mendiskiminasi antara skor tinggi dan skor rendah.

4. Korelasi negatif item keseluruhan menunjukkan item itu tidak mengukur perkara yang sama diukur ujian (individu yang

menjawab betul item itu tetapi mendapat skor rendah dalam keseluruhan ujian).

Kelebihan Kaedah Korelasi Item Keseluruhan

 Kaedah ini mudah iaitu dengan korelasikan skor item dengan skor ujian keseluruhan.

 Dengan kaedah ini, kita senang membuat keputusan ke atas kualiti sesuatu item. Misalnya, Jika korelasi item keseluruhan r = 0.40 ini menunjukkan item berkenaan menyumbang sebanyak 16% daripada variasi dalam skor ujian itu. Kenyataan ini tidak dapat dibuat bagi item yang mana index diskriminasinya = .40.

 Korelasi item keseluruhan berhubung secara langsung dengan reliabiliti ujian.

Korelasi Inter-Item

 Hasil metrik korelasi inter item membekalkan maklumat berikut: 1. Memperoleh maklumat berkenaan reliabiliti ujian – purata

korelasi inter-item dan jumlah item dalam sesuatu ujian.

2. Satu kegunaan paling penting korelasi inter-item ialah ia boleh membantu kita dalam memahami ukuran diskriminasi sesuatu item.

 Item yang menunjukkan korelasi item keseluruhan yang positif dan kuat juga akan menunjukkan korelasi positif dengan kebanyakan item dalam

ujian itu.

 Hasil korelasi inter-item juga membantu kita untuk memahami kenapa sesetengah item gagal untuk mendiskriminasi di antara mereka yang mendapat skor tinggi dengan mereka yang mendapat skor rendah dalam ujian.

 Jika hasil korelasi item keseluruhan adalah rendah, terdapat dua(2) penjelasan :

1. Item itu tidak berkaitan dengan item-item lain dalam ujian itu.

 Item itu harus diperbaiki atau disingkirkan.

2. Item itu mungkin berkorelasi secara positif dengan sesetengah item ujian itu tetapi berkorelasi secara negatif atau lemah korelasinya dengan item-item lain dalam ujian berkenaan.

 Keadaan ini berlaku sekiranya ujian itu mengukur dua atribut yang berbeza.

Dalam dokumen FULL NOTA UPP (Halaman 29-33)