Proses membentuk ujian boleh dibahagikan kepada tiga(3) peringkat :
1. Pembentukan Alat Kajian/ Ujian
Termasuk: menulis item, pembentukan skala, set respons dan memilih format ujian.
2. Membentuk Norma dan Mempiawai Ujian
Mempiawaikan ujian bagi populasi sasaran, membentuk norma dan menjalankan penyelidikan untuk menilai reliabiliti dan validiti ujian.
3. Penerbitan dan Meneliti Semula Ujian
Mengemaskini ujian setelah satu jangka masa. MEMBENTUK UJIAN
Memilih Jenis Item
Memastikan jenis item mana sesuai digunakan. 1. Item pelbagai pilihan.
soalan esei, soalan struktur, soalan demonstrasi kemahiran tertentu dll.
Item jenis respon berbentuk/berstuktur boleh mengukur dengan lebih mendalam berkenaan kebolehan dan kemahiran individu daripada item pelbagai pilihan.
Ujian pelbagai pilihan biasanya digunakan untuk mengukur aspek kebolehan individu yang lebih berfokus.
Namun, item pelbagai pilihan lebih diminati kerana:
Adalah sukar untuk membentuk metod permarkatan yang reliable bagi item jenis respon berstruktur.
Metod permarkatan bagi item jenis respon berstruktur mengambil masa yang lama dan mahal.
Adalah lebih senang membentuk metod permarkatan bagi ujian pelbagai pilihan.
Menulis Item
Langkah pertama membentuk ujian adalah proses membentuk item pool (1.5 - 3 kali ganda item).
Isu-isu yang perlu dipertimbang dalam menulis item:
Kepanjangan ayat, perbendaharaan kata, tahap akademik/ tahap membaca subjek sasaran, bahasa offensive , sexist atau racist .
Kandungan Item
Sesetengah ujian dibentuk dengan berdasarkan teori tertentu. Menterjemahkan idea-idea teori kepada item-item ujian.
Contoh, Edwards Personal Preference Schedule (EPPS) dibentuk berdasarkan teori personaliti yang dikemukankan oleh Murray (1938).
Definisi keperluan autonomi dalam teori itu – orang yang sentiasa mempengaruhi orang untuk melakukan sesuatu untuk diri sendiri atau orang yang inginkan gaya hidup yang bebas dan tidak terikat dengan tradisi (Murray, 1938).
Contoh item dalam EPPS
“I like to avoid situations where I am expected to do things in a conventional way” and “I like to avoid responsibilities and obligations”
Kelemahan item yang dibentuk dengan berdasarkan teori ialah item ini biasanya adalah agak transparent.
Senang diteka atau nampak apa yang ingin diukur item-item berkenaan.
Subjek biasanya akan memberi respon mengikut kehendak mereka atau apa yang sepatut dan bukan daripada persepsi sebenar mereka.
Satu cara lain yang diguna untuk menulis item ialah tidak berpandukan teori atau atheoretical.
Membentuk item pool yang besar.
Masih tidak terdapat tema bagi mengkelompokan item-item yang dibentuk.
Membentuk item yang boleh membezakan sesuatu kumpulan daripada kumpulan lain. Contoh, The Minnesota Multiphasic Personality Inventory (MMPI).
Alternatif-Alternatif Respons Item
Alternatif respons item yang digunakan dalam ujian psikologikal adalah pelbagai.
1. Format respon betul-salah (cth., Personality Research Form ), Format respon Setuju-Tidak Setuju cth., Chid Abuse Inventory “Saya tidak pernah rasa kasihan terhadap orang lain”
1. Setuju 2. Tidak Setuju 2. Format jawapan pelbagai pilihan (cth., Tennessess
Self-Concept Scale – skala Likert 5
3. Format Respons bebas – dalam ujian projectif subjek diminta memberi respons bebas dan tidak berstruktur ke atas pelbagai stimuli dalam ujian (cth., The Rorschach dan The Rotter Incomplete Sentence Blank)
4. Format penyelesaian malasah, subjek diminta menghasilkan produk tertentu yang mana merupakan sebahagian daripada proses ujian (cth., ujian pencapaian dan ujian bakat)
5.
Format yang paling popular ialah item pelbagai pilihan. Item ini mempunyai beberapa kelebihan:
1. Cara permarkatan item ini adalah mudah dan cepat, 2. Ralat pengukuran yang berkaitan dengan meneka
jawapan bagi sesuatu item boleh dikurangkan dengan meningkatkan jumlah pilihan item berkenaan.
3. Cara permarkatan item ini tidak melibatkan putusan daripada penilai.
Item pelbagai pilihan juga mempunyai kelemahan: 1. Adalah sukar menulis penyata alternatif bagi item
ini atau adalah sukar untuk membentuk distractor yang baik.
Kekuatan dan kelemahan item format respons bebas: 1. Kekuatan item ini ialah ia dapat memperoleh
maklumat yang banyak dan mendalam. 2. Kelemahan item ini ialah dari segi permarkatan.
Item pelbagai pilihan juga mempunyai kelemahan: 1. Adalah sukar menulis penyata alternatif bagi item
ini atau adalah sukar untuk membentuk distractor yang baik.
Kekuatan dan kelemahan item format respons bebas: 1. Kekuatan item ini ialah ia dapat memperoleh
maklumat yang banyak dan mendalam. 2. Kelemahan item ini ialah dari segi permarkatan. Pembentukan Skala
Setiap item dalam ujian psikologi mewakili satu permerhatian bagi tingkah laku atau tret tertentu.
Jika item-item yang sama dikumpulkan, permerhatian pelbagai bagi tingkah laku atau tertentu boleh dibentuk.
Terdapat tidak metod membentuk skala bagi ujian psikologi:
1. Skala Rasional
Metod membentuk skala yang paling lama.
Ia menggunakan pemikiran/pendapat, kepercayaan atau rational sebagai asas dalam memilih dan mengumpulkan item-item ke dalam skala tertentu.
Kekuatan menggunakan metod skala rasional:
1. Pencipta ujian boleh berpandukan teori tertentu untuk meramal tingkah laku yang diukur, kerana skala dibentuk untuk mengukur konsep-konsep teori.
Kelemahan menggunakan metod skala rasional:
1. Validiti skala bergantung kepada kekukuhan sesuatu teori. Jika teori itu tidak kukuh, skala yang dibentuk berasaskan teori itu akan mempunyai validiti yang rendah.
2. Skala Empirikal
Pembentukan skala berdasarkan kajian empirikal.
Satu set item ditadbirkan kepada subjek kumpulan sasaran dan subjek kumpulan biasa (bukan subjek sasaran). Item yang secara statistiknya boleh membezakan dua kumpulan itu dipilih.
Kenalpasti kumpulan sasaran. Contohnya, kumpulan subjek yang mengalami schizophrenia dan kumpulan subjek normal. Satu set item yang sama ditadbirkan kepada dua kumpulan itu. Item-item yang boleh membezakan dua kumpulan itu akan dipilih untuk membentuk skala.
Pembentukan skala dengan metod empirikal ini melibatkan penggunaan analisis faktor untuk memilih item-item yang mengukur tret atau tingkah laku yang sama.
Hasil daripada analisis faktor - Item-item yang terkumpul dalam sesuatu komponen menunjukkan item-item itu mengukur sesuatu gagasan yang sama. Gagasan yang diukur dikenalpasti melalui kandungan item-item itu.
Kekuatan metod ini adalah dari segi ciri-ciri psikometriknya.
Kelemahan metod ini:
Sukar untuk mengenalpasti gagasan yang diukur oleh item-item yang dipilih daripada hasil analisis statistik berbandingkan yang berdasarkan teori.
Metod analisis faktor yang berlainan digunakan akan menghasilkan kelompok item yang berbeza.
3. Skala Rasional-Empirikal
Skala dibentukkan dengan menggunakan kedua-dua atau kombinasi keadah skala rational dan kaedah skala empirikal
Set-Set Respons
Untuk mengukur tret psikologi, inventori self-report (subjek diminta memberi maklumat tentang diri mereka) biasa digunakan.
1. Sesetengah item dalam ujian self-report adalah sangat personal dan segan dilaporkan. Maka, sesetengah subjek tidak memberi maklumat yang tepat atau sengaja tidak menjawab sesetengah item.
2. sesetengah subjek tidak tahu bagaimana beri respons yang tepat pada sesetengah item yang kabur soalannya.
3. sesetengah subjek cuai dalam menjawab soalan dan memberi jawapan yang tidak tepat.
4. Perkara-perkara ini boleh meningkatkan ralat varians skor sesuatu ujian dan mempengaruhi proses tafsiran skor ujian.
5. Ujian psikologi yang baik mengandungi metod bagi mengesan sumber-sumber varians ini. 1. Kehendak Sosial (Social Desirability)
6. Subjek menjawab sesuatu item mengikut kehendak sosial atau apa yang diiktiraf oleh umum dan bukan dengan pendapat atau persepsi mereka sediri.
7. Allen L. Edwards (1957, 1970) - menganalisis pelbagai ujian personaliti telah menyimpulkan bahawa banyak di antara ujian itu tidak mengukur tret yang hendak diukur kerana individu yang menjawab ujian itu memberi respons berdasarkan apa yang diiktiraf oleh sosial/ masyarakat.
Untuk mengatasi masalah ini Strategi untuk mengawal atau menghapuskan kesan daripada respon kehendak sosial pada ujian personaliti:
1. Guna format ipsative - buat pasangan bagi item yang boleh menimbulkan kehendak sosial.
2. bentuk item yang tidak terlalu positif atau negatif bagi dimensi kehendak sosial (item neutral).
3. Menyesuaikan skor-skor ujian untuk menghapuskan kesan kehendak sosial
2. Respons Random
Set respons random adalah hasil daripada subjek tidak faham kandungan item dan memberi respons secara random.
Subjek juga akan beri respons random jika mereka tidak mahu dinilai atau mereka tidak boleh menjawab ujian berkenaan (misalnya, tidak boleh membaca soalan atau terganggu semasa mengambil ujian).
Strategi mengawal masalah ini ialah membentuk ujian yang boleh mengenalpasti pola respons random iaitu masukkan item yang mana secara universal betul atau salah bagi semua orang .
3. Dissimulation
Set response dissimulation merujuk kepada menjawab sesuatu inventori dengan sengaja menunjukkan kelakuan baik ( faking good ) atau kelakuan buruk (faking bad ).
Set respons ini banyak berlaku dalam situasi di mana ujian ditadbir untuk membantu dalam proses pemilihan kerja, kenaikan pangkat, membei anugerah atau membuat keputusan. Pola Respons
Pola respons merujuk kepada satu kecenderungan sama ada setuju atau tidak setuju terhadap kenyataan-kenyataan/item-item tanpa membaca/memahami item itu.
Terdapat pola tertentu dalam jawapan yang diberikan oleh subjek. MEMPIAWAIKAN UJIAN DAN MEMBENTUK NORMA
Membentuk Norma Bagi Ujian Psikologi
Kumpulan normatif haruslah terdiri daripada sampel yang boleh mewakili populasi.
biasanya, beberapa kumpulan normatif dibentukkan bagi sesuatu ujian supaya pengguna ujian boleh memilih kumpulan perbandingan yang lebih sesuai dengan tujuan mereka.
Langkah-langkah membentuk norma:
1. Mendefinisikan Populasi Sasaran
Kumpulan normatif diwujudkan adalah berdasarkan tujuan kegunaan ujian.
Contohnya kebanyak ujian kemampuan mental direkabentuk untuk mengukur kemampuan seseorang individu berbanding populasi umum.
Maka:
kumpulan normatif yang sesuai adalah terdiri daripada satu sampel yang boleh mewakili dan daripada semua tahap pendidikan yang dipilih secara random.
Jika kumpulan normatif terdiri daripada sampel yang lebih berfokus (misalnya, sampel daripada pelajar kolej/universiti), ia akan mengubah atau mempengaruhi tafsiran hasil ujian.
Langkah pertama dalam membentuk dan mentafsir norma adalah untuk mengenalpasti kumpulan sasaran dengan berdasarkan kerelevanan dan kesesuaiannya.
2. Memilih Sampel
Perkara penting dalam memilih sampel adalah mendapatkan sampel yang boleh mewakili populasi sasaran.
Contoh: populasi sasaran bagi membentuk norma bagi ujian