FULL NOTA UPP

(1)

KULIAH

KULIAH 1: 1: PENGENALAN KPENGENALAN KEPADA EPADA UJIAN & UJIAN & PENGUKURAN PENGUKURAN PSIKOLOGIPSIKOLOGI

UJIAN DAN PENGUKURAN UJIAN DAN PENGUKURAN

APA ITU UJIAN PSIKOLOGI? APA ITU UJIAN PSIKOLOGI?



 Ujian adalah satu alat pengukuran atau teknik yang digunakanUjian adalah satu alat pengukuran atau teknik yang digunakan untuk menilai tingkah laku atau alat bantuan untuk memahami untuk menilai tingkah laku atau alat bantuan untuk memahami dan meramal sesuatu tingkah laku (Kaplan & Saccuzzo, 2001). dan meramal sesuatu tingkah laku (Kaplan & Saccuzzo, 2001).



 Contoh: ujian mengeja perkataan (Contoh: ujian mengeja perkataan ( A A spelling spelling test test )) – – mengukurmengukur sejauh mana kebolehan seseorang itu mengeja perkataan atau sejauh mana kebolehan seseorang itu mengeja perkataan atau sebaik mana seseorang itu belajar mengeja satu senarai sebaik mana seseorang itu belajar mengeja satu senarai perkataan khas.

perkataan khas.



 Satu ujian psikologi adalah satu set item yang direkabentuk Satu ujian psikologi adalah satu set item yang direkabentuk untuk mengukur ciri-ciri manusia yang berkaitan dengan tingkah untuk mengukur ciri-ciri manusia yang berkaitan dengan tingkah laku (

laku (overt and covert behavior overt and covert behavior ))



 Overt behavior Overt behavior adalah aktiviti-aktiviti seseorang yang bolehadalah aktiviti-aktiviti seseorang yang boleh diperhatikan.

diperhatikan.



 Covert behavior Covert behavior adalah aktiviti-aktiviti seseorang yang tidak adalah aktiviti-aktiviti seseorang yang tidak boleh diperhatikan secara langsung (misalnya, perasaan atau boleh diperhatikan secara langsung (misalnya, perasaan atau pemikiran) (Kaplan & Saccuzzo, 2001).

pemikiran) (Kaplan & Saccuzzo, 2001).



 Ujian adalah satu prosedur sistematik bagi memerhati tingkahUjian adalah satu prosedur sistematik bagi memerhati tingkah laku seseorang dan menjelaskannya dengan bantuan satu skala laku seseorang dan menjelaskannya dengan bantuan satu skala nombor atau sistem kategori (Cronbach, 1990)

nombor atau sistem kategori (Cronbach, 1990)

APA ITU PENGUKURAN? APA ITU PENGUKURAN?



 Prosedur untuk menggambarkan ciri-ciri atau tingkah laku yang dinilai ituProsedur untuk menggambarkan ciri-ciri atau tingkah laku yang dinilai itu dengan menggunakan nombor.

dengan menggunakan nombor.

Kenapa Ujian Psikologi Penting? Kenapa Ujian Psikologi Penting?

–

– Ujian-ujian digunakan untuk membuat keputusan pentingUjian-ujian digunakan untuk membuat keputusan penting

berkenaan seseorang individu. berkenaan seseorang individu.

–

– Ahli-ahli Ahli-ahli psikologi psikologi klinikal klinikal menggunakan menggunakan ujian-ujianujian-ujian

objektif dan projektif untuk membantu mereka memilih objektif dan projektif untuk membantu mereka memilih rawatan-rawatan yang sesuai untuk klien mereka. rawatan-rawatan yang sesuai untuk klien mereka.

–

– Ujian-ujian juga digunakan di tempat kerja untuk Ujian-ujian juga digunakan di tempat kerja untuk

membantu dalam pemilihan personnel dan perlesenan membantu dalam pemilihan personnel dan perlesenan professional.

professional.

–

– Ujian-ujian psikologi boleh digunakan untuk mengukur pelbagaiUjian-ujian psikologi boleh digunakan untuk mengukur pelbagai

atribut seperti kecerdasan, motivasi, minat kerjaya, kecekapan atribut seperti kecerdasan, motivasi, minat kerjaya, kecekapan ruang (

ruang (spatial ability spatial ability ), kebimbangan, persepsi dan sebagainya.), kebimbangan, persepsi dan sebagainya.

–

– PanelPanel National Academy of Sciences National Academy of Sciences membuat rumusan bahawamembuat rumusan bahawa

ujian psikologi boleh dikatakan adalah teknologi yang paling ujian psikologi boleh dikatakan adalah teknologi yang paling tepat, adil dan baik bagi membuat keputusan penting berkenaan tepat, adil dan baik bagi membuat keputusan penting berkenaan seseorang individu.

seseorang individu.

UJIAN-UJIAN PSIKOLOGI: DEFINISI UJIAN-UJIAN PSIKOLOGI: DEFINISI



 Ujian psikologi adalah satu alat pengukuran yang mempunyai tiga (3) ciriUjian psikologi adalah satu alat pengukuran yang mempunyai tiga (3) ciri pendefinisian:

pendefinisian:

1.

1. Ujian psikologi adalah satu sampel tingkah laku.Ujian psikologi adalah satu sampel tingkah laku.

2.

2. Sampel tingkah laku itu diperoleh dalam keadaan piawaiSampel tingkah laku itu diperoleh dalam keadaan piawai

3.

3. Terdapat peraturan permarkatan atau peraturan memperolehTerdapat peraturan permarkatan atau peraturan memperoleh maklumat kuantitatif tertentu daripada sampel tingkah laku maklumat kuantitatif tertentu daripada sampel tingkah laku berkenaan.

berkenaan.

Sampel Tingkah Laku Sampel Tingkah Laku

–

– Penggunaan sampel tingkah laku dalam pengukuran psikologi mempunyaiPenggunaan sampel tingkah laku dalam pengukuran psikologi mempunyai

beberapa implikasi : beberapa implikasi :

1.

1. Ujian psikologi bukan satu pengukuran sempurna sepenuhnyaUjian psikologi bukan satu pengukuran sempurna sepenuhnya yang boleh digunakan untuk mengukur dan menjelaskan sesuatu yang boleh digunakan untuk mengukur dan menjelaskan sesuatu atribut (contoh: kecekapan mengeja perkataan).

atribut (contoh: kecekapan mengeja perkataan).

2.

2. Kualiti sesuatu ujian itu banyak bergantung kepada keupayaanKualiti sesuatu ujian itu banyak bergantung kepada keupayaan keperwakilan sampel tingkah laku berkenaan atau sejauh mana keperwakilan sampel tingkah laku berkenaan atau sejauh mana sampel tingkah laku itu boleh mengukur atribut yang hendak sampel tingkah laku itu boleh mengukur atribut yang hendak

(2)

diukur (contoh: Ujian IQ

diukur (contoh: Ujian IQ – – mengandungi ujian yang mengujimengandungi ujian yang menguji tentang kecekapan nombor, ruang, verbal dan non-verbal). tentang kecekapan nombor, ruang, verbal dan non-verbal).

Kepiawaian (

Kepiawaian (Standardization Standardization ))



 Ujian psikologi adalah satu sampel tingkah laku yang dikumpulUjian psikologi adalah satu sampel tingkah laku yang dikumpul dalam keadaan piawai.

dalam keadaan piawai.



 Kepiawaian itu merujuk kepada keseragaman prosedurKepiawaian itu merujuk kepada keseragaman prosedur penggunaan ujian psikologi iaitu dari segi pentadbiran dan penggunaan ujian psikologi iaitu dari segi pentadbiran dan permarkatan ujian.

permarkatan ujian.



 Contoh: mentadbirContoh: mentadbir The Scholastic Assessment Tests (SAT) The Scholastic Assessment Tests (SAT) kepada seribu orang pelajar sekolah.

kepada seribu orang pelajar sekolah.



 Terdapat beberapa prosedur yang mesti diikut olehTerdapat beberapa prosedur yang mesti diikut oleh pentadbir ujian:

pentadbir ujian:



 Pentadbir ujian akan membaca setiapPentadbir ujian akan membaca setiap arahanarahan kepadakepada semua pelajar sebelum ujian bermula.

semua pelajar sebelum ujian bermula.



 MasaMasa ditetapkan untuk menjawa setiap bahagian ujian.ditetapkan untuk menjawa setiap bahagian ujian. 

 Manual ujian mengandungi arahan-arahan yang lengkapManual ujian mengandungi arahan-arahan yang lengkap berkaitan dengan pola kedudukan yang sesuai, berkaitan dengan pola kedudukan yang sesuai, kecerahan lampu, kecemasan. Jawapan untuk soalan kecerahan lampu, kecemasan. Jawapan untuk soalan umum.

umum.



 Manual ujian lengkap boleh memastikan keseragamanManual ujian lengkap boleh memastikan keseragaman prosedur pentadbiran SAT di semua tempat.

prosedur pentadbiran SAT di semua tempat.

Peraturan Permarkatan Peraturan Permarkatan



 Tujuan ujian adalah untuk mengukur atau menjelaskan atribut-Tujuan ujian adalah untuk mengukur atau menjelaskan atribut-atribut tertentu individu yang mengambil ujian dalam bentuk atribut tertentu individu yang mengambil ujian dalam bentuk angka atau bentuk kuantitatif.

angka atau bentuk kuantitatif.



 Dengan itu, ujian psikologi harus mempunyai peraturan atauDengan itu, ujian psikologi harus mempunyai peraturan atau prosedur tertentu dalam menjelaskan tingkah laku individu yang prosedur tertentu dalam menjelaskan tingkah laku individu yang mengambil ujian itu dalam bentuk angka/nombor atau dalam mengambil ujian itu dalam bentuk angka/nombor atau dalam bentuk kuantitatif.

bentuk kuantitatif.



 Peraturan Permarkatan Objektif Peraturan Permarkatan Objektif 

 Merujuk kepada jika dua orang yang menggunakanMerujuk kepada jika dua orang yang menggunakan peraturan permarkatan yang sama dalam menilai peraturan permarkatan yang sama dalam menilai respon daripada seseorang individu, skor yang diperoleh respon daripada seseorang individu, skor yang diperoleh individu itu akan sentiasa sama daripada dua orang individu itu akan sentiasa sama daripada dua orang penilai berkenaan.

penilai berkenaan.



 Ujian yang menggukan peraturan permarkatan objektif Ujian yang menggukan peraturan permarkatan objektif adalah ujian pelbagai pilihan (

adalah ujian pelbagai pilihan (multiple choice test multiple choice test ).).



 Peraturan Permarkatan Subjektif Peraturan Permarkatan Subjektif 

 Permarkatan ini bergantung kepada penilaian penilaiPermarkatan ini bergantung kepada penilaian penilai atau pentadbir ujian.

atau pentadbir ujian.



 Istilah subjektif ini tidak menunjukkan metodIstilah subjektif ini tidak menunjukkan metod permarkatan ujian itu tidak tepat atau tidak boleh permarkatan ujian itu tidak tepat atau tidak boleh dipercayai.

dipercayai.



 Ujian yang menggukan peraturan permarkatan subjektif Ujian yang menggukan peraturan permarkatan subjektif adalah

adalah Rorschach inkblot tests Rorschach inkblot tests dandan ujian esei.ujian esei.

JENIS-JENIS UJIAN PSIKOLOGI JENIS-JENIS UJIAN PSIKOLOGI



 Secara keseluruhan ujian psikologi boleh dibahagikan kepada tiga (3)Secara keseluruhan ujian psikologi boleh dibahagikan kepada tiga (3) kategori:

kategori:

1.

1. Ujian Prestasi (Ujian Prestasi (Test of Performance Test of Performance ))



 Dalam ujian ini subjek diminta melakukan sesuatu tugasDalam ujian ini subjek diminta melakukan sesuatu tugas khas seperti menulis esei, menjawab soalan-soalan khas seperti menulis esei, menjawab soalan-soalan pelbagai pilihan, membuat putaran imej secara mental pelbagai pilihan, membuat putaran imej secara mental melalui komputer dll.

melalui komputer dll.

2.

2. Permerhatian Tingkah LakuPermerhatian Tingkah Laku



 Ujian ini melibatkan permerhatian tingkah laku subjek Ujian ini melibatkan permerhatian tingkah laku subjek dalam konteks tertentu.

dalam konteks tertentu.

3.

(3)

diukur (contoh: Ujian IQ

diukur (contoh: Ujian IQ – – mengandungi ujian yang mengujimengandungi ujian yang menguji tentang kecekapan nombor, ruang, verbal dan non-verbal). tentang kecekapan nombor, ruang, verbal dan non-verbal).

Kepiawaian (

Kepiawaian (Standardization Standardization ))



 Ujian psikologi adalah satu sampel tingkah laku yang dikumpulUjian psikologi adalah satu sampel tingkah laku yang dikumpul dalam keadaan piawai.

dalam keadaan piawai.



 Kepiawaian itu merujuk kepada keseragaman prosedurKepiawaian itu merujuk kepada keseragaman prosedur penggunaan ujian psikologi iaitu dari segi pentadbiran dan penggunaan ujian psikologi iaitu dari segi pentadbiran dan permarkatan ujian.

permarkatan ujian.



 Contoh: mentadbirContoh: mentadbir The Scholastic Assessment Tests (SAT) The Scholastic Assessment Tests (SAT) kepada seribu orang pelajar sekolah.

kepada seribu orang pelajar sekolah.



 Terdapat beberapa prosedur yang mesti diikut olehTerdapat beberapa prosedur yang mesti diikut oleh pentadbir ujian:

pentadbir ujian:



 Pentadbir ujian akan membaca setiapPentadbir ujian akan membaca setiap arahanarahan kepadakepada semua pelajar sebelum ujian bermula.

semua pelajar sebelum ujian bermula.



 MasaMasa ditetapkan untuk menjawa setiap bahagian ujian.ditetapkan untuk menjawa setiap bahagian ujian. 

 Manual ujian mengandungi arahan-arahan yang lengkapManual ujian mengandungi arahan-arahan yang lengkap berkaitan dengan pola kedudukan yang sesuai, berkaitan dengan pola kedudukan yang sesuai, kecerahan lampu, kecemasan. Jawapan untuk soalan kecerahan lampu, kecemasan. Jawapan untuk soalan umum.

umum.



 Manual ujian lengkap boleh memastikan keseragamanManual ujian lengkap boleh memastikan keseragaman prosedur pentadbiran SAT di semua tempat.

prosedur pentadbiran SAT di semua tempat.

Peraturan Permarkatan Peraturan Permarkatan



 Tujuan ujian adalah untuk mengukur atau menjelaskan atribut-Tujuan ujian adalah untuk mengukur atau menjelaskan atribut-atribut tertentu individu yang mengambil ujian dalam bentuk atribut tertentu individu yang mengambil ujian dalam bentuk angka atau bentuk kuantitatif.

angka atau bentuk kuantitatif.



 Dengan itu, ujian psikologi harus mempunyai peraturan atauDengan itu, ujian psikologi harus mempunyai peraturan atau prosedur tertentu dalam menjelaskan tingkah laku individu yang prosedur tertentu dalam menjelaskan tingkah laku individu yang mengambil ujian itu dalam bentuk angka/nombor atau dalam mengambil ujian itu dalam bentuk angka/nombor atau dalam bentuk kuantitatif.

bentuk kuantitatif.



 Peraturan Permarkatan Objektif Peraturan Permarkatan Objektif 

 Merujuk kepada jika dua orang yang menggunakanMerujuk kepada jika dua orang yang menggunakan peraturan permarkatan yang sama dalam menilai peraturan permarkatan yang sama dalam menilai respon daripada seseorang individu, skor yang diperoleh respon daripada seseorang individu, skor yang diperoleh individu itu akan sentiasa sama daripada dua orang individu itu akan sentiasa sama daripada dua orang penilai berkenaan.

penilai berkenaan.



 Ujian yang menggukan peraturan permarkatan objektif Ujian yang menggukan peraturan permarkatan objektif adalah ujian pelbagai pilihan (

adalah ujian pelbagai pilihan (multiple choice test multiple choice test ).).



 Peraturan Permarkatan Subjektif Peraturan Permarkatan Subjektif 

 Permarkatan ini bergantung kepada penilaian penilaiPermarkatan ini bergantung kepada penilaian penilai atau pentadbir ujian.

atau pentadbir ujian.



 Istilah subjektif ini tidak menunjukkan metodIstilah subjektif ini tidak menunjukkan metod permarkatan ujian itu tidak tepat atau tidak boleh permarkatan ujian itu tidak tepat atau tidak boleh dipercayai.

dipercayai.



 Ujian yang menggukan peraturan permarkatan subjektif Ujian yang menggukan peraturan permarkatan subjektif adalah

adalah Rorschach inkblot tests Rorschach inkblot tests dandan ujian esei.ujian esei.

JENIS-JENIS UJIAN PSIKOLOGI JENIS-JENIS UJIAN PSIKOLOGI



 Secara keseluruhan ujian psikologi boleh dibahagikan kepada tiga (3)Secara keseluruhan ujian psikologi boleh dibahagikan kepada tiga (3) kategori:

kategori:

1.

1. Ujian Prestasi (Ujian Prestasi (Test of Performance Test of Performance ))



 Dalam ujian ini subjek diminta melakukan sesuatu tugasDalam ujian ini subjek diminta melakukan sesuatu tugas khas seperti menulis esei, menjawab soalan-soalan khas seperti menulis esei, menjawab soalan-soalan pelbagai pilihan, membuat putaran imej secara mental pelbagai pilihan, membuat putaran imej secara mental melalui komputer dll.

melalui komputer dll.

2.

2. Permerhatian Tingkah LakuPermerhatian Tingkah Laku



 Ujian ini melibatkan permerhatian tingkah laku subjek Ujian ini melibatkan permerhatian tingkah laku subjek dalam konteks tertentu.

dalam konteks tertentu.

3.

(4)



 Subjek menjelaskan perasaan, sikap, kepercayaan,Subjek menjelaskan perasaan, sikap, kepercayaan, minat, pengalaman atau peringkat mental atau minat, pengalaman atau peringkat mental atau fizikalnya.

fizikalnya.

Ujian Prestasi

Ujian Prestasi ((Tests of Performance Tests of Performance ))



 Subjek diberi sesuatu tugas khas dan mereka akan cuba sedaya upayaSubjek diberi sesuatu tugas khas dan mereka akan cuba sedaya upaya untuk melaksanakan tugas berkenaan dengan jayanya.

untuk melaksanakan tugas berkenaan dengan jayanya.



 Skor ujian yang diperoleh subjek ditentukan dengan kejayaan subjek Skor ujian yang diperoleh subjek ditentukan dengan kejayaan subjek dalam menyempurnakan setiap tugas berkenaan.

dalam menyempurnakan setiap tugas berkenaan.



 Dalam pengambilan ujian ini, subjek diandaikan tahu aDalam pengambilan ujian ini, subjek diandaikan tahu a pakah yang sepatutpakah yang sepatut dilakukan dalam memberi respon ke atas tugas yang diberikan. Daripada dilakukan dalam memberi respon ke atas tugas yang diberikan. Daripada itu, subjek akan cuba sedaya upaya untuk menjayakan tugas yang itu, subjek akan cuba sedaya upaya untuk menjayakan tugas yang diberikan.

diberikan.



 _{Ujian prestasi direka bentuk untuk menilai apa yang boleh dilakukan oleh}_{Ujian prestasi direka bentuk untuk menilai apa yang boleh dilakukan oleh} seseorang dalam keadaan tertentu (keadaan yang hendak diuji, misalnya, seseorang dalam keadaan tertentu (keadaan yang hendak diuji, misalnya, menguji prestasi kerja operator mesin dalam

menguji prestasi kerja operator mesin dalam keadaan bising dan panas).keadaan bising dan panas).



 _{Contoh ujian}_{Contoh ujian prestasi: Ujian}_{prestasi: Ujian kecekapan mental}_{kecekapan mental (ujian kecerdasan/IQ),}_{(ujian kecerdasan/IQ),} ujian kecekapan khusus (kecekapan ruang, kecekapan muzik, kecekapan ujian kecekapan khusus (kecekapan ruang, kecekapan muzik, kecekapan matematik), ujian aktiviti psikomotor atau fizikal (ujian kecekapan matematik), ujian aktiviti psikomotor atau fizikal (ujian kecekapan psikomotor perkomputeran,

psikomotor perkomputeran, flight simulators flight simulators and ujian memandu).and ujian memandu).

Permerhatian Tingkah Laku Permerhatian Tingkah Laku



 Ujian-ujian psikologi yang melibatkan permerhatian tingkah laku danUjian-ujian psikologi yang melibatkan permerhatian tingkah laku dan respon-respon subjek dalam konteks tertentu.

respon-respon subjek dalam konteks tertentu.



 Contoh: menilai kecekapan jurujual, menilai sikap menolongContoh: menilai kecekapan jurujual, menilai sikap menolong pelajar dll.

pelajar dll.



 Berbeza dengan ujian prestasi, ujian ini tidak meminta subjek Berbeza dengan ujian prestasi, ujian ini tidak meminta subjek melaksanakan tugas tertentu.

melaksanakan tugas tertentu.



 Subjek mungkin tidak tahu tingkah laku mereka Subjek mungkin tidak tahu tingkah laku mereka sedang dikaji.sedang dikaji. 

 Ujian permerhatian tingkah laku menilai prestasi atau tingkah laku tipikalUjian permerhatian tingkah laku menilai prestasi atau tingkah laku tipikal subjek dalam konteks khusus.

subjek dalam konteks khusus.



 Permerhatian tingkah laku yang sistematik berguna dalam menilai atributPermerhatian tingkah laku yang sistematik berguna dalam menilai atribut seperti kemahiran atau penyesuaian sosial.

seperti kemahiran atau penyesuaian sosial.



 Contoh, menilai kecekapan kanak-kanak bersosial dengan rakan-Contoh, menilai kecekapan kanak-kanak bersosial dengan rakan-rakan.

rakan.

Laporan Kendiri (

Laporan Kendiri (Self-Report Self-Report ))



 Ujian-ujian psikologi yang meminta subjek untuk melapor atauUjian-ujian psikologi yang meminta subjek untuk melapor atau menjelaskan perasaan, sikap, kepercayaan, minat, pengalaman menjelaskan perasaan, sikap, kepercayaan, minat, pengalaman atau peringkat mental atau fizikalnya.

atau peringkat mental atau fizikalnya.



 Contoh, ujian personaliti, ujian kecerdasan emosi dll.Contoh, ujian personaliti, ujian kecerdasan emosi dll. UJIAN DAN KEPUTUSAN: KEGUNAAN UJIAN PSIKOLOGI

UJIAN DAN KEPUTUSAN: KEGUNAAN UJIAN PSIKOLOGI

Asal Usul Ujian Asal Usul Ujian

Some Milestones In The Development of Tests Some Milestones In The Development of Tests

___________________

_________________________________________________________________________________________________ _

_

1000b.c

1000b.c Testing Testing in in Chinese Chinese civil civil service service

1850-1900

1850-1900 Civil Civil service service examinations examinations in in the the United United States States

1900-1920

1900-1920 Development Development of of individual individual and and group group tests tests of of cognitive ability, development of psychometric cognitive ability, development of psychometric theory.

theory.

1920-1940

1920-1940 Development Development of of factor factor analysis, analysis, development development of of projective tests and standardized personality

projective tests and standardized personality inventories.

inventories.

1940-1960

1940-1960 Development Development of of vocational vocational interest interest measures, measures, standardized measures of psychopathology.

standardized measures of psychopathology.

1980-present

1980-present large-scale large-scale implimentation implimentation of computeriof computerized adaptive zed adaptive tests.

(5)

__________________________________________________________ _

Kegunaan Ujian Dalam Latar Pendidikan

 Dalam latar pendidikan ujian-ujian psikologi banyak digunakan dalam menilai pengambilan dan kemajuan pelajar. Misalnya:

 Penilaian pelajar bagi penempatan dalam pelbagai program pendidikan (e.g. ujian kecerdasan).

 Membuat diagnosis masalah pembelajaran (e.g. ujian prestasi dan ujian permerhatian tingkah laku).

 _{Menilai keberkesanan kurikulum.} Kegunaan Ujian Dalam Latar Personnel

 Dalam latar organisasi, ujian-ujian psikologi banyak digunakan dalam pemilihan personnel.

 Ujian psikologi yang banyak digunakan dalam pemilihan personel adalah ujian kecekapan dan ujian kemahiran khusus.

 Ujian kecekapan juga banyak digunakan dalam latar ketenteraan sama ada untuk membuat penapisan atau penempatan tentara mengikut kecekapan dan kemahiran mereka.

 Dalam latar organisasi ujian-ujian digunakan untuk menilai keperluan menjalankan sesuatu latihan, menilai prestasi pekerja dalam latihan dan menilai kerjayaan sesuatu program latihan, menilai perkembangan pengurusan dan program kerjaya kaunseling.

Kegunaan Ujian Dalam Latar Klinikal

 Dalam latar klinikal ujian-ujian psikologi banyak digunakan untuk menilai individu klien untuk menentukan rawatan mana yang sesuai bagi mereka.

 Dalam bidang klinikal, ujian-ujian personaliti objektif dan projektif serta ujian diagnostik banyak digunakan. Ujian neuropsikologikal juga digunakan oleh ahli psikologi klinikal.

 Ahli psikologi klinikal biasanya akan mendapat latihan khusus dalam mentadbir ujian psikologi terutamanya ujian kecerdasan individu sebelum mereka menggunakan ujian itu untuk menilai klien atau pesakit mereka.

TESTING ACTIVITIES OF PSYCHOLOGISTS

KULIAH 2 : NORMA DAN STATISTIK ASAS BAGI UJIAN DAN PENGUKURAN

LEARNING OBJECTIVE

When you have complete this chapter, you should be able to:

 Discuss three properties of scales of measurement.

 Determine why properties of scales are important in the field of measurement.

 Describe the mean and the standard deviation.  Define a Z & T score and explain how it is used.

 Relate the concepts of mean,standard deviation, and Z score to the concept of a standard normal distribution.

 Tell how norms are created.

 Relate the notion of tracking to the establishment of norms Kenapa Perlukan Statistik ?

(6)

Metod Statistik memainkan dua peranan penting dalam memahami persoalan saintifik:

1. Statistik digunakan untuk tujuan deskriptif (Statistik Deskriptif)

 Menjelaskan dan meringkaskan maklumat yang dikumpul daripada satu sampel – mengurangkan sejumlah besar data bentuk angka atau nombor ke dalam bentuk yang lebih tersusun (dalam jadual atau rajah).

 Statistik deskriptif adalah prosedur-prosedur statistik yang menjelaskan, menyusun dan meringkaskan ciri-ciri utama data sampel.

2. Statistik digunakan untuk membuat inferensi atau keputusan (Statistik Inferensi)

 _{Ia membolehkan penyelidik untuk membuat} _{inferensi –} keputusan (judgments) berkenaan populasi berdasarkan perhubungan dalam data sampel

 _{Statistik inferensi membolehkan generalisasi dibuat ke atas} populasi dengan berdasarkan data sampel- yang diambil daripada populasi itu.

SKALA PENGUKURAN

Definisi Pengukuran

 Pengukuran adalah satu prosedur untuk menggambarkan ciri-ciri atau tingkah laku

yang hendak dinilai itu dengan menggunakan nombor.

 Contoh: membuat pemeringkatan ke atas kepuasan hidup (1= sangat tidak puas hati, 10= sangat puas hati).

 Contoh lain berkaitan kebahagiaan (1 = Sangat tidak bahagia, 5 = Sangat bahagia)

Ciri-Ciri Skala Pengukuran

Adalah penting bagi seseorang penyelidik untuk mengenalpasti tahap pengukuran bagi data yang didapati sebelum sesuatu teknik analisis statistik digunakan.

Teknik yang hendak digunakan bergantung kepada jenis atau tahap data yang diperoleh.

 cth. Teknik Khi Kuasa Dua tidak sesuai untuk data yang bersifat sela.

Terdapat tiga ciri utama yang menyebabkan skala pengukuran berbeza antara satu sama lain: magnitude, sela yang sama (equal intervals ) dan kosong (0), mutlak (absolute 0)

Magnitude

Magnitude menunjukkan ciri “moreness ”.

Skala yang mempunyai ciri magnitude – ia boleh menunjukkan ciri sama ada lebih, kurang atau sama.

Cth. Ahmad (PNGK = 3.78) mempunyai pencapaian akademik yang lebih baik daripada Jamil (PNGK = 3.20)

Skala yang tidak mempunyai ciri magnitude A – pasukan bola sepak dibahagikan kepada Team 1, Team 2, Team 3 dan Team 4.

Skala di atas boleh menjadi skala yang mempunyai ciri magnitude sekiranya pasukan tadi disusun mengikut tempat kemenangan mereka.

Cth. No.1 adalah Team 3, No.2 adalah Team 1, No.3 adalah Team 4 dan terakhir adalah Team 2.

Sela yang sama (Equal Intervals)

Skala yang mempunyai ciri sela yang sama (equal intervals )

(7)

Perbezaan di antara dua titik pada sesuatu ukuran adalah sama kuantitinya dengan perbezaan di antara dua titik lain pada ukuran yang sama.

Cth. Perbezaan di antara 2 cm dan 4 cm pada satu pembaris menunjukkan kuantiti yang sama bagi perbezaan di antara 10 cm dan 12 cm, iaitu sebanyak 2 cm.

Dalam ujian psikologi jarang mempunyai ciri sela yang sama.

Cth. Perbezaan di antara IQ 45 dan 50 tidak menunjukkan makna yang sama dengan perbezaan di antara IQ 105 dan 110

Kosong (0) Mutlak ( Absolute 0 )

Kosong mutlak bermakna tiada ukuran yang wujud.

Cth. Denyutan jantung = 0, ini bermakna tiada kadar denyutan jantung atau bermakna orang itu telah mati.

Jenis Skala Pengukuran

Terdapat empat (4) jenis skala pengukuran: nominal, ordinal, sela(interval) dan nisbah(ratio).

Jadual 1: Skala pengukuran dan ciri-cirinya

Skala Nominal

 Skala nominal tidak mempunyai ketiga-tiga ciri magnitude, sela yang sama (equal intervals ) atau kosong mutlak (absolute 0 ).

 Skala nominal sebenarnya bukanlah satu skala, tujuannya hanya untuk menamakan sesuatu objek atau perkara atau hanya sebagai satu cara pengelasan sahaja.

 Skala nominal digunakan apabila maklumat itu adalah berbentuk kualitatif dan bukan kuantitatif.

 Contoh, jantina. Dalam soal selidik subjek yang dilabel mengikut jantina. 1=lelaki, 2=perempuan.

Skala Ordinal

 Skala ordinal mempunyai ciri magnitude tetapi tidak mempunyai ciri sela yang sama atau kosong mutlak.

 Skala ini membolehkan kita membuat pemeringkatan ke atas individu atau objek.

 Skala ini boleh menunjukkan perbezaan antara pilihan tetapi tidak menjelaskan perbezaan secara mutlak.

 Contoh item berkenaan tahap kepuasan kerja yang bersifat ordinal:

“Pekerjaan yang anda lakukan”

1. Sangat tidak puas hati

2. Tidak puas hati

3. Puas hati

4. Sangat puas hati

Kita tidak boleh menyatakan perbezaan antara 1 dan 2 adalah sama dengan perbezaan antara 3 dan 4.

Kita hanya boleh menganggapkan bahawa 4 adalah lebih puas dari 3 dan 3 adalah lebih puas dari 2 dan 2 lebih puas dari 1

Nombor-nombor hanyalah label mengikut urutan kepentingan sahaja.

Skala Sela (Interval Scale )

Skala ini mempunyai ciri magnitude dan sela yang sama tetapi tiada ciri kosong mutlak.

(8)

Skala ini mempunyai urutan atau pangkat serta anggapan bahawa perbezaan antara sela wujud.

Contoh: ukuran suhu dalam darjah Fahrenheit atau Celsius.

 Skala suhu ini mempunyai ciri magnitude – 35

lebih panas daripada 32 adalah lebih panas daripada 64 dan sebagainya.

 Perbezaan antara 90 F sebanyak 10 adalah sama dengan perbezaan antara 75

10

 Dalam skala Fahrenheit, suhu tidak mempunyai ciri kosong mutlak.

 Walaupun 0 menunjukkan tahap beku bagi skala Celcius, ia tidak menunjukkan kosong mutlak

 Oleh kerana skala ini tidak mempunyai ciri kosong mutlak maka kita tidak boleh membuat kenyataan dalam bentuk nisbah – suhu pada 22

lebih panas daripada suhu pada 11

Skala Nisbah (Ratio Scale)

Skala ini mempunyai ketiga-tiga ciri [magnitude, sela yang sama dan kosong mutlak (absolute 0 )].

contoh: umur, ketinggian, jarak dan kepantasan

 Seseorang yang berumur 20 tahun adalah dua kali umurnya dari seseorang yang berumur 10 tahun

 Ini bermakna perbandingan boleh dibuat dengan skala jenis ini

Transfomations: Skor Z

Skor Piawai Z ialah skor piawai yang mempunyai min sifar dan sisihan piawai 1. Rumusnya adalah seperti berikut:

di mana:

= skor piawai Z

= skor / data mentah

= min

= sisihan piawai

Transfomations: Skor Z

Contoh Skor Piawai Z yang diperolehi Amirul:

Skor piawai Z Ujian & Pengukuran = +2

Skor piawai z bagi U & P = +2 (0.9773) mempunyai pangkat peratusan sebanyak 98%. Ini bermaksud Amirul mendapat skor lebih baik berbanding 98% pelajar lain yang mengambil subjek ujian & pengukuran.

Transformations: Skor T

Jika kita menggunakan pengiraan skor z, terdapat nilai skor z berbentuk negatif contohnya nilai – 2.0.

Bagi mengelakkan nilai negatif ini, penggunaan pengiraan piawai T (Skor-T) boleh digunakan. Taburan skor T sama dengan

Ujian & Pengukuran

Skor Amirul ( ) 80 Min ( ) 70 Sisihan Piawai ( ) 5 F adalah F , 65 F F F -80

F -65 F yang juga sebanyak .

F adalah dua kali ganda F

(9)

taburan skor Z Cuma bezanya skor T mempunyai min 50 dan sisihan piawai 10. Rumusnya adalah seperti berikut:

= skor piawai T

= nilai skor piawai Z

Jadual & Taburan Normal Transformations

Lihat Table 5.1 (Murphy & Davidshofer, 2005) bagi transformasi data bagi ujian yang mempunyai min 100 dan sisihan piawai 15.

Lihat Figure 5.4 (Murphy & Davidshofer, 2005) bagi Taburan Normal.

Lihat Figure 3.10 (Hogan, 2003) untuk Taburan Normal.

Norma

Skor ujian-ujian psikologi yang mengukur sesuatu atribut jarang dalam bentuk skala pengukuran nisbah atau mutlak.

Dengan itu, satu cara yang paling baik dalam menjelaskan prestasi seseorang dalam sesuatu ujian adalah dengan membandingkan skor ujiannya dengan skor ujian orang lain atau skor ujian bagi sesuatu kumpulan.

Tafsiran berdasarkan norma (Norm-based interpretation ) – prestasi ujian seseorang ditafsir dengan membandingkan skor ujiannya dengan skor ujian bagi beberapa orang lain (kumpulan normatif yang dijadikan set piawai).

Skor-skor yang dijadikan perbandingan itu dikenali sebagai norma, ia memberi satu piawai atau standard bagi mentafsir skor ujian yang diperoleh seseorang individu dan

Ia menunjukkan kedudukan seseorang individu apabila dibandingkan dengan sekumpulan normatif tertentu yanng dijadikan set piawai

Dalam membuat tafsiran skor, beberapa kumpulan yang berbeza mungkin digunakan untuk mendapat maklumat normatif.

Contoh:skor yang diperoleh oleh seorang setiausaha dalam ujian kepantasan menaip tahap awal boleh dibandingkan dengan Skor ujian kepantasan menaip daripada:

1. Orang umum

2. Jurutaip yang berpengalaman

3. Setiausaha juga kelulusan menaip tahap awal.

Contoh di atas menjelaskan dua fakta penting:

1. Kumpulan normatif tidak semestinya daripada satu populasi sahaja.

2. Daripada skor yang diperoleh banyak tafsiran berdasarkan norma boleh dibuat, ia bergantung kepada kumpulan normatif mana dipilih

Fakta di atas menjelaskan bahawa pendefinisian dan tujuan pembentukan norma haruslah jelas.

Jenis-jenis Norma

Tiga bentuk data normatif yang paling umum adalah persentil, norma umur dan norma grade.

Pangkat persentil

 Bentuk norma yang paling umum.

 refer Table 5-3 (Murphy & Davidshofer, 2005) Norma Umur

 Banyak ciri-ciri psikologikal berubah mengikut masa – bahasa, kebolehan matematik dan penakulan moral.

(10)

 Norma umur mengkaitkan tahap prestasi seseorang dengan umurnya.

 refer Table 5-4 (Murphy & Davidshofer, 2005) Norma Grade

 Norma Grade seakan norma umur tetapi ia berdasarkan grade.  Norma ini banyak digunakan dalm melaporkan tahap pencapaian

kanak-kanak di sekolah

Persentil & Pangkat Persentil

Seseorang pelajar (Contohnya Ali mendapat skor 70) sudah tentu ingin mengetahui berapa orang pelajar yang mendapat skor/markat stres yang sama; atau yang mendapat skor/markat stres di bawahnya. Dengan kata lain, Ali ingin tahu kedudukan skornya dalam taburan skor-skor itu. Kaedah Persentil boleh digunakan bagi menjawab persoalan tersebut.

Berikut pula beberapa persoalan yang berkaitan persentil:

Adakah skor stres 70 Ali berada di dalam atau luar julat kumpulan pelajar yang mengalami stres?

Adakah skor 70 menghampiri atau berada jauh daripada min kumpulan pelajar? Atau skor itu berada di tengah-tengah taburan atau di hujung taburan? Jika skor tersebut terletak di hujung taburan data, adakah kedudukan stres Ali berada di sebelah rendah atau tinggi?

Berapa banyakkah skor yang tertabur di sebelah atas dan sebelah bawah skor tersebut?

Persentil merupakan titik atau skor/ markat yang terletak pada atau di bawah peratus yang ditentukan dalam sesuatu taburan.

Misalnya, median merupakan satu titik atau skor/ markat yang terletak di tengah-tengah taburan di mana sebanyak 50% markat dalam taburan berada di bawahnya sementara 50%

markat lagi berada di atasnya. Oleh itu, median boleh ditakrifkan sebagai persentil 50 (P50).

Persentil 90 (P90) menunjukkan terdapat satu markat di mana sebanyak 90% markat-markat lain dalam taburan terletak pada markat tersebut dan di bawahnya.

Jika persentil 90 bagi markat stres pelajar ialah 75, ini bermakna sebanyak 90% sampel dalam taburan yang mengambil satu ujian tersebut mempunyai markat 75 ke bawah.

Pangkat persentil (PP) menunjukkan banyaknya skor/ markat/ kes yang berada pada sesuatu markat atau di bawah markat tersebut. Ia dinyatakan dalam bentuk peratus.

PP membolehkan kita menentukan berapa peratus yang berada pada atau di bawah skor/ markat yang diberi. Sebagai contoh, pangkat persentil kepada skor / markat 75 ialah 90 (PR75). Ini bermakna sebanyak 90% skor / markat / kes berada pada skor / markat 75 ke bawah.

Tracking

 For a variety of physical characteristics, children tend to stay at about their same percentile level, relative to other children in their age group, as they grow older

 This tendency to stay at about same level relative to one’s peers is known as tracking.

 refer Figure 2-8 and Figure 2-9 (Kaplan & Saccuzzo, 2001)

KULIAH 3 : RELIABILITI/ KEBOLEHPERCAYAAN

INTRODUCTION

 Jack takes the college admissions test on Saturday, October 2, after a really tough week in school capped off by a Friday night football game. Jill also takes the test on the same date, feeling sharp as a tack and ready to whip the world.

(11)

– Would Jack and Jill get substantially different scores if

they were to take the test on Saturday, October 9, when their personal circumstances might be somewhat different?

– Terry’s chemistry class includes 700 freshmen. To

discourage cheating during an exam, the professor takes 100 test problems and divides them randomly into 4 sets of 25 problems each. Call them form A, B, C and D of the exam. The forms are distributed randomly to the class.

– Would Terry’ s score differ much if he took form A rather

than form B.

 How much do scores on a personality test fluctuate from day to day? How similar are scores on an essay test depending on who scores the test? When two clinicians use a form to rate the severity of psychological maladjustment, are they likely to agree in their ratings?

 All these questions relate to the topic of reliability. Sejarah dan Teori Reliabiliti

 Skor ujian yang diperoleh seseorang biasanya berbeza daripada kebolehan sebenar individu berkenaan.

 Perbezaan skor ini adalah biasa dalam ukuran berkenaan ciri manusia.

 Perbezaan di antara kebolehan sebenar dan kebolehan pengukuran ini dikenali sebagai ralat pengukuran.

 Ralat pengukuran dalam ujian psikologi bukan menunjukkan kesilapan yang telah dilakukan tetapi menunjukkan ketidaktepatan pengukuran tersebut.

 Tugas seorang pengguna ujian adalah untuk mengenalpasti nilai ralat berkenaan dan mencari jalan untuk meminimakannya.

 Ujian-ujian yang bebas daripada ralat pengukuran dikatakan adalah ujian yang reliable atau boleh dipercayai.

 Satu ujian yang reliable atau boleh dipercayai adalah ujian yang mana ia menghasilkan skor yang konsisten/tekal walaupun ujian itu diambil dua atau lebih kali oleh individu yang sama. Ataupun seseorang individu akan memperoleh skor yang tekal dalam dua borang/ujian alternate.

 Menurut Cronbach ( 1998), ujian yang reliable merujuk kepada ketepatan dan kejituan ujian itu dalam membuat ukuran. Persoalan di sini ialah “Adakah ujian yang sama jika diberikan semula kepada subjek yang sama akan menghasilkan keputusan yang sama?” – kosisten/tekal

Konsep Ralat

 Dalam bidang psikologi, tiada ukuran yang tegar (rigid ) untuk mengukur tret manusia seperti kecerdasan ataupun keagresifan dan sebagainya.

 Ukuran yang digunakan dalam psikologi mungkin akan menyebabkan pengguna ujian itu overestimate atau underestimate tret yang hendak diukur.

 Dengan demikian, ahli psikologi mesti menilai terlebih dahulu sebalum alat ukuran itu boleh digunakan.

Kajian Awal Spearman

 Pada tahun 1733 DeMoivre telah mengemukakan pendapat asas berkenaan ralat persampelan.

 Pada tahun 1896 Karl Pearson telah mengembangkan metod korelasi ( product moment correlation) .

 Pada tahun 1904 Spearman telah menggabungkan kedua-dua konsep itu dalam konteks pengukuran dan terbentuknya teori reliabiliti. Daripada itu,teori reliabiliti terus berkembang.

Teori Reliabiliti

 _{Reliabiliti ujian boleh dibahagikan dalam tiga konteks teoritikal:} 1. Classical test theory (CTT)

(12)

2. Item response theory (IRT)

3. Generalizability theory (GT)

Teori Ujian Klasik ( Classical test theory)

 Kata kunci dalam teori ujian klasik adalah skor diperoleh/skor diperhatikan(observed score )(O), skor sebenar (true score ) (T) and skor ralat (error score) (E ).

Skor diperoleh/diperhatikan (observed score )

 Skor diperoleh/diperhatikan (observed score ) adalah skor yang diperoleh (ataupun skor mental) seseorang individu dalam sesuatu ujian.

 Skor diperoleh/diperhatikan (observed score ) mungkin dipengaruh secara positif ataupun negatif oleh sumber-sumber yang menyebabkan ketidaktekalan skor.

– Skor diperoleh mungkin lebih tinggi kerana individu

boleh meneka betul jawapan. Atau skor ini mungkin lebih rendah disebabkan individu itu mungkin tidak sihat semasa mengambil ujian.

Skor sebenar

 Skor sebenar adalah skor diperoleh seseorang sekiranya semua sumber yang menyebabkan ketidaktekalan skor itu dihapuskan.

 Purata skor yang diperoleh daripada banyak kali tadbiran ujian (secara teori) pada masa yang berbeza dan sedikit perbezaan keadaan – purata atau min skor itu sepatutnya sama dengan skor sebenar.

 The true skor is what we really want to know, but in practice we never know it.

Skor Ralat (Error Score )

 Skor ralat adalah perbezaan di antara skor sebenar dan skor diperoleh.

 Skor ralat (E ) mungkin dalam bentuk positif atau negatif.  Teori skor ujian klasik mengandaikan bahawa dalam skor ujian

yang diperoleh seseorang individu adalah skor sebenar sekiranya tiada ralat dalam pengukuran itu.

 Namun, alat kajian biasanya adalah tidak sempurna, di mana skor yang diperoleh/skor yang diperhatikan pada kebanyakan masa adalah berbeza daripada ciri atau kebolehan sebenar seseorang.

 Teori reliabiliti ujian dikemukakan untuk membantu dalam menilai kesan ketidaktekalan skor pada pengukuran psikologikal.

 Menurut teori relibiliti, skor ujian menggambarkan pengaruh dua faktor:

1. Faktor-faktor yang menyumbang kepada ketekalan: ciri-ciri atau atributstabil yang hendak diukur.

2. Faktor-faktor yang menyumbang kepada ketidaktekalan: keadaan individu atau situasi yang boleh mempengaruhi skor ujian, tetapi tidak berkaitan dengan atribut yang hendak diukur.

 Ini menunjukkan dalam skor ujian/skor yang diperoleh/diperhatikan (observed score ) (O) mempunyai dua komponen iaitu, skor sebenar (T) dan ralat ( E ):

O (skor diperhatikan) = T (skor sebenar) + E (ralat)

 Atau, perbezaan yang wujud di antara skor sebenar dan skor yang diperhatikan adalah akibat daripada ralat pengukuran.

X – T = E

 Matlamat teori reliabiliti adalah untuk menilai ralat dalam pengukuran dan mencadangkan cara untuk memperbaiki supaya ralat pengukuran boleh diminimakan.

 Satu andaian teori reliabiliti adalah ralat pengukuran secara asasinya adalah random.

(13)

 Istilah random di sini bukan bermakna ralat itu berlaku kerana proses pengambilan sampel secara random.

 Tetapi ia bermakna, jika nilai ralat adalah tinggi dalam skor ujian seseorang individu, ia boleh senang diambilkira sekiranya kita tahu semasa mengambil ujian individu berkenaan mungkin a) mengulang kaji sampai larut malam b) duduk di tempat yagn bising semasa mengambil ujian, c) guna borang menjawab yang salah.

 Dalam kes individu, ralat dalam pengukuran bukanlah perkara random sepenuhnya.

 Tetapi dalam sekumpulan individu, punca-punca yang menyebabkan ralat pengukuran diandaikan adalah pelbagai dan kompleks. Dengan demikian, ralat pengukuran bertindak sebagai pembolehubah random.

 Jika ralat mempunyai ciri-ciri asasi pembolehubah random, maka wajarlah diandaikan bahawa secara sama rata ralat mungkin wujud dalam bentuk positif atau negatif dan ia tidak berkorelasi dengan skor sebenar dan ralat-ralat pada ujian lain.

 Dengan itu, ralat pengukuran diandaikan:  Min bagi ralat pengukuran = 0

 Skor sebenar dan ralat adalah tidak berkorelasi: r = 0  Ralat pada ukuran-ukuran lain adalah tidak berkorelasi r

= 0

 Mengikut teori reliabiliti, varians bagi skor diperolehi adalah sama dengan jumlah varians bagi skor sebenar dan varians bagi ralat pengukuran. Iaitu:

σ 2

X =σ 2T +σ 2e

 Kenyataan di atas mencadangkan bahawa skor ujian berbeza adalah hasil daripada dua faktor:

1. perubahan dalam skor sebenar

2. perubahan akibat daripada ralat pengukuran.

3. Maka, Jika nilai ralat pengukuran adalah tinggi dalam skor yang diperolehi, skor ujian yang diperoleh akan tidak tekal.

 Jika ralat pengukuran hanya memberi sedikit kesan ke atas skor ujian, skor ujian yang diperoleh adalah tekal.

Pekali Reliabiliti (r xx)

 Pekali reliabiliti menggambarkan pengaruh relatif skor sebenar dan skor ralat ke atas skor yang diperoleh/ diperhatikan.

 Secara umum, pekali reliabiliti didefinisi sebagai nisbah varians skor sebenar kepada jumlah varians bagi skor ujian

r xx = σ 2T r xx = σ 2T

σ 2

X σ 2T + σ 2e Sumber-Sumber Ralat

 Perbezaan wujud di antara skor yang diperoleh dan skor sebenar mungkin disebabkan:

1. Faktor situasi – bunyi bising dalam bilik ujian, bilik ujian mungkin terlalu sejuk atau panas, subjek mungkin jatuh sakit atau mengalami depresi semasa mengambil ujian.

2. Item-item pada ujian mungkin tidak dalam mewakili/mengukur domain atau gagasan yang hendak diukur.

METOD-METOD PENILAIAN RELIABILITI

 Tujuan penilaian reliabiliti adalah untuk mengenalpasti sejauh mana perubahan skor ujian itu dipengaruhi oleh ralat pengukuran dan skor sebenar.

 Model ujian parallel mencadangkan satu strategi untuk mencapai tujuan itu.

(14)

Model Ujian Parallel

 Mengikut model ujian parallel adalah mungkin untuk membentuk dua borang ujian yang sama di mana skor sebenar yang diperoleh seseorang dalam borang borang A adalah sam a dengan skor sebenar yang diperoleh pada borang B.

 Jika kedua-dua borang itu ditadbir kepada sekumpulan orang, perbezaan skor pada borang A dan borang B adalah semata-mata disebabkan ralat pengukuran.

 Dengan demikian, jika skor pada kedua-dua borang itu menunjukkan perbezaan skor yang besar , ralat pengukuran merupakan punca utama bagi perubahan skor ujian.

 Sebaliknya, jika skor pada kedua-dua borang itu menunjukkan tinggi persamaan, ralat pengukuran ralat pengukuran adalah kecil dan ujian itu mempunyai r eliabiliti yang tinggi.

 Model ujian parallel memberi solusi konseptual sahaja dalam menilai reliabiliti dan bukan solusi praktikal, kerana ujian parallel adalah amat sukar dibentuk.

 Dengan itu, empat strategi penilaian reliabiliti ujian yang lebih praktikal telah diperkenalkan iaitu:

 Metod Test-Retest  Metod Alternate Forms  Metod Split-Half

 Metod Ketekalan Dalaman (Internal Consistency ) –menilai bagaimana prestasi seseorang itu pada item-item yang serupa dalam borang ukuran yang sama.

Metod Test-Retest

 Metod test retest adalah metod yang paling awal diperkenalkan dan ia merupakan metod yang paling muhasabah/praktis.

 Metod test retest menilai secara langsung sejauh mana skor-skor ujian itu adalah tekal daripada tadbiran ujian pertama kepada tadbiran ujian kedua.

 Penilaian reliabiliti dengan metod test-retest melibatkan: a. Tadbir sesuatu ujian kepada sekumpulan subjek.

b. Tadbir semula ujian yang sama kepada kumpulan subjek yang sama setelah satu jangka masa.

c. Korelasikan skor ujian pada kali pertama dengan skor ujian pada kali kedua.

d. Hasil korelasi atau pekali korelasi menggambarkan reliabiliti ujian berkenaan.

e. Korelasi yang tinggi menunjukkan ujian berkenaan mempnyai reliabiliti yang tinggi.

 Rational metod test retest adalah disebabkan ujian yang sama ditadbir dua kali dan setiap ujian itu adalah parellel, maka perbezaan di antara skor ujian dengan skor ujian semula sepatutnya adalah disebabkan ralat pengukuran.

 Namun, kenyataan di atas adalah benar bagi pengukuran fizikal seperti ukuran pembaris dan tidak sentiasa benar bagi pengukuran psikologikal.

 Perbezaan skor ujian psikologikal pada tadbiran kali pertama dan kali kedua mungkin disebabkan (masalah teoritikal):

1. Ciri-ciri atau atribut yang diukur mungkin telah berubah antara ujian pertama dan ujian semula (cth. a spelling test).

(15)

2. Reactivity - subjek telah mempunyai pengalaman menggambil ujian.

3. Kesan bawaan - subjek masih ingat jawapan yang diberikan pada ujian kali pertama (jika jarak masa bagi tadbiran ujian kali pertama dan kali kedua terlalu pendek).

 Limitasi praktikal metod test retest adalah ujian perlu ditadbir sebanyak dua kali, ia mengambil masa yang lama dan metod penilai ini adalah mahal.

 Metod test retest paling sesuai digunakan jika seseorang itu berminat tentang ukuran yang long-term stability (cth., temporal stability of job performance measures)

Metod Alternate Forms

 Satu kunci metod alternate forms bagi menilai reliabiliti alat kajian ialah wujudkan borang/ soal selidik alternatif yang selari dari segi kandungan, proses tindakan dan ciri-ciri statistiknya dengan borang/ soal selidik pertama.

 Penilaian reliabiliti dengan metod alternate forms melibatkan: a. Tadbir ujian (Borang A) kepada sekumpulan subjek.

b. Tadbir ujian (Borang B atau Borang alternatif) kepada kumpulan subjek yang sama setelah satu jangka masa.

c. Korelasikan skor ujian (Borang A) dengan skor ujian (Borang B).

d. Hasil korelasi digunakan untuk menilai reliabiliti ujian.

e. Tinggi korelasi menunjukkan ujian berkenaan mempunyai reliabiliti yang tinggi.

 Kekuatan metod alternate forms :

a. Mengatasi masalah kesan bawaan dalam metod test-retest.

b. Mengatasi masalah kesan reactivity dalam metod test-retest.

c. Jangka masa untuk tadbir ujian (Borang B) lebih pendek berbanding metod test-retest.

d. Kelemahan metod alternate forms :

e. Mahal dan tidak praktikal.

f. Susah untuk membentuk borang alternatif.

g. Sukar untuk mengenalpasti keselarian/ parallel antara dua borang berkenaan.

Metod Split-Half

 Metod split-half memberi satu solusi pada dua masalah praktikal dalam metod alternate forms, iaitu:

1. Kesukaran membentuk borang alternatif.

2. Pentadbiran ujian sebanyak dua kali.

3. Kesan bawaan, kesan reaktiviti dan terutamanya kesan perubahan masa ke atas skor ujian boleh diminimakan.

4. Penilaian reliabiliti dengan metod split-half melibatkan:

5. Tadbir ujian kepada sekumpulan subjek.

6. Pecahkan/ bahagikan ujian itu kepada dua bahagian.

7. Korelasikan skor ujian bagi bahagian pertama dengan skor ujian bagi bahagian kedua.

8. Hasil korelasi digunakan untuk menilai reliabiliti ujian.

9. Tinggi korelasi menunjukkan ujian berkenaan mempunyai reliabiliti yang tinggi.

 Ketidaktekalan skor yang diperoleh pada d ua pecahan ujian yang berbeza menggambarkan ketidaktekalan respon subjek ke atas

(16)

ujian itu dan bukan disebabkan perubahan yang berlaku pada individu berkenaan.

 Terdapat beberapa cara untuk membahagi ujian kepada dua bahagian, iaitu membahagi ujian mengikut:

1. jumlah item dalam sesuatu ujian (cth, jumlah item = 40, bahagian 1 = 20 item, bahagian 2 = 20 item)

2. nombor ganjil-genap item ujian itu (odd-even split ).

3. Dalam proses pembahagian, pengguna ujian harus mengenalpasti bahawa bahagian pertama dan bahagian kedua ujian itu adalah serupa dari segi kandungan, proses tindakan dll.

 Kekuatan metod split-half :

1. Mengatasi masalah membentuk borang alternatif.

2. Hanya sekali tadbiran ujian.

3. Mengatasi masalah kesan bawaan

4. Mengatasi masalah reactiviti.

5. Kelemahan metod split-half :

6. Satu kelemahan paling nyata metod ini ialah terdapat banyak cara untuk membahagi ujian kepada dua bahagian. Cara pembahagian yang pelbagai menghasilkan korelasi yang berbagai (rujuk Jadual 2).

Metod Ketekalan Dalaman

 Penilaian reliabiliti metod ini adalah berdasarkan jumlah item dalam ujian (K) dan purata inter-korelasi antara item-item dalam ujian (rij).

rij= K(rij)

1 + (K-1) rij

 Penilaian reliabiliti dengan metod ketekalan dalaman melibatkan: a. Tadbir ujian kepada sekumpulan subjek.

b. Kira korelasi antara semua item dan kira purata inter-korelasi antara item-item dalam ujian berkanaan.

c. Gunakan formula rij= K(rij)

1 + (K-1) rij

 Kekuatan metod ketekalan dalaman : Jadual 2

cara Item Uji an I tem Uji an Reli abi li ti

Membahagi Bahagian A Bahagian B

1 1 2 3 4 5 6 0.64 2 1 2 4 3 5 6 0.68 3 1 2 5 3 4 6 0.82 4 1 2 6 3 4 5 0.79 5 1 3 4 2 5 6 0.88 6 1 4 5 2 3 6 0.81 7 1 5 6 2 3 4 0.82 8 2 3 5 1 4 6 0.72 9 2 4 5 1 3 6 0.71 10 2 4 6 1 3 5 0.74

Enam Item Kepada Dua Ba hagian

(17)

a. lebih praktikal.

b. Sekali sahaja tadbiran ujian.

c. Penilaian reliabiliti boleh dilakukan setiap kali ujian itu ditadbir.

PENILAIAN RELIABILITI DAN RALAT

 Empat metod penilaian reliabiliti mengandungi sumber perubahan skor masing-masing yang menyumbang kepada ralat pengukuran.

 Metod split-half dan metod ketekalan dalaman mendefinisikan ralat pengukuran dalam bentuk ketekalan dan ketidaktekalan kandungan ujian itu sendiri.

 Metod test-retest dan metod alternate forms mendefinisikan ralat pengukuran dalam tiga faktor umum:

a. ketekalan dan ketidaktekalan kandungan ujian itu sendiri.

b. Perubahan pada subjek setelah satu jangka masa.

c. Kesan pengambilan ujian pertama ke atas pengambilan ujian kedua.

KULIAH 4 : MENTAFSIR & MENGGUNAKAN MAKLUMAT RELIABILITI UJIAN

OBJEKTIF PEMBELAJARAN

• Bagaimana maklumat reliabiliti boleh digunakan dalam menilai, mentafsir

dan membaiki ujian psikologikal.

• Membincangkan hubungan di antara reliabiliti dan ketepatan skor-skor

ujian.

• Membincangkan hubungan di antara reliabiliti dengan validiti ujian.

• Faktor-faktor yang mempengaruhi reliabiliti skor ujian.

Menggunakan Maklumat Reliabiliti

• Pekali reliabiliti membekalkan maklumat penting berkenaan sesuatu ujian.

• Pekali reliabiliti boleh digunakan dalam dua perkara penting iaitu:

1. Menganggar sejauh mana perubahan skor ujian adalah akibat daripada ralat pengukuran.

2. Menganggar kesan ketidakbolehpercayaan (unreliability ) sesuatu ujian daripada kolerasi di antara ujian-ujian.

3. Pekali reliabiliti membekalkan maklumat berkenaan ukuran relatif ketetapatan skor

4. Cth. Satu ujian yang mempunyai pekali reliabiliti .90 adalah lebih reliable daripada ujian yang mempunyai reliabiliti .80.

5. Pekali reliabiliti tidak membekalkan petunjuk mutlak berkenaan ketepatan skor sesuatu ujian.

• Ini kerana implikasi praktikal nilai pekali reliabiliti ke atas ketepatan skor

ujian tidak dapat dibuktikan secara langsung. Tafsiran praktikal skor ujian perlu bergantung pada ralat piawai pengukuran.

• Maka, untuk menjelaskan ketepatan skor ujian secara konkret, kita perlu

mengetahui terlebih dahulu nilai/saiz ralat piawai pengukuran.

• Semakin besar nilai ralat piawai pengukuran, semakin tidak tepat skor

ujian/atribut yang telah diukur.

• Sebaliknya, ralat piawai pengukuran yang kecil menunjukkan skor yang

diperoleh itu adalah dekat dengan nilai yang diukur atau lebih tepat skor ujian berkenaan.

• The standard error of measurement (SEM) (Ralat piawai pengukuran ) is

the standard deviation of a hypothetically infinite number of obtained scores around the person‟s true score.

• Refer Figure 1a and 1b

• Refer Figure 1, each of these distribution has a standard deviation. This

particular kind of standard deviation is called a standard error of measurement.

(18)

• The distribution on the right in Figure 1 has a relatively large SEM. The

distribution on the left in Figure 1 has a relatively small SEM.

• If test reliability is perfect (r = 1.00), SEM = 0 – that is no measurement

error.

• Ralat piawai pengukuran (The standard error of measurement - SEM)

adalah satu fungsi daripada dua(2) faktor:

1. Reliabiliti ujian (rxx)

2. Perubahan skor-skor ujian (δx)

SEM = δ x

• SEM = ralat piawai pengukuran

• δ_x= sisihan piawai skor-skor ujian

• r_xx= pekali reliabiliti

– Cth: satu ujian IQ dengan: min = 100, sisihan piawai = 14,

reliabiliti ujian = .89 dan skor yang diperoleh subjek = 106.

SEM = 14

• Ralat piawai pengukuran yang diperoleh ini kemudiannya boleh

digunakan untuk membentuk sela keyakinan (confidence intervals ) yang berlingkar di antara skor yang diperoleh/ diperhatikan, dan menggunakan prosedur statistik untuk membuat anggaran kedudukan skor sebenar dalam sela keyakinan berkenaan.

• Sela keyakinan yang biasa digunakan dalam ujian psikologi

adalah sela 68% , sela 95% dan sela 99% - sela ini dibentuk dengan menggunakan skor Z .

• Cth: kita ingin membentuk sela keyakinan 95% bagi ujian IQ

daripada contoh sebelum.

• Sela keyakinan 95% ditukar kepada skor z = 1.96.

• Kawasan atasan sela keyakinan adalah sama dengan min campur

1.69xSEM. Kawasan bawah sela keyakinan adalah sama dengan min tolak dengan 1.69xSEM.

• Bagi contoh di atas, kawasan atasan adalah

• 106 + 1.96(4.64) = 115.09

• Kawasan bawah adalah:

• 106 – 1.96(4.64) = 96.91

• 95% daripada taburan normal, sela keyakinan adalah bersamaan (96.9

hingga 115.1).

• Daripada itu, walaupun kita tidak pasti skor IQ sebenar bagi individu yang

memperoleh skor 106, tetapi 95% kita yakin bahawa skor sebenar individu berkenaan adalah terletak di antara 96.9 hingga 115.1.

Hubungan Di Antara Reliabiliti Dengan Validiti Ujian

• Reliabiliti membawa implikasi kepada validiti ujian (sama ada validiti

pengukuran atau validiti membuat keputusan).

• Sesuatu ujian yang valid/ sah mestilah reliable. Tetapi ujian yang reliable

tidak semestinya valid/sah.

• Contoh: ujian IQ yang tinggi reliabilitinya tetapi tidak valid.

1. Anda dilahirkan pada bulan __________.

2. Siapa nama ibu anda? ____________.

3. 1 + 1 = ________.

4. Berapa hari dalam satu minggu? _________.

Faktor-Faktor Yang Mempengaruhi Reliabiliti Ujian

Sumber-sumber ralat pengukuran yang mempengaruhi reliabiliti skor ujian adalah: 1- r xx

(19)

a. Kepanjangan Ujian

– semakin banyak item (ukur tret atau atribut yang sama) semakin

reliable sesuatu ujian.

– Setiap item ujian itu bertindak sebagai satu permerhatian ke atas

pengetahuan, kemahiran, kemampuan atau tret lain individu yang mengambil ujian.

– Semakin banyak permerhatian semakin tepat sesuatu ukuran itu.

b. Kehomogenan Item-Item Ujian

– reliabiliti meningkat jika item-item sesuatu ujian itu adalah

homogen - mengukur faktor yang sama.

– Ujian yang mengandungi item-item heterogen dijangkakan

mempunyai pekali reliabiliti yang rendah.

a. Jarak masa uji dan uji semula / test-retest.

– Semakin lama jarak masa semakin rendah pekali reliabiliti.

– Tret atau atribut bagi seseorang individu mungkin telah berubah

setelah satu jangka masa yang lama - skor sebenar telah berubah.

– Meningkatkan ralat pengukuran yang mungkin diakibatkan

-tadbiran ujian, perubahan yang berlaku pada persekitaran atau situasi subjek.

c. Tadbiran Ujian

– arahan yang diberikan semasa tadbiran ujian. Arahan haruslah

sama bagi setiap kali tadbir ujian.

– Arahan yang sama boleh mengurangkan ralat daripada tindakan

berbeza subjek.

– Konsisten dari segi tadbiran ujian boleh elak ralat akibat daripada

persekitaran tadbiran ujian yang berbeza.

d. Permarkatan

– bersihkan data sebelum analisis.

– Pastikan tiada kesilapan semasa memasukkan data.

e. Kerja sama daripada subjek kajian

– kenalpasti sama ada subjek jawab dengan jujur atau tidak.

– Peranan pentadbir ujian untuk mendapat kerjasama daripada

subjek.

– Semak soal selidik atau jawapan yang diberikan oleh subjek.

f. Metod yang digunakan untuk menilai reliabiliti

– Metod yang berbeza mempunyai definisi yang berbeza ke atas

skor sebenar dan ralat pengukuran.

– Contoh: atribut yang berubah mengikut masa merupakan ralat

pengukuran jika penilaian reliabiliti dengan metod test-retest.

– Reliabiliti ujian yang dinilai dengan metod ketekalan dalaman

dan split-half dijangkakan mempunyai tahap reliabiliti yang lebih tinggi berbanding dengan menggunakan metod test-retest atau alternate form (lebih faktor yang menyumbang kepada ralat pengukuran)

MENTAFSIR PEKALI RELIABILITI

• Dua perkara penting yang harus diberi perhatian dalam mentafsir pekali

reliabiliti/korelasi:

a. Petanda nilai pekali (positif atau negatif)

• ujian yang reliable petanda nilai pekali mestilah dalam

bentuk positif atau hubungan positif.

b. Nilai pekali itu sendiri (-1 korelasi negatif sempurna, +1 korelasi positif sempurna)

(20)

• Nilai pekali yang dekat dengan positif satu (+1)

menunjukkan tahap reliabiliti yang tinggi dan sebaliknya, nilai pekali yang dekat dengan kosong (0) atau nilai pekali bentuk negatif menunjukkan tahap reliabliti yang rendah.

c. contoh: ujian yang pekali reliabiliti = +0.91. Pekali 0.91 adalah dekat dengan +1, ini menunjukkan ujian itu mempunyai tahap reliabiliti yang tinggi.

d. Pekali positif menjelaskan subjek yang mendapat skor tinggi/rendah pada kali pertama tadbiran ujian, mendapat skor tinggi/rendah (skor yang lebih kurang sama) pada kali kedua tadbiran ujian.

Sejauh Mana Tahap Reliabiliti Ujian Dikatakan Adalah Reliable?

• Tiada nilai tetap yang boleh digunakan untuk mentafsir reliabiliti sesuatu

ujian sama ada tahap reliabilitinya memuaskan atau tidak. Dan jawapannya bergantung kepada tujuan kegunaan ujian berkenaan.

• Bagi tujuan penyelidikan, jika sesuatu ujian itu menunjukkan tahap

reliabiliti dalam lingkungan .70 dan .80 dikatakan adalah cukup baik.

• Dalam latar klinikal, ujian yang digunakan harus mempunyai tahap

reliabiliti yang tinggi.

1. Ujian yang digunakan harus mempunyai tahap reliabiliti yang tinggi jika:

a. ujian itu digunakan untuk membuat sesuatu keputusan penting.

b. Individu-individu yang dibahagikan kepada banyak kategori dengan berdasarkan perbezaan kecil di antara individu-individu berkenaan.

2. Tahap reliabiliti ujian rendah boleh diterima jika:

a. ujian itu hanya digunakan untuk membuat tapisan awal.

b. Ujian digunakan untuk membahagikan individu-individu kepada beberapa kategori sahaja dengan berdasarkan perbezaan keseluruhan individu-individu berkenaan.

c. Bagi Ujian IQ yang mempunyai

a. Pekali reliabiliti = 0.90 (tahap reliabiliti tinggi)

b. Pekali reliabiliti = 0.80 (tahap reliabiliti sederhana)

c. Pekali reliabiliti = 0.70 (tahap reliabiliti rendah)

d. Bagi ujian digunakana untuk membuat tapisan awal

a. Pekali reliabiliti = 0.60 (tahap reliabiliti ini masih boleh diterima).

Cara Meningkatkan Reliabiliti Ujian

• Dua kaedah umum untuk memperbaiki reliabiliti ujian adalah:

1. Meningkatkan kepanjang ujian dan singkirkan item-item yang lemah yang mana menurunkan tahap reliabiliti ujian.

2. Menganggarkan kolerasi sebenar jika tidak wujudnya ralat pengukuran.

1. Meningkatkan Jumlah Item

– Mengikut model persampelan, setiap item dalam ujian adalah

satu sampel tret yang berasingan.

– Maka, semakin besar sampel ujian itu semakin boleh

mewakili/mengukur ciri-ciri sebenar yang hendak diukur.

– Reliabiliti ujian meningkat dengan peningkatan jumlah item

ujian.

– Formula Spearman-Brown boleh digunakan untuk menganggar berapa

banyak item yang perlu ditambah untuk meningkatkan reliabiliti ujian ke tahap yang boleh diterima.







d



o o d

r

N

  

1

(21)

• Cth: seorang pengkaji ingin meningkatkan reliabilit ujian EQ yang

mempunyai 20 item dengan tahap reliabiliti.87 kepada tahap reliabliti .95.

• Hasil pengiraan itu menunjukkan pengkaji itu perlukan 2.82 ujian yang

mana mengandungi 20 item.

• Maka, hasil pengiraan 2.82 harus didarab dengan 20 item iaitu, 2.82 x 20

item = 56.4.

• Ini bermakna untuk meningkatkan reliabiliti ujian kepada .95, item ujian

itu haruslah ditambah daripada 20 item kepada 56 item.

2. Analisis Faktor dan Analisis Item

• Reliabiliti ujian juga bergantung kepada adakah k esemua item dalam ujian

itu mengukur ciri-ciri yang sama.

• Untuk mengenalpasati sama ada item-item itu mengukur perkara yang

sama, dua kaedah boleh digunakan:

1. Analisis faktor

# Ujian adalah reliable jika ia adalah unidimensional

# Item-item yang tidak terletak dalam faktor yang terhasil (faktor mengira varians yang terbesar) boleh disingkirkan.

2. Analisis item

– Menilai kolerasi di antara setiap item dengan skor keseluruhan

ujian. Analisis ini dinamakan discriminability analysis.

– Apabila kolerasi di antara item tertentu dengan skor keseluruhan

ujian adalah rendah ini boleh dijelaskan:

– Item berkenaan mungkin mengukur perkara lain

daripada item-item dalam ujian itu.

– Item itu mungkin terlalu senang atau terlalu payah

sehingga ia tidak dalam membezakan skor-skor orang yang mengambil ujian.

– Korelasi item keseluruhan yang rendah menunjukkan item

berkenaan boleh menurunkan reliabiliti ujian dan item itu harus disingkirkan.

KULIAH 5 : VALIDITI PENGUKURAN: KENDUNGAN DAN GAGASAN

VALIDITI PENGUKURAN

 Dua permasalahan utama pengukuran psikologikal adalah untuk: 1. Mengenalpasti sama ada sesuatu ujian itu boleh mengukur apa

(atau atribut) yang hendak diukur.

2. Mengenalpasti sama ada sesuatu ujian itu boleh digunakan untuk membuat keputusan yang tepat.

Untuk menjawab permasalah ini, American Psychological Association‟s Technical Recommendations telah mengenalpasti

empat (4) cara untuk menilai validiti sesuatu ujian iaitu:

1. Validiti kandungan (Content validity )

2. Validiti gagasan (Construct validity )

3. Validiti ramalan (Predictive validity )

4. Validiti serentak (Concurrent validity )









.044 2.82 124 . 95 . 1 87 . 87 . 1 95 .      N

(22)

Keempat-empat strategi validasi ini direkabentuk untuk mencapai satu matlamat yang sama iaitu untuk memahami maksud dan implikasi skor sesuatu ujian.

 Kedua-dua strategi validasi kandungan dan gagasan merupakan kaedah bagi mengenalpasti sama ada sesuatu ujian itu boleh mengukur atribut yang hendak diukur.

– Kaedah ini mendefinisikan validiti dalam bentuk pengukuran

iaitu, sesuatu ujian itu dikatakan sah (valid ) jika ia boleh mengukur apa yang sepatut hendak diukur.

– Kedua-dua strategi validasi ramalan dan serentak pula

merupakan kaedah bagi mengenalpasti sama ada sesuatu ujian itu boleh digunakan untuk membuat keputusan yang tepat.

– Kaedah ini mengkaji validiti ujian dengan berdasarkan ramalan

dan keputusan yang dibuat daripada ujian berkenaan. Sesuatu ujian itu dikatakan sah (valid ) jika ia boleh digunakan untuk membuat keputusan yang betul atau tepat.

Perbezaan di antara validiti pengukuran dan validiti keputusan :

 Perbezaan kedua-dua jenis validiti pengukuran dan validiti keputusan boleh dijelaskan dengan merujuk kepada contoh ini: Sebuah organisasi ingin menggunakan alat kajian Leadership Skills Profile untuk membantu dalam permilihan pengurus organisasi. Sebelum menggunakan ujian ini, pihak organisasi akan mempersoalkan:

1. Adakah ujian itu boleh memberitahu mereka tentang kemahir an kepimpinan seseorang?

 Persoalan tentang validiti pengukuran ujian berkenaan. Adakah ujian itu boleh digunakan untuk mengukur

atribut kepimpinan?

2. Adakah orang yang mendapat skor tinggi dalam ujian ini akan merupa seorang pengurus yang baik nanti?

 Persoalan tentang validiti keputusan ujian berkenaan. Adakah ujian itu boleh digunakan untuk membuat

keputusan yang betul atau tepat?

Menilai Validiti Pengukuran

 Tidak terdapat satu piawai universal yang boleh dijadikan perbandigan/panduan kepada skor-skor yang diperoleh daripada ujian psikologi.

 Dengan demikian, ahli psikologi harus menggunakan kaedah-kaedah tidak langsung dalam mengenalpasti validiti sesuatu ujian. Misalnya, mengumpul bukti-bukti daripada pelbagai sumber untuk menunjukkan ujian itu boleh mengukur apa yang h endak diukur.

 Validiti kandugan boleh dikenalpasti deng an menilai kandungan ujian itu sendiri.

 Validiti gagasan boleh dikenalpasti dengan menilai hubungan di antara skor-skor sesuatu ujian dengan ukuran lain.

Strategi Validasi Berorientasi Kandungan

 Validiti kandungan boleh dikenalpasti dengan menilai sama ada sampel tingkah laku dalam sesuatu ujian itu merupakan satu sampel yang boleh mewakili atribut yang ingin diukur.

 _{Validiti kandungan sesuatu ujian bergantung kepada ujian itu sendiri dan} proses tindakan atau respon subjek terhadap ujian berkenaan.

 Dalam menilai validiti kandungan sesuatu ujian penilai boleh meneliti atau menilai sahaja setiap item dalam ujian dan memastikan adakah item itu mengukur atribut yang hendak diukur oleh ujian berkenaan. Namun cara ini tidak memadai.

 Maka, untuk mendapat bukti yang lebih kukuh tentang validiti kandungan sesuatu ujian itu penilai harus terlebih dahulu memahami konsep domain kandungan.

Domain Kandungan

 Satu deskripsi yang terperinci (detail description ) berkenaan domain kandungan merupakan asas bagi penilaian validiti kandungan.