Modul ke:
Fakultas Program Studi
Psikometri
NORMA 2
Arie Suciyana S., S.Si., M.Si.
Psikologi
Psikologi
Norma
•
Posisi/kedudukan seseorang dalam kelompok
Æ
patokan, acuan
•
Unit skala yang sama atau tidak, kasar-halus
•
Penggunaan norma tergantung tujuan tes.
Misal: T-score untuk melihat perbedaan yang cukup halus
(kecuali skor maksimal tes tidak terlalu besar, contoh:RS 0-30)
•
Didasarkan pada suatu kelompok yang
representatif mewakili populasi
NORMA
•
Hasil pengukuran psikologis = data
(skor) / skor mentah /
Raw score
:
•
Raw score bisa berupa:
•
Jumlah soal yang dijawab benar
•
Jumlah waktu untuk mengerjakan soal
•
Jumlah jawaban yang mengindikasikan
suatu ciri (jawaban “ya”)
Æ
tes
Mengapa diperlukan Norma?
•
Raw Score (RS)
yang dihasilkan dari
pengukuran
tidak mempunyai arti apa-apa
karena masih harus dihubungkan dengan
jumlah soal dan derajat kesulitan soal
Contoh:Bambang
•
Pada tes Arithmatik 1, dapat RS 15 dari 60 soal• Pada tes Arithmatik 2, dapat RS 30 dari 40 soal
• Pada tes Arithmatik 3, dapat RS 8 dari 10 soal Apa arti raw score di atas?
Æ Tidak bisa langsung diinterpretasi karena tidak ada patokan nilai
Mengapa diperlukan Norma?
• Pengukuran psikologis tidak mempunyai titik nol mutlak. Seseorang yang mendapat skor 80 tidak berarti 2 kali kemampuan skor 40 Æ selalu skala interval
• Perbedaan raw score tidak mencerminkan jarak yang sesungguhnya antarindividu yang
sesungguhnya
• Untuk dapat dimaknai, raw score individu harus diubah ke dalam bentuk Norma
Æ (raw score harus dikonversi menjadi scaled
PENGERTIAN NORMA
• ‘… performance by defined group on particular test
‘ (Kaplan & Saccuzzo)
• ‘……a set of values descriptive of the performance on a test on some specified group. Usually showed as a table giving equivalent values on some
derived score for each raw score on a test’ (Lyman, 1971)
• ‘…the test performance data of a particular group of testtakers that are designed for use as a
reference when evaluating or interpreting individual test scores.’ (Cohen & Swerdlik)
PENGERTIAN NORMA
• Penyebaran skor dari suatu kelompok standar yang dirancang sebagai acuan untuk mengevaluasi atau menginterpretasi skor yang diperoleh individu dalam suatu pengukuran.
• Patokan yang dipakai untuk menilai hasil tes (raw score) seseorang.
• Tidak harus dari kelompok peserta tes; bisa jadi dari teori yang digunakan.
• Jika norma didapatkan dari jumlah sampel yang besar dan representatif, norma tersebut bisa digunakan
Sampel harus merepresentasikan populasi
Æ
9
FUNGSI NORMA
• Menginterpretasikan skor yang diperoleh dari alat ukur
• Membandingkan posisi individu dengan individu lain
• Memaknai skor yang diperoleh individu dan
membandingkannya dengan skor kelompok dalam tes yang sama
• Mengambarkan kinerja individu di beberapa tes (intraindividu)
• Menggambarkan kinerja tes dari sampel yang sudah terstandardisasi
KELOMPOK STANDAR/NORMATIF
• Representatif mewakili populasi
• N cukup besar
Æ semakin besar N, semakin stabil norma; karena penyebaran mendekati normal dan tidak dipengaruhi oleh faktor kebetulan
• Sesuai dengan tujuan pengukuran
SCALED /CONVERTED SCORE
• Untuk mengetahui posisi individu, Raw Score(RS) diubah ke dalam skor relatif / Scaled Score/Converted Score/Derived Score
• Tujuannya:
oUntuk menunjukkan posisi relatif individu
dalam kelompok normatif, sehingga performa (skor) dapat dibandingkan dengan orang lain
(Antar-individu)
oUntuk memberikan ukuran yang memungkinkan perbandingan langsung performa (skor)
individu pada berbagai tes yang berbeda(
Cara umum untuk mengonversi RS
• Norma perkembangan (Developmental norms) Æ bagaimana perkembangan individu dibandingkan dengan kelompok sampel tertentu
• Norma Kelompok (Within Group Norms) Æ
membandingkan skor tes dengan performa kelompok subyek pada tes
Cara umum mengkonversikan RS
• Norma perkembangan (Developmental norms) Ada 3 macam :
• Mental AgeÆ Umur
• Grade Equivalents Æ Kelas
• Ordinal Scale Æ Tahap perkembangan (Gesell, Piaget)
• Norma Kelompok (Within Group Norm)
Cara umum mengkonversikan RS
• Norma perkembangan (Developmental norms)
• Norma Kelompok (Within Group Norm)
Prestasi kelompok standardisasi ini dinyatakan dalam skala :
• Persentil
• Standard score:
• Transformasi linear
• Transformasi non linear Æ Normalized standard score; T-score, Stanine score, C score
DEVELOPMENTAL NORMS
• Suatu cara untuk menafsirkan skor tes
berdasarkan tingkat perkembangan pada domain tertentu.
• Skor mentah yang dihubungkan dengan suatu norma perkembangan memperlihatkan sejauh mana perkembangan seseorang pada domain tersebut
• Terdiri dari 3 macam:
i. Mental Age,
ii. Grade Equivalent, dan
Mental Age
• Yang menjadi norma adalah nilai rata-rata yang diperoleh kelompok umur sampel standar pada tes tersebut
• Contoh terdapat pada skala Binet Simon
oItem-item dikelompokkan menurut tingkat umur oDalam tingkat umur 8 tahun terdapat item-item
yang dapat dikerjakan oleh sebagian besar anak-anak berusia 8 tahun pada sampel standar
• Skor yang dicapai seseorang anak memperlihatkan
Mental Age
• Skor yang dicapai seorang anak memperlihatkan tingkat umur perkembangannya
• misal nilai rata-rata umur 8 tahun pada tes X = 23
• Jika seorang anak mendapat skor 23 maka MA-nya = 8
→Kemampuan subyek setara dengan kemampuan anak usia 8 tahun
Mental Age
Bentuk test
• Soal soal dikelompokkan menurut tingkat umur.
• Test Binet - Simon (1908): 3 th – 13 th
• Soal soal untuk tingkat umur 7 th, adalah soal soal yang dapat dibuat oleh sebagian besar kelompok anak berumur 7 th (kelompok standardisasi)
Mental Age
Cara menghitung MA
• Hitung Basal Age (BA), yaitu usia tertinggi di
mana pada usia itu dan di bawah usia tsb semua item tes dapat dijawab dengan benar
• Hitung kredit tambahan, yaitu jumlah item yang dapat dijawab betul di atas Basal Age
• MA = Basal age + Kredit tambahan
Contoh Perhitungan MA
Umur Soal
1 Soal 2 Soal 3 Soal 4
6
+
+
+
+
7-
-
+
+
8+
+
-
-9
-
+
+
+
10+
-
+
+
11+
-
+
-12
-
-
-
-21
Jadi MA = 6 + 12/4 = 9 Æ (12=jawaban benar setelah BA) Jika CA = 10.5 maka Æ IQ = 9 / 10.5 x 100 = 85,7 Æ 86
Basal Age 6
tahun
Setiap tanda + dihitung sebagai ¼ thn (3 bln)Kelemahan Mental Age
• Satuan MA tidak konstan, cenderung mengecil / menyusut dengan meningkatnya usia
Contoh :
Anak usia 4 tahun IQ 75 = anak 12 tahun IQ 75
o Usia 4 tahun Æ 1 tahun keterbelakang mental
o Usia 12 tahun Æ 3 tahun keterbelakang mental MA = 3 IQ = 3/4 x 100 = 75
CA = 4
MA = 9 IQ = 9/12 x 100 = 75
CA = 12
Grade Equivalents
• Dipakai pada Educational Achievement Test
• Skor subyek pada test ini ditafsirkan menurut kelas
• Yang menjadi norma adalah nilai rata-rata yang
diperoleh sampel standar dalam pelajaran tertentu Contoh:
• Skor subyek pada test membaca setara dengan rata-rata anak kelas 2 SD (skor 48)
• Kemampuan membaca anak ini setara dengan kemampuan anak kelas 2 SD (GE 2)
• Bentuk test : Soal-soal tidak dikelompokkan menurut kelas (hanya rata-rata skor di kelas tertentu)
Hal hal yang perlu diperhatikan dalam menginterpretasikan skor subyek :
• Guru yang mengajar di setiap kelas berlainan; kecepatan dan mutu pengajaran juga berbeda
• Yang menjadi norma untuk setiap kelas adalah nilai rata rata dalam kelas Æ Ada anak yang berprestasi di bawah dan di atas rata rata (outliers).
• Jadi subyek yang mendapat skor lebih tinggi dari rata rata kelas belum berarti ia telah menguasai pelajaran kelas yang lebih tinggi
• Kelompok standardisasi : murid murid dalam setiap kelas
• Yang dijadikan norma kelas : Skor rata rata dari kelas
Kelemahan Grade Equivalents
Dapat terjadi salah interpretasi Contoh
Grade Equivalent matematika seorang anak kelas V = 6,3
Ætidak berarti ia menguasai materi matematika kelas VI, karena belum menguasai proses
aritmatika yang dipelajari di kelas VI.
ÆNamun, kemampuannya lebih baik daripada
Ordinal Scales
• Tidak sama pengertiannya dengan skala ordinal dalam statistika yang merupakan salah satu skala pengukuran
• Ordinal scale dibuat dengan tujuan menentukan fase/ tahapan perkembangan yang telah dicapai subyek pada suatu fungsi tingkah laku tertentu (locomotion, diskriminasi sensoris, bahasa,
kognisi)
Ordinal Scales
• Dibuat berdasarkan penelitian bahwa
perkembangan fungsi-fungsi tingkah laku
memperlihatkan pola urutan yang seragam dalam kebudayaan yang berbeda
• Menjadi norma adalah perilaku yang khas (typical) dalam suatu fase
Test Gesell , Test Piaget
ORDINAL SCALES
CONTOH
Gessel Development Schedules
• Mengukur fungsi motorik, adaptif, dan bahasa
• Usia 3 bulan Æ tengkurap
• Usia 6 bulan Æ duduk
• Usia 1 tahun Æ berjalan Piaget
• Proses-proses kognitif
• Object Permanence
• Conservation
WITHIN GROUP NORMS
• Suatu cara menafsirkan skor tes dengan membandingkannya dengan performa sekelompok subyek pada tes tersebut
• Kelompok subyek = kelompok terstandardisasi
• Subyek yang hendak dinilai dan kelompok
standarisasi berasal dari populasi yang sama; kelompok standarisasi mewakili populasi
WITHIN GROUP NORMS (2)
• Penilaian dilakukan dengan melihat kedudukan subyek dalam penyebaran skor kelompok
• Kedudukan subyek dalam penyebaran kelompok standar menggambarkan kedudukan subyek
dalam penyebaran populasi
WITHIN GROUP NORMS (3)
•
Contoh: Tes Wechsler Adult Intelligence
Scale
• Populasi : orang dewasa usia 16 s.d. 79 tahun
• Norma : 16-19 thn, 20-24 thn, 25-34 thn, dst.
• Buat norma warga Jakarta Æ harus Jakarta juga (tidak boleh dari pedalaman Papua, misalnya)
• Sampel usia 16-19 tahun Æ harus proporsional mewakili populasi
• Diberikan 11 subtest Æ cari penyebaran skor,
PERSENTIL
•
A
percentile
is a point on the
measurement scale below which specified
percentage of the cases in the distribution
falls
contoh: P
50= 23
Æ
•
The rank or
percentile rank
of a particular
score is defined as the percentage of
individuals n the distribution with scores
at or below the particular value
contoh: PR
23= 50
Æ
skor 23 atau di
PERSENTIL (1)
•
Menunjukkan posisi relatif seseorang dalam
sampel standarisasi
•
Dianggap sebagai urutan dalam kedudukan
suatu kelompok yang terdiri dari 100 orang,
di mana yang lebih baik adalah subyek
dengan
nilai persentil yang lebih besar
•
Skor persentil adalah persentase dari jumlah
orang yang berada di bawah skor mentah
PERSENTIL (2)
•
Contoh:
•
28% orang dari suatu kelompok berhasil
mengerjakan lebih dari 15 soal dengan
benar
•
Maka skor 15 berhubungan dengan
persentil 28
•
Persentil = % jumlah orang
•
Persentase skor = % jumlah item yang
benar
PERSENTIL
• Kelebihan
• Mudah dihitung dan dimengerti oleh awam (hanya butuh data mentah, persentase,
• Dapat digunakan secara universal
• Sesuai untuk semua jenis tes dan kelompok sampel
• Kekurangan
• Tidak memiliki satuan/unit yang sama Æ cth: perbedaan skor di persentil 50 dan 45 belum
STANDAR SCORE (SS)
• Mengungkapkan jarak individu dari nilai mean dalam satuan standar deviasi (SD) distribusi skor tes
• SS atau z-Score diperoleh dengan transformasi dari raw score
Linear/Nonlinear SS
•
Linear SS
: bentuk distribusi SS sama dengan
distribusi
raw score
•
Nonlinear SS
: bentuk distribusi SS
berbeda
dengan distribusi
raw score
karena distribusi
RS diubah ke dalam distribusi normal
(
normalized
)
Æ
ketika jumlah sampel besar
dan mewakili populasi secara representatif
Æ
caranya bisa jadi dengan menambah item
yang sulit/mudah (tergantung skewed ke arah
mana)
CARA MENGHITUNG Z-SCORE
• Buat distribusi frekuensi raw score
• Hitung mean dan SD
• Hitung z-Score dengan rumus:
38
z =
x - x
Evaluasi Standard Score
• Kelebihan
• Memiliki unit pengukuran yang sama
• Kedudukan subyek dalam suatu kelompok standar tetap
• Dapat memperbandingkan kemampuan subyek pada beberapa tes, atau kemampuan antarsubyek pada satu tes
• Kekurangan
• Memiliki nilai yang + dan –
STANDARD SCORES
• Untuk mengatasi kelemahan tersebut:
• Setiap nilai z dikalikan dengan suatu bilangan konstan
• Kemudian tambahkan dengan bilangan tertentu
• Misal z = -1
• Dikalikan dengan 10, ditambah dengan 50
• Maka z = (-1 x 10) + 50 = 40
Æ tidak akan ada nilai yang negatif
TRANSFER LANGSUNG
Raw Score Æ
Scaled Score
Xs = Standard Score
Xo = Raw Score
Xo = Mean RS
Xs = Mean SS
So = SD RS
Ss = SD SS
41Xs =
(
Ss
So
)
Xo
-
[(
Ss
So
)
Xo – Xs
]
T-SCALE
• Diperkenalkan oleh W.A.McCall
• Dipergunakan untuk mengatasi kelemahan dari standard score scale
• Tanpa angka -, jangkauan skor/daerah populasi diperluas, distribusi normal
• Mean = 50, SD = 10
CARA MENGHITUNG T-SCORE
• Dengan menggunakan Tabel T1. tentukan kelas interval
2. tentukan batas atas kelas
3. tentukan frekuensi
4. tentukan frekuensi kumulatif
5. tentukan proporsi kumulatif
6. cari nilai T melalui proporsi kumulatif dari masing-masing kelas pada table T
7. gambarkan titik-titik untuk merepresentasikan setiap nilai T
8. cari nilai T untuk masing-masing raw score
9. buat tabel yang memuat raw score dan T-Score
CARA MENGHITUNG T-SCORE
• Tanpa menggunakan Tabel T
1. s.d 5 sama dengan cara dengan menggunakan Tabel T
6. menentukan z-Score pada table B-Guilford
berdasarkan proporsi kumulatif yang diperoleh 7. masukkan z-Score ke rumus z = (skor-mean)/SD
dengan mean = 50, SD = 10
DOMAIN CRITERION-REFERENCED TESTING
(CRT)
• Yang menjadi patokan untuk menginterpretasikan adalah suatu content domain tertentu
• Skor mengindikasikan seberapa jauh seserang menguasai keterampilan-keterampilan tertentu misalnya berhitung dan membaca
• Content domain yang hendak diukur ditentukan oleh tujuan instruksional pendidikan, yaitu pengetahuan dan keterampialn apa yang harus dikuasai
SIFAT-SIFAT CRT
• Content meaning
• Apa yang dapat dilakukan subyek, apa yang mereka ketahui
• Bukan bagaimana mereka jika dibandingkan dengan orang lain
• Mastery Testing
• Apakah individu/subyek dapat atau tidak mencapai derajat penguasaan tertentu
SIFAT RELATIF DARI NORMA
• Skor tes tidak dapat diinterpretasikan terlepas dari nama tes (mengukur aspek/dimensi apa) serta skala dan
sample yang dipakai dalam pembuatan norma
• Tes Æ isi dari macam-macam tes berbeda-beda. Bahkan tes dengan nama yang sama isinya dapat berbeda
• Skala Æ Skor IQ yang dipakai menggunakan skala apa? Ratio IQ? Deviatin IQ? Standard Score? Mean? SD?
• Sampel Æ karakteristik sample? Tingkat
SIFAT RELATIF DARI NORMA
• Dapatkah derived score (misal IQ, Scaled Sore, T-Score) dari tes yang berbeda saling
diperbandingkan?
• TIDAK Æ jika sample standarisasi dari tes-tes tersebut berlainan
Lowest 4% Next 7% Next 12% Next 17% Middle 20% Next 17% Next 12% Next 7% Highest 4% Stanine 1 Stanine 2 Stanine 3 Stanine 4 Stanine 5 Stanine 6 Stanine 7 Stanine 8 Stanine 9 49
Lowest 1% Next 3% Next 7% Next 12% Next 17% Middl e 20% Nex t 17% Next 12% Next 7% Next 3& Highest 1% C = 0 C = 1 C = 2 C = 3 C = 4 C = 5 C = 6 C = 7 C = 8 C = 9 C = 10 50
NORM REFERENCED vs
CRITERION REFERENCE
Norm: untuk memberikan perbedaan perfomrna antar dividu; performa individu tergantung performa orang lain
Criterion-referenced: tidak bergantung pada orang lain, independen
Norm-Referenced
• Menghitung total skor penempuh tes
Criterion-Referenced Score
• Disebut juga: content-, domain-, objective referenced
• Skor individu mengindikasikan performa individu dalam domain tesnya dengan menggunakan kriteria perfect performance
• Dalam dunia pendidikan digunakan untuk mengetahui materi yang telah dikuasai oleh siswa
Criterion-Reference Score
• Proses Æ penyusun tes mengidentifikasi kriteria yang akan digunakan untuk membandingkan performa individu
• Kriteria bisa berupa:
• Optimum performance Æ penguasaan isi tes ( berapa yang dijawab dengan benar), fakta khusus, prinsip, keterampilan
Criterion-Referenced Norm pada
Optimum Performance Test
Terdiri dari tiga tipe:
•
content-referenced score
•
objective-referenced score
•
pass/fail
atau
mastery score
1. Content-Referenced Score
• Kriteria: Penguasaan individu terhadap keseluruhan materi
• Cara hitung: persentase jawaban yang dijawab dengan benar (benar : seluruhnya x 100%)
Interpretasi skor individu dengan menghitung content-referenced score dipengaruhi oleh:
1. Representativeness dari item terhadap domain tingkah laku (content validity)
2. Objective Referenced
Score
• Menggunakan tujuan (objective) sebagai kriteria
• Skor yang diperoleh: persentase objective yang dikuasi oleh individu
• Individu dianggap menguasai objective ketika bisa menjawab item
dengan benar dalam jumlah yang ditentukan
• Rumit, namun secara teoritis dapat mengukur
3. Pass/Fail or Mastery Scores
• C-r score dapat digunakan untuk membagi penempuh tes menjadi dua kelompok: lulus atau tidak lulus
• Ada batasan tertentu (ditentukan oleh penyusun tes) sebagai batasan kriteria kelulusan
• Skor awal bisa berupa content-referenced atau objective-referenced scores
Criterion-Referenced Norm pada
Typical Performance Test
1. Berdasarkan teoriÆ misalnya berdasarkan kriteria diagnosis pada DSM-IV-TR
2. Berdasarkan hypothetical mean
Hypothetical Mean
Misalnya:
Pada tes empati
• Menggunakan skala lichert (misalnya 1-6)
• Tentukan median dari range skor item (misalnya 3)
• Tentukan median dari range total skor atau all possible scores
Jika Budi mendapatkan skor 50 (hypothetical mean = 25), maka: Budi cenderung memiliki empati yang tinggi jika dibandingkan dengan
ÆBisa juga dibagi dengan jumlah item (50:10 = 5), dia cenderung menjawab ‘setuju’
Daftar Pustaka
Cohen, R. J., & Swerdlik, M. E. (2010). Psychological testing and assessment: An introduction to test and measurement. (7th ed.). Boston: McGraw Hill.
Field, A. (2009). Discovering statistics using SPSS. (3rd ed.). New York: SAGE Publications, Ltd.
Kaplan, R.M. & Saccuzzp, D.P. (2009). Psychological testing: Principles, applications, and issues. California:
Wadsworth Cengage Learning
Urbina, S. (2004). Essentials of psychological testing. New York: John Wiley & Sons, Inc.