• Tidak ada hasil yang ditemukan

Psikometri NORMA 2. Arie Suciyana S., S.Si., M.Si. Modul ke: Fakultas Psikologi. Program Studi Psikologi.

N/A
N/A
Protected

Academic year: 2021

Membagikan "Psikometri NORMA 2. Arie Suciyana S., S.Si., M.Si. Modul ke: Fakultas Psikologi. Program Studi Psikologi."

Copied!
64
0
0

Teks penuh

(1)

Modul ke:

Fakultas Program Studi

Psikometri

NORMA 2

Arie Suciyana S., S.Si., M.Si.

Psikologi

Psikologi

(2)

Norma

Posisi/kedudukan seseorang dalam kelompok

Æ

patokan, acuan

Unit skala yang sama atau tidak, kasar-halus

Penggunaan norma tergantung tujuan tes.

Misal: T-score untuk melihat perbedaan yang cukup halus

(kecuali skor maksimal tes tidak terlalu besar, contoh:RS 0-30)

Didasarkan pada suatu kelompok yang

representatif mewakili populasi

(3)

NORMA

Hasil pengukuran psikologis = data

(skor) / skor mentah /

Raw score

:

Raw score bisa berupa:

Jumlah soal yang dijawab benar

Jumlah waktu untuk mengerjakan soal

Jumlah jawaban yang mengindikasikan

suatu ciri (jawaban “ya”)

Æ

tes

(4)

Mengapa diperlukan Norma?

Raw Score (RS)

yang dihasilkan dari

pengukuran

tidak mempunyai arti apa-apa

karena masih harus dihubungkan dengan

jumlah soal dan derajat kesulitan soal

Contoh:Bambang

Pada tes Arithmatik 1, dapat RS 15 dari 60 soal

• Pada tes Arithmatik 2, dapat RS 30 dari 40 soal

• Pada tes Arithmatik 3, dapat RS 8 dari 10 soal Apa arti raw score di atas?

Æ Tidak bisa langsung diinterpretasi karena tidak ada patokan nilai

(5)

Mengapa diperlukan Norma?

• Pengukuran psikologis tidak mempunyai titik nol mutlak. Seseorang yang mendapat skor 80 tidak berarti 2 kali kemampuan skor 40 Æ selalu skala interval

• Perbedaan raw score tidak mencerminkan jarak yang sesungguhnya antarindividu yang

sesungguhnya

• Untuk dapat dimaknai, raw score individu harus diubah ke dalam bentuk Norma

Æ (raw score harus dikonversi menjadi scaled

(6)

PENGERTIAN NORMA

‘… performance by defined group on particular test

‘ (Kaplan & Saccuzzo)

‘……a set of values descriptive of the performance on a test on some specified group. Usually showed as a table giving equivalent values on some

derived score for each raw score on a test’ (Lyman, 1971)

‘…the test performance data of a particular group of testtakers that are designed for use as a

reference when evaluating or interpreting individual test scores.’ (Cohen & Swerdlik)

(7)

PENGERTIAN NORMA

• Penyebaran skor dari suatu kelompok standar yang dirancang sebagai acuan untuk mengevaluasi atau menginterpretasi skor yang diperoleh individu dalam suatu pengukuran.

• Patokan yang dipakai untuk menilai hasil tes (raw score) seseorang.

• Tidak harus dari kelompok peserta tes; bisa jadi dari teori yang digunakan.

• Jika norma didapatkan dari jumlah sampel yang besar dan representatif, norma tersebut bisa digunakan

(8)

Sampel harus merepresentasikan populasi

Æ

(9)

9

(10)

FUNGSI NORMA

• Menginterpretasikan skor yang diperoleh dari alat ukur

• Membandingkan posisi individu dengan individu lain

• Memaknai skor yang diperoleh individu dan

membandingkannya dengan skor kelompok dalam tes yang sama

• Mengambarkan kinerja individu di beberapa tes (intraindividu)

• Menggambarkan kinerja tes dari sampel yang sudah terstandardisasi

(11)

KELOMPOK STANDAR/NORMATIF

Representatif mewakili populasi

N cukup besar

Æ semakin besar N, semakin stabil norma; karena penyebaran mendekati normal dan tidak dipengaruhi oleh faktor kebetulan

• Sesuai dengan tujuan pengukuran

(12)

SCALED /CONVERTED SCORE

• Untuk mengetahui posisi individu, Raw Score

(RS) diubah ke dalam skor relatif / Scaled Score/Converted Score/Derived Score

• Tujuannya:

oUntuk menunjukkan posisi relatif individu

dalam kelompok normatif, sehingga performa (skor) dapat dibandingkan dengan orang lain

(Antar-individu)

oUntuk memberikan ukuran yang memungkinkan perbandingan langsung performa (skor)

individu pada berbagai tes yang berbeda(

(13)

Cara umum untuk mengonversi RS

Norma perkembangan (Developmental norms) Æ bagaimana perkembangan individu dibandingkan dengan kelompok sampel tertentu

Norma Kelompok (Within Group Norms) Æ

membandingkan skor tes dengan performa kelompok subyek pada tes

(14)

Cara umum mengkonversikan RS

• Norma perkembangan (Developmental norms) Ada 3 macam :

• Mental AgeÆ Umur

• Grade Equivalents Æ Kelas

• Ordinal Scale Æ Tahap perkembangan (Gesell, Piaget)

• Norma Kelompok (Within Group Norm)

(15)

Cara umum mengkonversikan RS

• Norma perkembangan (Developmental norms)

• Norma Kelompok (Within Group Norm)

Prestasi kelompok standardisasi ini dinyatakan dalam skala :

• Persentil

• Standard score:

• Transformasi linear

• Transformasi non linear Æ Normalized standard score; T-score, Stanine score, C score

(16)

DEVELOPMENTAL NORMS

• Suatu cara untuk menafsirkan skor tes

berdasarkan tingkat perkembangan pada domain tertentu.

• Skor mentah yang dihubungkan dengan suatu norma perkembangan memperlihatkan sejauh mana perkembangan seseorang pada domain tersebut

• Terdiri dari 3 macam:

i. Mental Age,

ii. Grade Equivalent, dan

(17)

Mental Age

• Yang menjadi norma adalah nilai rata-rata yang diperoleh kelompok umur sampel standar pada tes tersebut

• Contoh terdapat pada skala Binet Simon

oItem-item dikelompokkan menurut tingkat umur oDalam tingkat umur 8 tahun terdapat item-item

yang dapat dikerjakan oleh sebagian besar anak-anak berusia 8 tahun pada sampel standar

• Skor yang dicapai seseorang anak memperlihatkan

(18)

Mental Age

• Skor yang dicapai seorang anak memperlihatkan tingkat umur perkembangannya

• misal nilai rata-rata umur 8 tahun pada tes X = 23

• Jika seorang anak mendapat skor 23 maka MA-nya = 8

→Kemampuan subyek setara dengan kemampuan anak usia 8 tahun

(19)

Mental Age

Bentuk test

• Soal soal dikelompokkan menurut tingkat umur.

Test Binet - Simon (1908): 3 th – 13 th

• Soal soal untuk tingkat umur 7 th, adalah soal soal yang dapat dibuat oleh sebagian besar kelompok anak berumur 7 th (kelompok standardisasi)

(20)

Mental Age

Cara menghitung MA

• Hitung Basal Age (BA), yaitu usia tertinggi di

mana pada usia itu dan di bawah usia tsb semua item tes dapat dijawab dengan benar

• Hitung kredit tambahan, yaitu jumlah item yang dapat dijawab betul di atas Basal Age

• MA = Basal age + Kredit tambahan

(21)

Contoh Perhitungan MA

Umur Soal

1 Soal 2 Soal 3 Soal 4

6

+

+

+

+

7

-

-

+

+

8

+

+

-

-9

-

+

+

+

10

+

-

+

+

11

+

-

+

-12

-

-

-

-21

Jadi MA = 6 + 12/4 = 9 Æ (12=jawaban benar setelah BA) Jika CA = 10.5 maka Æ IQ = 9 / 10.5 x 100 = 85,7 Æ 86

Basal Age 6

tahun

Setiap tanda + dihitung sebagai ¼ thn (3 bln)

(22)

Kelemahan Mental Age

• Satuan MA tidak konstan, cenderung mengecil / menyusut dengan meningkatnya usia

Contoh :

Anak usia 4 tahun IQ 75 = anak 12 tahun IQ 75

o Usia 4 tahun Æ 1 tahun keterbelakang mental

o Usia 12 tahun Æ 3 tahun keterbelakang mental MA = 3 IQ = 3/4 x 100 = 75

CA = 4

MA = 9 IQ = 9/12 x 100 = 75

CA = 12

(23)

Grade Equivalents

• Dipakai pada Educational Achievement Test

• Skor subyek pada test ini ditafsirkan menurut kelas

• Yang menjadi norma adalah nilai rata-rata yang

diperoleh sampel standar dalam pelajaran tertentu Contoh:

• Skor subyek pada test membaca setara dengan rata-rata anak kelas 2 SD (skor 48)

• Kemampuan membaca anak ini setara dengan kemampuan anak kelas 2 SD (GE 2)

Bentuk test : Soal-soal tidak dikelompokkan menurut kelas (hanya rata-rata skor di kelas tertentu)

(24)

Hal hal yang perlu diperhatikan dalam menginterpretasikan skor subyek :

• Guru yang mengajar di setiap kelas berlainan; kecepatan dan mutu pengajaran juga berbeda

• Yang menjadi norma untuk setiap kelas adalah nilai rata rata dalam kelas Æ Ada anak yang berprestasi di bawah dan di atas rata rata (outliers).

• Jadi subyek yang mendapat skor lebih tinggi dari rata rata kelas belum berarti ia telah menguasai pelajaran kelas yang lebih tinggi

• Kelompok standardisasi : murid murid dalam setiap kelas

• Yang dijadikan norma kelas : Skor rata rata dari kelas

(25)

Kelemahan Grade Equivalents

Dapat terjadi salah interpretasi Contoh

Grade Equivalent matematika seorang anak kelas V = 6,3

Ætidak berarti ia menguasai materi matematika kelas VI, karena belum menguasai proses

aritmatika yang dipelajari di kelas VI.

ÆNamun, kemampuannya lebih baik daripada

(26)

Ordinal Scales

• Tidak sama pengertiannya dengan skala ordinal dalam statistika yang merupakan salah satu skala pengukuran

Ordinal scale dibuat dengan tujuan menentukan fase/ tahapan perkembangan yang telah dicapai subyek pada suatu fungsi tingkah laku tertentu (locomotion, diskriminasi sensoris, bahasa,

kognisi)

(27)

Ordinal Scales

• Dibuat berdasarkan penelitian bahwa

perkembangan fungsi-fungsi tingkah laku

memperlihatkan pola urutan yang seragam dalam kebudayaan yang berbeda

• Menjadi norma adalah perilaku yang khas (typical) dalam suatu fase

Test Gesell , Test Piaget

(28)

ORDINAL SCALES

CONTOH

Gessel Development Schedules

• Mengukur fungsi motorik, adaptif, dan bahasa

• Usia 3 bulan Æ tengkurap

• Usia 6 bulan Æ duduk

• Usia 1 tahun Æ berjalan Piaget

• Proses-proses kognitif

• Object Permanence

• Conservation

(29)

WITHIN GROUP NORMS

• Suatu cara menafsirkan skor tes dengan membandingkannya dengan performa sekelompok subyek pada tes tersebut

• Kelompok subyek = kelompok terstandardisasi

• Subyek yang hendak dinilai dan kelompok

standarisasi berasal dari populasi yang sama; kelompok standarisasi mewakili populasi

(30)

WITHIN GROUP NORMS (2)

• Penilaian dilakukan dengan melihat kedudukan subyek dalam penyebaran skor kelompok

• Kedudukan subyek dalam penyebaran kelompok standar menggambarkan kedudukan subyek

dalam penyebaran populasi

(31)

WITHIN GROUP NORMS (3)

Contoh: Tes Wechsler Adult Intelligence

Scale

• Populasi : orang dewasa usia 16 s.d. 79 tahun

• Norma : 16-19 thn, 20-24 thn, 25-34 thn, dst.

• Buat norma warga Jakarta Æ harus Jakarta juga (tidak boleh dari pedalaman Papua, misalnya)

• Sampel usia 16-19 tahun Æ harus proporsional mewakili populasi

• Diberikan 11 subtest Æ cari penyebaran skor,

(32)

PERSENTIL

A

percentile

is a point on the

measurement scale below which specified

percentage of the cases in the distribution

falls

contoh: P

50

= 23

Æ

The rank or

percentile rank

of a particular

score is defined as the percentage of

individuals n the distribution with scores

at or below the particular value

contoh: PR

23

= 50

Æ

skor 23 atau di

(33)

PERSENTIL (1)

Menunjukkan posisi relatif seseorang dalam

sampel standarisasi

Dianggap sebagai urutan dalam kedudukan

suatu kelompok yang terdiri dari 100 orang,

di mana yang lebih baik adalah subyek

dengan

nilai persentil yang lebih besar

Skor persentil adalah persentase dari jumlah

orang yang berada di bawah skor mentah

(34)

PERSENTIL (2)

Contoh:

28% orang dari suatu kelompok berhasil

mengerjakan lebih dari 15 soal dengan

benar

Maka skor 15 berhubungan dengan

persentil 28

Persentil = % jumlah orang

Persentase skor = % jumlah item yang

benar

(35)

PERSENTIL

• Kelebihan

• Mudah dihitung dan dimengerti oleh awam (hanya butuh data mentah, persentase,

• Dapat digunakan secara universal

• Sesuai untuk semua jenis tes dan kelompok sampel

• Kekurangan

• Tidak memiliki satuan/unit yang sama Æ cth: perbedaan skor di persentil 50 dan 45 belum

(36)

STANDAR SCORE (SS)

• Mengungkapkan jarak individu dari nilai mean dalam satuan standar deviasi (SD) distribusi skor tes

• SS atau z-Score diperoleh dengan transformasi dari raw score

(37)

Linear/Nonlinear SS

Linear SS

: bentuk distribusi SS sama dengan

distribusi

raw score

Nonlinear SS

: bentuk distribusi SS

berbeda

dengan distribusi

raw score

karena distribusi

RS diubah ke dalam distribusi normal

(

normalized

)

Æ

ketika jumlah sampel besar

dan mewakili populasi secara representatif

Æ

caranya bisa jadi dengan menambah item

yang sulit/mudah (tergantung skewed ke arah

mana)

(38)

CARA MENGHITUNG Z-SCORE

• Buat distribusi frekuensi raw score

• Hitung mean dan SD

• Hitung z-Score dengan rumus:

38

z =

x - x

(39)

Evaluasi Standard Score

Kelebihan

• Memiliki unit pengukuran yang sama

• Kedudukan subyek dalam suatu kelompok standar tetap

• Dapat memperbandingkan kemampuan subyek pada beberapa tes, atau kemampuan antarsubyek pada satu tes

Kekurangan

• Memiliki nilai yang + dan –

(40)

STANDARD SCORES

• Untuk mengatasi kelemahan tersebut:

• Setiap nilai z dikalikan dengan suatu bilangan konstan

• Kemudian tambahkan dengan bilangan tertentu

• Misal z = -1

• Dikalikan dengan 10, ditambah dengan 50

• Maka z = (-1 x 10) + 50 = 40

Æ tidak akan ada nilai yang negatif

(41)

TRANSFER LANGSUNG

Raw Score Æ

Scaled Score

Xs = Standard Score

Xo = Raw Score

Xo = Mean RS

Xs = Mean SS

So = SD RS

Ss = SD SS

41

Xs =

(

Ss

So

)

Xo

-

[(

Ss

So

)

Xo – Xs

]

(42)

T-SCALE

• Diperkenalkan oleh W.A.McCall

• Dipergunakan untuk mengatasi kelemahan dari standard score scale

• Tanpa angka -, jangkauan skor/daerah populasi diperluas, distribusi normal

• Mean = 50, SD = 10

(43)

CARA MENGHITUNG T-SCORE

• Dengan menggunakan Tabel T

1. tentukan kelas interval

2. tentukan batas atas kelas

3. tentukan frekuensi

4. tentukan frekuensi kumulatif

5. tentukan proporsi kumulatif

6. cari nilai T melalui proporsi kumulatif dari masing-masing kelas pada table T

7. gambarkan titik-titik untuk merepresentasikan setiap nilai T

8. cari nilai T untuk masing-masing raw score

9. buat tabel yang memuat raw score dan T-Score

(44)

CARA MENGHITUNG T-SCORE

• Tanpa menggunakan Tabel T

1. s.d 5 sama dengan cara dengan menggunakan Tabel T

6. menentukan z-Score pada table B-Guilford

berdasarkan proporsi kumulatif yang diperoleh 7. masukkan z-Score ke rumus z = (skor-mean)/SD

dengan mean = 50, SD = 10

(45)

DOMAIN CRITERION-REFERENCED TESTING

(CRT)

• Yang menjadi patokan untuk menginterpretasikan adalah suatu content domain tertentu

• Skor mengindikasikan seberapa jauh seserang menguasai keterampilan-keterampilan tertentu misalnya berhitung dan membaca

• Content domain yang hendak diukur ditentukan oleh tujuan instruksional pendidikan, yaitu pengetahuan dan keterampialn apa yang harus dikuasai

(46)

SIFAT-SIFAT CRT

• Content meaning

• Apa yang dapat dilakukan subyek, apa yang mereka ketahui

• Bukan bagaimana mereka jika dibandingkan dengan orang lain

• Mastery Testing

• Apakah individu/subyek dapat atau tidak mencapai derajat penguasaan tertentu

(47)

SIFAT RELATIF DARI NORMA

• Skor tes tidak dapat diinterpretasikan terlepas dari nama tes (mengukur aspek/dimensi apa) serta skala dan

sample yang dipakai dalam pembuatan norma

• Tes Æ isi dari macam-macam tes berbeda-beda. Bahkan tes dengan nama yang sama isinya dapat berbeda

• Skala Æ Skor IQ yang dipakai menggunakan skala apa? Ratio IQ? Deviatin IQ? Standard Score? Mean? SD?

• Sampel Æ karakteristik sample? Tingkat

(48)

SIFAT RELATIF DARI NORMA

• Dapatkah derived score (misal IQ, Scaled Sore, T-Score) dari tes yang berbeda saling

diperbandingkan?

TIDAK Æ jika sample standarisasi dari tes-tes tersebut berlainan

(49)

Lowest 4% Next 7% Next 12% Next 17% Middle 20% Next 17% Next 12% Next 7% Highest 4% Stanine 1 Stanine 2 Stanine 3 Stanine 4 Stanine 5 Stanine 6 Stanine 7 Stanine 8 Stanine 9 49

(50)

Lowest 1% Next 3% Next 7% Next 12% Next 17% Middl e 20% Nex t 17% Next 12% Next 7% Next 3& Highest 1% C = 0 C = 1 C = 2 C = 3 C = 4 C = 5 C = 6 C = 7 C = 8 C = 9 C = 10 50

(51)

NORM REFERENCED vs

CRITERION REFERENCE

Norm: untuk memberikan perbedaan perfomrna antar dividu; performa individu tergantung performa orang lain

Criterion-referenced: tidak bergantung pada orang lain, independen

(52)

Norm-Referenced

• Menghitung total skor penempuh tes

(53)

Criterion-Referenced Score

• Disebut juga: content-, domain-, objective referenced

• Skor individu mengindikasikan performa individu dalam domain tesnya dengan menggunakan kriteria perfect performance

• Dalam dunia pendidikan digunakan untuk mengetahui materi yang telah dikuasai oleh siswa

(54)

Criterion-Reference Score

• Proses Æ penyusun tes mengidentifikasi kriteria yang akan digunakan untuk membandingkan performa individu

• Kriteria bisa berupa:

Optimum performance Æ penguasaan isi tes ( berapa yang dijawab dengan benar), fakta khusus, prinsip, keterampilan

(55)

Criterion-Referenced Norm pada

Optimum Performance Test

Terdiri dari tiga tipe:

content-referenced score

objective-referenced score

pass/fail

atau

mastery score

(56)

1. Content-Referenced Score

• Kriteria: Penguasaan individu terhadap keseluruhan materi

• Cara hitung: persentase jawaban yang dijawab dengan benar (benar : seluruhnya x 100%)

(57)

Interpretasi skor individu dengan menghitung content-referenced score dipengaruhi oleh:

1. Representativeness dari item terhadap domain tingkah laku (content validity)

(58)

2. Objective Referenced

Score

• Menggunakan tujuan (objective) sebagai kriteria

• Skor yang diperoleh: persentase objective yang dikuasi oleh individu

• Individu dianggap menguasai objective ketika bisa menjawab item

dengan benar dalam jumlah yang ditentukan

• Rumit, namun secara teoritis dapat mengukur

(59)

3. Pass/Fail or Mastery Scores

• C-r score dapat digunakan untuk membagi penempuh tes menjadi dua kelompok: lulus atau tidak lulus

• Ada batasan tertentu (ditentukan oleh penyusun tes) sebagai batasan kriteria kelulusan

• Skor awal bisa berupa content-referenced atau objective-referenced scores

(60)

Criterion-Referenced Norm pada

Typical Performance Test

1. Berdasarkan teori

Æ misalnya berdasarkan kriteria diagnosis pada DSM-IV-TR

2. Berdasarkan hypothetical mean

(61)

Hypothetical Mean

Misalnya:

Pada tes empati

• Menggunakan skala lichert (misalnya 1-6)

• Tentukan median dari range skor item (misalnya 3)

• Tentukan median dari range total skor atau all possible scores

(62)

Jika Budi mendapatkan skor 50 (hypothetical mean = 25), maka: Budi cenderung memiliki empati yang tinggi jika dibandingkan dengan

ÆBisa juga dibagi dengan jumlah item (50:10 = 5), dia cenderung menjawab ‘setuju’

(63)

Daftar Pustaka

Cohen, R. J., & Swerdlik, M. E. (2010). Psychological testing and assessment: An introduction to test and measurement. (7th ed.). Boston: McGraw Hill.

Field, A. (2009). Discovering statistics using SPSS. (3rd ed.). New York: SAGE Publications, Ltd.

Kaplan, R.M. & Saccuzzp, D.P. (2009). Psychological testing: Principles, applications, and issues. California:

Wadsworth Cengage Learning

Urbina, S. (2004). Essentials of psychological testing. New York: John Wiley & Sons, Inc.

(64)

Terima Kasih

Referensi

Dokumen terkait

Materi pembelajaran dirancang dan disusun dengan mem-perhatikan keluasan dan kedalaman yang diatur oleh standar isi pada SN-Dikti (disajikan pada Tabel-1). Materi