Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi Adaptasi Fakultas Psikologi Universitas Sumatera Utara

(1)

DIFFERENTIAL ITEM FUNCTIONING

(DIF) ETNIS

PADA BIG FIVE INVENTORY (BFI) VERSI ADAPTASI

FAKULTAS PSIKOLOGI UNIVERSITAS SUMATERA UTARA

SKRIPSI

Diajukan untuk memenuhi persyaratan

Ujian Sarjana Psikologi

Oleh :

HITLER MANIK

081301097

FAKULTAS PSIKOLOGI

(2)

LEMBAR PERNYATAAN

Saya yang bertanda tangan di bawah ini menyatakan dengan

sesungguhnya bahwa skripsi saya yang berjudul:

Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi

Adaptasi Fakultas Psikologi Universitas Sumatera Utara

adalah hasil karya saya sendiri dan belum pernah diajukan untuk memperoleh

gelar kesarjanaan di suatu perguruan tinggi manapun.

Adapun bagian-bagian tertentu dalam penulisan skripsi ini saya kutip dari hasil

karya orang lain yang telah dituliskan sumbernya secara jelas sesuai dengan

norma, kaidah, dan etika penulisan ilmiah.

Apabila di kemudian hari ditemukan adanya kecurangan di dalam skripsi ini, saya

bersedia menerima sanksi dari Fakultas Psikologi Universitas Sumatera Utara

sesuai dengan peraturan yang berlaku.

Medan, Desember 2013

Hitler Manik

(3)

Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi

Adaptasi Fakultas Psikologi Universitas Sumatera Utara

Hitler Manik

1

dan Etty Rahmawati

2

ABSTRAK

Big Five Inventory (BFI) merupakan salah satu tes kepribadian yang telah

diadaptasi ke dalam Bahasa Indonesia. Beberapa penelitian telah dilakukan untuk

mengembangkan alat tes BFI versi Indonesia. Penelitian ini bertujuan untuk

melihat apakah alat tes kepribadian BFI merupakan alat tes yang adil jika

diterapkan pada etnis Batak Toba dan etnis Jawa. Oleh karena itu, diperlukan

sebuah pengujian terhadap aitem-aitem yang ada pada BFI. Dalam kajian ilmu

psikologi, khususnya kajian psikometri disebut uji Keberfungsian aitem yang

berbeda (

Differential Item Functioning

). Subjek dalam penelitian ini adalah orang

dewasa berusia 18-40 tahun berjumlah 327 orang, terdiri dari 172 orang etnis

Batak Toba dan 155 orang etnis Jawa. Hasil penelitian menunjukkan terdapat 10

aitem BFI versi Indonesia terdeteksi DIF Etnis. Hasil analisis reliabilitas skor

komposit pada etnis Batak Toba sebesar 0.74 dan Jawa sebesar 0.77.

Kata Kunci

: Big Five Inventory (BFI), Differential Item Functioning (DIF), etnis

Batak Toba, etnis Jawa

(4)

Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi

Adaptasi Fakultas Psikologi Universitas Sumatera Utara

Hitler Manik

1

and Etty Rahmawati

2

ABSTRACT

Big Five Inventory (BFI) is one of personality test had been adapted into

Indonesia language. More research had been developed to adapt the Indonesian

Big Five Inventory. The purpose of this research is to check whether BFI’s

personality test is fair if apply to ethnic of Batak Toba and Java. Therefore,

examination of BFI’s items is needed. In psychology, especially in psychometric

study, it is called Differential Item Functioning (DIF). Subject in this research is

327 people around 18 to 40 years old, including 172 people from ethnic Batak

Toba and 155 people from ethnic Java. The result of this research indicates that

DIF is detected in 10 BFI’s item. The result of reliability analysis composite score

for ethnic Batak Toba is 0.74 and ethnic Java is 0.77.

(5)

KATA PENGANTAR

Segala Pujian dan syukur peneliti panjatkan kepada Allah Tritunggal yang

selalu memberikan kekuatan dan telah melimpahkan hikmat dan karunia-Nya

yang begitu luar biasa, sehingga saya dapat menyelesaikan penelitian ini.

Peneliti juga mengucapkan terima kasih kepada:

1. Orang tua, abang, kakak, adik-adik dan seluruh keluarga yang selalu

mendukung saya baik dalam doa maupun dana untuk penyelesaian penelitian

ini

2. Prof. Dr. Irmawati, Psikolog selaku Dekan Fakultas Psikologi

3. Bu Etty Rahmawati, M.Si selaku Dosen pembimbing penelitian peneliti di

Fakultas Psikologi Sumatera utara yang terus mendukung saya dalam

menyelesaikan penelitian ini.

4. Dosen-dosen yang ada di Departemen Eksperimen (Bu Lili, Bu Ika, Kak Dina,

Kak Rahmi, dan Kak Masitah) yang turut mendukung untuk penyelesaian

penelitian ini.

5. Dosen Penguji saya, yaitu yang turut membantu saya dalam melengkapi

penelitian saya melalui masukan yang diberikan.

6. Pak Eka dan juga dosen lain yang mendukung peneliti dalam penyelesaian

penelitian ini.

7. Kak Mariyanti yang turut membantu dengan memberikan izin penggunaan

penelititannya, yaitu BFI yang sudah diadaptasi ke Bahasa Indonesia untuk

(6)

8. Kelompok Tumbuh Bersama (KTB) saya, yaitu Bang Aswindo, Bang Armen,

Bang Didier, Bang Princen, Kak Ester yang juga turut mendukung dan

mendoakan saya dalam mengerjakan penelitian ini

9. Adik-adik Kelompok (Rocky, Anggi, Mentari, Immanuel, Felix, Zio) yang

turut mendoakan dan mendukung saya

10. Koordinasi UKM KMK USU UP Psikologi 2013 yang juga membantu dalam

doa dan motivasi agar saya tetap semangat dalam penyelesaian penelitian ini

11. Teman-teman seperjuangan (Edwin, Roimer, Pangeran, Harri, Bang Agus,

Utami, dan yang lain) yang selalu mendukung saya untuk menyelesaikan

penelitian ini

12. Kakak, abang, teman-teman, dan junior saya yang turut membantu, mengajari,

dan meminjamkan buku sehingga peneliti dapat menyelesaikan penelitian ini

13. Semua pihak yang selalu ada dan selalu memberikan semangat buat peneliti,

sehingga penelitian ini dapat diselesaikan.

Peneliti menyadari bahwa penelitian ini masih jauh dari kesempurnaan, untuk

itu peneliti sangat mengharapkan kritik dan saran yang membangun untuk

kesempurnaan penelitian ini. Peneliti juga meminta maaf jika terdapat kesalahan

dalam proses penyelesaian penelitian ini. Akhir kata peneliti berharap kiranya

hasil dari penelitan ini nantinya dapat bermanfaat bagi kita semua.

Medan, Desember 2013

(7)

DAFTAR ISI

ABSTRAK

... i

KATA PENGANTAR

... iii

DAFTAR ISI

... v

DAFTAR TABEL

... ix

DAFTAR FIGURE

... x

DAFTAR FORMULA

... xi

DAFTAR LAMPIRAN

... xii

BAB I PENDAHULUAN

A. Latar Belakang Masalah ... 1

B. Rumusan Masalah ... 10

C. Tujuan Penelitian ... 10

D. Manfaat Penelitian ... 10

Kerangka Berpikir

... 11

BAB II TINJAUAN PUSTAKA

A. Teori Kepribadian Big Five ... 12

1. Sejarah ... 12

(8)

B. Differential Item Functioning

... 20

1. Defenisi ... 20

2. Jenis-jenis DIF ... 22

3. Dampak DIF ... 25

4. Analisis DIF ... 27

C. Etnis ... 28

1. Batak Toba ... 28

a)

Nilai Budaya Batak ... 29

b)

Hubungan Kontroversial dan inkonsistensi kepada Suku

Bangsa lain ... 30

c)

Kepribadian Batak Toba ... 32

2. Jawa ... 32

a)

Kebiasaan Ingin Menang Sendiri ... 33

b)

Kebiasaan Yang Menjatuhkan Harga Diri

... 34

c)

Dunia Damai ...

34 d)

Toleransi Orang Jawa ...

35 e)

Kepribadian Jawa ... 36

E. DIF Etnis Pada

Big Five Inventory

... 37

BAB III METODE PENELITIAN

A. Jenis Penelitian ... 39

B. Data yang digunakan ... 39

(9)

1. Populasi ... 40

2. Teknik Pengambilan Sampel... 40

D. Instrumen yang Digunakan ... 41

E. Persiapan Penelitian ... 42

1. Persiapan Awal ... 42

2. Pelaksanaan Penelitian ... 43

3. Pengolahan Data Penelitian... 43

4. Hasil dan Pembahasan ... 43

5. Kesimpulan dan Saran... 43

F. Software yang digunakan ... 44

G. Analisis DIF ... 44

1. Reliabilitas ... 44

2. Regresi Logistik ... 45

3. Regresi Logistik Ordinal ... 46

BAB IV HASIL DAN PEMBAHASAN

A. Analisa Data Penelitian ... 48

1. Gambaran Subjek Penelitian ... 48

2. Reliabilitas Komposit ... 50

3. Analisis DIF ... 51

B. Pembahasan

1. Analisis Reliabilitas ... 56

(10)

BAB V KESIMPULAN DAN SARAN

A. Kesimpulan ... 61

B. Saran ... 61

(11)

DAFTAR TABEL

Tabel 1.

Karakteristik Sifat-Sifat

Big Five Model

dengan Skor Tinggi

dan Rendah

...

14 Tabel 2.

Hubungan dengan Suku Bangsa Lain ... 31

Tabel 3.

Pengelompokan Etnis ke dalam kelompok Referensi dan Fokal ... 37

Tabel 4.

Blueprint

Big Five Inventory ... 42

Tabel 5.

Gambaran Subjek berdasarkan jenis kelamin dan usia ... 48

Tabel 6.

Reliabilitas Skor Batak Toba dan Jawa ... 50

Tabel 7.

Korelasi antar aspek BFI versi Indonesia pada kelompok

Batak Toba dan Jawa ... 50

Tabel 8.

Koefisien Reliabilitas setiap aspek BFI versi Indonesia pada

Kelompok Batak Toba dan Jawa... 51

Tabel 9.

Hasil Analisis Regresi Logistik Ordinal per Aitem BFI

versi Indonesia ... 52

(12)

DAFTAR FIGURE

Figure 1.

Dua ICC yang tidak bersinggungan ... 23

(13)

DAFTAR FORMULA

Formula 1.

Regresi Logistik Ordinal ... 28

(14)

DAFTAR LAMPIRAN

Skala BFI Versi Indonesia ... 65

Hasil Analisis Regresi Logistik ... 68

Hasil analisis Reliabilitas dan Standar Deviasi pada Subjek Batak Toba ... 310

Hasil analisis Reliabilitas dan Standar Deviasi pada Subjek Jawa ... 314

Hasil Analisis Korelasi antar Aspek pada Subjek Batak Toba ... 318

Hasil Analisis Korelasi antar Aspek pada Subjek Jawa ... 319

Nilai

Mean

Aitem yang Terdeteksi DIF... 320

(15)

Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi

Adaptasi Fakultas Psikologi Universitas Sumatera Utara

Hitler Manik

1

dan Etty Rahmawati

2

ABSTRAK

Big Five Inventory (BFI) merupakan salah satu tes kepribadian yang telah

diadaptasi ke dalam Bahasa Indonesia. Beberapa penelitian telah dilakukan untuk

mengembangkan alat tes BFI versi Indonesia. Penelitian ini bertujuan untuk

melihat apakah alat tes kepribadian BFI merupakan alat tes yang adil jika

diterapkan pada etnis Batak Toba dan etnis Jawa. Oleh karena itu, diperlukan

sebuah pengujian terhadap aitem-aitem yang ada pada BFI. Dalam kajian ilmu

psikologi, khususnya kajian psikometri disebut uji Keberfungsian aitem yang

berbeda (

Differential Item Functioning

). Subjek dalam penelitian ini adalah orang

dewasa berusia 18-40 tahun berjumlah 327 orang, terdiri dari 172 orang etnis

Batak Toba dan 155 orang etnis Jawa. Hasil penelitian menunjukkan terdapat 10

aitem BFI versi Indonesia terdeteksi DIF Etnis. Hasil analisis reliabilitas skor

komposit pada etnis Batak Toba sebesar 0.74 dan Jawa sebesar 0.77.

Kata Kunci

: Big Five Inventory (BFI), Differential Item Functioning (DIF), etnis

Batak Toba, etnis Jawa

(16)

Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi

Adaptasi Fakultas Psikologi Universitas Sumatera Utara

Hitler Manik

1

and Etty Rahmawati

2

ABSTRACT

Big Five Inventory (BFI) is one of personality test had been adapted into

Indonesia language. More research had been developed to adapt the Indonesian

Big Five Inventory. The purpose of this research is to check whether BFI’s

personality test is fair if apply to ethnic of Batak Toba and Java. Therefore,

examination of BFI’s items is needed. In psychology, especially in psychometric

study, it is called Differential Item Functioning (DIF). Subject in this research is

327 people around 18 to 40 years old, including 172 people from ethnic Batak

Toba and 155 people from ethnic Java. The result of this research indicates that

DIF is detected in 10 BFI’s item. The result of reliability analysis composite score

for ethnic Batak Toba is 0.74 and ethnic Java is 0.77.

(17)

BAB I

PENDAHULUAN

A. Latar Belakang Masalah

Ilmu Psikologi merupakan salah satu cabang ilmu yang berperan untuk

mempelajari proses mental dan perilaku manusia. Untuk mempelajari perilaku

manusia, para ahli psikologi telah melakukan berbagai macam pengukuran, atau

dengan kata lain dilakukan tes psikologi. Salah satu pengukuran yang dilakukan

adalah kepribadian manusia. Kepribadian dalam kehidupan sehari-hari sering

dihubungkan dengan karakter dan sifat individu. Oleh karena itu, ada banyak

peneliti yang melakukan penelitian bagaimana cara untuk mengukur kepribadian

manusia, yaitu sifat-sifat unik yang ada pada tiap-tiap individu (Lahey, 2007).

Pengukuran terhadap kepribadian merupakan hal yang penting dilakukan

karena tiap orang perlu untuk mengenal orang lain ketika hendak berinteraksi,

sehingga dapat menyesuaikan diri dengan orang lain. Pervin (2005)

mengungkapkan bahwa pengukuran terhadap kepribadian merupakan hal yang

penting karena kepribadian merupakan gambaran keseluruhan dari individu, dan

pentingnya untuk memahami keseluruhan aspek yang berbeda dalam individu dan

bagaimana hubungannya dengan orang lain. Selain itu, pengukuran kepribadian

penting dilakukan karena perlu mempelajari individu yang kompleks, seperti

keunikan seseorang, bagaimana interaksi dengan orang lain. Salah satu

pengukuran yang dilakukan adalah melalui tes, yaitu tes kepribadian. Tes

(18)

di bidang tertentu. Memandang hal tersebut, maka merupakan hal yang sangat

penting untuk melakukan tes kerpibadian, baik dalam hal seleksi maupun untuk

menentukan jabatan seseorang. Beberapa contoh yang berkaitan dengan

penggunaan tes kepribadaian adalah perekrutan ataupun penyeleksian karyawan

dalam suatu organisasi. Selain itu, tes kepribadian juga dilakukan ketika hendak

memilih jurusan, dan lain-lain.

Beberapa alat tes telah dikembangkan untuk mengukur kepribadian

individu, antara lain adalah

Sixteen Personality Factor

(16 PF), NEO

Personality

Inventory

Revised (NEO-PIR),

Big Five Inventory

(BFI),

Hogan Personality

Inventory

(HPI), dan lain-lain. Beberapa alat tes tersebut sudah dikembangkan dan

juga sudah digunakan di Indonesia. Dalam penelitian ini menggunakan salah satu

alat tes, yaitu

Big Five Inventory

(selanjunya akan disebut BFI). Adapun yang

menjadi alasan penggunaan BFI dalam penelitian ini adalah karena hingga saat ini

BFI dalam tahap pengembangan, sehingga peneliti menganggap penting untuk

meneliti aitem-aitem yang ada dalam BFI. Untuk melengkapi hasil penelitian

sebelumnya, diantaranya adalah penelitian yang dilakukan oleh Mariyanti (2012),

yaitu adaptasi BFI kedalam bahasa Indonesia, dan analisis konstrak pada etnis

Batak juga telah diteliti oleh Samosir (2013), dan analisis DIF administrasi tes

pada aitem BFI (Putri, 2013).

BFI merupakan salah satu alat tes untuk mengukur kepribadian yang

dikonsep dari teori Big Five oleh McCrae & Costa . BFI merupakan tes yang

sering digunakan di berbagai negara, diantaranya Amerika Serikat, Turki, Inggris,

(19)

Shackelford, 2008). Memandang bahwa budaya yang ada di negara-negara

tersebut berbeda dengan budaya yang ada di Indonesia, maka sangat diperlukan

suatu tes yang berfungsi sama untuk budaya yang berbeda-beda. Tes yang adil

merupakan tes yang tidak bias. Tes yang tidak bias merupakan tes yang berfungsi

sama meskipun diberikan pada budaya dan negara yang berbeda-beda. Menurut

Camilli & Shepard (1994) dan Clauser & Mazor (1998 dalam Zumbo, 1999), bias

aitem terjadi ketika individu dari satu kelompok cenderung untuk menjawab aitem

dengan benar (atau menyetujui pernyataan dalam aitem) dibandingkan peserta

individu dari kelompok lainnya, karena beberapa karakteristik dari aitem yang

dipakai dalam mengukur atau situasi pengukuran yang tidak relevan dengan

tujuan tes. Jadi, bias aitem dapat menyebabkan alat tes menjadi tidak adil.

BFI terdiri dari 44 aitem. Awalnya BFI dikonstrak dalam bahasa Inggris.

Aitem-aitem yang ada dalam BFI adalah untuk mengungkap kepribadian yang

disusun berdasarkan teori Big Five. Teori yang mendasari BFI adalah

Five Factor

Model

.

Five-Factor Model

aslinya didasarkan pada sebuah kombinasi dari dua

pendekatan, yaitu pendekatan leksikal (

lexical approach

) dan pendekatan statistik

(

statistical approach

). Pendekatan leksikal merupakan pendekatan yang

berhubungan dengan bahasa, yang artinya adalah bagaimana alat tes bersifat

universal, dan bisa digunakan di budaya yang berbeda-beda. Sedangkan

Pendekatan statistik merupakan pendekatan yang berhubungan dengan

pengelompokan kumpulan asli dari

Five Factor Model

menjadi lima faktor.

Pendekatan leksikal yang terdapat dalam

Five Factor Model

dimulai pada tahun

(20)

2010) dengan kerja keras untuk menerjemahkan dan mengidentifikasi 17.953

terminologi trait dari bahasa Inggris (yang berisi secara kasarnya sekitar 550.000

catatan asli yang terpisah). Allport dan Odbert kemudian membagi kumpulan asli

dari trait tersebut menjadi empat hal: (1) trait yang bersifat stabil (

stable traits

),

seperti rasa aman, intelegensi, (2) keadaan, suasana hati, dan aktivitas sementara,

seperti tidak tenang, gelisah (

agitated

)

,

perasaan gairah, gembira (

excited

), (3)

evaluasi sosial

,

seperti mempesona (

charming

)

,

menjengkelkan (

irritating

)

,

dan

(4) terminologi yang berhubungan dengan istilah-istilah metafora, fisik, dan

keragu-raguan, seperti kata subur (

prolific

), sedikit (

lean

) (Larsen & Buss, 2010).

Five Factor Model

telah diteliti lebih dari puluhan peneliti yang

menggunakan sampel yang berbeda-beda. Model ini telah direplikasi setiap

dekade selama akhir abad pertengahan. Model ini telah direplikasi kedalam

bahasa yang berbeda dan dalam format aitem yang berbeda juga (Larsen & Buss,

2010). Para peneliti yang berbeda memiliki variasi yang berbeda-beda dalam

memberi label pada kelima faktor ini seperti budaya (

culture

)

,

intelek (

intellect

)

,

imajinasi (

imagination

)

,

keterbukaan (

openness

)

,

terbuka terhadap pengalaman

(

openness to experience

)

,

dan intelegensi yang berubah-ubah (

fluid intelligence

)

dan berpikir tenang (

tender-mindedness

)

(Brand & Egan, 1989; De Raad, 1998,

dalam Larsen & Buss, 2010). Penyebab utama dari perbedaan ini adalah

perbedaan peneliti dalam memulai penelitian, yaitu dengan menggunakan

kelompok yang berbeda hingga analisis faktor (Larsen & Buss, 2010). Jadi, dari

beberapa penelitian tersebut, ditemukan bahwa BFI memiliki lima faktor,

(21)

Berdasarkan pendekatan leksikal, pengukuran terhadap trait yang muncul

secara universal, yang artinya adalah tetap memperhatikan perbedaan bahasa dan

budaya merupakan hal yang lebih penting dibanding tidak memperhatikan

perbedaan bahasa dan budaya. Penelitian yang berkaitan dengan hal ini telah

dilakukan dibeberapa negara, yaitu di negara Turki, Jerman, Italia. Hasil

penelitian di Turki menunjukkan bahwa faktor

openness

lebih jelas terlihat,

penelitian di Jerman menunjukkan bahwa kelima faktor BFI menjelaskan

intelegensi, talenta, dan kemampuan seseorang, dan penelitian di Italia

menunjukkan bahwa kelima faktor BFI adalah faktor yang sudah biasa dalam diri

individu yang ditandai dengan aitem-aiten memberontak dan selalu mengkritik

(Larsen & Buss, 2010).

Penelitian

mengenai BFI juga dilakukan Schmitt, dkk (2007), yaitu bentuk

dan profil dari deskripsi diri manusia di 56 negara. Jadi, bagian International

Sexuality Description Project menerjemahkan BFI dari bahasa Inggris menjadi 28

bahasa yang diadministrasikan kepada 17.837 orang dari 56 negara. Hasil

menunjukkan bahwa kelima dimensi yang ada pada BFI secara kuat menjelaskan

wilayah-wilayah utama di dunia. Level trait dihubungkan dapat menjadi cara

untuk memprediksi harga diri, sosioseksual, dan profil kepribadian nasional.

Orang-orang dari daerah geografis Amerika Selatan dan Asia Timur menunjukkan

hasil yang signifikan pada dimensi

openness

dibanding daerah lain yang ada di

dunia.

Penelitian juga telah dilakukan pada mahasiswa, yaitu dengan skor

(22)

Costa, 2006), pengukuran mengenai kepribadian

five factor

yang dilakukan juga

menemukan bahwa mahasiswa cenderung lebih tinggi pada faktor

Neuroticism,

Extraversion

, dan

Openness

, dan lebih rendah pada faktor

Agreeableness

dan

Conscientiousness.

Terdapat juga para peneliti yang fokus perhatiannya mengenai

lintas budaya yang disebut dengan multikulturalis.

Multikulturalis

mengembangkan sebuah ide yang disebut relativisme kebudayaan, yang

menyatakan bahwa nilai-nilai manusia dapat hanya dinilai dari dalam perspektif

budaya dimana mereka tumbuh, karena nilai-nilai yang ada pada mereka dibentuk

oleh budaya (McCrae & Costa, 2006).

Oleh karena itu, sangat penting bagi

peneliti untuk memperhatikan unsur budaya ketika ingin melakukan suatu

penelitian.

Penelitian BFI juga telah dilakukan oleh Mariyanti (2012), yaitu adaptasi

BFI ke dalam bahasa Indonesia. Hasil analisis faktor

exploratory

ini menunjukkan

jumlah faktor yang sama antara versi asli dengan versi adaptasi dalam Bahasa

Indonesia yaitu terdapat 5 faktor. Namun, terdapat perbedaan pada beberapa

indikator perilaku pada beberapa faktor (yang ditandai dengan nomor aitem yang

berbeda). Perbedaan diduga disebabkan oleh adanya perbedaan budaya antara

Indonesia dengan negara asal BFI. Beberapa aitem yang seharusnya dikategorikan

sebagai faktor tertentu dapat muncul sebagai faktor lain di Indonesia disebabkan

adanya perbedaan kepercayaan dan budaya pada masyarakat Indonesia dengan

negara asal (Mariyanti, 2012).

Indonesia memiliki budaya yang beragam, dan hal ini dapat dilihat dari

(23)

Batak Toba, Jawa, Batak Karo, Batak Simalungun dan lain-lain. Etnis yang

berbeda tersebut memberikan pengaruh terhadap individu-individu yang ada

dalam budaya tertentu, baik perilaku, maupun cara berpikir individu (Bangkaru,

2001). Memandang bahwa individu yang memiliki budaya yang berbeda-beda

tersebut, maka dibutuhkan suatu alat tes yang penggunaannya dapat berfungsi

secara adil, sehingga generalisasi alat tes merupakan hal yang penting, terutama

pada budaya yang berbeda-beda. Oleh karena itu sangat penting untuk melihat

bagaimana penggunaan BFI di Indonesia dengan budaya yang beragam, apakah

terdapat perbedaan respon terhadap aitem yang ada pada BFI. Hal ini

berhubungan dengan validitas suatu alat tes, yaitu apakah alat tes tersebut tetap

bekerja sesuai fungsinya ketika diterapkan di berbagai budaya. Hal ini sangat

dipengaruhi oleh bagaimana pemahaman subjek terhadap aitem yang ada pada

BFI

,

apakah dengan budaya dan bahasa yang berbeda berpengaruh terhadap

bagaimana subjek memahami aitem yang ada. Menurut Bangkaru (2001),

masing-masing budaya yang ada di Indonesia memiliki nilai budaya, tradisi dan

kepercayaan budaya masing-masing yang membuat satu budaya berbeda dengan

budaya yang lain. Penelitian ini melibatkan etnis karena dengan etnis yang

berbeda, terdapat kemungkinan tes rentan terhadap bias, sehingga membutuhkan

tes yang tidak bias.

Seperti yang dijelaskan sebelumnya, Indonesia memiliki etnis yang

beragam. Masing-masing etnis memiliki nilai-nilai budaya yang berbeda. Dari

beberapa etnis dan nilai budaya tersebut, ada dua etnis yang memiliki beberapa

(24)

Jawa. Etnis Batak terdiri dari beberapa jenis, antara lain Batak Toba, Batak

Mandailing, Batak Simalungun, Batak Karo, dan Batak Pakpak. Masing-masing

etnis tersebut dipengaruhi oleh budaya Batak Toba. Meskipun masing-masing

etnis memiliki nilai budaya dan kepribadian yang berbeda-beda, akan tetapi

sebagian besar nilai budaya mereka dipengaruhi oleh budaya Batak Toba,

misalnya Mandailing yang mirip dengan budaya Batak Toba, yaitu penggunan

marga hukum adat yang sangat berpengaruh terhadap kepribadian individu

menjadi terbuka terhadap sesama mereka. Kemudian Simalungun yang

dipengaruhi oleh etnis Melayu dan sedikit budaya Batak Toba, sehingga memiliki

budaya sangat menghargai adanya level dalam hubungan sosial (Bangkaru, 2001).

Berdasarkan hal tersebut, maka peneliti tertarik untuk meneliti etnis Batak Toba

dan Jawa karena memiliki nilai budaya yang membentuk kepribadian kedua etnis

tersebut menjadi sangat berbeda yaitu orang Batak Toba dengan kepribadian

yang mandiri, sangat menghargai keterbukaan, sadar diri dan sangat menghargai

desentralisasi, sedangkan orang Jawa memiliki stereotip sebagai suku bangsa yang

sopan dan halus, tetapi mereka juga terkenal sebagai suku bangsa yang tertutup

dan tidak mau terus terang (Harahap & Siahaan, 1987;

Endraswara, 2010

).

Memandang bahwa merupakan hal yang penting untuk mengetahui apakah

aitem-aitem tersebut benar-benar dipahami oleh subjek sesuai dengan tujuan awal

dari BFI, dan juga untuk membuktikan apakah BFI yang sudah diadaptasi bersifat

adil, maka diperlukan sebuah pengujian terhadap aitem-aitem yang ada pada BFI.

Dalam kajian ilmu psikologi, khususnya kajian psikometri disebut uji

(25)

disebut dengan DIF). DIF merupakan sebuah kondisi yang terjadi ketika

pengujian terhadap dua kelompok menunjukkan kemungkinan untuk menyetujui

atau tidak menyetujui aitem yang berbeda setelah kemampuan dasar yang telah

disetarakan (Camilli & Shepard, 1994; Clauser & Mazor, 1998 dalam Zumbo,

1999).

Menurut Zumbo (1999), ada dua hal penting yang perlu diperhatikan

ketika menggunakan analisis DIF, diantaranya adalah ketika anda menggunakan

tes yang sudah ada; atau ketika anda mengembangkan pengukuran yang baru atau

memodifikasi pengukuran (Zumbo, 1999; hal 14). Jadi, sebelum memutuskan

untuk menggunakan analisis DIF dalam suatu penelitian, maka kedua hal tersebut

perlu untuk diperhatikan kembali. Penelitian ini menguji DIF dengan alasan

karena peneliti menggunakan alat tes yang sedang dikembangkan, yaitu BFI yang

sudah diadaptasikan ke dalam bahasa Indonesia.

Penelitian mengenai DIF mencakup dua kelompok yang diuji, yaitu

kelompok referensi dan kelompok fokal. Dan hal ini lebih umum dikenal dengan

kelompok mayoritas dan kelompok minoritas. Dalam kehidupan sehari-hari

terdapat banyak kelompok referensi dan Fokal, dan seorang individu mungkin

terlibat pada satu atau lebih. Contohnya, wanita kulit putih mungkin termasuk

kedalam kelompok Referensi untuk satu analisis dan masuk kedalam kelompok

Fokal untuk hal yang lain (Camilli & Shepard, 1994). Dalam penelitian ini, yang

termasuk ke dalam kelompok Referensi adalah etnis Batak Toba, karena

kepribadian etnis tersebut lebih mendominasi dalam faktor-faktor yang terdapat

(26)

diri dan sangat menghargai desentralisasi. Sedangkan etnis Jawa termasuk dalam

kelompok Fokal, yaitu dengan kepribadian sebagai suku bangsa yang sopan dan

halus, tetapi mereka juga terkenal sebagai suku bangsa yang tertutup dan tidak

mau terus terang. Sehingga dalam penelitian DIF etnis pada BFI ini, peneliti ingin

melihat apakah aitem-aitem yang ada dalam BFI mengandung DIF etnis atau

tidak.

B. Rumusan Masalah

Sesuai dengan masalah yang dipaparkan sebelumnya, maka permasalahan

yang akan diteliti dalam penelitian ini adalah “Apakah aitem-aitem dalam BFI

versi Indonesia mengandung DIF Etnis?”

C. Tujuan Penelitian

Tujuan penelitian ini adalah untuk melengkapi bukti empiris BFI versi

Indonesia merupakan tes yang adil digunakan pada etnis Batak Toba dan Jawa.

D. Manfaat Penelitian

1. Manfaat Teoritis

Penilitian ini diharapkan dapat menambah referensi mengenai

keberfungsian aitem-aitem BFI ketika diterapkan dalam budaya Indonesia

2. Manfaat Praktis

Penelitian ini diharapkan dapat memberikan referensi kepada para praktisi

untuk menggunakan BFI sebagai salah satu alternatif alat tes kepribadian

yang dapat digunakan sebagai pertimbangan dalam pengambilan

(27)

BAB II

TINJAUAN PUSTAKA

A. Teori Kepribadian Big Five

1. Sejarah

Trait

adalah unit fundamental dari kepribadian, yang mewakili watak secara

luas untuk merespon suatu kondisi dengan cara tertentu. Penelitian mengenai

trait

kepribadian membutuhkan model persetujuan yang general mengenai penelitian

yang dilakukan oleh peneliti, sama halnya dengan ilmu pengetahuan yang lain.

Selama 40 tahun terakhir, sejumlah konsep kepribadian, dan sejumlah skala

pertanyaan didesain untuk mengukur

trait

kepribadian tersebut, dan hal ini

semakin meluas tanpa ada akhir yang jelas. Dalam bahasa inggris sendiri, terdapat

lebih dari 5000 kata yang menjelaskan

trait

kepribadian (Pervin, dkk, 2005).

Selama bertahun-tahun, para peneliti

trait

termasuk Eysenck, Cattell, dan yang

lainnya telah melakukan perdebatan mengenai jumlah dan asal dimensi dasar

trait

kepribadian

.

Namun hal ini tidak terselesaikan, hingga tahun 1980an terdapat

perkembangan secara bertahap dalam kualitas dan pengalaman metode, yang

berujung pada banyaknya peneliti yang setuju bahwa perbedaan individu dapat

dikategorikan ke dalam lima faktor bipolar yang dikenal sebagai “

Big Five

” (John

& Srivastava; McCrae & Costa dalam Pervin, dkk, 2005).

Kelima faktor yang berbeda-beda tersebut adalah

Neuroticism

(N),

(28)

atau yang sering disingkat dengan sebutan OCEAN. Masing-masing faktor dalam

BFI tersebut dapat dijelaskan sebagai berikut (Pervin, dkk, 2005):

1. Neuroticism

(N). Mengidentifikasi kecenderungan individu akan mengalami

kondisi

psikologis yang kurang baik, memiliki ide-ide yang tidak realistis,

kebutuhan/keinginan yang berlebihan, dan tidak dapat menyesuaikan respon

dengan kondisi yang ada. Dimensi bipolar dari faktor ini adalah

Emotional

Stability

2. Extraversion

(E).

Mengukur kuantitas dan intensitas interaksi intrapersonal,

aktivitas yang dilakukan, kebutuhan akan stimulasi, melakukan hal yang

disenangi. Dimensi bipolar dari faktor ini adalah

Introversion

3. Openness

(O).

Mengukur keinginan untuk mencari dan menghargai

pengalaman baru bagi dirinya sendiri, senang mengetahui sesuatu yang tidak

terkenal atau tidak familiar. Dimensi bipolar dari faktor ini adalah

Closedness

4. Agreeableness

(A). Mengukur kualitas orientasi interpersonal seseorang,

mulai dari perasaan kasihan sampai pada sikap permusuhan dalam hal pikiran,

perasaaan, dan tindakan. Dimensi bipolar dari faktor ini adalah

Antagonism.

5. Conscientiousness

(C).

Mengukur tingkat keteraturan seseorang, ketahanan

dan motivasi dalam mencapai tujuan. Berlawanan dengan ketergantungan, dan

kecenderungan untuk menjadi malas dan lemah. Dimensi bipolar dari faktor

(29)

Keterangan lebih lengkap mengenai dimensi bipolar dari kelima faktor

kerpribadian

Big Five

dapat dilihat pada tabel 1 berikut:

Tabel 1. Karakteristik Sifat-Sifat

Big Five Model

Dengan Skor Tinggi dan rendah

Skor tinggi

Sifat

Skor rendah

Kuatir, cemas, emosional,

merasa tidak nyaman,

kurang penyesuaian,

kesedihan yang tak

beralasan.

Neuroticism

Tenang , santai, tidak

emosional, tabah, nyaman,

puas terhadap diri sendiri.

Mudah bergaul, aktif,

banyak bicara, orientasi

pada manusia, optimis,

menyenangkan, kasih

sayang, bersahabat.

Extraversion

Tidak ramah, tenang, tidak

periang, menyendiri,

orientasi pada tugas

,

pemalu, pendiam.

Rasa ingin tahu tinggi,

ketertarikan luas, kreatif,

orisinil imajinatif, tidak

ketinggalan zaman

.

Openness

Mengikuti apa yang sudah

ada, kembali ke alam

,

tertarik hanya pada satu hal,

tidak memiliki jiwa seni,

kurang analitis.

Berhati lembut, baik, suka

menolong, mudah

percaya, mudah

memaafkan, mudah untuk

dimanfaatkan, terus

terang.

Agreeableness

Sinis, kasar, rasa curiga,

tidak mau bekerjasama,

pendendam, kejam, mudah

marah, manipulatif.

Teratur, dapat dipercaya,

pekerja keras, disiplin,

tepat waktu, teliti, rapi,

ambisius, tekun.

Conscientiousness

Tidak bertujuan, tidak

dapat dipercaya, malas,

kurang perhatian, lalai,

sembrono, tidak disiplin,

keinginan lemah, suka

bersenang-senang.

Tabel 1 menunjukkan dimensi bipolar dari masing-masing faktor yang ada

pada

Big Five,

yaitu karakterisitik dari individu yang berada pada skor yang

tinggi ataupun rendah, sehingga dapat dilihat kecenderungan sifat-sifat individu

(30)

2. Keuniversalan Dimensi Big Five

Jika ada pertanyaan umum yang fokus pada perbedaan individu dan interaksi

manusia, maka untuk menjawab hal ini perlu dilakukan pembuktian terhadap

keuniversalan struktur faktor

Big Five

. Untuk membuktikan keuniversalan faktor

Big Five

, sejumlah penelitian lintas budaya mengenai

trait

kepribadian semakin

meningkat secara dramatis pada dekade sebelumnya, terutama penelitian yang

dilakukan secara internasional oleh tim yang berasal dari negara yang

berbeda-beda. Hal ini mungkin dapat menjadi awal untuk menjawab pertanyaan tersebut

mengenai keuniversalan

Big Five

(Pervin, dkk, 2005).

Penelitian lintas budaya sangat penting untuk menjadi acuan dalam menjawab

keuniversalan faktor

Big Five

. Namun, sebelum melihat hasil dari penelitian, satu

hal yang perlu diperhatikan yaitu metode yang digunakan dalam penelitian

tersebut. Dalam penelitian, yaitu mengenai apakah

Big Five

bersifat universal,

masalah metodologi dapat memberikan suatu perbedaan besar. Salah satu

masalahnya meliputi penejermahan. Banyak peneliti yang mempelajari apakah

trait

kepribadian bersifat universal hanya dengan menerjemahkan kuesioner dari

satu bahasa asli (seperti bahasa Inggris) menjadi beberapa bahasa yang lain

(seperti bahasa Jerman, Jepang, dan lain-lain), tanpa mempertimbangkan

terjemahan tersebut dapat bersifat menjebak, dan mungkin juga kurang satu

persatu kata dari tiap terjemahan dan pemaknaan yang berbeda juga. Bahasa boleh

berbeda dan bahkan kata-kata yang diterjemahkan sama dapat memiliki arti yang

berbeda. Contohnya adalah kata “

aggressive”

dalam bahasa Inggris memiliki

(31)

Jerman, kata “

aggressive”

memiliki arti “

hostile

(bersifat mengancam)”

dibanding “

forceful-assertive

(ketegasan yang berlebihan) (Pervin, dkk, 2005).

Sebuah resensi kuantitatif yang dilakukan oleh De Raad, dkk (dalam Pervin,

dkk, 2005) membandingkan banyak penelitian Eropa, dan menyimpulkan bahwa

faktor yang mirip dengan

Big Five

muncul dalam banyak bahasa tetapi faktor

Openness

yang paling sedikit muncul. Hanya sedikit penelitian pada budaya dan

bahasa

non-western

yang pernah dilakukan (seperti Cina, Jepang, Filipina) dan

faktor

Openness

tidak begitu terlihat. Penelitian-penelitian yang ada menemukan

bahwa tiga faktor yaitu

extraversion, agreeableness

dan

conscientiousness

dapat

ditemukan di hampir semua bahasa, hanya dua faktor lain yaitu

neuroticism

dan

openness

yang kurang reliabel secara lintas budaya (Saucier, Hampson, &

Goldberg dalam Pervin, dkk, 2005). Penelitian yang ada di Indonesia, yaitu yang

dilakukan oleh Mastuti (2005) menemukan bahwa terdapat satu faktor tambahan

ketika dilakukan analisis faktor pada mahasiswa suku Jawa. Selain itu, penelitian

lain juga dilakukan oleh Mariyanti (2012) menemukan lima faktor yang ada pada

Big Five

tersebut ketika diberikan pada sampel yang lebih umum, dan penelitian

Samosir (2013) menemukan bahwa terdapat dua faktor tambahan ketika dilakukan

analisis faktor terhadap suku Batak Toba. Memandang perbedaan hasil tersebut,

maka sangat perlu dilakukan pengujian terhadap aitem-aitem yang ada pada

Big

(32)

3. Big Five Inventory (BFI)

Berbicara mengenai kebutuhan akan sebuah instrumen pendek untuk

mengukur komponen khusus dari

Big Five

, maka John, Donahue dan Kentle

(dalam John & Srivastava, 1999) mengkonstrak Big Five Inventory (BFI). Empat

puluh empat aitem BFI dikembangkan merepresentasikan definisi asli yang

dikembangkan berdasarkan penilaian ahli dan kemudian dilakukan pembuktian

dengan analisis faktor dan pembuktian terhadap penilaian kepribadian oleh

pengamat. Tujuan dari pembuatan alat ukur singkat ini adalah agar tercipta alat

ukur yang efisien dan fleksibel dari kelima faktor tersebut. Terdapat juga tokoh

yang menjelaskan mengenai BFI tersebut, yaitu Burisch (dalam John &

Srivastava, 1999) mengatakan bahwa skala yang singkat tidak hanya

mempersingkat waktu tes, tetapi juga menghindari kebosanan dan kelelahan yang

dialami subjek, subjek yang tidak memberikan respon yang sesungguhnya jika tes

terlihat membutuhkan waktu yang panjang. BFI tidak menggunakan kata sifat

tunggal sebagai aitem karena aitem seperti itu direspon dengan tidak konsisten

dibandingkan ketika aitem ditambahkan definisi ataupun kalimat tertentu

(Goldberg & Kilkowski, 1985 dalam John & Srivastava, 1999). BFI

menggunakan frase yang singkat didasarkan kata sifat yang diketahui

merepresentasikan kelima faktor

Big Five

(John, 1989, 1990 dalam John &

Srivastava, 1999). Kata sifat yang ada pada faktor

Big Five

disajikan sebagai inti

dari aitem dimana informasi yang jelas, luas, dan kontekstual menjadi tambahan.

Contohnya, kata sifat dari faktor ‘

Openness

’ merupakan kata sifat yang original

(33)

baru’ dan kata sifat untuk faktor ‘

Conscientiousness

’

disajikan sebagai dasar

untuk aitem dengan tambahan ‘bertahan hingga tugas diselesaikan’. Aitem-aitem

yang ada dalam BFI memberikan keuntungan dengan kata sifat (ringkas dan

sederhana) yaitu dapat mencegah ambiguitas atau arti ganda (

multiple meaning

).

Ketika dilakukan pengujian pada sampel yang berasal dari negara Kanada dan

Amerika Serikat, diperoleh reliabilitas alpha skala BFI berkisar antara 0.75

sampai 0.90 dan rata-rata reliabilitas tiap faktor diatas 0.80; reliabilitas tes

retesnya dalam rentang waktu tiga bulan berada antara 0.80 sampai 0.85 dimana

memiliki mean sebesar 0.80 (John & Srivastava, 1999). Sedangkan penelitian

yang dilakukan di Indonesia oleh Mariyanti (2012) diperoleh reliabilitas alpha

skala sebesar 0.70, yang berarti bahwa BFI yang telah diadaptasi ke dalam bahasa

Indonesia memiliki reliabilitas yang baik.

BFI yang digunakan dalam penelitian ini adalah BFI yang telah diadaptasi

kedalam versi bahasa Indonesia yang dilakukan oleh Mariyanti (2012).

Berdasarkan teori tersebut ditemukan bahwa terjadi perbedaan indikator dari

kelima faktor yang menyusun alat ukur BFI versi adaptasi Bahasa Indonesia, yaitu

(Mariyanti, 2012):

1. Openness

(O) adalah faktor yang melihat keterbukaan individu untuk mencari

tantangan dan hal-hal baru. Seseorang dikatakan terbuka terhadap pengalaman

(

open to experience

)

ketika memiliki karakteristik seperti cerdas dan suka

berpikir, memiliki ide-ide inovatif, percaya diri, mampu mempertimbangkan

(34)

2. Neuroticism

(N) adalah faktor yang mengidentifikasi individu yang rentan

terhadap distress psikologis, yaitu mudah mengalami rasa sedih, takut dan

cemas berlebihan, memiliki dorongan berlebihan, tidak bisa menyesuaikan

respon dengan kondisi yang ada. Selain itu juga terlihat dalam bentuk perilaku

mudah tersinggung (

irritability

) dan pemarah (

hostile

). Seseorang dikatakan

neurotis ketika individu tersebut mudah merasa tertekan dan sedih, tidak

mampu menghadapi situasi stress dengan baik, pencemas, suasana hati mudah

berubah, labil, pemalu dan perhatiannya mudah terganggu.

3. Conscientiousness

(C) adalah faktor yang melihat kesadaran diri, motivasi dan

kemampuan mengorganisasikan sesuatu dalam mencapai suatu tujuan.

Seseorang dikategorikan dalam faktor

Conscientiousness

ketika individu

tersebut memiliki karakteristik seperti teliti, terorganisir, tidak pemalas,

menyukai suatu pekerjaan yang rutin serta mampu bertahan dan mengerjakan

suatu tugas hingga selesai.

4. Extraversion

(E) adalah faktor yang melihat aktivitas yang dilakukan

sehari-hari dan kemampuan melakukan hubungan interpersonal individu. Seseorang

dikatakan

extrovert

apabila individu tersebut suka mengobrol, tidak pendiam,

santai, mudah bergaul dan senang bekerjasama dengan orang lain.

5. Agreeableness

(A) adalah faktor yang melihat kualitas

trust

dan seni individu.

Seseorang dikategorikan dalam faktor

Agreeableness

ketika individu tersebut

memiliki karakteristik seperti senang membantu dan tidak egois, mudah

memaafkan dan mempercayai orang lain, dan memiliki apresiasi terhadap

(35)

B. Differential Item Functioning (DIF)

1. Definisi

DIF adalah istilah teknis dalam ilmu pengukuran. DIF merupakan keadaan

yang menyatakan bahwa fakta-fakta empiris yang telah dianalisis menggunakan

metodologi yang terstandarisasi menunjukkan bahwa sebuah aitem tes bekerja

secara berbeda untuk dua kelompok atau lebih. Semua prosedur yang digunakan

untuk mengidentifikasi DIF perlu mempertimbangkan variasi kemampuan

kelompok (Osterlind & Everson, 2009 dalam Osterlind, 2010). DIF juga

menjelaskan performansi aitem secara individual dan tidak dihubungkan dengan

tes secara keseluruhan (Osterlind, 2010). Selain definisi diatas, Thiesse, Steinberg

& Wainer (dalam Reeve, 2002) menyatakan bahwa DIF merupakan kondisi

sebuah aitem yang berfungsi secara berbeda untuk responden dari kelompok yang

satu dengan kelompok yang lain. Dengan kata lain, responden dengan kesamaan

pada level trait laten, tetapi berasal dari populasi yang berbeda memiliki

kemungkinan berbeda dalam merespon sebuah aitem.

Menurut kajian psikometri, awalnya diskusi mengenai DIF berada pada

tataran emosional dan politik yaitu mengenai tes yang dianggap adil dan

konsekuensi dari penggunaan tes terhadap pengambilan keputusan, kemudian

diskusi terkini yang dilakukan oleh Camilli (dalam Osterlind, 2010) mengenai tes

yang adil dipandang dari perspektif yang lebih luas, yaitu meliputi dampak dan

penggunaan tes yang bersifat merugikan. Banyak ahli psikometri yang menguji

masalah-masalah praktis pengujian DIF memfokuskan usaha-usaha mereka pada

(36)

Istilah DIF sering dianggap sama dengan bias aitem

.

Beberapa penelitian

menyatakan bahwa istilah DIF dan bias aitem sering dipertukarkan. Sebaliknya,

terdapat juga penelitian yang menyatakan bahwa DIF dan bias aitem merupakan

dua konsep yang berbeda.

Penelitian yang dilakukan oleh Ellis & Raju (dalam Acar, 2011) menggunakan

istilah DIF yang sering dipertukarkan dengan bias aitem. Pada akhir tahun

1980an, istilah DIF berubah posisi dari istilah ‘bias aitem’. DIF mengungkap

perbedaan dalam kesempatan menjawab aitem dengan benar dengan

mempertimbangkan tingkat kemampuan tiap kelompok yang telah diukur

disesuaikan dengan aitem (Embretson & Reise, 2000; Lord, 1980 dalam Acar,

2011). Dalam studi mengenai DIF, diperlukan perbandingan performansi pada

aitem tes suatu kelompok pada tingkat kemampuan yang sama tetapi memiliki

karakteristik demografis yang berbeda, seperti pria-wanita atau Asia-Eropa

(Greer, 2004 dalam Acar, 2011).

Sebaliknya, Camilli, dkk (dalam Zumbo, 1999) menjelaskan bahwa

konsep mengenai DIF dan Bias merupakan dua hal yang berbeda. Bias aitem

terjadi ketika individu dari satu kelompok cenderung untuk menjawab aitem

dengan benar (atau menyetujui pernyataan dalam aitem) dibandingkan peserta

individu dari kelompok lainnya, karena beberapa karakteristik dari aitem yang

dipakai dalam mengukur atau situasi pengukuran yang tidak relevan dengan

tujuan tes. Sedangkan DIF merupakan sebuah kondisi yang terjadi ketika

pengujian terhadap dua kelompok menunjukkan kemungkinan untuk menyetujui

(37)

kabangsaan, daerah demografis, dan lain-lain, setelah kemampuan dasar yang

telah disetarakan (Camilli & Shepard, 1994; Clauser & Mazor, 1998 dalam

Zumbo, 1999). Dalam penelitian ini menggunakan konsep DIF yang sama dengan

bias aitem. Hal ini dikarenakan DIF merupakan bagian dari bias, yaitu dua

kelompok berasal dari populasi yang berbeda memiliki kesempatan yang berbeda

dalam menyetujui aitem setelah kemampuan dasar yang telah disetarakan. Hal ini

disebabkan oleh beberapa karakteristik seperti budaya, demografis, ras, dan

lain-lain.

2. Jenis-jenis DIF

Penelitian mengenai DIF menguji dua kelompok, yaitu kelompok Referensi

(

Reference

Group) dan kelompok Fokal (

Focal Group

). Dan hal ini lebih umum

dikenal dengan kelompok mayoritas dan kelompok minoritas. Dalam sebuah

penelitian, seorang individu dapat termasuk ke dalam kelompok referensi, dan

sebaliknya dapat pula termasuk dalam kelompok fokal untuk penelitian lain.

Contohnya, wanita kulit putih mungkin termasuk kedalam kelompok Referensi

untuk satu analisis dan masuk kedalam kelompok Fokal untuk hal yang lain

(Camilli & Shepard, 1994). Dalam teori respon aitem (

Item Response Theory

),

DIF terbagi atas dua kategori, yaitu

Uniform

atau

Consistent

DIF dan

Non-uniform

atau

inconsistent

DIF. Pembagian kelompok tersebut dilihat dari

Item

characteristic curves

(ICCs), yaitu kurva yang menunjukkan hubungan antara

kemungkinan jawaban benar terhadap suatu aitem dengan kemampuan individu

(38)

1. Uniform

atau

Consistent

DIF, terjadi ketika satu kelompok relatif diuntungkan

untuk keseluruhan aitem skala kemampuan, sedangkan kelompok lain

dirugikan. Hal ini dapat dilihat dari

Item characteristic curves

(ICCs) yang

tidak berpotongan atau bersinggungan pada semua aitem skala kemampuan

yang disajikan pada figure 1 berikut.

Figure 1. Dua ICC yang tidak bersinggungan

2. Non-uniform

atau

inconsistent

DIF: terjadi ketika satu kelompok relatif

diuntungkan untuk beberapa aitem skala kemampuan, sedangkan kelompok

lain dirugikan. Oleh karena itu, DIF dapat memberikan keseimbangan ataupun

tidak pada masing-masing kelompok untuk ditingkat tertentu. Hal ini dapat

dilihat dari

Item characteristic curves

(ICCs) yang berpotongan atau

bersinggungan pada beberapa aitem skala kemampuan disajikan pada figure 2

(39)

Figure 2. Dua ICC yang bersinggungan

Kajian Psikometri menjelaskan bahwa DIF memiliki hubungan dengan

validitas. Hal ini sejalan dengan yang dinyatakan dalam penelitian Salehi &

Tayebi (2012) bahwa konsep mengenai proses validasi berhubungan secara umum

dengan pembuatan tes dan juga dengan konsep keadilan tes dan bias tes, serta

sumber-sumber lain yang berhubungan dengan hal tersebut (seperti gender, hasil

penelitian, usia, kebangsaan, latar belakang pengetahuan/pendidikan, dan

lain-lain) dan umumnya dapat memberikan ancaman terhadap validitas tes (Salehi &

Tayebi, 2012). Ketika membahas mengenai validitas dalam pengukuran, maka

sangat penting untuk menilai secara utuh bahwa validitas merupakan sebuah

konsep ilmiah dan merupakan hal yang penting dalam ilmu pengukuran. Menurut

American Educational Research Association, dkk (1999 dalam Osterlind, 2010),

validitas merupakan hal yang menjadi pertimbangan utama ketika hendak

(40)

Selain validitas, karakterisitk lain yang perlu diperhatikan dalam sebuah alat

ukur adalah reliabilitas. Reliabilitas hasil pengukuran memiliki hubungan dengan

kesalahan (

error

), yaitu

random error

, yaitu kesalahan yang terjadi karena adanya

perbedaan antara skor yang sebenarnya (

true score

) dan skor yang diamati

(

observed score

) pada individu yang dapat berpengaruh kepada hasil kelompok.

Hubungan antara reliabilitas dengan DIF adalah bahwa DIF terjadi karena adanya

kesalahan (

error

) dalam pengukuran, yaitu kesalahan sistematis (

systematic

error

), yaitu kesalahan yang melibatkan respon kelompok yang dapat

mempengaruhi hasil pengukuran. Oleh karena itu, munculnya kesalahan dalam

pengukuran dapat menghasilkan reliabilitas yang rendah (Osterlind, 2010). Jadi,

aitem yang mengandung DIF bisa dikatakan sebagai aitem yang memiliki

kesalahan (

error

) karena bersifat tidak adil untuk dua kelompok yang berasal dari

populasi yang berbeda dan dapat mengakibatkan pengukuran menjadi tidak

reliabel.

3. Dampak DIF

Validitas pengukuran merupakan salah satu masalah utama yang dipengaruhi

oleh bias pengukuran. Seperti yang kita ketahui bahwa salah satu keobjektifan

suatu aplikasi pengukuran adalah diperolehnya informasi mengenai individu dan

aitem-aitem tes. Oleh karena itu, maka instrumen dan hasil pengukuran yang valid

dan akurat sangat dibutuhkan untuk menghasilkan objektivitas. Namun, salah satu

faktor yang dapat memberikan pengaruh yang negatif pada validitas adalah bias

(41)

aitem pada tes dapat melemahkan reliabilitas hasil yang berpengaruh terhadap

keputusan yang dibuat (Acar, 2011).

Selanjutnya, Thiesse, Steinberg, & Wainer (dalam Reeve, 2002) menyatakan

bahwa aitem yang terdeteksi DIF merupakan sebuah ancaman yang serius

terhadap validitas sebuah instrumen yang mengukur level trait kelompok ataupun

populasi yang berbeda. Instrumen yang berisi aitem-aitem yang terdeteksi DIF

mungkin dapat mengurangi validitas untuk perbandingan antarkelompok, karena

skor mereka mungkin menunjukkan atribut lain dibandingkan skala yang

mengukur apa yang seharusnya diukur. Kemudian, dalam penelitian yang

dilakukan oleh Rahmawati (2010) dijelaskan bahwa bias aitem juga merupakan

ancaman terhadap validitas pengukuran. Bila aitem tes berfungsi secara berbeda

pada dua kelompok peserta, mungkin aitem tersebut mengukur trait yang berbeda

pada kelompok tersebut. Hal ini akan menyebabkan kesimpulan yang salah

mengenai kemampuan tes untuk mengukur apa yang seharusnya diukur. DIF

merupakan titik awal studi tentang bias aitem.

Salehi & Tayebi (2012) dalam penelitiannya menjelaskan mengenai konsep

validitas yaitu berperan dalam hal bahasa yang digunakan dalam tes dan

pengukuran. Proses validasi kemudian dikaitkan dengan usaha untuk proses

membuat tes yang bisa digunakan secara umum, yaitu tes-tes keahlian bahasa

tertentu, seperti bahasa Inggris. Kemudian dihubungkan dengan konsep keadilan

tes dan bias tes dan sumber-sumber penyebabnya (seperti gender, hasil penelitian,