DIFFERENTIAL ITEM FUNCTIONING
(DIF) ETNIS
PADA BIG FIVE INVENTORY (BFI) VERSI ADAPTASI
FAKULTAS PSIKOLOGI UNIVERSITAS SUMATERA UTARA
SKRIPSI
Diajukan untuk memenuhi persyaratan
Ujian Sarjana Psikologi
Oleh :
HITLER MANIK
081301097
FAKULTAS PSIKOLOGI
LEMBAR PERNYATAAN
Saya yang bertanda tangan di bawah ini menyatakan dengan
sesungguhnya bahwa skripsi saya yang berjudul:
Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi
Adaptasi Fakultas Psikologi Universitas Sumatera Utara
adalah hasil karya saya sendiri dan belum pernah diajukan untuk memperoleh
gelar kesarjanaan di suatu perguruan tinggi manapun.
Adapun bagian-bagian tertentu dalam penulisan skripsi ini saya kutip dari hasil
karya orang lain yang telah dituliskan sumbernya secara jelas sesuai dengan
norma, kaidah, dan etika penulisan ilmiah.
Apabila di kemudian hari ditemukan adanya kecurangan di dalam skripsi ini, saya
bersedia menerima sanksi dari Fakultas Psikologi Universitas Sumatera Utara
sesuai dengan peraturan yang berlaku.
Medan, Desember 2013
Hitler Manik
Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi
Adaptasi Fakultas Psikologi Universitas Sumatera Utara
Hitler Manik
1dan Etty Rahmawati
2ABSTRAK
Big Five Inventory (BFI) merupakan salah satu tes kepribadian yang telah
diadaptasi ke dalam Bahasa Indonesia. Beberapa penelitian telah dilakukan untuk
mengembangkan alat tes BFI versi Indonesia. Penelitian ini bertujuan untuk
melihat apakah alat tes kepribadian BFI merupakan alat tes yang adil jika
diterapkan pada etnis Batak Toba dan etnis Jawa. Oleh karena itu, diperlukan
sebuah pengujian terhadap aitem-aitem yang ada pada BFI. Dalam kajian ilmu
psikologi, khususnya kajian psikometri disebut uji Keberfungsian aitem yang
berbeda (
Differential Item Functioning
). Subjek dalam penelitian ini adalah orang
dewasa berusia 18-40 tahun berjumlah 327 orang, terdiri dari 172 orang etnis
Batak Toba dan 155 orang etnis Jawa. Hasil penelitian menunjukkan terdapat 10
aitem BFI versi Indonesia terdeteksi DIF Etnis. Hasil analisis reliabilitas skor
komposit pada etnis Batak Toba sebesar 0.74 dan Jawa sebesar 0.77.
Kata Kunci
: Big Five Inventory (BFI), Differential Item Functioning (DIF), etnis
Batak Toba, etnis Jawa
Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi
Adaptasi Fakultas Psikologi Universitas Sumatera Utara
Hitler Manik
1and Etty Rahmawati
2ABSTRACT
Big Five Inventory (BFI) is one of personality test had been adapted into
Indonesia language. More research had been developed to adapt the Indonesian
Big Five Inventory. The purpose of this research is to check whether BFI’s
personality test is fair if apply to ethnic of Batak Toba and Java. Therefore,
examination of BFI’s items is needed. In psychology, especially in psychometric
study, it is called Differential Item Functioning (DIF). Subject in this research is
327 people around 18 to 40 years old, including 172 people from ethnic Batak
Toba and 155 people from ethnic Java. The result of this research indicates that
DIF is detected in 10 BFI’s item. The result of reliability analysis composite score
for ethnic Batak Toba is 0.74 and ethnic Java is 0.77.
KATA PENGANTAR
Segala Pujian dan syukur peneliti panjatkan kepada Allah Tritunggal yang
selalu memberikan kekuatan dan telah melimpahkan hikmat dan karunia-Nya
yang begitu luar biasa, sehingga saya dapat menyelesaikan penelitian ini.
Peneliti juga mengucapkan terima kasih kepada:
1.
Orang tua, abang, kakak, adik-adik dan seluruh keluarga yang selalu
mendukung saya baik dalam doa maupun dana untuk penyelesaian penelitian
ini
2.
Prof. Dr. Irmawati, Psikolog selaku Dekan Fakultas Psikologi
3.
Bu Etty Rahmawati, M.Si selaku Dosen pembimbing penelitian peneliti di
Fakultas Psikologi Sumatera utara yang terus mendukung saya dalam
menyelesaikan penelitian ini.
4.
Dosen-dosen yang ada di Departemen Eksperimen (Bu Lili, Bu Ika, Kak Dina,
Kak Rahmi, dan Kak Masitah) yang turut mendukung untuk penyelesaian
penelitian ini.
5.
Dosen Penguji saya, yaitu yang turut membantu saya dalam melengkapi
penelitian saya melalui masukan yang diberikan.
6.
Pak Eka dan juga dosen lain yang mendukung peneliti dalam penyelesaian
penelitian ini.
7.
Kak Mariyanti yang turut membantu dengan memberikan izin penggunaan
penelititannya, yaitu BFI yang sudah diadaptasi ke Bahasa Indonesia untuk
8.
Kelompok Tumbuh Bersama (KTB) saya, yaitu Bang Aswindo, Bang Armen,
Bang Didier, Bang Princen, Kak Ester yang juga turut mendukung dan
mendoakan saya dalam mengerjakan penelitian ini
9.
Adik-adik Kelompok (Rocky, Anggi, Mentari, Immanuel, Felix, Zio) yang
turut mendoakan dan mendukung saya
10. Koordinasi UKM KMK USU UP Psikologi 2013 yang juga membantu dalam
doa dan motivasi agar saya tetap semangat dalam penyelesaian penelitian ini
11. Teman-teman seperjuangan (Edwin, Roimer, Pangeran, Harri, Bang Agus,
Utami, dan yang lain) yang selalu mendukung saya untuk menyelesaikan
penelitian ini
12. Kakak, abang, teman-teman, dan junior saya yang turut membantu, mengajari,
dan meminjamkan buku sehingga peneliti dapat menyelesaikan penelitian ini
13. Semua pihak yang selalu ada dan selalu memberikan semangat buat peneliti,
sehingga penelitian ini dapat diselesaikan.
Peneliti menyadari bahwa penelitian ini masih jauh dari kesempurnaan, untuk
itu peneliti sangat mengharapkan kritik dan saran yang membangun untuk
kesempurnaan penelitian ini. Peneliti juga meminta maaf jika terdapat kesalahan
dalam proses penyelesaian penelitian ini. Akhir kata peneliti berharap kiranya
hasil dari penelitan ini nantinya dapat bermanfaat bagi kita semua.
Medan, Desember 2013
DAFTAR ISI
ABSTRAK
... i
KATA PENGANTAR
... iii
DAFTAR ISI
... v
DAFTAR TABEL
... ix
DAFTAR FIGURE
... x
DAFTAR FORMULA
... xi
DAFTAR LAMPIRAN
... xii
BAB I PENDAHULUAN
A. Latar Belakang Masalah ... 1
B. Rumusan Masalah ... 10
C. Tujuan Penelitian ... 10
D. Manfaat Penelitian ... 10
Kerangka Berpikir
... 11
BAB II TINJAUAN PUSTAKA
A. Teori Kepribadian Big Five ... 12
1. Sejarah ... 12
B.
Differential Item Functioning
... 20
1.
Defenisi ... 20
2.
Jenis-jenis DIF ... 22
3.
Dampak DIF ... 25
4.
Analisis DIF ... 27
C. Etnis ... 28
1.
Batak Toba ... 28
a)
Nilai Budaya Batak ... 29
b)
Hubungan Kontroversial dan inkonsistensi kepada Suku
Bangsa lain ... 30
c)
Kepribadian Batak Toba ... 32
2.
Jawa ... 32
a)
Kebiasaan Ingin Menang Sendiri ... 33
b)
Kebiasaan Yang Menjatuhkan Harga Diri
... 34
c)
Dunia Damai ...
34
d)
Toleransi Orang Jawa ...
35
e)
Kepribadian Jawa ... 36
E. DIF Etnis Pada
Big Five Inventory
... 37
BAB III METODE PENELITIAN
A.
Jenis Penelitian ... 39
B.
Data yang digunakan ... 39
1.
Populasi ... 40
2.
Teknik Pengambilan Sampel... 40
D.
Instrumen yang Digunakan ... 41
E.
Persiapan Penelitian ... 42
1.
Persiapan Awal ... 42
2.
Pelaksanaan Penelitian ... 43
3.
Pengolahan Data Penelitian... 43
4.
Hasil dan Pembahasan ... 43
5.
Kesimpulan dan Saran... 43
F.
Software yang digunakan ... 44
G.
Analisis DIF ... 44
1.
Reliabilitas ... 44
2.
Regresi Logistik ... 45
3.
Regresi Logistik Ordinal ... 46
BAB IV HASIL DAN PEMBAHASAN
A.
Analisa Data Penelitian ... 48
1.
Gambaran Subjek Penelitian ... 48
2.
Reliabilitas Komposit ... 50
3.
Analisis DIF ... 51
B.
Pembahasan
1.
Analisis Reliabilitas ... 56
BAB V KESIMPULAN DAN SARAN
A.
Kesimpulan ... 61
B.
Saran ... 61
DAFTAR TABEL
Tabel 1.
Karakteristik Sifat-Sifat
Big Five Model
dengan Skor Tinggi
dan Rendah
...
14
Tabel 2.
Hubungan dengan Suku Bangsa Lain ... 31
Tabel 3.
Pengelompokan Etnis ke dalam kelompok Referensi dan Fokal ... 37
Tabel 4.
Blueprint
Big Five Inventory ... 42
Tabel 5.
Gambaran Subjek berdasarkan jenis kelamin dan usia ... 48
Tabel 6.
Reliabilitas Skor Batak Toba dan Jawa ... 50
Tabel 7.
Korelasi antar aspek BFI versi Indonesia pada kelompok
Batak Toba dan Jawa ... 50
Tabel 8.
Koefisien Reliabilitas setiap aspek BFI versi Indonesia pada
Kelompok Batak Toba dan Jawa... 51
Tabel 9.
Hasil Analisis Regresi Logistik Ordinal per Aitem BFI
versi Indonesia ... 52
DAFTAR FIGURE
Figure 1.
Dua ICC yang tidak bersinggungan ... 23
DAFTAR FORMULA
Formula 1.
Regresi Logistik Ordinal ... 28
DAFTAR LAMPIRAN
Skala BFI Versi Indonesia ... 65
Hasil Analisis Regresi Logistik ... 68
Hasil analisis Reliabilitas dan Standar Deviasi pada Subjek Batak Toba ... 310
Hasil analisis Reliabilitas dan Standar Deviasi pada Subjek Jawa ... 314
Hasil Analisis Korelasi antar Aspek pada Subjek Batak Toba ... 318
Hasil Analisis Korelasi antar Aspek pada Subjek Jawa ... 319
Nilai
Mean
Aitem yang Terdeteksi DIF... 320
Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi
Adaptasi Fakultas Psikologi Universitas Sumatera Utara
Hitler Manik
1dan Etty Rahmawati
2ABSTRAK
Big Five Inventory (BFI) merupakan salah satu tes kepribadian yang telah
diadaptasi ke dalam Bahasa Indonesia. Beberapa penelitian telah dilakukan untuk
mengembangkan alat tes BFI versi Indonesia. Penelitian ini bertujuan untuk
melihat apakah alat tes kepribadian BFI merupakan alat tes yang adil jika
diterapkan pada etnis Batak Toba dan etnis Jawa. Oleh karena itu, diperlukan
sebuah pengujian terhadap aitem-aitem yang ada pada BFI. Dalam kajian ilmu
psikologi, khususnya kajian psikometri disebut uji Keberfungsian aitem yang
berbeda (
Differential Item Functioning
). Subjek dalam penelitian ini adalah orang
dewasa berusia 18-40 tahun berjumlah 327 orang, terdiri dari 172 orang etnis
Batak Toba dan 155 orang etnis Jawa. Hasil penelitian menunjukkan terdapat 10
aitem BFI versi Indonesia terdeteksi DIF Etnis. Hasil analisis reliabilitas skor
komposit pada etnis Batak Toba sebesar 0.74 dan Jawa sebesar 0.77.
Kata Kunci
: Big Five Inventory (BFI), Differential Item Functioning (DIF), etnis
Batak Toba, etnis Jawa
Differential Item Functioning (DIF) Etnis pada Big Five Inventory (BFI) versi
Adaptasi Fakultas Psikologi Universitas Sumatera Utara
Hitler Manik
1and Etty Rahmawati
2ABSTRACT
Big Five Inventory (BFI) is one of personality test had been adapted into
Indonesia language. More research had been developed to adapt the Indonesian
Big Five Inventory. The purpose of this research is to check whether BFI’s
personality test is fair if apply to ethnic of Batak Toba and Java. Therefore,
examination of BFI’s items is needed. In psychology, especially in psychometric
study, it is called Differential Item Functioning (DIF). Subject in this research is
327 people around 18 to 40 years old, including 172 people from ethnic Batak
Toba and 155 people from ethnic Java. The result of this research indicates that
DIF is detected in 10 BFI’s item. The result of reliability analysis composite score
for ethnic Batak Toba is 0.74 and ethnic Java is 0.77.
BAB I
PENDAHULUAN
A.
Latar Belakang Masalah
Ilmu Psikologi merupakan salah satu cabang ilmu yang berperan untuk
mempelajari proses mental dan perilaku manusia. Untuk mempelajari perilaku
manusia, para ahli psikologi telah melakukan berbagai macam pengukuran, atau
dengan kata lain dilakukan tes psikologi. Salah satu pengukuran yang dilakukan
adalah kepribadian manusia. Kepribadian dalam kehidupan sehari-hari sering
dihubungkan dengan karakter dan sifat individu. Oleh karena itu, ada banyak
peneliti yang melakukan penelitian bagaimana cara untuk mengukur kepribadian
manusia, yaitu sifat-sifat unik yang ada pada tiap-tiap individu (Lahey, 2007).
Pengukuran terhadap kepribadian merupakan hal yang penting dilakukan
karena tiap orang perlu untuk mengenal orang lain ketika hendak berinteraksi,
sehingga dapat menyesuaikan diri dengan orang lain. Pervin (2005)
mengungkapkan bahwa pengukuran terhadap kepribadian merupakan hal yang
penting karena kepribadian merupakan gambaran keseluruhan dari individu, dan
pentingnya untuk memahami keseluruhan aspek yang berbeda dalam individu dan
bagaimana hubungannya dengan orang lain. Selain itu, pengukuran kepribadian
penting dilakukan karena perlu mempelajari individu yang kompleks, seperti
keunikan seseorang, bagaimana interaksi dengan orang lain. Salah satu
pengukuran yang dilakukan adalah melalui tes, yaitu tes kepribadian. Tes
di bidang tertentu. Memandang hal tersebut, maka merupakan hal yang sangat
penting untuk melakukan tes kerpibadian, baik dalam hal seleksi maupun untuk
menentukan jabatan seseorang. Beberapa contoh yang berkaitan dengan
penggunaan tes kepribadaian adalah perekrutan ataupun penyeleksian karyawan
dalam suatu organisasi. Selain itu, tes kepribadian juga dilakukan ketika hendak
memilih jurusan, dan lain-lain.
Beberapa alat tes telah dikembangkan untuk mengukur kepribadian
individu, antara lain adalah
Sixteen Personality Factor
(16 PF), NEO
Personality
Inventory
Revised (NEO-PIR),
Big Five Inventory
(BFI),
Hogan Personality
Inventory
(HPI), dan lain-lain. Beberapa alat tes tersebut sudah dikembangkan dan
juga sudah digunakan di Indonesia. Dalam penelitian ini menggunakan salah satu
alat tes, yaitu
Big Five Inventory
(selanjunya akan disebut BFI). Adapun yang
menjadi alasan penggunaan BFI dalam penelitian ini adalah karena hingga saat ini
BFI dalam tahap pengembangan, sehingga peneliti menganggap penting untuk
meneliti aitem-aitem yang ada dalam BFI. Untuk melengkapi hasil penelitian
sebelumnya, diantaranya adalah penelitian yang dilakukan oleh Mariyanti (2012),
yaitu adaptasi BFI kedalam bahasa Indonesia, dan analisis konstrak pada etnis
Batak juga telah diteliti oleh Samosir (2013), dan analisis DIF administrasi tes
pada aitem BFI (Putri, 2013).
BFI merupakan salah satu alat tes untuk mengukur kepribadian yang
dikonsep dari teori Big Five oleh McCrae & Costa . BFI merupakan tes yang
sering digunakan di berbagai negara, diantaranya Amerika Serikat, Turki, Inggris,
Shackelford, 2008). Memandang bahwa budaya yang ada di negara-negara
tersebut berbeda dengan budaya yang ada di Indonesia, maka sangat diperlukan
suatu tes yang berfungsi sama untuk budaya yang berbeda-beda. Tes yang adil
merupakan tes yang tidak bias. Tes yang tidak bias merupakan tes yang berfungsi
sama meskipun diberikan pada budaya dan negara yang berbeda-beda. Menurut
Camilli & Shepard (1994) dan Clauser & Mazor (1998 dalam Zumbo, 1999), bias
aitem terjadi ketika individu dari satu kelompok cenderung untuk menjawab aitem
dengan benar (atau menyetujui pernyataan dalam aitem) dibandingkan peserta
individu dari kelompok lainnya, karena beberapa karakteristik dari aitem yang
dipakai dalam mengukur atau situasi pengukuran yang tidak relevan dengan
tujuan tes. Jadi, bias aitem dapat menyebabkan alat tes menjadi tidak adil.
BFI terdiri dari 44 aitem. Awalnya BFI dikonstrak dalam bahasa Inggris.
Aitem-aitem yang ada dalam BFI adalah untuk mengungkap kepribadian yang
disusun berdasarkan teori Big Five. Teori yang mendasari BFI adalah
Five Factor
Model
.
Five-Factor Model
aslinya didasarkan pada sebuah kombinasi dari dua
pendekatan, yaitu pendekatan leksikal (
lexical approach
) dan pendekatan statistik
(
statistical approach
). Pendekatan leksikal merupakan pendekatan yang
berhubungan dengan bahasa, yang artinya adalah bagaimana alat tes bersifat
universal, dan bisa digunakan di budaya yang berbeda-beda. Sedangkan
Pendekatan statistik merupakan pendekatan yang berhubungan dengan
pengelompokan kumpulan asli dari
Five Factor Model
menjadi lima faktor.
Pendekatan leksikal yang terdapat dalam
Five Factor Model
dimulai pada tahun
2010) dengan kerja keras untuk menerjemahkan dan mengidentifikasi 17.953
terminologi trait dari bahasa Inggris (yang berisi secara kasarnya sekitar 550.000
catatan asli yang terpisah). Allport dan Odbert kemudian membagi kumpulan asli
dari trait tersebut menjadi empat hal: (1) trait yang bersifat stabil (
stable traits
),
seperti rasa aman, intelegensi, (2) keadaan, suasana hati, dan aktivitas sementara,
seperti tidak tenang, gelisah (
agitated
)
,
perasaan gairah, gembira (
excited
), (3)
evaluasi sosial
,
seperti mempesona (
charming
)
,
menjengkelkan (
irritating
)
,
dan
(4) terminologi yang berhubungan dengan istilah-istilah metafora, fisik, dan
keragu-raguan, seperti kata subur (
prolific
), sedikit (
lean
) (Larsen & Buss, 2010).
Five Factor Model
telah diteliti lebih dari puluhan peneliti yang
menggunakan sampel yang berbeda-beda. Model ini telah direplikasi setiap
dekade selama akhir abad pertengahan. Model ini telah direplikasi kedalam
bahasa yang berbeda dan dalam format aitem yang berbeda juga (Larsen & Buss,
2010). Para peneliti yang berbeda memiliki variasi yang berbeda-beda dalam
memberi label pada kelima faktor ini seperti budaya (
culture
)
,
intelek (
intellect
)
,
imajinasi (
imagination
)
,
keterbukaan (
openness
)
,
terbuka terhadap pengalaman
(
openness to experience
)
,
dan intelegensi yang berubah-ubah (
fluid intelligence
)
dan berpikir tenang (
tender-mindedness
)
(Brand & Egan, 1989; De Raad, 1998,
dalam Larsen & Buss, 2010). Penyebab utama dari perbedaan ini adalah
perbedaan peneliti dalam memulai penelitian, yaitu dengan menggunakan
kelompok yang berbeda hingga analisis faktor (Larsen & Buss, 2010). Jadi, dari
beberapa penelitian tersebut, ditemukan bahwa BFI memiliki lima faktor,
Berdasarkan pendekatan leksikal, pengukuran terhadap trait yang muncul
secara universal, yang artinya adalah tetap memperhatikan perbedaan bahasa dan
budaya merupakan hal yang lebih penting dibanding tidak memperhatikan
perbedaan bahasa dan budaya. Penelitian yang berkaitan dengan hal ini telah
dilakukan dibeberapa negara, yaitu di negara Turki, Jerman, Italia. Hasil
penelitian di Turki menunjukkan bahwa faktor
openness
lebih jelas terlihat,
penelitian di Jerman menunjukkan bahwa kelima faktor BFI menjelaskan
intelegensi, talenta, dan kemampuan seseorang, dan penelitian di Italia
menunjukkan bahwa kelima faktor BFI adalah faktor yang sudah biasa dalam diri
individu yang ditandai dengan aitem-aiten memberontak dan selalu mengkritik
(Larsen & Buss, 2010).
Penelitian
mengenai BFI juga dilakukan Schmitt, dkk (2007), yaitu bentuk
dan profil dari deskripsi diri manusia di 56 negara. Jadi, bagian International
Sexuality Description Project menerjemahkan BFI dari bahasa Inggris menjadi 28
bahasa yang diadministrasikan kepada 17.837 orang dari 56 negara. Hasil
menunjukkan bahwa kelima dimensi yang ada pada BFI secara kuat menjelaskan
wilayah-wilayah utama di dunia. Level trait dihubungkan dapat menjadi cara
untuk memprediksi harga diri, sosioseksual, dan profil kepribadian nasional.
Orang-orang dari daerah geografis Amerika Selatan dan Asia Timur menunjukkan
hasil yang signifikan pada dimensi
openness
dibanding daerah lain yang ada di
dunia.
Penelitian juga telah dilakukan pada mahasiswa, yaitu dengan skor
Costa, 2006), pengukuran mengenai kepribadian
five factor
yang dilakukan juga
menemukan bahwa mahasiswa cenderung lebih tinggi pada faktor
Neuroticism,
Extraversion
, dan
Openness
, dan lebih rendah pada faktor
Agreeableness
dan
Conscientiousness.
Terdapat juga para peneliti yang fokus perhatiannya mengenai
lintas budaya yang disebut dengan multikulturalis.
Multikulturalis
mengembangkan sebuah ide yang disebut relativisme kebudayaan, yang
menyatakan bahwa nilai-nilai manusia dapat hanya dinilai dari dalam perspektif
budaya dimana mereka tumbuh, karena nilai-nilai yang ada pada mereka dibentuk
oleh budaya (McCrae & Costa, 2006).
Oleh karena itu, sangat penting bagi
peneliti untuk memperhatikan unsur budaya ketika ingin melakukan suatu
penelitian.
Penelitian BFI juga telah dilakukan oleh Mariyanti (2012), yaitu adaptasi
BFI ke dalam bahasa Indonesia. Hasil analisis faktor
exploratory
ini menunjukkan
jumlah faktor yang sama antara versi asli dengan versi adaptasi dalam Bahasa
Indonesia yaitu terdapat 5 faktor. Namun, terdapat perbedaan pada beberapa
indikator perilaku pada beberapa faktor (yang ditandai dengan nomor aitem yang
berbeda). Perbedaan diduga disebabkan oleh adanya perbedaan budaya antara
Indonesia dengan negara asal BFI. Beberapa aitem yang seharusnya dikategorikan
sebagai faktor tertentu dapat muncul sebagai faktor lain di Indonesia disebabkan
adanya perbedaan kepercayaan dan budaya pada masyarakat Indonesia dengan
negara asal (Mariyanti, 2012).
Indonesia memiliki budaya yang beragam, dan hal ini dapat dilihat dari
Batak Toba, Jawa, Batak Karo, Batak Simalungun dan lain-lain. Etnis yang
berbeda tersebut memberikan pengaruh terhadap individu-individu yang ada
dalam budaya tertentu, baik perilaku, maupun cara berpikir individu (Bangkaru,
2001). Memandang bahwa individu yang memiliki budaya yang berbeda-beda
tersebut, maka dibutuhkan suatu alat tes yang penggunaannya dapat berfungsi
secara adil, sehingga generalisasi alat tes merupakan hal yang penting, terutama
pada budaya yang berbeda-beda. Oleh karena itu sangat penting untuk melihat
bagaimana penggunaan BFI di Indonesia dengan budaya yang beragam, apakah
terdapat perbedaan respon terhadap aitem yang ada pada BFI. Hal ini
berhubungan dengan validitas suatu alat tes, yaitu apakah alat tes tersebut tetap
bekerja sesuai fungsinya ketika diterapkan di berbagai budaya. Hal ini sangat
dipengaruhi oleh bagaimana pemahaman subjek terhadap aitem yang ada pada
BFI
,
apakah dengan budaya dan bahasa yang berbeda berpengaruh terhadap
bagaimana subjek memahami aitem yang ada. Menurut Bangkaru (2001),
masing-masing budaya yang ada di Indonesia memiliki nilai budaya, tradisi dan
kepercayaan budaya masing-masing yang membuat satu budaya berbeda dengan
budaya yang lain. Penelitian ini melibatkan etnis karena dengan etnis yang
berbeda, terdapat kemungkinan tes rentan terhadap bias, sehingga membutuhkan
tes yang tidak bias.
Seperti yang dijelaskan sebelumnya, Indonesia memiliki etnis yang
beragam. Masing-masing etnis memiliki nilai-nilai budaya yang berbeda. Dari
beberapa etnis dan nilai budaya tersebut, ada dua etnis yang memiliki beberapa
Jawa. Etnis Batak terdiri dari beberapa jenis, antara lain Batak Toba, Batak
Mandailing, Batak Simalungun, Batak Karo, dan Batak Pakpak. Masing-masing
etnis tersebut dipengaruhi oleh budaya Batak Toba. Meskipun masing-masing
etnis memiliki nilai budaya dan kepribadian yang berbeda-beda, akan tetapi
sebagian besar nilai budaya mereka dipengaruhi oleh budaya Batak Toba,
misalnya Mandailing yang mirip dengan budaya Batak Toba, yaitu penggunan
marga hukum adat yang sangat berpengaruh terhadap kepribadian individu
menjadi terbuka terhadap sesama mereka. Kemudian Simalungun yang
dipengaruhi oleh etnis Melayu dan sedikit budaya Batak Toba, sehingga memiliki
budaya sangat menghargai adanya level dalam hubungan sosial (Bangkaru, 2001).
Berdasarkan hal tersebut, maka peneliti tertarik untuk meneliti etnis Batak Toba
dan Jawa karena memiliki nilai budaya yang membentuk kepribadian kedua etnis
tersebut menjadi sangat berbeda yaitu orang Batak Toba dengan kepribadian
yang mandiri, sangat menghargai keterbukaan, sadar diri dan sangat menghargai
desentralisasi, sedangkan orang Jawa memiliki stereotip sebagai suku bangsa yang
sopan dan halus, tetapi mereka juga terkenal sebagai suku bangsa yang tertutup
dan tidak mau terus terang (Harahap & Siahaan, 1987;
Endraswara, 2010
).
Memandang bahwa merupakan hal yang penting untuk mengetahui apakah
aitem-aitem tersebut benar-benar dipahami oleh subjek sesuai dengan tujuan awal
dari BFI, dan juga untuk membuktikan apakah BFI yang sudah diadaptasi bersifat
adil, maka diperlukan sebuah pengujian terhadap aitem-aitem yang ada pada BFI.
Dalam kajian ilmu psikologi, khususnya kajian psikometri disebut uji
disebut dengan DIF). DIF merupakan sebuah kondisi yang terjadi ketika
pengujian terhadap dua kelompok menunjukkan kemungkinan untuk menyetujui
atau tidak menyetujui aitem yang berbeda setelah kemampuan dasar yang telah
disetarakan (Camilli & Shepard, 1994; Clauser & Mazor, 1998 dalam Zumbo,
1999).
Menurut Zumbo (1999), ada dua hal penting yang perlu diperhatikan
ketika menggunakan analisis DIF, diantaranya adalah ketika anda menggunakan
tes yang sudah ada; atau ketika anda mengembangkan pengukuran yang baru atau
memodifikasi pengukuran (Zumbo, 1999; hal 14). Jadi, sebelum memutuskan
untuk menggunakan analisis DIF dalam suatu penelitian, maka kedua hal tersebut
perlu untuk diperhatikan kembali. Penelitian ini menguji DIF dengan alasan
karena peneliti menggunakan alat tes yang sedang dikembangkan, yaitu BFI yang
sudah diadaptasikan ke dalam bahasa Indonesia.
Penelitian mengenai DIF mencakup dua kelompok yang diuji, yaitu
kelompok referensi dan kelompok fokal. Dan hal ini lebih umum dikenal dengan
kelompok mayoritas dan kelompok minoritas. Dalam kehidupan sehari-hari
terdapat banyak kelompok referensi dan Fokal, dan seorang individu mungkin
terlibat pada satu atau lebih. Contohnya, wanita kulit putih mungkin termasuk
kedalam kelompok Referensi untuk satu analisis dan masuk kedalam kelompok
Fokal untuk hal yang lain (Camilli & Shepard, 1994). Dalam penelitian ini, yang
termasuk ke dalam kelompok Referensi adalah etnis Batak Toba, karena
kepribadian etnis tersebut lebih mendominasi dalam faktor-faktor yang terdapat
diri dan sangat menghargai desentralisasi. Sedangkan etnis Jawa termasuk dalam
kelompok Fokal, yaitu dengan kepribadian sebagai suku bangsa yang sopan dan
halus, tetapi mereka juga terkenal sebagai suku bangsa yang tertutup dan tidak
mau terus terang. Sehingga dalam penelitian DIF etnis pada BFI ini, peneliti ingin
melihat apakah aitem-aitem yang ada dalam BFI mengandung DIF etnis atau
tidak.
B.
Rumusan Masalah
Sesuai dengan masalah yang dipaparkan sebelumnya, maka permasalahan
yang akan diteliti dalam penelitian ini adalah “Apakah aitem-aitem dalam BFI
versi Indonesia mengandung DIF Etnis?”
C.
Tujuan Penelitian
Tujuan penelitian ini adalah untuk melengkapi bukti empiris BFI versi
Indonesia merupakan tes yang adil digunakan pada etnis Batak Toba dan Jawa.
D.
Manfaat Penelitian
1.
Manfaat Teoritis
Penilitian ini diharapkan dapat menambah referensi mengenai
keberfungsian aitem-aitem BFI ketika diterapkan dalam budaya Indonesia
2.
Manfaat Praktis
Penelitian ini diharapkan dapat memberikan referensi kepada para praktisi
untuk menggunakan BFI sebagai salah satu alternatif alat tes kepribadian
yang dapat digunakan sebagai pertimbangan dalam pengambilan
BAB II
TINJAUAN PUSTAKA
A.
Teori Kepribadian Big Five
1.
Sejarah
Trait
adalah unit fundamental dari kepribadian, yang mewakili watak secara
luas untuk merespon suatu kondisi dengan cara tertentu. Penelitian mengenai
trait
kepribadian membutuhkan model persetujuan yang general mengenai penelitian
yang dilakukan oleh peneliti, sama halnya dengan ilmu pengetahuan yang lain.
Selama 40 tahun terakhir, sejumlah konsep kepribadian, dan sejumlah skala
pertanyaan didesain untuk mengukur
trait
kepribadian tersebut, dan hal ini
semakin meluas tanpa ada akhir yang jelas. Dalam bahasa inggris sendiri, terdapat
lebih dari 5000 kata yang menjelaskan
trait
kepribadian (Pervin, dkk, 2005).
Selama bertahun-tahun, para peneliti
trait
termasuk Eysenck, Cattell, dan yang
lainnya telah melakukan perdebatan mengenai jumlah dan asal dimensi dasar
trait
kepribadian
.
Namun hal ini tidak terselesaikan, hingga tahun 1980an terdapat
perkembangan secara bertahap dalam kualitas dan pengalaman metode, yang
berujung pada banyaknya peneliti yang setuju bahwa perbedaan individu dapat
dikategorikan ke dalam lima faktor bipolar yang dikenal sebagai “
Big Five
” (John
& Srivastava; McCrae & Costa dalam Pervin, dkk, 2005).
Kelima faktor yang berbeda-beda tersebut adalah
Neuroticism
(N),
atau yang sering disingkat dengan sebutan OCEAN. Masing-masing faktor dalam
BFI tersebut dapat dijelaskan sebagai berikut (Pervin, dkk, 2005):
1.
Neuroticism
(N). Mengidentifikasi kecenderungan individu akan mengalami
kondisi
psikologis yang kurang baik, memiliki ide-ide yang tidak realistis,
kebutuhan/keinginan yang berlebihan, dan tidak dapat menyesuaikan respon
dengan kondisi yang ada. Dimensi bipolar dari faktor ini adalah
Emotional
Stability
2.
Extraversion
(E).
Mengukur kuantitas dan intensitas interaksi intrapersonal,
aktivitas yang dilakukan, kebutuhan akan stimulasi, melakukan hal yang
disenangi. Dimensi bipolar dari faktor ini adalah
Introversion
3.
Openness
(O).
Mengukur keinginan untuk mencari dan menghargai
pengalaman baru bagi dirinya sendiri, senang mengetahui sesuatu yang tidak
terkenal atau tidak familiar. Dimensi bipolar dari faktor ini adalah
Closedness
4.
Agreeableness
(A). Mengukur kualitas orientasi interpersonal seseorang,
mulai dari perasaan kasihan sampai pada sikap permusuhan dalam hal pikiran,
perasaaan, dan tindakan. Dimensi bipolar dari faktor ini adalah
Antagonism.
5.
Conscientiousness
(C).
Mengukur tingkat keteraturan seseorang, ketahanan
dan motivasi dalam mencapai tujuan. Berlawanan dengan ketergantungan, dan
kecenderungan untuk menjadi malas dan lemah. Dimensi bipolar dari faktor
Keterangan lebih lengkap mengenai dimensi bipolar dari kelima faktor
kerpribadian
Big Five
dapat dilihat pada tabel 1 berikut:
Tabel 1. Karakteristik Sifat-Sifat
Big Five Model
Dengan Skor Tinggi dan rendah
Skor tinggi
Sifat
Skor rendah
Kuatir, cemas, emosional,
merasa tidak nyaman,
kurang penyesuaian,
kesedihan yang tak
beralasan.
Neuroticism
Tenang , santai, tidak
emosional, tabah, nyaman,
puas terhadap diri sendiri.
Mudah bergaul, aktif,
banyak bicara, orientasi
pada manusia, optimis,
menyenangkan, kasih
sayang, bersahabat.
Extraversion
Tidak ramah, tenang, tidak
periang, menyendiri,
orientasi pada tugas
,
pemalu, pendiam.
Rasa ingin tahu tinggi,
ketertarikan luas, kreatif,
orisinil imajinatif, tidak
ketinggalan zaman
.
Openness
Mengikuti apa yang sudah
ada, kembali ke alam
,
tertarik hanya pada satu hal,
tidak memiliki jiwa seni,
kurang analitis.
Berhati lembut, baik, suka
menolong, mudah
percaya, mudah
memaafkan, mudah untuk
dimanfaatkan, terus
terang.
Agreeableness
Sinis, kasar, rasa curiga,
tidak mau bekerjasama,
pendendam, kejam, mudah
marah, manipulatif.
Teratur, dapat dipercaya,
pekerja keras, disiplin,
tepat waktu, teliti, rapi,
ambisius, tekun.
Conscientiousness
Tidak bertujuan, tidak
dapat dipercaya, malas,
kurang perhatian, lalai,
sembrono, tidak disiplin,
keinginan lemah, suka
bersenang-senang.
Tabel 1 menunjukkan dimensi bipolar dari masing-masing faktor yang ada
pada
Big Five,
yaitu karakterisitik dari individu yang berada pada skor yang
tinggi ataupun rendah, sehingga dapat dilihat kecenderungan sifat-sifat individu
2.
Keuniversalan Dimensi Big Five
Jika ada pertanyaan umum yang fokus pada perbedaan individu dan interaksi
manusia, maka untuk menjawab hal ini perlu dilakukan pembuktian terhadap
keuniversalan struktur faktor
Big Five
. Untuk membuktikan keuniversalan faktor
Big Five
, sejumlah penelitian lintas budaya mengenai
trait
kepribadian semakin
meningkat secara dramatis pada dekade sebelumnya, terutama penelitian yang
dilakukan secara internasional oleh tim yang berasal dari negara yang
berbeda-beda. Hal ini mungkin dapat menjadi awal untuk menjawab pertanyaan tersebut
mengenai keuniversalan
Big Five
(Pervin, dkk, 2005).
Penelitian lintas budaya sangat penting untuk menjadi acuan dalam menjawab
keuniversalan faktor
Big Five
. Namun, sebelum melihat hasil dari penelitian, satu
hal yang perlu diperhatikan yaitu metode yang digunakan dalam penelitian
tersebut. Dalam penelitian, yaitu mengenai apakah
Big Five
bersifat universal,
masalah metodologi dapat memberikan suatu perbedaan besar. Salah satu
masalahnya meliputi penejermahan. Banyak peneliti yang mempelajari apakah
trait
kepribadian bersifat universal hanya dengan menerjemahkan kuesioner dari
satu bahasa asli (seperti bahasa Inggris) menjadi beberapa bahasa yang lain
(seperti bahasa Jerman, Jepang, dan lain-lain), tanpa mempertimbangkan
terjemahan tersebut dapat bersifat menjebak, dan mungkin juga kurang satu
persatu kata dari tiap terjemahan dan pemaknaan yang berbeda juga. Bahasa boleh
berbeda dan bahkan kata-kata yang diterjemahkan sama dapat memiliki arti yang
berbeda. Contohnya adalah kata “
aggressive”
dalam bahasa Inggris memiliki
Jerman, kata “
aggressive”
memiliki arti “
hostile
(bersifat mengancam)”
dibanding “
forceful-assertive
(ketegasan yang berlebihan) (Pervin, dkk, 2005).
Sebuah resensi kuantitatif yang dilakukan oleh De Raad, dkk (dalam Pervin,
dkk, 2005) membandingkan banyak penelitian Eropa, dan menyimpulkan bahwa
faktor yang mirip dengan
Big Five
muncul dalam banyak bahasa tetapi faktor
Openness
yang paling sedikit muncul. Hanya sedikit penelitian pada budaya dan
bahasa
non-western
yang pernah dilakukan (seperti Cina, Jepang, Filipina) dan
faktor
Openness
tidak begitu terlihat. Penelitian-penelitian yang ada menemukan
bahwa tiga faktor yaitu
extraversion, agreeableness
dan
conscientiousness
dapat
ditemukan di hampir semua bahasa, hanya dua faktor lain yaitu
neuroticism
dan
openness
yang kurang reliabel secara lintas budaya (Saucier, Hampson, &
Goldberg dalam Pervin, dkk, 2005). Penelitian yang ada di Indonesia, yaitu yang
dilakukan oleh Mastuti (2005) menemukan bahwa terdapat satu faktor tambahan
ketika dilakukan analisis faktor pada mahasiswa suku Jawa. Selain itu, penelitian
lain juga dilakukan oleh Mariyanti (2012) menemukan lima faktor yang ada pada
Big Five
tersebut ketika diberikan pada sampel yang lebih umum, dan penelitian
Samosir (2013) menemukan bahwa terdapat dua faktor tambahan ketika dilakukan
analisis faktor terhadap suku Batak Toba. Memandang perbedaan hasil tersebut,
maka sangat perlu dilakukan pengujian terhadap aitem-aitem yang ada pada
Big
3.
Big Five Inventory (BFI)
Berbicara mengenai kebutuhan akan sebuah instrumen pendek untuk
mengukur komponen khusus dari
Big Five
, maka John, Donahue dan Kentle
(dalam John & Srivastava, 1999) mengkonstrak Big Five Inventory (BFI). Empat
puluh empat aitem BFI dikembangkan merepresentasikan definisi asli yang
dikembangkan berdasarkan penilaian ahli dan kemudian dilakukan pembuktian
dengan analisis faktor dan pembuktian terhadap penilaian kepribadian oleh
pengamat. Tujuan dari pembuatan alat ukur singkat ini adalah agar tercipta alat
ukur yang efisien dan fleksibel dari kelima faktor tersebut. Terdapat juga tokoh
yang menjelaskan mengenai BFI tersebut, yaitu Burisch (dalam John &
Srivastava, 1999) mengatakan bahwa skala yang singkat tidak hanya
mempersingkat waktu tes, tetapi juga menghindari kebosanan dan kelelahan yang
dialami subjek, subjek yang tidak memberikan respon yang sesungguhnya jika tes
terlihat membutuhkan waktu yang panjang. BFI tidak menggunakan kata sifat
tunggal sebagai aitem karena aitem seperti itu direspon dengan tidak konsisten
dibandingkan ketika aitem ditambahkan definisi ataupun kalimat tertentu
(Goldberg & Kilkowski, 1985 dalam John & Srivastava, 1999). BFI
menggunakan frase yang singkat didasarkan kata sifat yang diketahui
merepresentasikan kelima faktor
Big Five
(John, 1989, 1990 dalam John &
Srivastava, 1999). Kata sifat yang ada pada faktor
Big Five
disajikan sebagai inti
dari aitem dimana informasi yang jelas, luas, dan kontekstual menjadi tambahan.
Contohnya, kata sifat dari faktor ‘
Openness
’ merupakan kata sifat yang original
baru’ dan kata sifat untuk faktor ‘
Conscientiousness
’
disajikan sebagai dasar
untuk aitem dengan tambahan ‘bertahan hingga tugas diselesaikan’. Aitem-aitem
yang ada dalam BFI memberikan keuntungan dengan kata sifat (ringkas dan
sederhana) yaitu dapat mencegah ambiguitas atau arti ganda (
multiple meaning
).
Ketika dilakukan pengujian pada sampel yang berasal dari negara Kanada dan
Amerika Serikat, diperoleh reliabilitas alpha skala BFI berkisar antara 0.75
sampai 0.90 dan rata-rata reliabilitas tiap faktor diatas 0.80; reliabilitas tes
retesnya dalam rentang waktu tiga bulan berada antara 0.80 sampai 0.85 dimana
memiliki mean sebesar 0.80 (John & Srivastava, 1999). Sedangkan penelitian
yang dilakukan di Indonesia oleh Mariyanti (2012) diperoleh reliabilitas alpha
skala sebesar 0.70, yang berarti bahwa BFI yang telah diadaptasi ke dalam bahasa
Indonesia memiliki reliabilitas yang baik.
BFI yang digunakan dalam penelitian ini adalah BFI yang telah diadaptasi
kedalam versi bahasa Indonesia yang dilakukan oleh Mariyanti (2012).
Berdasarkan teori tersebut ditemukan bahwa terjadi perbedaan indikator dari
kelima faktor yang menyusun alat ukur BFI versi adaptasi Bahasa Indonesia, yaitu
(Mariyanti, 2012):
1.
Openness
(O) adalah faktor yang melihat keterbukaan individu untuk mencari
tantangan dan hal-hal baru. Seseorang dikatakan terbuka terhadap pengalaman
(
open to experience
)
ketika memiliki karakteristik seperti cerdas dan suka
berpikir, memiliki ide-ide inovatif, percaya diri, mampu mempertimbangkan
2.
Neuroticism
(N) adalah faktor yang mengidentifikasi individu yang rentan
terhadap distress psikologis, yaitu mudah mengalami rasa sedih, takut dan
cemas berlebihan, memiliki dorongan berlebihan, tidak bisa menyesuaikan
respon dengan kondisi yang ada. Selain itu juga terlihat dalam bentuk perilaku
mudah tersinggung (
irritability
) dan pemarah (
hostile
). Seseorang dikatakan
neurotis ketika individu tersebut mudah merasa tertekan dan sedih, tidak
mampu menghadapi situasi stress dengan baik, pencemas, suasana hati mudah
berubah, labil, pemalu dan perhatiannya mudah terganggu.
3.
Conscientiousness
(C) adalah faktor yang melihat kesadaran diri, motivasi dan
kemampuan mengorganisasikan sesuatu dalam mencapai suatu tujuan.
Seseorang dikategorikan dalam faktor
Conscientiousness
ketika individu
tersebut memiliki karakteristik seperti teliti, terorganisir, tidak pemalas,
menyukai suatu pekerjaan yang rutin serta mampu bertahan dan mengerjakan
suatu tugas hingga selesai.
4.
Extraversion
(E) adalah faktor yang melihat aktivitas yang dilakukan
sehari-hari dan kemampuan melakukan hubungan interpersonal individu. Seseorang
dikatakan
extrovert
apabila individu tersebut suka mengobrol, tidak pendiam,
santai, mudah bergaul dan senang bekerjasama dengan orang lain.
5.
Agreeableness
(A) adalah faktor yang melihat kualitas
trust
dan seni individu.
Seseorang dikategorikan dalam faktor
Agreeableness
ketika individu tersebut
memiliki karakteristik seperti senang membantu dan tidak egois, mudah
memaafkan dan mempercayai orang lain, dan memiliki apresiasi terhadap
B.
Differential Item Functioning (DIF)
1.
Definisi
DIF adalah istilah teknis dalam ilmu pengukuran. DIF merupakan keadaan
yang menyatakan bahwa fakta-fakta empiris yang telah dianalisis menggunakan
metodologi yang terstandarisasi menunjukkan bahwa sebuah aitem tes bekerja
secara berbeda untuk dua kelompok atau lebih. Semua prosedur yang digunakan
untuk mengidentifikasi DIF perlu mempertimbangkan variasi kemampuan
kelompok (Osterlind & Everson, 2009 dalam Osterlind, 2010). DIF juga
menjelaskan performansi aitem secara individual dan tidak dihubungkan dengan
tes secara keseluruhan (Osterlind, 2010). Selain definisi diatas, Thiesse, Steinberg
& Wainer (dalam Reeve, 2002) menyatakan bahwa DIF merupakan kondisi
sebuah aitem yang berfungsi secara berbeda untuk responden dari kelompok yang
satu dengan kelompok yang lain. Dengan kata lain, responden dengan kesamaan
pada level trait laten, tetapi berasal dari populasi yang berbeda memiliki
kemungkinan berbeda dalam merespon sebuah aitem.
Menurut kajian psikometri, awalnya diskusi mengenai DIF berada pada
tataran emosional dan politik yaitu mengenai tes yang dianggap adil dan
konsekuensi dari penggunaan tes terhadap pengambilan keputusan, kemudian
diskusi terkini yang dilakukan oleh Camilli (dalam Osterlind, 2010) mengenai tes
yang adil dipandang dari perspektif yang lebih luas, yaitu meliputi dampak dan
penggunaan tes yang bersifat merugikan. Banyak ahli psikometri yang menguji
masalah-masalah praktis pengujian DIF memfokuskan usaha-usaha mereka pada
Istilah DIF sering dianggap sama dengan bias aitem
.
Beberapa penelitian
menyatakan bahwa istilah DIF dan bias aitem sering dipertukarkan. Sebaliknya,
terdapat juga penelitian yang menyatakan bahwa DIF dan bias aitem merupakan
dua konsep yang berbeda.
Penelitian yang dilakukan oleh Ellis & Raju (dalam Acar, 2011) menggunakan
istilah DIF yang sering dipertukarkan dengan bias aitem. Pada akhir tahun
1980an, istilah DIF berubah posisi dari istilah ‘bias aitem’. DIF mengungkap
perbedaan dalam kesempatan menjawab aitem dengan benar dengan
mempertimbangkan tingkat kemampuan tiap kelompok yang telah diukur
disesuaikan dengan aitem (Embretson & Reise, 2000; Lord, 1980 dalam Acar,
2011). Dalam studi mengenai DIF, diperlukan perbandingan performansi pada
aitem tes suatu kelompok pada tingkat kemampuan yang sama tetapi memiliki
karakteristik demografis yang berbeda, seperti pria-wanita atau Asia-Eropa
(Greer, 2004 dalam Acar, 2011).
Sebaliknya, Camilli, dkk (dalam Zumbo, 1999) menjelaskan bahwa
konsep mengenai DIF dan Bias merupakan dua hal yang berbeda. Bias aitem
terjadi ketika individu dari satu kelompok cenderung untuk menjawab aitem
dengan benar (atau menyetujui pernyataan dalam aitem) dibandingkan peserta
individu dari kelompok lainnya, karena beberapa karakteristik dari aitem yang
dipakai dalam mengukur atau situasi pengukuran yang tidak relevan dengan
tujuan tes. Sedangkan DIF merupakan sebuah kondisi yang terjadi ketika
pengujian terhadap dua kelompok menunjukkan kemungkinan untuk menyetujui
kabangsaan, daerah demografis, dan lain-lain, setelah kemampuan dasar yang
telah disetarakan (Camilli & Shepard, 1994; Clauser & Mazor, 1998 dalam
Zumbo, 1999). Dalam penelitian ini menggunakan konsep DIF yang sama dengan
bias aitem. Hal ini dikarenakan DIF merupakan bagian dari bias, yaitu dua
kelompok berasal dari populasi yang berbeda memiliki kesempatan yang berbeda
dalam menyetujui aitem setelah kemampuan dasar yang telah disetarakan. Hal ini
disebabkan oleh beberapa karakteristik seperti budaya, demografis, ras, dan
lain-lain.
2.
Jenis-jenis DIF
Penelitian mengenai DIF menguji dua kelompok, yaitu kelompok Referensi
(
Reference
Group) dan kelompok Fokal (
Focal Group
). Dan hal ini lebih umum
dikenal dengan kelompok mayoritas dan kelompok minoritas. Dalam sebuah
penelitian, seorang individu dapat termasuk ke dalam kelompok referensi, dan
sebaliknya dapat pula termasuk dalam kelompok fokal untuk penelitian lain.
Contohnya, wanita kulit putih mungkin termasuk kedalam kelompok Referensi
untuk satu analisis dan masuk kedalam kelompok Fokal untuk hal yang lain
(Camilli & Shepard, 1994). Dalam teori respon aitem (
Item Response Theory
),
DIF terbagi atas dua kategori, yaitu
Uniform
atau
Consistent
DIF dan
Non-uniform
atau
inconsistent
DIF. Pembagian kelompok tersebut dilihat dari
Item
characteristic curves
(ICCs), yaitu kurva yang menunjukkan hubungan antara
kemungkinan jawaban benar terhadap suatu aitem dengan kemampuan individu
1.
Uniform
atau
Consistent
DIF, terjadi ketika satu kelompok relatif diuntungkan
untuk keseluruhan aitem skala kemampuan, sedangkan kelompok lain
dirugikan. Hal ini dapat dilihat dari
Item characteristic curves
(ICCs) yang
tidak berpotongan atau bersinggungan pada semua aitem skala kemampuan
yang disajikan pada figure 1 berikut.
Figure 1. Dua ICC yang tidak bersinggungan
2.
Non-uniform
atau
inconsistent
DIF: terjadi ketika satu kelompok relatif
diuntungkan untuk beberapa aitem skala kemampuan, sedangkan kelompok
lain dirugikan. Oleh karena itu, DIF dapat memberikan keseimbangan ataupun
tidak pada masing-masing kelompok untuk ditingkat tertentu. Hal ini dapat
dilihat dari
Item characteristic curves
(ICCs) yang berpotongan atau
bersinggungan pada beberapa aitem skala kemampuan disajikan pada figure 2
Figure 2. Dua ICC yang bersinggungan
Kajian Psikometri menjelaskan bahwa DIF memiliki hubungan dengan
validitas. Hal ini sejalan dengan yang dinyatakan dalam penelitian Salehi &
Tayebi (2012) bahwa konsep mengenai proses validasi berhubungan secara umum
dengan pembuatan tes dan juga dengan konsep keadilan tes dan bias tes, serta
sumber-sumber lain yang berhubungan dengan hal tersebut (seperti gender, hasil
penelitian, usia, kebangsaan, latar belakang pengetahuan/pendidikan, dan
lain-lain) dan umumnya dapat memberikan ancaman terhadap validitas tes (Salehi &
Tayebi, 2012). Ketika membahas mengenai validitas dalam pengukuran, maka
sangat penting untuk menilai secara utuh bahwa validitas merupakan sebuah
konsep ilmiah dan merupakan hal yang penting dalam ilmu pengukuran. Menurut
American Educational Research Association, dkk (1999 dalam Osterlind, 2010),
validitas merupakan hal yang menjadi pertimbangan utama ketika hendak
Selain validitas, karakterisitk lain yang perlu diperhatikan dalam sebuah alat
ukur adalah reliabilitas. Reliabilitas hasil pengukuran memiliki hubungan dengan
kesalahan (
error
), yaitu
random error
, yaitu kesalahan yang terjadi karena adanya
perbedaan antara skor yang sebenarnya (
true score
) dan skor yang diamati
(
observed score
) pada individu yang dapat berpengaruh kepada hasil kelompok.
Hubungan antara reliabilitas dengan DIF adalah bahwa DIF terjadi karena adanya
kesalahan (
error
) dalam pengukuran, yaitu kesalahan sistematis (
systematic
error
), yaitu kesalahan yang melibatkan respon kelompok yang dapat
mempengaruhi hasil pengukuran. Oleh karena itu, munculnya kesalahan dalam
pengukuran dapat menghasilkan reliabilitas yang rendah (Osterlind, 2010). Jadi,
aitem yang mengandung DIF bisa dikatakan sebagai aitem yang memiliki
kesalahan (
error
) karena bersifat tidak adil untuk dua kelompok yang berasal dari
populasi yang berbeda dan dapat mengakibatkan pengukuran menjadi tidak
reliabel.
3.
Dampak DIF
Validitas pengukuran merupakan salah satu masalah utama yang dipengaruhi
oleh bias pengukuran. Seperti yang kita ketahui bahwa salah satu keobjektifan
suatu aplikasi pengukuran adalah diperolehnya informasi mengenai individu dan
aitem-aitem tes. Oleh karena itu, maka instrumen dan hasil pengukuran yang valid
dan akurat sangat dibutuhkan untuk menghasilkan objektivitas. Namun, salah satu
faktor yang dapat memberikan pengaruh yang negatif pada validitas adalah bias
aitem pada tes dapat melemahkan reliabilitas hasil yang berpengaruh terhadap
keputusan yang dibuat (Acar, 2011).
Selanjutnya, Thiesse, Steinberg, & Wainer (dalam Reeve, 2002) menyatakan
bahwa aitem yang terdeteksi DIF merupakan sebuah ancaman yang serius
terhadap validitas sebuah instrumen yang mengukur level trait kelompok ataupun
populasi yang berbeda. Instrumen yang berisi aitem-aitem yang terdeteksi DIF
mungkin dapat mengurangi validitas untuk perbandingan antarkelompok, karena
skor mereka mungkin menunjukkan atribut lain dibandingkan skala yang
mengukur apa yang seharusnya diukur. Kemudian, dalam penelitian yang
dilakukan oleh Rahmawati (2010) dijelaskan bahwa bias aitem juga merupakan
ancaman terhadap validitas pengukuran. Bila aitem tes berfungsi secara berbeda
pada dua kelompok peserta, mungkin aitem tersebut mengukur trait yang berbeda
pada kelompok tersebut. Hal ini akan menyebabkan kesimpulan yang salah
mengenai kemampuan tes untuk mengukur apa yang seharusnya diukur. DIF
merupakan titik awal studi tentang bias aitem.
Salehi & Tayebi (2012) dalam penelitiannya menjelaskan mengenai konsep
validitas yaitu berperan dalam hal bahasa yang digunakan dalam tes dan
pengukuran. Proses validasi kemudian dikaitkan dengan usaha untuk proses
membuat tes yang bisa digunakan secara umum, yaitu tes-tes keahlian bahasa
tertentu, seperti bahasa Inggris. Kemudian dihubungkan dengan konsep keadilan
tes dan bias tes dan sumber-sumber penyebabnya (seperti gender, hasil penelitian,
usia, kebangsaan, latar belakang pengetahuan/pendidikan, dan lain-lain) dan
digunakan. Lebih lagi, dalam penelitian terkini, telah dilakukan peninjauan
terhadap pendekatan-pendekatan yang berdeda-beda untuk meneliti validitas tes.
DIF, diantara metode lain untuk meneliti validitas tes dengan deskripsi dan
penjelasan serta kelebihan dan kelemahan masing-masing metode dan pendekatan
berbeda menyimpulkan bahwa regresi logisitik adalah salah satu diantara metode
terbaik saat ini (Salehi & Tayebi, 2012).
4.
Analisis DIF
Menurut Gierl, Khalia, & Baughton (dalam Acar, 2011), DIF secara luas
digunakan untuk menyelidiki bias dalam pengukuran. Terdapat beberapa metode
untuk menentukan DIF. Beberapa contoh metode yang didasarkan pada CTT
adalah teknik Mantel Haenzel (M-H) yang sebagian besar sering digunakan,
regresi logistik (LR) dan simultaneous bias test (subtest).
Dalam penelitian ini,
analisis yang digunakan untuk menganalisis DIF adalah menggunakan Regresi
logistik (
logistic regression
), yaitu model regresi logistik ordinal (
ordinal logistic
regression
). Regresi logistik ordinal merupakan salah satu metode terkini yang
tersedia untuk menginvestigasi DIF aitem-aitem yang biasanya ditemukan dalam
pengukuran kepribadian dan psikologi sosial. Alasan memilih regresi logistik
ordinal antara lain (Miller & Spray dalam Zumbo, 1999):
(a)
Penggunaan regresi logistik ordinal memiliki keuntungan yaitu dapat
digunakan untuk model aitem bineri dan ordinal
(b) Model statistik yang digunakan untuk aitem bineri dan ordinal ini sebaiknya
(c)
Model regresi logistik ordinal diperluas oleh Zumbo-Thomas, yaitu memiliki
uji statistik dan pengukuran yang cocok mengenai
effect size
, tidak seperti
metode yang lainnya.
Regresi logistik ordinal ini dapat diinterpretasi seperti regresi linear yang
menjadi variabel prediktor terhadap sebuah variabel random yang yang tidak
dapat diobservasi secara terus menerus, Y
*. persamaan ini dapat ditunjukkan
sebagai berikut:
Y* = b
0+ b
1TOT + b
2GENDER + b
3TOT * GENDERi +
εi
…...(1)
εi
untuk model regresi logistik didistribusi dengan mean zero dan varian
�2�3.Dari
beberapa kondisi ini, kriteria aitem mengandung DIF adalah jika (a) nilai p
≤ 0.01,
dan (b) R
2≥ 0.13 (Zumbo, 1999; hal.23 & 27).
C.
Etnis
1.
Batak Toba
Etnis Batak Toba dikenal dengan penggunaan marga pada nama, sebagai
penanda asal usul keluarga seseorang. Simanjuntak (2009) menyatakan bahwa
menurut pandangan orang Batak toba, kebudayaannya memiliki sistem nilai
budaya yang sangat penting, yang menjadi tujuan dan pandangan hidup mereka
secara turun-temurun yakni kekayaan (
hamoraon
), keturunan (
hagabeon
) dan
penghornatan (
hasangapon
). Yang dimaksud dengan kekayaan ialah harta milik
berwujud materi maupun non-materi yang diperoleh melalui usaha atau melalui
adalah mempunyai banyak anak, cucu, cicit, dan keturunan-keturunannya,
termasuk pemilikan tanaman dan ternak. Kehormatan merupakan pengakuan dan
penghormatan orang lain atas wibawa dan martabat seseorang. Hubungan sosial
diatur oleh sistem sosial yang didasarkan pada marga. Hubungan sosial
antarmarga diatur menurut dasar struktur sosial tungku berkaki tiga (
Dalihan Na
Tolu
) (Simanjuntak, 2009).
a)
Nilai Budaya Batak
Menurut Harahap & Siahaan (1987), nilai budaya Batak yang mencakup
semua aspek kehidupan orang Batak dikelompokkan dalam sembilan nilai, yang
disebut sebagai budaya utama, yaitu antara lain:
1.
Kekerabatan, yang mencakup hubungan primordial suku, kasih sayang atas
hubungan darah, kerukunan, dan segala yang berkaitan dengan hubungan
kekerabatan karena pernikahan, solidaritas marga, dan lain-lain.
2.
Religi, mencakup kehidupan keagamaan, baik agama tradisional maupun
agama yang datang kemudian yang mengatur hubungannya dengan Maha
Pencipta serta hubungannya dengan manusia dan lingkungan hidupnya.
3.
Hagabeon
, artinya banyak keturunan dan panjang umur. Satu ungkapan
tradisional Batak yang terkenal yang disampaikan pada saat upacara
pernikahan ialah ungkapan yang mengharapkan agar kelak pengantin baru
dikaruniai putra tujuh belas orang dan putri enam belas orang. Sumber daya
manusia bagi orang Batak merupakan hal sangat penting.
4.
Hasangapon
, artinya kemuliaan, kewibawaan, kharisma, suatu nilai utama
dorongan kuat untuk meraih jabatan dan pangkat yang memberikan
kemuliaan, kewibawaan, kharisma dan kekuasaan.
5.
Hamoraon,
artinya kaya raya, salah satu nilai budaya yang mendasari dan
mendorong orang Batak untuk mencari harta benda yang banyak.
6.
Hamajuon,
artinya kemajuan, yang diraih melalui merantau dan menuntut
ilmu. Nilai budaya ini sangat kuat mendorong orang Batak untuk bermigrasi
ke seluruh pelosok tanah air.
7.
Hukum
, Patik dohot uhum
, artinya aturan dan hukum. Nilai
patik dohot uhum
merupakan nilai yang kuat disosialisasikan oleh orang Batak. Budaya
menegakkan kebenaran, terlibat dalam dunia hukum, merupakan dunia orang
Batak.
8.
Pengayoman dalam kehidupan sosiokultural orang Batak kurang kuat
dibandingkan nilai-nilai yang disebutkan sebelumnya. Hal ini mungkin
disebabkan kemandirian yang berkadar tinggi. Kehadiran orang yang
mengayomi, pelindung, pemberi kesejahteraan, hanya diperlukan dalam
keadaan yang sangat mendesak.
9.
Konflik dalam kehidupan orang Batak Toba cenderung tinggi, dan hal ini
menyagkut perjuangan meraih hasil nilai budaya lainnya, antara lain
hamoraon
yang mau ataupun tidak merupakan sumber konflik yang abadi.
b)
Hubungan Kontroversial dan Inkonsistensi kepada Suku Bangsa Lain
Berdasarkan penelitian yang dilakukan oleh Simanjuntak (2009) ditemukan
bahwa orang Batak Toba selalu menaruh rasa hormat dan percaya orang lain.
inkonsistensi yang ditunjukkan oleh orang Batak terhadap suku bangsa lain yaitu
dapat disusun berdasarkan peringkat. Hubungan kontroversi tersebut ditunjukkan
dengan sikap antara yang paling disenangi dengan yang tidak disenangi. Secara
logis, seharusnya orang yang menghormati orang lain hendaknya memperlakukan
orang tersebut sebagai saudara serta suka memberi pertolongan. Demikian juga
kepada orang yang dipercaya seharusnya menganggap dan memperlakukannya
sebagai saudara, menolong dan mau saling mengalah. Sedangkan kepada orang
lain yang tidak dipercaya memang tidak perlu untuk mengalah. Hal ini dapat
ditunjukkan pada tabel berikut (Simanjuntak, 2009).
Tabel 2. Hubungan dengan Suku Bangsa Lain
Rank