TES PADA AITEM
BIG FIVE INVENTORY
(BFI) VERSI
INDONESIA
SKRIPSI
Diajukan Untuk Memenuhi Persyaratan
Ujian Sarjana Psikologi
Oleh:
UTAMI NURHAFSARI PUTRI
091301050
FAKULTAS PSIKOLOGI
UNIVERSITAS SUMATERA UTARA
i
SKRIPSI
DIFFERENTIAL ITEM FUNCTIONING
(DIF) ADMINISTRASI
TES PADA AITEM
BIG FIVE INVENTORY
(BFI) VERSI
INDONESIA
Dipersiapkan dan disusun oleh:
UTAMI NURHAFSARI PUTRI
091301050
Telah dipertahankan di depan Dewan Penguji
Pada tanggal 11 Juli 2013
Mengesahkan,
Dekan Fakultas Psikologi
Prof. Dr. Irmawati, psikolog
NIP. 19530131 198003 2 001
Tim Penguji Departemen Psikologi Umum dan Eksperimen
1.
Dina Nazriani, MA
Penguji I/ Dosen
NIK: 841005 1104 2001
Pembimbing
2.
Etty Rahmawati, M. Si
Penguji II
NIP : 19810725 200801 2 013
3.
Juliana I. Saragih, M. Psi, psikolog Penguji III
NIP : 19800722 200502 2 001
LEMBAR PERNYATAAN
Saya yang bertanda tangan dibawah ini, menyatakan dengan
sesungguhnya bahwa skripsi saya yang berjudul:
Differential Item Functioning
(DIF) Administrasi Tes pada Aitem
Big
Five Inventory
(BFI) versi Indonesia
adalah karya sendiri dan belum pernah diajukan untuk memperoleh gelar
kesarjanaan disuatu perguruan tinggi manapun.
Adapun bagian-bagian tertentu dalam penulisan skripsi ini yang saya kutip
dari hasil karya orang lain telah dituliskan sumbernya secara jelas sesuai dengan
norma, kaidah dan etika penulisan ilmiah.
Apabila dikemudian hari ditemukan adanya kecurangan dalam skripsi ini,
saya bersedia menerima sanksi pencabutan gelar akademis yang saya sandang dan
sanksi-sanksi lainnya sesuai dengan peraturan perundangan yang berlaku.
Medan, Oktober 2013
Utami Nurhafsari Putri
iii
Inventory
(BFI) versi Indonesia
Utami Nurhafsari Putri
1dan Dina Nazriani
2.
ABSTRAK
Perkembangan teknologi dimasa ini memunculkan administrasi tes baru,
yaitu administrasi tes
online
, yang sebelumnya hanya menggunakan metode
paper-and-pencil
atau bisa disebut dengan administrasi tes manual.
Perkembangan metode pelaksanaan tes ini memunculkan tantangan baru berkaitan
dengan evaluasi karakteristik psikometris alat tes, salah satunya adalah pengujian
DIF. DIF merupakan konsep pengukuran bias yang berpengaruh pada validitas.
DIF bertujuan untuk melihat keadilan aitem suatu alat tes pada dua kelompok
yang berbeda. Penelitian ini menggunakan Big Five Inventory (BFI) versi
Indonesia yang diadaptasi oleh Mariyanti dan Rahmawati (2011). Penelitian ini
bertujuan untuk melihat apakah BFI versi Indonesia adil dan bisa digunakan baik
saat diadministrasikan secara manual maupun
online.
Hasil penelitian ini
menemukan terdapat DIF administrasi tes pada tiga aitem BFI versi Indonesia
yang berasal dari aspek
Extraversion
dan
Openness
, dengan
effect size
yang tidak
signifikan (
negligible
). Hal ini menunjukkan bahwa secara umum, alat tes BFI
versi Indonesia dapat dipergunakan dan disajikan baik pada administrasi tes
manual maupun
online
.
Kata Kunci
:
Differential Item Functioning
(DIF)
,
Administrasi Tes
,
BFI,
Big Five
1
Mahasiswa Fakutas Psikologi Universitas Sumatera Utara
2Dosen Departemen Umum dan Eksperimen Fakultas Psikologi Universitas Sumatera Utara
Inventory
(BFI) Indonesian Version
Utami Nurhafsari Putri
1and Dina Nazriani
2.
ABSTRACT
The development of technology in this era emerges the new test
administration, namely online test administration, which previously only using
paper-and-pencil
or can be called with the manual test administration. The
development of this method emerges new challenges relating to the evaluation of
psychometrics characteristic of the test, one of which is testing DIF. DIF is a
concept of bias measurement that can be affecting validity. The purpose of DIF is
checking the item fairness of the test for two different groups. This research is
using Big Five Inventory (BFI) Indonesian version which is already adapted by
Mariyanti and Rahmawati (2011). The purpose of this research is checking
whether BFI Indonesian version is fair and can be used for both online and
manual test administration. The result of this research found that there was DIF
test administration on three items of BFI Indonesian version that belongs to
Extraversion and Openness
’
aspect, with negligible effect size. This fact shows
that in common, this BFI Indonesian version test can be used and administered
both online and manual test administration.
Keywords
: Differential Item Functioning
(DIF)
,
Test Administration
,
BFI,
Big
Five
1
The Student of Psychology Faculty, University of Sumatera Utara
v
Puji dan syukur penulis panjatkan ke hadirat Allah SWT beserta
junjungan nabi besar Muhammad SAW karena berkat karunia-Nya membuat
Penulis dapat menyelesaikan skripsi yang berjudul “
Differential Item Functioning
(DIF) Administrasi Tes pada Aitem
Big Five Inventory
(BFI) versi Indonesia”.
Penulisan skripsi ini dilaksanakan untuk memenuhi persyaratan sarjana.
Selain itu, Penulis juga berharap skripsi ini dapat memperluas wawasan dan
menambah pengetahuan para pembaca sebagai mahasiswa, praktisi psikologi
eksperimen dan para praktisi psikometri, dan bagi setiap orang yang meminati
dunia Psikologi Umum dan Eksperimen, khususnya yang berkaitan dengan
karakteristik psikometri suatu alat ukur.
Penulis mengucapkan terima kasih kepada :
1.
Seluruh keluarga, bapak, mama, dan adik yang selalu memberi
dukungan dalam kehidupan saya.
2.
Ibu Prof. Dr. Irmawati, psikolog., selaku Dekan Fakultas Psikologi
USU
3.
Kak Dina Nazriani, MA, selaku dosen pembimbing dan mentor
penulis, beserta Ibu Etty Rahmawati, M.Si., Kak Juliana Saragih,
M.Psi, psikolog., sebagai dosen penguji penulis yang telah banyak
membantu dalam menyelesaikan skripsi ini.
4.
Pak Ferry Novliadi, M. Si., Kak Arliza Lubis, M.Psi, psikolog., Bang
Tarmidi, M.Psi, psikolog., Pak Ari Widiyanta, M.Si, psikolog., Kak
Masitah, M.Si., dan semua dosen terutama dosen Departemen
UMEKS yang secara langsung ataupun tidak langsung memberikan
bantuan dalam proses penyelesaian skripsi ini.
5.
Teman-teman saudara seminar saya di Dept. UMEKS, wulan, rahmi,
bang Hitler, bang Armen, dan juga bang Agus yang telah banyak
membantu memberikan waktu, masukan, inspirasi, semangat, dan juga
meminjamkan buku kepada penulis.
6.
Kakak, Adik, Teman-teman di Psikologi dan di luar Psikologi,
terutama wina, dian wulan, dicky, dkk., yang selalu ada dan selalu
memberikan bantuan serta semangat buat penulis. Para partisipan
penelitian, serta semua pihak yang telah memberikan dukungan
kepada penulis sehingga skripsi ini dapat terselesaikan.
Penulis menyadari bahwa penelitian ini masih jauh dari kesempurnaan,
untuk itu penulis sangat mengharapkan kritik dan saran yang membangun demi
perbaikan di masa yang akan datang. Penulis juga meminta maaf jika terdapat
kesalahan dalam proses penyelesaian penelitian ini. Akhir kata penulis berharap
kiranya hasil dari penelitan ini nantinya dapat bermanfaat bagi kita semua.
Medan, Oktober 2013
vii
LEMBAR PENGESAHAN... i
LEMBAR PERNYATAAN... ii
ABSTRAK... iii
KATA PENGANTAR... v
DAFTAR ISI... vii
DAFTAR TABEL... x
DAFTAR LAMPIRAN... xi
BAB I PENDAHULUAN
A.
Latar Belakang... 1
B.
Rumusan Masalah... 9
C.
Tujuan Penelitian... 9
D.
Manfaat Penelitian... 9
E.
Sistematika Penulisan... 10
BAB II LANDASAN TEORI
A.
Big Five
... 12
1.
Sejarah
Big Five
... 12
2.
Tipe Kepribadian
Big Five
... 14
3.
Big Five Inventory
... 17
B.
Differential Item Functioning
(DIF)…
... 21
1.
Definisi
Differential Item Functioning
(DIF)... 23
2.
Sumber
Differential Item Functioning
(DIF)... 24
3.
Jenis
Differential Item Functioning
(DIF)... 26
4.
Metode Analisis DIF... 27
C.
Administrasi Tes………....…
... 29
1.
Definisi Administ
rasi Tes…
... 29
2.
Hal-hal yang Berkaitan dengan Administrasi Tes... 30
a.
Persiapan Tester... 30
b.
Kondisi Tes... 31
c.
Perkenalan Tes:
Rapport
dan Orientasi tes... 33
D.
Differential Item Functioning
Administrasi Tes pada Aitem
Big Five
Inventory
versi Indonesia... 35
BAB III METODE PENELITIAN
A.
Data yang Digunakan ... 44
B.
Subjek Penelitian... 44
C.
Instrumen Penelitian... 45
D.
Prosedur Pelaksanaan Penelitian... 46
1.
Persiapan Penelitian... 46
2.
Pelaksanaan Penelitian... 47
3.
Pengolahan Data Penelitian... 49
ix
5.
Kesimpulan dan Saran... 50
E.
Metode Analisis Data... 50
1.
Reliabilitas ... 51
2.
Regresi Logistik (Ordinal) ... 52
F.
Program Komputer yang Digunakan... 54
BAB IV HASIL DAN PEMBAHASAN
A.
Analisa Data Penelitian... 56
1.
Gambaran Subjek Penelitian... 56
2.
Hasil Analisis... 58
a.
Reliabilitas Komposit... 58
b.
Differential Item Functioning
(DIF) ... 59
B.
Pembahasan... 63
BAB V KESIMPULAN DAN SARAN
A.
Kesimpulan... 70
B.
Saran... 70
DAFTAR PUSTAKA... 73
LAMPIRAN... 76
DAFTAR TABEL
Tabel 1.
Sub Faktor pada
trait
dalam model
Big Five..
... 17
Tabel 2.
Pengelompokan Aitem-Aitem pada BFI versi Indonesia... 21
Tabel 3.
Blueprint
berdasarkan definisi BFI versi Indonesia... 46
Tabel 4.
Gambaran Subjek penelitian Kelompok Manual dan
Online
Berdasarkan Jenis Kelamin dan Usia... 56
Tabel 5.
Reliabilitas Skor Komposit Manual dan
Online
... 58
Tabel 6.
Hasil Analisis Regresi Logistik Ordinal per Aitem BFI versi
Indonesia... 59
xi
DAFTAR LAMPIRAN
Lampiran 1.
BFI versi Indonesia... 76
Lampiran 2.
Output
SPSS Uji Normalitas... 79
Lampiran 3.
Output
SPSS (
Pearson-Product Moment
) Korelasi Antar
Aspek BFI... 80
Lampiran 4.
Output
SPSS Reliabilitas (
alpha cronbach
) setiap Aspek
BFI dan Koefisien Standar Deviasi setiap Aspek
BFI... 82
Lampiran 5.
SPSS
SYNTAX Regresi Logistik Ordinal... 85
Lampiran 6.
Output
SPSS Regresi Logistik Ordinal... 92
Inventory
(BFI) versi Indonesia
Utami Nurhafsari Putri
1dan Dina Nazriani
2.
ABSTRAK
Perkembangan teknologi dimasa ini memunculkan administrasi tes baru,
yaitu administrasi tes
online
, yang sebelumnya hanya menggunakan metode
paper-and-pencil
atau bisa disebut dengan administrasi tes manual.
Perkembangan metode pelaksanaan tes ini memunculkan tantangan baru berkaitan
dengan evaluasi karakteristik psikometris alat tes, salah satunya adalah pengujian
DIF. DIF merupakan konsep pengukuran bias yang berpengaruh pada validitas.
DIF bertujuan untuk melihat keadilan aitem suatu alat tes pada dua kelompok
yang berbeda. Penelitian ini menggunakan Big Five Inventory (BFI) versi
Indonesia yang diadaptasi oleh Mariyanti dan Rahmawati (2011). Penelitian ini
bertujuan untuk melihat apakah BFI versi Indonesia adil dan bisa digunakan baik
saat diadministrasikan secara manual maupun
online.
Hasil penelitian ini
menemukan terdapat DIF administrasi tes pada tiga aitem BFI versi Indonesia
yang berasal dari aspek
Extraversion
dan
Openness
, dengan
effect size
yang tidak
signifikan (
negligible
). Hal ini menunjukkan bahwa secara umum, alat tes BFI
versi Indonesia dapat dipergunakan dan disajikan baik pada administrasi tes
manual maupun
online
.
Kata Kunci
:
Differential Item Functioning
(DIF)
,
Administrasi Tes
,
BFI,
Big Five
1
Mahasiswa Fakutas Psikologi Universitas Sumatera Utara
iv
Inventory
(BFI) Indonesian Version
Utami Nurhafsari Putri
1and Dina Nazriani
2.
ABSTRACT
The development of technology in this era emerges the new test
administration, namely online test administration, which previously only using
paper-and-pencil
or can be called with the manual test administration. The
development of this method emerges new challenges relating to the evaluation of
psychometrics characteristic of the test, one of which is testing DIF. DIF is a
concept of bias measurement that can be affecting validity. The purpose of DIF is
checking the item fairness of the test for two different groups. This research is
using Big Five Inventory (BFI) Indonesian version which is already adapted by
Mariyanti and Rahmawati (2011). The purpose of this research is checking
whether BFI Indonesian version is fair and can be used for both online and
manual test administration. The result of this research found that there was DIF
test administration on three items of BFI Indonesian version that belongs to
Extraversion and Openness
’
aspect, with negligible effect size. This fact shows
that in common, this BFI Indonesian version test can be used and administered
both online and manual test administration.
Keywords
: Differential Item Functioning
(DIF)
,
Test Administration
,
BFI,
Big
Five
1
The Student of Psychology Faculty, University of Sumatera Utara
2The Lecturer of General and Experiment Department of Psychology Faculty, University of Sumatera Utara
PENDAHULUAN
A.
Latar Belakang
Psikologi adalah cabang ilmu yang mempelajari tentang perilaku manusia.
Terdapat banyak cara untuk mempelajari perilaku manusia, salah satunya adalah
dengan menggunakan alat tes psikologi. Tujuan penggunaan alat tes psikologi
bergantung pada apa yang ingin dilihat, baik itu intelegensi, struktur kepribadian,
maupun minat dan bakat individu.
Tes psikologi adalah alat ukur yang berisikan sekumpulan aitem
berstandar objektif yang dapat digunakan secara luas, yang dapat membedakan
ataupun memprediksi karakteristik individu baik secara psikologis ataupun
perilakunya (Anastasi & Urbina, 1997; Kaplan & Sacuzzo, 2005). Tes psikologi
akan menghasilkan skor berdasarkan respon yang diberikan dari individu, yang
kemudian memberikan informasi mengenai seberapa baik individu dalam bidang
tertentu, bisa dalam pekerjaan ataupun mengetahui karakter seseorang, tergantung
dari tujuan tes psikologi dan tiga fungsi utamanya, yaitu pada konteks pendidikan,
pekerjaan, dan klinis (Anastasi dan Urbina, 1997; Aslam, 2011).
Menurut Kaplan dan Saccuzo (2005), terdapat dua jenis tes psikologi,
yaitu tes kepribadian (
personality test
) dan tes kemampuan (
ablility test
),
termasuk tes intelegensi. Tes kepribadian digunakan untuk melihat struktur
kepribadian individu, seperti BFI, 16PF, MMPI, dan sebagainya. Sedangkan tes
kemampuan digunakan untuk melihat keterampilan individu terhadap suatu hal,
Alat tes kemampuan umumnya hanya menggunakan satu jenis alat tes
dalam serangkaian tes psikotest (misalnya IST saja, CFIT, atau APM saja),
sedangkan alat tes kepribadian memiliki beragam alat tes. Beberapa alat tes yang
sering digunakan adalah EPPS, Papikostick, Kraepelin, dan PAULI (Juliana,
komunikasi personal tanggal 19 Oktober 2012 pukul 12.30 WIB). Selain keempat
tes kepribadian diatas, terdapat pula DISC, dan juga tes Grafis yang umumnya
juga digunakan di biro psikologi (Tarmidi, komunikasi personal tanggal 24 April
2013 pukul 09.00 WIB).
Biasanya tes kepribadian yang dipergunakan tidak terlalu berbeda dan
bervariasi antara biro yang satu dengan yang lain (Ari, komunikasi personal
tanggal 24 April 2013 pukul 09.30 WIB). Hal ini tergantung dari permintaan
user
mengenai hal apa saja yang perlu untuk diungkap. Untuk menambah informasi,
dapat dilakukan pula
self-report
yang dibuat langsung oleh psikolog dan juga
adanya wawancara untuk melihat aspek non-verbal peserta tes (Ferry, komunikasi
personal tanggal 24 April 2013 pukul 11.00 WIB).
Berdasarkan hasil wawancara dan fenomena yang ditemukan oleh peneliti,
didapatkan informasi bahwa penggunaan alat tes kepribadian lebih banyak
variasinya dibandingkan untuk tes kemampuan, yang sudah pasti memiliki usaha
lebih banyak baik dari segi waktu maupun jumlah aitem. Sedangkan secara
praktis, alat tes tidak dibenarkan memakan banyak waktu karena dapat
menimbulkan kelelahan dan kebosanan (Burisch, dalam John, O. P., Naumann, L.
P., & Soto, C. J., 2008; John & Srivastava, 1999). Salah satu alat tes dengan aitem
sedikit sehingga memiliki efisiensi waktu dan tenaga adalah alat tes kepribadian
Big Five Inventory
(BFI) yang disusun oleh John, Donahue dan Kentle pada tahun
1991 dengan menggunakan teori kepribadian
Big Five
.
Saat ini banyak ahli psikologi berkeyakinan bahwa gambaran yang paling
baik mengenai struktur
trait
dimiliki oleh
Big Five
yang juga dikenal dengan
istilah
Five Factor Model
(Mastuti, 2005)
,
karena luasnya level abstraksi yang
dimiliki. Luasnya level abstraksi yang dimaksudkan adalah meski sudah banyak
ahli teori yang membentuk berbagai macam
trait,
pada dasarnya adalah kelima hal
tersebut. Adanya kesamaan antara sebagian besar sistem yang ada pada ciri-ciri
kepribadian memberikan model deskriptif integratif untuk penelitian. Dengan
demikian, struktur
Big Five
tidak berarti bahwa
trait
kepribadian dapat dikurangi
menjadi hanya lima dimensi. Sebaliknya, lima dimensi ini mewakili kepribadian
pada tingkat abstraksi luas, dan masing-masing dimensi merangkum sejumlah hal
berbeda, dengan karakteristik kepribadian yang lebih spesifik (John & Srivastava,
1999; McCrae & Costa, 2003; dalam Pervin, 2005). Selain itu, teori
big five
juga
terbukti memiliki konsistensi meski diterapkan di tempat berbeda, termasuk
Indonesia (Widhiarso, 2004).
Banyaknya penelitian dan hasil riset yang dilakukan oleh para ahli
kepribadian, termasuk diantaranya Eysenck, Cattell, dan Costa dan McCrae,
dimana kemudian munculnya kesepakatan bahwa kepribadian individu terdiri dari
komunikasi personal tanggal 16 Mei 2013). Bahkan terlihat peningkatan publikasi
penelitian-penelitian yang berkaitan dengan
Big Five
sejak terbentuknya konsep
tersebut. Tercatat pada tahun 2005-2009 jumlah penelitian yang dipublikasikan
mencapai lebih dari 1500an jika dibandingkan pada tahun awal terbentuknya
konsep
Big Five
, yaitu awal tahun 1990an yang hanya berkisar 250an (John, O. P.,
Naumann, L. P., & Soto, C. J., 2008).
Penelitian yang dilakukan oleh Schmitt, dkk (2007) menghasilkan bahwa
BFI sepenuhnya dapat digeneralisasikan dalam budaya yang beragam, dimensi
kepribadian
big five
dapat diukur dengan reliabel pada manusia dengan budaya
yang berbeda. Tak heran jika
Big Five Inventory
(BFI) sudah banyak mengalami
adaptasi ke dalam berbagai bahasa, seperti bahasa Italia, Jerman, Cina, Spanyol,
Portugis,
Swedia,
Belanda,
Ibrani,
dan
Lithuania
(http://www.ocf.berkeley.edu/~johnlab/bfi.htm). Pengadaptasian bahasa ini tidak
terkecuali kedalam bahasa Indonesia yang dilakukan oleh Mariyanti dan
Rahmawati yang merupakan peneliti yang berasal dari Universitas Sumatera
Utara, pada tahun 2011.
BFI yang sudah diadaptasi tersebut berisi empat puluh empat aitem
sehingga tidak menimbulkan kelelahan, waktunya lebih singkat, serta dapat
diberikan secara berkelompok. Selain itu, reliabilitas dan validitas konstraknya
juga sudah diuji oleh Mariyanti dan Rahmawati (2011) dalam proses
pengadaptasiannya ke dalam bahasa Indonesia, sehingga layak untuk
dipergunakan demi alasan pengembangan alat ukur BFI.
Pada dasarnya semua pelaksanaan tes (baik tes kepribadian maupun tes
kemampuan) berawal dari tes
paper-and-pencil
atau bisa disebut administrasi tes
secara manual, namun administrasi tes menggunakan komputer semakin dirasa
lumrah
saat ini. Fenomena ini muncul seiring dengan berkembangnya zaman
dimana perkembangan teknologi baik itu sistem komputerisasi ataupun dunia
internet, semakin tidak bisa dipisahkan dari kehidupan manusia. Kemajuan
teknologi ini memudahkan individu untuk mengakses berbagai informasi dan
memberikan revolusi baru pada dunia alat tes, termasuk pada variasi alat tes
kepribadian yang dapat diakses melalui internet (Kaplan & Sacuzzo, 2005),
sehingga memunculkan administrasi baru yaitu administrasi tes secara
online
.
Fenomena alat tes dengan sistem komputerisasi mulai menjamur dan
sudah banyak pula alat tes yang bisa diakses secara
online.
Seperti halnya pada
alat tes BFI, individu tidak perlu datang ke suatu biro psikologi untuk
mengerjakan tes tersebut karena sudah bisa dikerjakan secara
online
. Meskipun
terkadang menghasilkan kecemasan tersendiri dan tidak ada interaksi langsung
(Kaplan & Sacuzzo, 2005), terdapat beberapa keunggulan yang diberikan ketika
menggunakan komputer yaitu efisiensi waktu, memudahkan dalam proses
pengadministrasian baik dari pihak peserta maupun administrator tes ( Anastasi &
Urbina, 1997).
Perbedaan administrasi tes ini memunculkan tantangan baru berkaitan
dengan karakteristik psikometris alat tes. Salah satu karakteristik psikometris yang
(administrasi tes secara manual ataupun
online
), dimana setiap individu pada
kedua kelompok memiliki
latent trait
yang sama, yaitu memiliki OCEAN.
DIF
merupakan hal penting yang berkaitan dengan validitas, yang menjadi hal
fundamental bagi alat tes (American Educational Research Association, dkk.,
dalam Osterlind, 2010).
Konsep DIF berkaitan dengan apakah kelompok yang satu dengan yang
lain, yang memiliki
latent trait
yang sama, memberikan respon yang sama ketika
diberikan aitem yang sama (keadilan antara kelompok yang satu dengan yang
lain). DIF menjadi penting untuk diuji jika terdapat keraguan dua kelompok tidak
akan mendapatkan perlakuan yang adil meski mendapat stimulus yaitu berupa
aitem yang sama. Sama halnya dalam konteks perbedaan administrasi tes yaitu
manual dan
online
, perlu diperhatikan keadilan aitem pada alat tes yang diberikan
pada kedua kelompok.
Pengadministrasian tes sejak awal dibuat untuk diadministrasikan secara
manual, yang kemudian ditransformasi dan dibentuk dalam
form digital
yang
dapat diakses melalui komputer dan jaringan internet yang kemudian dikenal
dengan adminitrasi tes
online
. Administrasi tes
online
mungkin memberikan
keunggulan tersendiri, namun terlepas dari itu, pada awalnya setiap tes
diadministrasikan secara manual, termasuk BFI. BFI dikonstruk awalnya untuk
diberikan secara manual kepada peserta tes, meskipun sekarang sudah bisa
ditemui pengerjaannya secara
online.
Pada dasarnya alat tes harus bisa berfungsi
sebaik pengadministrasian dasarnya, yaitu administrasi manual. Namun adanya
fenomena administrasi tes
online
, memunculkan pertanyaan sejauh mana kedua
administrasi ini dapat berfungsi sama, yaitu mampu memberikan respons yang
sama dari kedua kelompok yang mendapat pengadministrasian yang berbeda,
terhadap aitem yang sama dari alat tes BFI.
Penelitian oleh Aslam (2011) yang berkaitan dengan standarisasi instruksi
pada pengadministrasian tes juga menghasilkan kesimpulan secara umum bahwa
terdapat pengaruh instruksi yang terstandar dan yang tidak terstandar
dalam
pengadministrasian
Big Five Inventory
terhadap hasil
Big Five Inventory
. Hasil
penelitian ini cukup memberikan bukti bahwa metode pengadministrasian yang
sama (administrasi manual), namun dengan instruksi yang berbeda (tidak standar)
saja bisa memberikan pengaruh pada hasil tes, terlebih lagi jika metode
pengadministrasiannya secara keseluruhan sudah jelas berbeda seperti halnya
pada administrasi tes manual dan
online
.
Penggunaan komputer sebagai alat bantu dalam mendapatkan informasi
selain dari EPPS, Papikostik, dan tes grafis sudah diaplikasikan. Namun,
penggunaan komputer dianggap masih terbatas dan tidak dijadikan pedoman
utama dalam mendiagnosa individu. Hal ini dikarenakan, keterbatasan informasi
yang bisa didapat dari tes dengan program komputer, terlebih lagi ketika tes
tersebut digunakan oleh yang bukan berlatar belakang psikologi. Penggunaan
sistem komputer dirasa unggul dalam efisiensi waktu, namun dianggap tidak
memberikan esensi dari psikologis itu sendiri karena hanya sedikit informasi yang
bisa didapat atau digali. Berbeda dengan manual dimana
skill
psikolog akan
berperan didalamnya. Tidak menutup mata bahwa perkembangan zaman harus
sistem komputerisasi kemudian diaplikasikan. Namun, tetap ada yang harus
dipertimbangkan dimana penggunaannya harus disesuaikan dengan situasi yang
ada (Ari, komunikasi personal 24 April 2013).
Kemajuan teknologi mungkin mempermudah dan meringankan kinerja
individu, namun tetap tidak bisa menggantikan secara penuh keutamaan yang bisa
dilakukan individu itu sendiri. Sama halnya dengan administrasi tes
online
yang
merupakan “anak baru”
yang masih perlu diajarkan banyak hal (pengujian) jika
dibandingkan dengan administrasi tes manual. Hal ini karena administrasi tes
manual merupakan
setting-
an asli yang menjadi awal mula, dasar, dan acuan
dalam hal pengadministrasian tes. Inilah alasan mengapa administrasi tes manual
dianggap menjadi kelompok referensi (
reference group
)
sedangkan administrasi
tes
online
dianggap sebagai kelompok yang menjadi kelompok fokal (
focal
group
), sesuai dengan istilah penamaan dua kelompok yang dibandingkan pada
konsep DIF. Perlu adanya pengujian untuk melihat apakah ada perbedaan respon
antara kedua kelompok yang memiliki
latent trait
yang sama sudah jelas
mendapat cara pengadministrasian tes berbeda, sehingga uji DIF menjadi hal yang
penting dalam penelitian ini.
Konsep DIF pada kedua kelompok tersebut kemudian diterapkan pada
penggunaan alat tes BFI versi Indonesia yang telah diadaptasi oleh Mariyanti dan
Rahmawati pada tahun 2011. Dengan pengujian DIF administrasi tes, akan teruji
pula keadilan aitem pada alat tes BFI versi Indonesia baik saat diadministrasikan
secara manual maupun
online
.
Dengan adanya pengujian DIF, dapat dilihat
apakah BFI dengan administrasi tes
online
sama baiknya dengan penyajian BFI
pada administrasi tes secara manual.
Dengan demikian, BFI versi Indonesia akan
teruji DIF administrasi tesnya sebagai alat tes yang adil atau tidak, pada kelompok
manual dan
online.
Penelitian ini juga diharapkan dapat melengkapi karakteristik
psikometri pada BFI versi Indonesia dari segi DIF administrasi tes, sehingga BFI
versi Indonesia ini dapat digunakan dikemudian hari sebagai variasi baru dalam
alat tes kepribadian di Indonesia.
B.
Rumusan Masalah
Masalah dalam penelitian ini dirumuskan dalam bentuk pertanyaan
penelitian yaitu, apakah terdapat DIF administrasi tes
pada aitem-aitem BFI versi
Indonesia?
C.
Tujuan Penelitian
Penelitian ini bertujuan untuk menguji apakah terdapat DIF administrasi
tes pada aitem-aitem dalam alat tes BFI
versi Indonesia, sehingga akan teruji
apakah penggunaan BFI versi Indonesia adil ketika diadministrasikan secara
manual maupun
online
.
D.
Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan manfaaat teoritis maupun
praktis, sebagai berikut:
1.
Manfaat Teoritis
Penelitian ini diharapkan dapat menambah manfaat keilmuan dalam
Inventory
versi Indonesia ditinjau dari
differential item functioning
administrasi
tes
.
2.
Manfaat Praktis
Penelitian ini diharapkan dapat memberikan masukan bagi pengguna
Big
Five Inventory
agar memperhatikan pengaruh perbedaan administrasi tes,
terutama secara manual dan
online.
Penelitian ini juga diharapkan dapat
melengkapi karakteristik psikometri pada BFI yang telah diadaptasi oleh
Mariyanti dan Rahmawati (2011) ke dalam bahasa Indonesia dari segi DIF
administrasi tesnya, sehingga BFI ini dapat digunakan dikemudian hari sebagai
variasi baru dalam alat tes kepribadian agar bisa dipergunakan di Indonesia.
E.
Sistematika Penulisan
Sistematika penulisan dalam penelitian ini adalah sebagai berikut:
BAB I: PENDAHULUAN
Bab ini menjelaskan tentang latar belakang masalah, rumusan masalah,
tujuan penelitian, manfaat penelitian dan sistematika penulisan.
BAB II: TINJAUAN PUSTAKA
Bab ini berisi tentang tinjauan teoritis yang menjadi acuan dalam
pembahasan penelitian ini. Teori yang digunakan adalah teori
Big Five
Personality, Big Five Inventory,
Administrasi Tes, Karakteristik
Psikometri, dan teori
Differential Item Functioning
(DIF).
BAB III: METODE PENELITIAN
Bab ini menjelaskan tentang jenis penelitian, data yang digunakan, subjek
penelitian, instrument penelitian, prosedur penelitian dan metode analisis
data.
BAB IV : HASIL DAN PEMBAHASAN
Bab ini menjelaskan tentang hasil yang didapatkan dari penelitian, disertai
dengan pembahasan mengenai hasil penelitian.
BAB V : KESIMPULAN DAN SARAN
Bab ini menjelaskan tentang kesimpulan dari hasil penelitian disertai
12
TINJAUAN PUSTAKA
A.
Big Five
1.
Sejarah
Big Five
Kepribadian menurut Allport (dalam Schultz, 2005) didefinisikan sebagai
suatu organisasi dinamik dalam diri individu yang merupakan sistem
psychophysical
yang menentukan karakteristik perilaku dan pikiran individu.
Dalam usaha mempelajari kepribadian manusia muncul pertanyaan mengenai
perbandingan antara individu yang satu dan lainnya. Misalnya: seseorang
mungkin saja mengalami depresi, namun sejauh mana tingkat depresi yang
dialaminya? Para ahli sepakat bahwa cara untuk menjawab pertanyaan itu adalah
dengan mengkategorisasikan individu kedalam kelompok tinggi, sedang atau
rendah. Untuk melakukan hal itu maka kepribadian harus diuraikan menjadi
beberapa tipe. Hal ini mengundang perdebatan mengenai jumlah dimensi dasar
dari kepribadian. Berkaitan dengan hal ini, Allport pada tahun 1937 dan para ahli
kepribadian lain, seperti Eysenck, Cattell, dan Costa dan McCrae melakukan
pembahasan. Mereka kemudian membuat kesepakatan bahwa kepribadian terdiri
dari
trait
(Coaley, 2010; John & Srivastava, 1999; McCrae & Costa, 2003; dalam
Pervin, 2005).
Sejak kemunculan metode yang bernama analisis faktor, untuk
mengidentifikasi dimensi atau faktor dari sekian banyaknya
trait
ditahun 1980an,
maka mulailah banyak konsep mengenai
trait
yang bermunculan, termasuk
konsep dimensi yang dibuat oleh Eysenck (3 dimensi utama) dan Cattell (16
dimensi utama) terhadap kepribadian. Tupes, Chrystal, dan Goldberg pada tahun
1981 (dalam Coaley, 2010), adalah peneliti pertama yang menemukan bahwa
kepribadian bisa dikecilkan menjadi hanya 5 (lima) komponen. Kelima faktor
yang ditemukan tersebut dibentuk dengan metode yang sederhana, yaitu mencoba
menemukan unit dasar dari kepribadian dengan menganalisis kata-kata yang
orang-orang biasa (tidak hanya psikolog) gunakan sehari-hari, untuk
mendeskripsikan
kepribadian
seseorang.
Hasilnya
kemudian
diurutkan
menggunakan analisis faktor untuk melihat
trait
yang mana yang bisa berjalan
secara bersamaan (Goldberg, dalam John, O. P., Naumann, L. P., & Soto, C. J.,
2008; Pervin, 2005; Coaley, 2010).
Costa dan McCrae pada tahun 1985, 1992, adalah para peneliti yang
paling terkenal dalam menemukan kelima faktor tersebut melalui analisis faktor
(Coaley, 2010). McCrae & Costa.Jr (dalam Pervin, 2005) menyatakan bahwa pada
trait
kepribadian digambarkan dalam bentuk lima dimensi dasar. Lima faktor
tersebut terdiri dari
Opennes, Conscientiousness, Extraversion, Agreeableness,
dan
Neuroticism
, yang biasa disebut OCEAN untuk mempermudah
penghafalannya (John dalam Pervin, 2005).
Penamaan
trait
mungkin berbeda pada setiap teoris dan dari alat ukur yang
ada, namun ide dan kontennya tetap sama. Hal ini kemudian mengundang
persetujuan bahwa data yang ada mengarah pada kesimpulan bahwa yang
terbentuk adalah kelima faktor tersebut. Dengan kata lain, deskripsi kepribadian
yang luar biasa, yang dikenal sebagai
Big Five
(John & Srivastava, 1999; McCrae
& Costa, 2003; dalam Pervin, 2005; Coaley 2010).
Konsep
Big Five
banyak dilibatkan dalam berbagai penelitian oleh ahli
kepribadian di berbagai negara, dan tetap menghasilkan gambaran 5 dimensi dasar
kepribadian. Fakta ini mendukung munculnya kesepakatan yang menyatakan
bahwa konsep
Big Five
stabil. (Coaley, 2010; Pervin, 2005). Bahkan terlihat
peningkatan publikasi penelitian-penelitian yang berkaitan dengan
Big Five
atau
istilah lainnya adalah
Five Factor Model
(FFM) sejak terbentuknya konsep
tersebut. Tercatat pada tahun 2005-2009 jumlah publikasi mencapai lebih dari
1500an jika dibandingkan pada tahun awal terbentuknya konsep
Big Five
, yaitu
awal tahun 1990an yang hanya berkisar 250an publikasi (John, O. P., Naumann,
L. P., & Soto, C. J., 2008).
2.
Tipe Kepribadian
Big Five
Berdasarkan penjelasan mengenai sejarah
Big Five
, maka dapat
disimpulkan bahwa
Big Five Personality
adalah suatu pendekatan dalam dunia
psikologi untuk melihat kepribadian manusia dengan menggunakan konsep FFM,
yaitu
trait
yang tersusun dalam lima buah domain kepribadian yang telah dibentuk
dengan menggunakan analisis faktor. Berikut ini adalah
trait-trait
dalam
domain-domain dari
Big Five Personality
Costa & McCrae (dalam Pervin, 2005), yaitu:
a.
Openness (O)
Openness
yang dimaksudkan adalah
openness to experience,
dimana
trait
ini mengidentifikasikan kepribadian individu dari sudut pandang keaktifan dalam
mencari dan mengapresiasi pengalaman hidup, toleransinya terhadap hal-hal yang
baru dan tidak biasa. Orang dengan skor tinggi merupakan orang yang memiliki
rasa ingin tahu, ketertarikan yang luas, kreatif,
original
, imajinatif, dan menyukai
hal yang bervariasi (tidak tradisional). Sedangkan orang dengan skor rendah
memiliki pemikiran yang konvensional,
down-to-earth
, ketertarikannya hanya
pada hal tertentu, tidak artistik, dan tidak analitis.
b.
Conscientiousness (C)
Trait ini mengidentifikasikan kepribadian individu dari sudut pandang
derajat kemampuan individu terhadap pengorganisasian, daya tahan dan motivasi
berperilaku dalam meraih tujuan, tidak bergantung, tidak tahan dengan orang yang
ceroboh dan tidak bersemangat. Orang dengan skor tinggi dapat dipercaya,
terorganisir dan teratur, pekerja keras, disiplin dan tepat waktu, teliti, rapi,
ambisius, dan gigih. Sedangkan orang dengan skor rendah terlihat tanpa tujuan
dan terlihat tidak perduli akan sesuatu, malas, sulit diandalkan, sembrono dan
tidak teratur, mudah menyerah, dan suka bersenang-senang (
hedonis
).
c.
Extraversion (E)
Trait
ini mengidentifikasikan kepribadian individu dari segi kuantitas dan
intensitas interaksi interpersonal, level aktivitas, kebutuhan untuk menstimulasi,
kapasitas untuk memberi kesenangan. Orang dengan skor tinggi merupakan orang
d.
Agreeableness (A)
Trait
ini mengidentifikasikan kepribadian individu dari segi kualitas
pikiran, perasaan, dan tindakan, terhadap orientasi interpersonal dalam kontinum
(rentang)
compassion
hingga
antagonism
. Orang dengan skor tinggi berhati
lembut,
good-nature,
percaya pada orang lain, pemaaf, penolong, polos dan
terang-terangan/blak-blakan. Sedangkan orang dengan skor rendah lebih kasar,
curiga, sinis, kurang kooperatif, memiliki lebih mungkin dalam menyimpan
dendam, menyebalkan dan terkesan kejam, mementingkan kepentingan sendiri,
serta manipulatif.
e.
Neuroticism (N)
Trait
ini mengidentifikasi kepribadian individu pada sudut pandang
kestabilan emosi, yang berkaitan dengan
distress
psikologis, ide yang tidak
realistis, harapan atau dorongan yang berlebihan, dan
coping respon
yang
maladaptif. Orang dengan skor tinggi akan memiliki rasa khawatir, cemas,
emosional, merasa tidak aman, merasa ada yang kurang, dan perasaan sedih atas
dirinya. Sedangkan orang dengan skor rendah mempunyai bawaan santai, tenang
,
tidak emosional, lebih stabil, merasa lebih aman dan merasa puas akan dirinya.
Kelima domain
trait
pada model
Big Five
tersebut dibagi kedalam enam
subfaktor oleh Costa & McCrae (dalam Pervin, 2005; John & Srivastava, 1999),
yaitu:
Tabel 1.
Sub Faktor pada
trait
dalam model
Big Five
Positive Emotions (emosi yang positif) Warmth (kehangatan)Agreeableness
Straightforwardness (berterusterang) Trust (kepercayaan)
Altruism (mendahulukan kepentingan orang lain) Modesty (rendah hati)
3.
Big five Inventory
(BFI)
Ada beberapa alat tes yang dibentuk dengan menggunakan konsep
Big
Five,
antara lain yaitu
Big Five Inventory
(BFI), NEO PI-R,
International Item
Pool
(IPIP), PCI, dan HPI. Mastuti (2005) menyatakan bahwa di Indonesia
penggunaan alat ukur kepribadian
Big Five
maupun pengembangan alatnya masih
belum begitu populer. Padahal banyak hal yang mampu diprediksi dengan
John, Donahue, dan Kentle menyadari akan kebutuhan suatu instrumen
yang efisien, fleksibel, dan berlaku universal, dalam kepentingannya untuk
mengukur kepribadian individu dengan menggunakan konsep
big five
. Kemudian,
pada tahun 1991, John, Donahue, dan Kentle menyusun suatu alat ukur yang
kemudian dinamakan
Big Five Inventory
.
Big Five Inventory
(BFI) ini terdiri atas
44 (empat puluh empat) aitem, yang dapat direspon dalam waktu 5 (lima) menit,
dan dapat menghasilkan kelima dimensi
Big Five
yang dibentuk oleh Costa dan
McCrae (John, O. P., Naumann, L. P., & Soto, C. J., 2008; Rammstedt & John,
2006).
Burisch (dalam John, O. P., Naumann, L. P., & Soto, C. J., 2008; John &
Srivastava, 1999) mengatakan, skala pendek tidak hanya menghemat waktu
pengujian, tetapi juga menghindari kebosanan dan kelelahan subjek, karena akan
ada subyek yang tidak memberi respon sesuai harapan jika tes terlihat terlalu
lama.
Big Five Inventory
(BFI) menggunakan frase pendek berdasarkan kata sifat
yang dikenal sebagai inti dari
Big Five
. Selanjutnya ditambahkan kata-kata yang
berfungsi sebagai tambahan informasi atau untuk memperjelas kata inti.
Big Five
Inventory
(BFI) dengan frase kata sifatnya juga memiliki keuntungan dalam
mencegah ambiguitas atau
multiple meanings
(John, O. P., Naumann, L. P., &
Soto, C. J., 2008).
Banyak penelitian yang bertujuan untuk mengembangkan
Big Five
Inventory
(BFI) ini, termasuk di Indonesia, di mana salah satunya adalah
penelitian yang dilakukan oleh Mariyanti dan Rahmawati pada tahun 2011.
Mariyanti dan Rahmawati (2011) melakukan penelitian yang bertujuan untuk
melihat kualitas BFI versi adaptasi Bahasa Indonesia dengan melihat karakteristik
psikometrisnya.
BFI versi Indonesia ini terdiri dari 44 aitem
favourable
dan
unfavourable
yang terdiri dari kalimat pernyataan. Kalimat pernyataan tersebut direspon dengan
memilih angka 1 hingga 5 dan menuliskannya ditempat yang telah disediakan
pada setiap pernyataan.
Makna angka “1” adalah “sangat tidak setuju”, “2” adalah
“tidak setuju”, “3” adalah “netral”, “4” adalah “setuju”, dan “5” bermakna “sangat
setuju”. Aitem
favourable
akan diberi nilai dari angka 1 sampai 5 pada jawaban
STS sampai SS, sedangkan aitem
unfavourable
akan diberi nilai sebaliknya. BFI
yang sudah diadaptasi oleh Mariyanti dan Rahmawati (2011) ke dalam bahasa
Indonesia ini memiliki reliabilitas yang baik yaitu 0.70 dan juga memiliki
validitas konstruk yang memuaskan dengan nilai loading rata-rata diatas 0.30 dan
varian yang dapat dijelaskan sebesar 41.45%.
Berdasarkan hasil dari penelitian Mariyanti dan Rahmawati pada tahun
2011, terjadi pergeseran definisi dari kelima faktor dalam teori
Big Five
pada BFI
versi adaptasi Bahasa Indonesia, yaitu :
a.
Openness
(O)
adalah faktor yang melihat keterbukaan individu untuk
mencari tantangan dan hal-hal baru. Seseorang dikatakan
open to
experience
ketika individu tersebut cerdas dan suka berpikir, memiliki
ide-ide inovatif, percaya diri, mampu mempertimbangkan dan membuat suatu
rencana dan menjalankannya serta memiliki rasa ingin tahu yang besar.
b.
Neuroticism
(N)
adalah faktor yang mengidentifikasi individu yang rentan
dan cemas berlebihan, memiliki dorongan berlebihan, memiliki
coping
respon maladptif. Selain itu juga terlihat dalam bentuk perilaku mudah
tersinggung (
irritability
) dan pemarah (
hostile
). Seseorang dikatakan
neurotis ketika individu tersebut mudah merasa tertekan dan sedih, tidak
mampu menghadapi situasi stress dengan baik, pencemas, suasana hati
mudah berubah, labil, pemalu dan perhatiannya mudah terganggu.
c.
Conscientiousness
(C)
adalah faktor yang melihat kesadaran diri, motivasi
dan kemampuan mengorganisasikan sesuatu dalam mencapai suatu tujuan.
Seseorang dikategorikan dalam faktor
Conscientiousness
ketika individu
tersebut teliti, terorganisir, tidak pemalas, menyukai suatu pekerjaan yang
rutin serta mampu bertahan dan mengerjakan suatu tugas hingga selesai.
d.
Extraversion
(E)
adalah faktor yang melihat level aktivitas dan
kemampuan melakukan hubungan interpersonal individu. Seseorang
dikatakan
extrovert
apabila individu tersebut suka mengobrol, tidak
pendiam, santai, mudah bergaul dan senang bekerjasama dengan orang
lain.
e.
Agreeableness
(A)
adalah faktor yang melihat kualitas
trust
dan seni
individu. Seseorang dikategorikan dalam faktor
Agreeableness
ketika
individu tersebut senang membantu dan tidak egois, mudah memaafkan
dan mempercayai orang lain, dan memiliki apresiasi terhadap seni, musik
atau sastra.
Tabel 2.
Pengelompokan Aitem-Aitem pada BFI versi Indonesia
No. Faktor Nomor Butir Aitem Jumlah
Aitem Persentasi
1 Faktor 1
(Opennes)
5, 10, 11, 12, 13, 15, 16, 20, 25, 26,
33, 38, 40 13 29,55%
2 Faktor 2
(Neuroticism) 4, 9, 14, 19, 24, 29, 31, 34, 37, 39, 43 11 25%
3 Faktor 3
(Conscientiousness) 2, 3, 8, 18, 23, 28, 35 7
15.91%
4 Faktor 4
(Extraversion) 1, 6, 21, 27, 36, 42 6
13.63%
5 Faktor 5
(Agreeableness) 7, 17, 22, 30, 32, 41, 44 7
15.91%
TOTAL 44 100%
B.
Differential Item Functioning
(DIF)
Analisis aitem merupakan langkah awal yang krusial dalam
pengembangan alat tes, yang meliputi berbagai jenis prosedur evaluasi. Ketika
dilakukan pengembangan, perlu dilakukan pengamatan berkaitan dengan
karakteristik yang diukur. Untuk mengetahui kualitas alat tes, dapat dilihat
karakteristik psikometrisnya, yaitu validitas dan reliabilitas. Kedua hal ini berjalan
beriringan, yaitu tes tidak akan valid jika tidak teruji bahwa tes tersebut reliabel,
akan tetapi hal ini tidak berlaku sebaliknya. Meski demikian, para ilmuan
psikologi menyadari bahwa validitas lebih penting dibandingkan reliabilitas. Hal
ini karena, reliabilitas berfokus pada akurasi hasil tes, sedangkan validitas
berfokus pada
nature
dari konstruk yang diukur (Coaley, 2010).
Reliabilitas merupakan konsep yang digunakan untuk menyatakan
mengacu pada sejauh mana ketepatan dan kecermatan suatu alat ukur dalam
melakukan fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan
maksud dan tujuan dilakukannya pengukuran tersebut, sehingga berguna untuk
melakukan pengambilan keputusan yang bertujuan untuk pengukuran aspek
mental (Azwar, 2012; American Educational Research Association, dalam
Osterlind, 2010; Coaley, 2010).
Analisis aitem memiliki beberapa istilah, yaitu
item impact
, DIF, dan juga
bias aitem (Zumbo, 1999). Pada sudut pandang psikometri, perbedaan konsistensi
intrapersonal maupun interpersonal merupakan hal yang krusial terhadap
karakteristik psikometrisnya, yaitu validitas dan reliabilitas (Anastasi & Urbina,
1997). Untuk mendapatkan reliabilitas yang baik, maka eror harus diminimalisir.
Reliabilitas dipengaruhi secara langsung pada
random error
(kesalahan yang
berasal dari individu peserta tes), sedangkan kesalahan sistematik (
systematic
error
)
merupakan kesalahan yg berasal atas keanggotaan suatu kelompok
(Osterlind, 2010), sehingga berkaitan dengan bias yang terjadi pada tes, yang juga
dapat merusak validitasnya (Coaley, 2010; Osterlind, 2010).
DIF merupakan salah satu konsep dalam pengukuran bias (Sheppard, dkk.,
2006) yang termasuk kesalahan sistematik (
systematic error
)
dan dapat
berpengaruh pada validitas. Meskipun DIF merupakan kesalahan sistematik
yang
berpengaruh terhadap validitas, namun didalam kelompok juga terdiri dari
individu yang dapat memberikan kontribusi kesalahan, sehingga akan dapat
berpengaruh pada reliabilitas dimana individu dalam kelompok merespons pada
aitem yang terjangkit DIF tersebut. Selain itu, dalam pemahaman berdasarkan
Osterlind (2010), DIF termasuk dalam sumber bukti validitas berdasarkan struktur
internal.
1.
Definisi
Differential Item Functioning
(DIF)
DIF berbeda dengan bias aitem. Bias aitem terjadi ketika individu dari satu kelompok cenderung
untuk menyetujui pernyataan pada aitem tertentu dibandingkan peserta individu dari kelompok lainnya, karena
beberapa karakteristik dari aitem yang dipakai dalam mengukur atau situasi pengukuran yang tidak relevan
dengan tujuan tes. Sedangkan DIF adalah sebuah kondisi dimana individu dari kelompok yang berbeda,
memiliki kemungkinan/probabilitas berbeda dalam merespon setuju pada suatu pernyataan dalam sebuah
aitem, setelah level atribut/latent trait yang diukur dikondisikan setara (Zumbo, 1999; Widhiarso, 2004;
Osterlind, 2010).