• Tidak ada hasil yang ditemukan

Computerized Adaptive Testing: Pemanfaatan Psikologis dari Komputer untuk Pengetesan Psikologis

N/A
N/A
Protected

Academic year: 2021

Membagikan "Computerized Adaptive Testing: Pemanfaatan Psikologis dari Komputer untuk Pengetesan Psikologis"

Copied!
6
0
0

Teks penuh

(1)

Prosiding Konferensi Nasional Sistem Informasi 2008: Indonesia Modern dalam Budaya Informasi. Yogyakarta, 14-15 Januari 2008. Yogyakarta: Universitas Sanata Dharma Yogyakarta dan Kelompok Keahlian Informatika Sekolah Tinggi Elektro & Informatika Institut Teknologi Bandung. ISBN: 978-979-1153-28-7

Computerized Adaptive Testing: Pemanfaatan Psikologis dari Komputer untuk

Pengetesan Psikologis

Aries Yulianto

Fakultas Psikologi, Universitas Indonesia Kampus Baru UI, Depok Jawa Barat 16424

aries_y@ui.edu

Abstrak

Maraknya penggunaan komputer di berbagai bidang belakangan ini di Indonesia, tidak diikuti dengan pemanfaatannya untuk pengetesan psikologi. Dengan Computerized Adaptive Testing (CAT), komputer dimanfaatkan untuk memberikan item tes secara adaptif kepada penempuh tes yang sesuai dengan kemampuannya masing-masing. Secara psikologis, pengadministrasian tes secara adaptif dianggap lebih adil dan lebih tepat mengukur kemampuan individual dibandingkan administrasi tes secara konvensional. Walaupun CAT telah dikembangkan di Amerika Serikat sejak 1970-an dan telah digunakan secara luas sejak 1990-an (misalnya pada TOEFL, GRE, GMAT, atau ASVAB), pengembangan dan pemanfaatannya di Indonesia masih terbatas. Tulisan ini bertujuan untuk memaparkan kemungkinan pemanfaatan dan pengembangan CAT secara psikologis untuk pengetesan psikologis di Indonesia.

Kata kunci : computerized adaptive testing, tes psikologi, item response theory

1. Pendahuluan

Di Indonesia saat ini pengetesan psikologis masih terbatas pada bentuk administrasi paper-pencil test (disingkat PPT) yang konvensional. Artinya, peserta tes diberikan tes yang tercetak di kertas dan mengerjakannya dengan menggunakan alat tulis. Sayangnya, bentuk administrasi paper-pencil test ini memiliki sejumlah keterbatasan, misal hanya mampu menampilkan item (butir soal) berupa gambar statis. Bunderson et. al [1] mengungkapkan salah satu kelemahan PPT adalah kerahasiaan tes tidak terjaga karena dapat saja dibaca oleh orang yang tidak berwenang atau bertanggung jawab. Kelemahan-kelemahan ini menyebabkan skor yang diperoleh dari tes tersebut tidak dapat menunjukkan kemampuan atau karakteristik yang hendak diukur dari penempuh tes.

Dengan pesatnya perkembangan komputer serta luasnya pemanfaatan di berbagai bidang beberapa tahun belakangan ini, memungkinkan pemanfaatan komputer dalam pengadministrasian tes psikologi di Indonesia. Komputer dapat diguna-kan untuk mengadministrasi, menyekor, dan meng-interpretasikan tes, atau untuk membuat tugas-tugas baru dan mengukur kemampuan yang tidak dapat dilakukan oleh prosedur tradisional [2]. Pemanfaatan komputer untuk mengadministrasikan tes dengan memindahkan item-item tes ke dalam komputer disebut computerized test (disingkat CT). Dalam penerapan CT di bidang pendidikan misalnya, Graduate Record Examination Computer-Based Test

(GRE-CBT) mulai digunakan pada tahun 1992 di Amerika Serikat [3].

Sejumlah penelitian membuktikan bahwa pengadministrasian melalui CT memiliki kelebihan dibandingkan PPT. Komputer dapat dimanfaatkan untuk dalam mengontrol variabel stimulus tes (item-item tes) dan respons penempuh tes. Dari sisi stimulus, melalui komputer kita dapat dengan mudah menciptakan gerakan, kedalaman, kecepatan, atau- pun karakteristik lain yang sebelumnya sulit dilakukan dengan administrasi PPT. Misalnya untuk seleksi pilot, Park dan Lee [4] memberikan tugas gerak perseptual dan kognisi yang diadministrasikan melalui komputer.

Sedangkan dari sisi respons, komputer memungkinkan untuk mengukur kecepatan respons, selain mengurangi pekerjaan untuk menyekor respons penempuh tes [4]. Berkaitan dengan kinerja, penempuh tes menilai CT lebih positif serta mem-perkecil perbedaan budaya dibandingkan PPT [5, 6]. Dalam perkembangan selanjutnya, komputer tidak hanya digunakan sekedar untuk memindahkan item-item tes ke dalam komputer tetapi juga digunakan untuk mengatur urutan pemberian item tes kepada setiap penempuh tes, yang disebut dengan computerized adaptive test (disingkat CAT). Penyebutan adaptif ini karena komputer digunakan untuk mengatur item yang akan diberikan selanjutnya kepada penempuh tes terkait dengan respons penempuh tes pada item sebelumnya. Hal ini mengakibatkan penempuh tes yang memiliki

(2)

kemampuan tinggi akan mendapatkan item yang berbeda dibandingkan individu yang memiliki kemampuan lebih rendah [7].

Pengadministrasian tes yang adaptif pada CAT berbeda dengan pengadministrasian konvensional dengan PPT maupun CT. Pengadministrasian tes konvensional dilakukan dengan memberikan serangkaian item tes yang sama pada semua penempuh tes dan biasanya tes dimulai dengan item dengan tingkat kesukaran rendah. Sayangnya, dengan memberikan seluruh item tes menyebabkan pengetesan cukup panjang sehingga dapat menimbulkan kelelahan. Akibatnya, kelelahan dapat mempengaruhi performa tes sehingga skor tes yang dihasilkan tidak menunjukkan kemampuan sebenarnya. Selain itu, karena sejumlah item yang diberikan kepada dirinya tidak sesuai dengan kemampuannya, motivasi mengerjakan tes pada penempuh tes menjadi rendah. Akibatnya, performa yang ditunjukkan skor tes menjadi lebih rendah dari kemampuan sebenarnya.

Secara psikologis, pengadministrasian tes yang adaptif menghasilkan skor tes yang sesuai dengan kemampuan sebenarnya dari setiap penempuh tes. Hal ini disebabkan karena tidak semua item tes diberikan, sehingga dapat menghindari kelelahan yang timbul dari mengerjakan tes yang cukup panjang. Selain itu, setiap penempuh tes akan tetap termotivasi untuk mengerjakan tes karena mendapatkan item-item tes yang sesuai dengan kemampuannya.

Sebenarnya pengadministrasian tes yang adaptif bukanlah hal yang baru dalam pengetesan psikologi. Tes Inteligensi Stanford-Binet (SB) yang dikembangkan tahun 1905 dan merupakan salah satu pelopor tes psikologi modern, sebenarnya merupa-kan pengadministrasian tes yang adaptif. Dalam tes SB, item tes diadministrasikan secara individual untuk mendapatkan tingkat kesukaran yang sesuai untuk setiap penempuh tes. Artinya, setiap penempuh tes akan mendapatkan item tes yang berbeda-beda. Untuk memilih item tes yang diberi-kan, Binet memilih item untuk setiap tingkatan usia kronologis apabila kira- kira 50% dari anak-anak pada usia tersebut dapat menjawab benar.

Item pertama pada tes SB yang diberikan kepada seorang penempuh tes adalah item tes yang memiliki tingkat kesukaran sesuai dengan kemampuan penempuh tes yang diperkirakan oleh pengetes. Konsekuensinya, apabila diperoleh informasi awal mengenai kemampuan seorang penempuh tes, maka item pertama yang diberikan dapat berbeda dengan penempuh tes lain walaupun dengan tingkat usia kronologis yang sama. Misalnya, anak usia 8 tahun yang memiliki prestasi yang baik di sekolah akan mendapatkan item pertama yang lebih sukar dibandingkan anak usia 8 tahun lain yang tidak bersekolah.

Pemberian item berikutnya ditentukan ber-asarkan respons penempuh tes pada item sebelumnya. Apabila sebagian besar item dapat dijawab benar dari suatu tingkatan usia, maka yang akan diberikan selanjutnya adalah item untuk tingkatan usia yang lebih tinggi. Demikian sebalik-nya, apabila penempuh tes tidak mampu menjawab sebagian besar item dari suatu tingkatan usia, maka selanjutnya akan diberikan item dari tingkatan usia lebih rendah. Misalnya, anak usia 8 tahun dapat menjawab benar sebagian besar item tes untuk usia 8 tahun, maka selanjutnya ia akan diberikan item untuk usia 9 tahun (dengan item yang mudah terlebih dahulu). Sebaliknya, apabila anak usia 8 tahun tidak dapat menjawab benar pada sebagian item tes untuk anak usia 8 tahun, maka ia akan diberikan item untuk anak usia 7 tahun.

Kalau demikian, kapankah seorang pengetes menghentikan pemberian tes kepada seorang penempuh tes? Prosedur menghentikan pemberian tes juga dapat berbeda satu penempuh tes dengan penempuh tes yang lain. Penghentian tes kepada setiap penempuh tes dilakukan apabila telah diperoleh ceiling level dan basal level. Basal level merupakan tingkat dimana penempuh tes menjawab benar pada semua item, sedangkan ceiling level merupakan tingkat dimana tidak ada satupun item yang dijawab benar oleh penempuh tes [5]. Misal-nya, seorang anak usia 8 tahun dapat menjawab benar semua item untuk usia 7 tahun dan juga item untuk usia 8 tahun, namun ia tidak dapat menjawab benar ketika diberikan sejumlah item untuk usia 9 tahun. Oleh karena itu, pemberian tes SB dihentikan kepada anak tersebut karena telah diperoleh basal level, yaitu usia 8 tahun, dan ceiling level, yaitu usia 9 tahun. Informasi basal level dan ceiling level ini digunakan untuk mendapatkan IQ.

Pengadministrasian tes yang adaptif, seperti tes SB, dianggap cukup adil karena setiap penempuh tes mengerjakan item-item tes yang sesuai dengan kemampuannya masing-masing. Sayangnya, peng-administrasian sebagian besar tes psikologi saat ini tidak bersifat adaptif. Salah satu alasannya karena untuk diadministrasikan secara adaptif, tes harus diberikan secara individual. Artinya, dalam suatu waktu tertentu pengetes hanya dapat mengetes seorang penempuh tes sehingga membutuhkan waktu lama apabila banyak orang yang akan dites. Walaupun demikian, apabila pengadministrasian tes adaptif dilakukan secara manual, seperti tes SB, maka skor tes yang diperoleh juga dipengaruhi oleh kemampuan pengetes dalam memperkirakan kemampuan penempuh tes serta memberikan item- item. Artinya, pengadministrasian tes akan ditentu- kan juga oleh faktor subyektifitas dari pengetes.

Untuk menghindari faktor subyektifas yang mungkin terjadi seperti di atas, komputer dapat digunakan untuk mengadministrasikan tes secara adaptif, seperti yang dilakukan oleh CAT. Prinsip pengadministrasian tes yang adaptif, seperti SB, menjadi dasar

(3)

pengadministrasian untuk merupakan prinsip dasar pengadministrasian CAT. Weiss [8] membuktikan bahwa komputer lebih efektif untuk mengadministrasikan tes SB.

Pengadministrasian tes melalui CAT mulai dikembangkan sekitar tahun 1970-an. Hal ini di- tandai dengan diadakannya konferensi CAT pertama di Washington, Amerika Serikat, pada tahun 1975. Perkembangan penggadministrasian tes melalui CAT selanjutnya sangat meningkat pesat. Pada tahun 1990- an tercatat hanya sekitar ratusan CAT, namun menjadi lebih dari satu juta pada tahun 1999 [9]. Walaupun demikian berdasarkan publikasi yang ada, CAT masih belum banyak digunakan dan dikembangkan di Indonesia. Pengembangan CAT yang ada saat ini hanya terbatas sebagai simulasi atau pengaplikasian teknologi, namun belum menyentuh aspek psikologisnya. Yulianto [10] mengemukakan kemungkinan pengembangan CAT di Indonesia untuk penggunaan di bidang industri dan psikologi, seperti seleksi atau penempatan karyawan. Walaupun dibutuhkan waktu lama dan biaya yang cukup besar, kelebihan yang diperoleh akan lebih menguntungkan. Oleh karena itu, dengan perkembangan teknologi, khususnya komputer, di Indonesia, semakin memungkinkan pengembangan dan pemanfaatan CAT dalam pengetesan psikologis. Dengan pengadministrasian tes yang adaptif, skor tes yang diperoleh melalui CAT akan lebih menunjukkan kemampuan sebenarnya dari setiap penempuh tes dibandingkan pengadministrasian yang konvensional. Efektivitas CAT ini seharusnya tidak hanya ditinjau dari sudut pengaplikasian teknologi saja, melainkan juga dari sudut aspek psikologisnya.

2. Item Response Theory

Pengadministrasian tes yang adaptif melalui komputer ini dimungkinkan karena pendekatan pengukuran yang menggunakan item response theory (IRT). Dengan pendekatan IRT dimungkin-kan setiap penempuh tes mendapatkan sejumlah item yang berbeda dengan penempuh tes lainnya walaupun untuk tes yang sama. Hal ini tidak dapat dilakukan dengan pendekatan pengukuran dengan teori klasik (classical test theory). Bagian ini akan menjelaskan secara singkat mengenai IRT, khusus-nya perbandingan dengan teori klasik, sebagai jembatan untuk menjelaskan CAT.

Pendekatan IRT tidak berorientasi pada tes, tetapi berorientasi pada item tes [11]. Pendekatan IRT meletakkan sebuah dimensi kemampuan atau sifat dimana item tes bergantung pada respons dari individu penempuh tes [12]. Dengan kata lain, kemampuan individu (disebut theta, disimbolkan θ) dan kemampuan item berada pada sebuah dimensi yang sama. Dengan demikian, dapat dilakukan perbandingan antar individu penempuh tes maupun

perbandingan antar item-item tes. Perbandingan kemampuan penempuh tes dengan kemampuan item tes ini tidak dapat dilakukan pada pengukuran dengan pendekatan teori klasik.

Berbeda dengan pendekatan teori klasik yang mengharuskan setiap penempuh tes mendapatkan serangkaian item tes yang sama, dengan IRT dimungkinkan setiap penempuh tes mendapat rangkaian item tes yang berbeda dengan penempuh tes lainnya. Pada pendekatan pengukuran teori klasik, diasumsikan error pengukuran berlaku sama untuk semua orang dan item tes harus disusun berdasarkan tingkat kesukaran. Kedua asumsi ini tidak berlaku dalam IRT dimana urutan item tidak menjadi relevan [12].

Beberapa prinsip dari IRT di atas menjadi dasar CAT untuk pengadministrasian yang adaptif. CAT menggunakan dasar IRT untuk menciptakan sebuah algoritma dimana setiap penempuh tes mendapatkan sebuah tes yang merupakan pengukuran yang baik terhadap individu tersebut [13]. Apabila penempuh tes tidak dapat menjawab benar pada item yang diberikan, maka komputer akan memberikan item dengan kesukaran yang lebih rendah. Sebaliknya, apabila penempuh tes dapat menjawab benar, item yang diberikan selanjutnya adalah item dengan kesukaran lebih tinggi. Konsekuensinya, seorang penempuh tes akan mendapatkan set item tes yang berbeda dengan penempuh tes lainnya. Dengan demikian, CAT berbasis IRT biasanya akan berisi item yang lebih sedikit dibandingkan pengetesan dengan pendekatan teori klasik [13].

3. Computerized Adaptive Testing

Computerized adaptive testing (CAT) merupakan generasi kedua dari pemanfaatan komputer untuk pengetesan [1]. Dalam sejarah pengembangannya, CAT digunakan pertama kali pada seleksi personel dan klasifikasi di industri, pemerintahan, dan militer di Amerika Serikat. The Computerized Adaptive Testing version of the Armed Services Vocational Aptitude Battery (CAT-ASVAB) merupakan salah satu tes kemampuan manusia yang telah diteliti secara seksama dalam sejarah pengetesan modern [14]. Dipersiapkan sejak tahun 1979 dan mulai digunakan pada bulan September 1990, CAT-ASVAB merupakan batere tes adaptif berskala besar yang diadministrasikan dalam situasi berisiko besar. Wainer [9] mencatat pengadminstrasian melalui CAT dalam empat tes berskala besar, yaitu Graduate Record Examination (GRE), Graduate Management adminision Test (GMAT), the Test of English as Foreign Language (TOEFL), dan Armed Services Vocational Aptitude Battery (ASVAB).

Gambar1 menjelaskan bagaimana alur pengadminis-trasian tes dengan CAT, seperti yang tercantum dalam Yulianto [10].

(4)

Gambar 1. Alur administrasi CAT

3.1 Pertimbangan dalam CAT

Embretson dan Reise [13] mengemukakan lima faktor yang perlu diperhatikan dalam CAT, yaitu:

a. Item bank. Karena tujuan CAT adalah untuk mengadministrasikan serangkaian item yang dapat memberikan informasi dan efisiensi yang maksimal untuk setiap penempuh tes, tidak semua item tes yang tersedia diberikan pada setiap penempuh tes. Oleh karena itu, idealnya tersedia sebuah item bank yang berisi sejumlah item yang memiliki kemampuan daya beda tinggi dengan parameter kesukaran tersebar diantara rentang kemampuan [13]. Embretson dan Reise [13] menyarankan sekitar 100 buah item yang ada dalam item bank. Drasgrow [15] menyarankan 200 item untuk model 2 PL. b. Mengadministrasikan item pertama. Apabila

diperoleh informasi mengenai kemampuan penempuh tes, maka informasi tersebut dapat digunakan untuk memilih tingkat kesulitan pada butir soal di awal. Rata-rata kemampuan dari populasi penempuh tes dapat digunakan sebagai perkiraan kemampuan [16]. Namun apabila tidak diperoleh informasi dan diasumsikan kemampuan penempuh tes dalam populasi terdistribusi secara normal, maka dapat dimulai dengan parameter kesukaran sedang (antara -0,5 dan 0,5). Di lain pihak, beberapa peneliti lebih suka untuk memulai dengan item mudah sehingga penempuh tes memiliki pengalaman berhasil dalam menjawab, sehingga mengurangi kecemasan dalam mengerjakan tes [13].

c. Pemberian skor. Beberapa peneliti tidak menganjurkan metode maximum a posterori dan

expected a posteriori karena berpotensi untuk mempengaruhi skor. Kelebihan dari metode maximum likelihood adalah tidak bias, efisien, dan error diasumsikan berdistribusi normal [13]. d. Pemilihan item berikutnya. Maximum item

information adalah strategi yang paling sering digunakan, selain minimum expected posterior standard deviation [16]. Pada strategi maximum information, item yang dipilih adalah item yang memiliki parameter kesukaran mendekati perkiraan kemampuan penempuh tes saat itu. Sedangkan pada metode Bayesian, item yang dipilih adalah item yang dapat memaksimalkan expected posterior precision.

e. Menghentikan Tes. Ada dua kriteria umum untuk menghentikan administrasi CAT, yaitu variable length dan fixed length. Pada variable length, administrasi CAT berhenti ketika SEM sudah mencapai batasan yang telah ditetapkan. Kriteria kedua, yaitufixed length, tes dihentikan apabila sejumlah item telah diadministrasikan. Keduanya kriteria ini dapat digabungkan, apabila kemungkinan akan kehabisan item sebelum target keakuratan tercapai (khususnya apabila hanya sedikit jumlah item yang ter- sedia). Embretson dan Reise [13] menyarankan penggunaan SEM untuk menghentikan peng-administrasian tes karena memanfaatkan algoritma dari CAT. Selain itu, Thissen dan Mislevy [16], mengajukan pemberhentian item setelah selang waktu tertentu. Pengggunaan batas waktu ini tidak dianjurkan untuk power test, tapi akan memberikan keuntungan pada speed test.

Gambar 2 menunjukkan administrasi CAT pada tes Raven’s Advanced Progressive Matrices (APM) dari dua penempuh tes yang berbeda pada penelitian Yulianto [17].

Gambar 2(a) Alur CAT-APM pada AA

1. Mulai dengan perkiraan kemampuan awal penempuh tes 2. Memilih & menampilkan item yang optimal 3. mengevaluasi respons penempuh tes

4. Estimasi skor dan standard error score 5. Aturan berhenti terpenuhi? 6. Hentikan Tes Tidak Ya

(5)

Gambar 2(b) Alur CAT-APM pada BB

Berikut penjelasan untuk gambar 2(a) dan 2(b) di atas. Pada penelitian ini, item pertama yang diberikan dipilih secara acak dengan parameter kesukaran antara -0,5 hingga 0,5 dan item berikutnya dipilih dengan metode maximum item information. Metode ML digunakan untuk penyekoran dan tes berhenti apabila SEM dari skor ≤0,40. Pada penempuh tes AA, komputer secara acak memperkirakan kemampuannya sebesar -0,11 (theta=-0,11), sedangkan penempuh tes BB diberi-kan theta=-0,22. Keduanya diberikan item 17 sebagai item pertama karena memiliki kesukaran mendekati perkiraan kemampuan awal keduanya (b=-0,10). Karena keduanya dapat menjawab benar, maka kemampuannya belum dapat diperkirakan sehingga diberikan theta tertinggi (theta=4,00). Item 36 adalah item yang memiliki nilai b mendekati theta keduanya (b=2,21), sehingga diberikan sebagai item kedua. Baik tes AA dan BB ternyata tidak dapat menjawab benar sehingga diberikan theta = 1,05. Karena SEM skor masih di atas 0,40 maka tes dilanjutkan dengan memberikan item 35 yang memiliki b=1,18. AA mendapatkan theta sebesar 0,47 karena menjawab salah, sedangkan theta sebesar 1,77 diberikan kepada BB karena menjawab benar. Karena SE dari theta keduanya masih besar, tes masih dilanjutkan. Selanjutnya, AA diberikan item yang berbeda dengan BB karena memiliki theta yang berbeda. Di akhir tes (item ke 11), keduanya diberikan item 27, namun karena AA menjawab salah sedangkan BB menjawab benar, maka AA mendapat theta lebih kecil dibandingkan BB (0,87 < 1,82). Karena kedua theta ini memiliki SE yang sama atau lebih kecil dari 0,40, maka tes dihentikan untuk keduanya. Theta terakhir ini menjadi perkiraan skor tes untuk AA dan BB. Dari hasil ini diketahui hanya diperlukan 11 item untuk mengadministrasikan tes dibandingkan 36 item yang biasa dilakukan pada administrasi APM dengan PPT.

3.2 Kelebihan CAT

Bunderson et. al [1] mencatat beberapa kelebihan dari CAT, yaitu: meningkatkan kontrol dalam menampilkan item, meningkatkan keamanan tes, memperkaya kemampuan tampilan, diperoleh skor yang sama dengan waktu yang lebih singkat, mengurangi error of measurement, dan meningkat-kan penyekoran dan pelaporan.Green [7] juga mengemukakankelebihan dari CAT, yaitu: meningkatkan keamanan tes, individu dapat bekerja sesuai dengan kemampuannya, setiap individu tetap produktif karena ditantang mengerjakan soal yang sulit, mengatasi masalah yang terjadi dengan lembar jawaban, tes diskor segera, item dapat ditambahkan ke dalam tes, dan dapat menggunakan item yang beragam. Jette, Haley, & Wei Tao [18] menambah-kan kelebihan CAT, yaitu kemampuan untuk memperbarui dan memperbaiki item bank.

Selain kelebihan di atas, hal yang penting diungkapkan adalah berkurangnya item tes yang perlu diadministrasikan kepada penempuh tes, dibandingkan administrasi konvensional yang meng-administrasikan seluruh item tes yang tersedia. Dari hasil penelitian Simms dan Clark [19], hanya dibutuhkan 50% dari kesuluruhan item tes Schedule of Nonadaptive and Adaptive Personality (SNAP). Pada penelitian Olsen [1] hanya dibutuhkan 30%-50% dari keseluruhan item tes yang ada. Pada penelitian Yulianto [17], CAT hanya mengadminis-trasikan 33% item tes APM dengan keakuratan yang sama dengan saat tes diadministrasikan PPT.

Dengan berkurangnya jumlah item yang diberikan kepada penempuh tes, maka secara langsung akan mengurangi jumlah waktu yang dibutuhkan untuk mengadministrasikan tes [1]. Dengan demikian, CAT membutuhkan waktu administrasi tes yang lebih singkat dibandingkan administrasi konvensional, namun dengan keakuratan yang tinggi.

4. Kesimpulan dan Saran

Tujuan dari pengetesan psikologis adalah untuk mendapatkan informasi yang akurat mengenai kemampuan seseorang. Dengan pengadministrasian tes secara adaptif, akan diperoleh skor tes yang menunjukkan kemampuan sebenarnya dari seorang penempuh tes. Dengan CAT, komputer dapat membantu untuk memberikan item tes secara adaptif dengan menciptakan logaritma yang berbasis IRT. Secara psikologis, motivasi penempuh tes tetap tinggi untuk mengerjakan tes karena CAT hanya memberikan item-item yang sesuai dengan kemampuannya. Konsekuensinya, item tes yang diberikan kepada setiap penempuh tes akan berbeda satu dengan yang lain. Beberapa penelitian telah membuktikan bahwa jumlah item yang diadminis-trasikan melalui CAT akan lebih sedikitdibanding-kanadministrasites yang konvensional (memberi-kan seluruh item yang tersedia). Karena

(6)

jumlah item tes yang diadministrasikan lebih sedikit, dengan demikian jumlah waktu pengetesan yang dibutuhkan menjadi lebih singkat. Hal ini menyebabkan CAT lebih efisien dibandingkan dengan administrasi secara konvensional.

Pengembangan CAT akan menjadi tantangan sekaligus kemajuan dalam perkembangan pengukuran psikologis di Indonesia. Oleh karena itu, CAT perlu dikembangkan lebih lanjut di Indonesia. Tidak sekedar hanya pemanfaatan dari sisi peng-aplikasian teknologi komputer, tetapi juga harus dilihat dari sisi pemanfaatan secara psikologis. Hal ini diperlukan agar pemanfaatan dan pengembangan CAT dapat secara maksimal mengukur kemampuan psikologis individu.

Salah satu sisi psikologis yang perlu diperhatikan dalam pengembangan CAT adalah mempertimbangkan aspek psikologis yang dapat mempengaruhi performa individu ketika diadminis-trasikan tes melalui CAT. Beberapa penelitianmembuktikansejumlahfaktorpsikologis dapat mempengaruhi performa individu, seperti motivasi mengerjakantes [20],kecemasan[21,22],kepuasan [21], dan keyakinan diri [21]. Oleh karena itu, faktor-faktor psikologissepertitersebutdiatasharus menjadi perhatian dalam pengembangan dan pemanfaatan CAT di Indonesia.

Daftar Pustaka:

[1] Bunderson, C.V., Inouye, D. K., & Olsen, J.B., 1989, The Four Generations of Computerized Educational Measurement, dalam Robert L. Linn, Educational Measurement. 3rd ed, New York, American Council on Education & Macmillan Publishing Company.

[2] Kaplan, R.M., & Saccuzzo, D.P., 2005, Psychological Testing: Principles, Applications, and issues, California, Thomson-Wadworth. [3] Schaeffer, G.A., Steffen, M., Golub-Smith, M.L.,

Mills, C.N., & Durso, R., 1995, The Introduction and Comparability of the Computer Adaptive GRE General Test, GRE Board Report No. 88- 08aP, August 1995, New Jersey, Educational Testing Service.

[4] Landy, F. J., Shankster, L. L., Kohler, & Stacey, S., 1994, Personnel selection and placement, Annual Review of Psychology, ProQuest Social Science Journals, 45, 261-296.

[5] Friedenberg, L., 1995, Psychological Testing: Design, Analysis, and Use, Massachusetts, Allyn & Bacon.

[6] Murphy, K.R., & Davidshofer, K.O., 2001, Psychological Testing: Principles and Applications, New Jersey, Prentice-Hall, Inc. [7] Wainer, H., 1990, Introduction and History, dalam

H. Wainer, N.J. Dorans, R. Flugher, & B.F. Green, Computerized Adaptive Testing: a Primer, New Jersey, Lawrance Erlbaum Associates, Publishers.

[8] Weiss, D. J., 1973, The stratified adaptive computerized ability test (Research Report 73-3), Minneapolis:,University of Minnesota, Department of Psychology, Psychometric Methods Program, Computerized Adaptive Testing Laboratory.

[9] Wainer, H., 2000, CATs: Whither and Whence, Psicológica, 21, 121-133.

[10] Yulianto, A., 2007, The Potential Use and Development of Conputerized Adaptive Testing in Organizational and Industrial Setting. I/O Psychology at the Crossroad: Diversity in I/O Psychology Conference Proceeding.

[11] Hambleton, R.K., Swaminathan, H, & Rogers, H.J., 1991, Fundamental of Item Response Theory, California, Sage Publications, Inc. [12] Wainer, H. & Mislevy, R.J., 1990, Item Response

Theory, Item Calibration, and Proficiency Estimation, dalam H. Wainer, N.J. Dorans, R. Flugher, & B.F. Green, Computerized Adaptive Testing: a Primer, New Jersey, Lawrance Erlbaum Associates, Publishers.

[13] Embretson, S.E, & Reise, S.P., 2000, Item Response Theory for Psychologist, New Jersey, Lawrence Erlbaum Associates, Inc.

[14] Segall, D.O., & Moreno, K.E., 1999, Development of the Computerized Adaptive Testing version of the Armed Services Vocational Aptitude Battery, dalam ritz Drasgow & Julie B. Olson-Buchanan, Innovations in Computerized Assessment, New Jersey, Lawrence Erlbaum Associates, Publishers. [15] Zickar, M.J., Overton, R.C., Taylor, L.R., &

Harms, H.J., 1999, The Development of Computerized Selection System for Computer Programmers in a Financial Services Company, dalam Fritz Drasgow & Julie B. Olson-Buchanan, Innovations in Computerized Assessment, New Jersey, Lawrence Erlbaum Associates, Publishers.

[16] Thissen, D., & Mislevy, R. J., 1990, Testing Algorithms, dalam H. Wainer, N.J. Dorans, R. Flugher, & B.F. Green, Computerized Adaptive Testing: a Primer, New Jersey, Lawrance Erlbaum Associates, Publishers.

[17] Yulianto, A. 2006, Pengaruh Bentuk Administrasi Tes dan Batas Waktu terhadap Skor Advanced Progressive Matrices, Tugas akhir Program Magister Psikologi, Kekhususan Psikometri, Fakultas Psikologi, Universitas Indonesia (tidak diterbitkan), Depok, Fakultas Psikologi, Universitas Indonesia.

[18] Jette, A. M., Haley, S. M., & Wei Tao, 2007, Prospective Evaluation of the AM-PAC-CAT in Outpatient Rehabilitation Settings, Physical Therapy, April 2007, 87, 4, Academic Research Library, 385.

[19] Simms, L.J., & Clark, L.A., 2005, Validation of a Computerized Adaptive Version of Schedule of Nonadaptive and Adaptive Personality (SNAP), Psychological Assessment, vol. 17, no. 1, 28-43. [20] Kim, J. & McLean, J.E., 1995, The Influence of

Examinee Test-Taking Motivation in Computerized Adaptive Testing, Makalah disajikan pada the Annual Meeting of the National Council on Measurement in Education. [21] Tonidandel, S., Quinones, M.A., & Adams, A.A.,

2002, Computer-Adaptive Testing: The Impact of Test Characteristics on Perceived Performance and Test Taker’s Performance, Journal of Applied Psychology, Vol. 87, No. 2, 320-332.

[22] Wise, S.L., 1997, Examinee Issues in CAT. Makalah disajikan pada the Annual Meeting of the National Council on Measurement in Education.

Gambar

Gambar 1. Alur administrasi CAT

Referensi

Dokumen terkait

Pada penelitian yang dilakukan oleh Susanso dkk (2020) guru SD yang diberikan literasi pedagogik agar memiliki pengetahuan mengenai: (a) rasional, program, tujuan

merupakan pemikiran menentang segala hal yang berkaitan dengan kemutlakan dan menghindari suatu sisteatika uraian atau pemecahan persoalan yang sederhana dan

Dinyatakan sebagai Penyedia Barang/Jasa Demikian untuk menjadikan periksa. Probolinggo, 18 November2014 DINAS KESEHATAN KABUPATEN PROBOLINGGO PEJABAT

Melihat pentingnya saksi dalam perkara perdata, maka di dalam hukum acara perdata secara khusus mengatur tentang pembuktian dengan alat bukti saksi berdasarkan dengan

Ekstraksi cair-cair merupakan suatu teknik yang mana suatu larutan (biasanya dalam air) dibuat bersentuhan dengan suatu pelarut kedua (biasanya pelarut organik), yang pada

Registrasi peserta dimulai pukul 15.00 hari pertama pelatihan 3 4 MEDAN SURABAYA 5 SEMARANG.. Piere Tendean

MANAGEMEN Penyesuaian dosis, ganti anti analgetik lain yaitu paracetamol Menghentikan allopurinol dilakukan dengan berlahan dengan menurunkan dosis secara bertahap Pemantauan kadar

Puji dan syukur kepada Tuhan Yesus Kristus, atas kasih dan berkat yang sangat luar biasa yang diberikan, akhirnya penulis dapat menyelesaikan skripsi ini sebagai salah satu