i
i
PENGUKURAN ENGLISH VOCABULARY SIZE DENGAN COMPUTERIZED-
ADAPTIVE TESTING
Andhita Dessy Wulansari Dhinuk Puspita Kirana
Thalibul Ilmi Publishing & Education
ii
Pengukuran English Vocabulary Size dengan Computerized- Adaptive Testing
©Penerbit Thalibul Ilmi Publishing & Education, 2023 119 halaman, 21 x 29.7 cm
Penulis
Andhita Dessy Wulansari Dhinuk Puspita Kirana
Editor Indah Puji Lestari
Desain Cover Dewi Fitria Sari
Penata Letak Nur Jannah
ISBN: 978-623-8224-05-0 Cetakan I, April 2023
Diterbitkan oleh:
Penerbit Thalibul Ilmi Publishing & Education Desa Dampaan RT 01 RW 02, Cerme, Gresik, Jawa Timur
Layanan Customer : 085731948161/081283137243 Instagram : @thalibulilmi_publishing
Email : [email protected]
Website: https://thalibulilmi.com/
iii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT yang telah memberikan rahmat serta hidayah-Nya sehingga penulis akhirnya dapat menyelesaikan buku yang berjudul Pengukuran English Vocabulary Size dengan Computerized- Adaptive Testing.
Bagi pembelajar bahasa Inggris, hal utama yang harus dikuasai terlebih dahulu adalah vocabulary. Penguasaan vocabulary yang banyak merupakan fasilitas utama untuk bisa menyusun kalimat dan berbicara dengan lancar. Untuk mencapai standar yang tinggi dan mencapai kemahiran seperti native speaker, siswa perlu mengetahui sekitar 20.000 rumpun kata (tidak termasuk nama yang tepat dan bentuk yang diturunkan secara transparan). Untuk mengetahui vocabulary yang telah dipelajari, diperlukan vocabulary size test. Vocabulary Size Test (VST) yang banyak digunakan oleh para peneliti dirancang oleh Nation. Tes tersebut dirancang
untuk memberikan perkiraan vocabulary size untuk pelajar bahasa kedua dan asing.
Selama ini di berbagai tempat VST diselanggarakan secara manual/klasik yang biasa dikenal sebagai Paper Based Test. Paper Based Test (PBT) yang diselenggarakan di berbagai tempat selama ini dinilai kurang efektif dan efesien, banyak masalah/kendala pada saat penyiapan sampai dengan distribusi soal tes, perlu scanning LJK dan scoring sehingga membutuhkan biaya, tenaga dan waktu yang ekstra.
Untuk mengatasi hal tersebut lahirlah Computerized-Adapative Testing.
Computerized-Adapative Testing adalah perkembangan dari CBT. Computerized- Adapative Testing (CAT) memiliki kelebihan untuk menyesuaikan item soal tes yang diberikan dengan kemampuan peserta tes. Selain itu kelebihan CAT adalah, tes akan berhenti jika estimasi kemampuan peserta tes sudah dapat diketahui sehingga waktu lebih efesien dan lebih efektif. Kemampuan peserta tes dapat diestimasi dengan Item Response Theory (IRT). Demikian halnya dengan estimasi parameter item/butir soal. Besarnya hasil estimasi parameter item/butir soal inilah yang nantinya akan dibandingkan dengan kemampuan peserta tes.
iv
Pengembangan tes terkomputerisasi untuk mengukur english vocabulary size dengan model logistik dalam IRT diharapakan mampu menjadi standar tes bagi calon mahasiswa baru sehingga input mahasiswa terstandarisasi sesuai dengan english vocabulary size yang dimiliki mahasiswa sejak tes ujian masuk. Selain itu dapat memberikan alternatif bagi institusi, karyawan, dosen dan mahasiswa sebagai sistem evaluasi modern. Bagi Mahasiswa, dapat menjadi tolak ukur kemampuan (penguasaan vocabulary) bahasa Inggris mahasiswa, sehingga mahasiswa mengetahui kemampuan awal mereka sekarang sehingga dapat meningkatkan kesadaran untuk meningkatkan kemampuan bahasa Inggris mereka. Bagi dosen, dapat memberikan informasi terkait hasil analisis data dan evaluasi secara detail mengenai english vocabulary size yang dimiliki mahasiswa sehingga dosen mampu merencanakan program pembelajaran bahasa yang sesuai untuk mahasiswa.
Selanjutnya pada kesempatan ini penulis ingin menyampaikan terima kasih kepada keluarga dan semua pihak yang telah membantu terselesaikannya buku ini.
Tiada gading yang tak retak, penulis menyadari bahwa buku ini masih jauh dari sempurna. Oleh karena itu kritik dan saran yang membangun diharapkan dari berbagai pihak demi perbaikan selanjutnya. Semoga buku ini dapat memberikan manfaat bagi banyak pihak, aamiin.
Ponorogo, 3 April 2023
Penulis
v
DAFTAR ISI
HALAMAN JUDUL...i
KATA PENGANTAR ... iii
DAFTAR ISI ... v
BAGIAN 1: PEMBELAJARAN VOCABULARY BAHASA INGGRIS DI INDONESIA ... 1
BAGIAN 2: VOCABULARY SIZE IDEAL UNTUK PARA PEMBELAJAR BAHASA INGGRIS ... 5
BAGIAN 3: PENGUKURAN ENGLISH VOCABULARY SIZE DENGAN TES TERKOMPUTERISASI ... 9
BAGIAN 4: COMPUTERIZED-ADAPATIVE TESTING (CAT) ... 15
BAGIAN 5: ITEM RESPONSE THEORY (IRT) ... 17
BAGIAN 6: KARAKTERISTIK BUTIR SOAL VOCABULARY TEST ... 26
BAGIAN 7: PENGEMBANGAN COMPUTERIZED-ADAPTIVE TESTING UNTUK MENGUKUR ENGLISH VOCABULARY SIZE ... 33
BAGIAN 8: IMPLEMENTASI COMPUTERIZED-ADAPTIVE TESTING UNTUK MENGUKUR ENGLISH VOCABULARY SIZE ... 99
DAFTAR PUSTAKA ... 108
BIOGRAFI PENULIS ... 113
1
BAGIAN 1 PEMBELAJARAN VOCABULARY BAHASA INGGRIS DI INDONESIA
Banyak pembelajar bahasa kedua maupun pembelajar bahasa asing menganggap bahwa salah satu alat bantu yang efektif mereka dalam belajar adalah kamus. Namun mungkin hanya beberapa saja yang benar-benar pernah bertanya tentang berapa sebenarnya vocabulary size yang mereka harus kuasai sehingga mereka dapat berkomunikasi dalam kegiatan sehari hari tanpa bantuan kamus. Dari para pengajar bahasa Inggris, pertanyaan yang sering muncul adalah ”berapa kira- kira vocabulary yang telah diperolah peserta didik?” dan sebaiknya “vocabulary mana saja yang seharusnya diajarkan kepada para peserta didik sebelum vocabulary yang lain?”. Pertanyaan-pertanyaan sejenis pertanyaan diatas telah banyak menjadi perhatian para ahli bahasa atau linguistis di berbagai negara di dunia, baik dalam konteks pembelajaran bahasa ke dua maupun pembelajaran bahasa asing.
Fan menyatakan bahwa masalah utama yang bisa dihadapi para pembelajar bahasa Inggris maupun pembelajar bahasa asing apapun adalah pemerolehan vocabulary, hal ini karena vocabulary adalah hal terbesar yang perlu dipelajari karena vocabulary adalah bagian utama dari sumber makna bahasa apapun.
Dengan demikian, pembelajar bahasa asing diharapkan perlu memperoleh vocabulary yang memadai yang penting bagi pembelajar bahasa agar terampil dan efisien dalam menggunakan bahasa Inggris sebagai bahasa asing.1
Dalam pembelajaran bahasa Inggris sebagai bahasa asing di Indonesia, vocabulary memainkan peran yang sangat penting. Seperti kita ketahui, belajar
1 Fan, M. Y. Frequency of use, perceived usefulness and actual usefulness of second language vocabulary strategies: a study of Hong Kong learners, The Modern Language Journal, 2003, 87/2: 222-241.
2
bahasa asing harus dimulai dengan belajar vocabulary karena sejak awal pembelajaran, pembelajar bahasa asing akan diminta membaca susunan kata, mendengarkan rangkaian kata, dan mengucapkan untaian kata serta menulis susuna kata kata dalam bentuk kalimat maupun paragraf. Richard dan Renandya mengungkapkan bahwa vocabulary adalah bagian sentral dari penguasaan bahasa Inggris. Semakin banyak vocabulary yang dimiliki pelajar, semakin baik kemampuan bahasa Inggris mereka. Semakin sedikit vocabulary yang dimiliki pembelajar, mereka akan mengalami kesulitan dalam menggunakan bahasa secara maksimal2.
Para ahli mengatakan bahwa pemerolehan vocabulary adalah inti dari pembelajaran bahasa. Jika pembelajar bahasa asing hanya memiliki vocabulary yang terbatas, mereka akan menemui berbagai hambatan dalam memahami tuturan orang lain dan mengalami kesulitan dalam menanggapi tuturan orang lain yang berbicara dalam bahasa asing. Lebih dari itu, kurangnya pemerolehan vocabulary umumnya dapat menghambat pembelajar bahasa dalam memperoleh bahasa kedua maupun bahasa asing dengan mahir. Kurangnya vocabulary size yang dikuasai tersebut dapat menghambat pembelajar asing dalam rangka membaca dan menulis dan baik, serta dalam berkomunikasi dalam bahasa target secara efektif.
Pembelajar bahasa asing cenderung mempelajari vocabulary daripada tata bahasa.
Hal ini sesuai dengan hasil kajian terdahulu bahwa pembelajar bahasa kedua maupun pembelajar bahasa asing sering mengungkapkan keinginan untuk lebih banyak mendapat pengajaran vocabulary bagi mereka3.
Vocabulary bahasa Inggris sebagai bahasa asing dalam kurikulum bahasa di Indonesia tampaknya berubah sesuai dengan kurikulum yang ada, disesuaikan
2 Richard, Jack C and Renandya, Willy A. Methodology in Language Teaching. England:
Cambridge Univerity Press, 2002.
3Folse, K. Vocabulary myths: Applying second language research to classroom teaching. Ann Arbor: University of Michigan Press, 2004.
3
dengan tujuan dan metode pengajaran bahasa Inggris di Indonesia4. Pada sekitar tahun 1960 an, kurikulum mengadopsi versi Audio Lingual Method (ALM).
Dengan pemilihan metode ALM ini dapat diasumsikan bahwa pengajaran penggunaan struktur tata bahasa begitu tinggi sehingga pengajaran vocabulary sangat minimum. Hal ini sesuai dengan pendapat Seal5 bahwa metode ALM menyebabkan pengajaran vocabulary bahasa menjadi ditekan atau menjadi kurang maksimal.
Menurut Furneaux6, perubahan terjadi sekitar tahun 1980-an, dimana terjadi pergeseran status dari pentingnya posisi vocabulary dalam pembelajaran bahasa, dimana vocabulary mendapatkan atensi yang baik di buku-buku teks dan program- program pembelajaran bahasa.
Pada tahun 1990-an, mulai banyak bermunculan kajian-kajian tentang vocabulary bahasa Inggris dalam konteks pembelajaran bahasa Inggris sebagai bahasa asing di Indonesia. Misalnya menurut Mukminatien, kajian tentang vocabulary sangat diperlukan untuk memahami peran vocabulary dalam pembelajaran bahasa asing di Indonesia sehingga diharapkan dapat mengatasi masalah-masalah pembelajaran bahasa asing yang terkait dengan pemerolehan vocabulary bahasa Inggris.7 Kurikulum tahun 1994 mengadopsi “pendekatan kebermaknaan”, yaitu salah satu dari versi pendekatan komunikatif, dimana komponen bahasa yaitu struktur bahasa, vocabulary, dan pengucapan dianggap sangat perlu dipelajari bagi pembelajar bahasa asing8.
4 Cahyono, B. Y., & Widiati, U. (2015). The teaching of EFL vocabulary in the Indonesian context: the state of the art. TEFLIN journal, 19(1), 1-17.
5 Seal, B. D. 1991. Vocabulary Learning and Teaching. In Celce-Murcia, M.
(Ed.), Teaching English as a Second or Foreign Language (pp. 296-311).
Boston: Heinle & Heinle.
6 Furneaux, C. L. 1999. Vocabulary Teaching. In Johnson, K. & Johnson, H.
Encyclopedic Dictionary of Applied Linguistics (pp. 367-369). Oxford: Blackwell.
7 Mukminatien, N. 1994. Masalah Leksis dalam Bahasantara [Lexical Problems in Interlanguage]. Bahasa dan Seni, 22(2): 140-150.
8 Huda, N. 1999. Principles of Teaching and Learning: Trends and Issues. Malang: State University of Malang Press.
4
Kurikulum 2004 dan 2006 yang biasa disebut dengan Kurikulum berbasis kompetensi (CBC) atau Kurikulum tingkat satuan pendidikan (KTSP), menggaris bawahi bahwa perkembangan kompetensi komunikasi termasuk kompetensi linguistik, kompetensi wacana, kompetensi sosial-budaya, kompetensi strategik sangatlah diutamakan. Kurikulum ini menyarankan penggunaan empat tahap proses belajar mengajar yaitu Building Knowledge of the Field (BKOF), Modelling of the Text (MOT), Joint Contruction of the Text (JCOT) dan Independent Construction of the Text (ICOT). Vocabulary harus mulai diperhatikan sejak tahap awal9.
Kurikulum 2013 berbeda dengan kurikulum sebelumnya. Tidak sama dengan Kurikulum 2006, implementasi pada Kurikulum 2013 menekankan pada kompetensi lulusan yang terdiri dari empat kompetensi inti yang meliputi sikap spiritual (KI 1), sikap sosial (KI 2), pengetahuan (KI 3), dan Keterampilan (KI 4).
Pembelajaran bahasa Inggris pun harus turut serta tidak hanya dalam membangun pengetahuan, namun lebih dari itu harus juga menekankan aspek spiritual, aspek sosial, juga aspek ketrampilan10.
9 Cahyono, B. Y., & Widiati, U. (2015). The teaching of EFL vocabulary in the Indonesian context: the state of the art. TEFLIN journal, 19(1), 1-17.
10 Friantary, H., & Martina, F. (2018). Evaluasi Implementasi Penilaian Hasil Belajar Berdasarkan Kurikulum 2013 oleh Guru Bahasa Inggris dan Bahasa Indonesia di MTS Ja-Alhaq Kota Bengkulu. Silampari Bisa: Jurnal Penelitian Pendidikan Bahasa Indonesia, Daerah, Dan Asing, 1(2), 264-283.
5
BAGIAN 2 VOCABULARY SIZE IDEAL UNTUK PARA
PEMBELAJAR BAHASA INGGRIS
Mengetahui vocabulary size yang dimiliki pembelajar bahasa asing sangatlah penting. Pengukuran perkiraan vocabulary size ini dapat digunakan untuk merencanakan program pembelajaran bahasa, mendiagnosis dan untuk kajian lebih lanjut. Karena sangat pentingnya mengetahui ukuran vocabulary dalam pembelajaran bahasa, ada permintaan yang meningkat untuk memperkirakan ukuran vocabulary pelajar bahasa asing untuk menyesuaikan dengan program pembelajaran bahasa secara efektif.11 Bagi pengembang materi ajar, guru, maupun instruktur bahasa Inggris, tidaklah mudah untuk merencanakan program pengembangan vocabulary yang sesuai bagi pembelajar bahasa Inggris tanpa mengetahui kemampuan awal para pembelajar sekarang.
Tes Tingkat Vocabulary atau VST digunakan untuk mengukur perkiraan jumlah vocabulary yang telah diperoleh pembelajar bahasa kedua maupun pembelajar bahasa asing yaitu bahasa Inggris umum ataupun bahasa Inggris akademik 12. Tes ukuran vocabulary memberikan perkiraan ukuran vocabulary pembelajar bahasa pada tingkat frekuensi yang berbeda. Sesuai dengan frekuensinya, vocabulary bisa dibagi menjadi tiga, yaitu vocabulary dengan frekuensi tinggi, yaitu sekitar 2000 kata, vocabulary frekuensi menengah, yaitu sekitar 7000 kata, sehingga menjadi 9000 kata, dan sisanya adalah vocabulary
11 Meara, P. The dimensions of lexical competence. Performance and competence in second language acquisition, 1996, 35, 33-55.
12 Schmitt, N., Schmitt, D., & Clapham, C. Developing and exploring the behavior of two new versions of the Vocabulary Levels Test, Language Testing, 2001, 18, 55–88.
doi:10.1191/026553201668475857
6
dengan frekuensi rendah sekitar 10.000 kata namun berpotensi lebih banyak dari itu13.
Meletakkan tujuan pembelajaran vocabulary sebanyak 9000 kata bagi pembelajar bahasa Inggris sebagai bahasa asing tentunya akan sangat tinggi, atau bisa dijadikan tujuan jangka panjang. Namun tujuan jangka pendek yang lebih masuk akal adalah pada vocabulary frekuensi tinggi yang terdiri dari 2000 vocabulary. Setelah vocabulary frekuensi tinggi dapat dicapai, tentunya pembelajar akan melanjutkan untuk mempelajari vocabulary frekuensi menengah.
Seperti yang dapat ditarik dari studi literatur, minimal 3.000 rumpun kata dianggap sebagai ambang batas untuk tingkat universitas. Dengan memiliki ukuran vocabulary sekitar 2.000-3.000 rumpun kata, pembelajar bahasa akan lebih berhasil dalam menggunakan bahasa Inggris secara efektif14.
Sebagaimana kita tahu bahwa bahasa Inggris adalah bahasa internasional yang telah digunakan di berbagai negara dan telah dianggap sebagai bahasa unggulan untuk komunikasi yang lebih luas15. Namun, untuk menguasai bahasa Inggris, pembelajar bahasa harus memperhatikan beberapa aspek bahasa misalnya struktur bahasa, vocabulary, dan keahlian berbahasa seperti menyimak, membaca, berbicara dan menulis.
Dari aspek-aspek bahasa tersebut, vocabulary menempati posisi yang sangat penting dalam penguasaan bahasa. Penguasaan vocabulary merupakan satu dari komponen bahasa yang terpenting dalam pembelajaran bahasa. Penguasaan vocabulary yang kurang akan berdampak pada kurangnya kemampuan pembelajar bahasa dalam usaha berkomunikasi dengan lancer dalam percakapan sehari-hari, lebih lebih dalam percakanan akademik.
13 Nation, P. (2012, August). Measuring vocabulary size in an uncommonly taught language. In International Conference on Language Proficiency Testing in the Less Commonly Taught Languages (pp. 17-18).
14 Zhang, L. J., & Anual, S. B. The Role of Vocabulary in Reading Comprehension The Case of Secondary School Students Learning English in Singapore. RELC Journal, 2008, 39(1), 51-76.
15 Nunan, D. 1999/2000. "Yes, but is English?" TESOL Matters, p. 3.
7
Ada pertanyaan yang sering diajukan tentang berapa banyak vocabulary yang perlu diketahui pembelajar bahasa yang dapat berfungsi dalam situasi sehari- hari. Diperkirakan vocabulary sekitar 2.000 keluarga kata yang sering digunakan.
Jumlah 2000 kata pertama inilah adalah vocabulary yang sering digunakan oleh penutur asli dalam percakapan sehari-hari16. Jumlah kata tersebut menurut Nation17 adalah yang paling sering mencakup sebagian besar bahasa dan kata-kata seperti itu yang paling mungkin ditemui dalam wacana kegiatan sehari-hari.
Keluarga kata 1.000 kata yang paling sering digunakan membentuk sekitar 70- 75% dari teks tertulis, dan 2.000 keluarga kata memungkinkan pemahaman sekitar 80%.
Paul Nation juga menunjukkan tiga tingkat frekuensi utama: tingkat frekuensi tinggi, tingkat frekuensi sedang, dan tingkat frekuensi rendah.
Vocabulary dengan frekuensi tinggi; berkisar dari 1.000-2.000 rumpun kata, vocabulary frekuensi menengah berkisar dari 3.000-9.000 rumpun kata, dan vocabulary frekuensi rendah berkisar dari 10.000 rumpun kata18.
Di lain pihak, Laufer menegaskan bahwa mengetahui keluarga kata sebanyak 3000 akan membantu kinerja pembelajar bahasa untuk dapat membaca dengan baik. Hal ini didukung oleh pendapat Zhang dan Anual bahwa mereka menyarankan bahwa pembelajar bahasa sebaiknya memahami 2.000-3.000 rumpun kata dalam bahasa Inggris sebagai bahasa asing. Hal ini didukung dengan hasil riset meraka bahwa memahami 2.000-3.000 rumpun kata dalam bahasa
16 Nation, I. S. P. Learning vocabulary in another language. Cambridge: Cambridge University Press. 2001.
17 Nation, I. S. P. Learning vocabulary in another language. Cambridge: Cambridge University Press. 2001.
18Nation, I. S. P., Measuring Vocabulary Size in an Uncommonly Taught
Language.International Conference on Language Proficiency Testing in the Less Commonly Taught Languages, 2012.
8
Inggris berkorelasi dengan pemahaman bacaan sehingga memudahkan pembelajar bahasa untuk menjawab pertanyaan-pertanyaan dalam bacaan19
Pembelajar bahasa akan mudah memahami bahasa asing dengan mengetahui 98% dari vocabulary yang digunakan baik dalam text, maupun dalam tuturan lisan. Hal ini secara mudah dapat dikatakan dengan ungkapan yang lebih mudah yaitu, dalam text panjang yang terdiri dari 100 vocabulary, pembelajar bahasa akan dapat memahami teks tersebut meskipun dia mungkin kesulitan menemukan arti dari maksimal 2 vocabulary dari keseluruhan teks tersebut.
Pembelajar bahasa diharapkan mengusai sekitar 7000 rumpun bahasa untuk memahami tuturan bahasa Inggris lisan tanpa kesulitan berarti20. Studi lain juga menunjukkan bahwa sarjana yang bukan merupakan penutur asli yang belajar di universitas berbahasa Inggris memiliki vocabulary sekitar 5.000-6.000 rumpun kata. Selain itu, mahasiswa doktoral yang bukan penutur asli diperkirakan memiliki sekitar 9.000 vocabulary 21.
19 Zhang, L. J., & Anual, S. B. The Role of Vocabulary in Reading Comprehension The Case of Secondary School Students Learning English in Singapore. RELC Journal, 2008, 39(1), 51-76.
20 Nation, I. S. P. How large a vocabulary is needed for reading and listening? Canadian Modern Language Review, 2006, 63(1), 59-82.
21 Nation, I. S. P., & Beglar, D. A vocabulary size test. The language teacher, 2007, 31(7), 9-13.
9
BAGIAN 3 PENGUKURAN ENGLISH VOCABULARY SIZE DENGAN TES TERKOMPUTERISASI
Bahasa inggris adalah bahasa internasional yang pasti digunakan oleh orang di seluruh dunia, oleh karena itu, jika kita menguasai bahasa inggris maka tentu saja akan mudah beradaptasi (bercakap) dengan dengan banyak orang di seluruh penjuru dunia. Dengan penguasaan bahasa inggris yang baik orang akan mudah mendapatkan karier di jenjang internasional.
Perkembangan zaman sangatlah pesat, daya saing juga semakin ketat. Dunia pendidikan di Indonesia juga menangkap hal tersebut, bahwasannya Bahasa Inggris dinilai berkorelasi positif terhadap meningkatnya daya saing Sumber Daya Manusia (SDM), sehingga bahasa inggris sangat penting untuk dikuasai oleh orang indonesia yang notabene bahasa ibu nya adalah bahasa inggris. Hal ini dapat dibuktikan dengan adanya mata pelajaran bahasa ingrris pada kurikulum pendidikan di indonesis. Mulai dari tingkat Sekolah Dasar (SD) hingga universitas, bahasa Inggris telah dipelajari sebagai bahasa asing. Namun, walaupun bahasa Inggris sudah diunggulkan sejak SD, siswa masih kesulitan dalam menguasai bahasa ini.
Dalam bahasa inggris, ada 4 yang harus dikuasai yaitu listening, speaking, reading dan writing. Adapun faktor penting yang sangat berpengaruh terhadap 4 skill tersebut adalah penguasaan vocabulary dan grammar. Bagi pembelajar bahasa inggris, hal utama yang harus dikuasai terlebih dahulu adalah vocabulary. Menurut Schmitt, definisi vocabulary adalah kumpulan kata yang dikenal dan digunakan oleh orang tertentu dalam suatu bahasa22. Penguasaan vocabulary yang banyak
22 Schmitt, Norbert, and Diane Schmitt. Vocabulary in Language Teaching. Cambridge university press, 2020.
10
merupakan fasilitas utama untuk bisa menyusun kalimat dan berbicara dengan lancar.
Banyaknya pembelajar bahasa inggris yang kekurangan vocabulary inilah yang kemudian akan membuat mereka kesulitan dalam mengungkapkan ide-idenya dalam bahasa Inggris. Vocabulary adalah blok bangunan bahasa. Oleh karena itu, ketika seseorang ingin berbicara bahasa Inggris dengan baik, mereka harus memiliki vocabulary yang cukup sehingga berkomunikasi dengan lancar.
pembelajar bahasa inggris mungkin tidak memiliki cukup waktu untuk belajar bahasa Inggris di kelas. Oleh karena itu, mereka perlu meningkatkan tingkat vocabulary mereka dengan mendengarkan dan membaca sebanyak mungkin.
Setiap pembelajar bahasa inggris mungkin pernah berpikir berapa banyak kata bahasa Inggris yang perlu dia ketahui untuk mahir berbahasa Inggris saat mereka membawa kamus selama kelas bahasa Inggris mereka23. Untuk mengetahui vocabulary yang telah dipelajari siswa, diperlukan vocabulary size test. Vocabulary Size Test (VST) yang banyak digunakan, dirancang oleh Nation. Tes tersebut dirancang untuk memberikan perkiraan vocabulary size untuk pelajar bahasa kedua
dan asing24. Untuk belajar secara efektif, pembelajar bahasa inggris perlu mengetahui
tujuan mereka tentang seberapa besar vocabulary yang perlu mereka ketahui atau pelajari. Menurut Nation, ada 6.000-7.000 keluarga kata yang dibutuhkan untuk mendengarkan mendengarkan bahasa Inggris dan ada 8.000-9.000 keluarga kata yang diperlukan untuk dapat membaca tanpa bantuan kamus. Untuk mencapai standar yang tinggi dan mencapai kemahiran seperti native speaker, siswa perlu
23 Schmitt, Norbert. An Introduction to Applied Linguistics. Routledge, 2013.
24 Nation, Paul. "Measuring Vocabulary Size in an Uncommonly Taught Language." Paper presented at the International Conference on Language Proficiency Testing in the Less Commonly Taught Languages, 2012.
11
mengetahui sekitar 20.000 rumpun kata (tidak termasuk nama yang tepat dan bentuk yang diturunkan secara transparan)25.
Ada banyak argumen yang menyatakan bahwa mengetahui 2.000 rumpun kata adalah ukuran yang cukup bagi pembelajar bahasa inggris, untuk dapat mendengarkan dan berbicara dalam aktivitas sehari-hari. Jika pembelajar bahasa asing memiliki kurang dari 2.000 kata, mereka akan kesulitan berkomunikasi dalam aktivitas sehari-hari. Dengan menguasai minimal jumlah vocabulary atau 2.000 kata, pembelajar bahasa akan mampu mengungkapkan ide-idenya dalam bahasa Inggris dalam percakapan sehari-hari.
Namun studi terbaru berpendapat bahwa 2000 rumpun kata tidaklah cukup.
Baru-baru ini, para ahli vocabulary mengusulkan sedikitnya 3000 rumpun kata.
Riset terbaru yang diterbitkan oleh Nation menemukan bahwa penutur bahasa Inggris berpendidikan tinggi yang sedang studi untuk meraih gelar pascasarjananya menunjukkan bahwa vocabulary size bahasa Inggris mereka adalah sekitar 6.000 hingga 7.000 untuk teks lisan dan 8.000 hingga 9.000 keluarga kata untuk pemahaman tanpa bantuan26.Mahasiswa bahasa asing di tingkat universitas harus menguasai minimal 3000 rumpun kata untuk mendukung keberhasilan mereka dalam membaca akademis.
Beberapa teori telah diajukan untuk menunjukkan relevansi kosakata bahasa Inggris (English vocabulary) Dalam pemerolehan bahasa kedua. Menurut Krashen27, ada banyak alasan untuk memperhatikan terminologi. Pertama, pembelajar sering menggunakan kamus daripada buku tata bahasa, menunjukkan bahwa kosakata adalah ukuran yang baik dari kemahiran bahasa. Wilkins berkata bahwa 'Without grammar very little can be conveyed, without vocabulary nothing
25 Goulden, Robin, Paul Nation, and John Read. "How Large Can a Receptive Vocabulary Be?". Applied linguistics 11, no. 4 (1990): 341-63.
26 Nation, I. "How Large a Vocabulary Is Needed for Reading and Listening?". Canadian modern language review 63, no. 1 (2006): 59-82.
27 Krashen SD. We acquire vocabulary and spelling by reading: Additional evidence for the input hypothesis. The Modern Language Journal 1989; 73: 440-464.
12
can be conveyed'28, 'Tanpa tata bahasa sangat sedikit yang dapat disampaikan, tanpa kosa kata tidak ada yang dapat disampaikan'. Hal ini menujukkan bahwa bahwa kosa kata adalah salah satu aspek yang paling penting dari kompetensi berbahasa, baik bahasa Ibu mupun bahasa kedua maupun bahasa asing. Anda perlu mengetahui kata-kata dari suatu bahasa untuk dapat berkomunikasi menggunakannya. Bisa dikatakan bahwa hal ini menunjukkan bahwa memiliki kosa kata yang banyak dapat membantu pembelajar berbicara lebih banyak dan berdampak positif bagi orang lain.
Namun, riset terbaru berpendapat bahwa vocabulary size 2000 dianggap kurang cukup. Baru-baru ini, ahli vocabulary mengusulkan akuisisi sejumlah minimal 3000 kata. Riset terbaru menemukan bahwa non-penutur asli berpendidikan tinggi, penutur asli bahasa Inggris yang sedang belajar gelar lanjutan menggunakan media bahasa Inggris menunjukkan bahwa bahasa Inggris reseptif mereka sekitar sejumlah 6.000 hingga 7.000 untuk teks lisan dan 8.000 hingga 9.000 keluarga kata untuk pemahaman tanpa bantuan29.
Riset lainnya bertujuan untuk menganalisis vocabulary size dan tingkat penguasaan mahasiswa jurusan bahasa Inggris. Riset ini menggunakan desain riset deskriptif-kuantitatif. Subyek riset adalah mahasiswa semester pertama, ketiga, dan mahasiswa semester lima jurusan Bahasa Inggris. Tiga ratus sembilan belas siswa berpartisipasi dalam ini studi ini dan diberi VST berbasis Paper-Based Test untuk mengukur ukuran kosakata bahasa Inggris mereka. Temuan dari riset ini mengungkapkan bahwa siswa hanya tahu sekitar 1.366 keluarga kata. Hasilnya masih di bawah ambang batas, seperti yang disarankan oleh para ahli vocabulary.
Temuan juga menunjukkan bahwa peserta memiliki tingkat penguasaan vocabulary yang masih rendah. Hasil dari riset ini menyarankan bahwa riset masa depan diperlukan untuk fokus dalam menyelidiki pembelajaran kosa kata dan instruksional strategi yang efektif dalam mengembangkan kata-kata yang
28 Wilkins D. Linguistics in language teaching. London: Arnold; 1972.
29 Nation, I. How large a vocabulary is needed for reading and listening?. Canadian modern language review, 2006. 63(1), 59-82.
13
frekuensinya tinggi digunakan dalam komunikasi sehari-hari maupun kata-kata akademik di perkuliahan.30
Sangatlah penting untuk melakukan VST untuk mengetahui apakah mereka memiliki cukup vocabulary untuk dapat tampil dalam bahasa Inggris tanpa dukungan eksternal terutama untuk kalangan akademisi. Selama ini di berbagai tempat VST diselanggarakan secara manual/klasik yang biasa dikenal sebagai Paper Based Test. Paper Based Test (PBT) yang selama ini dinilai kurang efektif dan efesien, banyak masalah/kendala pada saat penyiapan sampai dengan distribusi soal tes, perlu scanning LJK dan scoring sehingga membutuhkan biaya, tenaga dan waktu yang ekstra. Namun perkembangan teknologi saat ini sangatlah pesat sehingga memungkinkan melakukan tes secara modern dengan menggunakan yang selanjutnya disebut sebagai tes terkomputerisasi.
Namun dalam penerapannya tidak sedikit tes terkomputerisasi yang memiliki prinsip kerja yang serupa dengan PBT yang dikenal sebagai Computer Based Test (CBT). Prinsip kerja CBT adalah komputer menyediakan sejumlah soal yang sudah ditentukan oleh penguji, kemudian soal tersebut dijawab oleh peserta tes dan hasil kerja peserta tes tersebut dihitung oleh komputer berapa jumlah benar/salahnya. Dari informasi jawaban benar/salah tersebut dapat estimasi kemampuan peserta tes. Dibandingkan PBT tentu saja CBT memiliki keunggulan dari segi waktu dan tenaga, namun dari CBT masih didapatkan informasi yang tidak optimal karena desain tesnya masih sama untuk semua peserta tes (tidak bisa menyesuaikan soal tes dengan kemampuan peserta tes).
Untuk mengatasi hal tersebut lahirlah Computerized-Adapative Testing.
Computerized-Adapative Testing adalah perkembangan dari CBT. Computerized- Adapative Testing (CAT) memiliki kelebihan untuk menyesuaikan item soal tes yang diberikan dengan kemampuan peserta tes. Selain itu kelebihan CAT adalah, tes akan berhenti jika estimasi kemampuan peserta tes sudah dapat diketahui
30 Kirana, D. P. and Basthomi, Y. (2020). Vocabulary Size among Different Levels of University Students. Universal Journal of Educational Research, 8(10), 4357-4364. DOI:
10.13189/ujer.2020.081001.
14
sehingga waktu lebih efesien dan lebih efektif, berbeda halnya dengan CBT yang jumlah waktu pengerjaan tes dan jumlah soal sudah ditentukan sebelumnya.
Kemampuan peserta tes dapat diestimasi dengan Item Response Theory (IRT).
Demikian halnya dengan estimasi parameter item/butir soal. Besarnya hasil estimasi parameter item/butir soal inilah yang nantinya akan dibandingkan dengan kemampuan peserta tes.
Dengan bantuan CAT penguji akan dapat mengetahui gambaran penguasaan vocabulary yang sebenarnya dari peserta tes dalam waktu yang cukup singkat. Estimasi kemampuan peserta tes ini diukur melalui CAT berbasis IRT berdasarkan pola jawabannya. Tes terkomputerisasi untuk mengukur english vocabulary size dengan model logistik dalam IRT ini dapat memberikan gambaran alternatif sebagai sistem evaluasi modern.
15
BAGIAN 4 COMPUTERIZED-ADAPATIVE TESTING
(CAT)
Computerized-Adapative Test (CAT) atau dalam Bahasa Indonesia disebut sebagai Tes Adaptif Terkomputerisasi. Menurut kamus Inggris – Indonesia, adaptive adalah kata sifat yang berarti dapat menyesuaikan diri dengan keadaan31. Menurut kamus besar Bahasa Indonesia, adaptif berarti mudah untuk menyesuaikan diri sesuai dengan keadaan dan keperluan32. Berdasarkan definisi tersebut, maka adaptif disini adalah kemampuan perangkat untuk menyesuaikan diri dengan keadaan dan keperluan tertentu sesuai dengan yang diprogramkan.
Kemampuan tersebut berarti kemampuan perangkat untuk menyesuaikan diri dalam memilih item/butir soal yang sesuai dengan kemampuan dari peserta tes berdasarkan respon jawaban dari peserta tes sebelumnya yang dianalisis dengan Item Response Theory (IRT). Jika peserta tes dapat mengerjakan item/butir soal dengan tingkat kesulitan sedang maka dalam CAT, peserta tes tersebut selanjutnya akan diberikan item/butir soal dengan tingkat kesulitasn lebih tinggi. Sebaliknya jika peserta tes tidak dapat mengerjakan item/butir soal dengan tingkat kesulitan sedang, peserta tes tersebut selanjutnya akan diberikan item/butir soal dengan tingkat kesulitan lebih rendah.
Apabila dibandingkan dengan tes pilihan ganda yang statis yang menggunakan seperangkat tes dengan item/butir soal yang tetap untuk semua peserta tes, CAT membutuhkan item/butir soal yang lebih sedikit sekitar 50%
untuk sampai bisa melakukan estimasi kemampuan peserta tes namun dengan
31 Echols, John M, and Hasan Shadily. "Kamus Inggris Indonesia." 2019.
32 Pena, Tim Prima. "Kamus Besar Bahasa Indonesia Edisi Terbaru." Gita Media Press, 2012.
16
tingkat akurasi yang lebih tinggi. Hal tersebut senada dengan pendapat Hambleton, Swaminathan dan Rogers, tes dengan Panjang item/butir soal statis (fixed) tidak akan efesien jika diberikan kepada semua peserta tes dengan kemampuan yang bervariasi, karena cukup untuk diberikan beberapa item/butir soal sesuai dengan tingkat kemampuannya33. Hal ini berarti panjang tes dapat dipendekkan tanpa kehilangan tes yang presisi, jika item/butir soal yang disiapkan sesuai dengan kemampuan peserta tes. Oleh karena itu penting untuk mengetahui informasi kemampuan peserta tes secara lengkap, sehingga masing-masing peserta tes memperoleh soal sesuai dengan kemampuannya. Dalam CAT, item/butir soal dipilih dari bank soal yang dikembangkan berdasarkan aturan pemilihan item/butir soal tes yang ditetapkan sebelumnya.
Adapun tahapan iterasi algoritma dasar CAT adalah :
1. Bank soal yang tersedia mencari item/butir soal yang paling sesuai dengan dengan kemampuan peserta tes. Item/butir soal yang terpilih ditampilkan kepada peserta tes untuk dijawab sehingga didapatkan jawaban benar atau salah.
2. Kemampuan peserta tes diperbarui, berdasarkan jawaban pada tahap 1 3. Langkah pada tahap 1 sampai 2 terus diulang sampai dengan kriteria
stopping rule terpenuhi.
Kemampuan peserta tes belum dapat diketahui sampai dengan peserta tes tersebut menjawab item/butir soal nomor 1. Pada algoritma ini item/butir soal yang pertama kali ditampilkan adalah item/butir soal dengan tingkat kesulitan sedang.
Setiap peserta tes diberi item/butir soal yang berbeda. Perkembangan dalam ilmu psikometri memungkinkan algoritma ini dapat terealisasi dengan menggunakan Item Response Theory (IRT).
33 Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
17
BAGIAN 5 ITEM RESPONSE THEORY (IRT)
Dalam Teori Tes Klasik atau yang dikenal sebagai Classical Test Theory (CTT), kemampuan peserta tes dapat didefinisikan setara dengan skor total yang didapatkannya. Dalam CTT, tingkat kesulitan adalah proporsi dari peserta tes dalam menjawab benar (pada suatu sampel peserta tes tertentu). Definisi ini menjelaskan bahwa tingkat kesulitan butir/item soal tergantung pada peserta tes yang dikenai item/butir soal tersebut. Sebaliknya, kemampuan peserta tes tergantung dari apakah item/butir soal tersebut tinggi atau rendah. Jika tingkat kesulitan rendah, maka hasil estimasi kemampuan peserta tes akan tinggi dan sebaliknya. Nilai daya beda, validitas, dan juga reliabilitas dari skor tes, tergantung pada sampel peserta tes yang dikenai item/butir soal tersebut. Penerapan CTT untuk analisis kualitas butir soal memang tergolong relatif mudah, akan tetapi memiliki beberapa kelemahan. Adapun kelemahan utamanya adalah keterikatan CTT pada sampel. Dalam suatu proses pembelajaran, penerapan CTT ini akan menimbulkan berbagai masalah, terutama dalam melihat kemampuan peserta tes secara individu. Oleh karena respon dari tiap peserta tes terhadap item/butir soal tidak dapat dijelaskan oleh CTT, maka lahirlah Teori Tes Modern yang disebut sebagai Item Response Theory (IRT). Model IRT mempunyai kelebihan, yaitu dapat menjelaskan respon setiap peserta tes terhadap item/butir soal. Model IRT adalah suatu alternatif yang bisa digunakan dalam analisis kualitas item/butir soal, sebagai usaha untuk membebaskan alat ukur dari keterikatannya terhadap sampel.
Berdasarkan model matematis IRT, dapat diketahui bahwa bahwa peluang peserta tes untuk menjawab benar tergantung pada kemampuan peserta tes dan karakteristik item/butir soalnya. Hal ini menunjukkan bahwa, peserta tes yang mempunyai kemampuan tinggi akan memiliki peluang menjawab benar lebih besar daripada peserta tes yang mempunyai kemampuan rendah. Model IRT
18
berbeda dengan CTT, berikut adalah perbedaan karakteristiknya: (i) IRT mempunyai asumsi yang kompleks; (ii) IRT lebih memperhatikan item/butir sebagai independen dibandingkan tes secara utuh; (iii) IRT lebih memperhatikan hasil ujian individu dibandingkan hasil ujian kelompok; (iv) IRT juga mempertimbangkan berbagai skala/metrik di luar jumlah benar (raw score); (v) IRT mempunyai prediksi dan jangkauan yang mendalam; dan (vi) pada model IRT penting untuk melakukan uji asumsi dan uji akurasi dari hasil peramalan model.343536 Menurut dan ada 3 asumsi yang harus dipenuhi pada model IRT yaitu, asumsi unidimensi, asumsi independensi lokal, dan asumsi invariansi parameter.
Unidimensi berarti setiap item/butir soal hanya mengukur satu kemampuan saja. Contohnya, pada tes statistika, item/butir yang ada dalam tes tersebut hanyalah mengukur kemampuan peserta tes dalam tes statistika saja, bukan kemampuan peserta tes dalam bidang lain. Pada kenyataannya, asumsi unidimensi ini sangat sulit dipenuhi karena ada faktor-faktor lainnya yang dapat mempengaruhi pelaksanaan tes. Oleh karena itu, asumsi unidimensi ini sudah cukup ditunjukkan oleh tes yang mengandung satu komponen dominan saja yang mengukur kemampuan peserta tes.
Independensi lokal terjadi jika jawaban dari peserta terhadap satu item/butir soal tidak mempengaruhi jawaban terhadap butir soal lainnya. Uji asumsi independensi lokal dapat dipenuhi jika peluang peserta tes bisa menjawab benar item/butir soal ke-1 sampai dengan item/butir soal ke-i sama dengan hasil kali peluang peserta tes menjawab benar pada setiap item/butir soalnya.
34 Brennan, Robert L. Educational Measurement. Santa Barbara: Greenwood Publishing Group, 2006.
35 ———. Item Response Theory: Principles and Applications. New York: Springer Science & Business Media, 2013.
36 Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
19
Invariansi parameter berarti kemampuan pesertas tes tidak akan berubah hanya dikarenakan peserta tes tersebut mengerjakan item/butir yang berbeda dengan tingkat kesulitannya. Item parameter tidak akan berubah hanya karena diteskan kepada kelompok peserta tes yang berbeda tingkat kemampuannya.
Invariansi parameter kemampuan dapat diketahui dengan melakukan pengujian pada dua perangkat tes atau lebih, yang mempunyai tingkat kesulitan berbeda pada sekelompok peserta tes, dan apabila hasil estimasi kemampuan peserta tes tidak berubah walaupun tes yang diberikan berbeda tingkat kesulitannya, maka invariansi parameter kemampuan terbukti37.
Model IRT dikembangkan oleh para ahli pengukuran untuk meminimalkan kelemahan pada CTT. Dalam IRT, mendapatkan model yang tepat adalah hal penting, karena model yang fit akan dapat mengungkapkan keadaan yang sebenarnya. Berdasarkan jumlah item parameter-nya, secara umum model IRT yang populer digunakan adalah, Model Logistik 1 Parameter (1 Parameter Logistic Model/ Model 1PL), Model Logistik 2 Parameter (2 Parameter Logistic Model/ Model 2PL) dan Model Logistik 3 Parameter (3 Parameter Logistic Model/
Model 3PL).
Parameter utama dalam IRT adalah kemampuan peserta tes yang disimbolkan dengan theta (ϴ) atau yang dikenal sebagai person parameter.
Besarnya ϴ tidak terbatas, terbentang pada range -sampai , namun besarnya ϴ berada dalam suatu range baku dalam distribusi normal -4 sampai dengan 438. Selain ϴ, parameter lainnya yang juga merupakan ukuran kebaikan suatu item adalah item parameter yang terdiri dari tingkat kesulitan, daya beda dan pseudo guessing
Pada Model 1PL, tingkat kesulitan soal yang disimbolkan sebagai b adalah suatu titik pada skala kemampuan agar peserta tes mempunyai peluang menjawab
37 Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
38 Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
20
benar sebesar 0,5 pada item/butir tertentu. Misalkan suatu item/butir soal mempunyai b = 2, maka dibutuhkan kemampuan pesertas tes minimal 2 untuk dapat menjawab benar dengan peluang 0,5. Semakin besar nilai b maka kemampuan peserta tes yang diperlukan untuk dapat menjawab benar dengan peluang 0,5 juga semakin besar. Besarnya b berada pada range -sampai dengan
, tapi besarnya nilai b masuk kategori baik jika berada pada range -2 sampai dengan 2 39. Berikut ini adalah peluang kemampuan menjawab benar pada Model 1PL.40
) exp(
1
) ) exp(
, 1
( i bj
bj j i
i b xij
P + −
= −
=
(1)
Hubungan antara peluang peserta tes menjawab benar dengan item parameter pada IRT dapat dilihat pada ICC. Dengan melihat ICC dapat diketahui bahwa perubahan Ɵ dapat mempengaruhi pergeseran peluang peserta tes menjawab benar. Gambar 1 berikut ini adalah contoh ICC dengan 10 item/butir untuk Model 1PL.41 Berdasarakan Gambar 1 tersebut dapat diketahui bahwa bentuk ICC monoton naik, dimana peluang peserta tes menjawab benarnya tidak akan pernah sama dengan 1, hanya mendekati 1.
39 Hambleton, Ronald K, and Hariharan Swaminathan. Item Response Theory. Boston, MA: Kluwer Inc., 1985.
40 Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
41Wulansari, A. D. "Analisis Butir Soal Dikotomus Dengan Menggunakan Program R."
(2017).
21
Coefficients:
Dffclt
item1 -0.152 item2 -1.306 item3 -0.446 item4 -1.762 item5 -0.486 item6 -0.551 item7 -0.727 item8 -0.490 item9 0.167 item10 -1.494
Gambar 1. ICC untuk Model Logistik 1 Parameter
Pada Model 2PL selain melibatkan parameter tingkat kesulitan soal (b) seperti halnya Model 1PL, juga melibatkan parameter daya beda (a). besarnya nilai a menggambarkan kemiringan (slope) dari ICC di titik b pada skala kemampuan tertentu. Parameter a berfungsi untuk mendeteksi mampu atau tidaknya suatu item/butir soal membedakan suatu kelompok dalam aspek yang diukur (sesuai dengan perbedaan yang ada dalam kelompok tersebut). Besarnya nilai a terbentang dari range -sampai dengan , namun besarnya nilai a dapat dikategorikan baik jika berada pada rentang 0 sampai 2.42 Berikut adalah peluang kemampuan menjawab benar pada Model 1PL jika ditambahkan parameter a yang menunjukkan arah kemiringan pada ogive normal menurut.43
42 Hambleton, Ronald K, and Hariharan Swaminathan. Item Response Theory. Boston, MA: Kluwer Inc., 1985.
43 Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
22 )) (
exp(
1
)) (
) exp(
, , 1
( aj i bj
bj i aj aj
bj i xij
P + −
= −
=
(2)
Coefficients:
Dffclt Dscrm
item1 -0.257 0.690 item2 -1.404 1.303 item3 -0.393 2.184 item4 -1.404 2.471 item5 -0.407 2.653 item6 -0.484 2.156 item7 -0.626 2.214 item8 -0.714 0.831 item9 0.201 1.031 item10 -1.383 1.722
Gambar 2. ICC untuk Model Logistik 2 Parameter
Gambar 2 adalah contoh ICC dengan 10 butir soal untuk Model 2PL.44 Dari Gambar 2 tersebut dapat dilihat bahwa semakin besar kemiringan atau slope nya maka semakin besar pula nilai a nya.45 Efek ditambahkan parameter a pada model IRT ditunjukkan oleh bentuk slope atau kemiringan garis lengkung ICC. Bentuk slope pada ICC menunjukkan perbedaan antara Model 1PL dengan Model 2PL.
Asimtot pada ICC dari Model 2PL untuk ϴ → -∞ adalah 0, jika asimtotnya tidak sama dengan 0, maka nilai tersebut adalah adalah pseudo guessing (c). Dengan adanya tambahan parameter c maka akan menjadi Model 3PL.
44 Wulansari, A. D. "Analisis Butir Soal Dikotomus Dengan Menggunakan Program R."
(2017).
45 Retnawati, Heri. Teori Respon Butir Dan Penerapannya. Yogyakarta: Nuha Medika, 2014.
23
Model 3PL selain melibatkan parameter tingkat kesulitan soal (b), daya beda (a), seperti halnya model 2PL, juga melibatkan pseudo guessing (c).
Parameter c menunjukkan peluang peserta tes dengan kemampuan rendah untuk bisa menjawab dengan benar item/butir soal yang mempunyai tingkat kesulitan diatas kemampuannya.46 Besarnya nilai c terbentang dari range 0 sampai dengan 1. Nilai parameter c dapat dikategorikan baik jika nilai c < 1/k.47 Berikut ini adalah peluang kemampuan menjawab benar untuk Model 3PL.48
)) (
exp(
1
)) (
) exp(
1 ( )
, , , 1
( aj i bj
bj i aj cj
cj cj aj bj i xij
P + −
− − +
=
=
(3)
Coefficients:
Gussng Dffclt Dscrm
item1 0.003 -0.240 0.700 item2 0.503 -0.320 2.355 item3 0.111 -0.193 2.895 item4 0.356 -0.927 4.135 item5 0.018 -0.353 2.765 item6 0.145 -0.232 2.938 item7 0.252 -0.201 4.189 item8 0.007 -0.679 0.853 item9 0.172 0.580 1.654 item10 0.412 -0.694 2.626
Gambar 3. ICC untuk Model Logistik 3 Parameter
46Retnawati, Heri. Teori Respon Butir Dan Penerapannya. Yogyakarta: Nuha Medika, 2014.
47 Hulin, Charles Lee, Fritz Drasgow, and Charles K Parsons. Item Response Theory:
Application to Psychological Measurement. Homewood: Dorsey Press, 1983.
48Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
24
Gambar 3 adalah contoh ICC dengan 10 butir soal untuk Model 3PL.49 Gambar 3 menunjukkan asimtot untuk ϴ → -∞ tidak sama dengan 0. Parameter c dapat membuat kemungkinan asimtot bawah tidak sama dengan 0 atau nonzero lower asymptote. Efek ditambahkan parameter c pada model IRT ini ditunjukkan oleh bentuk lower asymptote, sehingga bentuk asimstot tersebut menunjukkan perbedaan antara Model 1PL, Model 2PL dan Model 3PL.
Menurut ukuran sampel dapat membuat estimasi parameter semakin stabil.50 Estimasi parameter kemampuan berukuran sampel besar dapat dilakukan dengan menggunakan Maximum Likelihood Estimation (MLE). Dengan menggunakan hasil estimasi parameter yang dihasilkan, besarnya sumbangan item/butir dalam menunjukkan latent trait (yang ingin diukur dari suatu tes) dapat dijelaskan.
Nilai Fungsi Informasi/NFI I(ϴ) item/butir dihitung untuk mengetahui informasi item/butir soal mana yang sebenarnya cocok dengan model, sehingga dapat membantu seleksi butir pada bank soal.51 Secara matematis, I(ϴ) dapat dijelaskan sebagai jumlah dari fungsi informasi butir soal Ii(ϴ).52
=
= n i Ii I
1 ) ( )
(
(4)
49Wulansari, A. D. "Analisis Butir Soal Dikotomus Dengan Menggunakan Program R."
(2017).
50Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
51Retnawati, Heri. Teori Respon Butir Dan Penerapannya. Yogyakarta: Nuha Medika, 2014.
52Hambleton, Ronald K, and Hariharan Swaminathan. Item Response Theory. Boston, MA: Kluwer Inc., 1985.
25 dengan
exp(1,7 ( ))
1 exp( 1,7 ( ))
21 ) 2( 89 , ) 2
(
bi ai bi
ai c
ci ai Ii
−
− +
− +
= −
Pengukuran hasil estimasi parameter pada model IRT bersifat probabilistik karena merupakan hasil estimasi. Begitu juga halnya dengan I(ϴ) yang dihasilkan juga tidak mungkin lepas dari kesalahan pengukuran yang dikenal sebagai Standard Error of Mesurement (SEM). Hubungan NFI dengan SEM berbanding terbalik kuadratik, secara matematis hubungan tersebut dapat ditulis menjadi:53
) ( ) 1 (ˆ
SEM = I
(5)
53 Hambleton, Ronald K, Hariharan Swaminathan, and H Jane Rogers. Fundamentals of Item Response Theory. Vol. 2, Newbury Park, CA: Sage Publication Inc., 1991.
26
BAGIAN 6 KARAKTERISTIK BUTIR SOAL
VOCABULARY TEST
Untuk membangun atau mengembangkan CAT, dalam prosesnya, pada bank soal program CAT perlu di entry-kan butir-butir soal vocabulary yang sudah diestimasi tingkat kesulitannya dari PBT dengan menggunakan Program R 4.2.1.
Oleh karena itu analisis karakteristik butir soal diperlukan pada tahapan awal pengembangan program CAT. Pengembangan CAT menggunakan Model Logistik 1 Parameter. Oleh karena itu nalisis karakteristik butir soal disini dilakukan dengan melihat tingkat kesulitan butir soal. Model Logistik 1 Parameter (1PL) hanya memiliki satu item parameter yaitu tingkat kesulitan butir soal. Berdasarkan teori Model 1PL, butir soal dikatakan baik jika tingkat kesulitan butir soalnya berada diantara -2 sampai dengan 2 (mudah sampai dengan sulit). Dalam hal ini VST terbagi menjadi 2 paket soal yaitu Soal A yang dikerjakan oleh 135 peserta tes dan Soal B yang dikerjakan oleh 127 peserta tes. Berikut ini adalah tingkat kesulitan soal dari masing-masing paket, dimana pada masing-masing paket ada 100 butir soal vocabulary yang seluruhnya nanti entry-kan dalam bank soal CAT.
Tingkat Kesulitan Butir Soal Paket A
Call:
rasch(data = SOAL_A) Coefficients:
Dffclt.I1 Dffclt.I2 Dffclt.I3 Dffclt.I4 Dffclt.I5 -4.628 -5.790 -2.703 3.637 -4.425 Dffclt.I6 Dffclt.I7 Dffclt.I8 Dffclt.I9 Dffclt.I10 -4.424 -0.261 -1.948 -1.817 -1.272
27
Dffclt.I11 Dffclt.I12 Dffclt.I13 Dffclt.I14 Dffclt.I15 -2.882 -2.792 0.924 -0.832 0.831 Dffclt.I16 Dffclt.I17 Dffclt.I18 Dffclt.I19 Dffclt.I20 -0.518 0.777 -1.506 -0.644 0.563 Dffclt.I21 Dffclt.I22 Dffclt.I23 Dffclt.I24 Dffclt.I25 -0.886 -2.228 0.669 1.719 1.527 Dffclt.I26 Dffclt.I27 Dffclt.I28 Dffclt.I29 Dffclt.I30 0.723 0.669 -3.776 -0.518 -3.920 Dffclt.I31 Dffclt.I32 Dffclt.I33 Dffclt.I34 Dffclt.I35 1.284 -1.447 -2.228 0.669 1.167 Dffclt.I36 Dffclt.I37 Dffclt.I38 Dffclt.I39 Dffclt.I40 0.682 -0.159 2.134 4.472 -3.398 Dffclt.I41 Dffclt.I42 Dffclt.I43 Dffclt.I44 Dffclt.I45 -2.791 -0.994 0.777 0.669 -2.358 Dffclt.I46 Dffclt.I47 Dffclt.I48 Dffclt.I49 Dffclt.I50 2.884 1.053 1.167 0.563 -0.159 Dffclt.I51 Dffclt.I52 Dffclt.I53 Dffclt.I54 Dffclt.I55 0.354 1.225 3.085 0.865 -4.426 Dffclt.I56 Dffclt.I57 Dffclt.I58 Dffclt.I59 Dffclt.I60 -0.108 -2.883 1.110 1.390 1.404 Dffclt.I61 Dffclt.I62 Dffclt.I63 Dffclt.I64 Dffclt.I65 3.191 1.225 -1.689 -0.466 3.191 Dffclt.I66 Dffclt.I67 Dffclt.I68 Dffclt.I69 Dffclt.I70 1.920 0.723 1.465 0.777 -0.779 Dffclt.I71 Dffclt.I72 Dffclt.I73 Dffclt.I74 Dffclt.I75 -0.210 0.251 0.886 2.285 1.465
Dffclt.I76 Dffclt.I77 Dffclt.I78 Dffclt.I79 Dffclt.I80 0.046 0.510 0.760 1.404 0.251
28
Dffclt.I81 Dffclt.I82 Dffclt.I83 Dffclt.I84 Dffclt.I85 1.990 2.526 -0.159 0.831 1.774 Dffclt.I86 Dffclt.I87 Dffclt.I88 Dffclt.I89 Dffclt.I90 0.941 1.527 2.285 0.251 1.990 Dffclt.I91 Dffclt.I92 Dffclt.I93 Dffclt.I94 Dffclt.I95 0.616 0.199 -1.049 -3.399 1.053 Dffclt.I96 Dffclt.I97 Dffclt.I98 Dffclt.I99 Dffclt.I100 0.428 -0.415 0.563 1.404 1.284 Dscrmn
0.631
Log.Lik: -7465.42
Berdasarkan output diatas dapat diketahui bahwa, tingkat kesulitan (difficuty) butir soal paket A pada berada pada rentang –5,790 sampai dengan 4,472 sehingga tingkat kesulitan butir soal (b) dapat dikategorikan antara sangat mudah menuju sangat sulit, nilai ini sesuai dengan tingkat kemampuan peserta tes yang beraneka ragam dari rentah kemampuan rendah sampai tinggi. Untuk nilai log likelihood-nya adalah -7465,42, sehingga dapat disimpulkan bahwa kemampuan vocabulary peserta tes tersebut dapat cocok jika menggunakan model 1PL.
29
Gambar 5. ICC Soal Paket A
Berdasarkan gambar kurva diatas, dapat diketahui bahwa item nomor 2 adalah item yang paling mudah dan item nomor 39 adalah item paling sulit dengan penjelasan seperti ini : jika dilihat, orang dengan kemampuan 0 pada saat mengerjakan item 39 (item paling kanan pada posisi kurva), probabilitas menjawab benarnya paling kecil diantara item lainnya yaitu mendekati 0,0 sedangkan apabila orang tersebut mengerjakan item nomor 2 (item paling kiri pada posisi kurva), maka probabilitas menjawab benarnya paling besar diantara item lainnya yaitu mendekati 1,0. Sehingga dapat disimpulkan bahwa, pada ICC model 1PL diatas, semakin kekanan tingkat kesulitan item soal semakin rendah dan semakin kekiri tingkat kesulitan soal semakin tinggi.
Tingkat Kesulitan Butir Soal Paket B
Call:
rasch(data = SOAL_B)
Coefficients:
Dffclt.I1 Dffclt.I2 Dffclt.I3 Dffclt.I4 Dffclt.I5 -3.441 -0.465 -3.772 -4.857 -2.472
30
Dffclt.I6 Dffclt.I7 Dffclt.I8 Dffclt.I9 Dffclt.I10 -0.508 -3.169 -0.379 -0.250 -4.856 Dffclt.I11 Dffclt.I12 Dffclt.I13 Dffclt.I14 Dffclt.I15 0.313 0.679 -0.337 0.449 -2.471 Dffclt.I16 Dffclt.I17 Dffclt.I18 Dffclt.I19 Dffclt.I20 -0.774 -1.342 -2.315 -4.211 -1.344 Dffclt.I21 Dffclt.I22 Dffclt.I23 Dffclt.I24 Dffclt.I25 0.051 1.290 0.138 -1.966 -3.773 Dffclt.I26 Dffclt.I27 Dffclt.I28 Dffclt.I29 Dffclt.I30 -1.499 -1.193 0.972 -0.285 1.347 Dffclt.I31 Dffclt.I32 Dffclt.I33 Dffclt.I34 Dffclt.I35 1.180 0.314 -1.653 -0.422 0.921 Dffclt.I36 Dffclt.I37 Dffclt.I38 Dffclt.I39 Dffclt.I40 -1.242 -0.293 0.095 1.347 0.727 Dffclt.I41 Dffclt.I42 Dffclt.I43 Dffclt.I44 Dffclt.I45 -1.292 -3.171 -0.595 -3.972 0.540 Dffclt.I46 Dffclt.I47 Dffclt.I48 Dffclt.I49 Dffclt.I50 -1.764 0.226 -0.509 -0.553 -1.446 Dffclt.I51 Dffclt.I52 Dffclt.I53 Dffclt.I54 Dffclt.I55 0.492 -1.242 0.138 0.181 1.180 Dffclt.I56 Dffclt.I57 Dffclt.I58 Dffclt.I59 Dffclt.I60 -2.551 0.270 0.726 0.540 0.494 Dffclt.I61 Dffclt.I62 Dffclt.I63 Dffclt.I64 Dffclt.I65 1.520 -0.293 0.095 0.632 0.403 Dffclt.I66 Dffclt.I67 Dffclt.I68 Dffclt.I69 Dffclt.I70 0.774 1.223 0.774 -0.035 1.583 Dffclt.I71 Dffclt.I72 Dffclt.I73 Dffclt.I74 Dffclt.I75 0.774 -0.163 -0.006 0.727 1.779
31
Dffclt.I76 Dffclt.I77 Dffclt.I78 Dffclt.I79 Dffclt.I80 0.494 -2.937 0.679 -1.194 1.713 Dffclt.I81 Dffclt.I82 Dffclt.I83 Dffclt.I84 Dffclt.I85 -0.818 1.903 0.449 1.127 1.180 Dffclt.I86 Dffclt.I87 Dffclt.I88 Dffclt.I89 Dffclt.I90 0.586 1.404 0.449 -1.664 0.972 Dffclt.I91 Dffclt.I92 Dffclt.I93 Dffclt.I94 Dffclt.I95 0.774 1.647 -0.379 1.074 0.403 Dffclt.I96 Dffclt.I97 Dffclt.I98 Dffclt.I99 Dffclt.I100 2.141 0.632 1.127 -0.336 -0.035
Dscrmn 0.824
Log.Lik: -6929.759
Berdasarkan output diatas dapat diketahui bahwa, tingkat kesulitan (difficuty) butir soal paket A pada berada pada rentang –4,857sampai dengan 2,141 sehingga tingkat kesulitan butir soal (b) dapat dikategorikan antara sangat mudah menuju sulit, nilai ini sesuai dengan tingkat kemampuan peserta tes yang beraneka ragam dari rendah kemampuan rendah sampai tinggi. Untuk nilai log likelihood- nya adalah -6929,759, sehingga dapat disimpulkan bahwa kemampuan vocabulary peserta tes tersebut dapat cocok jika menggunakan model 1PL.
32
Gambar 6. ICC Soal B
Berdasarkan gambar kurva diatas, dapat diketahui bahwa item nomor 4 adalah item yang paling mudah dan item nomor 96 adalah item paling sulit dengan penjelasan seperti ini : jika dilihat, orang dengan kemampuan 0 pada saat mengerjakan item 96 (item paling kanan pada posisi kurva), probabilitas menjawab benarnya paling kecil diantara item lainnya yaitu mendekati 0,0 sedangkan apabila orang tersebut mengerjakan item nomor 4 (item paling kiri pada posisi kurva), maka probabilitas menjawab benarnya paling besar diantara item lainnya yaitu mendekati 1,0. Sehingga dapat disimpulkan bahwa, pada ICC model 1PL diatas, semakin kekanan tingkat kesulitan item soal semakin rendah dan semakin kekiri tingkat kesulitan soal semakin tinggi.
33
BAGIAN 7 PENGEMBANGAN COMPUTERIZED- ADAPTIVE TESTING UNTUK MENGUKUR
ENGLISH VOCABULARY SIZE
Sangatlah penting untuk melakukan Vacobulary Size Test (VST) untuk mengetahui kecukupan vocabulary untuk dapat tampil dalam bahasa Inggris tanpa dukungan eksternal terutama untuk kalangan akademisi. Selama ini di berbagai tempat VST diselanggarakan secara manual/klasik yang biasa dikenal sebagai Paper Based Test (PBT). Paper Based Test yang diselenggarakan di berbagai tempat selama ini dinilai kurang efektif dan efesien, banyak masalah/kendala pada saat penyiapan sampai dengan distribusi soal tes, perlu scanning LJK dan scoring sehingga membutuhkan biaya, tenaga dan waktu yang ekstra. Namun perkembangan teknologi saat ini sangatlah pesat sehingga memungkinkan melakukan tes secara modern dengan menggunakan yang selanjutnya disebut sebagai tes terkomputerisasi. Namun dalam penerapannya tidak sedikit tes terkomputerisasi yang memiliki prinsip kerja yang serupa dengan PBT yang dikenal sebagai Computer Based Test (CBT). Untuk mengatasi hal tersebut lahirlah Computerized-Adapative Testing.
Computerized-Adapative Testing adalah perkembangan dari CBT.
Computerized-Adapative Testing (CAT) memiliki kelebihan untuk menyesuaikan item soal tes yang diberikan dengan kemampuan peserta tes. Selain itu kelebihan CAT adalah, tes akan berhenti jika estimasi kemampuan peserta tes sudah dapat diketahui (Standar Error/ SE mendekati 0,01) sehingga waktu lebih efesien dan lebih efektif Dengan bantuan CAT penguji akan dapat mengetahui gambaran penguasaan vocabulary yang sebenarnya dari peserta tes dalam waktu yang cukup singkat. Selain itu, lahirnya tes terkomputerisasi khususnya CAT untuk mengukur