• Tidak ada hasil yang ditemukan

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

B. Hasil Penelitian

2. Hasil Analisis Tes

Tes BVA IIIA1 dianalisis berdasarkan parameter itemnya, yaitu parameter ambang dan daya diskriminasi, fungsi informasi item dan tesnya, serta reliabilitasnya. Berikut adalah hasilnya:

a) Parameter Ambang Item

Sebelum memilah – milah tes berdasarkan kategorinya, pertama – tama haruslah dilakukan penentuan kategori dan rentang skor yang masuk dalam kategori yang ada. Tingkatan trait dalam item characteristic curve

(ICC) disajikan dalam bentuk skor standard, dan skor yang tampak pada skala traitpada ICC adalah satuan standar deviasi (SD). Pembagian kategori tingkatan kesulitan item sendiri ditentukan oleh peneliti, karena tidak ada ketentuan baku dari kategorisasi itu. Dalam penelitian ini, skala tingkat trait

mudah, rata-rata, sulit, sangat sulit. Maka dari total 6 SD yang ada dibagi 5 kategori, terbetuklah rentang 1,2 SD. Dari hasil itu, maka rentang beserta kategori yang terbentuk adalah sbb: SD<1,8= sangat mudah, 1,8 <SD< -0,6=mudah, -0,6<SD<0,6=rata-rata, 0,6<SD<1,8= sulit, SD>1,8= sangat sulit.

Dari hasil estimasi parameter, pada tabel parameter item diketahui bahwa sebagian besar item (26 item) masuk dalam kategori rata – rata, item yang mudah terdiri dari 4 buah item, yaitu item 1, 3, 10, dan 49, serta tidak ada item yang masuk dalam kategori sangat mudah. Item yang sulit terdiri dari 16 buah item, yaitu item 4, 12, 13, 17, 24, 25, 28, 29, 31, 33, 34, 35, 43, 46, dan 50, sedangkan item yang sangat sulit terdiri dari 4 buah item, yaitu item 36, 39, 42, dan 47, dengan catatan 3 buah item berada di luar rentang skala, yaitu item 36 (b=4,278), item 42 (b=4,632), dan item 47 (b=12,476). Setelah estimasi skor tingkat kesulitan didapat, maka perlu diketahui juga kesalahan estimasi dari skor ini. Tolak ukur kesalahan estimasi skor parameter sendiri dapat dilihat pada tabel tersebut dalam bentuk standard error. Standard error adalah besaran variasi skor dari skor estimasi. Variasi yang dapat diterima dalam penelitian sendiri diputuskan dengan menggunakan uji t, dengan membandingkan skor t dengan tabel t. Skor t

didapatkan dengan membagi statistik (estimasi), dalam hal ini parameter b,

dengan standard errornya (Keppel & Wickens, 2004).sedangkan nilai tabel sendiri menggunakan taraf signifikansi 5% dengan derajat kebebasan co, karena sampel berjumlah 1200 subjek. Skor tabel yang dihasilkan yaitu 1,960. Dalam skala tingkat trait ini diterjemahkan sebagai rentang antara

-itu berskor positif maupun negatif tidaklah mempunyai skor varians kesalahan yang signifikan. Dari sini didapatkan bahwa terdapat 6 buah item yang mempunyai skorstandard error yang signifikan, yaitu item 2 (t=1,630), 6 (t= 1,048), 15 (t= -0,358), 23 (t= 1,105), 26 (t= -0,979), dan 37 (t= 1,520).

b) Parameter Diskriminasi Item

Parameter diskriminasi (a) menunjukkan kualitas item dalam membedakan antara kelompok yang mempunyai tingkattrait yang tinggi dan rendah. Secara visual, besarnya skor a terlihat dari kecuraman ICC, semakin curam ICC, maka semakin baik daya diskriminasinya. Penetapan kategori pada skor daya diskriminasi item mengikuti kategori yang dibuat oleh Baker (2001). Baker membagi kategori diskriminasi menjadi tujuh, yaitu tidak diskriminatif (0 ≤x>0.01), sangat rendah (0,01 ≤x>0,35), rendah (0,35 ≤x> 0,65), rata – rata (0,65 ≤x> 1,35), tinggi (1,35 ≤x> 1,7), sangat tinggi ( x > 1,7), dan sempurna (+ tak terhingga). Sedangkan skor negatif dalam skor diskriminasi tidak dimasukkan kedalam kategori apapun. Hal ini disebabkan karena skor negatif mengandung informasi yang ganjil serta berlawanan dengan tujuan tes. Skor negatif pada daya diskriminasi berarti bahwa semakin tinggi tingkat trait subjek, maka probabilitas menjawab item semakin berkurang. Munculnya skor negatif dalam tes mungkin disebabkan oleh kesalahan penulisan item, kesalahan penetapan respon, atau bias terhadap kelompok kemampuan tinggi (Baker,2001). Maka dari itu, item dengan skor negatif selalu dibuang, atau diperbaiki.

IIIA1 tidak terdapat item yang tidak diskriminatif, tiga buah item, yaitu item 2, 10, dan 47, masuk kedalam kategori sangat rendah, dan tiga buah item, yaitu item 15, 21, dan 33, masuk dalam kategori rendah. Sedangkan Item yang masuk dalam kategori tinggi berjumlah sebelas item, yaitu item 5, 9, 14, 24, 26, 29, 34, 37, 41, 44, 49, dan item yang kategori sangat tinggi berjumlah tujuh item, yaitu item 7, 13, 19, 31, 48, 43, dan 27. Sementara itu, sebagian besar item, 26 item, masuk kedalam kategori rata – rata.

Analisis kesalahan (error) estimasi pada skor parameter diskriminasi menggunakan uji t. Uji t dilakukan dengan membandingkan skor t dengan nilai tabel t. Apabila hasilnya signifikan (skor t < nilai tabel) berarti nilai estimasi mempunyai nilai kesalahan yang signifikan. Skor t dihasilkan dari nilai estimasi parameter dibagi dengan nilai standard error, sedangkan nilai tabel yangi menggunakan taraf signifikansi 5% dengan derajat kebebasan co (N= 1200) menghasilkan nilai 1,960. Dari ujitdiketahui bahwa tidak terdapat item yang mempunyai kesalahan estimasi yang signifikan.

c) Fungsi Informasi

Informasi merupakan indikator dari tingkat ketelitian pengukuran yang berbanding terbalik dengan varians skor. Maksudnya adalah semakin tinggi informasi, semakin kecil fluktuasi varians skor pada suatu skorability.

Secara visual nilai informasi suatu item terletak pada skor informasi di puncak kurva. Nilai tersebut berarti bahwa item yang sedang dianalisis mencapai puncak ketelitiannya disekitar titik di skala ability dimana kurva informasi mencapai puncaknya. Analisis terhadap informasi akan dilakukan

yaitu analisis informasi item secara individual, danTest Information function, yaitu analisis informasi tes secara keseluruhan.

1) Item Information Function

Tujuan dari informasi adalah melihat pada tingkat ability berapa sebuah item melakukan perhitungan yang paling rinci. Untuk tujuan itu pertama – tama skala dibagi menjadi beberapa bagian. Sama seperti pembagian skala ability sebelumnya, skala ability kali ini dibagi menjadi lima ketegori, yaitu SD <1,8 = sangat rendah, 1,8 <SD< 0,6 =rendah, -0,6 <SD< -0,6 =rata-rata, -0,6 <SD< 1,8 = tinggi, SD > 1,8 = sangat tinggi. Dari kategori di atas serta melihat pada hasil pada tabel hasil informasi item (lampiran), diketahui bahwa dari 50 item yang diperiksa terdapat 5 buah item, yaitu item 1, 3, 10, 11, dan 49, yang mempunyai ketelitian maksimal untuk tingkat ability yang sangat rendah. 15 buah item, yaitu item 4, 12, 13, 17, 24, 25, 28, 29, 31, 33, 34, 35, 43, 46, dan 50, yang teliti untuk tingkatabilityyang tinggi, 5 item, yaitu item 21, 36, 39, 42, dan 47, yang teliti untuk item yang sangat tinggi. Sementara itu 25 item sisanya sangat teliti pada tingkatabilityyang rata – rata.

Dalam konteks informasi item tidak ada standard khusus dalam pengkategorian nilai informasi item. Berbeda dengan pembagian kategorisasi lainnya yang didasarkan oleh standar deviasi, kali ini kategorisasi hanya didasarkan atas dasar kualitatif kebermaknaan suatu nilai. Hal ini disebabkan karena skor informasi item tidak mempunyai nilai standard karena skor ini bergantung sepenuhnya pada skor diskriminasi item. Melalui pemahaman itu kategori ini hanya ditujukan untuk

mutlak. Maka dalam penelitian ini informasi dibagi menjadi tiga kategori, yaitu sangat rendah (I≤ 0,1), Baik ( 0,1 > I < 0,8), dan sangat baik ( I≥

0,8). Melalui kategori itu diketahui bahwa terdapat enam buah item yang mempunyai informasi yang sangat rendah , yaitu item 2 (I=0,0222), 10 (I= 0,0172), 15 (I= 0,0510), 21 (I= 0,0865), 33 (I= 0,0648), dan 47 ( I= 0,0103). Item yang mempunyai informasi yang sangat baik adalah item 27 (I= 0,8467) dan item 43 (I= 0,8788). Sementara itu, sisanya (42 item) masuk dalam kategori baik.

2) Test Information Function(TIF)

Skor informasi secara individual biasanya sangatlah kecil. Pengetahuan mengenai skor ini akan lebih berarti apabila skor tersebut dihasilkan dari penjumlahan keseluruhan informasi item (informasi tes). Skor informasi tes yang baik setidaknya sebesar 10 (Hembleton, 2004). Hasil dari TIF Tes BVA IIIA1 sendiri adalah 14,91. Berpegang dengan pernyataan sebelumnya, maka dapat disimpulkan bahwa hasil TIF tes verbal menunjukkan hasil yang cukup memuaskan.

Informasi lain yang dapat diketahui melalui TIF adalah pada tingkatan

ability berapa tes ini mencapai puncak ketelitiannya. Melalui gambar 4.1 dapat diketahui bahwa titik tertinggi kurva jatuh pada tingkatan ability

0,25. Hal ini menunjukkan bahwa secara keseluruhan tes ini mempunyai kerincian dalam mengukur kelompok subjek dengan tingkat ability

menengah. Selain itu dapat dilihat pula melalui kurva TIF bahwa kerincian tes mengalami penurunan pada kedua titik ekstrim, terlebih pada ekstrim

meninggi pada nilai - nilai ekstrim ability. Bentuk dari tes ini merupakan bentuk yang khas dari tes yang terstandard, dimana puncak ketelitian pengukuran terletak pada skor tengah, dengan penurunan ketelitian yang terlihat pada skor yang tinggi dan rendah (Harvey, Murry, & Markham, 1994).

Gambar 4.1:Test Information Curve(TIF)

STANDARD INFOR-ERROR MATION ---1.13| * +++ |14.9072 | + + | 1.07| + + |14.1618 | * + + | 1.01| |13.4165 | * + + | 0.96| |12.6711 | * + + | 0.90| * |11.9258 | + + | 0.84| * *|11.1804 | + + * | 0.79| * |10.4350 | + + * | 0.73| * * | 9.6897 | * + + * | 0.68| * | 8.9443 | * * | 0.62| * + + * | 8.1990 | * | 0.56| + + * | 7.4536 | * + * | 0.51| * + ** | 6.7082 | * + * | 0.45| * + * | 5.9629 | * + | 0.39| +** ** + | 5.2175 | + * * | 0.34| ** ** + | 4.4722 | + ** ** + | 0.28| + **** **** + | 3.7268 | + ******* + | 0.23| + + | 2.9814 | + ++ | 0.17| + + | 2.2361 | ++ +++ | 0.11| ++ ++| 1.4907 | +++ | 0.06|+++++ | 0.7454 | | 0.00| | 0.0000 -+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+---+ -4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00

MAXIMUM INFORMATION APPROXIMATELY 0.1491D+02 AT 0.2500 FOR A NORMAL POPULATION WITH MEAN 0.000 AND S.D. 1.000 AVERAGE INFORMATION= 0.1161D+02 AND RELIABILITY INDEX= 0.921

d) Reliabilitas

Dari tabel hasil rangkuman statistik (lampiran) estimasi tingkatability

diketahui bahwa hasil reliabilitas empiris tes verbal adalah 0,9122, sedangkan hasil dari reliabilitas teoretisnya adalah 0,921. Hasil ini sangatlah baik dan menandakan bahwa skor yang dihasilkan tes ini sangat konsisten.

Dokumen terkait