• Tidak ada hasil yang ditemukan

BAB III METODE PENELITIAN

3.6. Teknik analisis data

3.6.2. Data kuantitatif

Data kuantitatif diperoleh dari hasil analisis kualitas produk yang mencakup validitas, reliabiltas, daya pembeda, tingkat kesukaran, dan analisis pengecoh.

3.6.2.1. Validitas

Valid berarti cocok atau sesuai. Suatu tes dikatakan valid, apabila tes tersebut benar-benar menyasar kepada apa yang dituju. Tes tersebut benar-benar memberikan keterangan atau gambaran tentang apa yang diinginkan (Sulistiyorini, 2009: 165). Suatu alat ukur dapat dikatakan valid jika betul-betul mengukur apa yang hendak diukur secara tepat (Arifin, 2012: 64). Validitas didefinisikan sebagai ukuran seberapa cermat suatu tes melakukan fungsi ukuranya. Tes hanya dapat melakukan fungsinya dengan cermat kalau ada “sesuatu” yang diukurnya. Jadi, untuk dikatakan valid, tes harus mengukur dan melakukannya dengan cermat (Mardapi, 2004: 25). Di sini peneliti lebih mengulas tentang standar validitas pada sebuah perangkat soal tes. Pada bab II peneliti telah menyampaikan tentang jenis validitas menurut Sugiyono (2010). Berikut adalah jenis validitas: (Sugiyono,2010 : 176)

1. Validitas isi (content validity)

Validitas isi berhubungan dengan kesanggupan tes untuk mengukur isi yang seharusnya diukur. Dengan kata lain validitas isi menyatakan apakah tes sudah mencakup sampel yang representatif dari domain perilaku yang diukur (Sugiyono,2010 : 176). Validitas isi ini sering disebut juga validitas perumusan. Validitas perumusan berkenaan dengan pertanyaan apakah aspek-aspek dalam

55

soal-soal itu betul-betul tercakup dalam perumusan tentang apa yang hendak diukur (Arifin, 2009: 316).

Validitas isi dilakukan dengan cara memberikan kisi-kisi butir soal kepada para ahli (expert judgement) dengan rentang skor mengadopsi skala Likert. Validitas ini dilakukan dengan cara melakukan konsultasi kepada dosen Matematika, dosen Evaluasi Pembelajaran, dosen Bahasa Indonesia dan dua guru SD guna melihat kualitas kisi-kisi butir soal tes hasil belajar. Berdasarkan hasil data tersebut, maka data tersebut diolah dengan statistik yang sesuai, yaitu (1) pengumpulan data kasar, (2) pemberian skor untuk analisis kuantitatif , dan (3) pengkonversian skor hasil analisis menjadi nilai dengan skala Likert. Peneliti hanya menggunakan rentang 4 skala saja, jika biasanya kriteria “cukup” dicantumkan, maka pada peneliti kali ini tidak menggunakan kriteria tersebut. Jadi peneliti hanya menggunakan rentang skala sebagai berukut: (1) angka “1” untuk data yang “sangat kurang baik”, (2) angka “2” untuk data yang “kurang baik”, (3) angka “3” untuk data yang “baik”, dan (4) angka “4” untuk data yang “sangat baik”. Pada penelitian ini, para ahli bisa memberikan nilai pada kolom yang disediakan. Nilai tersebut terdiri dari angka 1, 2, 3, dan 4.

Pengkonversian nilai dilakukan pada data yang diperoleh dari pengisian kuesioner. Pengkonversian nilai skala Likert bertujuan untuk memperoleh kualitas produk yang dikembangkan. Konversi skor adalah proses transformasi skor mentah yang dicapai peserta didik ke dalam skor terjabar atau skor standar untuk menetapkan nilai hasil belajar yang diperoleh (Arifin, 2009: 281).

Berikut adaptasi konversi nilai dari skor yang diperoleh berdasarkan kategorinya (Widoyoko, 2009: 238).

Tabel 3.5 Konversi Skor Kelayakan Uji Validasi Oleh Ahli

Interval skor Kategori

̅ Sangat baik

̅ ̅ Baik

̅ ̅ Kurang baik

̅̅̅̅̅̅̅̅ Sangat kurang baik Keterangan:

̅

56

Diketahui

Skor maksimal ideal = 4 Skor minimal = 1

Rerata ideal ̅ =

simpangan baku ideal = kategori skor:

kategori sangat baik = ̅ = = = Kategori baik = ̅ ̅ = = =

Kategori kurang baik = ̅ ̅ = = =

Kategori sangatkurang baik = =

57 =

Skor yang diperoleh dikategorikan pada tabel sebagai berikut.

Tabel 3.6 Kriteria Kelayakan Uji Validasi Oleh Ahli

Interval skor Kategori

3,5 – 4,00 Sangat baik

2,9 – 3,4 Baik

2,3 – 2,8 Kurang baik

1 – 1,6 Sangat kurang baik

Tabel ini digunakan untuk menetukan kategori pada hasil keseluruhan hasil kelayakan uji validasi oleh ahli. Soal yang akan diujicobakan adalah soal yang telah memenuhi skor nilai rerata minimal 2,9 atau “Baik”. Jadi soal yang belum memenuhi skor minimal 2,9 akan direvisi terlebih dahulu dan kemudian soal tersebut bisa diujicobakan.

2. Validitas empiris

Validitas empiris adalah tingkat ketepatan suatu instrumen untuk mengukur hal-hal yang akan diukur, apakah sudah mewakili kriteria yang akan diukur dengan instrumen dengan melihat kecocokan instrumen dengan yang akan diteliti (Sukmadinata, 2008: 229). Validitas empiris biasanya menggunakan teknik statistik, yaitu analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan antara skor tes dengan suatu kriteria tertentu yang merupakan suatu tolok ukur di luar tes yang bersangkutan. Namun, kriteria itu harus relevan dengan apa yang akan diukur. Validitas empiris disebut juga validitas yang dihubungkan dengan kriteria (criterion-related validity) atau validitas statistik (statistical validity) (Arifin, 2009: 316). Validitas empiris digunakan untuk memvalidasi produk tes hasil belajar berupa tes pilihan ganda. Peneliti memberikan soal tes tersebut kepada siswa kelas V di SD N Srowolan, SD N Tawangharjo, dan SD N Baratan.

58

Peneliti menggunakan teknik korelasi point biserial dengan menggunakan program TAP (Test Analysis Program) version 14.7.4. Teknik point biserial merupakan teknik mencari korelasi antar dua variabel dimana salah satu variabelnya berbentuk kontinum dan variabel lainnya berbentuk diskrit murni (Hartono dalam Cholifah, 2014: 56). Item yang dapat dikatakan valid adalah item yang mempunyai nilai rhitung > rtabel dengan atas dasar taraf signifiasi yang digunakan sebesar 5% atau 0,05. rhitung adalah r yang diperoleh dari hasil TAP sama dengan atau lebih besar dari r dalam tabel signifikasi. Bilangan-bilangan yang membatasi signifikan tidaknya sesuatu nilai r sangat tergantung N atau jumlah peserta tes (Hadi, 2004: 246-247).

Instrumen berupa achievment test, memiliki benar-salah, artinya jawabannya ada yang benar dan ada yang salah, maka pengujian validitas item instrumen dilakukan dengan menggunakan rumus koefisien korelasi point biserial. Rumus yang digunakan sebagai berikut: (Hamzah & Satria K, 2012 : 169).

Keterangan:

= koefisien korelasi biserial

= rata-rata skor untuk yang menjawab benar butir ke-i

= rata-rata skor seluruhnya.

pi = proporsi yang menjawab benar (tingkat kesulitasn) butir ke-i qi = sama dengan 1-p

st = standar deviasi skor total

Berdasarkan pada tabel signifikasi, rtabel pada taraf signifikasi 5% dan jumlah siswa (N) sebanyak 60 dengan dua tipe soal yaitu tipe soal A dan tipe soal B adalah 0,36. Jadi item yang nilainya mencapai minimal 0,36 maka item tersebut

59

valid. Pada penelitian ini validitas empiris dapat dilihat pada hasil TAP yaitu pada point biserial atau yang telah dijelaskan pada gambar berikut.

Gambar 3.4 Validitas empiris pada program TAP

3.6.2.2. Reliabilitas

Reliabilitas suatu tes adalah tingkat atau derajat konsistensi tes yang bersangkutan. Reliabilitas berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes dapat dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda (Arifin, 2009: 326). Secara statistik, jenjang reliabilitas suatu tes hasil belajar diidentifikasi dengan cara mencari koefisien korelasi melalui penggunaan berbagai macam rumus korelasi. Berikut adalah rumus koefisien reliabilitas menurut Hamzah & Satria K (2012 : 173).

( ∑ ) s = standar deviasi skor total

60

q = proporsi siswa yang menjawab salah untuk tiap-tiap item

Sebelum perhitungan terlebih dahulu dibuat tabel kerja dengan langkah-langkah sebagai berikut:

1. Item-item yang dinyatakan tidak valid dikeluarkan dari instrumen. Jadi reliabilitas instrumen dihitung hanya untuk item-item yang dinyatakan valid. 2. Menghitung p, yaitu proporsi siswa yang menjawab benar untuk tiap-tiap

item.

3. Menghitung q, yaitu proporsi siswa yang menjawab salah untuk tiap-tiap item.

4. (q=1-p)

5. Menghitung hasil kali p dengan q (pxq) untuk tiap-tiap item. Standar deviasi (s) untuk skor total, dengan menggunakan rumus:

√ ∑

Selanjutnya menghitung koefisien reliabilitas instrumen dengan menggunakan rumus KR-20 sebagai berikut:

Tabel 3.7 Kriteria reliabilitas instrumen tes (Arikunto, 2003: 75)

Koefisien korelasi Kriteria reliabilitas

0,81 < r ≤ 1,00 Sangat tinggi

0,61 < r ≤ 0,80 Tinggi

0,41 < r ≤ 0,60 Cukup

0,21 < r ≤ 0,40 Rendah

0,00 < r ≤ 0,20 Sangat rendah

Berdasarkan dari beberapa teknik analisa data reliabiltas di atas peneliti menggunakan metode belah dua (Split-Half Method), yaitu dengan menggunakan

61

metode belah dua berdasarkan item genap dan ganjil. Sedangkan kriteria yang digunakan adalah kriteria yang berdasarkan kriteria reliabiltas instrumen tes (Arikunto. 2003: 75). Peneliti menetapkan item yang lolos yaitu item yang mencapai nilai minimal 0,41 atau “cukup”. Pada hasil analisis data pada program TAP relibiltas dapat dilihat seperti pada gambar berikut:

Gambar 3.5 Reliabilitas pada program TAP

3.6.2.3. Daya pembeda

Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal mampu membedakan anak yang pandai dan anak yang kurang pandai berdasarkan kriteria tertentu. Semakin tinggi nilai daya pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan anak yang pandai dan yang kurang pandai. Untuk menghitung daya pembeda setiap butir soal dapat dipergunakan rumus sebagai berikut: (Arifin, 1990: 136)

Keterangan:

WL = jumlah testi yang gagal dari lower group WH = jumlah testi yang gagal dari hidger group n = 27% x N

62

Kriteria daya pembeda menurut Crakcker & Algania (dalam Kusaeri & Suprananto, 2012: 177).

Tabel 3.8. Kriteria Daya Pembeda yang Digunakan Peneliti

No Range daya pembeda

Kategori Keputusan

1 0,40 – 1,00 Sangat memuaskan Diterima

2 0,30 – 0,39 Memuaskan Diterima

3 0, 20 – 0,29 Tidak memuaskan Ditolak/ direvisi 4 0,00 – 0,19 Sangat tidak memuaskan Ditolak/ direvisi Berdasarkan dari beberapa tabel diatas, peneliti hanya menggunakan kriteria daya pembeda menurut Crakcker & Algania. Alasan peneliti menggunakan kriteria ini karena peneliti tidak hanya mengetahui kategori dari daya pembeda suatu item tetapi peneliti juga dapat mengetahui keputusan dari hasil kategori dari item tersebut sebagai pertimbangan langkah selanjutnya. Daya pembeda yang akan digunakan jika mencapai skor minimal 0,20 dengan catatan perlu diperbaiki terlebih dahulu. Daya pembeda pada analisis program TAP dapat dilihat di gambar berikut:

63

3.6.2.4. Tingkat kesulitan

Tingkat kesukaran yang sudah disampaikan di bab II adalah peluang menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam indeks. Indeks kesukaran soal dinyatakan dalam bentuk proporsi yang besarnya berkisar dari 0- 1. Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil perhitungan, maka semakin mudah soal itu (Kusaeri, 2014: 106). Klasifikasi tingkat kesukaran soal dapa menggunakan kriteria sebaga berikut (Kusaeri & Suprananto, 2012: 175):

Tabel 3.9 Klasifikasi tingkat kesukaran soal

No Range tingkat kesukaran Kategori Keputusan

1 0,71 – 1,0 Mudah Ditolak/ direvisi

2 0,31 – 0,70 Sedang Diterima

3 0,0 – 0,30 Sulit Ditolak/ direvisi Perhitungan tingkat kesukaran item adalah pengukuran seberapa besar derajat kesukaran suatu item atau tes. Jika suatu item atau tes memiliki tingkat kesukaran seimbang, maka dapat dikatakan bahwa tes tersebut baik. Dengan kata lain, suatu item atau tes hendaknya tidak terlalu sukar dan tidak terlalu mudah. Pada penelitian ini peneliti membuat produk soal pilihan ganda yang berdasarkan Arifin, 1990: 129 ada beberapa cara perhitungan tingkat kesukaran untuk tes bentuk objektif salah satunya dengan menggunakan rumus sebagai berikut:

Keterangan:

WL = jumlah testi yang menjawab salah dari lower group WH = jumlah testi yang menjawab salah dari higher group nL = jumlah kelompok bawah

64

Sebelum menggunakan rumus di atas, maka perlu menempuh dahulu langkah- langkah sebagai berikut:

1. Menyusun lembar jawaban siswa dari yang mendapat skor tertinggi sampai mendapat skor terendah

2. Mengambil 27% jawaban dari atas yang selanjutnya disebut kelompok atas (higher group), dan 27% lembar jawaban dari bawah yang selanjutnya disebut kelompok bawah (lower gruoup). Sisa sebanyak 46% disihkan. 3. Membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap

siswa, baik untuk kelompok atas maupun untuk kelompok bawah. Jika jawaban siswa benar, diberi tanda + (plus); sebaliknya jika jawaban siswa salah, diberi tanda – (minus).

Tingkat kesukaran pada produk tes hasil belajar yang dikembangkan oleh peneliti yaitu 25% soal mudah, 50% soal sedang, dan 25% soal sulit. Alasan peneliti membuat penyebaran soal semacam itu agar soal yang dikembangkan bisa benar-benar mempunyai kualitas yang baik. Misalnya saja kalau soal yang sukar lebih banyak, maka soal tersebut tidak bisa membedakan siswa yang beprestasi di atas dengan siswa yng berprestasi di bawah. Tingkat kesukaran yang masih membutuhkan revisi maka akan dilakukan perbaikan. Tingkat kesukaran pada analisa data pada program TAP dapat dilihat di gambar berikut:

65

3.6.2.5. Analisis pengecoh

Hampir semua tipe soal tes hasil belajar gaya objektif menyediakan sejumlah jawaban. Jawaban-jawaban yang disediakan itu terdiri dari jawaban- jawaban benar atau jawaban-jawaban salah. Jawaban-jawaban salah itulah yang biasanya sebagai jawaban pengecoh. Jawaban pengecoh yang baik adalah jawaban-jawaban yang menarik para peserta tes untuk memilihnya sebagai jawaban-jawaban yang benar. Sebab itu, jawaban pengecoh harus dirumuskan sedemikian rupa sehingga menimbulkan kesan seakan-akan jawaban pengecoh itu merupakan jawaban-jawaban benar. Jawaban pengecoh dinyatakan efektif apabila jawaban pengecoh itu dipilih oleh lebih banyak peserta tes dalam kelompok berprestasi hasil belajar rendah dibandingkan dengan yang dari peserta tes dari kelompok berprestasi hasil belajar tinggi (Waridjan, 1991: 387).

Analisis efektivitas pengecoh (distractor) atau analisis pola jawaban dilakukan dengan menghitung peserta tes yang memilih tiap alternatif jawaban pada masing-masing item. Kriteria pengecoh yang baik adalah apabila pengecoh tersebut dipilih oleh minimal 5% dari peserta tes. Misalnya peserta tes berjumlah 30 orang, maka 5% dari 30 orang siswa adalah sekitar 2 orang yang memilih jawaban pengecoh tersebut (Uno & Satria K, 2012: 180). Suatu pilihan jawaban (pengecoh) dapat dikatakan berfungsi apabila: (1) pengecoh paling tidak dipilih oleh 5% peserta tes atau siswa, dan (2) pengecoh lebih banyak dipilih oleh kelompok siswa yang belum memahami materi yang diujikan (Kusaeri & Suprananto, 2012: 177).

Berdasarkan teori para ahli di atas peneliti dapat menyimpulkan jika jawaban pengecoh yang baik adalah jawaban yang dipilih oleh 5% dari peserta tes dalam kelompok berprestasi hasil belajar rendah. Skor 5% ini jika diubah dalam bentuk desimal maka skornya adalah 0,05. Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus: (Arifin, 2009: 357)

66

Keterangan:

IP = indeks pengecoh

P = jumlah peserta didik yang memilih pengecoh N = jumlah peserta didik yang ikut tes

B = jumlah peserta didik yang menjawab benar pada setiap soal n = jumlah alternatif jawaban (opsi)

1= bilangan tetap

Pada penelitian ini peneliti akan menggunakan skor 5% atau 0,05 untuk menentukan batas minimal kriteria pengecoh yang baik. Analisis pengecoh pada program TAP dapat dilihat di gambar berikut:

67

Jawaban yang benar ada tanda bintangnya. Jika pengecoh < 5% berarti pengecoh tersebut belum berfungsi dengan baik, jadi pengecoh tersebut perlu diperbaiki.

68

Dokumen terkait