BAB III METODE PENELITIAN

(1)

44 BAB III

METODE PENELITIAN

3.1. Desain Penelitian

Pada penelitian ini dilaksanakan secara eksperimen, yaitu peneliti menggunakan Data Mining metode Clustering algoritma K-means terhadap data kemampuan tahfidz siswa SMK Luqman Al Hakim Kudus tahun 2018 sampai dengan 2020. Selanjutnya data tersebut akan dianalisa dan diklasterisasi sesuai dengan kecepatan menghafal, makhorijul huruf, tajwid, dan kelancaran membaca Al Qur’an. Proses pengolahan data tersebut dilakukan dengan menggunakan aplikasi Micorsoft Excel dan RapidMiner.

Kemudian hasil dari pengolahan data akan dikelompokan sesuai dengan tingkat kemiripan data. Ada 4 kategori, yang pertama adalah sangat baik, kedua adalah baik, ketiga adalah cukup baik, dan yang ke empat adalah kurang baik. Dengan terkelompokannya tahfidz siswa sesuai dengan kemampuan yang dimiliki sebagai hasil akhir dari penelitian ini, maka diharapkan dapat membantu SMK Luqman Al Hakim Kudus dalam membentuk kelompok tahfidz serta menyusun strategi pembelajaran tahfidz.

3.2. Pengumpulan Data

Dalam melakukan perhitungan Data Mining dengan metode Clustering algoritma K-means, tentunya diperlukan sejumlah data yang sesuai dengan kebutuhan penelitian. Maka dari itu peneliti menggunakan data kemampuan tahfidz siswa SMK Luqman Al Hakim Kudus tahun 2018 sampai dengan 2020 dengan cara meminta ijin kepada Kepala Sekolah.

Kemudian setelah mendapat ijin, peneliti meminta data siswa SMK Luqman Al Hakim Kudus ke ruang Tata Usaha dengan cara mengkopi file excel data siswa angkatan tiga tahun terakhir.

(2)

File excel yang diterima peneliti adalah data siswa SMK Luqman Al Hakim Kudus tahun 2018 sampai dengan 2020. Di dalamnya terdapat data yang berjumlah 70 data siswa yang memiliki beberapa kolom, yaitu:

1. Nomor 2. Nama

3. NIPD (Nomor Induk Peserta Didik) 4. Jenis Kelamin

5. NISN (Nomor Induk Siswa Nasional) 6. Tempat Lahir

7. Tanggal Lahir 8. Alamat 9. Nama Ayah 10. Nama Ibu

Dari Data siswa yang diterima peneliti, tidak semua kolom akan digunakan. Peneliti hanya akan menggunakan kolom Nomor dan Nama saja.

Kemudian ditambahkan dengan kolom atribut yang akan digunakan dalam perhitungan Data Mining, diantaranya adalah kolom kecepatan menghafal, makhorijul huruf, tajwid, dan kelancaran membaca Al Qur’an.

Selanjutnya untuk melengkapi data dengan atribut yang sudah disesuaikan, peneliti meminta data kemampuan tahfidz siswa SMK Luqman Al Hakim Kudus kepada pengajar tahfidz.

3.3. Lokasi Penelitian

Lokasi dalam penelitian ini yaitu SMK Luqman Al Hakim Kudus.

Sekolah menengah kejuruan dengan basis pondok pesantren yang alamatnya berada di Jalan Raya Kudus-Jepara Km. 05, Desa Kedungdowo, Kecamatan Kaliwungu, Kabupaten Kudus, Provinsi Jawa Tengah 59463.

(3)

3.4. Pengolahan Data

Proses pengolahan data pada penelitian ini, diperlukan adanya perangkat keras (Hardware) dan juga perangkat lunak (Software).

Penjelasan dari perangkat-perangkat tersebut seperti berikut ini:

3.4.1. Perangkat Keras

Pada Penelitian ini, perangkat keras atau hardware yang digunakan adalah satu buah laptop. Laptop yang digunakan adalah ASUS yang memiliki spesifikasi X441N Series, Intel 2Core N3350 CPU 2.4 GHz, RAM 4 GB, Hardisk 1 TB, Operating System Windows 10 64-bit.

3.4.2. Perangkat Lunak

Peneliti menggunakan beberapa perangkat lunak atau software untuk mendukung penelitian ini. Perangkat lunak yang digunakan saat melaksanakan penelitian ini, yaitu:

1. Sistem Operasi

Peneliti menggunakan laptop dengan sistem operasi Windows 10 64-bit dalam penelitian ini.

2. Microsoft Word

Pada penelitian ini software Microsoft Word digunakan untuk membuat laporan penelitian. Versi dari Microsoft Word yang digunakan adalah versi 2010.

3. Microsoft Excel

Dalam penelitian ini software Microsoft Excel digunakan untuk pengolahan data siswa SMK Luqman Al Hakim Kudus. Versi dari Microsoft Excel yang digunakan adalah versi 2010.

4. RapidMiner

Dalam penelitian ini juga digunakan software RapidMiner 5.3 untuk melakukan proses perhitungan Data Mining metode Clustering

(4)

menggunakan algoritma K-means terhadap data siswa SMK Luqman Al Hakim Kudus.

3.5. Tahapan Metode

Peneliti menggunakan salah satu metode pada Data Mining yaitu metode Clustering algoritma K-means. Di dalam metode ini, terdapat beberapa tahapan yang harus dilakukan, tahapan-tahapan tersebut adalah:

3.5.1. Pre-processing Data

Tahapan pre-processing data merupakan sebuah tahap dimana data yang sudah diperoleh, dipisahkan supaya didapatkan data sesuai dengan kebutuhan untuk proses selanjutnya. Tahapan pre-processing data ini memiliki beberapa proses dimana setiap prosesnya saling berkaitan satu sama lainnya. Berikut ini adalah proses-proses tersebut:

1. Data Cleaning

Proses cleaning mencakup beberapa tindakan seperti membuang duplikasi data, memeriksa data inkonsisten, serta memperbaiki kesalahan yang ada pada data, misalnya kesalahan cetak (tipografi). Selain itu dilakukan proses enrichment, yaitu proses untuk memperkaya data, dengan menggunakan data atau informasi lain yang relevan pada data yang sudah ada.

2. Data Integration

Penggabungan data yang berasal dari berbagai sumber basis data menjadi satu basis data yang baru. Terkadang data yang dibutuhkan untuk melakukan data mining bukan berasal dari satu basis data saja, akan tetapi berasal dari beberapa sumber basis data atau file teks. Integrasi data dilakukan terhadap atribut-atribut yang mengidentifikasikan entitas- entitas unik misalnya atribut nama, jenis produk, nomor pelanggan dan yang lainnya. Integrasi data harus dilakukan dengan cermat, dikarenakan kesalahan yang terjadi pada integrasi data dapat memberikan hasil yang

(5)

menyimpang, bahkan dapat menyesatkan untuk pengambilan aksi nantinya. Sebagai contoh melakukan integrasi data berdasarkan jenis produk yang menggabungkan produk dengan kategori berbeda, maka akan diperoleh suatu korelasi antar produk yang sebenarnya tidak ada.

3. Data Selection

Data yang terdapat dalam basis data terkadang tidak semuanya digunakan, maka dari itu data yang sesuai untuk dianalisis saja yang akan digunakan dari basis data. Contohnya, suatu kasus yang meneliti tentang faktor kecenderungan seseorang membeli dalam kasus market basket analisis, hanya perlu mengambil id pelanggan saja, tidak perlu nama pelanggan,

4. Data Transformation

Supaya data dapat diproses ke dalam data mining, maka data perlu diubah atau digabung menjadi format yang sesuai. Dalam data mining terdapat beberapa metode yang memerlukan format data khusus sebelum dapat diaplikasikan. Contohnya yaitu beberapa metode standar seperti analisis asosiasi dan clustering yang hanya dapat menerima masukan data kategorial. Oleh karena itu data dalam bentuk angka numerik yang berlanjut perlu untuk dibagi-bagi menjadi beberapa interval. Proses ini biasa dikenal dengan transformasi data.

3.5.2. K-means

Dari percobaan ini diambil beberapa sampel data siswa SMK Luqman Al Hakim Kudus. Sampel data siswa dari tahun 2018 sampai dengan 2020, seperti berikut ini:

Tabel 3.1 Data Siswa Tahun 2018 sampai dengan 2020

No Nama Kecepatan

Menghfal

Makhorijul

Huruf Tajwid Kelancaran Membaca

1 Abdul Hakim A A A A

2 Abdurrahman

Farros Arsalan B B B A

(6)

3 Ahmad Izhar

Maulana B B B A

4 Burhan Dwi

Fahmi C C C B

5 Dhuhaalhaq

Abdul Karim B C C B

6 Imam Samudra B B B B

7 Iqdam Haidar

Ahmad C C C C

8 Lukman Hakim C C C C

9 Mohammad

Hisyam Hidayat B B B B

10

Muhammad I Khadafi Djaelani

B B C B

11 Muhammad

Yanuar Rafly A A A A

12 Mush'ab Khalil C C C B

13

Rangga Muhammad Firman Saputra

C C C B

14 Reksi

Pamungkas A A B A

15 Afif Muizzuddin B B B B

16 Ahmad Ridwan

Khoironi B B B B

17 Cavan Rizal

Arrafi B B B B

18 Demas Panki B B B B

(7)

1. Transformasi Data

Sebelum masuk ke dalam proses pengolahan data, proses yang perlu dilakukan adalah mentrasformasi bentuk data yang belum memiliki entitas jelas menjadi bentuk data valid atau siap diolah dengan proses data mining.

Data kecepatan menghafal, makhorijul huruf, tajwid, dan kelancaran membaca Al Qur’an, akan diinisialisasi ke dalam bentuk angka, sehingga data tersebut siap untuk diproses.

Tabel 3.2 Inisialisasi Data Kecepatan Menghafal Kecepatan Menghafal Inisialisasi

A 1

B 2

C 3

D 4

Tabel 3.3 Inisialisasi Data Makhorijul Huruf Makhorijul Huruf Inisialisasi

A 1

B 2

C 3

D 4

Tabel 3.4 Inisialisasi Data Tajwid

Tajwid Inisialisasi

A 1

B 2

C 3

D 4

(8)

Tabel 3.5 Inisialisasi Data Kelancaran Membaca Kelancaran Membaca Inisialisasi

A 1

B 2

C 3

D 4

2. Pengolahan Data

Apabila seluruh data siswa sudah ditransformasikan menjadi bentuk angka, maka data-data tersebut dapat diproses ke tahap selanjutnya, yaitu Data Mining menggunakan metode Clustering algoritma K-means.

Kemudian untuk proses pengelompokan data-data menjadi beberapa cluster perlu dilakukan langkah-langkah seperti berikut ini:

a. Tentukan jumlah cluster yang akan dibuat. Di dalam percobaan ini jumlah cluster adalah empat cluster.

b. Tentukan nilai secara random untuk pusat awal cluster sebanyak cluster yang telah ditentukan. Dengan jumlah cluster adalah empat, maka titik pusat cluster bisa diperhatikan pada tabel 3.6.

Tabel 3.6 Titik Pusat Awal Cluster Titik

Pusat Nama Kecepatan Menghafal

Makhorijul

Cluster 1

Abdurrahman Farros

Arsalan

2 2 2 1

Cluster 2 Burhan Dwi

Fahmi 3 3 3 2

Cluster 3 Dhuhaalhaq

Abdul Karim 2 3 3 2

Cluster 4

2 2 3 2

(9)

c. Metode Hard K-means digunakan pada percobaan ini untuk menempatkan setiap data ke dalam satu cluster. Sehingga data akan dimasukkan ke dalam suatu cluster dengan jarak terdekat terhadap titik pusat dari setiap cluster. Selanjutnya jarak setiap data terhadap titik pusat setiap cluster dihitung untuk mengetahui cluster manakah yang terdekat dengan data. Dibawah ini adalah perhitungan jarak data siswa pertama terhadap pusat cluster pertama:

d(1, 1) = √( ) ( ) ( ) ( )

= √( ) ( ) ( ) ( )

= 1,732

Dari perhitungan di atas diperoleh hasil, jarak data siswa pertama terhadap pusat cluster pertama yaitu 1,732.

Berikut ini adalah perhitungan jarak data siswa pertama terhadap pusat cluster kedua:

d(1, 2) = √( ) ( ) ( ) ( )

= √( ) ( ) ( ) ( )

= 3,606

Dari perhitungan di atas diperoleh hasil, jarak data siswa pertama terhadap pusat cluster kedua yaitu 3,606.

Berikut ini adalah perhitungan jarak data siswa pertama terhadap pusat cluster ketiga:

d(1, 3) = √( ) ( ) ( ) ( )

= √( ) ( ) ( ) ( )

= 3,162

(10)

Dari perhitungan di atas diperoleh hasil, jarak data siswa pertama terhadap pusat cluster ketiga yaitu 3,162.

Berikut ini adalah perhitungan jarak data siswa pertama terhadap pusat cluster keempat:

d(1, 4) = √( ) ( ) ( ) ( )

= √( ) ( ) ( ) ( )

= 2,646

Dari perhitungan di atas diperoleh hasil yaitu, jarak data siswa pertama terhadap pusat cluster keempat yaitu 2,646. Berdasarkan hasil dari keempat perhitungan di atas dapat diperhatikan bahwa, jarak data siswa pertama yang terdekat yaitu jarak ke cluster satu. Sehingga data siswa pertama akan dimasukkan ke dalam cluster satu. Selanjutnya data siswa dihitung satu per satu seperti perhitungan diatas, hasil dari perhitungan data siswa dapat diperhatikan pada tabel 3.7.

Tabel 3.7 Contoh Hasil Perhitungan Setiap Data Ke Setiap Cluster

No Nama

Kecepatan Menghafal Makhorijul Huruf Tajwid Kelancaran Membaca

Jarak Ke Cluster Jarak Terdekat

Ke Cluster

C1 C2 C3 C4

1 Abdul Hakim 1 1 1 1 1,422 3,736 3,162 2,646 1

2

Abdurrahman Farros

Arsalan

2 2 2 1 0,692 2,227 1,732 1,414 1

3 Ahmad Izhar

Maulana 2 2 2 1 0,692 2,227 1,732 1,414 1 4 Burhan Dwi

Fahmi 3 3 3 2 2,201 0,4 1 1,414 2

5 Dhuhaalhaq

Abdul Karim 2 3 3 2 1,816 1,077 0 1 3

(11)

6 Imam

Samudra 2 2 2 2 0,624 1,778 1,414 1 1

7 Iqdam Haidar

Ahmad 3 3 3 3 2,599 0,6 1,414 1,732 2

8 Lukman

Hakim 3 3 3 3 2,599 0,6 1,414 1,732 2

9

Mohammad Hisyam Hidayat

2 2 2 2 0,624 1,778 1,414 1 1

10

2 2 3 2 1,324 1,470 1 0 4

11 Muhammad

Yanuar Rafly 1 1 1 1 1,422 3,736 3,162 2,646 1 12 Mush'ab

Khalil 3 3 3 2 2,201 0,4 1 1,414 2

13

Rangga Muhammad Firman Saputra

3 3 3 2 2,201 0,4 1 1,414 2

14 Reksi

Pamungkas 1 1 2 1 1,178 3,311 2,646 2 1

15 Afif

Muizzuddin 2 2 2 2 0,624 1,778 1,414 1 1

16

Ahmad Ridwan Khoironi

2 2 2 2 0,624 1,778 1,414 1 1

17 Cavan Rizal

Arrafi 2 2 2 2 0,624 1,778 1,414 1 1

18 Demas Panki 2 2 2 2 0,624 1,778 1,414 1 1

(12)

d. Setelah semua data dialokasikan ke dalam cluster terdekat, gunakan rata-rata anggota yang terdapat pada cluster tersebut untuk menghitung kembali pusat cluster yang baru.

e. Kemudian apabila sudah diperoleh titik pusat baru pada setiap cluster.

Ulangi langkah ketiga sampai titik pusat dari setiap cluster tidak ada yang berubah dan tidak ada data yang berpindah antara satu cluster ke cluster yang lain.

Dalam percobaan ini, iterasi yang terjadi sebanyak dua kali. Pada iterasi kedua, titik pusat setiap cluster tidak berubah lagi dan tidak ada data yang berpindah antara satu cluster ke cluster yang lain lagi.

3.6. Evaluasi Metode BCV dan WCV

Pada percobaan sampel data siswa SMK Luqman Al Hakim Kudus tahun 2018 sampai dengan 2020, didapat hasil yang mempunyai nilai error.

Ketika hasil dari perhitungan mempunyai nilai error yang kecil, maka akan semakin baik hasil yang diperoleh. Ketika hasil perhitungan mempunyai nilai error tinggi maka hasil yang diperoleh kurang baik. Terdapat beberapa tahapan atau proses dalam melakukan pengujian ini. Berikut proses perhitungan nilai error yang digunakan pada penelitian ini:

1. Menentukan iterasi keberapa yang akan dihitung

Iterasi yang dipakai adalah iterasi terakhir, karena iterasi terakhir mempunyai centroid yang baik dibanding iterasi sebelumnya. Maka dari itu iterasi terakhirlah yang akan digunakan. Pada percobaan ini menggunakan sampel data siswa SMK Luqman Al Hakim Kudus tahun 2018 sampai dengan 2020. Data tersebut dapat diperhatikan pada tabel berikut:

(13)

Tabel 3.8 Nilai Centroid Pada Iterasi Terakhir Titik Pusat Kecepatan

Menghafal

Makhorijul

Cluster 1 1,7 1,7 1,8 1,5

Cluster 2 3 3 3 2,4

Cluster 3 2 3 3 2

Cluster 4 2 2 3 2

Selanjutnya hitung nilai centroid menggunakan persamaan BCV (Between-Class Variation)

BCV = √( ) ( ) ( ) ( ) √( ) ( ) ( ) ( ) √( ) ( ) ( ) ( ) √( ) ( ) ( ) ( ) √( ) ( ) ( ) ( ) √( ) ( ) ( ) ( )

= 3,839

2. Menentukan jarak minimum centroid

Jarak minimum pusat centroid yang digunakan berasal dari iterasi terakhir. Setelah jarak minimum dengan nilai pusat centroid diperoleh, selanjutnya menghitung seluruh jarak minimum menggunakan persamaan WCV (Within-Class Variation).

WCV =

= 9,927

Hasil yang diperoleh adalah WCV= 9,927.

(14)

3. Menghitung perbandingan BCV dan WCV

Hitung nilai perbandingan dari BCV (Between-Class Variation) dengan WCV (Within-Class Variation) sehingga diperoleh nilai error. Hitung menggunakan persamaan rasio, seperti berikut ini.

Rasio =

= 0,387

Setelah didapatkan hasil rasio, selanjutnya perhatikan kriteria pengukuran rasio untuk menentukan bagus atau tidaknya hasil pengujian yang diperoleh, kriteria pengukuran rasio dapat diperhatikan pada tabel 2.8. Nilai rasio yang diperoleh dari hasil pengujian menggunakan perbandingan BCV (Between-Class Variation) dan WCV (Within-Class Variation) adalah 0,387. Maka tingkat penggunaan nilai sample data centroid memiliki kualitas yang baik.