• Tidak ada hasil yang ditemukan

SKRIPSI. Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika. Disusun Oleh :

N/A
N/A
Protected

Academic year: 2021

Membagikan "SKRIPSI. Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika. Disusun Oleh :"

Copied!
129
0
0

Teks penuh

(1)

i

SKRIPSI

OPTIMASI ALGORITMA C4.5 DALAM PREDIKSI SEKOLAH LANJUTAN TINGKAT ATAS MENGGUNAKAN SELEKSI

FITUR ALGORITMA GENETIKA DI SMP ISLAM AL- HIKMAH PONDOK CABE

Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik Informatika

Disusun Oleh :

Nama : Ananda Arimbi Saraswati

NIM : 311510930

PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK

UNIVERSITAS PELITA BANGSA KABUPATEN BEKASI

2019

(2)

ii

(3)

iii

(4)

iv

(5)

v

(6)

vi

(7)

vii

(8)

viii ABSTRAK

Ananda Arimbi Saraswati, 311510930, Optimasi algoritma C4.5 prediksi sekolah lanjutan tingkat atas menggunakan seleksi fitur algoritma genetika di SMP Islam Al-Hikmah Pondok Cabe.

SMP Al-Hikmah merupakan salah satu sekolah pertama di kota Pamulang Tangerang Selatan. Pemilihan sekolah lanjutan yang tidak tepat bisa sangat merugikan masa depan siswa. Hal demikian bisa menimbulkan permasalahan muncul keengganan untuk belajar sehingga menurunnya kualitas dan prestasi akademik. Dengan pemilihan sekolah lanjutan tingkat atas yang tepat diharapkan dapat memaksimalkan potensi, bakat atau talenta individu, sehingga dapat memaksimalkan nilai akademisnya. Berdasarkan latar belakang tersebut, maka dengan menerapkan teknik data mining diharapkan dapat membantu siswa untuk menentukan sekolah lanjutan yang tepat sesuai dengan kriteria yang ditetapkan.

Adapaun teknik data mining yang digunakan dalam penentuan sekolah lanjutan ini membandingkan 2 metode yaitu Algoritma C4.5 dan Algoritma Genetika.

Dengan klasifikasi dalam Algoritma C4.5, permasalahan tersebut dapat diselesaikan dengan menghasilkan rule dari pohon keputusan. Untuk dapat meningkatkan akurasi dari prediksi algoritma C4.5 dapat digunakan fitur seleksi dengan menggunakan algoritma genetika. Berdasarkan penerapan algorima C4.5 dihasilkan akurasi sebesar 81,21% untuk memprediksi sekolah lanjutan tingkat atas dan dengan seleksi fitur menggunakan algoritma genetika meningkatkan akurasi sebesar 7,36% menjadi 88,57%. Dari penelitian ini algoritma genetika terbukti dapat meningkatkan akurasi untuk prediksi sekolah lanjutan tingkat atas.

Kata Kunci: sekolah lanjutan, prediksi, algoritma C4.5, algoritma genetika

(9)

ix ABSTRACT

Ananda Arimbi Saraswati, 311510930, Optimization of C4.5 algorithm prediction of senior high school level using genetic algorithm feature selection at Al-Hikmah Islamic Junior High School Pondok Cabe.

Al-Hikmah Islamic Junior High School is one of the first schools in the city of Pamulang, South Tangerang. The selection of an improper high school can be very detrimental to the future of students. This can lead to problems that arise a reluctance to learn so that the quality and academic achievement decreases. The selection of the right high school is expected to maximize the potential, talents or talents of individuals, so as to maximize their academic value. Based on this background, then applying data mining techniques is expected to help students to determine appropriate high school in accordance with established criteria. As for the data mining techniques used in the determination of secondary schools, it compares 2 methods, namely C4.5 Algorithm and Genetic Algorithm. With the classification in C4.5 Algorithm, these problems can be solved by generating rules from the decision tree. To be able to improve the accuracy of the predicted C4.5 algorithm the selection feature can be used by using a genetic algorithm.

Based on the application of the C4.5 algorithm, an accuracy of 81.21% is generated to predict senior high school and with feature selection using a genetic algorithm increasing the accuracy by 7.36% to 88.57%. From this research, genetic algorithms have been proven to be able to improve the accuracy of senior high school prediction.

Keywords: advanced school, prediction, C4.5 algorithm, genetic algorithm

(10)

x

DAFTAR ISI

HALAMAN JUDUL ... i

HALAMAN PERSETUJUAN ... ii

HALAMAN PENGESAHAN ... iii

PERNYATAAN KEASLIAN SKRIPSI ... iv

PERNYATAAN PERSETUJUAN PUBLIKASI ... v

KATA PENGANTAR ... vi

ABSTRAK ... viii

ABSTRACT ... ix

DAFTAR ISI ... x

DAFTAR TABEL ... xiii

DAFTAR GAMBAR ... xv

DAFTAR GRAFIK ... xvi

DAFTAR LAMPIRAN ... xvii

BAB I. PENDAHULUAN ... 1

1.1. Latar Belakang ... 1

1.2. Identifikasi Masalah ... 3

1.3. Batasan Masalah ... 3

1.4. Rumusan Masalah ... 4

1.5. Tujuan Penelitian ... 4

1.6. Manfaat Penelitian ... 4

BAB II. TINJAUAN PUSTAKA DAN LANDASAN TEORI ... 5

(11)

xi

2.1. Tinjauan Penelitian ... 5

2.2. Tinjauan Pustaka ... 7

2.2.1. Definisi Pendidikan ... 7

2.2.2. Definisi Sekolah ... 9

2.2.3. Definisi Sekolah Menengah Atas (SMA) ... 10

2.2.4. Definisi Sekolah Menengah Kejuruan (SMK) ... 11

2.2.5. Definisi Minat ... 12

2.2.6. Definisi Mechine Learning ... 12

2.2.7.1 Konsep Pembelajaran Mechine Learning ... 14

2.2.7.2 Algoritma Machine Learning ... 15

2.2.7. Data Mining ... 16

2.2.8.1 Fungsi dan Tugas Data Mining ... 17

2.2.8.2 Pengelompokan Data Mining ... 18

2.2.8.3 Tahapan Data Mining ... 19

2.2.8. Pengertian Klasifikasi ... 20

2.2.9. Definisi Decision Tree / Classification Tree ... 21

2.2.10. Definisi Algoritma C4.5... 21

2.2.11. Pengertian Algoritma Genetika ... 24

2.3. Kerangka Pemikiran... 25

BAB III. METODELOGI PENELITIAN ... 27

3.1. Sejarah SMP Islam Al-Hikmah ... 27

3.1.1. Visi Misi Sekolah ... 27

3.1.2. Struktur Organisasi ... 29

3.2. Metode Penelitian... 32

3.3. Metode Pengumpulan Data ... 33

3.4. Pengelompokan Data Awal ... 34

3.5. Metode yang Diusulkan ... `36

3.6. Pemodelan ... `37

BAB IV HASIL DAN PEMBAHASAN ... 40

(12)

xii

4.1. Pembahasan ... 40

4.1.1 Transfoms ... 40

4.1.2 Perhitungan Entropy... 41

4.1.3 Perhitungan Gain ... 48

4.1.4 Proses RapidMiner ... 51

4.1.2.1 Pengujian Algoritma C4.5 ... 52

4.1.2.2 Pengujin DecisionTree optimasi Genetika (GA) ... 62

4.2. Hasil ... 70

4.2.1. Hasil Perbandingan Dua Algoritma ... 70

4.2.2. Range Hasil Algoritma C4.5 dan Alogoritma GA ... 71

BAB V PENUTUP ... 74

5.1. Kesimpulan ... 74

5.2. Saran ... 75

DAFTAR PUSTAKA ... 76

(13)

xiii

DAFTAR TABEL

Tabel 3.1 Data Asli SMP Islam Al-Hikamah ... 34

Tabel 3.2 Atribut yang digunakan ... 35

Tabel 3.3 Perhitungan Jumlah Kasus ... 38

Tabel 4.1 Perhitungan Entropy ... 47

Tabel 4.2 Perhitungan Gain ... 50

Tabel 4.3 Fungsi Format Columns ... 55

Tabel 4.2 Hasil Perbandingan ... 71

(14)

xiv

DAFTAR GAMBAR

Gambar 2.1 Tahap Data Mining ... 20

Gambar 2.2 Pola Decision Tree ... 21

Gambar 2.3 Rumus Gain ... 23

Gambar 2.4 Rumus Entropy ... 23

Gambar 2.5 Kerangka Pemikiran ... 27

Gambar 3.1 Struktur Organisasi ... 31

Gambar 3.2 Langkah Pengujian Metode ... 36

Gambar 4.1 Data Transfom ... 40

Gambar 4.2 Tools RapidMiner Studio Version 9.1 ... 51

Gambar 4.3 Start Project ... 52

Gambar 4.4 Main Process Cross-Validation (CV) ... 52

Gambar 4.5 Main Process Dacision Tree ... 53

Gambar 4.6 Import Data ... 54

Gambar 4.7 Edit Sheet ... 55

Gambar 4.8 Edit List Data ... 55

Gambar 4.9 Rule Desicion Tree ... 56

Gambar 4.10 Hasil Accuracy Decission Tree ... 59

Gambar 4.11 Hasil Precision Decission Tree ... 59

Gambar 4.12 Hasil Recall Decission Tree... 60

Gambar 4.13 Hasil AUC Decission Tree ... 61

(15)

xv

Gambar 4.14 Main Process Dacision Tree optimasi Genetika ... 62

Gambar 4.15 Main Process Cross-Validation (CV) optimasi Genetika ... 62

Gambar 4.16 Main Process Dacision Tree optimasi Genetika ... 63

Gambar 4.17 Import Data ... 64

Gambar 4.18 Edit Sheet ... 64

Gambar 4.19 Edit List Data ... 65

Gambar 4.20 Hasil Accuracy Decission Tree Optimasi Genetika... 66

Gambar 4.21 Hasil Precision Decission Tree Optimasi Genetika ... 67

Gambar 4.22 Hasil Recall Decission Tree Optimasi Genetika ... 68

Gambar 4.23 Hasil AUC Decission Tree Optimasi Genetika ... 69

(16)

xvi

DAFTAR GRAFIK

Grafik 4.1 Perbandingan Hasil ... 70

Grafik 4.2 Accurasy ... 71

Grafik 4.3 Precision ... 72

Grafik 4.4 Recall ... 72

Grafik 4.5 AUC ... 73

(17)

xvii

DAFTAR LAMPIRAN

Lampiran 1. Set Data Asli ... 78

Lampiran 2. Data Transfom ... 98

Lampiran 3. Surat Ijin Penelitian ... 130

Lampiran 4. Kartu Kendali Bimbingan Skripsi ... 131

(18)

1

BAB I

PENDAHULUAN

1.1. Latar Belakang

Pendidikan merupakan bidang yang paling penting dalam perkembangan suatu bangsa. Suatu bangsa dikatakan sebagai bangsa maju apabila tingkat pendidikan warganya baik. Pendidikan nasional berfungsi mengembangkan kemampuan dan membentuk watak serta peradaban bangsa yang bermartabat dalam rangka mencerdaskan kehidupan bangsa, bertujuan untuk berkembangnya potensi siswa agar menjadi manusia yang beriman dan bertakwa kepada Tuhan Yang Maha Esa, berakhlak mulia, sehat, berilmu, cakap, kreatif, mandiri, dan menjadi warga negara yang demokratis serta bertanggung jawab. Dalam rangka mewujudkan tujuan dari pendidikan nasional secara optimal maka setiap siswa perlu menempuh jenjang pendidikan formal setidaknya sampai siswa menempuh Sekolah Lanjutan Tingkat Atas (SLTA) dan lebih baik lagi melanjutkan hingga ke Perguruan Tinggi. Jenjang pendidikan formal tersebut dimulai dari pendidikan dasar, pendidikan menengah pertama, kemudian dilanjutkan dengan pendidikan menengah tingkat atas. Pendidikan menengah tingkat atas terdiri atas pendidikan menengah umum dan pendidikan menengah kejuruan. Pendidikan menengah berbentuk sekolah menengah umum (SMA), madrasah aliyah (MA), sedangkan sekolah menengah kejuruan (SMK), madrasah aliyah kejuruan (MAK) atau bentuk lain yang sederajat. Sejalan dengan hal di atas maka setelah lulus SMP (Sekolah Menengah Pertama) setiap siswa kelas IX (sembilan) seharusnya melanjutkan pendidikan ke Sekolah Lanjutan Tingkat Atas (SLTA) baik itu sekolah menengah atas (SMA), madrasah aliyah (MA) atau sekolah menengah kejuruan (SMK), madrasah aliyah kejuruan (MAK). Sehingga siswa kelas IX (sembilan) yang menempuh jenjang pendidikan sekolah menengah pertama (SMP) sudah pasti akan dihadapkan dengan masalah memilih sekolah lanjutan, baik sekolah menengah umum maupun kejuruan.

(19)

2

Pemilihan sekolah lanjutan saat dibangku Sekolah Menengah Pertama, nampaknya merupakan hal yang cukup sulit dan membingungkan bagi pelajar yang duduk di kelas IX, apakah akan memilih sekolah menengah atas atau kejuruan? Tentunya bukan pilihan yang mudah. Siswa Sekolah Menengah Pertama (SMP) berada pada jenjang yang strategis dan kritis bagi perkembangan dan masa depannya. Pada masa ini siswa berada di pintu gerbang pertama untuk memasuki dunia pendidikan tingkat atas yang merupakan wahana untuk membentuk integritas cita-cita yang diinginkan di masa mendatang. Siswa juga berada pada persiapan untuk memasuki dunia kerja yang penuh tantangan dan kompetisi. Putusan para siswa dalam memilih sekolah lanjutan, terkadang di pengaruhi oleh berbagai macam faktor seperti misalnya pendapat orang tua, teman atau figure yang diidolakan. Jika hanya mendasarkan pada factor-faktor tersebut tanpa menelaah kemampuannya, seseorang bisa mengambil putusan yang bertolak belakang dengan minat dan bakatnya. Hal demikian bisa menimbulkan permasalahan misalnya, muncul keengganan untuk belajar sehingga menurunnya kualitas dan prestasi akademik karena salah memilih sekolah lanjutan.

Salah satu pemodelan yang bisa digunakan untuk menentukan rekomendasi pemilihan sekolah lanjutan yaitu dengan penambangan data. Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstrasi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar [1].

Perkembangan penambangan data tidak terlepas dari kemajuan teknologi informasi yang memungkinkan data dalam jumlah yang besar terakumulasi.

Seiring dengan semakin dibutuhkannya penambangan data muncul beberapa algoritma klasifikasi untuk memproses data dalam jumlah besar.

Dengan adanya penelusuran peminatan diharapkan peserta didik dapat meningkatkan kemampuan dalam memilih lanjutan studi dan mempersiapkan diri sebaik mungkin, serta dapat memilih lanjutan studi yang tepat dan sesuai dengan minatnya, mampu mengikuti kegiatan pembelajaran, mampu memahami persyaratan lanjutan atau program studi di sekolah menengah atas (SMA) atau

(20)

3

sekolah menengah kejuruan (SMK), sehingga tidak adanya kesenjangan atau kesulitan dalam memilih lanjutan studi yang sesuai dengan minat dan bakat peserta didik tersebut.

Berdasarkan latar belakang di atas tersebut, maka menjadi suatu hal yang logis apabila penelusuran minat diorientasikan untuk pemilihan minat melanjutkan ke pendidikan yang lebih tinggi, sehingga dapat memberikan alternatif positif bagi peserta didik dalam menatap dan merencanakan masa depannya. Dengan demikian merupakan suatu alasan yang mendasar untuk membahas permasalahan tersebut dalam skirpsi yang berjudul “Optimasi algoritma C4.5 dalam prediksi sekolah lanjutan tingkat atas menggunakan seleksi fitur algoritma genetika di SMP Islam Al-Hikmah Pondok Cabe”.

1.2. Identifikasi Masalah

Dari beberapa uraian yang dikemukakan pada latar belakang, maka dapat diidentifikasi masalah-masalah sebagai berikut :

1. Sulitnya membangun bangsa yang maju dengan mengoptimalkan tingkat pendidikan warga.

2. Banyak terjadinya penurunan kualitas dan prestasi akademik karena keengganan untuk belajar akibat salah memilih sekolah lanjutan.

3. Belum adanya suatu prediksi dengan metode maupun akurasi dalam melihat prediksi sekolah lanjutan yang sesuai dengan minat dan bakat, yang mengakibatkan hasil pendidikan menjadi tidak optimal.

4. Belum adanya suatu hasil untuk melihat maupun implementasi dalam pemilihan sekolah lanjutan SMP Islam Al-Hidayah Pondok Cabe.

1.3. Batasan Masalah

Untuk memudahkan pemahaman dalam skripsi ini, penulis akan menentukan pembatasan masalah dalam penelitian sebagai berikut:

1. Belum adanya suatu prediksi ataupun metode di dalam prediksi dengan metode maupun akurasi dalam melihat prediksi sekolah lanjutan tingkat

(21)

4

atas. Subjek penelitian ini adalah hasil belajar siswa kelas IX (sembilan) SMP Islam Al-Hikmah Pondok Cabe.

2. Belum adanya pengujian prediksi maupun metode dalam memprediksi sekolah lanjutan tingkat atas, dengan algoritma yang digunakan adalah Algoritma C.45.

1.4. Rumusan Masalah

Dari pembatasan masalah diatas, maka masalah yang dapat dirumuskan adalah sebagai berikut :

1. Bagaimana perbandingan prediksi sekolah lanjutan tingkat atas dengan menggunakan metode algoritma C.45 dan optimasi Genetika?

1.5. Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk mengetahui prediksi sekolah lanjutan tingkat atas di SMP Islam Al-Hikmah.

1.6. Manfaat Penelitian

Adapun manfaat yang didapat dari penelitian ini dapat diuraikan sebagai berikut:

1. Bagi sekolah, untuk staff pengajar agar dapat mengetahui apakah penerapan strategi pembelajatannya efektif untuk meningatkan hasil belajar siswa.

2. Bagi siswa, agar lebih meningkatkan lagi proses belajarnya khususnya di Mata Pelajaran yang di minati

3. Bagi para orang tua, baiknya para orang tua dapat terus mendampingi maupun memantau bagaimana nilai yang di dapatkan siswa ketika ada tugas di sekolah maupun di rumah

4. Bagi pembaca, apabila pembaca ingin melakukan penelitian lebih lanjut, maka pembaca dapat melakukan dan mengembangkan penelitian ini dengan banyak faktor lain yang dapat mempengaruhi penjurusan sekolah lanjutan siswa kelas IX.

(22)

5

BAB II

TINJAUAN PUSTAKA DAN LANDASAN TEORI

2.1. Tinjauan Penelitian

Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan pengelohan data yang akurat sehingga bisa langsung digunakan dan dilaporkan.

Penelitian mengenai data mining sebelumnya sudah banyak dilakukan, tetapi tempat dan program aplikasi yang digunakan berbeda-beda. Adapun sistem data mining yang berkaitan yang pernah dibuat adalah sebagai berikut:

1. Penerapan Algoritma C4.5 Untuk Klasifikasi Predikat Keberhasilan Mahasiswa Di Amik Tunas Bangsa [2]. Metode yang digunakan dalam penelitian ini adalah C4.5 untuk mengetahui berdasarkan kriteria apa saja mahasiswa layak mendapatkan predikat keberhasilannya dengan beberapa atribut seperti jenis kelamin, kehadiran, sesi perkuliahan, rerata NEM, dan Asal sekolah. Hasil penelitian yang diperoleh disimpulkan bahwa telah didapat klasifikasi predikat keberhasilan mahasiswa di Amik Tunas Bangsa Pematangsiantar. Variabel yang memiliki prioritas utama terhadap predikat keberhasilan mahasiswa adalah mahasiswa yang memilih sesi perkuliahan pada pagi hari dan didukung dengan nilai kehadiran > 50 maka mahasiswa tersebut mendapatkan predikat cumlaude dibanding dengan mahasiswa yang berada di sesi perkuliahan siang dan malam 2. Optimasi Algoritma C4.5 Dalam Prediksi Web Phishing Menggunakan

Seleksi Fitur Genetic Algoritma [3] Masalah keamanan terbesar salah satunya adalah Phishing yang melibatkan duplikat situs yang sah atau asli untuk menipu dengan mencuri informasi pengguna online. Sangat sulit untuk membedakan situs asli dengan palsu. Dibutuhkan klasifikasi dalam memprediksi website yang terindikasi Phishing. Dengan klasifikasi dalam Algoritma C4.5, permasalahan tersebut dapat diselesaikan dengan menghasilkan rule dari pohon keputusan. Untuk dapat meningkatkan

(23)

6

akurasi dari prediksi algoritma C4.5 dapat digunakan fitur seleksi dengan menggunakan algoritma genetika.

3. Pengujian Kinerja Algoritma C4.5 Untuk Prediksi Pemilihan Minat Lanjutan Pada Siswa SMK Etika [4]. Dalam upaya peningkatan mutu pendidikan di SMK (sekolah menengah kejuruan), sekolah membutuhkan alat bantu yang digunakan untuk memprediksi minat siswa setelah lulus dari SMK (sekolah menengah kejuruan). Penelitian ini membahas proses pembangunan pohon keputusan yang menggunakan algoritma C4.5. Pohon keputusan tersebut kemudian diinterpretasikan kedalam bentuk aturan- aturan keputusan yang mudah dipahami dan digunakan sebagai acuan untuk memprediksi minat lanjutan pada siswa setelah lulus SMK (sekolah menengah kejuruan). Dari data pengujian tersebut diambil kesimpulan bahwa percobaan yang menggunakan enam atribut (termasuk atribut minat siswa) memberikan hasil yang lebih baik dibandingkan dengan percobaan yang hanya menggunakan lima atribut saja.

4. Educational Data Mining & Students’ Performance Prediction [5]. It is important to study and analyse educational data especially students' performance. Educational Data Mining (EDM) is the field of study concerned with mining educational data to find out interesting patterns and knowledge in educational organizations. This study is equally concerned with this subject, specifically, the students' performance. This study explores multiple factors theoretically assumed to affect students' performance in higher education, and finds a qualitative model which best classifies and predicts the students' performance based on related personal and social factors.

5. Penerimaan Calon Siswa Baru dan Penentuan Penjurusan Dengan Algoritma C 4.5 SMK PLUS PGRI 1 Cibinong [6]. Institusi pendidikan saat ini khususnya Sekolah Kejuruan dituntut memiliki daya saing yang unggul di semua sektor dengan memanfaatkan semua sumber daya yang mereka miliki. Metode pohon keputusan adalah struktur bagan alur yang mirip dengan struktur pohon, setiap titik pohon adalah atribut yang telah

(24)

7

diuji, setiap cabang adalah hasil tes, dan titik akhir adalah pembagian kelas yang dihasilkan algoritma C4.5 dan pohon keputusan adalah dua model yang tidak dapat dipisahkan, karena untuk membangun pohon keputusan, diperlukan algoritma C4.5. Dari masalah yang ada, metode digunakan untuk mengklasifikasikan calon siswa berdasarkan jurusan, yaitu dengan menggunakan metode algoritma C.45 dan Aplikasi RapidMiner.

2.2. Tinjauan Pustaka 2.2.1 Definisi Pendidikan

Menurut Undang Undang SISDIKNAS No. 20 tahun 2003, pada jurnal

“Kesenjangan Pendidikan Desa Dan Kota” [7] pendidikan adalah adalah sebagai usaha sadar dan terencana untuk mewujudkan suasana belajar dan proses pembelajaran sedemikian rupa supaya peserta didik dapat mengembangkan potensi dirinya secara aktif supaya memiliki pengendalian diri, kecerdasan, keterampilan dalam bermasyarakat, kekuatan spiritual keagamaan, kepribadian serta akhlak mulia.

Adapun beberapa pengertian pendidikan menurut para ahli :

1. Menurut Soekidjo Notoatmodjo dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan secara umum adalah segala upaya yang direncanakan untuk mempengaruhi orang lain baik individu, kelompok, atau masyarakat sehingga mereka melakukan apa yang diharapkan oleh pelaku pendidikan.

2. Menutut Ki Hajar Dewantara dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan adalah tuntutan di dalam hidup tumbuhnya anak-anak, adapun maksudnya, pendidikan yaitu menuntun segala kekuatan kodrat yang ada pada anak- anak itu, agar mereka sebagai manusia dan sebagai anggota masyarakat dapatlah mencapai keselamatan dan kebahagiaan setinggi-tingginya.

Pendidikan adalah usaha sadar untuk menyiapkan peserta didik melalui kegiatan bimbingan, pengajaran, dan atau latihan bagi peranannya dimasa yang akan datang.

(25)

8

3. Menurut Pusat Bahasa dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan adalah proses pengubahan sikap dan tata laku seseorang atau kelompok orang dalam usaha mendewasakan manusia melalui upaya pengajaran dan pelatihan, proses, cara, dan perbuatan mendidik.

4. Menurut John Stuart Mill dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan adalah meliputi segala sesuatu yang dikerjakan oleh seseorang untuk dirinya atau yang dikerjakan oleh orang lain untuk dia, dengan tujuan mendekatkan dia kepada tingkat kesempurnaan.

5. Menurut John Dewey dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan adalah suatu proses pembaharuan makna pengalaman, hal ini mungkin akan terjadi di dalam pergaulan biasa atau pergaulan orang dewasa dengan orang muda, mungkin pula terjadi secara sengaja dan dilembagakan untuk menghasilkan kesinambungan sosial. Proses ini melibatkan pengawasan dan perkembangan dari orang yang belum dewasa dan kelompok di mana dia hidup.

6. Menurut Edgar Dalle dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan adalah usaha sadar yang dilakukan oleh keluarga, masyarakat, dan pemerintah melalui kegiatan bimbingan, pengajaran, dan latihan, yang berlangsung di sekolah dan di luar sekolah sepanjang hayat untuk mempersiapkan peserta didik agar dapat memainkan peranan dalam berbagai lingkungan hidup secara tetap untuk masa yang akan datang.

7. Menurut M.J. Longeveled dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan adalah usaha, pengaruh, perlindungan, dan bantuan yang diberikan kepada anak agar tertuju kepada kedewasaannya, atau lebih tepatnya membantu anak agar cukup cakap melaksanakan tugas hidupnya sendiri.

(26)

9

8. Menurut Ibnu Muqaffa dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan itu ialah yang kita butuhkan untuk mendapatkan sesuatu yang akan menguatkan semua indera kita seperti makanan dan minuman, dengan yang lebih kita butuhkan untuk mencapai peradaban yang tinggi yang merupakan santapan akal dan rohani.

9. Menurut Plato dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan adalah membantu perkembangan masing-masing dari jasmani dan akal dengan sesuatu yang memungkinkan tercapainya kesempurnaan.

10. Menurut Prof. Richey dalam jurnal “Pendidikan Sepanjang Hayat Menurut Perspektif Islam (Kajian Tafsir Tarbawi)” [8]. Pendidikan adalah yang berkenaan dengan fungsi yang luas dari pemeliharaan dan perbaikan kehidupan suatu masyarakat terutama membawa warga masyarakat yang baru (generasi baru) bagi penuaian kewajiban dan tanggung jawabnya di dalam masyarakat.

Dari beberapa pengertian para tokoh di atas maka dapat disimpulkan bahwa pendidikan adalah bimbingan atau pertolongan yang diberikan/disampaikan oleh orang dewasa kepada perkembangan anak-anak untuk mencapai kedewasaannya dengan tujuan agar anak cukup cakap melaksanakan tugas hidupnya sendiri tidak dengan bantuan orang lain[8].

2.2.2 Definisi Sekolah

Berikut beberapa definisi sekolah menurut pendapat para ahli :

1. Menurut Wayne, dalam jurnal “Hubungan Pengawasan Orang Tua Dengan Tingkat Putus Sekolah” [9]. Sekolah adalah sistem interaksi sosial suatu organisasi keseluruhan terdiri atas interaksi pribadi terkait bersama dalam suatu hubungan organic.

2. Menurut Undang-undang No 2 Tahun 1989, dalam jurnal “Hubungan Pengawasan Orang Tua Dengan Tingkat Putus Sekolah” [9]. Sekolah

(27)

10

adalah satuan pendidikan yang berjenjang dan berkesinambungan untuk menyelenggarakan kegiatan belajar mengajar.

Berdasarkan beberapa pendapat diatas menurut para ahli dapat disimpulkan bahwa sekolah adalah suatu lembaga atau organisasi yang diberi wewenang untuk menyelenggarakan kegiatan pembelajaran. Sebagai suatu organisasi sekolah memiliki persyaratan tertentu.

2.2.3 Definisi Sekolah Menengah Atas (SMA)

Menurut Depdiknas, dalam jurnal “Sistem Pendukung Pengambilan Keputusan Penjurusan”[10]. Sekolah Menengah Atas merupakan jenjang pendidikan menengah yang mengutamakan penyiapan siswa untuk melanjutkan pendidikan yang lebih tinggi dengan pengkhususan. Perwujudan pengkhususan tersebut berupa diselenggarakanya penjurusan di mulai di kelas XI (sebelas), yakni, penjurusan pada Ilmu Pengetahuan Alam (IPA), Ilmu Pengetahuan Sosial (IPS), dan Bahasa yang mulai diterapkan pada siswa sekolah menengah atas (SMA) kelas XI tahun pelajaran 2005 / 2006. Penjurusan merupakan upaya strategis dalam memberikan fasilitas kepada siswa untuk menyalurkan bakat, minat, dan kemampuan yang dimilikinya yang dianggap paling potensial untuk dikembangkan secara optimal. Oleh karena itu, maka sekolah, guru, dan petugas Bimbingan Konseling (BK) harus mampu menempatkan ke dalam jurusan secara tepat. Menempatkan siswa pada jurusan tertentu secara tepat berarti memberikan peluang kepada siswa untuk dapat berhasil pada masa yang akan datang. Hal ini sesuai dengan bunyi pasal 12 Undang-Undang Nomor 20 tahun 2003, bahwa Peserta didik mendapatkan pelayanan pendidikan sesuai dengan bakat, minat, dan kemampuannya.

Untuk menghindarkan kemungkinan terjadi ketidaktepatan penjurusan siswa SMA dalam pilihan jurusan tertentu, perlu ada upaya pengukuran dan penilaian keefektifan perencanaan penjurusan, keefektifan pelaksanaan penjurusan, keberhasilan siswa setelah penjurusan, serta kendala-kendala yang dihadapi dalam penjurusan.

(28)

11

2.2.4 Definisi Sekolah Menengah Kejuruan (SMK)

SMK atau Sekolah Menengah Kejuruan yang disebut adalah bagian terpadu dari Sistem Pendidikan Nasional, yang mempunyai peranan yang sangat penting didalam mempersiapkan dan mengembangankan Sumber Daya Manusia (SDM).

Sekolah Menengah Kejuruan adalah salah salah satu jenjang pendidikan menengah dengan kekhususan mempersiapkan lulusannya untuk siap terjun pada dunia kerja. Menurut Evans dalam jurnal “E-Learning Dengan Aplikasi Edmodo Di Sekolah Menengah Kejuruan” [11]. Pendidikan sekolah kejuruan mempunyai arti yang bervariasi namun dapat dilihat kesamaanya. Pendidikan kejuruan adalah bagian kecil dari sistem pendidikan yang mempersiapkan seseorang atau peserta didik agar lebih mampu bekerja pada suatu kelompok pekerjaan atau satu bidang pekerjaan dari bidang-bidang pekerjaan lainnya yang lebih bervariasi.

Dengan pengertian bahwa setiap bidang studi adalah pendidikan kejuruan sepanjang bidang studi tersebut dipelajari lebih mendalam dan kedalaman tersebut dimaksudkan sebagai bekal memasuki dunia kerja.

Menurut Undang-undang Sisdiknas No. 20 dalam jurnal “E-Learning Dengan Aplikasi Edmodo Di Sekolah Menengah Kejuruan” [11]. Pendidikan nasional berfungsi mengembangkan kemampuan dan membentuk karakter/atitude serta peradaban bangsa yang bermartabat dalam rangka mencerdaskan kehidupan bangsa dan bernegara, yang bertujuan untuk mengembangkan potensi diri peserta didik/siswa agar menjadi manusia yang berkarakter, beriman dan bertakwa kepada Tuhan Yang Maha Esa, berakhlak mulia, sehat, berilmu, cakap, kreatif, mandiri, dan menjadi warga negara yang demokratis serta bertanggung jawab”.

Menurut Depdikbud dalam jurnal “E-Learning Dengan Aplikasi Edmodo Di Sekolah Menengah Kejuruan” [11]. Pendidikan kejuruan merupakan pendidikan menengah yang mempersiapkan peserta didik terutama untuk bekerja di bidang tertentu. Pendidikan kejuruan adalah pendidikan yang mempersiapkan peserta didik untuk dapat bekerja dalam bidang tertentu. Pengertian ini mengandung pesan bahwa setiap institusi yang menyelenggarakan pendidikan kejuruan harus berkomitmen menjadikan tamatannya mampu bekerja dalam bidang tertentu.

(29)

12

Berdasarkan definisi di atas, maka sekolah menengah kejuruan atau juga disebut SMK sebagai sub sistem pendidikan nasional seyogyanya mengutamakan mempersiapkan peserta didik/siswanya untuk mampu memilih karir, memasuki lapangan kerja, berkompetisi, dan mampu mengembangkan dirinya dengan sukses di lapangan kerja yang cepat berubah sesuai dengan tututan perkembangan jaman.

Tercapai tidaknya tujuan di atas sangat tergantung pada masukan dan sejumlah variabel dalam proses pendidikan. Menurut Depdikbud dalam jurnal “E-Learning Dengan Aplikasi Edmodo Di Sekolah Menengah Kejuruan” [11]. Salah satu variabel dalam proses pendidikan yang menentukan ketercapaian tujuan Sekolah Menengah Kejuruan (SMK) adalah kerja sama antara SMK dengan dunia usaha dan dunia pendidikan tinggi. Adanya hubungan yang semakin erat antara SMK dengan dunia pendidikan tinggi, logikanya semakin baik kualitas tamatannya, yang berarti kualitas tamatan dapat ditingkatkan karena di dunia pendidikan tinggi, ilmu dan teknologi akan berkembang.

2.2.5 Definisi Minat

Definisi Minat menurut KBBI dalam jurnal “Pengaruh Intelegensi Dan Minat Siswa Terhadap Putusan Pemilihan Jurusan” [12] adalah kecenderungan hati yang tinggi terhadap sesuatu, gairah, keiginan. Dalam Kamus Psikologi J.P. Chaplin jurnal “Pengaruh Intelegensi Dan Minat Siswa Terhadap Putusan Pemilihan Jurusan” [12] menjelaskan bahwa interest (minat) adalah :

1. Suatu sikap yang berlangsung terusmenerus yang memolakan perhatian seseorang sehingga membuat dirinya jadi selektif terhadap objek minatnya.

2. Perasaan yang menyatakan bahwa satu aktivitas pekerjaan atau objek itu berharga atau berarti bagi individu.

3. Satu keadaan motivasi atau satu set motivasi yang menuntun tingkah laku menuju arah (sasaran tertentu).

(30)

13

Jadi minat terhadap sesuatu merupakan hasil belajar selanjutnya. Walaupun minat terhadap sesuatu merupakan hasil belajar dan menyokong kegiatan belajar selanjutnya. Minat juga merupakan suatu pemusatan perhatian yang tidak di sengaja yang terlahir dengan penuh kemauannya dan yang tergantung dari bakat dan lingkungan. Minat merupakan salah satu faktor penentu dalam keberhasilan pendidikan. Minat sebenarnya bersifat subyektif karena masing-masing orang dapat membedabedakan minatnya. Minat erat sekali hubungannya dengan perasaan suka atau tidak suka, tertarik atau tidak tertarik, senang atau tidak senang.

Dari beberapa uraian para ahli mengenai definisi minat diatas, maka dapat disimpulkan bahwa minat pada hakikatnya adalah adanya rasa kecenderungan atau ketertarikan hati terhadap sesuatu. Dengan adanya minat dalam diri seseorang dapat menjadi suatu dorongan untuk melakukan sesuatu.

2.2.6 Definisi Machine Learning

Machine Learning adalah suatu area dalam artificial intelligence atau kecerdasan buatan yang berhubungan dengan pengembangan teknik-teknik yang bisa diprogramkan dan belajar dari data masa lalu. Pengenalan pola, data mining dan machine learning sering dipakai untuk menyebut sesuatu yang sama. Bidang ini bersinggungan dengan ilmu probabilitas dan statistik kadang juga optimasi.

Machine learning menjadi alat analisis dalam data mining[13]. Belajar dalam hal ini berkaitan dengan bagaimana menuntaskan berbagai tugas yang ada, atau membuat suatu prediksi kesimpulan baru yang akurat dari berbagai pola yang sudah dipelajari sebelumnya. Machine Learning merupakan salah satu bidang yang termasuk dalam kecerdasan buatan yang dapat mempengaruhi berbagai aspek yang lain yaitu statiska, matematika dan berbagai aspek teoritikal dari komputer sains. Pada dasarnya Machine Learning memiliki tujuan untuk mempelajari sebuah algoritma untuk melakukan sistem belajar secara otomatis dengan kontribusi yang sangat minimal yang dilakukan oleh manusia pada

(31)

14

umumnya. Berikut beberapa contoh implementasi dari Machine Learning yang pada umumnya diterapkan :

1. Face Detection, Sebuah sistem yang mampu mengenali wajah dari seseorang untuk memberikan representasi identitas dari orang tersebut.

2. Spam Filtering, Sebuah sistem yang memiliki kemampuan untuk melakukan penyaringan sebuah pesan apakah termasuk spam atau non- spam.

3. Customer Segmentation, Sebuah sistem yang melakukan sebuah prediksi pola perilaku konsumen yang berguna bagi produsen untuk implementasi dan pengaturan biaya dalam hal tertentu misalnya bidang pemasaran.

2.2.7.1 Konsep Pembelajaran Machine Learning

Machine Learning terbagi menjadi 2 macam konsep pembelajaran, yaitu, Supervised Learning dan Unsupervised Learning. Supervised Learning yang merupakan teknik pembelajaran mesin yang membuat suatu fungsi berdasarkan data latihan yang sudah ada, dalam hal ini dapat dikatakan untuk teknik ini sudah tersedia data latihan secara detil dan terklasifikasi dengan baik yang akan dijadikan sebuah model data saat dilakukan proses ujicoba dengan data tes yang baru dan menghasilkan hasil keluaran yang sesuai diharapkan sebelumnya berdasarkan data latihan yang ada. Unsupervised Learning yang merupakan teknik pembelajaran mesin yang berusaha untuk melakukan representasi pola sebuah input yang berasal dari data latihan dan salah satu yang menjadi perbedaan dengan Supervised Learning adalah tidak adanya pengklasifikasian dari input data.

Dalam Machine Learning teknik Unsupervised Learning menjadi esensial karena sistem kerja yang diberikan sama dengan cara kerja otak manusia dimana dalam proses pembelajaran tidak ada role model atau informasi dan contoh yang tersedia untuk dijadikan sebagai model dalam melakukan proses ujicoba untuk penyelesaian sebuah masalah dengan data yang baru.

(32)

15 2.2.7.2 Algoritma Machine Learning

Berikut beberapa contoh algoritma dari konsep pembelajaran Supervised Learning :

1. Logistic Regression, merupakan suatu teknik statistik yang juga digunakan untuk penyelesaian masalah dengan menghasilkan sebuah prediksi variabel baru berdasarkan beberapa variabel yang sudah ada dan ditentukan sebelumnya dan mencari hubungan keterkaitan antara variabel input data variabel yang sudah ditentukan dengan variabel output atau variabel prediksi yang baru.

2. K-Nearest Neighbors Algorithm (KNN), merupakan sebuah metode yang digunakan dalam penyelesaian masalah klasifikasi sebuah objek dengan melakukan implementasi featurespace dimana sebuah objek yang menjadi data training dan dijadikan sebuah model data diberikan pembobotan nilai dan direpresentasikan ke dalam n-dimensional vektor. Kemudian penyelesaian masalah dilakukan dengan mengukur jarak terdekat objek baru dengan model data yang ada di dalam n-dimensional vektor lalu dilakukan proses pemberian sebuah kategori pada objek baru tersebut.

Berikut contoh algoritma dari konsep pembelajaran Unsupervised Learning:

1. Clustering, suatu metode pembentukan pola dasar dari sebuah objek yang digunakan untuk melakukan penyelesaian permasalahan dalam kasus machine learning seperti klasifikasi atau kategorisasi objek ke dalam sebuah kelas atau kategori. Terbentuknya pola dasar ini dilakukan dengan menggunakan beberapa feature yang ditentukan dan hal ini dilakukan karena data yang dijadikan sebagai model data belum terdefinisi kelompok datanya sehingga tidak bisa menentukan klasifikasi sebuah objek, setelah mendapatkan pola dasar yang terbentuk kemudian dapat dijadikan sebuah model data dan dijadikan data training dalam kasus kategorisasi objek baru.

(33)

16 2.2.7 Data Mining

Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar, menurut Davies pada jurnal “Sistem Aplikasi Data Mining Untuk Menampilkan Informasitingkat Kelulusan Mahasiswa” [13]. Menurut Pramudiono pada jurnal “Sistem Aplikasi Data Mining Untuk Menampilkan Informasitingkat Kelulusan Mahasiswa” [13], Data mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data Menurut Santoso pada jurnal “Sistem Aplikasi Data Mining Untuk Menampilkan Informasitingkat Kelulusan Mahasiswa” [13]. Data mining sering juga disebut sebagai knowledge discovery in database (KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar. Data mining adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimpan dalam database, data warehouse, atau penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu lain, seperti database system, data warehousing, statistik, machine learning, information retrieval, dan komputasi tingkat tinggi.

Selain itu, data mining didukung oleh ilmu lain seperti neural network, pengenalan pola, spatial data analysis, image database, signal processing, menurut Han pada jurnal “Sistem Aplikasi Data Mining Untuk Menampilkan Informasitingkat Kelulusan Mahasiswa” [13].

Menurut Witten dalam jurnal “Sistem Aplikasi Data Mining Untuk Menampilkan Informasitingkat Kelulusan Mahasiswa”[13], Data mining didefinisikan sebagai proses menemukan pola-pola dalam data. Proses ini otomatis atau seringnya semiotomatis. Pola yang ditemukan harus penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan secara ekonomi.

Data yang dibutuhkan dalam jumlah besar. Pramudiono dalam bukunya Kusrini mengatakan Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual dalam jurnal “Klasifikasi Nasabah Menggunakan Algoritma C4.5

(34)

17

Sebagai Dasar Pemberian Kredit”[14]. Karakteristik data mining sebagai berikut menurut Davies, pada jurnal “Sistem Aplikasi Data Mining Untuk Menampilkan Informasitingkat Kelulusan Mahasiswa” [13] :

1. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan pola data tertentu yang tidak diketahui sebelumnya.

2. Data mining biasa menggunakan data yang sangat besar. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya.

3. Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi.

Berdasarkan beberapa pengertian tersebut dapat ditarik kesimpulan bahwa data mining adalah suatu teknik menggali informasi berharga yang terpendam atau tersembunyi pada suatu koleksi data (database) yang sangat besar sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak diketahui. Kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Karena itu data mining sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan database. Beberapa metode yang sering disebut dalam literatur data mining antara lain clustering, classification, association rules mining, neural network, genetic algorithm dan lain-lain[13].

2.2.8.1 Fungsi dan Tugas Data Mining

Data mining menganalisis data menggunakan tool untuk menemukan pola dan aturan dalam himpunan data. Perangkat lunak bertugas untuk menemukan pola dengan mengidentifikasi aturan dan fitur pada data. Tool Data mining diharapkan mampu mengenal pola ini dalam data dengan input minimal dari user. Dalam penelitian ini pembahasan Data Mining diklasifikasikan dalam fungsi Association.[15]

Data mining mempunyai fungsi yang penting untuk membantu mendapatkan informasi yang berguna serta meningkatkan pengetahuan bagi pengguna. Pada dasarnya, data mining mempunyai empat fungsi dasar yaitu:

(35)

18

1. Fungsi Prediksi (prediction), Proses untuk menemukan pola dari data dengan menggunakan beberapa variabel untuk memprediksikan variabel lain yang tidak diketahui jenis atau nilainya.

2. Fungsi Deskripsi (description), Proses untuk menemukan suatu karakteristik penting dari data dalam suatu basis data.

3. Fungsi Klasifikasi (classification), Klasifikasi merupakan suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta dapat meramalkan kecenderungan data pada masa depan.

4. Fungsi Asosiasi (association), Proses ini digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data.

2.2.8.2 Pengelompokan Data Mining

Menurut Larose, dalam jurnal “Data Mining Menggunakan Algoritma Naïve Bayes Untuk Klasifikasi Kelulusan Mahasiswa Universitas Dian Nuswantoro“

[16]Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat di lakukan, yaitu :

1. Deskripsi

Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecendrungan yang terdapat dalam data.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke arah numerik dari pada ke arah kategori.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa mendatang.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori.

(36)

19 5. Pengklusteran

Clustering merupakan suatu metode untuk mencari dan mengelompokkan data yang memiliki kemiripan karakteriktik (similarity) antara satu data dengan data yang lain. Clustering merupakan salah satu metode data mining yang bersifat tanpa arahan (unsupervised).

6. Asosiasi

Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.

2.2.8.3 Tahapan Data Mining

Data mining sebenarnya merupakan salah satu bagian proses Knowledge Discovery in Database (KDD) yang bertugas untuk mengekstrak pola atau model dari data dengan menggunakan suatu algoritma yang spesifik. Adapun proses KDD sebagai berikut [17]:

1. Data Selection, pemilihan data dari sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.

2. Preprocessing , sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning dengan tujuan untuk membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi). Juga dilakukan proses enrichment, yaitu proses “memperkaya” data yang sudah ada dengan data atau informasi lain yang relevan dan diperlukan untuk KDD, seperti data atau informasi eksternal.

3. Transformation yaitu proses coding pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Prosescoding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam database.

4. Data mining, proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu.

(37)

20

5. Interpretation / Evaluation, pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya atau tidak. Data miningjuga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Tahapan-tahapan pada data mining dapat digambarkan seperti berikut :

Gambar 2.1 Tahap Data Mining Sumber : M. A. Sembiring (2016,6) 2.2.8 Pengertian Klasifikasi

Klasifikasi dapat digambarkan sebagai berikut. Data input, disebut juga training set, terdiri atas banyak contoh (record), yang masing-masing memiliki beberapa atribut. Selanjutnya, tiap contoh diberi sebuah label class khusus.

Tujuannya untuk menganalisa data input dan mengembangkan deskripsi atau model akurat untuk tiap class menggunakan fitur-fitur pada data. Deskripsi class ini digunakan untuk mengklasifikasikan data pengujian lainnya dengan label class tidak diketahui. Deskripsi tersebut juga dapat digunakan untuk memahami tiap

(38)

21

class dalam data. Aplikasi-aplikasi klasifikasi antara lain berupa credit approval, target marketing, medical diagnosis, treatment effectiveness, store location, dll.[18]

2.2.9 Definisi Decision Tree / Classification Tree

Decision tree adalah teknik model prediksi yang dapat digunakan untuk klasifikasi dan prediksi tugas. Decision tree menggunakan teknik “membagi dan menaklukkan” untuk membagi ruang pencarian masalah menjadi himpunan masalah.

Proses pada decision tree adalah mengubah bentuk data tabel menjadi sebuah model tree. Model tree akan menghasilkan rule dan disederhanakan. Data dalam decision tree biasanya dinyatakan dalam bentuk tabel dengan atribut dan record.

Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan tree.

Decision tree merupakan salah satu teknik klasifikasi terhadap objek atau record. Teknik ini terdiri dari kumpulan decision node, dan dihubungkan oleh cabang, bergerak ke bawah dari root node sampai berakhir di leaf node. Konsep dasar pohon keputusan, menurut Yusuf W dalam jurnal “Penerapan Algoritma C4.5 Untuk Memprediksi Nilai Kelulusan Siswa Sekolah Menengah Berdasarkan Faktor Eksternal” [19].

Gambar 2.2 Pola Decision Tree

Sumber : R. H. Pambudi and B. D. Setiawan (2018,3)

(39)

22 2.2.10 Definisi Algoritma C4.5

Beberapa pengembangan yang dilakukan pada C4.5 adalah sebagai antara lain bisa mengatasi missing value, bisa mengatasi contiu data, dan pruning[14].

Algoritma C4.5 merupakan salah satu teknik decision tree yang sering digunakan, yang menghasilkan beberapa aturan-aturan dan sebuah pohon keputusan dengan tujuan untuk meningkatkan keakuratan dari prediksi yang sedang dilakukan, di samping itu algoritma C4.5 merupakan algoritma yang mudah dimengerti[14].

Menurut Kusrini Et Al dalam durnal “Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit” [14], Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut :

1. Pilih atribut sebagai akar

2. Buat cabang untuk tiap-tiap nilai 3. Bagi kasus dalam cabang

Ulangi proses untuk setiap cabang sampai semua kasus pada cabang memiliki kelas yang sama. Algoritma C4.5 mempunyai prinsip dasar kerja yang sama dengan Algoritma ID3, tetapi memiliki beberapa perbedaan yaitu :

1. Dapat menangani atribut diskrit dan numerik/kontinyu.

2. Dapat menangani training data dengan missing value.

3. Hasil pohon keputusan dipangkas (pruning) setelah dibentuk.

4. Pemilihan atribut dilakukan menggunakan gain ratio.

Algoritma C4.5 menggunakan metode pessimistic pruning, metode pessimistic pruning memangkas subtree didasarkan dari tingkat kesalahan training dataset dan tidak memerlukan prune set. Dalam memilih kelas default, C4.5 memilih kelas yang memiliki training tuples dengan aturan yang paling sedikit. Terdapat beberapa tahapan dalam membangun decision tree menggunakan Algoritma C4.5 yaitu :

1. Pilih Atribut sebagai akar berdasarkan gain paling tinggi 2. Nilai pada Atribut yang terpilih akan menjadi cabang.

3. Tentukan Atribut selanjutnya untuk menjadi cabang berdasarkan klasifikasi nilai dari Atribut sebelumnya menggunakan gain nilai tersebut.

(40)

23

4. Ulangi langkah pertama sampai langkah ketiga sampai semua syarat terpenuhi.

5. Syarat tersebut adalah semua kasus pada cabang memiliki kelas yang sama da tidak ada Atribut yang dapat dipartisi.

Atribut yang dipilih sebagai akar adalah atribut yang memiliki nilai gain paling tinggi. Atribut numerik akan menggunakan gain ratio, sedangkan atribut diskrit menggunakan information gain. Nilai gain ratio didapat dari hasil pembagian information gain dengan split info. Nilai information gain didapat dari nilai entropy target dikurang nilai entropy tiap values/record dalam atribut.

Entropi merupakan peluang kemunculan suatu record dalam atribut. Rumus information gain adalah sebagai berikut :

Gambar 2.3 Rumus Gain Sumber : M. A. Sembiring (2016,7)

Keterangan :

S : Himpunan Kasus

A : Atributn atau Jumlah partisi Atribut A

|Si| : Jumlah kasus pada partisi ke i

|S| : Jumlah kasus dalam S

Rumus Entropy target adalah sebagai berikut :

Gambar 2.4 Rumus Entropy Sumber : M. A. Sembiring (2016,7)

(41)

24 Keterangan :

S : Himpunan kasus n : Jumlah partisi S

pi : Proporsi dari Si terhadap S 2.2.11 Pengertian Algoritma Genetika

Pada tahun 1970 Algortima Genetica (GA) diperkenalkan oleh John Holland di Universitas Michigan (J.H. Holland, 1975), bahwa dari bagian masalah merupakan bentuk dari adaptasi dari alam maupun buatan yang dapat diformulakan mejadi bagian genetika (Suryanto, 2007). GA merupakan bagian optimasi dan pencarian yang didasarkan pada seleksi alam dan seleksi makluk hidup secara apa adanya. Pada akhirnya, mengembalikan satu bagian yang terbaik yang dijadikan solusi dari masalah yang akan dipecahkan sebagai kromosom (Desiani, A., & Muhammad, A, 2006) Ada tiga aspek dalam dalam menggunakan GA dalam jurnal “Optimasi Algoritma C4.5 Dalam Prediksi Web Phishing Menggunakan Seleksi Fitur Genetic Algoritma “[3] :

1. Definisi fungsi objektif/definisi

2. Definisi dan implementasi representasi genetika.

3. Definisi dan implementasi dari operator genetica.

Setiap masalah yang berbentuk adaptasi (alami maupun buatan) dapat diformulasikan dalam terminologi genetika[20]. Algoritma genetika adalah simulasi dari proses evolusi Darwin dan operasi genetika atas kromosom.

Pada algoritma genetika, teknik pencarian dilakukan sekaligus atas sejumlah solusi yang mungkin dikenal dengan istilah populasi. Individu yang terdapat dalam satu populasi disebut dengan istilah kromosom. Kromosom ini merupakan suatu solusi yang masih berbentuk simbol. Populasi awal dibangun secara acak, sedangkan populasi berikutnya merupakan hasil evolusi kromosom- kromosom melalui iterasi yang disebut dengan generasi. Pada setiap generasi, kromosom akan melalui proses evaluasi dengan menggunakan alat ukur yang disebut dengan fungsi fitness. Nilai fitness dari suatu kromosom akan menunjukkan kualitas dari kromosom dalam populasi tersebut.

Gambar

Gambar 2.1 Tahap Data Mining  Sumber : M. A. Sembiring (2016,6)  2.2.8  Pengertian Klasifikasi
Gambar 2.2 Pola Decision Tree
Gambar 2.5 Kerangka Pemikiran Permasalahan
Gambar 3.1 Struktur Organisasi
+7

Referensi

Dokumen terkait

[r]

Berikut ini adalah salinan e-mail permohonan izin penggunaan e-book Modern Analytical Chemistry yang sebelumnya telah diterbitkan oleh McGrawHill dan kini telah dikembalikan

Adaptasi Peranan Suami pada Keluarga Tenaga Kerja Wanita (TKW) Luar Negeri (Studi Kasus pada Suami yang Ditinggal Istri Pergi Bekerja ke Luar Negeri di Desa Sumbersari,

Tujuan dari penelitian ini adalah untuk mengetahui besar derajat kecembungan profil jaringan keras dan jaringan lunak wajah pada pasangan kembar (identik), serta

Serikat menjadi satu-satunya negara superpower yang mendominasi konteks hubungan internasional dalam segala dimensinya (militer, politik, ekonomi,

[r]

Biocontrol of potato cyst nematode Globodera rostochiensis was studied on potato using three isolates of rhizobacter from Banjarnegara (Pseudomonas diminuta,

[r]