• Tidak ada hasil yang ditemukan

Implementasi Metode ID3 untuk memprediks

N/A
N/A
Protected

Academic year: 2018

Membagikan "Implementasi Metode ID3 untuk memprediks"

Copied!
91
0
0

Teks penuh

(1)

Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa

sepulang kuliah dan kululusan mahasiswa

SKRIPSI

Diajukan Sebagai Salah Satu Syarat

Untuk Mencapai Gelar Sarjana Strata Satu

Jurusan Teknik Informatika

Oleh :

AANG SETIAWAN

NIM : 12.10802.00229

FAKULTAS TEKNIK

JURUSAN TEKNIK INFORMATIKA

(2)

LEMBAR PERNYATAAN

Yang bertanda tangan dibawah ini :

Nama : Aang Setiawan

Tempat, Tanggal Lahir : Sidoarjo, 20 November 1992

NIM : 12.10802.00229

Fakultas / Jurusan : Teknik / Teknik Informatika

Menyatakan bahwa Skripsi yang berjudul “Implementasi metode ID3 untuk mempredksi kegiatan mahasiswa sepulang kuliah dan kelulusan mahasiswa” adalah bukan Skripsi orang lain, baik sebagian maupun keseluruhan, kecuali dalam bentuk kutipan yang telah disebutkan sumbernya.

Demikian surat pernyataan ini saya buat dengan sebenar-benarnya dan apabila pernyataan ini tidak benar, saya bersedia mendapatkan sanksi akademis.

Sidoarjo, 22 Juni 2016 Yang menyatakan,

(3)

LEMBAR PERSETUJUAN

Telah Diperiksa dan Disetujui

Isi Laporan Skripsi Ini

LAPORAN SKRIPSI

Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa

sepulang kuliah dan kululusan mahasiswa

Disusun Oleh :

Nama : Aang Setiawan

NIM : 12.10802.00229

Menyetujui,

Dosen Pembimbing

Mochamad Alfan Rosid, S.Kom, M.Kom

FAKULTAS TEKNIK

JURUSAN TEKNIK INFORMATIKA

(4)

LEMBAR PENGESAHAN

Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa

sepulang kuliah dan kululusan mahasiswa

Skripsi disusun untuk salah satu syarat memperoleh gelar

Sarjana Komputer (S.Kom)

Di Universitas Muhammadiyah Sidoarjo

Oleh :

Aang Setiawan

12.10802.00229

Tanggal ujian : 22 Juni 2016 Disetujui oleh :

1. Mochamad Alfan Rosid, S.Kom, M.Kom NIK. 210381

..………. (Pembimbing) 2. Hindarto, S.Kom.,MT.

NIK. 201198

..………. (Penguji 1) 3. Yulian Findawati, ST, M.MT

NIK. 208356

..………. (Penguji 2)

Dekan Fakultas Teknik,

Izza Anshory, ST, MT

(5)

Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa

sepulang kuliah dan kululusan mahasiswa

Nama : Aang Setiawan NIM : 121080200229

Pembimbing : Mochamad Alfan Rosid, S.Kom, M.Kom

ABSTRAK

Seorang mahasiswa dinyatakan lulus tepat waktu jika dapat menyelesaikan pendidikan selama minimal 8 semester atau 4 tahun. Untuk mewujudkan hal tersebut, perkembangan nilai Indeks Prestasi sangat membantu dalam proses penyelesaian skripsi suatu mahasiswa. Dengan memantau hasil belajar di Universitas berupa nilai IP tiap semester, seorang mahasiswa dapat dinyatakan lulus tepat waktu atau tidak. Pada penelitian ini dibuat aplikasi untuk Memprediksi kegiatan mahasiswa sepulang kuliah dan tingkat kelulusan mahasiswa. Harapan dengan adanya metode ini semua mahasiswa dapat diprediksi kegiatannya saat sepulang kuliah dan tingkat kecepatan studinya, sehingga kepada mereka dapat diberikan early warning atau peringatan dini agar lebih memperbaiki sistem belajarnya lagi.

Pohon Keputusan merupakan salah satu teknik terkenal dalam data mining dan merupakan salah satu metode yang populer dalam menentukan keputusan suatu kasus. Hal ini karena metode ini tidak memerlukan proses pengelolaan pengetahuan terlebih dahulu dan dapat menyelesaikan dengan sederhana kasus-kasus yang memiliki dimensi yang besar. ID3 merupakan algoritma pohon keputusan yang sering digunakan untuk membuat suatu pohon keputusan karena memiliki tingkat akurasi yang tinggi dalam menentukan keputusan.

Dalam laporan ini dibahas kinerja algoritma pohon keputusan ID3 untuk memprediksi kegiatan mahasiswa sepulang kuliah dan kelulusan mahasiswa. Dari penelitian yang dilakukan, diketahui yang digunakan sebagai data master disini adalah alumni mahasiswa universitas muhammadiyah sidoarjo sebanyak 60 dan yang menjadi data testing disini adalah mahasiswa semester 7 sebanyak 30. Disini 60 data dihitung secara manual menggunakan metode ID3 dan 30 data dihitung di program aplikasi. Hasil akhir dari penelitian ini membuktikan bahwa algoritma ID3 memiliki tingkat akurasi dengan nilai rata-rata sebesar 91.111 %.

(6)

Implementasi Metode ID3 untuk memprediksi kegiatan mahasiswa

sepulang kuliah dan kululusan mahasiswa

By : Aang Setiawan Student Identity Number : 121080200229

Supervisor : Mochamad Alfan Rosid, S.Kom, M.Kom

ABSTRACT

One student stated Pass Timely Education IF can be completed for at least 8 semesters OR 4 Years. To review the HAL realize , Progress Value Achievement Index Very helpful hearts Resolution Process A student thesis . Article Search Google monitor the results to the University each semester Form IP Value , A student can be declared Passed On Time OR NOT . ON Research Singer Made Application for review Predicting student activities after classes and Graduation rates of students . WITH their expectations singer method ALL students can be predicted after classes and activities currently SPEED Level studies, so that they can not be shown to be given early warning in order MORE OR Early Warning System Improving learning Again.

Decision Trees is one of the well-known technique in data mining and is one popular method in the decision making of a case. This is because this method does not require any prior knowledge management process and can be completed with simple cases that have huge dimensions. ID3 is a decision tree algorithms are often used to create a decision tree because it has a high degree of accuracy in determining the decision.

In this report discussed the performance of ID3 decision tree algorithm to predict student activities after classes and graduation . From research conducted , known as master data that is used here is an alumnus of the university students of Muhammadiyah Sidoarjo 60 and into the data of testing here is a 7th semester student as much as 30. Here 60 are

calculated manually using ID3 and 30 are calculated on the application program . The end result of this study proves that the ID3 algorithm has an accuracy rate with an average value of 91 111 % .

(7)

MOTTO

“ Pendidikan merupakan perlengkapan paling baik untuk hari tua.” (Aristoteles)

“ Tiada kata terlambat untuk berbuat kebaikan.” (Aang Setiawan)

PERSEMBAHANKU

Puji syukur kehadirat Allah SWT sehingga Skripsi ini dapat terselesaikan dengan baik. Tidak lupa ucapan terima kasih kepada :

 Keluarga ku terutama kedua orang tua ku yang tiada henti yang selalu mendo'akan ku, memberikan dorongan dan motivasi sehingga Skripsi ini terselesaikan.

 Bapak Mochamad Alfan Rosid, S.Kom, M.Kom, selaku dosen pembimbing yang sabar memberikan bimbingan dan solusi atas permasalahan selama mengerjakan Skripsi ini.

 Hindarto, S.Kom, MT, Yulian Findawati, ST., MMT., selaku dosen penguji yang memberikan saran dan ilmu guna perbaikan pada penulis dimasa depan.  Teman-teman kelas Sore - D Angkatan 2012, terima kasih untuk do'a dan

semangatnya.

(8)

KATA PENGANTAR

Syukur Alhamdulillah atas kehadirat Allah S.W.T karena atas rahmat dan hidayah-Nya akhirnya laporan skripsi ini dapat saya selesaikan. Adapun maksud penulisan laporan skripsi ini adalah sebagai syarat untuk pelaksanaan mata kuliah Skripsi dalam menyelesaikan program studi Strata satu (S1) di Universitas Muhammadiyah Sidoarjo. Oleh karenanya, pada kesempatan ini penulis ingin mengucapkan banyak terima kasih kepada :

1.

Drs.Hidayatulloh,M.Si., selaku Rektor Universitas Muhammadiyah Sidoarjo

2.

Izza Anshory, ST., MT., selaku Dekan Fakultas Teknik

3.

Yulian Findawati, ST., MMT., selaku Kaprodi Teknik Informatika

4.

Mochamad Alfan Rosid, S.Kom., M.Kom., selaku Dosen Pembimbing 5. Kedua orang tua saya yang selalu mendukung proses akademik saya

Penulis mendoakan untuk semua pihak yang telah membantu penulis mendapatkan imbalan yang lebih dan senantiasa diberkahi rahmat berlimpah dari Allah SWT. Aamiin. Semoga dengan terselesaikannya skripsi dan laporannya ini dapat memberikan manfaat bagi penulis dan pembaca. Penulis menyadari bahwa skripsi dan laporan ini masih jauh dari kesempurnaan. Mengingat terbatasnya pengetahuan dan kemampuan penulis, oleh karenanya penulis memohon maaf dan selalu terbuka untuk menerima kritik dan saran dari pembaca.

Sidoarjo, 20 Mei 2016

(9)

DAFTAR ISI

HALAMAN JUDUL ... i

LEMBAR PERSETUJUAN ... ii

DAFTAR ISI ... iii

DAFTAR GAMBAR ... v

DAFTAR TABEL ... vi

DAFTAR RUMUS ... vii

ABSTRAK ... viii

BAB I : PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 2

1.3 Batasan Masalah ... 2

1.4 Tujuan Penelitian ... 3

1.5 Manfaat Penelitian ... 3

1.6 Sistematika Penulisan ... 4

BAB II : TINJAUAN PUSTAKA dan DASAR TEORI ... 6

2.1 Penelitian Terdahulu ... 6

2.2 Definisi Mahasiswa ... 8

2.3 Data Mining ... 9

2.3.1 Pengelompokan Data Mining ... 10

2.3.2 Tahapan Proses dalam Data Mining ... 12

2.4 Klasifikasi Metode Data Mining ... 13

2.5 Teori Pemrograman ... 21

2.5.1 PHP & MySQL ... 21

2.6 Perangkat Pemodelan Sistem dalam Pembuatan suatu Program ... 21

2.6.1 Basis Data (DataBase) ... 21

2.6.2 Data Flow Diagram (DFD) ... 23

(10)

BAB III : METODOLOGI PENELITIAN ... 25

3.1 Lokasi Penelitian ... 25

3.2 Alat dan Bahan Penelitian ... 25

3.3 Kerangka Penelitian ... 26

3.4 Tahap Pengumpulan Data ... 27

3.5 Analisa ... 27

3.5.1 Perhitungan Hasil Analisa Data Latih ... 27

3.5.1 Perhitungan Hasil Analisa Data Testing ... 37

3.6 Diagram Alir (FlowChart) ... 47

3.7 Analisa Sistem ... 48

3.7.1 Diagram Konteks ... 48

3.7.2 Data Flow Diagram ... 49

3.7.3 Struktur Data ... 50

3.8 Desain Interface Program ... 54

3.9 Jadwal Kegiatan ... 57

BAB IV : HASIL DAN PEMBAHASAN ... 58

4.1 Hasil Penelitian ... 58

4.2 Hasil Pengujian ... 84

4.3 Proses Data Mining ... 85

BAB V : PENUTUP ... 86

5.1 Kesimpulan ... 86

(11)

DAFTAR GAMBAR

Gambar 2.1 Tahapan Proses dalam Data Mining ... 12

Gambar 2.2 Pohon Keputusan dengan Simpul Akar Asset ... 17

Gambar 2.3 Entitas Luar ... 23

Gambar 2.4 Arus Data ... 23

Gambar 2.5 Nama Proses ... 23

Gambar 2.6 Data Store ... 24

Gambar 2.7 Simbol-simbol FlowChart ... 24

Gambar 3.1 Langkah-langkah Penelitian secara Skematis ... 26

Gambar 3.2 (Data Latih) Pohon Keputusan untuk Atribut IPK ... 31

Gambar 3.3 Pohon Keputusan untuk Memperoleh Hasil dari IPK 2.75 ... 31

Gambar 3.4 Pohon Keputusan untuk Atribut IPK dan Kegiatan ... 33

Gambar 3.5 Pohon Keputusan untuk Memperoleh Hasil dari IPK 3.30 ... 34

Gambar 3.6 Pohon Keputusan untuk Memperoleh Hasil dari IPK 3.50 ... 35

Gambar 3.7 Hasil Keseluruhan untuk Pohon Keputusan ... 35

Gambar 3.8 (Data Testing) Pohon Keputusan untuk Atribut IPK ... 41

Gambar 3.9 Pohon Keputusan untuk Memperoleh Hasil dari IPK 2.75 ... 41

Gambar 3.10 Pohon Keputusan untuk Atribut IPK dan Kegiatan ... 43

Gambar 3.11 Pohon Keputusan untuk Memperoleh Hasil dari IPK 3.30 ... 44

Gambar 3.12 Pohon Keputusan untuk Memperoleh Hasil dari IPK 3.50 ... 45

Gambar 3.13 Hasil Keseluruhan untuk Pohon Keputusan ... 45

Gambar 3.14 Flowchart Aplikasi ID3 ... 47

Gambar 315 Diagram Konteks ... 48

Gambar 3.16 DFD Level 1 ... 49

Gambar 3.17 Menu Login ... 51

Gambar 3.18 Menu Utama ... 52

Gambar 3.19 Menu Home ... 52

(12)

Gambar 3.21 Menu Data Klasifikasi... 53

Gambar 3.22 Menu Data Latih ... 53

Gambar 3.23 Menu Tentang ... 53

Gambar 4.1 Menu Login ... 60

Gambar 4.2 Menu Home ... 63

Gambar 4.3 Data Master ... 69

Gambar 4.4 Menu Data Klasifikasi ... 72

Gambar 4.5 Menu Proses Prediksi ... 78

Gambar 4.6 Menu Generate Rule Set ... 82

(13)

DAFTAR TABEL

Tabel 2.1 Perbedaan Penelitian Terdahulu dengan Penelitian sekarang ... 7

Tabel 2.2 Data untuk Klasifikasi Resiko Kredit ... 16

Tabel 2.3 Nilai Entropy dan Gain untuk Menentukan Simpul Akar ... 18

Tabel 3.1 Hasil Analisa (Data Latih) ... 27

Tabel 3.2 Himpunan IPK 2.75 ... 31

Tabel 3.3 Himpunan IPK 3.00 ... 32

Tabel 3.4 Himpunan IPK 3.30 ... 34

Tabel 3.5 Himpunan IPK 3.50 ... 34

Tabel 3.6 Hasil Analisa (Data Testing) ... 37

Tabel 3.7 Himpunan IPK 2.75 ... 41

Tabel 3.8 Himpunan IPK 3.00 ... 42

Tabel 3.9 Himpunan IPK 3.30 ... 44

Tabel 3.10 Himpunan IPK 3.50 ... 44

Tabel 3.11 Admin ... 50

Tabel 3.12 Data Latih ... 50

Tabel 3.13 Data Testing ... 50

Tabel 3.14 Jadwal Kegiatan ... 54

(14)

DAFTAR RUMUS

Rumus 2.1 Entropy ... 14

Rumus 2.2 Atribut ... 14

Rumus 2.3 Nilai Entropy ... 15

Rumus 2.4 Nilai Gain ... 15

Rumus 2.5 Hitung Nilai Entropy ... 16

Rumus 2.6 Hitung Nilai Gain ... 17

(15)

BAB 1

PENDAHULUAN

1.1 Latar Belakang

Mahasiswa merupakan aspek penting dalam evaluasi keberhasilan penyelenggaraan program studi pada suatu perguruan tinggi khususnya di Universitas Muhammadiyah Sidoarjo. Dalam masa pembelajarannya, mahasiswa berkembang untuk meningkatkan pola pikir kecerdasan sebagai langkah awal untuk memasuki dalam persaingan di dunia kerja dan lingkungan masyarakat kelak. Kualitas dari sebuah perguruan tinggi selain dapat dilihat dari rata-rata jumlah kelulusan Mahasiswa yang tepat waktu, juga dapat dilihat dari kegiatan Mahasiswa itu sendiri saat sepulang kuliah yang akan sangat berpengaruh pada nilai Indeks Prestasi, dan kegiatan mahasiswa sepulang kuliah juga dapat mencerminkan nama baik atau buruknya Universitas dimata masyarakat. Khusus mengenai evaluasi standar mahasiswa dan lulusan, komponen yang dinilai adalah system rekrutmen mahasiswa baru, dan lulusan ( rata-rata studi dan IPK ).

(16)

ID3 singkatan dari Iterative Dichotomiser Three. Ada juga yang menyebut Induction of Decision Tree. ID3 adalah suatu algooritma matematika yang digunakan untuk menghasilkan suatu pohon keputusan yang mampu mengklasifikasi suatu obyek. ID3 diperkenalkan pertama kali oleh Ross Quinlan (1979). ID3 merepresentasi konsep-konsep dalam bentuk pohon keputusan. Aturan-aturan yang dihasilkan oleh ID3 mempunyai relasi yang hirarkis seperti suatu pohon (mempunyai akar, titik, cabang, dan daun). Beberapa peneliti menyebut struktur model yang dihasilkan ID3 sebagai pohon keputusan (decision tree) sementara peneliti yang lain menyebutnya pohon aturan (rule tree).

1.2 Rumusan Masalah

Berdasarkan dari uraian latar belakang di atas maka dapat dirumuskan suatu permasalahan antara lain :

1. Bagaimana menerapkan metode ID3 untuk dapat memprediksi kegiatan mahasiswa sepulang kuliah dan memprediksi tingkat kelulusan mahasiswa ?

1.3 Batasan Masalah

Agar dalam pengerjaan Skripsi ini dapat lebih terarah, maka pembahasan penulisan ini dibatasi pada ruang lingkup pembahasan sebagai berikut:

1. Jenis indikator yang akan menjadi objek analisa penelitian yaitu jenis kelamin, tipe kepribadian dan nilai IPK.

2. Kegiatan mahasiswa sepulang kuliah pada penelitian ini, yaitu Belajar, Bekerja, Nongkrong dan Tidur.

3. Ada 2 tipe Kepribadian pada penelitian ini, yaitu Introvert (senang menyendiri) dan Extrovert (senang bersama banyak orang).

(17)

1.4 Tujuan Penelitian

Perlunya di buat aplikasi ini tujuannya adalah merancang dan membuat aplikasi implementasi metode ID3 untuk memprediksi kegiatan mahasiswa sepulang kuliah dan kelulusan mahasiswa, sehingga kepada mereka dapat diberikan early warning atau peringatan dini.

1.5 Manfaat Penelitian

Dalam penelitian ini penulis berharap semoga hasil penelitian dapat memberikan manfaat konseptual utamanya kepada Mahasiswa Universitas Muhammadiyah Sidoarjo agar bisa lebih memperbaiki lagi sistem belajar mereka agar bisa lulus dengan tepat waktu.

1. Manfaat Teoritis

Secara teoritis hasil penelitian ini dapat bermanfaat sebagai berikut :

a. Sebagai salah satu alternatif untuk meningkatkan keaktifan Mahasiswa dalam meningkatkan kesadaran, bahwa pentingnya waktu senggang kuliah untuk digunakan belajar atau menambah wawasan mereka semasa berada di bangku kuliah.

b. Sebagai pijakan untuk mengembangkan penelitian-penelitian yang menggunakan Data Mining dengan metode ID3.

c. Bagi mahasiswa agar dapat meningkatkan mutu belajar dan kegiatan dalam masa kuliah mereka.

2. Manfaat Praktis

Secara praktis penelitian ini dapat bermanfaat sebagai berikut :

a. Bagi penulis, dapat memperoleh pengalaman langsung dalam menerapkan dan bisa memprediksi kegiatan mahasiswa sepulang kuliah dan tingkat kelulusan mahasiswa dengan menggunakan Data Mining metode ID3.

(18)

tersebut waktu sepulang kuliah dan lebih bagusnya lagi bisa memprediksi tingkat kelulusan mahasiswa dengan menggunakan Data Mining metode ID3. c. Bagi mahasiswa terutama sebagai subyek penelitian, diharapkan dapat lebih

bisa memanfaatkan waktu luang mereka diluar kampus untuk belajar ataupun melakukan hal-hal positif yang lainnya agar bisa menunjang nilai Indeks Prestasi mereka dan keberhasilan mereka dalam memperoleh gelar Sarjana dengan tepat waktu.

1.6 Sistematika Penulisan

Sistematika penulisan ini merupakan gambaran umum mengenai isi dari keseluruhan pembahasan, yang bertujuan untuk memudahkan pembaca dalam mengikuti alur pembahasan yang terdapat dalam penulisan makalah skripsi ini. Adapun sistematika penulisan adalah sebagai berikut :

BAB 1 : PENDAHULUAN

Berisi tentang latar belakang obyek penelitian yaitu Mahasiswa Universitas Muhammadiyah Sidoarjo. Membahas permasalahan yang dihadapi, ruang lingkup permasalahan yang akan diteliti, tujuan dan manfaat yang akan dilakukan dan sistematika penulisan.

BAB 2 : TINJAUAN PUSTAKA DAN DASAR TEORI

Berisi tentang teori dasar yang mendasari analisis dan penerapan metode ID3 untuk dapat memprediksi kegiatan mahasiswa sepulang kuliah dan tingkat kelulusan mahasiswa. Terdapat kutipan dari buku-buku, website, maupun sumber literatur lainnya yang mendukung penyusunan skripsi ini. Berisi pula teori-teori khusus yang berhubungan dengan Data Mining metode ID3.

BAB 3 : METODOLOGI PENELITIAN

(19)

BAB II

TINJAUAN PUSTAKA DAN DASAR TEORI

2.1 Penelitian Terdahulu

Penelitian terdahulu yang mendukung penelitian ini adalah :

a. Ronny Ardi Giovani (2011) “Sistem Pendukung Keputusan Prediksi Kecepatan Studi Mahasiswa Menggunakan Metode ID3”, penelitian tersebut memberikan kesimpulan bahwa dengan adanya aplikasi data mining dapat memudahkan prediksi kecepatan studi mahasiswa. Applikasi Data Mining telah berhasil menetukan klasifikasi kecepatan studi mahasiswa dengan metode ID3.

(20)

Tabel 2.1 Perbedaan Penelitian Terdahulu dengan Penelitian Sekarang

(21)

dapat memprediksi kegiatan mahasiswa sepulang kuliah dan tingkat kelulusan mahasiswa Universitas Muhammadiyah Sidoarjo.

2.2 Definisi Mahasiswa

Mahasiswa adalah orang yang belajar di perguruan tinggi, baik di universitas, institut atau akademi. Mereka yang terdaftar sebagai murid di perguruan tinggi dapat disebut sebagai mahasiswa. Tetapi pada dasarnya makna mahasiswa tidak sesempit itu. Terdaftar sebagai mahasiswa di sebuah Perguruan Tinggi hanyalah syarat administratif menjadi mahasiswa, tetapi menjadi mahasiswa mengandung pengertian yang lebih luas dari sekedar masalah administratif itu sendiri.

Menyandang gelar mahasiswa merupakan suatu kebanggaan sekaligus tantangan. Betapa tidak, ekspektasi dan tanggung jawab yang diemban oleh mahasiswa begitu besar. Pengertian mahasiswa tidak bisa diartikan kata per kata, Mahasiswa adalah Seorang agen pembawa perubahan. Menjadi seorang yang dapat memberikan solusi bagi permasalahan yang dihadapi oleh suatu masyarakat bangsa di berbagai belahan dunia.

Sebagai mahasiswa berbagai macam lebel pun disandang, ada beberapa macam label yang melekat pada diri mahasiswa, misalnya:

1. Direct Of Change, mahasiswa bisa melakukan perubahan langsung karena SDMnya yg banyak.

2. Agent Of Change, mahasiswa agent perubahan, maksudnya SDM untuk melakukan perubahan.

3. Iron Stock, sumber daya manusia dari mahasiswa itu tidak akan pernah habis. 4. Moral Force, mahasiswa itu kumpulan orang yg memiliki moral yg baik.

5. Social Control, mahasiswa itu pengontrol kehidupan sosial, contoh mengontrol

(22)

Namun secara garis besar, setidaknya ada 3 peran dan fungsi yang sangat penting bagi mahasiwa, yaitu :

Pertama, peranan moral, dunia kampus merupakan dunia di mana setiap mahasiswa dengan bebas memilih kehidupan yang mereka mau. Disinilah dituntut suatu tanggung jawab moral terhadap diri masing-masing sebagai indidu untuk dapat menjalankan kehidupan yang bertanggung jawab dan sesuai dengan moral yang hidup dalam masyarakat.

Kedua, adalah peranan sosial. Selain tanggung jawab individu, mahasiswa juga memiliki peranan sosial, yaitu bahwa keberadaan dan segala perbuatannya tidak hanya bermanfaat untuk dirinya sendiri tetapi juga harus membawa manfaat bagi lingkungan sekitarnya.

Ketiga, adalah peranan intelektual. Mahasiswa sebagai orang yang disebut-sebut sebagai insan intelek haruslah dapat mewujudkan status tersebut dalam ranah kehidupan nyata. Dalam arti menyadari betul bahwa fungsi dasar mahasiswa adalah bergelut dengan ilmu pengetahuan dan memberikan perubahan yang lebih baik dengan intelektualitas yang ia miliki selama menjalani pendidikan.

2.3 Data Mining

Data mining merupakan area yang banyak diminati dan dipakai dalam berbagai bidang. Mahasiswa, dosen, peneliti maupun praktisi di bidang manajemen, meteorologi, kedokteran, mikrobiologi dan lain-lain banyak memakai teknik-teknik data mining untuk membantu memahami dan mengimplementasikannya. Tentu saja untuk implementasi sederhana dengan skala problem kecil (Budi Santosa, 2007).

(23)

Menarik untuk diingat bahwa kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar. Dari definisi-definisi itu, dapat dilihat ada beberapa faktor yang mendefinisikan data mining :

1. Data mining adalah proses otomatis terhadap data yang dikumpulkan di masa lalu. 2. Objek dari data mining adalah data yang berjumlah besar atau kompleks.

3. Tujuan dari data mining adalah menemukan hubungan-hubungan atau pola-pola yang mungkin memberikan indikasi yang bermanfaat.

Sejarah Data mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dulu. Gambar 1 menunjukkan bahwa data mining memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistic, database dan juga information retrieval.

(24)

2.3.1 Pengelompokan Data Mining

Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan yaitu :

1. Deskripsi

Terkadang peneliti dan analis secara sederhana ingin mencoba mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden.

2. Estimasi

Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik daripada kearah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai variabel dari target sebagai nilai prediksi, selanjutnya pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi.

3. Prediksi

Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada dimasa mendatang.

4. Klasifikasi

Dalam klasifikasi, terdapat target variabel kategori, sebagai contoh penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi, sedang dan rendah.

5. Pengklusteran

(25)

6. Asosiasi

Tugas Asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu. Dalam dunia bisnis disebut dengan analisis keranjang belanja. 2.3.2 Tahapan Proses Dalam Data Mining

Ada beberapa tahapan proses dalam data mining. Diagram dibawah menggambarkan beberapa tahap / proses yang berlangsung dalam data mining. Fase awal dimulai dari data sumber dan berakhir dengan adanya informasi yang dihasilkan dari beberapa tahapan, yaitu :

Gambar 2.1 Alur Data Mining

Gambar 2.1 . Tahapan Data Mining

Gambar 2.1 Tahapan Proses Dalam Data Mining

Tahapan proses dalam Data Mining dapat dijelaskan sebagai berikut : 1. Seleksi Data

Pemilihan (seleksi) data baru sekumpulan data operasional perlu dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing / Cleaning

(26)

3. Transformasi

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.

4. Data mining

Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakn teknik atau metode tertentu . Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat tergantung pada tujuan dan proses KDD secara keseluruhan.

5. Interpretasi / Evaluasi

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan . Tahap ini merupakan bagian dari proses KDD yang disebut sebagai interpretation.

2.4 Klasifikasi Metode Data Mining

Ada beberapa contoh metode yang bisa digunakan dalam data mining, diantaranya :

1. Decesion Tree (Pohon Kputusan)

(27)

pohon keputusan adalah klasifikasi. Dari set database kita bisa mengetahui apakah suatu nasabah merupakan nasabah yang baik atau tidak dari riwayatnya, seseorang berpeluang terkena suatu penyakit tertentu berdasarkan riwayat dan lain-lain.

Pohon keputusan merupakan teknik yang paling efisien. Ibaratnya, kita menyaring sesuatu lewat pohon keputusan, apakah suatu data lolos atau tidak terhadap saringan kita dengan proses yang cukup cepat. Teknik regresi sangat banyak, tetapi yang paling terkenal adalah algoritma yang diperkenalkan oleh Prof. Briemann dengan istilah The Classification and Regression Tree (CART).

Masalah pertama pada pembuatan pohon keputusan adalah, variabel manakah yang menjadi akar dari pohon tersebut. Akar disini adalah pemisah pertama dari pohon keputusan. Dikenal istilah Bayesian Score yang menilai suatu variabel, atau dalam Pohon Keputusan terkenal dengan sebutan Entropi. Entropi dihitung dengan rumusan sebagai berikut :

Entropy (p1, p2, ..., pn) = - p1log2p1 – p2log2P2 ... – pnlog2pn (2.1)

Dimana p1, p2, ..., pn adalah probabilitas tiap kondisi pada atribut yang diprediksi dan :

p1 + p2 + ... + pn = 1 (2.2)

(28)

memilih pembagian yang optimal. Ada beberapa tahap dalam membuat sebuah pohon keputusan dengan algoritma C4.5, yaitu :

1. Menyiapkan data training. Data training biasanya diambil dari data histori yang pernah terjadi sebelumnya dan sudah dikelompokkan ke dalam kelas-kelas tertentu.

2. Menentukan akar dari pohon. Akar dari pohon dimbil dari atribut yang terpilih, dengan cara mengitung nilai gain dari masing-masing atribut, nilai gain yang paling tinngi akan menjadi akar yang pertama. Sebelum menghitung nilai gain dari atribut, hitung dulu nilai entropy. Untuk menghitung nilai entropy digunakan rumus :

3. Kemudian hitung nilai gain menggunakan rumus :

Gain (S,A) = Entropy(S) -

* Entropy (Si) (2.4)

4. Ulangi langkah ke-2 hingga semua record terpartisi. 5. Proses partisi pohon keputusan akan berhenti saat :

a. Semua record dalam simpul N mendapat kelas yang sama. b. Tidak ada atribut di dalam record yang dipartisi lagi. c. Tidak ada record di dalam cabang yang kosong.

n

i=1

n

(29)

Tabel 2.2 dibawah ini adalah contoh data training apakah seseorang nasabah bermasalah dalam kredit atau tidak.

Tabel 2.2 Data untuk klasifikasi resiko kredit

Pelanggan Simpanan Aset Pendapatan Resiko Kredit

1 Medium High 75 Good

2 Low Low 50 Bad

3 High Medium 25 Bad

4 Medium Medium 50 Good

5 Low Medium 100 Good

6 High High 25 Good

7 Low Low 25 Bad

8 Medium Medium 75 Good

Data training pada Tabel 2.2 adalah untuk menentukan apakah seseorang nasabah bermasalah atau tidak, ditentukan oleh kolom predictor saving, asset, dan pendapatan. Kolom Resiko Kredit adalah kelas dari masing-masing record.

Berikut akan dibahas prediksi apakah nasabah bermasalah atau tidak, menggunakan metode klasifikasi. Langkah untuk membuat pohon keputusan, yaitu :

1. Tabel 2.2 adalah data training beserta kelasnya. Untuk atribut pendapatan yang bernilai angka, dibuat dalam bentuk kategori, yaitu pendapatan <=25, pendapatan >25, pendapatan <=50, pendapatan >50, pendapatan <=75, pendapatan >75.

2. Hitung entropy. Dari data training diketahui jumlah kasus ada 8, yang beresiko kredit good 5 record dan Bad 3 record sehingga didapat entropy :

Entropy = ∑𝑛 − 𝑝𝑖. 𝑙𝑜𝑔2 𝑝𝑖

𝑖=0 (2.5)

(30)

3. Hitung nilai Gain untuk setiap atribut, lalu ditentukan nilai gain tertinggi. Yang mempunyai nilai gain tertinggi itulah yang akan dijadikan akar dari pohon. Misalkan atribut saving dengan nilai low didapat nilai gain :

Gain (S,A) = Entropy(S) - ∑𝑛𝑖=0|𝑆𝑖| * Entropy (𝑆𝑖) (2.6)

Gain (S,A) = 0.9544 – ( 2/8(1) + 3/8(0) + 3/8(0.9183) = 0.3601 )

Hasil perhitungan gain untuk setiap atribut terlihat pada Tabel 2.3. Nilai gain tertinggi akan menjadi akar pohon.

Terlihat dari Tabel 2.3 Atribut, asset mempunyai nilai low, medium, dan high. Nilai low dan high masing-masing sudah menjadi satu klasifikasi karena pada data training, semua asset menghasilkan keputusan yang sama yaitu bad untuk nilai low dan good untuk nilai high. Sedangkan untuk simpul dengan nilai medium perlu dipartisi lagi.

Asset

X Good

Bad

Low

Medium

High

Gambar 2.2 Pohon Keputusan dengan Simpul Akar Asset

Gambar 2.2 adalah hasil pembentukan pohon keputusan berdasarkan perhitungan yang terdapat pada Tabel 2.2. Dari hasil perhitungan didapat gain tertinggi untuk atribut asset, maka asset menjadi akar dari pohon keputusan. Untuk menentukan akar dari atribut medium, dilakukan lagi perhitungan nilai gain (Prabowo Pudjo Widodo, Ramadya Trias Handayanto, Herlawati (2013).

(31)

Tabel 2.3 Nilai Entropy dan Gain untuk menentukan Simpul Akar

Simpul Data Good Bad Entropy Gain

Akar Total 8 5 3 0.9544

Saving 0.3601

Low 3 1 2 0.9183

Medium 3 3 0 0

High 2 1 1 1

Asset 0.5488

Low 2 0 2 0

Medium 4 3 1 0.8113

High 2 2 0 0

Pendapatan 0.1589

<=25 3 1 2 0.9183

>25 5 4 1 0.7219

0.3476 <=50 5 2 3 0.9710

>50 3 3 0 0

0.0924 <=75 7 4 3 0.9852

(32)

2. Support Vector Machine (SVM)

Support Vector Machine merupakan metode klasifikasi jenis terpandu (supervised) karena ketika proses pelatihan, diperlukan target pembelajaran tertentu, berbeda dengan FCM yang dalam proses klasifikasi tidak membutuhkan target pelatihan.

Support Vector Machine merupakan algoritma yang bekerja menggunakan pemetaan nonlinier untuk mengubah data pelatihan asli ke dimensi yang lebih tinggi. Dalam hal ini dimensi baru, akan mencari hyperplane untuk memisahkan secara linier dan dengan pemetaan nonlinier yang tepat ke dimensi yang cukup tinggi, data dari dua kelas selalu dapat dipisahkan dengan hyperplane tersebut. Support Vector Machine menemukan hyperplane ini menggunakan support vector dan margin.

Support Vector Machine muncul pertama kali pada tahun 1992 oleh Vladimir Vapnik berama rekannya Bernhard Boser dan Isabelle Guyon. Dasar untuk SVM sudah ada sejak tahun 1960-an (termasuk karya awal oleh Vapnik dan Alexei Chervonenkis pada teori belajar statistik).

Meskipun waktu pelatihan SVM kebanyakan lambat, tetapi metode ini sangat akurat karena kemampuannya untuk menangani model-model nonlinier yang kompleks. SVM kurang rentan terhadap overfitting dibandingkan metode lainnya. SVM dapat digunakan untuk prediksi dan klasifikasi. Contoh penerapannya antara lain deteksi tulisan tangan, pengenalan obyek, identifikasi suara, dan lain-lain (Prabowo Pudjo Widodo, Ramadya Trias Handayanto, Herlawati (2013).

3. Adaptive Neuro – Fuzzy Inference System (ANFIS)

(33)

Metode TSK diprakasai oleh Takagi, Sugeno, dan Kang pada tahun 1985. Tujuannya untuk memperoleh rule yang berasal dari hubungan masukan dan keluaran suatu sistem. Prinsipnya antara lain :

If x is A and y is B then z = f(x,y) (2.7)

Dimana A dan B merupakan set Fuzzy sedangkan z merupakan fungsi dalam bentuk crisp (bukan fuzzy). Jadi perbedaan mencolok antara TSK dengan Mamdani terletak sisi kanan setelah “then” karena pada metode mamdani, setelah “then” masih berupa fungsi fuzzy, bukan crisp (Prabowo Pudjo Widodo, Ramadya Trias Handayanto, Herlawati (2013).

4. Interactive Dychotomizer Three(ID3)

ID3 (Iterative Dichotomiser Three) atau yang disebut juga dengan Induction of Decision Tree adalah suatu algoritma matematika yang digunakan untuk menghasilkan suatu pohon keputusan yang mampu mengklasifikasi suatu obyek. Pengertian laindari ID3 yaitu ID3 merupakan sebuah metode yang digunakan untuk membangkitkan pohon keputusan.

ID3 diperkenalkan pertama kali oleh Ross Quinlan (1979). ID3 merepresentasi konsep-konsep dalam bentuk pohon keputusan. Aturan-aturan yang dihasilkan oleh ID3 mempunyai relasi yang hirarkis seperti suatu pohon (mempunyai akar, titik, cabang, dan daun). Beberapa peneliti menyebut struktur model yang dihasilkan ID3 sebagai pohon keputusan (decision tree) sementara peneliti yang lain menyebutnya pohon aturan (rule tree).

(34)

2.5 Teori Pemrograman

Pada penelitian ini dipilih menggunakan bahasa pemrograman PHP & MySQL. Berikut definisi dari PHP & MySQL :

2.5.1 PHP & MySQL

PHP (singkatan dari Personal Home Page) adalah bahasa pemrograman yang digunakan untuk membuat Aplikasi Web.

Alasan Menggunakan PHP diantaranya :

1. Free (gratis), PHP bersifat Open Source. Sehingga kita bebas menggunakan PHP tanpa harus membayar.

2. Lintas Per Platform. PHP dapat dijalankan pada sistem operasi apapun, seperti Linux, Windows, OpenBSD, FreeBSD, Mac OS, Solaris, dll.

3. Didukung Berbagai Web Server Handal, seperti Apache, IIS (Windows), Xitami, Lighttpd, OmniSecure, WebWeaver, Sambar Server, dll.

4. Mampu Koneksi dengan Berbagai Database, baik yang gratisan maupun seperti MySQL, Ms. SQL Server, Ms. Acces, ORACLE, PostgresSQL, Interbase, SQLite, dBase, Informix, IBM DB2, Sybase, ODBC, dll.

5. Memiliki tingkat akses paling cepat dibanding pemrograman web lainnya (Lukmanul Hakim, 2014).

2.6 Perangkat Pemodelan Sistem Dalam Pembuatan Suatu Program.

Pada pembuatan pemodelan system sangat di perlukan jika akan merancang suatu system informasi. Pemodelan system berupa aliran data yang akan di proses menjadi informasi.

2.6.1 Basis Data (Database)

(35)

menyediakan informasi yang di perlukan oleh pemakai. Istilah sistem basis data tentu saja berbeda dengan istilah basis data, sistem basis data merupakan lingkup yang lebih luas dari pada basis data (Yakub, 2008).

Tujuan database dalam pemrosesan data pada suatu aplikasi adalah: a. Menghindari terjadinya data kembar.

b. Memudahkan dalam manipulasi data. c. Standarisasi klasifikasi data dan dokumen. Adapun konsep database dijelaskan sebagai berikut :

1. Entityadalah sebuah tabel yang berisi obyek sebagai identitas atau keterangan tentang tabel tersebut. Contoh : Data Mahasiswa.

2. Atribute adalah karakteristik dari entity yang menyediakan penjelasan detail tentang entity tersebut.

Nilai atribut merupakan suatu data aktual atau informasi yang disimpan pada suatu atribut didalam suatu entity. Contoh : NIM, Nama.

Jenis – jenis atribut :

a. Atribute simple yaitu atribut yang bernilai tunggal yang tidak bisa diuraikan lagi. Contoh : NIM, TTL.

b. Atribute composit yaitu suatu atribut yang terdiri dari beberapa atribut yang lebih kecil yang mempunyai arti tertentu. Contoh: Tanggal Lahir.

c. Primary Key (PK) yaitu atribut yang digunakan untuk menentukan suatu entity

secara unik dan dapat mewakili setiap kejadian dari suatu entity. Contoh : atribut NIM pada tabel Data Mahasiswa.

d. Foreign Key (FK) yaitu atribut sebagai kunci tamu untuk berhubungan dengan

entity yang mempunyai kunci utama (PK).

(36)

f. File adalah kumpulan record sejenis yang mempunyai panjang elemen yang sama, atribut yang sama namun berbeda data valuenya. Contoh : file Data Mahasiswa,

file Data Mata Kuliah.

2.6.2 Data Flow Diagram (DFD)

Data Flow Diagram adalah sebuah teknis grafis yang menggambarkan aliran informasi yang diaplikasikan pada saat data bergerak dari input menjadi output.

DFD dapat digunakan untuk menyajikan sebuah sistem atau perangkat lunak pada setiap abstraksi. DFD dapat dipartisi ke dalam tingkat-tingkat yang merepresentasikan aliran informasi yang bertambah dan fungsi ideal.

Notasi dasar digunakan dalam DFD :

1. External Entity / Entitas Luar (kesatuan luar)

External Entity yaitu sebuah elemen sistem (misalnya perangkat keras, seseorang, program yang lain) atau sistem yang lain yang menghasilkan informasi bagi transformsi oleh perangkat lunak atau menerima informasi yang dihasilkan oleh perangkat lunak.

Gambar 2.3 Entitas Luar

2. Data Flow (arus data)

Arus data merupakan data yang menjadi input atau output ke atau dari proses. Arus data ini mengalir diantara proses (process), simpanan data (data store) dan kesatuan luar (external entity).

Gambar 2.4 Arus Data

3. Data Flow (arus data)

(37)

Gambar 2.5 Nama Proses

4. Data Store (simpanan data)

Data store merupakan penyimpanan data yang ditunjukan (file/ database) untuk penggunaan selanjutnya. Simpanan data di DFD di simbolkan dengan sepasang garis horizontal.

Gambar 2.6 Data Store

2.6.3 FlowChart

Flowchart adalah bagian dengan simbol-simbol tertentu yang menggambarkan urutan suatu proses dalam program.

Proses yaitu untuk pengolahan data baik operasi perhitungan maupun perubahan harga.

Data untuk proses pembacaan dan penulisan data

Decistion untuk mengambil keputusan

Predifimed proses untuk menunjukkan unit sub program

Floppy disk untuk dokumentasi program dan disimpan pada

floppy disk

Terminal menunjukkan awal dan akhir program.

Document menunjukkan dokumentasi program yang dicetak dikertas

Conector sebagai tanda penghubung antara halaman

Arrow menunjukkan arah proses program

Gambar 2.7 Simbol – Simbol Flowchart Nama

(38)

BAB III

METODOLOGI PENELITIAN

Bab ini menjelaskan tentang perancangan dalam membangun Aplikasi Data Mining. Analisis meliputi analisis data mining dengan metode ID3 serta analisis dalam membangun aplikasi.

3.1 Lokasi Penelitian

Lokasi Penelitian adalah di perguruan tinggi Universitas Muhammadiyah Sidoarjo. Penelitian dimulai pada Oktober 2015 sampai Desember 2015.

3.2 Alat dan Bahan Penelitian

a. Alat

a. Seperangkat Laptop Intel Core i3 – 2350M, 2.3 GHz. b. Sistem Operasi Windows 7

c. Bahasa Pemrograman PHP d. MySQL

b. Bahan

1. Buku referensi tentang pemrograman PHP & MySQL 2. Artikel – artikel tentang database

(39)

3.3 Kerangka Penelitian

Pengumpulan Data

Analisa Data

Perancangan Sistem

Implementasi Program Perancangan Program

Uji Kelayakan

Evaluasi Program

Dimana didalam pembuatan suatu system maupun aplikasi dibutuhkan sebuah kerangka agar system atau aplikasi tersebut layak dipergunakan dan dapat bermanfaat bagi pemakainya. Dalam pembuatan aplikasi ada beberapa langkah – langkah yang harus diperhatikan yang biasa disebut dengan kerangka penelitian yang diantaranya adalah Pengumpulan Data, setelah melakukan pengumpulan data maka selanjutanya adalah menganalisa data tersebut sehingga dapat menentukan perancangan system yang dibutuhkan, selanjutnya menentukan perancangan program yang akan dipergunakan untuk membuat aplikasi tersebut. Setelah melakukan perancangan program, maka program yang sudah selesai diuji kelayakannya, jika masih belum sesuai dengan apa yang diharapkan maka langkah selanjutnya dengan mengevaluasi

(40)

program tersebut agar sesuai dengan yang diharapkan, jika sudah sesuai maka program atau aplikasi tersebut diimpelementasikan kedalam komputer yang sudah dipersiapkan.

3.4 Tahap Pengumpulan Data

Teknik pengumpulan data yang digunakan dalam penelitian skripsi adalah : 1. Pengamatan (observasi )

Yaitu suatu teknik pengumpulan data yang di peroleh dengan jalan melakukan penelitian dan pencatatan secara langsung pada obyek yang di teliti.

2. Studi Literatur

Yaitu melalui berbagai artikel yang didapat dari jurnal dan buku – buku referensi yang menunjang pembuatan aplikasi ini.

3. Wawancara (Interview)

Melakukan tanya jawab secara langsung dengan memberikan kuesioner kepada mahasiswa yang berkaitan dengan permasalahan seputar obyek penelitian untuk memperoleh keterangan yang relevan.

3.5 Analisa

3.5.1 Perhitungan hasil Analisa Data Latih

Tabel 3.1 Hasil Analisa Data Latih

No. Jenis Kelamin Tipe Kepribadian IPK Kegiatan Lulus Tepat Waktu

(41)

9. Laki-laki Extrovert 3.00 Nongkrong Tidak 10. Laki-laki Extrovert 3.00 Nongkrong Tidak 11. Laki-laki Introvert 3.00 Tidur Tidak 12. Laki-laki Introvert 3.00 Tidur Tidak 13. Laki-laki Extrovert 2.75 Bekerja Tidak 14. Laki-laki Extrovert 2.75 Bekerja Tidak 15. Laki-laki Extrovert 3.00 Bekerja Ya 16. Laki-laki Extrovert 3.00 Bekerja Ya 17. Laki-laki Extrovert 3.30 Bekerja Ya 18. Laki-laki Extrovert 3.30 Bekerja Ya 19. Laki-laki Extrovert 3.00 Nongkrong Tidak 20. Laki-laki Extrovert 3.00 Nongkrong Tidak 21. Laki-laki Extrovert 3.30 Bekerja Ya 22. Laki-laki Extrovert 3.30 Bekerja Ya 23. Laki-laki Extrovert 2.75 Bekerja Tidak 24. Laki-laki Extrovert 2.75 Bekerja Tidak 25. Laki-laki Introvert 3.50 Belajar Ya 26. Laki-laki Introvert 3.50 Belajar Ya 27. Laki-laki Extrovert 2.75 Bekerja Tidak 28. Laki-laki Extrovert 2.75 Bekerja Tidak 29. Laki-laki Extrovert 2.75 Bekerja Tidak 30. Laki-laki Extrovert 2.75 Bekerja Tidak 31. Perempuan Extrovert 3.30 Belajar Ya 32. Perempuan Extrovert 3.30 Belajar Ya

33. Perempuan Introvert 3.30 Tidur Ya

(42)

35. Perempuan Extrovert 3.30 Belajar Ya 36. Perempuan Extrovert 3.30 Belajar Ya 37. Perempuan Extrovert 3.50 Belajar Ya 38. Perempuan Extrovert 3.50 Belajar Ya 39. Perempuan Extrovert 3.50 Belajar Ya 40. Perempuan Extrovert 3.50 Belajar Ya 41. Perempuan Introvert 3.00 Tidur Tidak 42. Perempuan Introvert 3.00 Tidur Tidak 43. Perempuan Introvert 2.75 Tidur Tidak 44. Perempuan Introvert 2.75 Tidur Tidak 45. Perempuan Extrovert 3.50 Belajar Ya 46. Perempuan Extrovert 3.50 Belajar Ya 47. Perempuan Extrovert 3.50 Belajar Ya 48. Perempuan Extrovert 3.50 Belajar Ya 49. Perempuan Extrovert 3.50 Belajar Ya 50. Perempuan Extrovert 3.50 Belajar Ya 51. Perempuan Extrovert 2.75 Nongkrong Tidak 52. Perempuan Extrovert 2.75 Nongkrong Tidak 53. Perempuan Extrovert 3.00 Bekerja Ya 54. Perempuan Extrovert 3.00 Bekerja Ya 55. Perempuan Extrovert 3.00 Bekerja Ya 56. Perempuan Extrovert 3.00 Bekerja Ya 57. Perempuan Extrovert 3.50 Belajar Ya 58. Perempuan Extrovert 3.50 Belajar Ya 59. Perempuan Introvert 2.75 Tidur Tidak

(43)

Dari tabel diatas dapat diambil perhitungan seperti berikut : Ada 2 kemungkinan dalam S yaitu, tepat_waktu dan tidak. Entropy (S)

= - (36/60) log2 (36/60) – (24/60) log2 (24/60) = 0,4421793 + 0,5287712 = 0,9709505

Ada 4 atribut dalam S yaitu, Jenis_Kelamin, Tipe Kepribadian, IPK dan Kegiatan. Ada 2 Variasi nilai dalam Jenis_Kelamin yaitu, Laki-laki dan Perempuan.

Entropy (Slaki_laki)

= - (14/30) log2 (14/30) – (16/30) log2 (16/30) = 0,5131166 + 0,4836749 = 0,9967915

Entropy (Sperempuan)

= - (22/30) log2 (22/30) – (8/30) log2 (8/30) = 0,3281365 + 0,5085041 = 0,8366406

Gain (S, Jenis_Kelamin)

= Entropy (S) – (30/60) * Entropy (Slaki_laki) – (30/60) * Entropy (Sperempuan)

= 0,9709505 – (30/60) * 0,9967915 – (30/60) * 0,8366406 = 0,9709505 – 0,4983957 – 0,4183203 = 0,0524345

Ada 2 Variasi nilai dalam Tipe kepribadian yaitu, Introvert dan Extrovert. Entropy (Sintrovert)

= - (8/16) log2 (8/16) – (8/16) log2 (8/16) = 0,5 + 0,5 = 1

Entropy (Sextrovert)

= - (28/44) log2 (28/4) – (16/44) log2 (16/44) = 0,4149578 + 0,5307024 = 0,9456602

Gain (S, Tipe_kepribadian)

= Entropy (S) – (16/60) log2 (16/60) * Entropy (Sintrovert) – (44/60) * Entropy

(44)

= 0,9709505 – (16/60) * 1 – (44/60) * 0,9456602 = 0,9709505 – 0,2666666 – 0,6934841 = 0,0107998

Ada 4 Variasi nilai dalam IPK yaitu, 2.75 , 3.00 , 3.30 dan 3.50. Entropy (S2.75)

= - (14/14) log2 (14/14) = 0 Entropy (S3.00)

= - (8/18) log2 (8/18) – (10/18) log2 (10/18)

= 0,5199666 + 0,4711093 = 0,9910759

Entropy (S3.30)

= - (14/14) log2 (14/14) = 0 Entropy (S3.50)

= - (14/14) log2 (14/14) = 0 Gain (S, IPK)

= Entropy (S) – (14/60) * Entropy (S2.75) – (18/60) * Entropy (S3.00) – (14/60) *

Entropy (S3.30) – (14/60) * Entropy (S3.50)

= 0,9709505 – (14/60) * 0 – (18/60) * 0,9910759 – (14/60) * 0 – (14/60) * 0 = 0,9709505 – 0,2973227 = 0,6736278

Ada 4 Variasi nilai dalam Kegiatan yaitu, Belajar, Bekerja, Nongkrong dan Tidur. Entropy (Sbelajar)

= - (22/22) log2 (22/22) = 0 Entropy (Sbekerja)

= - (12/20) log2 (12/20) – (8/20) log2 (8/20) = - 0,4421793 + 0,5287712 = 0,9709505

Entropy (Snongkrong)

(45)

= - (2/10) log2 (2/10) – (8/10) log2 (8/10) = 0,4643856 + 0,2575424 = 0,721928

Gain (S, Kegiatan)

= Entropy (S) – (22/60) * Entropy (Sbelajar) – (20/60) * Entropy (Sbekerja) – (8/60) *

Entropy (Snongkrong) – (10/60) * Entropy (Stidur)

= 0,9709505 – (22/60) * 0 – (20/60) * 0,9709505 – (8/60) * 0 – (10/60) * 0,721928 = 0,9709505 – 0,3236501 – 0,1203213 = 0,5269791

Berarti Atribut yang diambil terlebih dahulu adalah IPK.

IPK

2.75 3.00 3.30 3.50

Gambar 3.2 Pohon Keputusan untuk Atribut IPK

Himpunan S2.75 adalah seperti berikut :

Tabel 3.2 Himpunan IPK 2.75

IPK Jenis Kelamin Tipe kepribadian Kegiatan Lulus Tepat Waktu

2.75 Laki-laki Extrovert Bekerja Tidak

2.75 Laki-laki Extrovert Bekerja Tidak

2.75 Laki-laki Extrovert Bekerja Tidak

2.75 Laki-laki Extrovert Bekerja Tidak

2.75 Laki-laki Extrovert Bekerja Tidak

2.75 Laki-laki Extrovert Bekerja Tidak

(46)

2.75 Laki-laki Extrovert Bekerja Tidak

2.75 Perempuan Introvert Tidur Tidak

2.75 Perempuan Introvert Tidur Tidak

2.75 Perempuan Extrovert Nongkrong Tidak 2.75 Perempuan Extrovert Nongkrong Tidak

2.75 Perempuan Introvert Tidur Tidak

2.75 Perempuan Introvert Tidur Tidak

Cuma ada 1 kelas, yaitu Tidak → Tidak diproses.

IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Gambar 3.3 Pohon Keputusan untuk memperoleh hasil dari IPK 2.75

Himpunan S3.00 adalah seperti berikut :

Tabel 3.3 Himpunan IPK 3.00

IPK Jenis Kelamin Tipe kepribadian Kegiatan Lulus Tepat Waktu

3.00 Laki-laki Extrovert Nongkrong Tidak 3.00 Laki-laki Extrovert Nongkrong Tidak

3.00 Laki-laki Extrovert Bekerja Ya

3.00 Laki-laki Extrovert Bekerja Ya

3.00 Laki-laki Extrovert Nongkrong Tidak 3.00 Laki-laki Extrovert Nongkrong Tidak

3.00 Laki-laki Introvert Tidur Tidak

(47)

3.00 Laki-laki Extrovert Bekerja Ya

3.00 Laki-laki Extrovert Bekerja Ya

3.00 Laki-laki Extrovert Nongkrong Tidak 3.00 Laki-laki Extrovert Nongkrong Tidak

3.00 Perempuan Introvert Tidur Tidak

3.00 Perempuan Introvert Tidur Tidak

3.00 Perempuan Extrovert Bekerja Ya

3.00 Perempuan Extrovert Bekerja Ya

3.00 Perempuan Extrovert Bekerja Ya

3.00 Perempuan Extrovert Bekerja Ya

Ada 2 kelas dalam S3.00 , yaitu Ya dan Tidak.

Entropy (S3.00)

= - (8/18) log2 (8/18) – (10/18) log2 (10/18) = 0,5199666 + 0,4711093 = 0,9910759

Ada 3 Atribut dalam S3.00, yaitu Jenis_Kelamin, Tipe kepribadian dan Kegiatan.

Ada 2 Variasi nilai dalam Jenis_Kelamin, yaitu Laki_laki dan Perempuan. Entropy (S3.00,laki_laki)

= - (4/12) log2 (4/12) – (8/12) log2 (8/12) = 0,5283208 + 0,3899750 = 0,9182958

Entropy (S3.00,perempuan)

= - (4/6) log2 (4/6) – (2/6) log2 (2/6) = 0,3899750 + 0,5283208 = 0,9182958

Gain (S3.00, Jenis_Kelamin)

Entropy (S3.00) – (12/18) * Entropy (S3.00,laik_laki) – (6/18) * Entropy (S3.00,perempuan)

(48)

Ada 2 Variasi nilai dalam Tipe kepribadian, yaitu Introvert dan Extrovert. Entropy (S3.00,introvert)

= - (4/4) log2 (4/4) – (4/4) log2 (4/4) = 0 Entropy (S3.00,extrovert)

= - (8/14) log2 (8/14) – (6/14) log2 (6/14) = 0,4613456 + 0,5238824 = 0,985228

Gain (S3.00, Tipe_kepribadian)

= Entropy (S3.00) – (4/18) * Entropy (S3.00,introvert) – (14/18) * Entropy (S3.00,entrovert)

= 0,9910759 – (4/18) * 0 – (14/18) * 0,985228

= 0,9910759 – 0,7662884 = 0,2247875

Ada 3 Variasi dalam kegiatan, yaitu Bekerja, Nongkrong dan Tidur. Entropy (S3.00,bekerja)

= - (8/8) log2 (8/8) = 0 Entropy (S3.00,nongkrong)

= - (6/6) log2 (6/6) = 0 Entropy (S3.00,tidur)

= - (4/4) log2 (4/4) = 0 Gain (S3.00, Kegiatan)

= Entropy (S3.00) – (8/18) * Entropy (S3.00,bekerja) – (6/18) * Entropy (S3.00,nongkrong) –

(4/18) * (S3.00,tidur)

= 0,9910759 – (8/18) * 0 – (6/18) * 0 – (4/18) * 0 = 0,9910759

(49)

IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Kegiatan

Bekerja

Nongkrong Tidur

Gambar 3.4 Pohon Keputusan untuk Atribut IPK dan Kegiatan

Himpunan S3.30 adalah berikut :

Tabel 3.4 Himpunan IPK 3.30

IPK Jenis Kelamin Tipe kepribadian Kegiatan Lulus Tepat Waktu

3.30 Laki-laki Introvert Belajar Ya

3.30 Laki-laki Introvert Belajar Ya

3.30 Laki-laki Introvert Belajar Ya

3.30 Laki-laki Introvert Belajar Ya

3.30 Laki-laki Extrovert Belajar Ya

3.30 Laki-laki Extrovert Belajar Ya

3.30 Laki-laki Extrovert Belajar Ya

3.30 Laki-laki Extrovert Belajar Ya

3.30 Perempuan Extrovert Belajar Ya

3.30 Perempuan Extrovert Belajar Ya

3.30 Perempuan Introvert Belajar Ya

3.30 Perempuan Introvert Belajar Ya

3.30 Perempuan Extrovert Belajar Ya

3.30 Perempuan Extrovert Belajar Ya

(50)

IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Kegiatan

Bekerja

Nongkrong Tidur

Lulus Tepat Waktu

Gambar 3.5 Pohon Keputusan untuk memperoleh hasil dari IPK 3.30

Himpunan S3.50 adalah seperti berikut :

Tabel 3.5 Himpunan IPK 3.50

IPK Jenis Kelamin Tipe Kepribadian Kegiatan Lulus Tepat Waktu

3.50 Laki-laki Introvert Belajar Ya

3.50 Laki-laki Introvert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

(51)

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

Cuma ada 1 kelas, yaitu Ya → Tidak diproses.

IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Kegiatan

Bekerja Nongkrong

Tidur

Lulus Tepat Waktu Lulus Tepat Waktu

Gambar 3.6 Pohon Keputusan untuk memperoleh hasil dari IPK 3.50

(52)

IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Kegiatan

Bekerja Nongkrong

Tidur

Lulus Tepat Waktu Lulus Tepat Waktu

Jenis Kelamin Tidak Lulus Tepat Waktu Tidak Lulus Tepat Waktu

Laki-laki Perempuan

Tipe Kepribadian Tipe Kepribadian

Extrovert Introvert Extrovert Introvert

Lulus Tepat Waktu Lulus Tepat Waktu Lulus Tepat Waktu Lulus Tepat Waktu

Gambar 3.7 Hasil Keseluruhan untuk Pohon Keputusan

Rule Set dibangkitkan dengan melakukan traversal terhadap pohon keputusan ini dan menghasilkan :

RULE 1

IF IPK = 2.75

THEN Lulus_Tepat_Waktu = Tidak RULE 2

IF IPK = 3.00

AND Kegiatan = Bekerja

AND Jenis_Kelamin = Laki-laki AND Tipe_Kepribadian = Extrovert THEN Lulus_Tepat_Waktu = Ya RULE 3

IF IPK = 3.00

(53)

AND Jenis_Kelamin = Laki-laki AND Tipe_Kepribadian = Introvert THEN Lulus_Tepat_Waktu = Ya RULE 4

IF IPK = 3.00

AND Kegiatan = Bekerja

AND Jenis_Kelamin = Perempuan AND Tipe_Kepribadian = Introvert THEN Lulus_Tepat_Waktu = Ya RULE 5

IF IPK = 3.00

AND Kegiatan = Bekerja

AND Jenis_Kelamin = Perempuan AND Tipe_Kepribadian = Extrovert THEN Lulus_Tepat_Waktu = Ya RULE 6

IF IPK = 3.00

AND Kegiatan = Nongkrong

THEN Lulus_Tepat_Waktu = Tidak RULE 7

IF IPK = 3.00

AND Kegiatan = Tidur

THEN Lulus_Tepat_Waktu = Tidak RULE 8

IF IPK = 3.30

THEN Lulus_Tepat_Waktu = Ya RULE 9

(54)

THEN Lulus_Tepat_Waktu = Ya

3.5.2 Perhitungan hasil Analisa Data Testing

Tabel 3.6 Hasil Analisa Data Testing

No. Jenis Kelamin Tipe kepribadian IPK Kegiatan Lulus Tepat Waktu

1. Laki-laki Extrovert 2.75 Bekerja Tidak 2. Laki-laki Extrovert 3.00 Nongkrong Tidak 3. Laki-laki Extrovert 3.00 Nongkrong Tidak

4. Laki-laki Extrovert 3.30 Belajar Ya

5. Laki-laki Extrovert 3.00 Bekerja Ya

6. Laki-laki Extrovert 3.00 Nongkrong Tidak

7. Laki-laki Extrovert 3.00 Bekerja Ya

8. Laki-laki Extrovert 2.75 Nongkrong Tidak

9. Laki-laki Introvert 3.00 Tidur Tidak

10. Laki-laki Extrovert 3.30 Bekerja Ya 11. Laki-laki Extrovert 3.00 Nongkrong Tidak 12. Laki-laki Introvert 3.30 Belajar Ya 13. Laki-laki Extrovert 2.75 Bekerja Tidak 14. Laki-laki Introvert 3.50 Belajar Ya 15. Laki-laki Introvert 3.50 Belajar Ya 16. Perempuan Extrovert 3.50 Belajar Ya 17. Perempuan Extrovert 3.50 Belajar Ya 18. Perempuan Extrovert 3.30 Belajar Ya 19.. Perempuan Extrovert 3.30 Belajar Ya

20. Perempuan Extrovert 3.30 Tidur Ya

(55)

23. Perempuan Introvert 2.75 Tidur Tidak 24. Perempuan Extrovert 2.75 Nongkrong Tidak 25. Perempuan Extrovert 3.50 Belajar Ya 26. Perempuan Extrovert 3.00 Bekerja Ya 27. Perempuan Extrovert 3.30 Bekerja Ya 28. Perempuan Extrovert 3.50 Belajar Ya 29. Perempuan Introvert 2.75 Tidur Tidak 30. Perempuan Extrovert 3.30 Belajar Ya

Dari tabel diatas dapat diambil perhitungan seperti berikut : Ada 2 kemungkinan dalam S yaitu, tepat_waktu dan tidak. Entropy (S)

= - (18/30) log2 (18/30) – (12/30) log2 (12/30) = 0,4421793 + 0,5287712 = 0,9709505

Ada 4 atribut dalam S yaitu, Jenis_Kelamin, Status, IPK dan Kegiatan. Ada 2 Variasi nilai dalam Jenis_Kelamin yaitu, Laki-laki dan Perempuan. Entropy (Slaki_laki)

= - (7/15) log2 (7/15) – (8/15) log2 (8/15) = 0,5131166 + 0,4836749 = 0,9967915

Entropy (Sperempuan)

= - (11/15) log2 (11/15) – (4/15) log2 (4/15) = 0,3281365 + 0,5085041 = 0,8366406

Gain (S, Jenis_Kelamin)

= Entropy (S) – (15/30) * Entropy (Slaki_laki) – (15/30) * Entropy (Sperempuan)

= 0,9709505 – (15/30) * 0,9967915 – (15/30) * 0,8366406 = 0,9709505 – 0,4983957 – 0,4183203 = 0,0524345

(56)

Ada 2 Variasi nilai dalam Tipe kepribadian yaitu, Introvert dan Extrovert. Entropy (Sintrovert)

= - (3/7) log2 (3/7) – (4/7) log2 (4/7) = 0,5238824 + 0,4613456 = 0,985228

Entropy (Sextrovert)

= - (15/23) log2 (15/23) – (8/23) log2 (8/23) = 0,4021769 + 0,5299345 = 0,9321114

Gain (S, Status)

= Entropy (S) – (7/30) * Entropy (Sintrovert) – (23/30) * Entropy (Sextrovert)

= 0,9709505 – (6/30) * 0,985228 – (24/30) * 0,9321114 = 0,9709505 – 0,1970456 – 0,7456891 = 0,0282158

Ada 4 Variasi nilai dalam IPK yaitu, 2.75 , 3.00 , 3.30 dan 3.50. Entropy (S2.75)

= - (6/6) log2 (6/6) = 0 Entropy (S3.00)

= - (3/9) log2 (3/9) – (6/9) log2 (6/9)

= 0,5283208 + 0,3899750 = 0,9182958

Entropy (S3.30)

= - (9/9) log2 (9/9) = 0 Entropy (S3.50)

= - (6/6) log2 (6/6) = 0 Gain (S, IPK)

= Entropy (S) – (6/30) * Entropy (S2.75) – (9/30) * Entropy (S3.00) – (9/30) * Entropy

(S3.30) – (6/30) * Entropy (S3.50)

(57)

Ada 4 Variasi nilai dalam Kegiatan yaitu, Belajar, Bekerja, Nongkrong dan Tidur. Entropy (Sbelajar)

= - (12/12) log2 (12/12) = 0 Entropy (Sbekerja)

= - (5/7) log2 (5/7) – (2/7) log2 (2/7) = - 0,3467334 + 0,5163871 = 0,8631205

Entropy (Snongkrong)

= - (6/6) log2 (6/6) = 0 Entropy (Stidur)

= - (1/5) log2 (1/5) – (4/5) log2 (4/5) = 0,4643856 + 0,2575424 = 0,721928

Gain (S, Kegiatan)

= Entropy (S) – (12/30) * Entropy (Sbelajar) – (7/30) * Entropy (Sbekerja) – (6/30) *

Entropy (Snongkrong) – (5/30) * Entropy (Stidur)

= 0,9709505 – (12/30) * 0 – (7/30) * 0,8631205 – (6/30) * 0 – (5/30) * 0,721928 = 0,9709505 – 0,2013947 – 0,1203213 = 0,6492345

Berarti Atribut yang diambil terlebih dahulu adalah IPK.

IPK

2.75 3.00 3.30 3.50

Gambar 3.8 Pohon Keputusan untuk Atribut IPK

Himpunan S2.75 adalah seperti berikut :

Tabel 3.7 Himpunan IPK 2.75

IPK Jenis Kelamin Tipe kepribadian Kegiatan Lulus Tepat Waktu

(58)

2.75 Laki-laki Extrovert Nongkrong Tidak

2.75 Laki-laki Extrovert Bekerja Tidak

2.75 Perempuan Introvert Tidur Tidak

2.75 Perempuan Extrovert Nongkrong Tidak

2.75 Perempuan Introvert Tidur Tidak

Cuma ada 1 kelas, yaitu Tidak → Tidak diproses.

IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Gambar 3.9 Pohon Keputusan untuk memperoleh hasil dari IPK 2.75

Himpunan S3.00 adalah seperti berikut :

Tabel 3.8 Himpunan IPK 3.00

IPK Jenis Kelamin Tipe kepribadian Kegiatan Lulus Tepat Waktu

3.00 Laki-laki Extrovert Nongkrong Tidak 3.00 Laki-laki Extrovert Nongkrong Tidak

3.00 Laki-laki Extrovert Bekerja Ya

3.00 Laki-laki Extrovert Nongkrong Tidak

3.00 Laki-laki Extrovert Bekerja Ya

3.00 Laki-laki Introvert Tidur Tidak

3.00 Laki-laki Extrovert Nongkrong Tidak

3.00 Perempuan Introvert Tidur Tidak

(59)

Ada 2 kelas dalam S3.00 , yaitu Ya dan Tidak.

Entropy (S3.00)

= - (3/9) log2 (3/9) – (6/9) log2 (6/9) = 0,5283208 + 0,3899750 = 0,9182958

Ada 3 Atribut dalam S3.00, yaitu Jenis_Kelamin, Status dan Kegiatan.

Ada 2 Variasi nilai dalam Jenis_Kelamin, yaitu Laki_laki dan Perempuan. Entropy (S3.00,laki_laki)

= - (2/7) log2 (2/7) – (5/7) log2 (5/7) = 0,5163871 + 0,3467334 = 0,8631205

Entropy (S3.00,perempuan)

= - (1/2) log2 (1/2) – (1/2) log2 (1/2) = 0,5 + 0,5 = 1

Gain (S3.00, Jenis_Kelamin)

Entropy (S3.00) – (7/9) * Entropy (S3.00,laik_laki) – (2/9) * Entropy (S3.00,perempuan)

= 0,9182958 – (7/9) * 0,861205 – (2/9) * 1

= 0,9182958 – 0,6713159 – 0,2222222 = 0,0247577

Ada 2 Variasi nilai dalam Tipe kepribadian, yaitu Introvert dan Extrovert. Entropy (S3.00,introvert)

= - (2/2) log2 (2/2) – (2/2) log2 (2/2) = 0 Entropy (S3.00,extrovert)

= - (3/7) log2 (3/7) – (4/7) log2 (4/7) = 0,5238824 + 0,4613456 = 0,985228

Gain (S3.00, Status)

= Entropy (S3.00) – (2/9) * Entropy (S3.00,introvert) – (7/9) * Entropy (S3.00,extrovert)

= 0,9182958 – (2/9) * 0 – (7/9) * 0,985228

= 0,9182958 – 0,7662884 = 0,1520074

(60)

= - (3/3) log2 (3/3) = 0 Entropy (S3.00,nongkrong)

= - (4/4) log2 (4/4) = 0 Entropy (S3.00,tidur)

= - (2/2) log2 (2/2) = 0 Gain (S3.00, Kegiatan)

= Entropy (S3.00) – (3/9) * Entropy (S3.00,bekerja) – (4/9) * Entropy (S3.00,nongkrong) – (2/9)

* (S3.00,tidur)

= 0,9182958 – (3/9) * 0 – (4/9) * 0 – (2/9) * 0 = 0,9182958

Berarti Atribut selanjutnya yang diambil adalah Kegiatan.

IPK

Gambar 3.10 Pohon Keputusan untuk Atribut IPK dan Kegiatan

Himpunan S3.30 adalah berikut :

Tabel 3.9 Himpunan IPK 3.30

IPK Jenis Kelamin Tipe kepribadian Kegiatan Lulus Tepat Waktu

3.30 Laki-laki Extrovert Belajar Ya

3.30 Laki-laki Extrovert Bekerja Ya

3.30 Laki-laki Introvert Belajar Ya

3.30 Perempuan Extrovert Belajar Ya

3.30 Perempuan Extrovert Belajar Ya

3.30 Perempuan Extrovert Tidur Ya

(61)

3.30 Perempuan Extrovert Bekerja Ya

3.30 Perempuan Extrovert Belajar Ya

Cuma ada 1 kelas, yaitu Ya → Tidak diproses. IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Kegiatan

Bekerja Nongkrong

Tidur

Lulus Tepat Waktu

Gambar 3.11 Pohon Keputusan untuk memperoleh hasil dari IPK 3.30

Himpunan S3.50 adalah seperti berikut :

Tabel 3.10 Himpunan IPK 3.50

IPK Jenis Kelamin Status Kegiatan Lulus Tepat

Waktu

3.50 Laki-laki Introvert Belajar Ya

3.50 Laki-laki Introvert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

3.50 Perempuan Extrovert Belajar Ya

(62)

IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Kegiatan

Bekerja Nongkrong

Tidur

Lulus Tepat Waktu Lulus Tepat Waktu

Gambar 3.12 Pohon Keputusan untuk memperoleh hasil dari IPK 3.50

dan seterusnya ... hingga menghasilkan pohon keputusan seperti berikut : IPK

2.75 3.00 3.30 3.50

Tidak Lulus Tepat Waktu

Kegiatan

Bekerja

Nongkrong Tidur

Lulus Tepat Waktu Lulus Tepat Waktu

Jenis Kelamin Tidak Lulus Tepat Waktu Tidak Lulus Tepat Waktu

Laki-laki Perempuan

Tipe Kepribadian Tipe Kepribadian

Extrovert Introvert Extrovert Introvert

Lulus Tepat Waktu Lulus Tepat Waktu Lulus Tepat Waktu Lulus Tepat Waktu

Gambar 3.13 Hasil Keseluruhan untuk Pohon Keputusan

Gambar

Tabel 2.1 Perbedaan Penelitian Terdahulu dengan Penelitian Sekarang
Gambar 2.1 . Tahapan Data Mining
Tabel 2.2 Data untuk klasifikasi resiko kredit
Gambar 2.2 Pohon Keputusan dengan Simpul Akar Asset
+7

Referensi

Dokumen terkait

Jika anggaran tidak banyak dan telah ada televisi dengan ukuran yang memenui dan sistem stereo, dapat dilakukan pembaharuan sistem entertainmen ke dalam home teater

Dokumen kualifikasi perusahaan asli yang diupload atau dokumen yang dilegalisir oleh pihak yang berwenang dan menyerahkan 1 (satu) rangkap rekaman (foto copy).

However, most of the students feel that avoidance can be used as strategy in learning process to avoid error and to reduce feeling of fear (less confident) despite the fact that

Memilih lensa focal length yang berbeda (atau menggunakan lensa zoom dengan focal length yang bervariasi) memungkinkan perancang sistem dapat menentukan letak kamera pada

Surat Penawaran tidak ditandatangani oleh Pemimpin/Direktur Utama atau penerima kuasa dari pimpinan/direktur utama yang nama penerima kuasanya tercantum dalam akte

This study aims to find out the effect of semantic nature of different types of phrasal verb (literal and figurative phrasal verbs) in the learners’ tendency to avoid phrasal verb,

SEGA genesis (juga dikenal sebagai SEGA Mega Drive) merupakan video game konsol 16 bit yang direlease oleh Sega untuk bersaing dengan NES Sega Generisi

Elemen tersebut adalah sebagai berikut : pola jaringan prostitusi ayam abu-abu; motif-motif yang mendasari ayam abu-abu terjun ke dalam dunia prostitusi dan