• Tidak ada hasil yang ditemukan

Analisis Akurasi Algoritma Pohon Keputusan Dan K-Nearest Neighbor (k-NN)

N/A
N/A
Protected

Academic year: 2019

Membagikan "Analisis Akurasi Algoritma Pohon Keputusan Dan K-Nearest Neighbor (k-NN)"

Copied!
16
0
0

Teks penuh

(1)

ANALISIS AKURASI ALGORITMA POHON KEPUTUSAN

DAN K-NEAREST NEIGHBOR (k-NN)

TESIS

HULIMAN

117038025

PROGRAM STUDI S2 TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

(2)

ANALISIS AKURASI ALGORITMA POHON KEPUTUSAN DAN K-NEAREST NEIGHBOR (k-NN)

TESIS

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika

HULIMAN 117038025

PROGRAM STUDI S2 TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS SUMATERA UTARA

(3)

PERSETUJUAN

Judul : ANALISIS AKURASI ALGORITMA POHON

KEPUTUSAN DAN K-NEAREST NEIGHBOR

(k-NN)

Kategori : -

Nama : Huliman

Nomor Induk Mahasiswa : 117038025

Program Studi : S2 Teknik Informatika

Fakultas : ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Dr. Erna Budhiarti Nababan, M.IT Prof. Dr. Herman Mawengkang

Diketahui/disetujui oleh

Program Studi S2 Teknik Informatika

Ketua,

(4)

PERNYATAAN ORISINALITAS

ANALISIS AKURASI ALGORITMA POHON KEPUTUSAN

DAN K-NEAREST NEIGHBOR (k-NN)

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa

kutipan dan ringkasan yang masing-masing telah disebutkan sumbernya.

Medan, 25 Juli 2013

(5)

PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK KEPENTINGAN

AKADEMIS

Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di

bawah ini:

Nama : Huliman

NIM : 117038025

Program Studi : S2 Teknik Informatika

Jenis Karya Ilmiah : Tesis

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada

Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive

Royalty Free Right) atas tesis saya yang berjudul:

ANALISIS AKURASI ALGORITMA POHON KEPUTUSAN

DAN K-NEAREST NEIGHBOR (k-NN)

Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti

Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media,

memformat, mengelola dalam bentuk database, merawat, dan mempublikasikan tesis

saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai

penulis dan sebagai pemegang dan/atau sebagai pemilik hak cipta.

Demikian pernyataan ini dibuat dengan sebenarnya.

Medan, 25 Juli 2013

Huliman

(6)

Telah diuji pada

Tanggal: 15 Agustus 2013

PANITIA PENGUJI TESIS

Ketua : Prof. Dr. Herman Mawengkang

Anggota : 1. Dr. Erna Budhiarti Nababan, M.IT

2. Prof. Dr. Muhammad Zarlis

3. Prof. Dr. Tulus

(7)

RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap (berikut gelar) : Huliman, S.Kom

Tempat dan Tanggal Lahir : Medan, 15 Desember 1985

Alamat Rumah : Jl. Platina Raya Komplek The Ivory

Blok E-17 Kel. Titipapan

Kec. Medan Deli

Telepon/Faks/HP : (061) 77053205 / 0852 7515 0011

E-mail : [email protected]

Instansi Tempat Bekerja : 1) SMA Dr. Wahidin Sudirohusodo

2) STMIK TIME Medan

Alamat Kantor : 1) Jl. K.L. Yos Sudarso Km. 16,5

Pajak Rambe Kel. Martubung

Kec. Medan Labuhan

2) Jl. Merbabu No. 32 AA-BB Medan

DATA PENDIDIKAN

SD : SD Dr. Wahidin Sudirohusodo TAMAT: 1997

SLTP : SLTP Dr. Wahidin Sudirohusodo TAMAT: 2000

SLTA : SMU Dr. Wahidin Sudirohusodo TAMAT: 2003

S1 : Sistem Informasi STMIK IBBI TAMAT: 2007

(8)

UCAPAN TERIMA KASIH

Pertama-tama penulis memanjatkan puji syukur kehadirat Tuhan Yang Maha Esa atas

segala limpahan rahmat dan karunia-Nya, sehingga penulis dapat menyelesaikan tesis

ini dengan baik dan tepat waktu.

Tesis ini disusun sebagai salah satu syarat untuk memperoleh ijazah Magister

Teknik Informatika pada Program Studi S2 Teknik Informatika, Fakultas Ilmu

Komputer dan Teknologi Informasi Universitas Sumatera Utara (Fasilkom TI USU).

Dalam kesempatan ini, penulis hendak memberikan penghargaan dan

mengucapkan terima kasih yang sebesar-besarnya kepada:

1. Bapak Prof. Dr. dr. Syahril Pasaribu, D.T.M.&H., M.Sc. (C.T.M.), Sp.A.(K.)

selaku Rektor Universitas Sumatera Utara, atas kesempatan yang diberikan

kepada penulis untuk mengikuti dan menyelesaikan pendidikan Pasca Sarjana.

2. Bapak Prof. Dr. Muhammad Zarlis, selaku Dekan Fakultas Ilmu Komputer dan

Teknologi Informasi Universitas Sumatera Utara, sekaligus Ketua Program

Studi S2 Teknik Informatika dan penguji tesis yang telah memberikan masukan

dan motivasi yang tidak ternilai harganya kepada penulis.

3. Bapak Prof. Dr. Herman Mawengkang, selaku pembimbing utama yang

senantiasa memberikan arahan kepada penulis hingga selesainya tesis ini.

4. Ibu Dr. Erna Budhiarti Nababan, M.IT, selaku pembimbing kedua yang telah

meluangkan waktu, tenaga, dan pikiran, serta kesabaran dalam menuntun dan

mengarahkan penulis menjadi seorang peneliti sejati.

5. Bapak Prof. Dr. Tulus, selaku penguji tesis yang benar-benar memberikan

masukan dan arahan yang berarti bagi penulis.

6. Bapak Prof. Dr. Drs. Iryanto, M.Si, selaku penguji tesis yang telah memberikan

arahan dan motivasi yang luar biasa kepada penulis dalam penelitian ini.

7. Bapak M. Andri Budiman, ST, M.Comp.Sc, MEM, selaku Sekretaris Program

Studi S2 Teknik Informatika yang telah memberikan perhatian dan masukan

dalam pengerjaan tesis ini.

8. Seluruh dosen Program Studi S2 Teknik Informatika, Fasilkom TI USU yang

(9)

9. Ibu P.W. Wijaya, M.Pd, selaku Kepala SMA Dr. Wahidin Sudirohusodo, Medan

Labuhan yang telah memberikan izin studi, membagi pengalaman beliau di

bidang pendidikan, dan juga memberikan spirit (semangat) yang “hebat dan

dahsyat” kepada penulis.

10. Ibu Madjakani Widjaja, yang senantiasa menjadi inspirator dan motivator bagi

penulis serta memberikan doa sehingga penulis dapat menyelesaikan studi ini

dengan baik dan tepat waktu.

11. Kedua orang tuaku, saudara, dan istri tercinta, Cristiena yang telah memberikan

kasih sayang dan dengan penuh ketulusan mendoakan penulis agar selalu

diberikan kekuatan lahir dan batin dalam menyelesaikan studi ini.

12. Perg. Dr. Wahidin Sudirohusodo, Medan Labuhan, tempat penulis mengabdikan

diri sebagai Guru Bidang Studi Teknologi Informasi dan Komunikasi (TIK).

13. STMIK TIME Medan, tempat penulis mengabdikan diri sebagai Dosen Mata

Kuliah Algoritma dan Pemrograman sejak tahun 2007.

14. Rekan mahasiswa Program Studi S2 Teknik Informatika, Fasilkom TI USU

Angkatan 2011 atas kerja sama dan kekompakan selama studi dan penelitian.

15. Seluruh staf/pegawai dan sivitas akademika Program Studi S2 Teknik

Informatika, Fasilkom TI USU atas kerja sama-nya selama studi dan penelitian.

Penulis menyadari sepenuhnya bahwa masih adanya kekurangan dalam

penyajian tesis ini. Oleh karena itu, penulis mengharapkan masukan dan saran yang

bersifat membangun demi penyempurnaan tesis ini di masa mendatang. Akhir kata,

penulis berharap tesis ini dapat bermanfaat bagi para pembaca yang memiliki minat di

bidang ilmu komputer dan teknologi informasi.

Medan, 25 Juli 2013

Huliman

(10)

ABSTRAK

Perkembangan teknologi basis data modern telah memungkinkan ruang penyimpanan yang besar dan hal ini menjadi latar belakang dikembangkannya konsep data mining. Salah satu fungsi utama data mining adalah fungsi klasifikasi yang digunakan untuk memprediksi kelas dan menghasilkan informasi berdasarkan data historis. Pada fungsi klasifikasi, terdapat banyak algoritma yang dapat digunakan untuk mengolah input

menjadi output yang diinginkan, sehingga harus diperhatikan aspek performance dari masing-masing algoritma tersebut. Tujuan penelitian ini adalah untuk menganalisis dan membandingkan performance algoritma klasifikasi pohon keputusan (C4.5) dan

k-Nearest Neighbor (k-NN) dari sudut pandang akurasi. Data sets penelitian berasal

dari UCI data sets, yaitu BreastCancer, Car, Diabetes, Ionosphere, dan Iris. Adapun metode evaluasi yang digunakan pada kedua macam algoritma adalah 10-fold cross

validation. Hasil evaluasi berupa confusion matrix untuk penilaian precision, recall,

F-measure, dan success rate. Hasil analisis perbandingan akurasi menunjukkan bahwa

nilai keakuratan algoritma pohon keputusan lebih baik dengan variasi 2.28% - 2.5% dibandingkan algoritma k-NN pada implementasi terhadap 5 data sets penelitian.

(11)

ACCURACY ANALYSIS OF DECISION TREE AND

K-NEAREST NEIGHBOR (k-NN) ALGORITHM

ABSTRACT

The development of modern database technology has enabled large space of storage and this concept has become the background of the data mining applications. One of the main functions of data mining is the classification that is used to predict the class and generate information based on historical data. In the classification, there is a lot of algorithms that can be used to process the input into the desired output, thus it is very important to observe and measure the performance of each algorithm. The purpose of this research is to analyze and compare the performance of decision tree (C4.5) and k-Nearest Neighbor (k-NN) algorithm from the point of view of accuracy. Data sets are derived from UCI data sets, namely BreastCancer, Car, Diabetes, Ionosphere, and Iris. The evaluation method used in both kinds of algorithms is 10-fold cross validation. Evaluation result for each algorithm is a confusion matrix for measuring the precision, recall, F-measure, and success rate. Comparative analysis of the accuracy showed that the accuracy of the decision tree algorithm is better by variation of 2.28% - 2.5% compared to k-NN algorithm in the implementation for 5 research data sets.

(12)
(13)
(14)

xiii

BAB 5 : KESIMPULAN DAN SARAN

5.1. Kesimpulan 63

5.2. Saran 64

DAFTAR PUSTAKA 65

(15)

xiv

(16)

xv

DAFTAR GAMBAR

Nomor Keterangan Hal

2.1. Konsep Pohon Keputusan 5

2.2. Struktur Pohon Keputusan 6

2.3. Pohon Keputusan Sebelum dan Setelah Dipangkas 11 2.4. Ilustrasi Kedekatan Kasus Pasien 12

2.5. Ilmu Data Mining 16

2.6. Peranan Bidang Ilmu Lain terhadap Data Mining 16 2.7. Tingkatan Pemanfaatan Data untuk Pengambilan Keputusan 17 2.8. Tahapan KDD pada Data Mining 18 2.9. Data Cube pada Data Warehouse 22 2.10. Contoh Model Klasifikasi 24 2.11. Prosedur 5-fold Cross Validation 26

2.12. Hasil Prediksi Kelas 27

3.1. Diagram Alir Perhitungan Akurasi Pohon Keputusan pada Diabetes.arff 35 3.2. Diagram Alir Perhitungan Akurasi k-NN pada Diabetes.arff 37 3.3. Metode 10-fold Cross Validation 38 3.4. Confusion MatrixDiabetes.arff 39

3.5. Interface WEKA 3.7.8 42

3.6. Tahapan Preprocess 43

3.7. Tahapan Classify 44

Referensi

Dokumen terkait

Tujuan dari penelitian ini adalah untuk menganalisa mengkomparasi Algoritma Scale Invariant Feature Transform (SIFT) dengan Algoritma K-Nearest Neighbor (K-NN) untuk

Untuk Mata Acara Rapat ke-6, keputusan adalah mengikat apabila disetujui oleh pemegang saham Seri A Dwiwarna dan para pemegang saham lainnya dan/atau wakil mereka yang sah

Semakin cepatnya laju alih fungsi lahan pertanian yang terjadi di Kabupaten Badung dan Kabupaten Gianyar, menggambarkan eksistensi subak akan dipertaruhkan, sehingga jika

Pihak pertama berjanji akan mewujudkan target kinerja yang seharusnya sesuai lampiran perjanjian ini, dalam rangka mencapai target kinerja jangka menengah seperti yang telah

1) dapatkan daftar setiap kegiatan teknis sebagaimana tertuang dalam Renstra Organisasi Perangkat Daerah, RKT, DPA termasuk indikator sasarannya. 2) dapatkan definisi dan

Meningkatnya kualitas akuntabilitas keuangan negara di wilayah Perwakilan Meningkatnya tata pemerintahan yang baik di wilayah Perwakilan BPKP Terciptanya iklim yang

yang termuat dalam Pasal 1575 KUHPer, sebab ketentuan hukum itu sudah tidak berlaku lagi sejak berlakunya UUPA pada tanggal 24. September 1960, sehingga yang berlaku disini

Pemberian media tumbuh serbuk kayu, ampas tebu dan ampas teh dengan penambahan gula (sukrosa) berpengaruh nyata waktu pertumbuhan optimal misellium , munculnya