ANALISA PERFORMANSI MENGGUNAKAN
ALGORITMA DECISSION TREE
TESIS
Oleh
MARIES SWENDY
097038001/ TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
ANALISA PERFORMANSI MENGGUNAKAN
ALGORITMA DECISSION TREE
TESIS
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Magister Komputer Dalam Program Studi Magister Teknik
Informatika Pada Program Pascasarjana Fakultas MIPA
Universitas Sumatera Utara
Oleh
MARIES SWENDY
097038001/ TINF
PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA MEDAN
PENGESAHAN TESIS
Menyetujui Komisi Pembimbing,
Dr. Erna Budhiarti Nababan, MIT Prof Dr Drs Iryanto M.Si
Anggota Ketua
Ketua Program Studi Dekan
Prof. Dr. Muhammad Zarlis Dr. Sutarman, M.Sc
NIP : 19570701 198601 1 003 NIP : 19631026 199103 1 001 Judul Tesis :
ANALISA PERFORMANSI
MENGGUNAKAN
ALGORITMA
DECISSION TREE
Nama Mahasiswa : MARIES SWENDY Nomor Induk Mahasiswa : 097038001Program Studi : Magister (S2) Teknik Informatika
PERNYATAAN ORISINALITAS
ANALISA PERFORMANSI MENGGUNAKAN ALGORITMA DECISSION TREE
TESIS
Dengan ini penulis nyatakan bahwa penulis mengakui semua karya tesis ini adalah hasil karya penulis sendiri kecuali kutipan dan ringkasan yang tiap bagiannya telah dijelaskan sumbernya dengan benar.
Medan, 20 Januari 2012
PERNYATAAN PERSETUJUAN PUBLIKASI
KARYA ILMIAH UNTUK KEPENTINGAN
AKADEMIS
Sebagai sivitas akademika Universitas Sumatera Utara, saya yang bertandatangan di bawah ini:
Nama Mahasiswa : MARIES SWENDY
Nomor Induk Mahasiswa : 097038001
Program Studi : Magister (S2) Teknik Informatika Jenis Karya Ilmiah : TESIS
Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive
Royalty Free Right) atas Tesis saya yang berjudul :
ANALISA PERFORMANSI MENGGUNAKAN ALGORITMA DECISSION TREE
Beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Non-Eksklusifini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan Tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.
Medan, 20 Januari 2012
Telah diuji pada
Tanggal : 20 Januari 2011
PANITIA PENGUJI TESIS
Ketua : Prof. Drs Iryanto, M.Si
Anggota : 1. Dr. Erna Budhiarti Nababan, MIT 2. Prof.Dr.Opim Salim Sitompul 3 . Prof. Dr. Muhammad Zarlis
DATA PRIBADI
RIWAYAT HIDUP
Nama Lengkap MARIES SWENDY
Tempat dan Tanggal Lahir Medan, 28 Maret 1985
Alamat Rumah Jl. Gelatik IX No. 205 Perumnas Mandala Medan 20226
Email [email protected]
Instansi Tempat Bekerja PT. Telekomunikasi Indonesia, Tbk. Alamat Kantor Jl.Putri Hijau No. 1 Medan
DATA PENDIDIKAN
i
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT Tuhan Yang Maha Esa atas segala limpahan erkah, rahmat dan karunia-Nya sehingga Tesis ini dapat diselesaikan melalui bimbingan, arahan dan bantuan yang diberikan berbagai pihak khususnya pembimbing, pembanding, para dosen, teman mahasiswa, khususnya mahasiswa Program Studi Magister (S2) Teknik Informatika di FMIPA Universitas Sumatera Utara.
Tesis yang berjudul: “Analisa Performansi menggunakan Algoritma
Decision Tree” adalah merupakan Tesis dan syarat untuk memperoleh gelar Magister Komputer dalam Program Studi Magister (S2) Teknik Informatika pada Program Pascasarjana FMIPA Universitas Sumatera Utara. Penulis mengucapkan terima kasih yang sebesar-besarnya kepada:
Orangtua tercinta Ayahanda dan Ibunda serta semua keluarga yang senantiasa mendoakan, dan memberikan dorongan kepada penulis.
Rektor Universitas Sumatera Utara, Prof. Dr. dr. Syahril Pasaribu, DTM&H, M,Sc (CTM), Sp. A(K) atas kesempatan yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan Program Magister (S2).
Dekan FMIPA Universitas Sumatera Utara, Dr. Sutarman, M.Sc atas kesempatan yang diberikan kepada penulis menjadi mahasiswa Program Magister (S2) pada Program Pascasarjana FMIPA Universitas Sumatera Utara.
Ketua Program Studi Magister (S2) Teknik Informatika, Prof. Dr. Muhammad Zarlis, Sekretaris Program Studi Magister (S2) Teknik Informatika M. Andri Budiman, ST, M. Comp. Sc, M.EM beserta seluruh Staff Pengajar pada Program Studi Magister (S2) Teknik Informatika Program Pascasarjana FMIPA Universitas Sumatera Utara, yang telah bersedia membimbing penulis, sehingga dapat menyelesaikan pendidikan tepat pada waktunya.
ii
kesabaran membimbing, memberikan dukungan moril, memotivasi kritik dan saran serta memberikan bahan-bahan yang berkaitan dengan penyusunan tesis ini sehingga penulis dapat menyelesaikan tesis ini dengan baik.
Terimakasih yang tak terhingga dan penghargaan setinggi-tingginya penulis ucapkan kepada Prof. Dr. Muhammad Zarlis, Prof. Dr. Opim, M.Sc dan M. Andri Budiman, ST, M. Comp. Sc, M.EM sebagai pembanding, yang telah memberikan kritik dan saran serta arahan yang baik demi penyelesaian tesis ini.
Seluruh Staf Pengajar dan Administrasi, Program Studi Magister (S2) Teknik Informatika Program Pascasarjana FMIPA Universitas Sumatera Utara yang telah memberikan bantuan dan pelayanan yang baik kepada penulis selama mengikuti perkuliahan.
Rekan Mahasiswa Angkatan Pertama Program Studi Magister (S2) Teknik Informatika Komputer FMIPA Universitas Sumatera Utara yang telah banyak membantu penulis selama mengikuti perkuliahan.
Kepada semua pihak yang tidak dapat penulis sebutkan satu persatu dalam tesis ini, terima kasih atas segala bantuan yang diberikan. Sekecil apapun bantuan yang diberikan kepada penulis turut menghantarkan penulis untuk menyelesaikan pendidikan yang ditempuh selama ini. Dengan segala kekurangan dan kerendahan hati, semoga segala bantuan yang diberikan mendapat balasan oleh Allah SWT Tuhan Yang Maha Kuasa.
Penulis menyadari bahwa tesis ini masih jauh dari sempurna, untuk itu sangat diharapkan masukan, kritik dan saran agar tesis ini bisa lebih baik lagi di masa yang akan datang serta dapat memberi manfaat.
Medan, Januari 2012 Penulis,
iii
ABSTRAK
Penerapan data mining dalam mengambil informasi yang lebih berguna dibandingkan dengan peggunaan basis data konvensional dengan kebutuhan tambahan berupa analisa pemikiran dari user/ pelaku sistem dari sebuah organisasi/ perusahaan. Tesis ini mengusulkan sebuah tools tools yang dapat melakukan monitoring dan tracking performansi melalui model aturan keterhubungan data survei, data hasil audit dengan data revenue pada organisasi/ perusahaan. Faktor-faktor mana yang lebih dominan yang mempengaruhi growth
revenue sebagai variabel tingkat kinerja organisasi/ performansi perusahaan
tersebut. Penggunaan variabel tersebut dengan sistem skala dapat membantu menentukan tingkat performansi yang beragam pada data growth revenue untuk perhitungan pada algoritma pohon klasifikasi dan regresi (CART).
Kata Kunci: decision tree, regresi, performansi, pohon klasifikasi dan regresi
iv
PERFORMANCE ANALYSIS USING DECISION TREE ALGORITHMS
ABSTRACT
Data mining have been implemented to get the information more usefull then using conventional database combine with using human analysis as the user from the organization/ company systems. This Thesis proposes a tools to monitoring and tracking performance from the connectedness rule model of the results of survey, audit data and revenue’s data in organization/ company systems. The more dominant factors that influence the growth revenue as the variable of organization/ company performance. The Variabel using scale system to helps finding kind of performance level in growth revenue using classification and regression tree (CART)
v
BAB I PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Perumusan Masalah 3
1.3. Batasan Masalah 4
1.4 Tujuan Penelitian 4
1.5 Manfaat Penelitian 5
1.6 Metodologi Penelitian 5 1.7 Sistematika Penulisan 6
BAB II TINJAUAN PUSTAKA 8
2.1 Pengertian Data Mining 8 2.2 Tahapan Data Mining 10 2.3 Teknik Data Mining 13
2.4 Kernel K-Mean 17
vi
BAB III METODOLOGI 33
3.1. Selection Data 33
3.1.1 Data Revenue 34
3.1.2 Data Customer Satisfaction Index (CSI) 35 3.1.3 Data Kriteria Baldridge 37 3.2 Preprocessing Data 39
3.2.1 Data Revenue 40
3.2.2 Data Customer Satisfaction Index (CSI) 41 3.2.3 Data Kriteria Baldridge 42 3.2.4. Validasi Data 42
3.3 Transformasi Data 47
3.3.1 Clustering pada data Revenue 48 3.3.2 Penggabungan Data 51
3.3.3 Data Mining 52
BAB IV HASIL DAN PEMBAHASAN 57
4.1. Pendahuluan 57
4.2 Hasil Percobaan 58
4.2.1Cronbach’s Alpha 58 4.2.2 Teknik Analisis Regresi Linear Berganda 59 4.3 Percobaan Data Keseluruhan 62
BAB V KESIMPULAN DAN SARAN 71
5.1. Kesimpulan 71
5.2 Saran 71
DAFTAR PUSTAKA 72
vii
DAFTAR TABEL
Nomor J u d u l Halaman
2.1 Tabel Perbandingan Penelitian yang Relevan 30
3.1 Atribut Data Revenue 35
3.2 Atribut Data CSI 37
3.3 Atribut Data Kriteria Baldridge 39 3.4 Data yang tidak memenuhi syarat 40
3.5 Data Growth Revenue 41
3.6 Data CSI 42
3.7 Data Kriteria Baldridge 42 3.8 Signifikan dan Reliabilitas Statistik Sampel
Data Uner 1 Sumatera 43
viii
DAFTAR GAMBAR
Nomor J u d u l Halaman
1.1 Kerangka pemikiran penelitian 6
2.1 Proses Data Mining 11
2.2 Alur produksi data mining 12 2.3 Penggolongan teknik data mining 13 2.4 Tahapan Teknik Klasifikasi 14 2.5 Tahapan Teknik Asosiasi 15
2.6 Proses clustering 16
2.7 Diagram CART 21
2.8 Struktur Administrasi MBNQA 26 2.9 Kerangka Kerja MBCfPE 27 3.1 Flowchart KDD process 33 3.2 Capture Hasil Kluster dengan Kernel K-Mean 50 3.3 Capture Diagram Hasil Kluster dengan Kernel K-Mean50
3.4 Algoritma CART 53
3.5 Grafik Decision tree pada data sampel 54 3.6 Profil Predikat pada data sampel 56 4.1 Proses penginputan Data Keseluruhan 63 4.2 Proses Linkage Data Keseluruhan 64 4.3 Tampilan Proses pada tab XML di Rapidminer 65 4.4 Tampilan Pohon pada tab XML di Rapidminer 66
4.5 Decision tree Data Keseluruhan 67