• Tidak ada hasil yang ditemukan

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Data dengan Data Asal dan Data Tereduksi adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi manapun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Agustus 2015 Sifa Lusiana NIM G54110006

ABSTRAK

SIFA LUSIANA. Klasifikasi Data dengan Data Asal dan Data Tereduksi. Dibimbing oleh SISWADI dan TONI BAKHTIAR.

Analisis Komponen Utama Kernel (AKUK) merupakan perluasan dari Analisis Komponen Utama (AKU) biasa yang dapat digunakan untuk menyelesaikan permasalahan data yang takterpisah secara linear. Dua kelompok data, yaitu data pengenalan anggur dan data breast tissue digunakan dalam studi ini. Pengklasifikasian pada data asal dan data terstandardisasi dilakukan dengan jarak Euclid dan Mahalanobis. Salah klasifikasi yang diperoleh dengan jarak Mahalanobis lebih besar dibandingkan dengan jarak Euclid. Fungsi kernel Gauss dengan parameter � digunakan dalam AKUK. Salah klasifikasi yang diperoleh dengan AKUK dari kedua kelompok data lebih kecil dibandingkan dengan AKU, pengklasifikasian langsung pada data asal, dan data terstandardisasi dengan menggunakan jarak Euclid. Salah klasifikasi yang diperoleh dari data pengenalan anggur langsung dengan data asal, data terstandardisasi, AKU, dan AKUK pada

� = masing-masing ialah 27.53%, 2.25%, 2.81%, dan 1.12%. Sedangkan, salah klasifikasi yang diperoleh dari data breast tissue langsung dengan data asal, data terstandardisasi, AKU, dan AKUK pada � = masing-masing ialah 31.37%, 13.73%, 13.73%, dan 3.92%.

Kata kunci: salah klasifikasi, jarak Euclid, jarak Mahalanobis, analisis komponen utama, analisis komponen utama kernel

ABSTRACT

SIFA LUSIANA. Data Classification with Original Data and Reduced Data. Supervised by SISWADI and TONI BAKHTIAR.

Kernel Principal Component Analysis (KPCA) is an extension of ordinary Principal Component Analysis (PCA) which can be used to resolve the problem of linearly unseparated data. Two groups of data, namely wine recognition data and breast tissue data are used in this study. The classification on original data and standardized data is performed by using Euclidean and Mahalanobis distances. Misclassification obtained by using Mahalanobis distance is greater compared to that of Euclidean distance. Gaussian kernel function with parameter � is used in KPCA. Misclassification obtained by KPCA from the two data groups is smaller than those of PCA, direct classification with original data, and standardized data using Euclidean distance. Misclassification obtained from wine recognition data on direct classification with original data, standardized data, PCA, and KPCA on � =

respectively are 27.53%, 2.25%, 2.81%, and 1.12%. Meanwhile, misclassification obtained from breast tissue data on direct classification with original data, standardized data, PCA, and KPCA on � = respectively are 31.37%, 13.73%, 13.73% and 3.92%.

Keywords: misclassification, Euclidean distance, Mahalanobis distance, principal component analysis, kernel principal component analysis

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains

pada

Departemen Matematika

KLASIFIKASI DATA DENGAN DATA ASAL DAN DATA

TEREDUKSI

DEPARTEMEN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

BOGOR 2015

Judul Skripsi : Klasifikasi Data dengan Data Asal dan Data Tereduksi Nama : Sifa Lusiana

NIM : G54110006 Disetujui oleh Prof Dr Ir Siswadi, MSc Pembimbing I Dr Toni Bakhtiar, MSc Pembimbing II Diketahui oleh Dr Toni Bakhtiar, MSc Ketua Departemen Tanggal Lulus:

PRAKATA

Puji dan syukur penulis panjatkan kepada Allah SWT atas segala rahmat dan karunia-Nya serta sholawat dan salam kepada Nabi Muhammad SAW sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Januari 2015 ini ialah analisis data, dengan judul Klasifikasi Data dengan Data Asal dan Data Tereduksi. Penyusunan karya ilmiah ini juga tidak lepas dari bantuan beberapa pihak. Untuk itu, penulis mengucapkan terima kasih yang sebesar-besarnya kepada :

1. Prof Dr Ir Siswadi, MSc selaku dosen Pembimbing I yang telah memberikan ilmu, motivasi, bimbingan, kesabaran, saran, dan bantuannya selama penulisan skripsi ini.

2. Dr Toni Bakhtiar, MSc selaku dosen Pembimbing II yang telah memberikan ilmu, motivasi, bimbingan, kesabaran, dan saran selama penulisan skripsi ini.

3. Ir Ngakan Komang Kutha Ardana, MSc selaku dosen penguji yang telah memberikan ilmu dan sarannya.

4. Keluarga tercinta Ayah, Mama, Nabillah, dan keluarga besar yang selalu memberikan doa, dukungan, semangat, bimbingan, dan motivasi yang tak henti-hentinya.

5. Aditya Darmawan yang selalu memberikan semangat, dukungan, doa, motivasi, dan senantiasa mendengarkan curahan hati selama penulisan skripsi ini.

6. Habibah, Elvira, Menisa, Chrysta, Vini, Ronny selaku sahabat SMA yang selalu memberikan semangat dan doanya.

7. Ayu Kharisma, Intan, Kio, Riefdah, Atikah, Alfi, Resty, Putri, Lidya, Febiyana, Andini, Hanna selaku sahabat yang menemani penulis selama masa kuliah, yang telah mendengarkan curahan hati selama penulisan skripsi ini, dan sahabat seperjuangan di tingkat akhir yang selalu memberikan motivasi, semangat, doa, serta dukungannya.

8. Teman-teman Matematika Angkatan 48 yang selalu memberikan dukungan, doa, bantuan, dan keceriaannya.

9. Kakak-kakak Matematika Angkatan 47, adik-adik Matematika Angkatan 49, dan semua teman-teman saya IPB Angkatan 48 yang telah memberikan doa, semangat, dan dukungannya.

Semoga karya ilmiah ini dapat bermanfaat bagi dunia ilmu pengetahuan khususnya Matematika dan menjadi inspirasi bagi penelitian-penelitian selanjutnya.

Bogor, Agustus 2015 Sifa Lusiana

DAFTAR ISI

DAFTAR TABEL vii

DAFTAR GAMBAR vii

DAFTAR LAMPIRAN viii

PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 1

TINJAUAN PUSTAKA 2

Jarak Euclid dan Jarak Mahalanobis 2

Analisis Komponen Utama 2

Analisis Komponen Utama Kernel 6

Fungsi Kernel Gauss 10

Studi Lain 10

METODE PENELITIAN 11

Sumber Data 11

Prosedur Analisis Data 12

HASIL DAN PEMBAHASAN 14

KESIMPULAN 26

DAFTAR PUSTAKA 27

LAMPIRAN 28

Dokumen terkait