• Tidak ada hasil yang ditemukan

Analisis Perbandingan Algoritma Support Vector Clustering (SVC) dan K-Medoids pada Klaster Dokumen

N/A
N/A
Protected

Academic year: 2016

Membagikan "Analisis Perbandingan Algoritma Support Vector Clustering (SVC) dan K-Medoids pada Klaster Dokumen"

Copied!
78
0
0

Teks penuh

(1)

ANALISIS PERBANDINGAN ALGORITMA SUPPORT

VECTOR CLUSTERING (SVC) DAN K-MEDOIDS

PADA KLASTER DOKUMEN

TESIS

SUHADA

117038037

PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

(2)

ANALISIS PERBANDINGAN ALGORITMA SUPPORT

VECTOR CLUSTERING (SVC) DAN K-MEDOIDS

PADA KLASTER DOKUMEN

TESIS

Diajukan untuk melengkapi tugas dan memenuhi syarat memperoleh ijazah Magister Teknik Informatika

SUHADA

117038037

PROGRAM STUDI MAGISTER (S2) TEKNIK INFORMATIKA

FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

UNIVERSITAS SUMATERA UTARA

MEDAN

(3)

PERSETUJUAN

Judul Tesis : Analisis Perbandingan Algoritma Support Vector Clustering (SVC) Dan K-Medoids Pada Klaster Dokumen

Kategori : Tesis

Nama Mahasiswa : Suhada Nomor Induk Mahasiswa : 117038037

Program Studi : Magister (S2) Teknik Informatika

Fakultas : Ilmu Komputer Dan Teknologi Informasi Universitas Sumatera Utara

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Dr. Marwan Ramli, M.Si Prof. Dr. Muhammad Zarlis

Diketahui/disetujui oleh

Program Studi Magister (S2) Teknik Informatika Ketua,

(4)

PERNYATAAN ORISINALITAS

ANALISIS PERBANDINGAN ALGORITMA SUPPORT

VECTOR CLUSTERING (SVC) DAN K - MEDOIDS

PADA KLASTER DOKUMEN

TESIS

Saya mengakui bahwa tesis ini adalah hasil karya saya sendiri, kecuali beberapa kutipan dan ringkasan masing – masing telah disebutkan sumbernya.

Medan, 6 Juni 2013

(5)

PERNYATAAN PERSETUJUAN PUBLIKASI

KARYA ILMIAH UNTUK KEPENTINGAN

AKADEMIS

Sebagai Sivitas akademika Universitas Sumatera Utara, saya yang bertanda tangan di bawah ini:

Nama : Suhada

NIM : 117038037

Program Studi : Magister (S2) Teknik Informatika Jenis Karya Ilmiah : Tesis

Demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas Sumatera Utara Hak Bebas Royalti Non-Eksklusif (Non-Exclusive Royalty free Right) atas tesis saya yang berjudul:

ANALISIS PERBANDINGAN ALGORITMA SUPPORT VECTOR CLUSTERING (SVC) DAN K-MEDOIDS

PADA KLASTER DOKUMEN

Beserta perangkat yang ada. Dengan Hak Bebas Royalti Non-Eksklusif ini, Universitas Sumatera Utara berhak menyimpan, mengalih media, memformat, mengelola dalam bentuk database, merawat dan mempublikasikan tesis saya tanpa meminta izin dari saya selama tetap mencantumkan nama saya sebagai penulis dan sebagai pemegang dan atau sebagai pemilik hak cipta.

Demikian pernyataan ini dibuat dengan sebenarnya.

Medan, 6 Juni 2013

(6)

Telah diuji pada

Tanggal : 20 Juni 2013

PANITIA PENGUJI TESIS

Ketua : Prof. Dr. Muhammad Zarlis

Anggota : 1. Prof. Dr. Herman Mawengkang

2. Prof. Dr. Tulus

3. Dr. Marwan Ramli, M.Si

(7)

RIWAYAT HIDUP

DATA PRIBADI

Nama Lengkap : Drs. Suhada

Tempat dan Tanggal Lahir : Pematangsiantar, 13 Mei 1958

Alamat Rumah : Jl. Batu Kapur No. 19 Pematangsiantar

E_Mail :

Instansi Tempat Bekerja : AMIK Tunas Bangsa Pematangsiantar

Alamat Kantor : Jl. Jend. Sudirman No. 2A Pematangsiantar

DATA PENDIDIKAN

SD : SD Negeri No.8 Pematangsiantar TAMAT : 1971

SMP : SMP Negeri 2 Pematangsiantar TAMAT : 1974

SMA : SMA Negeri 3 Pematangsiantar TAMAT : 1977

Strata-1 : FMIPA Fisika USU Medan TAMAT : 1987

(8)

KATA PENGANTAR

Assalamu’alaikum Wr. Wb.

Pertama-tama penulis panjatkan syukur Alhamdulillah kepada Allah SWT, berkat

rahmat dan kemurahanNya penulis dapat menyelesaikan tesis ini dengan judul Analisis

Perbandingan Algoritma Support Vector Clustering (SVC) Dan K-Medoids Pada Klaster

Dokumen.

Laporan tesis ini disusun dan diajukan untuk memenuhi persyaratan dalam

memperoleh gelar magister pada Program Pascasarjana FasilKom TI Universitas

Sumatera Utara.

Dalam penyelesaian tesis beserta penyusunan laporannya dapat berjalan dengan

lancar, tidak lepas dari dukungan berbagai pihak. Oleh karena itu, penulis mengucapkan

banyak terima kasih kepada:

Allah SWT yang senantiasa memberikan kemudahan dan kekuatan kepada

penulis dalam memahami dan mengamalkan ilmu-ilmu yang didapatkan selama ini.

Bapak Prof. Dr. dr. Syahril Pasaribu, DTM&H, M.Sc (CTM), Sp. A(K) selaku

Rektor Universitas Sumatera Utara, atas kesempatan yang diberikan kepada penulis untuk

mengikuti dan menyelesaikan pendidikan Program Magister.

Bapak Prof. Dr. Muhammad Zarlis, selaku Dekan FasilKom TI Universitas

Sumatera Utara, atas kesempatan yang diberikan kepada penulis untuk mengikuti dan

menyelesaikan pendidikan Program Magister pada Program Pascasarjana FasilKom TI

Universitas Sumatera Utara..

Bapak Prof. Dr. Muhammad Zarlis selaku Ketua Program Studi Magister Teknik

Informatika dan selaku dosen pembimbing utama yang dengan penuh perhatian telah

(9)

Bapak Muhammad Andri Budiman, S.T, M. Comp. Sc, M.EM selaku Sekretaris

Program Studi Magister Teknik Informatika.

Bapak Dr. Marwan Ramli, M.Si selaku pembimbing anggota yang dengan penuh

kesabaran menuntun dan membimbing penulis hingga selesainya penelitian ini.

Seluruh dosen serta civitas akademika pada Program Studi Magister Teknik

Informatika Program Pascasarjana FasilKom TI Universitas Sumatera Utara, yang telah

memberikan bekal ilmu dan pengetahuan selama penulis mengikuti kuliah di Universitas

Sumatera Utara.

Ketua Yayasan Muhammad Nasir AMIK Tunas Bangsa Pematangsiantar H.

Mauliyah Ahmad Ridwan Syah yang telah memberikan izin, bantuan moril dan materil

dan kesempatan kepada penulis untuk mengikuti pendidikan lanjutan pada program

Pascasarjana FasilKom TI Universitas Sumatera Utara.

Orangtua tercinta, almarhum ayahanda dan almarhum ibunda serta seluruh

keluarga yang senantiasa mendoakan dan memberikan dorongan kepada penulis.

Istri dan anak tercinta Nikma Siregar, Fanny Andhina dan Riyan Muhammad

yang selalu mendoakan, memberikan semangat dengan kasih, sabar dan bantuan selama

penulis mengikuti pendidikan. Budi baik ini tidak dapat dibalas, hanya diserahkan kepada

Allah SWT, Tuhan Yang Maha Esa. Sekali lagi terimakasih.

Rekan mahasiswa se-angkatan penulis program studi magister (S2) Teknik

Informatika Komputer FasilKom TI Universitas Sumatera Utara dan rekan sejawat di

AMIK Tunas Bangsa Pematangsiantar, yang telah banyak membantu penulis selama

mengikuti perkuliahan.

Direktur AMIK Tunas Bangsa, Bapak Rahmat Widia Sembiring, M.Sc.IT. yang

telah banyak membantu penulis dalam menyelesaikan tesis ini.

Bapak Prof. Dr. Opim Salim Sitompul yang telah banyak memberikan dorongan

kepada penulis untuk menyelesaikan tesis ini.

Semua pihak yang tidak dapat disebutkan satu-persatu, yang telah berperan serta

(10)

Penulis menyadari bahwa penulisan laporan tesis ini masih jauh dari

kesempurnaan baik dari segi materi yang dibahas maupun dari penulisannya. Untuk itu

saran dan kritik yang bersifat membangun sangat penulis harapkan.

Akhir kata penulis berharap semoga tesis beserta laporannya ini membawa

manfaat dan faedah bagi pembaca dan pihak-pihak yang berkepentingan, serta buat

penulis sendiri sebagai dharma bakti penulis kepada almamater.

Wassalamualaikum.Wr.Wb.

Medan, 6 Juni 2013 Penulis

(11)

ABSTRAK

Data dengan jumlah yang begitu besar berpotensi menghasilkan kesalahan dalam penyajian informasi. Pengolahan data dokumen juga menjadi isu penting pada saat ini. Seiring dengan meningkatkan jumlah data yang dikumpulkan dan disimpan dalam suatu database meningkat secara drastis. Data ini dapat berasal dari berbagai macam sumber seperti aplikasi financial, Enterprise Resource Management (ERM), Customer Relationship Management (CRM), dan lain-lain. Data-data tersebut jika di olah dapat digunakan untuk menunjang proses pengambilan keputusan.

Penelitian ini difokuskan kepada isu aplikasi metode data mining pada kasus pengelompokkan data (Clustering). Dengan terdapatnya jumlah data yang cukup besar memungkinkan peranan metode data mining dalam hal proses segmentasi melalui klastering yang dapat mengelompokkan data ke dalam beberapa kelompok (Klaster) yang diinginkan. Adapun metode data mining yang digunakan Support Vector Clustering (SVC) dan algoritma K-Medoids. Pengujian nya dilakukan dengan software Rapidminer. Hasilnya didapat untuk SVC berkisar 11:21 Menit dan K-Medoids berkisar 3:21 Menit.

(12)

ABSTRACT

Data with such a large number of potentially result in errors in the presentation of information. Data processing documents also become an important issue at this time. Along with the increasing amount of data collected and stored in a database increases drastically. This data can come from a variety of sources such as financial applications, Enterprise Resource Management (ERM), Customer Relationship Management (CRM), and others. These data if if can be used to support the decision-making process.

This study focused on the issue of application of data mining methods in the case of data classification (clustering). With the presence of a considerable amount of data possible role of data mining methods in the process of segmentation via clustering that can classify the data into groups (clusters) are desired. The data mining method used Support Vector Clustering (SVC) and K-Medoids algorithm. Her test is done with the software RapidMiner. The result obtained for 11:21 Minutes SVC ranges and K-Medoids range 3:21 Minutes.

(13)

DAFTAR ISI 2.5 Algoritma Support Vektor Clustering 14

2.6 Algoritma K-Medoids 15

2.7 Riset-Riset Terkait 16

2.8 Kontribuasi Riset 17

2.9 Analisa dan Interpretasi 17

BAB III METODE PENELITIAN 18

3.1. Pendahuluan 18

3.2 Lokasi dan Waktu Penelitian 18

3.3 Rancangan Penelitian 20

3.4 Flowchart Metodologi Penelitian 21 3.5 Perancangan Proses Klastering 23

BAB IV HASIL DAN PEMBAHASAN 24

(14)

4.2 Sampel Data Yang Bersumber Dari Berbagai Bidang Pendidikan AMIK Tunas Bangsa

Pematangsiantar 25

4.3 Proses Support Vector Clustering 25 4.4 Hasil Proses Support Vector Clustering 31

4.5 Proses K-Medoids 38

BAB V PENUTUP 53

5.1. Kesimpulan 53

5.2. Saran 53

DAFTAR PUSTAKA

(15)

ABSTRAK

Data dengan jumlah yang begitu besar berpotensi menghasilkan kesalahan dalam penyajian informasi. Pengolahan data dokumen juga menjadi isu penting pada saat ini. Seiring dengan meningkatkan jumlah data yang dikumpulkan dan disimpan dalam suatu database meningkat secara drastis. Data ini dapat berasal dari berbagai macam sumber seperti aplikasi financial, Enterprise Resource Management (ERM), Customer Relationship Management (CRM), dan lain-lain. Data-data tersebut jika di olah dapat digunakan untuk menunjang proses pengambilan keputusan.

Penelitian ini difokuskan kepada isu aplikasi metode data mining pada kasus pengelompokkan data (Clustering). Dengan terdapatnya jumlah data yang cukup besar memungkinkan peranan metode data mining dalam hal proses segmentasi melalui klastering yang dapat mengelompokkan data ke dalam beberapa kelompok (Klaster) yang diinginkan. Adapun metode data mining yang digunakan Support Vector Clustering (SVC) dan algoritma K-Medoids. Pengujian nya dilakukan dengan software Rapidminer. Hasilnya didapat untuk SVC berkisar 11:21 Menit dan K-Medoids berkisar 3:21 Menit.

(16)

ABSTRACT

Data with such a large number of potentially result in errors in the presentation of information. Data processing documents also become an important issue at this time. Along with the increasing amount of data collected and stored in a database increases drastically. This data can come from a variety of sources such as financial applications, Enterprise Resource Management (ERM), Customer Relationship Management (CRM), and others. These data if if can be used to support the decision-making process.

This study focused on the issue of application of data mining methods in the case of data classification (clustering). With the presence of a considerable amount of data possible role of data mining methods in the process of segmentation via clustering that can classify the data into groups (clusters) are desired. The data mining method used Support Vector Clustering (SVC) and K-Medoids algorithm. Her test is done with the software RapidMiner. The result obtained for 11:21 Minutes SVC ranges and K-Medoids range 3:21 Minutes.

(17)

BAB I

PENDAHULUAN

1.1 Latar Belakang

(18)

dalam pengklasteran data salah satu nya adalah dengan Data Mining (DM). Data Mining adalah proses pencarian pola dan relasi-relasi yang tersembunyi di data yang besar dengan tujuan untuk melakukan klasifikasi, estimasi, prediksi, klastering, deskripsi, dan visualisasi (Han dkk, 2001 dan Baskoro,2010).

Dengan meningkatnya pertumbuhan teknologi, jumlah data yang dikumpulkan dan disimpan dalam database semakin meningkat secara drastis, sehingga menimbulkan kesulitan dalam pengelompokkan data. Data-data tersebut, jika diolah dapat digunakan untuk menunjang pengambilan keputusan. Kita dapat mempelajari pola-pola dari data-data tersebut yang sering dikenal dengan pengenalan pola (pattern recognition), merupakan bagian dari data mining. Tujuan utama dari data mining untuk mendapatkan informasi dari data dengan cara mempelajari pola tersebut. Mengacu dari skema di atas penelitian ini fokus pada isu aplikasi metode data mining pada kasus pengelompokan data (clustering). Dengan terdapatnya jumlah data yang berskala besar memungkinkan peranan data mining, dalam hal proses segmentasi melalui klastering yang dapat mengelompokkan ke dalam beberapa kelompok (cluster) yang diinginkan. Untuk menyelesaikan permasalahan ini, metode yang digunakan adalah Support Vector Clustering (SVC) dan algoritma K-Medoids akan dibandingkan untuk melihat algoritma mana yang lebih cepat dalam mengklastering data sekaligus mengetahui jumlah hasil klasteringnya.

1.2 Perumusan Masalah

Permasalahan yang akan diselesaikan dalam penelitian ini adalah melakukan klastering dengan menggunakan metode Support Vector Clustering dan Algoritma K-Medoids (PAM) kemudian dilakukan analisis perbandingan tersebut dengan kedua metode tersebut, untuk mengetahui metode terbaik dalam klastering data judul tugas akhir mahasiswa berdasarkan database, jaringan dan web.

1.3 Ruang Lingkup Penulisan

(19)

1. Data yang digunakan di ambil dari judul tugas akhir mahasiswa Diploma 3 AMIK Tunas Bangsa Pematangsiantar berdasarkan Database, jaringan dan web.

2. Metode klastering yang digunakan metode Support Vector Clustering (SVC) dan K-Medoids (PAM) untuk yang hasil akan dibandingkan metode mana yang terbaik dalam pengklasteran dokumen tersebut.

1.4 Tujuan Penelitian

Tujuan dalam penelitian ini adalah :

1. Melakukan pengujian validitas metode yang akan digunakan untuk klastering.

2. Melakukan klastering dari data yang diperoleh dengan beberapa metode yang diusulkan.

3. Menghitung nilai variansi dalam klaster dan antar klaster pada tiap metode.

4. Membanding metode data mining yang digunakan sehingga didapatkan metode yang terbaik berdasarkan nilai variansi yang dihasilkan.

1.5 Manfaat Penelitian

Manfaat yang diperoleh dari penelitian ini adalah :

1. Diperoleh hasil klastering yang lebih optimal untuk data tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar yang didasarkan atas database, jaringan dan web.

(20)

BAB II

TINJAUAN PUSTAKA

2.1. Penambangan Data (Data Mining)

Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini tersembunyi dibalik data atau tidak diketahui secara manual (Iko Pramudiono, 2006). Proses untuk menggali nilai tambah dari sekumpulan data sering juga dikenal sebagai penemuan pengetahuan dari pangkalan data (Knowledge Discovery in Databases = KDD) yaitu tahap-tahap yang dilakukan dalam menggali pengetahuan dari sekumpulan data. Tahap-tahap yang dimaksud digambarkan seperti Gambar 2.1. berikut ini:

Gambar 2.1. Proses Menggali Pengetahuan Dari Pangkalan Data (Sumber; Han.J & Kember, 2006)

(21)

1. Data Selection

Pada proses ini dilakukan pemilihan himpunan data, menciptakan himpunan data target, atau memfokuskan pada subset variabel (sampel data) dimana penemuan akan melakukan. Hasil seleksi disimpan dalam satu berkas yang terpisah dari basis data operasional.

2. Pre-Processing

Pre-Processing dilakukan untuk membuang data yang tidak konsisten dan noise, duplikasi data,memperbaiki kesalahan data dan boleh juga diperkaya dengan data eksternal yang relevan.

3. Transformation

Proses ini mentransformasikan atau menggabungkan ke dalam data yang lebih tepat untuk melakukan proses mining dengan cara melakukan peringkasan.

4. Data Mining

Proses data mining yaitu proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik, metode atau algoritma tertentu.

5. Evaluasi

Proses untuk menterjemahkan pola-pola yang dihasilkan dari data mining. Mengevaluasi apakah pola atau informasi yang ditemukan bersesuaian atau bertentangan dengan fakta atau hipotesa sebelum nya.

(22)

himpunan data yang berukuran besar, output dari data mining dapat dipakai untuk memperbaiki pengambilan keputusan.

Pada dasarkan data mining berhubungan dengan analisis data dan penggunaan perangkat lunak untuk mencari pola dan kesamaan dalam sekelompok data. Ide dasarnya menggali sumber yang berharga dari tempat yang sama sekali tidak terduga, seperti perangkat lunak. Data mining mengekstrasi pola yang sebelumnya tidak terlihat atau tidak begitu jelas sehingga tidak terperhatikan sebelumnya. Analisis data mining berjalan pada data yang cenderung terus meningkat dan teknik terbaik yang digunakan kemudian berorientasi kepada data yang berukuran sangat besar untuk mendapatkan kesimpulan dan keputusan paling layak. Data mining memiliki beberapa sebutan antara lain yaitu : Knowledge Discovery (MiningI in Databases (KDD), ekstraksi pengetahuan (knowledge extraction), analisis data pola , kecerdasan bisnis (business intelligence).

Beberapa faktor yang mendukung perlunya data mining adalah : 1. Data telah mencapai jumlah dan ukuran yang sangat besar. 2. Telah dilakukan proses data warehousing.

3. Kemampuan komputasi yang semakin terjangkau. 4. Persaingan bisnis yang semakin ketat.

Secara sederhana data mining mengacu pada pengekstrakan suatu pengetahuan dari banyaknya data. Sehingga data mining dapat disebut secara tepat dengan data pengetahuan yang diambil dari data sangat besar. Mining itu sendiri berkarakteristik pada proses yang menemukan sekumpulan data kecil yang berharga dari sekian banyak data yang ada.

(23)

2.2 Klastering

2.2.1. Pengertian Klastering

”Klastering adalah proses pengelompokkan satu set benda-benda fisik atau abstrak ke dalam kelas objek yang sama” (Han and Kamber, 2006).

Baskoro (2010) menyatakan bahwa :

Klastering adalah satu diantara alat bantu pada data mining yang bertujuan untuk mengelompokkan objek-objek ke dalam klaster-klaster. Klaster adalah sekelompok atau sekumpulan objek-objek data yang similar satu sama lain dalam klaster yang sama dan disimilar terhadap objek-objek data yang berbeda klaster. Objek-objek yang akan dikelompokkan ke dalam satu atau lebih klaster sehingga objek-objek yang berada dalam suatu klaster akan mempunyai kesamaan yang tinggi antara satu dengan yang lainnya. Objek-objek dikelompokkan berdasarkan prinsip memaksimalkan kesamaan objek pada klaster yang sama dan memaksimalkan ketidaksamaan pada klaster yang berbeda. Kesamaan objek biasanya diperoleh dari nilai-nilai atribut yang menjelaskan objek data, sedangkan objek-objek data biasanya direpresentasikan sebagai sebuah titik dalam ruang multidimensi.

(24)

Klaster 1

Klaster 2 Outliners

Gambar 2.2 Contoh Klastering(Baskoro 2010)

Adapun tujuan dari data Klastering ini adalah untuk meminimalisasikan

objective function yang diset dalam proses Klastering, yang pada umumnya

berusaha meminimalisasikan variasi di dalam suatu Klaster dan

memaksimalisasikan variasi antar Klaster.

2.2.2. Metode Klastering.

Secara garis besar, terdapat beberapa metode clusterisasi data. Pemilihan metode clusterisasi bergantung pada tipe data dan tujuan clusterisasi itu sendiri. Metode-metode beserta algoritma yang termasuk didalamnya meliputi (Baskoro, 2010):

Sadaaki et. al. (2008) menyatakan :

Sebelum memutuskan berapa jumlah cluster yang akan dibentuk bahwa

terdapat dua pendekatan yang dapat digunakan yaitu :

a. supervised (jika jumlah cluster ditentukan).

b. unsupervised (jika jumlah cluster tidak ditentukan/alami).

2.3. Dokumen Klastering.

Dokumen Klastering merupakan suatu teknik untuk mengelompokkan

dokumen-dokumen berdasarkan kemiripannya dengan tujuan mendapatkan sekumpulan

dokumen yang tepat” (Widyawati, 2010). Dokumen-dokumen tersebut dikelompokan

ke dalam klaster berdasarkan tingkat kemiripannya. Suatu klaster dapat dikatakan

bagus apabila tingkat kemiripan antar anggota klaster sangat tinggi dan tingkat Klaster 1

(25)

kemiripan antar klaster sangat rendah. Sedangkan kualitas suatu klasterdapat diukur

melalui kemampuannya dalam menemukan pola-pola yang tersembunyi.

Gambar 2.3. berikut ini menunjukkan contoh data yang akan dilakukan

klastering :

Gambar 2.3 Data Sebelum dilakukan proses pengelompokkan

Jika data dilakukan klastering (pengelompokkan) berdasarkan warna, maka

pengelompokkannya seperti yang terlihat pada gambar 2.4 :

(26)

Jika data dilakukan klastering berdasarkan bentuk, maka pengelompokkan

seperti terlihat gambar 2.5 :

Gambar 2.5 Pengelompokkan berdasarkan kesamaan bentuk

Pengelompokkan bisa juga bisa dilakukan dengan kesamaan jarak

Gambar 2.6 Pengelompokkan berdasarkan kesamaan jarak

Teknik analisis data yang bertujuan untuk mengelompokkan individu / objek

kedalam beberapa kelompok yang memiliki sifat berbeda antar kelompok, sehingga

(27)

Ukuran data yang bias digunakan adalah jarak euclidius (euiclidean) antara dua objek.

Jika objek pertama yang diamati adalah X =[ x1, x2, m, xp,]’ dan Y = [y1, y2,m, yp]’

adalah :

d(�+�) = √ ��=1(Xy−Yj) 2 ……….2.1 analisi klaster diukur dengan menggunakan nilai variance, variance digunakan

untuk mengukur nilai penyebarandari data-data hasil klastering. Pada dasarnya

variance pada klastering ada 2 yaitu variance dalam klaster (Vw) dan variance antar

klaster (Vb). klaster disebut ideal jika memiliki nilai Vw seminimal mungkin Vb

semaksimal mungkin.

Untuk menghitung nilai variance dari semua data setiap klaster digunakan

rumus :

Sedangkan untuk menghitung variance didalam klaster digunakan rumus

sebagai berikut :

1

(28)

1

Sedangkan untuk menghitung variance antar klaster digunakan rumus

sebagai berikut :

untuk mendapat nilai variance dari semua klaster dilakukan dengan cara

membagi nilai variance dalam klaster dengan variance antar klaster. Semakin kecil

nilai tersebut maka semakin klaster yang dihasilkan.

2.4. Support Vector Clustering (SVC)

Support vector clustering merupakan metode clustering dengan menggunakan probabilitas kepadatan titik memakai kernel jarak pada dimensi tinggi (Ben-hur et al, 2001 ) Dua tahapan dari SVC adalah pelatihan data untuk menentukan jarak dan pelabelan kluster.

Pada metode ini, data dipetakan ke dalam dimensi yang lebih tinggi dengan kernel jarak. Pada ruang dimensi yang baru, dilakukan kluster data terlihat sebagai bentuk bola. Untuk mendapatkan kluster data yang sesuai, dilakukan pencarian bentuk bola yang minimal (minimal sphere) .

(29)

Dimana merupakan fungsi transformasi non linear Xj dari dimensi rendah ke dimensi tinggi.

Sehingga persamaan diatas dapat diubah menjadi

………..2.5 Dimana :

a merupakan titik tengah bola minimal R merupakan radius bola minimal

Variabel slack untuk pinalty term bentuk bola yang tidak selalu ideal, dimana j

>= 0.

Untuk dapat menyelesaikan permasalah bola minimal, diperkenalkan Langrangian

……….2.6

Untuk setiap titik xj dengan $j =0 merupakan titik yang berada di permukaan atau di dalam bola. Dimana $j >=0 dan μj>=0 merupakan

Langrangian Multiplier yang bisa didapatkan dengan mengubah ke bentuk Dual problem (W):

………..2.7 Dengan konstrain

(30)

Dengan mengeset turunan dari Langrarian menghasilkan a=

Bola minimal yang telah didapat kemudian dipetakan kembali ke dimensi awal (rendah) dengan menjadi kontur yang secara eksplisit memperlihatkan bentuk kluster. Seluruh titik yang berada pada kontur tersebut diasosiasikan sebagai anggota kluster tersebut.

Ciri titik berada di dalam kontur adalah jarak titik tersebut dengan pusat kluster lebih kecil atau sama dengan radius bola.

……….2.8

……….2.9

Sehingga bentuk kluster dapat dilihat dengan melihat titik –titik support vector dari kluster tersebut. Untuk menentukan titik masuk ke kluster mana diperlukan pengujian jarak titik tersebut dengan titik yang lain. Misal terdapat titik i dan j maka i dan j termasuk dalam kluster yang sama jika jarak seluruh titik-titik antara i dan j dalam garis lurus lebih kecil atau sama dengan radius bola minima. Cara diatas mengharuskan dibuatnya matrik ketetanggan antar titik dimana Aij=1 jika titik i dan j terletak dalam 1 kluster dan Aij=0 jika i dan j tidak terletak dalam 1 kluster.

2.5. Algoritma Support Vector Clustering

1. Lakukan inisialisasi data.

2. Lakukan pencarian nilai beta melalui optimasi persamaan linear dual wolfe dengan konstrain 0< βj < C dan ∑βj=1

(31)

2.6. Algoritma K-Medoids

Pengelompokkan merupakan proses pengumpulan beberapa objek ke dalam

kelompok sehingga setiap objek dalam satu kelompok adalah mirip namun tidak

mirip dengan kelompok yang lain. Metode K-Means telah diketahui sehingga teknik

yang baik untuk pengelompokan. Namun, metode K-Means ini sensitive terhadap

adanya outlier, alternatifnya yang sering digunakan adalah metode K-Medoids

(Park dan Jun, 2009). K-Medoids ini mirip dengan K-Mean, namun yang menjadi

center klaster adalah datum, bukan mean data.

Park dan Jun (2009) menawarkan algoritma K-Medoids dimana menurut

penelitiannya algoritma ini menghasilkan kinerja yang baik dibandingkan K-Means

dan dengan waktu yang lebih cepat.

Algoritma K-Medoids tersebut adalah sebagai berikut :

1. Tahap pertama (pilih inisial medoid)

1-1 Hitung dij , jarak di antara setiap pasangan objek berdasarkan ukuran jarak

tertentu, misalnya Euclidean

��� = �∑��=1(��� − ���)2 = �(x� − x�)′(x�−x�) ( 2.10 )

dimana i=1,…..,n; j=1,…..,n dan p adalah banyak variable, serta V adalah matrik varian kovarian.

1-2 Hitung vj untuk setiap objek j dimana

= � ���

1-3 Urutkan vj dari terkecil ke terbesar. Pilih objek terkecil sebanyak k sebagai inisial medoid.

1-4 Hitung jarak setiap objek terhadap inisial medoid dan kelompok objek dalam k kelompok berdasarkan jarak minimal terhadap setiap medoid. 1-5 Hitung jumlah jarak dari semua objek ke medoid kelompoknya.

(32)

Cari medoid baru pada setiap kelompok dimana jarak antar objek minimal. Update medoid setiap kelompok yang ada dengan medoid yang baru.

3 Tahap Ketiga (menghubungkan objek pada medoid)

3-1 Hitung jarak semua objek ke setiap medoid dan dihasilkan kelompok baru berdasarkan jarak minimal.

3-2 Hitung jarak semua ke medoid kelompoknya. Jika jumlahnya sama dengan jumlah sebelumnya, hentikan algoritma. Jika tidak kembali ke tahap 2.

2.7. Riset-Riset Terkait

Terdapat beberapa riset yang telah dilakukan banyak peneliti berkaitan dengan

domain pendidikan, seperti yang akan dijelaskan dibawah ini :

1. Muchammad Juniarto (2009) menjelaskan bahwa metode SVC lebih baik

daripada K-Means dalam pengelompokkan data.

2. Kusrini (2001) menjelaskan bahwa algoritma data mining.

3. Jayanti Diah Basuki (2008) menjelaskan implementasi tentang algoritma

K-Medoids untuk Clustering dokumen teks.

4. Karhendana, A (2008) menjelaskan tentang pemanfaatan dokumen

(33)

2.8. Kontribusi Riset

Penelitian ini memberikan kontribuasi pada pemahaman tentang hubungan data tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar untuk mengetahui perbandingan ke dua algoritma yang mana yang lebih cepat dalam pengclasteran dokumen. Beberapa kemungkinan lain yang dianggap penting adalah bahwa perguruan tinggi dapat menggunakan informasi dalam hal pengelompokkan data di perguruan tinggi tersebut, untuk membuat agar dapat diketahui model algoritma mana yang lebih baik dalam pengklasteran dokumen.

2.9. Analisis dan Interpretasi

(34)

BAB III

METODOLOGI PENELITIAN

3.1. Pendahuluan

Tujuan dari penulisan tesis ini adalah untuk membuat pengelompokkan data dari tugas akhir mahasiswa dengan membandingkan kedua algoritma Support Vector Clustering dan algoritma K-Medoids untuk mengetahui algoritma mana yang lebih cepat dalam hal pengelompokkan data tugas akhir mahasiswa tersebut, dengan menggunakan software Rapidminer sebagai pedoman dalam pembuatan keputusan. Pada bagian ini kita mulai dengan menggambarkan studi kasus data mining untuk jumlah mahasiswa Diploma III di AMIK Tunas Bangsa Pematangsiantar dalam hal ini judul Tugas Akhir mahasiswa tersebut untuk diolah datanya.

Data yang telah dikumpulkan dari database bagian pendidikan di AMIK Tunas Bangsa Pematangsiantar dan mensurvei data tugas akhir tersebut diambil dari tahun 2007 sampai 2012. Instrumen penelitian yang digunakan harus mempunyai ukuran yang akurat, terperinci, bagaimana mendapatkan yang lebih baik dalam proses data mining yang digambarkan pada bagian sebelum pemrosesan data.

3.2. Lokasi dan Waktu Penelitian

(35)

Secara detail metodologi penelitian ini dirancang seperti diagram block berikut ini :

Gambar 3.1. Diagram Block Penelitian

3.2.1. Data Colection

Data tugas akhir mahasiswa diperoleh dari database AMIK Tunas Bangsa Pematangsiantar berjumlah 2020 dengan atribut sebagai berikut :

1. Nim 2. Nama

3. Tahun Akademik 4. Judul TA

5. Klasifikasi TA

Keseluruhan data yang diperoleh dibuat dalam tabel data (dapat dilihat pada Bab

4 (4.2))

3.2.2. Data Preprocessing

Data yang telah dikumpulkan dilakukan proses untuk mempersiapkan data inputan pada aplikasi SVC dan K-Medoids untuk proses klastering. Langkah-langkah dalam preprocessing data dilakukan sebagai berikut :

1. Data Cleaning

Proses data cleaning dilakukan untuk memastikan dalam tabel data tidak terdapat missing value, tidak konsisten dan atribut yang hilang. 2. Data Transformasi

Format data dibuat dalam bentuk Excel, akan dikonversi menjadi format XML sebagai inputan untuk aplikasi SVC dan K-Medoids.

(36)

3.2.3. Data Analisis (Clustering)

Data yang sudah dipersiapkan sebagai output dari preprocessing akan dianalisis oleh 2 metode klastering yakni : SVC dan K-Medoids.

3.2.4. Cluster Analisis

Hasil klaster yang diperoleh dari proses SVC dan K-Medoids diinterpretasikan untuk mendapatkan ferforma dari masing-masing klaster yang dihasilkan oleh SVC dan K-Medoids, kedua hasil klaster akan dibandingkan untuk melihat model klaster yang terbaik. Model klaster yang terbaik tersebut diperoleh dengan parameter yakni jumlah data pada setiap klaster, atribut data yang mudah dilihat dari setiap klaster yang terbentuk.

3.3. Rancangan Penelitian

Rancangan penelitian ini pertama kali dilakukan dengan pengamatan atau (observasi) untuk mempelajari data tugas akhir mahasiswa. Hasil pengamatan kemudian dibuat percobaan yang mendukung selanjutnya dilakukan eksperimen data dengan menggunakan algoritma Support Vector Clustering dan algoritma K-Medoids lalu membandingkan kedua algoritma tersebut untuk mendapatkan hasil klaster yang terbaik.

Hasil dari eksperimen data ini merupakan pengembangan dari ilmu pengetahuan yang nantinya dapat merupakan input bagi pemecahan masalah yang ada di lembaga pendidikan AMIK Tunas Bangsa Pematangsiantar.

Secara garis besar metodologi penelitian ini dilaksanakan adalah sebagai berikut :

1. Studi literature yang berkaitan dengan permasalahan dan teknik-teknik yang akan digunakan untuk analisis data bersumber dari journal-journal, buku-buku dan internet.

(37)

3. Pemeriksaan kelengkapan data dan pembersihan data-data yang tidak lengkap.

4. Melakukan proses data Preparation (Data Cleaning and Transformation) untuk persiapan sebagai input analisis data.

5. Pengujian dan analisis data menggunakan software Rapidminer yang ada.

6. Pendokumentasian proses dan hasil pengolahan data. 7. Perumusan kesimpulan.

8. Penulisan laporan dalam bentuk tesis.

3.4. Flowchart Metodologi Penelitian

Adapun proses metodologi penelitian untuk Support Vector Clustering dan K-Medoids dapat dilihat pada gambar 3.2 berikut ini :

Identifikasi Permasalahan

Penetapan Tujuan Penelitian

Studi Literatur :

- DataMining - SVC

- K-Medoids

Tahap Identifikasi Awal

Pengumpulan Data : Data Tugas Akhir

Pengolahan Data :

Proses Validasi Metode Klastering (K-Medoids dan SVC) Menggunakan Data TA

Pengolahan Data :

Proses klastering menggunakan data Tugas Akhir dengan metode

(K-Medoids dan SVC)

(38)

Gambar 3.2. Flowchart Metodologi Penelitian

Dalam metodologi penelitian jelas kelihatan bahwa tahap awal, tahap pengumpulan data dan tahap analisis dan kesimpulan, sehingga proses ini dapat memudahkan kita untuk menjalankan pengolahan-pengolahan dan pengumpulan datanya. Dalam hal ini metodologi penelitian yang diproses oleh SVC sangat membantu dalam penulisan tesis ini.

Perbandingan Metode :

Perhitungan variansi dalam klaster dan variansi antar klaster

masing-masing metode

Analisi dan Interpretasi Data (Analisi hasil klastering dan

perbandingan metode)

Kesimpulan dan Saran

(39)

3.5. Perancangan Proses Klastering.

Proses klastering seperti gambar 3.3. di bawah ini yang terdiri dari beberapa proses di antaranya proses klastering itu sendiri. Inputnya berupa teks dokumen (Tugas Akhir Mahasiswa AMIK Tunas Bangsa Pematangsiantar). Untuk mengelompokkan data yang didapat dari Tugas Akhir Mahasiswa AMIK Tunas Bangsa Pematangsiantar yaitu Tentang Web, Jaringan dan Database, dapat dilihat pada gambar 3.3 berikut ini :

Gambar 3.3. Proses Klastering dari SVC dan K-Medoid

Input Teks Dokumen

Preprocessing

Feature Selection

Clustering

SVC K-Medoids

Start

Clustering Teks Dokumen

Clustering Teks Dokumen

(40)

BAB IV

HASIL DAN PEMBAHASAN

4.1. Komunitas Rapidminer

Rapidminer (YALE) adalah perangkat lunak Open Source untuk knowledge discovery dan data mining. Rapidminer memiliki kurang lebih 400 prosedure (operator) data mining, termasuk operator masukan, output dan preprocessing dan visualisasi. Operator meta secara otomatis mengoptimalkan desain eksperimen dan pengguna tidak memerlukan waktu yang panjang untuk menentukan langkah dan parameter yang lebih panjang. Sejumlah besar teknik visualisasi dan kemungkinan untuk meletakkan breakpoints setelah masing-masing operator memberikan pandangan tentang keberhasilan desain anda bahkan untuk menjalankan percobaan.

Ribuan aplikasi data mining yang telah dikembangkan menggunakan Rapidminer dan banyak digunakan di dunia bisnis maupun penelitian.

Beberapa fitur dari Rapidminer antara lain : 1. Berlisensi gratis (open source)

2. Multiflatform karena deprogram dalam bahasa java

3. Internal data berbasis XML sehingga memudahkan pertukaran data eksperimen

4. Dilengkapi dengan scripting language untuk optomasi eksperimen 5. Memiliki GUI (Graphical User Interface), Command Line Mode (batch

Mode), dan java API yang dapat dipanggil dari program lain. 6. Dapat dikembangkan dengan menambahkan plugin dan ekstention 7. Fasilitas plotting untuk visualisasi, multidimensi dan model

(41)

4.2. Sampel Data Yang Bersumber Dari Bidang Pendidikan AMIK Tunas

Bangsa Pematangsiantar.

Data ini adalah data yang diambil dari bidang pendidikan AMIK Tunas Bangsa Pematangsiantar untuk contoh pengklasteran judul Tugas Akhir mahasiswa di AMIK Tunas Bangsa Pematangsiantar, diambil sampel dari 2020 judul, sampel tersebut dapat dilihat pada tabel 4.1 berikut ini :

Tabel 4.1 Sampel Data Tugas Akhir

No Tahun

Akademik Nim Nama Judul

Klasifikasi

1 2012/2013 201001030037 SRI REZEKI

PERANCANGAN SISTEM APLIKASI PENGOLAHAN DATA SIMPAN PINJAM PADA CU. CINTA MULIA PEMATANGSIANTAR

DATABASE

2 2012/2013 201001030020 YULIA CITRA DEWI

Perancangan Dan Impelementasi

Pengarsipan Pembukuan Pada Kantor Bpdas Asahan Barumun Pematangsiantar

DATABASE

3 2012/2013 201001030046 EVA ADINA

Aplikasi Game Tebak Kata Dengan

Menggunakan

Macromedia Flash 8.0

WEB Programming

4 2012/2013 201001030152

ERNI Kuintansi Serba Serbi Berbasis Web Pada PT. Asuransi Jiwasraya Pematangsiantar

WEB Programming

5 2012/2013 201001030005 ELLA

SRIWAHYUNI

Perancangan Dan Implementasi Data Absensi Karyawan PTPN IV Perkebunan Bah Birong Ulu

DATABASE

(42)

proses nantinya akan dibandingkan dengan melihat hasil pengklasteran melalui tampilan yang ada.

4.3. Proses Support Vector Clustering

Dalam proses SVC tampilan yang diperlihatkan dilayar menjadi pedoman untuk

mengetahui proses SVC dengan 4 tahapan yang dapat dilihat pada gambar 4.1 berikut ini

:

Process flow dari Support

Vector Clustering

Gambar 4.1. Tampilan dari Proses SVC dengan menggunakan Software

(43)

Dengan memasukkan data yang bersumber dari bidang pendidikan AMIK Tunas Bangsa pematangsiantar yang berjumlah 2020 judul Tugas Akhir mahasiswa, maka dapat dilihat tahap proses SVC yang dengan ini menggunakan software Rapidminer dengan 4 tahapan antara lain pengelompokan berdasarkan nim, nama, tahun masuk, dan judul Tugas Akhir dari mahasiswa, kemudian dilakukan pengujian sehingga menghasilkan 4 tahapan dari masing-masing gambar. Keterangan masing-masing gambar dapat dilihat pada halaman berikutnya.

Ringkasan

Operator ini membaca sebuah teladan dari file spreadsheet Excel.

Deskripsi

Operator ini dapat digunakan untuk memuat data dari spreadsheet Microsoft Excel. Operator ini mampu membaca data dari Excel 95, 97, 2000, XP, dan 2003. Pengguna harus menentukan mana dari spreadsheet di buku kerja harus digunakan sebagai tabel data. Tabel harus memiliki format sehingga setiap baris adalah contoh dan setiap kolom mewakili atribut. Harap dicatat bahwa baris pertama mungkin digunakan untuk nama atribut yang dapat ditunjukkan dengan parameter.

(44)

Masukan: Data file excel diatur, berupa Data Judul Tugas Akhir, yang bersumber Dari Database AMIK Tunas Bangsa Pematangsiantar.

Output: data set excel Yang Akan menjadi pengelompokkan Artikel Baru Support Vector Clustering

Ringkasan

Clustering dengan vektor dukungan

Deskripsi

Implementasi Support Vector Clustering berdasarkan {@ rapidminer.cite BenHur/etal/2001a}. Operator ini akan membuat atribut klaster jika belum ada.

Masukan

• Contoh set menampilkan: ExampleSetMetaData: # contoh: = 0; # atribut: 0

Keluaran

• Klaster Model:

• Berkelompok menjadi set parameter:

Parameter

• menambahkan atribut klaster: Menunjukkan jika id cluster dihasilkan sebagai atribut khusus yang baru. • tambahkan sebagai label: Jika nilai klaster

ditambahkan sebagai label.

• menghapus berlabel: Hapus contoh berlabel. • pts min: Jumlah minimal poin dalam setiap cluster. • Tipe kernel: The SVM Jenis kernel

• kernel gamma: The SVM parameter kernel gamma (radial).

• Gelar kernel: The SVM kernel Gelar parameter (polinomial).

(45)

• kernel b: The SVM parameter kernel b (saraf). • kernel cache: Ukuran cache untuk evaluasi kernel im MB

• konvergensi epsilon: Presisi pada kondisi KKT • max iterasi: Hentikan setelah ini banyak iterasi • p: Fraksi diperbolehkan outlier.

• r: Gunakan jari-jari ini bukan yang dihitung (-1 untuk radius dihitung).

• titik sampel nomor: Jumlah titik sampel virtual untuk memeriksa neighborship.

Ringkasan

Operator ini dapat digunakan untuk langsung menurunkan ukuran kinerja dari data tertentu atau nilai statistik.

Deskripsi

Operator ini dapat digunakan untuk memperoleh nilai tertentu dari contoh himpunan dan memberikan itu sebagai nilai kinerja yang dapat digunakan untuk tujuan optimasi.

Masukan

• Contoh set: yang didapat dari Example Set

Keluaran

• kinerja: • Contoh set:

Parameter

• Jenis kinerja: Menunjukkan cara bagaimana makro harus didefinisikan.

(46)

digunakan sebagai nilai makro.

• nama atribut: The Nama dari atribut dari mana data harus diturunkan.

• nilai atribut: Nilai atribut yang harus dihitung.

• Indeks contoh: Indeks contoh dari mana data harus diturunkan. Indeks negatif dihitung dari akhir set data. Penghitungan positif dimulai dengan 1, penghitungan negatif dengan -1.

• arah optimasi: Menunjukkan jika nilai kinerja harus diminimalkan atau dimaksimalkan.

Ringkasan

Visualisasi teks.

Deskripsi Masukan

• set contoh masukan

Keluaran

• set contoh keluaran

• Teks pelabuhan Visualizer

Parameter

text-atribut

Yang atribut harus digunakan untuk divisualisasikan? label-atribut

Yang atribut harus divisualisasikan sebagai label?

(47)

terlihat sebagai bentuk bola, untuk mendapatkan klaster data yang sesuai dilakukan pencarian bentuk bola yang minimal.

4.4. Hasil Proses SVC

Pada gambar 4.2 menunjukkan bahwa setelah dilakukan pengklasteran dengan menggunakan metode SVC didapat waktu berkisar 11:21 menit.

Meta data View

Proces sing time

Perfor

mance

Vector

Gambar 4.2. (Hasil klastering dengan proses SVC)

Pada proses dengan Support Vector Clustering (SVC) menunjukkan kecepatan pengklasteran data yakni judul tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar hasil klasteringnya didapat waktu 11:21 menit, dengan klaster yang lebih baik. Ini dapat dilihat pada gambar 4.2.1 berikut ini :

(48)

Model

klaster

SVC

Hasil cluster dengan scatter matrix

(49)

Pada pengklasteran menggunakan metode SVC diambil Scatter Matrix dan berdasarkan judul dapat dilihat pada gambar 4.3 berikut ini :

Gambar 4.3. Hasil klastering SVC berdasarkan judul dengan Scatter Matrix

Berikutnya adalah hasil klastering SVC berdasarkan klasifikasi dapat dilihat pada gambar 4.4. berikut ini :

(50)

Selanjutnya hasil klastering dari SVC berdasarkan Nim dapat dilihat pada gambar 4.5 sebagai berikut :

Gambar 4.5. Hasil klastering SVC berdasarkan Nim dengan Scatter Matrix

Kemudian dilanjutkan dengan pengklasteringan dengan SVC berdasarkan tahun akademik dapat dilihat pada gambar 4.6 berikut ini :

(51)

Untuk melihat hasil klastering baik proses SVC maupun proses K-Medoids ditemukan pengklasteran yang dapat dilihat pada tabel berikut :

Dari tabel diatas dapat dilihat jumlah daripada pengklasteran judul tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar dengan database berjumlah 1708 dan web programming berjumlah 311, selanjutnya dapat juga dilihat beberapa proses klaster berdasarkan judul dan klasifikasi, tahun, nim dan nama yang dapat dilihat pada gambar 4.7 berikut ini :

(52)

Gambar 4.8. Hasil klastering SVC didapat berdasarkan Tahun

(53)
(54)

4.5. Proses K-Medoids

Dalam proses K-Medoids tampilan yang diperlihatkan dilayar menjadi pedoman

untuk mengetahui proses K-Medoids dengan 4 tahapan yang dapat dilihat pada tampilan

berikut ini :

Process flow dari

K-medoids Clustering

Gambar 4.11. Tampilan dari Proses K-Medoids dengan menggunakan Software

(55)

Ringkasan

Operator ini membaca sebuah tampilan yang terbaik dari file spreadsheet Excel.

Deskripsi

Operator ini dapat digunakan untuk memuat data dari spreadsheet Microsoft Excel. Operator ini mampu membaca data dari Excel 95, 97, 2000, XP, dan 2003. Pengguna harus menentukan mana dari spreadsheet di buku kerja harus digunakan sebagai tabel data. Tabel harus memiliki format sehingga setiap baris adalah contoh dan setiap kolom mewakili atribut. Harap dicatat bahwa baris pertama mungkin digunakan untuk nama atribut yang dapat ditunjukkan dengan parameter.

Tabel data dapat ditempatkan di manapun pada lembar dan diperbolehkan mengandung instruksi sewenang-wenang format, baris kosong, dan kolom kosong. Nilai data yang hilang ditandai dengan sel kosong atau sel yang hanya berisi "?".

Masukan: Data file excel diatur, berupa Data Judul Tugas Akhir, diambil Dari database sebuah institusi Pendidikan

Output: data set excel Yang Akan di kelompokan Artikel Baru Support Vector Clustering

Parameter

• mengkonfigurasi Operator: Konfigurasi operator ini dengan cara Wizard.

• file excel: Nama dari file excel untuk membaca data dari.

(56)

lembar karena tidak mengandung data yang dapat digunakan.

• Kolom offset: Jumlah kolom untuk melewati di sisi kiri lembar karena tidak mengandung data yang dapat digunakan.

• baris pertama sebagai nama: Mengindikasikan jika baris pertama harus digunakan untuk nama-nama atribut.

• penjelasan: Peta nomor baris untuk nama penjelasan. • membaca tidak sesuai nilai-nilai sebagai missings: Nilai yang tidak cocok dengan mengetik nilai yang ditentukan dianggap sebagai missings.

• kumpulan data meta informasi data: Informasi meta data

• nama atribut telah didefinisikan: parameter menjelaskan apakah nama-nama atribut yang ditetapkan oleh pengguna secara manual atau yang dihasilkan oleh pembaca (nama generik atau baris pertama dari file)

Ringkasan

Clustering dengan k-medoids

deskripsi

Operator ini merupakan implementasi k-medoids. Operator ini akan membuat atribut klaster yang belum ada.

masukan

• Contoh set : ditampilkan: ExampleSetMetaData: # contoh: = 0; # atribut: 0

(57)

keluaran

• klaster Model:

• menjadi bagian yang berkelompok:

parameter

• menambahkan atribut klaster: Menunjukkan jika id cluster dihasilkan sebagai atribut khusus baru.

• tambahkan sebagai label: Jika nilai klaster ditambahkan sebagai label.

• menghapus berlabel: Hapus contoh berlabel. • k: Jumlah cluster yang harus terdeteksi.

• max berjalan: Jumlah maksimal berjalan K-Medoids dengan inisialisasi acak yang dilakukan.

• max optimasi langkah: Jumlah maksimal iterasi dilakukan untuk satu run K-Medoids.

• menggunakan pengacakan secara local : Menunjukkan jika pengacakan lokal harus digunakan.

• benih pengacakan lokal: Menentukan pengacakan lokal

• jenis ukuran: Jenis Ukuran • ukuran campuran: Pilih ukuran • ukuran nominal: Pilih ukuran • ukuran numerik: Pilih ukuran • perbedaan: Pilih divergence • Tipe kernel: Jenis kernel

• kernel gamma: Kernel parameter gamma. • kernel sigma1: Kernel Parameter sigma1. • kernel sigma2: Kernel Parameter sigma2. • kernel sigma3: Kernel Parameter sigma3. • Gelar kernel: Tingkat parameter kernel.

(58)

• kernel b: Kernel parameter b.

Ringkasan

Operator ini dapat digunakan untuk langsung

menurunkan ukuran kinerja dari data tertentu atau nilai statistik.

Deskripsi

Operator ini dapat digunakan untuk memperoleh nilai tertentu dari contoh himpunan dan memberikan itu sebagai nilai kinerja yang dapat digunakan untuk tujuan optimasi.

Masukan

• Contoh set: yang ditampilkan: ExampleSet

Keluaran

• Kinerja: • Contoh set:

Parameter

• Jenis kinerja: Menunjukkan cara bagaimana makro harus didefinisikan.

• Statistik: Statistik dari atribut tertentu yang harus digunakan sebagai nilai makro.

• nama atribut: Nama dari atribut dari mana data harus diturunkan.

(59)

diturunkan. Indeks negatif dihitung dari akhir set data. Penghitungan positif dimulai dengan 1, penghitungan negatif dengan -1.

• arah optimasi: Menunjukkan jika nilai kinerja harus diminimalkan atau dimaksimalkan.

Ringkasan

Visualisasi teks. Deskripsi

Masukan

• set contoh masukan

Keluaran

• set contoh keluaran • Teks tempat Visualizer

Parameter

text-atribut

Yang atribut harus digunakan untuk divisualisasikan? label-atribut

(60)

Hasil proses dari K-Medoids dapat dilihat kecepatan mengklaster data judul tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar memakan waktu 3,21 menit, sedangkan hasil klastering nya cukup memadai, yang dapat dilihat pada gambar

Metadat a View

Processi ng time

Centroid cluster model

(61)

Pada pengklasteran menggunakan metode K-Medoids diambil Scatter Matrix dan berdasarkan judul dapat dilihat pada gambar 4.13 berikut ini :

Gambar 4.13. Hasil klastering K-Medoids berdasarkan judul dengan Scatter Matrix

Berikutnya adalah hasil klastering K-Medoids berdasarkan klasifikasi dapat dilihat pada gambar 4.14. berikut ini :

(62)

Selanjutnya hasil klastering dari K-Medoids berdasarkan Nim dapat dilihat pada gambar 4.15 sebagai berikut :

Gambar 4.15. Hasil klastering K-Medoids berdasarkan Nim dengan Scatter Matrix

Kemudian dilanjutkan dengan pengklasteringan dengan K-Medoids berdasarkan tahun akademik dapat dilihat pada gambar 4.16 berikut ini :

(63)

Untuk melihat hasil klastering baik proses SVC maupun proses K-Medoids ditemukan pengklasteran yang dapat dilihat pada tabel berikut :

Dari tabel diatas dapat dilihat jumlah daripada pengklasteran judul tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar dengan database berjumlah 1708 dan web programming berjumlah 311, selanjutnya dapat juga dilihat beberapa proses klaster berdasarkan judul dan klasifikasi, tahun, nim dan nama yang dapat dilihat pada gambar 4.17 berikut ini :

(64)

Gambar 4.18. Hasil klastering K-Medoids didapat berdasarkan Tahun

(65)

Gambar 4.20. Hasil klastering K-Medoids didapat berdasarkan Nama

(66)

Gambar 4.22. Hasil dari Klastering K-Medoids Dengan Sumbu-Y sebagai Nim dan Sumbu -X sebagai Judul

(67)

Gambar 4.24. Hasil dari Klastering K-Medoids Dengan Sumbu-Y sebagai Judul dan Sumbu-X sebagai Judul

(68)

Dari tampilan-tampilan yang telah ditunjukkan oleh gambar hasil proses SVC dan K-Medoids dapat dijelaskan bahwa :

1. Pada pengklasteringan judul Tugas akhir mahasiswa AMIK Tunas Bangsa Pematangsiantar yang berjudul 2020 jelas kelihatan bahwa pengelompokkan terhadap database dan web programming masing-masing berjumlah 1708 untuk database dan 311 untuk web programming, karena jenis klasifikasi lain tidak ada diambil untuk Tugas akhir mahasiswa tersebut.

2. Pada pengklasteran dengan mengambil scatter sebagai pilihan dapat dilihat pada gambar 4.7 dengan hasil pengelompokkan database dan web programming. Ini berlaku untuk algoritma SVC dan K-Medoids.

(69)

BAB V

PENUTUP

5.1.Kesimpulan

1. Penelitian ini menggunakan data yang bersumber dari bidang Pendidikan di AMIK Tunas Bangsa Pematangsiantar yaitu judul Tugas Akhir mahasiswa dengan mengelompokkan berdasarkan database, web programming dan jaringan.

2. Hasil pengujian dengan menggunakan software Rapidminer didapat untuk SVC berkisar 11:21 menit dengan hasil pengelompokkan yang lebih baik, sedangkan dari K-Medoids didapat hasil pengklasteran berkisar antara 3,21 menit dengan hasil pengelompokkan yang cukup signifikan.

3. Setelah dilakukan pengklasteran dengan menggunakan software Rapidminer maka ditemukan hasil hanya dua klasifikasi yaitu database dan web programming. Database berjumlah 1708 judul sedangkan untuk web programming 311 judul dan untuk jaringan tidak ada.

5.2.Saran

Berdasarkan hasil penelitian yang telah dilakukan, maka penulis berharap penulis selanjutnya untuk :

1. Mencari lebih banyak lagi data dalam hal judul tugas akhir mahasiswa yang dikelompokkan berdasarkan klasifikasi misalnya database, web programming, jaringan, dan multimedia.

2. Untuk lebih detailnya penulisan selanjutnya dengan menggunakan algoritma klastering lainnya.

(70)

Daftar Pustaka

Aggarwal, C., Yu, P.S., Park, 2001, Outlier Detection for High Dimensional Data, SIGMOD, 2001.

Baskoro, H. (2010). Implementasi Algoritma K-Means Menggunakan Data Penyewaaan Alat Berat Untuk Melakukan Estimasi Nilai Outcome, Skripsi Program S1 Fakultas Ilmu Komputer, Universitas Pembangunan Nasional “Veteran” Jakarta.

Ben-Hur, D.Horn, H.Siegelmann, and V. Vapnik (2001), Support Vector Clustering.

Journal of Machine Learning Research 2, p 125- 137

Berry, M.J.A. dan Linoff G.S, 2004. Data Mining Techniques For Marketing , Sales, Customer Relationship Management, Second Edition, Wiley Publishing, Inc.

Han, J., & Kamber, M (2006). Data Mining Concepts adnd Techniques Second Edition. San Fransico : Morgan Kaufman Publisher.

Han, Michael dan Kamber, Micheline, 2001, “Data Mining Concepts and Techniques San Fransisco; Morgan Kaufmann Publishers,.

Iko Pramudiono, (2006), Apa itu Data Mining ? dalam

diakses tanggal 04 Mei 2013.

Jayanti Diah Basuki, 2008 “Implementasi Algoritma K-Medoids untuk Clustering Dokumen teks”,Skripsi Program S1 Ilmu Komputer Universitas Kristen Duta Wacana.

Kusrini & Lutfi, Emha Taufiq. (2009). Algoritma Data Mining. Yogyakarta : Penerbit Andi.

Lanzi, P., L., (2009). Clustering Partitioning Method. Diakses 01 Mei 2012, dari

(71)

Large, R., Dvornik, T., Hamilton, W., (2012), & Hess B. (n.d.). Data Mining For Facebook Cliques. Diakses 23 Februari 2012, dari

Mochammad Juniarto. , 2009 ”Implementasi Metode Support Vector Clustering untuk Pengklasteran Produk”, Institut Teknologi Sepuluh November.

Ogor Emmanuel. N, 2004, “Student Academic Performance : Monitoring and Evaluation Using Data Mining Techniques”. Fourth Congress of Electronics, Robotics and Automotive Mechanics.. I EEE Computer Socienty.

Parr Rud, O. (2001), Data Mining Cookbook. Modeling Data for Marketing , Risk and Customer Relationship Management. John Wiley & Sons, Inc.; .

Press, WH, Teukolsky, SA, Vetterling, WT, Flannery, BP (2007), “Section 2.6”, Numerical Recipes : The Art of Scientific Computing (3rd ed.), New York : Cambridge University Press, ISBN 978-0-521-88068-8

Saadaki M, Hidetomo I, Katsuhiro H. 2008. Algorithm for Fuzzy Clustering. Di dalam : Studies in Fuzziness and Soft Computing. ISSN : 1434-9922

Sajadin S, Embong. A., Hamza.M, Furqan.M, (2009)“Improving Student Academik Performance Using Data Mining Techniques”. The 5th IMTGT International Conference on Mathematic, Statistic and their Aplication (ICMSA), Bukit Tinggi Sumatera Utara.

Stephen D. Bay, Mark Scwabacher, (2003)Mining Distance Based Outliers in Near Linier Time with Randomization and a Simple Pruning Rule. In ACM SIGMOD.

Sudipto Guha, Rajew Rastogi, Kyuseok Shim, (1998)CURE: An efficient Clustering algorithm for large databases. In ACM SIGMOD Internation Conference on Management of Data,.

Tan. Pang-Ning, Steincbach. Michael, Kumar. Vipin, 2006, Introduction to Data Mining, Pearson Education Inc.

(72)

Wibisono, Y. (2012). Perbandingan Partition Around Medoids (PAM) dan K-Means Clustering Untuk Tweets. Diakses 23 Maret 2012, dari

Widyawati, N. (2010). Perbandingan Clustering Based On Frequent Word Sequence (CFWS) dan K-Means Untuk Pengelompokan Dokumen Berbahasa Indonesia. Skripsi. Bandung: Fakultas Pendidikan Matematika Dan Ilmu Pengetahuan Alam, Universitas Pendidikan Indonesia. [Tersedia]:

(73)

LAMPIRAN A

Data berikut adalah data Judul Tugas Akhir Mahasiswa AMIK Tunas Bangsa Pematangsiantar yang berjumlah 2020 judul (dalam lampiran ini hanya sampel) :

No Tahun NIM NAMA Judul Kasifikasi

1 2012/2013 201001030037 SRI REZEKI

PERANCANGAN SISTEM APLIKASI PENGOLAHAN DATA SIMPAN PINJAM PADA CU. CINTA MULIA

PEMATANGSIANTAR

DATABASE

2 2012/2013 201001030020 YULIA CITRA DEWI

Perancangan Dan Impelementasi Pengarsipan Pembukuan Pada Kantor Bpdas Asahan Barumun

Pematangsiantar

DATABASE

3 2012/2013 201001030046 EVA ADINA Aplikasi Game Tebak Kata Dengan Menggunakan Macromedia Flash 8.0

WEB Programming

4 2012/2013 201001030152 ERNI DWIYANA GULTOM

Perancangan Dan Implementasi Laporan Pertanggungjawaban Kuintansi Serba Serbi Berbasis Web Pada PT. Asuransi Jiwasraya Pematangsiantar

WEB Programming

5 2012/2013 201001030005 ELLA SRIWAHYUNI

Perancangan Dan Implementasi Data Absensi Karyawan PTPN IV Perkebunan Bah Birong Ulu

DATABASE

6 2012/2013 201001030034 RICHI FERNANDO SARAGIH

SISTEM INFORMASI PENDAFTARAN ANGGOTA BARU BERBASIS WEB DI KOPDIT CU. CINTA MULIA

WEB Programming

7 2012/2013 201001030032 NURWALIANI

Perancangan Dan Implementasi Pengolahan Data Anggaran Pengeluaran Pembangulan Di Kantor Camat Jorlang Hataran

DATABASE

8 2012/2013 201001030072 LAMRIA SIHOMBING

Perancangan Perencanaan Sistem Kerja Di Kantor Bpdas Asahan Barumun Pematangsiantar

DATABASE

9 2012/2013 201001030126 ANDRI YANTI

Perancangan Dan Implementasi Pendaftaran Pernikahan Online Pada Kantor Kementrian Agama

Pematangsiantar

WEB Programming

10 2012/2013 201001030096 RENGGA AMRISTHA

Perancangan Dan Impelementasi Data Penjualan Raskin Pada Kecamatan Siantar Marimbun Kelurahan Tong Marimbun

DATABASE

11 2012/2013 201001030185 RICKY REZZA FRIMA

Perancangan Dan Implementasi Daftar Piket Security Pada PPKS Marihat Pematangsiantar Dengan Menggunakan Visual Basic 6.0 Dan Daabase Mikrosoft SQL Server 2000

DATABASE

12 2012/2013 201002030010 JOANA PRATIWI

Perancangan Dan Implementasi Penerimaan Dan Pengeluaran Barang Pada PT. Perkebunan Nusantara IV Marihat

DATABASE

13 2012/2013 201001030021 ANDRIANSYAH RUKMAN

Perancangan Dan Implementasi Pengolahan Data Bkm(Bantuan Khusus Murid) Pada Smk Teladan

Pematangsiantar

DATABASE

14 2012/2013 201001030057 SRI RAHMAYANI

Sistem Informasi Masa Bebas Tugas (Mbt) Karyawan Yang Akan Pensiun Pada PTP. Nusantara IV (Persero) Unit Kebun Dolok Ilir

(74)

LAMPIRAN B

15 2012/2013 201001030323 NURHILMAN SIRAIT

Perancangan Dan Implementasi Konstruksi Pemasangan Pipa Di Perusahaan Daerah Air Minum ( PDAM )Tirtauli Pematangsiantar Menggunakan Bahasa Pemrograman Visual Basic 6.0 dan Database SQL Server 2000

DATABASE

16 2012/2013 201001030058 SUCI LESTARI

Perancangan Dan Implementasi Finishing Polis Pada PT. Asuransi Sinar Mas Pematangsiantar

DATABASE

17 2012/2013 201001030059 SURIANI

Sistem Informasi Penerimaan Surat Pengantar Kiriman Berbasis Web Pada PT. Kerta Gaya Pustaka Pematangsiantar

WEB Programming

18 2012/2013 201002030006 FITRIANI

Perancangan Dan Implementasi Dana Kredit Kontrak Pada Kopdit/ CU Cinta Mulia Pematangsiantar

DATABASE

19 2012/2013 201001030339 LUCY NOVITRI

Perancangan Dan Implementasi Sistem Informasi Pendaftaran Pasien Pada Rumah Sakit Vita Insani Dengan Menggunakan Macromedia Dreamweaver Mx2004 Dan Database Mysql

WEB Programming

20 2012/2013 201001030356 IDRIS MAYANDA

Sistem Informasi Pelaksanaan Kegiatan Instruktur Dan Daftar Data Kelulusan Peserta Pelatihan Pada Balai Latihan Kerja UKM Pematangsiantar

DATABASE

21 2012/2013 201001030052 MUTIARA LUBIS

Perancangan Dan Implementasi Penggajian Karyawan Pada Kantor Camat Siantar Barat Pematangsiantar Dengan Menggunakan Microsoft Visual Basic 6.0 Dan Database Sql Server 2000

DATABASE

22 2012/2013 201001030316 HERMAN SAPUTRA

Perancangan Dan Implementasi Sistem Data Pada Laka Pada Kantor Jasa Raharja Cabang Pematang Siantar Dengan Menggunakan Visual Basic 6.0 Dan SQL Server 2000

DATABASE

23 2012/2013 201001030030 KHOIROTUN NISYAH NASUTION

Peracangan Dan Implementasi Pendataan Penyandang Cacat Berat Di Kantor Camat Jorlanghataran Dengan Menggunakan Bahasa Pemrograman Visual Basic 6.0 Dan Data Base Sql Server2000

DATABASE

24 2012/2013 201001030022 ARFYAH YUSLINA

Perancangan Dan Implementasi Buku Tamu Pada Kantor Perwakilan Bank Indonesia Pematangsiantar

DATABASE

25 2012/2013 201001030038 SUYANTINI

Perancangan Dan Implementasi Penggajian Pegawai Pada Dinas Pendapatan Pengelolaan Keuangan Dan Aset Daerah Pematangsiantar

DATABASE

26 2012/2013 201001030004 DEWI MUSTIKA SARI

Perancangan Dan Implementasi Aplikasi Daftar Nilai Ujian Semester Pada Smk Satrya Budi Karang Sari

DATABASE

27 2012/2013 201001030027 ESTI RAHMADHANI UTAMI

Perancangan Program Sistem Pengingputan Data Pembuatan STNK CV. Apollo Motor Pematangsiantar

(75)

LAMPIRAN C

28 2012/2013 201001030159 MUHAMMAD NURSANDRI

Sistem Informasi Pendaftaran Siswa/ Siswi SMK PRAMAARTHA Dengan Menggunakan Microsoft Visual Basic 6.0 Dan Database Microsoft SQL Server 2000

DATABASE

29 2012/2013 201001030029 JULISAH

Perancangan Sistem Informasi Data Iventaris Pada Kantor Camat Jorlang Hataran Dengan Menggunakan Kambahasa Pemrograman Vb 6.0 Dan Data Base Sql Server 2000

DATABASE

30 2012/2013 201001030031 M. RISWANDI

Perancangan Dan Implementasi Pengolahan Data Pembayaran Uang Buku Smk Teladan Pematangsiantar

DATABASE

31 2012/2013 201001030053 NASTRIANI

Perancangan Dan Implementasi Pengolahan Data Piutang Harian Pada Kerta Pusaka (Kgp) Denagan Microsoft Vb 6.0. Dan My Sql Server Pematangsiantar

DATABASE

32 2012/2013 201001030033 OGI IMANUEL

Perancangan Sistem Informasi Pendataan Simpanan Pokok Dan Simpanan Wajib Pada Koperasi CU Cinta Mulia Pematangsiantar

DATABASE

33 2012/2013 201002030031 NURIDWAN

Perancangan Dan Implementasi Jurnal Khusus Pengeluaran Kas Pada Pembelian Buku Lembar Kerja Siswa Smk Swasta Al-Wasliyah 07 Dolok Batu Naggar,Kabupaten Simalungun Dengan Menggunakan Visual Basic For Application(Macro Excel)

DATABASE

34 NULL 2003010300004 Andri Kurniawan

SISTEM IFORMASI INVENTARISASI BERKAS PIUTANG NEGARA PADA KP2LN PEMATANGSIANTAR MENGGUNAKAN BAHASA PEMOGRAMAN VISUAL BASIC 6.0 DENGAN DATABASE SQL SERVER

DATABASE

35 NULL 2003010300005 Arif Rahman

PERANCANGAN DAN IMPLEMENTASI WEB PADA KANTOR PELAYANAN PIUTANG DAN LELANG NEGARA ( KP2LN ) PEMATANG SIANTAR DENGAN MENGGUNAKAN MACROMEDIA DREAMWEAVER MX

WEB Programming

36 NULL 2003010300007 Azhari Rufiandi Saragih

PERANCANGAN DAN IMPLEMENTASI WEB PADA PUSAT PENELITIAN KELAPA SAWIT ( PPKS) PEMATANG SIANTAR DENGAN MENGGUNAKAN MACROMEDIA DREAMWEAVER MX

WEB Programming

37 NULL 2003010300010 Daoni Sinaga

SISTEM INFORMASI INDISIPLINER MAHASISWA AMIK TUNAS BANGSA PEMATANGSIANTAR

MENGGUNAKAN BAHASA PEMOGRAMAN VISUAL BASIC 6.0

DATABASE

38 NULL 2003010300011 Dessi Anizar

SISTEM INFORMASI ADMINISTRASI KARYAWAN MUTASI PADA PTP. NUSANTARA IV KEBUN SIBOSUR MENGGUNAKAN BAHASA PEMROGRAMAN DELPHI 7.0 DENGAN DATABASE SQL SERVER 2000

(76)

LAMPIRAN D

39 NULL 2003010300013 Dewi Furi

Handayani

SISTEM INFORMASI PENDATAAN KARYAWAN PENSIUN PADA PTP. NUSANTARA IV UNIT KEBUN SIBOSUR MENGGUNAKAN BAHASA PEMROGRAMAN VISUAL BASIC 6.0 DENGAN DATABASE SQL SERVER 2000

DATABASE

40 NULL 2003010300015 Dina Maya Sari

SISTEM INFORMASI KEPEGAWAIAN PADA PT. TELEKOMUNIKASI INDONESIA, TBK DEVISI LONG DISTANCE RO PEMATANG SIANTAR DENGAN BAHASA PEMOGRAMAN BORLAND DELPHI 7 DAN MENGGUNAKAN DATABASE MICROSOFT ACCESS 2000

DATABASE

41 NULL 2003010300016 Edi Gunawan

PERANCANGAN DAN IMPLEMENTASI E - LEARNING PADA AMIK TUNAS BANGSA PEMATANGSIANTAR DENGAN MENGGUNAKAN MACROMEDIA DREAMWEVER MX 2004 DAN PHP

WEB Programming

42 NULL 2003010300018 Eva Novalina Tamba

SISTEM INFORMASI PELANGGARAN LALU LINTAS PADA POLRES PEMATANGSIANTAR DENGAN MENGGUNAKAN BAHASA PEMROGRAMAN DELPHI 7.0

DATABASE

43 NULL 2003010300022

Heppy Diana Malindan Tampubolon

SISTEM INFORMASI KEPEGAWAIAN PADA DINAS PU TOBA SAMOSIR MENGGUNAKAN BAHASA PEMROGRAMAN VISUAL BASIC 6.0 DAN DATABASE SQL SERVER

DATABASE

44 NULL 2003010300023 Iin Parlina

SISTEM INFORMASI PEGAWAI PADA PT. JAMSOSTEK KISARAN

MENGGUNAKAN BAHASA PEMROGRAMAN VISUAL BASIC 6.0 DENGAN DATABASE SQL SERVER

DATABASE

45 NULL 2003010300024 Ika Novasari

SISTEM INFORMASI ABSENSI PEGAWAI PADA PT. JAMSOSTEK KISARAN MENGGUNAKAN BAHASA PEMROGRAMAN VISUAL BASI 6.0 DENGAN DATABASE SQL SERVER

DATABASE

46 NULL 2003010300027 Joko Julianto

SISEM INFORMASI PENGHITUNGAN SMS PADA Q RADIO DENGAN PEMOGRAMAN VB 6.0 DENGAN SQL SERVER 2000

DATABASE

47 NULL 2003010300028 Juni Anggriani

SISTEM INFORMASI PENGGAJIAN PEGAWAI PADA PT. ASURANSI JIWASRAYA PERSERO PEMATANGSIANTAR DENGAN MENGGUNAKAN BAHASA PEMROGRAMAN VISUAL BASIC 6.0 DENGAN DATABASE SQL SERVER

DATABASE

48 NULL 2003010300029 Lili Chairani Situmorang

SISTEM INFORMASI TATA USAHA GUDANG PADA DIVISI URT PPKS UNIT USAHA MARIHAT MENGGUNAKAN BAHASA PEMROGRAMAN VISUAL BASIC 6.0 DENGAN DATABASE SQL SERVER

Gambar

Gambar 3.2. Flowchart Metodologi Penelitian
Gambar 3.3. Proses Klastering dari SVC dan K-Medoid
Tabel 4.1 Sampel Data Tugas Akhir
Gambar 4.1. Tampilan dari Proses SVC dengan menggunakan Software
+7

Referensi

Dokumen terkait

dan algoritma genetika sebagai seleksi fitur, bisa disimpulkan bahwa, metode support vector machine dan algoritma genetika dapat diterapkan untuk melakukan sentimen

Penelitian ini akan melakukan perbandingan dua algoritma yaitu Support Vector Machine (SVM) dan K-Nearest Neighbor (KNN) pada sentimen analisis opini masyarakat

Hasil dari percobaan K-Medoids Clustering menggunakan 3 cluster yaitu terdapat 237 data berada pada cluster 0 dengan kondisi belum perlu untuk dilakukan peremajaan, 126

Ada beberapa penelitian yang menggunakan algoritma Support Vector Machine sebagai pengkalsifikasian dalam klasifikasi teks sentimen pada twitter, diantaranya ketiga

3.3 Perbandingan Kedua Algoritma Hasil prediksi dari kedua algoritma Naïve Bayes dan Support Vector Machine dengan metode latih percentage split dan k-fold cross validation

Solikhun, Data Mining: Penerapan Algoritma K-Means Clustering dan K-Medoids Clustering, Yayasan Kita Menulis, 2020.. & KUSNADI, "ANALISIS DAN PERANCANGAN APLIKASI RESERVASI DAN ORDER

Sintaks Modeling Random Forest Setelah pemodelan dengan algoritma Support Vector Machine dan Random Forest, langkah selanjutnya adalah menerapkan algoritma Logistic Regression pada

Hasil penelitian dari jurnal tersebut mendapatkan hasil yang baik, algoritma K-Medoids dapat melakukan pengelompokan data covid-19 mana saja wilayah yang terinfeksi di wilayah masing –