BAB 1
PENDAHULUAN
Bab ini membahas tentang hal-hal yang menjadi latar belakang pembuatan tugas akhir, rumusan masalah, tujuan, batasan masalah, manfaat, metodologi penelitian serta sistematika penulisan tugas akhir.
1.1. Latar Belakang
Salah satu masalah utama saat ini baik di negara-negara miskin, berkembang, maupun di negara-negara maju adalah kemiskinan. Kemiskinan merupakan awal dari timbulnya masalah-masalah sosial lainnya yang terkait erat dengan kualitas pendidikan, kriminalitas, kelaparan, dan sebagainya yang secara tidak langsung akan mengganggu ketahanan atau stabilitas negara (Arisanti, 2011). Oleh karena itu pemerintah daerah di setiap negara berusaha untuk mengatasi masalah kemiskinan dengan beragam kebijakan-kebijakan, termasuk di Provinsi Sumatera Utara.
Penanganan masalah kemiskinan di Indonesia tertuang pada Rencana Pembangunan Jangka Menengah Nasional (RPJMN) Tahun 2010-2014. Dalam RPJMN 2010-2014 sasaran utama dalam pembangunan kesejahteraan rakyat di bidang ekonomi salah satunya adalah menurunkan tingkat kemiskinan menjadi 8-10 persen diakhir tahun 2014.
Beragam kebijakan pemerintah terkait dengan kemiskinan tentunya akan efektif jika kebijakan tepat mengarah pada faktor-faktor yang mempengaruhi kemiskinan itu sendiri. Sehingga akan dapat dirumuskan alternatif kebijakan pengentasan kemiskinan yang lebih intensif dan tepat sasaran.
Kabupaten Kutai Kartanegara. Yang mana penelitian tersebut menyimpulkan bahwa jumlah kelompok yang paling optimal adalah sebanyak 5 (lima) kelompok. Penelitian lain dilakukan oleh Angsoka Dewi, dkk yang menggunakan Algoritma Cluster Ensemble untuk pengelompokan desa perdesaan di Provinsi Riau. Penelitian ini menunjukkan bahwa algoritma pengelompokkan ensembel menghasilkan kelompok dengan kinerja yang lebih baik daripada pengelompokkan full kategorik dan full
kontinu. Nilai rasio dari masing-masing algoritma yang diukur pada jumlah kelompok sama dengan 4 (empat) secara berturut-turut adalah 0,0072; 0,0904; dan 0,2679. Dengan pengelompokkan ensembel, desa perdesaan di Provinsi Riau dapat dikelompokkan menjadi 4 (empat) kelompok dan dapat mengidentifikasi 65 desa yang merupakan remote area. Nur’Aidah pada tahun 2014 juga melakukan penelitian
menggunakan Agglomerative Spatial Hierarchical Clustering untuk Pengelompokan Daerah Tertinggal di Provinsi Daerah Istimewa Yogyakarta. Penelitian ini menghasilkan kesimpulan bahwa berdasarkan hasil perbandingan algoritma Spatial Hierarchical Clustering dapat mengelompokkan wilayah dalam letak geografis yang berdekatan, sementara algoritma Hierarchical Clustering tidak.
Pengklasteran menurut Edi Satriyanto adalah suatu algoritma pengelompokkan berdasarkan ukuran kedekatan (kemiripan). Pengklasteran berbeda dengan group dimana group berarti kelompok yang sama kondisinya sedangkan klaster tidak harus sama akan tetapi pengelompokkannya berdasarkan pada kedekatan dari suatu karakteristik sampel yang ada.
Algoritma K-means merupakan algoritma clustering yang paling sederhana dan umum. Hal ini dikarenakan K-means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan waktu komputasi yang relatif cepat dan efisien. Namun, K-means mempunyai mempunyai kelemahan yang diakibatkan oleh penentuan pusat awal cluster. Hasil cluster yang terbentuk dari algoritma K-means ini sangatlah tergantung pada inisiasi nilai pusat awal cluster yang diberikan. Hal ini menyebabkan hasil clusternya berupa solusi yang sifatnya local optimal. Untuk itu, maka K-means dikolaborasikan oleh algoritma hierarki untuk penentuan pusat awal
cluster (Alfina, dkk., 2012).
Berbasis Arc View” yang mana pada pada hasil penelitian tersebut perwilayahan di
provinsi Sumatera Selatan dibagi menjadi 7 kluster dan menghasilkan hasil klusterisasi dan analisis yang baik. Penelitian lain dilakukan oleh Tahta Alfina, dkk pada tahun 2012 dengan judul “Analisa Perbandingan Algoritma Hierarchical Clustering, K-means dan Gabungan Keduanya dalam Cluster Data (Studi kasus: Problem Kerja Praktek JurusanTeknik Industri ITS)” yang mana hasil dari penelitian ini menghasilkan pengelompokan data yang lebih baik jika dibandingkan dengan K-Means dalam semua pengujian. Dalam studi kasus Problem Kerja Praktek Jurusan Teknik Industri ITS, dari kombinasi hierarchical clustering dan K-means yang ada, kombinasi single linkage clustering dan K-means menghasilkan pengelompokan data yang terbaik dibandingkan dengan algoritma hierarki yang lainnya. Rendy Handoyo pada tahun 2014 juga melakukan penelitian dengan judul “Perbandingan Algoritma
Clustering Menggunakan Algoritma Single Linkage Dan K - Means Pada Pengelompokan Dokumen” yang mana hasil dari penelitian ini adalah Algoritma
Single Linkage memilliki performansi yang lebih baik dibandingkan dengan algoritma
K-means. Jumlah cluster memberikan pengaruh terhadap nilai silhouette dan Purity. Dan jumlah dokumen memberikan pengaruh terhadap nilai Silhouette Coefficient. Dan pada tahun 2007 Kohei Arai dan Ali Ridho Barakbah melakukan penelitian dengan judul “Hierarchical K-means: an algorithm for centroids initialization for K-means”
yang mana penggunaan algoritma hierarchical k-means menghasilkan waktu komputasi yang lebih singkat dibandingkan dengan algoritma lain yang digunakan seperti Single Linkage, Centroid Linkage, Complete Linkage, Average Linkage, Fuzzy c-means,dan K-means using random init.
Berdasarkan latar belakang diatas, maka judul penelitian ini adalah
“ALGORITMA HIERARCHICAL K-MEANS UNTUK PENGELOMPOKAN DESA
TERTINGGAL DI PROVINSI SUMATERA UTARA”.
1.2. Rumusan Masalah
sehingga mempermudah pemerintah memberi kebijakan untuk menanggulangi masalah kemiskinan agar lebih tepat sasaran ?
1.3. Tujuan Penelitian
Mengelompokkan desa-desa tertinggal yang ada di provinsi Sumatera Utara dengan menggunakan algoritma hierarchical k-means sehingga dapat membantu pemerintah untuk memberi kebijakan untuk menanggulangi masalah kemiskinan di daerah tersebut.
1.4. Ruang Lingkup Penelitian
Ruang lingkup pada penelitian adalah :
1. Desa yang dikluster adalah desa-desa yang ada di provinsi Sumatera Utara.
2. Parameter yang digunakan variabel yang digunakan dalam penelitian ini hanya 9 variabel bertipe data kontinu dan pemilihan variabel diperoleh dari penelitian Husna (2011) yaitu :
1. Jarak kantor desa terhadap kantor bupati
2. Rasio jumlah sarana pendidikan per 100 penduduk. 3. Rasio jumlah sarana kesehatan per 100 penduduk. 4. Rasio jumlah tenaga kesehatan per 100 penduduk. 5. Jumlah minimarket.
6. Persentase keluarga pertanian. 7. Persentase keluarga pengguna listrik.
8. Persentase keluarga yang tinggal dibantaran sungai 9. Rasio penderita gizi buruk per 1000 penduduk
1.5. Manfaat Penelitian
Manfaat dari penelitian ini adalah :
1. Menambah pengetahuan penulis dalam bidang data mining khusunya clustering.
1.6. Metodologi Penelitian
Metodologi penelitian yang digunakan pada penelitian ini adalah sebagai berikut. 1. Studi Literatur
Pada tahap ini dilakukan studi kepustakaan yaitu proses mengumpulkan bahan referensi mengenai hierarchical clustering, k-means, data mining, dan daerah tertinggal dari berbagai buku, jurnal, artikel, dan beberapa sumber referensi lainnya.
2. Analisis
Pada tahap ini dilakukan analisis terhadap studi literatur untuk mendapatkan pemahaman mengenai algoritma hierarchical clustering dan k-means untuk menyelesaikan masalah pengelompokan desa tertinggal di Provinsi Sumatera Utara.
3. Perancangan
Pada tahap ini dilakukan perancangan arsitektur, pengumpulan data, pelatihan, dan perancangan antarmuka. Proses perancangan dilakukan berdasarkan hasil analisis studi literatur yang telah didapatkan.
4. Implementasi
Pada tahap ini dilakukan pengkodean program menggunakan PHP, javascript, dan MySQL
5. Pengujian
Pada tahap ini dilakukan pengujian aplikasi pengelompokan desa tertinggal yang telah dibuat guna memastikan aplikasi telah berjalan sesuai dengan yang diharapkan.
6. Dokumentasi dan Penyusunan Laporan
Pada tahap ini dilakukan dokumentasi hasil analisis dan implementasi algoritma
1.7. Sistematika Penulisan
Sistematika penulisan dari skripsi ini terdiri dari lima bagian utama sebagai berikut: Bab 1: Pendahuluan
Bab ini berisi latar belakang, rumusan masalah, tujuan penelitian, batasan masalah, manfaat penelitian, metodologi penelitian, dan sistematika penulisan.
Bab 2: Landasan Teori
Bab ini berisi teori-teori yang digunakan untuk memahami permasalahan yang dibahas pada penelitian ini. Pada bab ini dijelaskan tentang penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal dan data-data pendukungnya.
Bab 3: Analisis dan Perancangan Sistem
Bab ini berisi analisis dan penerapan hierarchical clustering dan k-means untuk pengelompokan desa tertinggal, serta perancangan seperti pemodelan dengan
flowchart.
Bab 4: Implementasi dan Pengujian Sistem
Bab ini berisi pembahasan tentang implementasi dari analisis dan perancangan yang disusun pada Bab 3 dan pengujian apakah hasil yang didapatkan sesuai dengan yang diharapkan.
Bab 5: Kesimpulan Dan Saran