1
Bab 1
Pendahuluan
1.1 Latar Belakang
Data merupakan sekumpulan infromasi atau nilai yang diperoleh melalui observasi terhadap suatu obyek. Data dapat berupa angka, lambang atau sifat (Situmorang dkk, 2010). Pertumbuhan data yang semakin pesat setiap harinya jika tidak tidak dimanfaatkan dengan baik akan tertimbun sia-sia. Oleh karena itu, data tersebut perlu dikelola dengan baik melalui berbagai cara agar dapat menjadi informasi yang berguna.
Terdapat beberapa metode yang dapat digunakan untuk mengelola data. Dalam penelitian ini, metode yang akan digunakan untuk mengelola data adalah clustering. Clustering
merupakan kegiatan mengelompokkan objek ke dalam suatu
cluster, sehingga objek pada suatu cluster memiliki kemiripan yang besar dengan objek lain pada cluster yang sama dan berbeda dengan objek pada cluster lainnya. Dalam mengembangkan metode clustering, terdapat beberapa metode yang dapat digunakan antara lain metode parsial dan metode hirarki. Metode parsial mengorganisir sejumlah data tertentu ke dalam kelompok yang lebih spesifik atau cluster, sedangkan metode hirarki
clustering mengelompokkan objek data ke dalam sebuah hirarki atau pohon cluster (Han dkk, 2011).
2
diminati oleh para investor untuk menanam sahamnya. Setiap bahan tambang mempunyai karakteristik yang berbeda. Seringkali hal ini menjadi kendala bagi investor untuk mengambil keputusan dalam menentukan daerah yang akan digunakan sebagai wilayah usahanya di Provinsi tersebut. Oleh karena itu, perlu adanya clustering mengenai data tersebut agar dapat digunakan sebagai acuan dalam melakukan analisis untuk membantu dalam menentukan pengambilan keputusan kedepannya.
Dalam penelitian ini, akan dilakukan clustering data
menggunakan metode parsial. Algoritma yang akan digunakan untuk melakukan proses clustering ini adalah Algortima K-Means. Data yang akan dikelompokkan dalam penelitian adalah data mengenai hasil tambang di Provinsi Papua Barat.
Data yang digunakan dalam proses clustering berupa data spasial dan kemudian akan dinormalisasi dalam bentuk Kartesius. Setelah dinormalisasi, data tersebut dikelompokkan melalui
3
pelaku usaha tambang dapat memilih wilayah potensi tambang yang prospek dengan mudah.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan, maka rumusan masalah yang dapat diambil adalah bagaimana melakukan clustering data pada data spasial menggunakan Algoritma K-Means dan ditampikan menggunakan Heatmap.
1.3 Tujuan dan Manfaat
Tujuan dari penelitian ini adalah merancang dan melakukan clustering data pada data spasial menggunakan Algoritma K-Means lalu ditampilkan menggunakan Heatmap. Manfaat dari penelitian ini adalah pengelompokan data spasial ke dalam cluster tertentu.
1.4 Batasan Masalah
Batasan masalah dari penelitian yang dilakukan adalah sebagai berikut :
1. Clustering dilakukan menggunakan Algoritma K-Means.
2. Penyajian data pada aplikasi web menggunakan Heatmap. 3. Kasus yang digunakan dalam penelitian ini adalah potensi
bahan tambang Provinsi Papua Barat. 4. Data yang digunakan berupa data spasial.
4
1.5 Sistematika Penulisan
Sistematika dari laporan penelitian ini dibagi dalam beberapa bagian sebagai berikut :
Bab 1 Pendahuluan
Berisikan Latar Belakang, Rumusan Masalah, Tujuan dan Manfaat, Batasan Masalah dan Sistematika Penulisan.
Bab 2 Tinjauan Pustaka
Pada bagian ini berisikan rangkuman dari beberapa penelitian yang pernah dilakukan dengan landasan teoritis yang berkaitan, meliputi : Clustering, Algoritma K-Means dan Heatmap.
Bab 3 Metode Penelitian
Pada bab ini berisi pembahasan mengenai metode penelitian yang digunakan serta perancangan sistem.
Bab 4 Hasil dan Pembahasan
Bab ini membahas tentang hasil dari proses clustering
yang dilakukan menggunakan algoritma K-Means serta penyajiannya menggunakan Heatmap.
Bab 5 Kesimpulan dan Saran