• Tidak ada hasil yang ditemukan

BAB II TINJAUAN PUSTAKA

2.2 Dasar Teori

2.2.6 Data Mining

2.2.6.1 Algoritma dan Metode Data Mining

Menurut Dicky Nofriansyah dan Gunadi Widi Nurcahyo (2015:7) pada proses pemecahan masalah dan pencarian pengetahuan baru terdapat beberapa klasifikasi secara umum yaitu:

1. Estimasi

Digunakan untuk melakukan estimasi terhadap sebuah data baru yang tidak memiliki keputusan berdasarkan histori data yang telah ada. Contohnya ketika melakukan estimasi pembiayaan pada saat pembangunan sebuah hotel baru pada kota yang berbeda.

2. Asosiasi

Digunakan untuk mengenali kelakuan dari kejadian-kejadian khusus atau proses dimana hubungan asosiasi muncul pada saat kejadian. Adapun metode pemecahan masalah yang sering digunakan seperti algoritma Apriori.

Cntohnya pemanfaatan algoritma asosiasi yaitu pada bidang marketing ketika sebuah minimarket melakukan tata letak produk yang dijual berdasarkan produk-produk mana yang paling sering dibeli konsumen, selain itu seperti tata letak buku yang dilakukan pustakawan di perpustakaan.

3. Klasifikasi

Suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang telah didefinisikan. Teknik ini dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan hasilnya untuk memberikan sejumlah aturan. Salah satu contoh yang mudah dan populer adalah dengan Decision Tree yaitu salah satu metode klasifikasi yang paling populer karena mudah untuk interpretasi seperti algoritma C4.5, ID3 dan lain-lain. Contoh pemanfaatannya adalah pada bidang akademik yaitu klasifikasi siswa yang layak masuk ke dalam kelas unggulan atau akselerasi di sekolah tertentu.

4. Klastering

Digunakan untuk menganalisis pengelompokan berbeda terhadap data, mirip dengan klasifikasi, namun pengelompokan belum didefinisikan sebelum dijalankannya tool data mining. Biasanya menggunakan metode neural network atau statistik, analitikal hierarki cluster. Clustering membagi item menjadi kelompok-kelompok berdasarkan yang ditemukan tool data mining.

5. Prediksi

Algoritma prediksi biasanya digunakan untuk memperkirakan atau forecasting suatu kejadian sebelum kejadian atau peristiwa tertentu terjadi.

Contohnya pada bidang Klimatologi dan Geofisika, yaitu bagaimana Badan Meterologi dan Geofisika (BMKG) memperkirakan tanggal tertentu bagaimana cuacanya, apakah hujan, panas, dan lain sebagainya. Ada beberapa metode yang sering digunakan salah satunya adalah Metode Rough Set.

2.2.6.2 Jenis Permasalahan Data Mining

Aplikasi yang menggunakan Data Mining bermaksud menyelesaikan permasalahan dengan membangun model berdasarkan data yang sudah digali untuk diterapkan terhadap data yang lain. Secara umum ada dua jenis tipologi aplikasi Data Mining (Prabowo Pudjo Widodo, dkk., 2013:5):

1. Metode Prediksi, yang bermaksud memprediksi nilai yang akan datang berdasarkan data-data yang telah ada variabelnya seperti klasifikasi, regresi, detikasi anomali dan lain-lain.

2. Metode Deskriptif, yang bermaksud membantu user agar mudah melihat pola-pola yang berasal dari data yang ada.

2.2.6.3 Kegunaan Data Mining

Secara umum kegunaan data mining dapat dibagi menjadi dua: deskriptif dan prediktif. Deskriptif berarti data mining digunakan untuk mencari pola-pola yang dapat dipahami manusia yang menjelaskan karakteristik data. Sedangkan prediktif berarti data mining digunakan untuk membentuk sebuah model pengetahuan yang akan digunakan untuk melakukan prediksi. Menurut Fayyad et all (dalam Suyanto, 2017:3) Berdasarkan fungsionalitasnya, tugas-tugas data mining bisa dikelompokan ke dalam enam kelompok berikut ini :

1. Klasifikasi (classification): men-generalisasi struktur yang diketahui untuk diaplikasikan pada data-data baru. Misalkan, klasifikasi penyakit ke dalam sebuah jenis, klasifikasi email ke dalam spam atau bukan.

2. Klasterisasi (clustering): Mengelompokan data, yang tidak diketahui label kelasnya, ke dalam sejumlah kelompok tertentu sesuai dengan ukuran kemiripannya.

3. Regresi (regression): menemukan suatu fungsi yang memodelkan data dengan galat (kesalahan prediksi) seminimal mungkin.

4. Deteksi anomali (anomaly detection): mengidentifikasi data yang tidak umum, bisa berupa outlier (pencilan), perubahan atau deviasi yang mungkin sangat penting dan perlu investigasi lebih lanjut.

5. Pembelajaran aturan asosiasi (association rule learning) atau pemodelan kebergantungan (dependency modeling): mencari relasi antar variabel.

6. Perangkuman (summarization): menyediakan representasi data yang lebih sederhana, meliputi visualisasi dan pembuatan laporan.

2.2.6.4 Aplikasi-Aplikasi Data Mining

Kemampuan perangkat keras dalam mengelola data yang berukuran besar baik prosesor dan harddisk, berkembangnya perangkat lunak pembuat aplikasi data mining, mengakibatkan tingginya permintaan terhadap aplikasi berbasis data mining dalam berbagai bidang. Selain itu, riset-riset yang dikembangkan oleh ilmuwan di seluruh dunia tentang teknik-teknik dan algoritma-algoritmanya banyak membantu kualitas dari sistem berbasis data mining seperti (Prabowo Pudjo Widodo, dkk., 2013:16) :

1. Perbankan dan Finansial

Bidang ini sangat membutuhkan aplikasi berbasis data mining dan telah lama menggunakan aplikasi-aplikasi tersebut. Dipergunakan dalam: Pemodelan

dan Deteksi Pelanggaran (Fraud), Analisis Resiko, Analisis Trend, Analisis Keuntungan, dan Sistem Pendukung Pemasaran.

2. Keuangan

Dalam bidang keuangan, aplikasi data mining biasa digunakan dalam:

Peramalan harga saham, pemilihan jenis usaha dagang, manajemen portofolio, peramalan harga barang, merger dan akuisisi perusahaan, peramalan bencana keuangan.

3. Kebijakan Penjualan

Pada bidang ritel dan supermarket (hypermarket) strategi penjualan telah banyak yang menggunakan teknik data mining, antara lain: data warehouse, segmentasi pelanggan, identifikasi profil nasabah, evaluasi harga produk tertentu (barang antik, mobil bekas, seni, dan lain-lain)

4. Kesehatan

Kesehatan juga merupakan salah satu bidang penting pertama yang mendorong pengembangan metode data mining, dari teknik visualisasi, memprediksi biaya perawatan kesehatan, hingga sistem diagnosis berbasis komputer.

5. Telekomunikasi

Dalam beberapa tahun terakhir, telekomunikasi telah mengambil manfaat dari penggunaan teknologi data mining. Terutama karena persaingan yang ketat antar operator telekomunikasi saat ini. Diperlukan sistem yang mampu mengidentifikasi profil pelanggan, memelihara loyalitas pelanggan, hingga strategi untuk menjual produk baru. Beberapa masalah yang dapat

diselesaikan dengan teknik data mining dalam bidang ini antara lain: deteksi penipuan dalam penggunaan telepon seluler, identifikasi profil pelanggan yang menguntungkan, identifikasi faktor yang mempengaruhi perilaku pelanggan terhadap beragam penggilan telepon, identifikasi resiko terhadap investasi baru (misalnya serat optik, nano-teknologi, semikonduktor, dan lain-lain), identifikasi perbedaan dalam produk dan jasa antar pesaing.

Dokumen terkait