Data mining bukanlah tugas yang mudah, karena algoritma yang digunakan bisa menjadi sangat kompleks dan data tidak selalu tersedia di satu tempat. Perlu diintegrasikan dari berbagai sumber heterogen data. Faktor-faktor ini juga membuatbeberapa masalah.
sebelum lebih lanjut silahan baca postingan sebelumnya mengenai pengenalan dan tugas utama data mining.
Postingan Terkait : Apa itu Data Mining? dan Tugas Utama Data Mining
Di sini dalam postingan ini, kita akan membahas masalah - masalah utama mengenai data mining seperti dibawah ini −
Pertambangan metodologi dan interaksi pengguna
Masalah kinerja
Jenis masakah Data beragam
*Penjelasan Dari gambar dibawah ini :
Metodologi Data Mining dan masalah pada interaksi pengguna Ia merujuk kepada jenis berikut − masalah
Mining jenis pengetahuan dalam database / Mining different kinds of knowledge in databases − pengguna yang berbeda mungkin tertarik dalam berbagai jenis pengetahuan. Oleh karena itu sangatlah penting untuk data pertambangan untuk menutupi berbagai pengetahuan penemuan tugas.
pola, menyediakan dan menyempurnakan permintaan pertambangan data berdasarkan hasil yang dikembalikan.
Proses penggabungan / Incorporation of background knowledge − pengetahuan latar belakang penemuan panduan dan untuk mengekspresikan pola ditemukan tidak hanya dalam istilah yang ringkas tetapi di beberapa tingkatan abstraksi.
Permintaan bahasa data mining dan ad hoc data mining / Data mining query languages and ad hoc data mining− Data mining Query language yang memungkinkan pengguna untuk menggambarkan tugas-tugas di Adhoc minging, harus
dalam database, data pertambangan algoritma harus efisien dan scalable.
Paralel, didistribusikan dan inkremental mining algoritma / Parallel, distributed, and incremental mining algorithms − faktor-faktor seperti ukuran besar database, distribusi data, dan kompleksitas dari metode pertambangan data memotivasi pengembangan data paralel dan didistribusikan mining algoritma. Algoritma ini membagi data ke partisi yang diproses lebih lanjut dalam mode paralel. Kemudian hasil dari partisi digabungkan. Algoritma inkremental, update database tanpa pertambangan data lagi dari awal. tidakmungkin untuk satu sistem untuk mining semua jenis data ini.
Mining information from heterogeneous databases and
global information systems / Pertambangan informasi dari database heterogen dan informasi global sistem − data tersedia di sumber data yang berbeda pada LAN atau WAN. Sumber data ini mungkin terstruktur, semi terstruktur atau tidak terstruktur. Oleh karena itu pengetahuan mining dari mereka menambah tantangan data mining.