Aplikasi dan Kecenderungan dalam
Data Mining
■ Aplikasi data mining
■ Sistem produk dan protetipe riset data mining
■ Tema tambahan pada data mining
■ Dampak tentang data mining
■ Kecenderungan yang terdapat pada data mining
Aplikasi Data Mining
■
Data Mining adalah suatu aplikasi terbaru yang berbeda
dan lebih luas
■ Masih adanya perbedaan pendapat antara prinsip umum dan
pembagian wilayah secara khusus pada aplikasi data mining, khususnya pada keefektifan alat bantu data mining untuk
aplikasi tertentu
■
Beberapa aplikasi domein (yang tercantum pada bab ini)
■ Biomedical dan analisa data DNA ■ Analisa data keuangan
Biomedical
dan Analisa Data DNA
■ Urutan DNA: 4 dasar yang membangun blok ( nucleotides): adenine ( A), cytosine ( C), guanine ( G), dan thymine ( T)
■ Gen: suatu urutan dari beratus-ratus individu nucleotides yang diatur secara tertentu
■ Manusia mempunyai sekitar 30,000 gen
■ Hal yang paling luar biasa yaitu jumlah jalan yang terdapat pada nucleotides sehingga dapat dipecah dan diurutkan kembali untuk membentuk gen yang terpisah
■ Pengintegrasian pembagian heterogen yang semantik, dalam genome database
Sekarang: terbagi-bagi, Generasi yang tak terkendali dan penggunaan data DNA secara luas
Contoh Analisa DNA
Pencarian persamaan dan perbandingan antar urutan DNA
Perbandingan sering terjadi pada pola tiap kelas ( sebagai contoh, sehat dan sakit) Mengidentifikasi urutan pola gen yang berperan dalam berbagai penyakit
Analisa asosiasi: identifikasi dari co-occurring urutan gen
Kebanyakan penyakit tidaklah dicetuskan oleh gen tunggal tetapi oleh suatu kombinasi gen yang bertindak bersama-sama
Analisa asosiasi dapat membantu menentukan macam gen yang mungkin terjadi bersama-sama dalam target percontohan
Analisa alur: menghubungkan gen pada masa pengembangan penyakit lain
Gen yang berbeda bisa menjadi aktip pada penyakit yang berbeda
Intervensi pada masa perkembang farmasi yang mentargetkan langkah-langkah yang berbeda secara terpisah
Data Mining pada Analisa Data
Keuangan
Data keuangan yang dikumpulkan oleh bank dan lembaga keuangan relatif lebih lengkap, dapat dipercaya, dan bermutu tinggi
Disain dan konstruksi dari gudang data untuk multidimensional analisa data dan data mining
Gambaran dari hutang perbulan, perdaerah, persektor, dan faktor lain
Mengakses informasi statistik seperti maximum, minimum, total, rata-rata, kecenderungannya, dan lain lain
Analisa pembayaran peminjaman kebijakan kredit secara prediksi per pelanggan
Seleksi di masa depan dan perlunya penggolongan secara atribut Pencapaian pembayaran peminjaman
Keuangan Data Mining
Penggolongan dan pengelompokan pelanggan untuk target
pemasaran
Segmentasi multidimensional berdasarkan metode terdekat,
penggolongan, alur keputusan, dan lain lain untuk mengidentifikasi penggolongan persediaan sekelompok pelanggan atau pelanggan baru
Mendeteksi pencucian uang dan kejahatan keuangan lain
pengintegrasian dari berbagai DBs ( sebagai contoh, transaksi bank, DBs sejarah kejahatan federal/negara)
Alat bantu: data gambar, analisa pertalian, penggolongan, alat penggabungan, analisa orang asing, dan analisa pola alat
Data Mining pada Industri Retail
Industri Retail: besarnya data penjualan, sejarah
belanja pelanggan, dan lain-lain
Aplikasi dari Retail data mining
Mengidentifikasi perilaku pembelian pelanggan
Menentukan kecenderungan pola belanja pelanggan
Meningkatkan mutu dari layanan pelanggan
Mencapai kepuasan pelanggan
Tingkatkan perbandingan konsumsi barang-barang
Contoh Data Mining pada Industri
Retail
Disain dan konstruksi dari gudang data yang didasarkan
keuntungan penggunaan data mining
Analisa multidimensional dari penjualan, pelanggan, produk, waktu, dan daerah
Analisa dari efektivitas dari kampanye penjualan
Ingatan pelanggan: Analisa dari kesetiaan pelanggan
Menggunakan informasi kartu kesetiaan pelanggan untuk mendaftarkan urutan dari pembelian dari pelanggan tertentu Menggunakan pola mining untuk menyelidiki perubahan dalam konsumsi atau kesetiaan pelanggan
Menyarankan penyesuaian penetapan harga dan variasi barang-barang
Data Mining pada Industri
Telekomunikasi ( 1)
Perkembangan yang sangat cepat dan industri
yang sangat kompetitif dan permintaan yang besar
untuk data mining
Memahami bisnis yang terlibat
Mengidentifikasi pola telekomunikasi
Menangkap aktivitas curang
Mempergunaan sumber daya secara lebih baik
Meningkatkan mutu dari layanan
Data Mining pada Industri
Telekomunikasi ( 2)
Analisa pola kecurangan dan identifikasi pola yang tidak
lazim
Mengidentifikasi pola para pengguna yang berpotensi curang dan penggunaan yang tidak lazim
Mendeteksi usaha kecurangan masukan ke dalam rekening pelanggan
Menemukan pola yang tidak biasa memerlukan perhatian khusus
Multidimensional asosiasi dan percontohan pola analisa
Temukan pola satu set jasa komunikasi berdasarkan kelompok pelanggan, bulan, dan lain lain
Mempromosikan penjualan dari jasa spesifik
Meningkatkan ketersediaan dari jasa tertentu pada suatu daerah
Bagaimana cara memilih suatu
Sistem Data Mining?
Secara komersil sistem data mining mempunyai sedikit
kesamaan
Perbedaan kemampuan atau metodologi Data Mining
Dapat bekerja dengan bermacam-macam data yang berbeda
Memerlukan berbagai pandangan yang dimensional dalam
pemilihan
Jenis data: relational, tanggapan, teks, urutan waktu, ruang?
Isu sistem
Hanya berjalan pada satu atau beberapa sistem operasi? Arsitektur client/server?
Bagaimana cara memilih suatu
Sistem Data Mining? ( 2)
Sumber data
File teks ASCII, berbagai sumber data relational Mendukung koneksi ODBC ( OLE DB, JDBC)?
Fungsi dan metodologi Data mining
Satu melawan berbagai fungsi data mining
Satu melawan berbagai macam variasi perfungsi
Fungsi lain data mining dan metoda perfungsinya menyediakan pengguna dengan analisa dan fleksibilitas yang lebih besar
Menggabungkan dengan DB dan/atau sistem data gudang
Empat format penggabungan: tidak ada penggabungan,
penggabungan lepas, penggabungan semi ketat, dan penggabungan ketat
Bagaimana cara memilih suatu
Sistem Data Mining? ( 3)
Scalabilitas
Scalabilitas perbaris ( atau ukuran database) Scalabilitas perkolom ( atau dimensi)
Kutukan dari dimensionalitas: jauh lebih menantang untuk membuat suatu skala sistem kolom dari pada skala sistem baris
Alat bantu gambar
"Suatu gambar dapat berharga seribu kata-kata“
Kategori penggambaran: data gambar, hasil gambaran, proses penggambaran, dan gambaran data mining
Bahasa query pada Data mining dan tampilan grafis
pengguna
Mudah digunakan dan grafis yang berkualitas tinggi
Contoh Sistem Data Mining ( 1)
Miner IBM yang cerdas
Suatu cakupan luas dari algoritma data mining Skala algoritma data mining
Alat bantu: algoritma jaringan neural, metode statistik, persiapan data, dan alat bantu penggambaran data gambar
Pengintegrasian yang ketat IBM dengan relational sistem database DB2
Perusahaan SAS miner
Berbagai alat bantu analisa yang statistik
Alat bantu data gudang dan berbagai data algoritma mining
Microsoft SQLServer 2000
Contoh Sistem Data Mining ( 2)
Sgi Mineset
Berbagai algoritma dan statistik tingkat lanjut data mining Alat bantu penggambaran tingkat lanjut
Clementine (SPSS)
Pengembangan lingkungan data mining yang terintegrasi untuk pengguna akhir dan pengembang
Berbagai algoritma data mining dan alat bantu penggambaran
DBMiner ( DBMiner Teknologi Inc.)
Berbagai modul data mining : analisa OLAP discovery-driven, asosiasi, penggolongan, dan pengelompokan
efisien, Asosiasi dan sequential-pattern fungsi mining, dan alat penggolongan visuil
Visuallisasi Data Mining
Visualisasi: penggunaan grafik komputer untuk menciptakan gambaran visuil yang membantu pemahaman yang ruwet, penyajian presentasi data yang kokoh
Visualisasi
Tujuan visualisasi
Memperoleh masukan ruang informasi dengan
mempetakan data ke dalam grafis sederhana
Menyediakan ikhtisar yang kwalitatif dari data yang besar
Mencari contoh pola, kecenderungan, struktur,
ketidakteraturan, hubungan antar data.
Bantuan untuk menemukan daerah menarik dan
parameter yang pantas untuk analisis kuantitatif lebih
lanjut.
Visualisasi Data Mining & Visualisasi
Data
Pengintegrasian dari visualisasi data mining
Visualisasi data
Hasil Visualisasi data mining
Proses visualisasi data mining
Visualisasi data mining yang interaktip
Visualisasi data
Data dalam database atau data gudang terlihat
Pada tingkat abstrak yang berbeda
Sebagai kombinasi yang berbeda tentang atribut atau dimensi