DATA MINING
Pengantar
• Perkembangan teknologi dalam bidang basis data pada masa sekarang ini makin meningkat dengan sangat cepat.
• Kemajuan teknologi tersebut dapat memungkinkan suatu perusahaan atau organisasi untuk mengumpulkan data dari berbagai sumber dengan mudah dan cepat.
• Kemudahan dalam mengumpulkan data ini membuat volume data menjadi semakin besar dan terus bertambah.
• Pada dasarnya data bisa saja dianalisis dan
diinterpretasi secara manual untuk mendapatkan informasi dan pengetahuan yang terkandung
didalamnya, namun analisis data manual bersifat lambat, mahal dan sangat subjektif.
• Teknik manual atau dapat juga disebut teknik tradisional ini tidak mungkin digunakan untuk menemukan informasi dan pengetahuan yang terkandung pada sekumpulan data dalam ukuran yang sangat besar.
• Kebutuhan analisis data tersebut dapat dijawab dengan adanya teknologi data mining, yaitu suatu teknologi untuk mengekstraksi atau menambang pengetahuan dari data skala besar
• Proses akan dilakukan dalam data mining adalah proses secara otomatis menemukan informasi
yang berguna yang tersimpan pada data dengan ukuran besar.
• Tujuan utama penggunaan data mining adalah deskripsi dan prediksi.
• Deskripsi berarti menemukan pola yang mudah dipahami oleh pengguna dalam menggambarkan data, sedangkan prediksi berarti menemukan pola untuk memprediksi nilai dari suatu variabel dalam basis data dengan melibatkan penggunaan
beberapa variabel yang nilainya sudah diketahui.
CASE :
Komponen : tgl. pasang, tgl. Rusak, km pakai, origin, lokasi pakai Komponen : tgl. pasang, tgl. Rusak, km pakai, origin, lokasi pakai
Q : Menentukan kesesuaian antara origin komponen, dengan kondisi operasi komponen
Mhs : Prodi, IP, lama kuliah, Asal SMA, Asal SD, Suku Mhs : Prodi, IP, lama kuliah, Asal SMA, Asal SD, Suku
Q : Menentukan keterkaitan antara SUKU dengan prestasi pada prodi tertentu.
Tgl. Pasang Tgl. Rusak KM Pakai Origin Lokasi Pakai
Okt.05 Agu.06 53.000 Korea Jakarta
Mar.05 Jul.06 40.000 Taiwan Bandung
Jan.06 Sep.06 35.000 Jepang Jakarta
Prodi IP Lama Kuliah Asal SMA Asal SD Suku
IF 3,6 11 Jogya Jogya Jawa
EL 3,4 10 Makssar Makssar Minang
AR 3,7 12 Bandung Majalaya Sunda
TL 3,2 9 Jakarta Jakarta Ambon
Contoh Kasus :
• Toko Komputer (Menjual barang apa aja yg berkaitan dengan Komputer)
• Supermarket (meletakkan barang)
• Perusahaan memprediksi product apa yang akan diciptakan (dibuat) melihat pola konsumen atau kebutuhan konsumen dari waktu ke waktu.
• Orang yg datang ke Asia sudah pasti akan kena penyakit TBC atau tidak.
• Menentukan persetujuan kredit seseorang disuatu bank
Daftar Pustaka
• Judul : Data Mining Concepts and Techniques.
Pengarang : Jiawei Han & Micheline Kamber, Second Edition.
USA : Morgan Kaufmann Publishers.
• Judul : Data Mining.
Pengarang : Pang-Ning Tan, Michael
Steinbach, Vipin Kumar
Tugas, Latihan Soal dan Quiz
• Tugas :
- Tugas Mandiri
- Tugas Berkelompok dan di Presentasikan
• Latihan Soal :
Akan diberikan pada penjelasan materi tertentu
• Quiz
- Mendadak
- Ada pemberitahuan sebelumnya
Tidak ada Tugas, Quiz dan Ujian Susulan Atau Perbaikan !
Sistematika Penilaian
10 % Tugas
20 % Quiz
35 % UTS
35 % UAS
Diluar Penilaian Sebenarnya :
80 % kehadiran (Minimal 12 x hadir)
Nilai Akhir (Grade) Akan dipertimbangkan
Batas Nilai Akhir :
A >= 75 60 <= B < 75 45 <= C < 60 30 <= D < 45 E < 30
Tugas Awal :
• Buat Makalah Tentang Data Mining
Referensi (Rujukan) :
- Dari Buku yang dianjurkan
- Dari Internet (Tuliskan dibagian akhir tugas, alamat
“lengkap” website-nya)
Contoh : http://209.85.175.104/search?
q=cache:KWXHAKPPokoJ:staffsite.gunadarma.ac.id/hasmapsa/ind ex.php%3Fstateid%3Ddownload%26id%3D1503%26part
%3Dfiles+batch+orientation&hl=id&ct=clnk&cd=1&gl=id