Glosarium Data Mining 1. Data Mining:
o Definisi 1: Proses penggalian informasi dan pola yang bermanfaat dari data yang sangat besar.
Referensi: Mitchell, T. M. (1997). Machine Learning. McGraw-Hill.
o Definisi 2: Proses ekstraksi pengetahuan yang berharga dari sekumpulan data yang besar dan kompleks.
Referensi: Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
2. Machine Learning:
o Definisi 1: Cabang kecerdasan buatan yang memungkinkan komputer belajar dari data untuk membuat prediksi atau keputusan tanpa diprogram secara eksplisit.
Referensi: Mitchell, T. M. (1997). Machine Learning. McGraw-Hill.
o Definisi 2: Proses membangun algoritma yang dapat belajar dari data.
Referensi: Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
3. Big Data:
o Definisi 1: Sekumpulan data yang sangat besar, kompleks, dan beragam yang memerlukan teknologi khusus untuk dianalisis guna mendapatkan wawasan yang berharga.
Referensi: Marr, B. (2015). Big Data: Using SMART Big Data, Analytics and Metrics to Make Better Decisions and Improve Performance. Wiley.
o Definisi 2: Kumpulan data dalam jumlah besar yang dianalisis untuk menemukan pola, tren, dan hubungan yang bermanfaat.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
4. Predictive Analytics:
o Definisi 1: Proses analisis data yang menggunakan teknik statistik dan machine learning untuk memprediksi kejadian di masa depan.
Referensi: Kotu, V., & Deshpande, B. (2014). Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner. Morgan Kaufmann.
o Definisi 2: Proses memperkirakan nilai di masa depan berdasarkan pola historis dalam data.
Referensi: Montgomery, D. C., Jennings, C. L., & Kulahci, M. (2015). Introduction to Time Series Analysis and Forecasting (2nd ed.). Wiley.
5. Algoritma:
o Definisi 1: Sekumpulan instruksi atau langkah sistematis yang digunakan untuk memecahkan masalah atau menjalankan tugas dalam pemrograman dan matematika.
Referensi: Cormen, T. H., Leiserson, C. E., Rivest, R. L., & Stein, C. (2009). Introduction to Algorithms (3rd ed.). MIT Press.
o Definisi 2: Prosedur sistematis untuk memecahkan masalah.
Referensi: Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
6. Data:
o Definisi 1: Kumpulan fakta atau angka yang terekam tanpa membawa makna sebelum diolah.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
o Definisi 2: Keterangan yang benar dan nyata.
Referensi: KBBI.
7. Analisis Data:
o Definisi: Proses memeriksa, membersihkan, mengubah, dan memodelkan data dengan tujuan menemukan informasi berguna.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
8. Anomali:
o Definisi: Efek samping yang tidak diharapkan dalam basis data akibat struktur tabel yang bermasalah.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
9. Evaluasi Kinerja:
o Definisi: Penilaian terhadap efektivitas kerja berdasarkan data yang telah dikumpulkan.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
10. Informasi:
o Definisi: Data yang telah dikompilasi dan diorganisir sehingga memiliki makna atau tujuan tertentu.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
11. Kebijakan Berbasis Data:
o Definisi: Keputusan yang diambil berdasarkan analisis data yang mendalam untuk meningkatkan efisiensi dan efektivitas suatu sistem.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
12. Kompilasi Data:
o Definisi: Penggabungan data dari berbagai sumber untuk mendapatkan informasi yang lebih bermakna.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
13. Metode Pengolahan Data:
o Definisi: Teknik yang digunakan untuk mengolah data sehingga dapat menghasilkan informasi dan pengetahuan.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
14. Pengetahuan:
o Definisi: Informasi yang telah diolah lebih lanjut sehingga dapat digunakan untuk pengambilan keputusan.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
15. Pola:
o Definisi: Hubungan, struktur, atau tren yang dapat ditemukan dalam sekumpulan data.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
16. Prediksi:
o Definisi: Proses memperkirakan suatu kejadian di masa depan berdasarkan data yang ada.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
17. Statistik:
o Definisi: Cabang ilmu yang mempelajari cara mengumpulkan, menganalisis, menafsirkan, dan menyajikan data.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
18. Transformasi Data:
o Definisi: Proses perubahan data mentah menjadi informasi, lalu menjadi pengetahuan, dan akhirnya menjadi kebijakan.
Referensi: The-Morgan-Kaufmann-Series-in-Data-Management-Systems-Jiawei Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques 3rd-Edition-Morgan-Kaufmann- 2011[1].pdf.
19. Clustering:
o Definisi 1: Teknik dalam data mining yang mengelompokkan sekumpulan objek sedemikian rupa sehingga objek dalam satu kelompok memiliki kemiripan satu sama lain lebih besar dibandingkan dengan objek di kelompok lain.
Referensi: Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
o Definisi 2: Proses mengelompokkan data ke dalam kelompok-kelompok berdasarkan kesamaan karakteristik tertentu.
Referensi: Tan, P., Steinbach, M., & Kumar, V. (2005). Introduction to Data Mining. Pearson.
20. Classification:
o Definisi 1: Proses pengelompokkan data ke dalam kategori atau kelas berdasarkan atribut-atribut tertentu.
Referensi: Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
o Definisi 2: Teknik dalam data mining yang digunakan untuk mengelompokkan data ke dalam kelas atau kategori.
Referensi: Tan, P., Steinbach, M., & Kumar, V. (2005). Introduction to Data Mining. Pearson.
21. Regression:
o Definisi 1: Teknik dalam data mining yang digunakan untuk memprediksi nilai numerik.
Referensi: Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
o Definisi 2: Proses memperkirakan nilai suatu variabel berdasarkan variabel lain.
Referensi: Montgomery, D. C., Jennings, C. L., & Kulahci, M. (2015). Introduction to Time Series Analysis and Forecasting (2nd ed.). Wiley.
22. Decision Tree:
o Definisi 1: Model prediktif yang menggunakan struktur pohon untuk membuat keputusan berdasarkan serangkaian aturan yang berasal dari fitur data.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
o Definisi 2: Teknik klasifikasi yang sederhana yang banyak digunakan dalam data mining.
Referensi: Ade Putranto and Wuryandari, 2015.
23. Association Rule:
o Definisi 1: Teknik dalam data mining yang digunakan untuk menemukan hubungan atau pola tersembunyi di antara item dalam dataset besar.
Referensi: Han, J., Kamber, M., & Pei, J. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
o Definisi 2: Metode dalam data mining yang digunakan untuk menemukan hubungan atau pola menarik antara item dalam dataset yang besar.
Referensi: Agrawal, R., & Srikant, R. (1994). Fast Algorithms for Mining Association Rules.
Proceedings of the 20th VLDB Conference.
24. Market Basket Analysis:
o Definisi: Analisis yang bertujuan untuk memahami kebiasaan belanja konsumen dengan menemukan asosiasi antar item yang berbeda yang ditempatkan dalam keranjang belanja mereka.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
25. Profiling:
o Definisi: Proses pengumpulan informasi tentang seseorang atau kelompok untuk memahami karakteristik atau perilaku mereka, sering digunakan dalam konteks analisis data untuk mendeteksi pola tertentu.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
26. Konfidensialitas (Confidence):
o Definisi: Dalam konteks aturan asosiasi, konfidensialitas mengukur seberapa sering item dalam konsekuen muncul dalam transaksi yang mengandung item dalam anteseden.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
27. Pola Konsumsi:
o Definisi: Kebiasaan atau perilaku konsumen dalam membeli dan menggunakan barang atau jasa, yang dapat dianalisis untuk memahami preferensi dan kebutuhan pasar.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
28. Prediksi Perilaku:
o Definisi: Penggunaan data historis dan teknik analisis untuk memprediksi tindakan atau keputusan yang mungkin diambil oleh individu atau kelompok di masa depan.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
29. Neural Network:
o Definisi: Model komputasi yang terinspirasi oleh cara kerja otak manusia, terdiri dari lapisan-lapisan neuron yang saling terhubung untuk mengenali pola dan memproses data secara non-linear.
Referensi: Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
30. Support Vector Machine (SVM):
o Definisi: Metode pembelajaran mesin yang digunakan untuk klasifikasi dan regresi.
Referensi: Schölkopf, B., & Smola, A. J. (2002). Learning with Kernels: Support Vector Machines, Regularization, Optimization, and Beyond. MIT Press.
31. Fuzzy Logic:
o Definisi: Metode penalaran yang menangani ketidakpastian dan ambigu dalam data.
Referensi: Ross, T. J. (2010). Fuzzy Logic with Engineering Applications (3rd ed.). Wiley.
32. Text Mining:
o Definisi: Proses ekstraksi informasi dari teks dalam jumlah besar menggunakan teknik Natural Language Processing (NLP), clustering, classification, dan association rule mining untuk menemukan pola dalam data teks.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
33. Data Preprocessing:
o Definisi: Tahap awal dalam data mining untuk membersihkan dan mempersiapkan dataset agar siap dianalisis.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
34. Data Integration:
o Definisi: Proses menggabungkan berbagai sumber data menjadi satu kesatuan untuk analisis lebih lanjut.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
35. Data Warehouses:
o Definisi: Tempat penyimpanan terpusat untuk menyimpan data historis yang digunakan dalam analisis bisnis dan proses data mining.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
36. Data Exploration:
o Definisi: Proses eksplorasi awal dataset untuk memahami pola atau tren sebelum melakukan analisis mendalam.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
37. Data Scientist:
o Definisi: Profesional yang bertanggung jawab atas pengumpulan, analisis, dan interpretasi big data menggunakan teknik seperti machine learning dan statistik.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
38. Statistical Summary:
o Definisi: Ringkasan statistik seperti mean, median, atau distribusi yang digunakan sebagai langkah awal eksplorasi dataset.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
39. Metadata:
o Definisi: Data tentang data; memberikan informasi deskriptif tentang atribut dataset seperti tipe atau format.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
40. Modeling:
o Definisi: Proses membangun model matematis atau algoritma untuk memprediksi atau mengklasifikasi pola dalam dataset.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
41. Discovery:
o Definisi: Penemuan pola baru atau hubungan tersembunyi dalam dataset melalui proses eksplorasi dan analisis.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
42. Knowledge:
o Definisi: Informasi bernilai yang diperoleh dari hasil proses knowledge discovery in databases (KDD).
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
43. Data Presentation:
o Definisi: Penyajian hasil analisis kepada pengguna akhir melalui tabel, grafik, atau laporan.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
44. Visualization Techniques:
o Definisi: Teknik visualisasi seperti diagram batang atau scatter plot digunakan untuk memperjelas hasil analisis kepada pengguna akhir.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
45. A Priori:
o Definisi: Istilah "a priori" dan "a posteriori" digunakan terutama untuk menunjukkan fondasi yang menjadi dasar pengetahuan suatu proposisi.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
46. Cradle Disentri:
o Definisi: Teknik untuk memisahkan faktor tersembunyi dalam representasi data.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
47. Chi Square:
o Definisi: Uji Chi Square atau sering disebut uji chi kuadrat (X kuadrat) bertujuan untuk mengetahui hubungan antar variabel yang terdapat pada baris dengan kolom.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
48. Coefficient of Correlation:
o Definisi: Ukuran statistik dari kekuatan hubungan antara pergerakan relatif dua variabel.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
49. Data Masa Depan:
o Definisi: Data yang tidak punya label.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
50. Disentri Algoritma:
o Definisi: Istilah yang berkaitan dengan pemisahan elemen dalam data mining, seperti dalam dimensionality reduction atau feature selection, yang bertujuan menghilangkan fitur yang tidak relevan.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
51. Deep Learning:
o Definisi: Sebuah teknik berbasis jaringan saraf tiruan telah banyak digunakan dalam beberapa tahun terakhir sebagai salah satu metode implementasi Machine Learning (ML).
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
52. Fp-growth:
o Definisi: Algoritma penambangan data yang digunakan untuk menemukan pola pembelian pelanggan.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
53. Fuzzy C-means:
o Definisi: Metode pengelompokan data yang menggunakan derajat keanggotaan untuk menentukan pengelompokan data.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
54. Generalized Linear Model:
o Definisi: Suatu perluasan dari regresi linear yang memungkinkan hubungan antara variabel
dependent dan independent tidak harus berbentuk linear serta memungkinkan variabel dependent mengikuti distribusi selain distribusi normal.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
55. Genrush 4.5:
o Definisi: Merujuk pada C4.5 Algorithm, salah satu algoritma decision tree yang dikembangkan oleh Ross Quinlan untuk klasifikasi data.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
56. K-Means:
o Definisi: Algoritma pengelompokan iteratif yang bertujuan untuk menemukan maxima lokal pada setiap iterasi.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
57. K-Medoids:
o Definisi: Metode partisi yang digunakan untuk mengelompokkan data menjadi beberapa cluster.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
58. K-Nearest Neighbor:
o Definisi: Algoritma machine learning yang bersifat non-parametric dan lazy learning.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
59. Linear Discriminant Analysis:
o Definisi: Teknik statistik yang digunakan secara luas yang menemukan pola dan informasi diskriminatif dalam kumpulan data untuk membantu tugas klasifikasi dan pengurangan dimensi.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
60. Linear Regression:
o Definisi: Jenis regresi yang menghubungkan antara variabel Y dengan X yang tidak linear.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
61. Logistic Regression:
o Definisi: Teknik analisis data yang menggunakan matematika untuk menemukan hubungan antara dua faktor data.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
62. Naïve Bayes:
o Definisi: Suatu model independen yang membahas mengenai klasifikasi sederhana berdasarkan teorema Bayes.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
63. Self-Organizing Map:
o Definisi: Salah satu jenis artificial neural network atau ANN.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
64. Support Vector Machine:
o Definisi: Suatu metode yang handal dalam menyelesaikan masalah klasifikasi data.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.
65. Text Mining:
o Definisi: Proses ekstraksi informasi dari teks dalam jumlah besar menggunakan teknik Natural Language Processing (NLP), clustering, classification, dan association rule mining untuk menemukan pola dalam data teks.
Referensi: Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques (3rd ed.).
Morgan Kaufmann.