TUGAS 2 DATA MINING Putri Nur Khasanah
20210801492
1. Misalkan nilai untuk sekumpulan data tertentu dikelompokkan ke dalam interval.
Interval dan frekuensi yang sesuai adalah sebagai berikut:
Hitung perkiraan nilai median untuk data tersebut!
Jawaban:
2. Uraikan secara singkat cara menghitung perbedaan antara objek yang dijelaskan berikut ini: (a) Atribut nominal (b) Atribut biner asimetris (c) Atribut numerik
Jawaban:
Menghitung Perbedaan Antar Objek
Berikut adalah cara menghitung perbedaan antar objek berdasarkan jenis atributnya:
a. Atribut Nominal:
• Perbedaan kategori: Hitung jumlah kategori yang berbeda antara dua objek.
• Contoh: Misalkan objek A memiliki kategori "merah" dan objek B memiliki kategori "biru". Perbedaan kategorinya adalah 1.
• Catatan: Perbedaan kategori tidak memperhitungkan urutan atau jarak antar kategori.
b. Atribut Biner Asimetris:
• Hitung selisih nilai: Kurangi nilai objek B dari nilai objek A.
• Contoh: Misalkan objek A memiliki nilai "1" (ya) dan objek B memiliki nilai "0"
(tidak). Perbedaan nilainya adalah 1.
• Catatan: Perbedaan nilai hanya menunjukkan arah perbedaan, bukan besarannya.
c. Atribut Numerik:
• Hitung selisih absolut: Kurangi nilai yang lebih kecil dari nilai yang lebih besar.
• Contoh: Misalkan objek A memiliki nilai 10 dan objek B memiliki nilai 5.
Perbedaan absolutnya adalah 5.
• Catatan: Perbedaan absolut menunjukkan besaran perbedaan nilai antar objek.
Metode Perbandingan Lainnya:
• Jarak Euclidean: Menghitung jarak antar objek dalam ruang multidimensi.
• Koefisien korelasi: Mengukur hubungan linear antara dua variabel.
• Analisis cluster: Mengelompokkan objek berdasarkan kesamaan atributnya.
Pilihan metode tergantung pada:
• Jenis atribut
• Tujuan analisis
• Interpretasi yang diinginkan
Contoh Penerapan:
• E-commerce: Merekomendasikan produk yang serupa berdasarkan atribut nominal (kategori produk) dan numerik (harga, rating).
• Medis: Mendiagnosis penyakit berdasarkan atribut biner asimetris (gejala) dan numerik (hasil tes).
• Keuangan: Menganalisis risiko investasi berdasarkan atribut numerik (kinerja keuangan, rasio risiko).