Lembar Kerja Mahasiswa
Coding Machine Learning ( Farida Ardiani, S.Kom., M.Kom. ) Program Studi Ilmu Komunikasi
Fakultas Bisnis dan Humaniora – Universitas Teknologi Yogyakarta Identitas Mahasiswa
Nama Nama NPM Kelas
Untuk menjawab silahkan gunakan template berikut
Perhatikan soal dan perintah dengan baik agar setiap pertanyaan terjawab dengan baik
Dikumpulkan di elearning max jam 17.55
Tipe file yang dikumpulkan adalah word
File Penamaan (NPM-NAMA-T5)
SOAL
1. Diketahui data transaksi pada suatu clothing store seperti yang dapat dilihat pada file clothing_store_m12.csv (file dapat di-download di wa grup) Berdasarkan demo penerapan Data Association Rule menggunakan FP Growth
RapidMiner yang telah di kerjakan pada pertemuan 10 lihatlah rule apa yang terbentuk dari data di tersebut. Kemudian kerjakan perintah berikut:
a. Atur nilai min. support menjadi = 0.2 b. Atur nilai min. confidence menjadi = 0.5
c. Berdasarkan hasil running program, sebutkan 3 rule dengan tingkat confidence tertinggi
d. Bahas bagaimana ketiga hasil rule (dengan tingkat confidence tertinggi) jika dilihat dari sisi LIFT dan CONVICTION
2. Diketahui
Proses 1 : process feature engineering untuk memprediksi apaha seseorang akan bermain golf atau tidak menggunakan pendekatan weihgt by information gain dengan optimize selection brute force dan algoritma naïve bayes dengan
pembagian data 7:3.
Proses 2 : process memprediksi apakah seseorang akan bermain golf atau tidak menggunakan metode naïve bayes biasa tanpa feature engingeering
a) Lakukan perbandingan hasil antara proses 1 dan proses 2 kemudian jelaskan hasilnya
b) Setelah mengetahui proses terbaik kemudian berikan alasan mengapa proses tersebut lebih baik dari proses satunya
3. Menggunakan data berikut https://drive.google.com/file/d/1lPwZCQTigtsdACtiA2wF2R-7L5cbDItG/view?usp=sharing Lakukan lah proses auto model menggunakan metode metode yang telah kita pelajari sebelumnya kemudain lakukan perbandingan hasilnya dan simpulkanlah 2 algoritma dengan hasil performance terbaik
:Jawaban 1.
2.
3.