• Tidak ada hasil yang ditemukan

Abstrak - Open Library Telkom University

N/A
N/A
Nguyễn Gia Hào

Academic year: 2023

Membagikan "Abstrak - Open Library Telkom University"

Copied!
1
0
0

Teks penuh

(1)

i

Abstrak

Imbalance class adalah salah satu permasalahan yang ada dalam data mining. Permasalahan ini diakibatkan karena adanya jumlah data yang tidak seimbang pada kelas yang berbeda, dimana kelas yang satu memiliki jumlah data yang sangat banyak (mayoritas), sedangkan kelas lainnya memiliki jumlah data yang sangat sedikit (minoritas). Pada pengklasifikasian biasa, kelas minoritas tersebut tidak dapat terprediksi. Hal ini disebabkan karena bila jumlah data pada satu kelas sangat kecil, kelas tersebut akan salah diprediksi sebagai kelas mayoritas.

Salah satu metode klasifikasi yang biasa digunakan adalah metode decision tree. Metode decision tree ini akan membentuk model seperti flow chart

dengan struktur tree. Pada Tugas Akhir ini diperbandingkan tiga algoritma pada decision tree yaitu C4.5, CART, dan HDDT. Setiap algoritma tersebut memiliki

splitting criterion atau attribute selection measure yang berbeda dengan tingkat sensitivitas yang berbeda pula terhadap kecondongan data.

Analisis yang dilakukan pada Tugas Akhir ini adalah mengetahui bagaimana performansi dari algoritma C4.5, CART, dan HDDT yang memiliki splitting criterion yang berbeda pada permasalahan imbalance class serta

bagaimana perbandingan performansi dari ketiga algoritma decision tree tersebut berdasarkan nilai precision, recall, dan f-measure.

Hasil yang didapat dari penelitian menunjukkan bahwa algoritma HDDT memiliki performansi yang lebih baik pada tingkat imbalance yang rendah dibandingkan algoritma CART dan C4.5. Hal ini disebabkan karena algoritma HDDT memiliki tingkat sensitivitas yang rendah terhadap kecondongan data yang menjadi masalah dalam imbalance class.

Kata kunci: imbalance class, algoritma C4.5, CART, HDDT, performansi.

PDF created with FinePrint pdfFactory Pro trial version http://www.fineprint.com

Referensi

Dokumen terkait

Selama ini baik data pasien, data dokter maupun data penjualan dan pembelian obat pada klinik Permata Raya masih menggunakan sistem secara manual, yaitu belum adanya komputerisasi dalam

Metode penelitian yang digunakan dalam penelitian ini adalah regresi sederhana, dengan teknik survey non-probability sampling, dimana memberi peluang atau kesempatan yang sama bagi

Nilai koefisiensi determinasi 0,118 yang artinya 11,8% dari variasi Earning Responce Coefficient yang dapat dijelaskan oleh variabel Corporate Social Responsibility Disclosure dan

Penelitian ini memiliki hasil analisis deskriptif sebesar 73% untuk variabel kelebihan media promosi youtube, sebesar 71% untuk variabel karakteristik video pada youtube, serta 75%

EFA Bermula dari 12 faktor yang diadopsi dari 4 penelitian terdahulu, setelah melakukan analisis dengan menggunakan EFA, lalu didapatlah hasil penelitian dan analisa yang dilakukan

Saat ini kondisi bagian HRD perusahaan yang menghitung sistem adminitrasi penggajian belum memiliki sistem yang terintegrasi dengan absensi maupun dengan bagian keuangan, dan

Rancangan yang diusulkan dalam penelitian ini adalah 1 proses bisnis bagian non-akademik STISI Telkom yang sesuai dengan Standar Akreditasi Program Studi dan ISO 9001:2008, 2 SOP yang

Cloud Computing adalah model komputasi yang menggunakan teknologi komputer dengan memanfaatkan kemampuan pemrosesan dari banyak komputer antar jaringan yang kemampuannya dapat