Nama : Dina Pani Safira Nim : 12250320357 Kelas : 5C
Mata Kuliah : Data Mining
TUTORIAL MENGGUNAKAN WIDGET HIERARCHICAL CLUSTERING
1. Buka aplikasi Orange dan klik New untuk memulai proyek baru.
2. Dalam laporan ini, widget yang digunakan meliputi File, Distance, Distance Matrix, Hierarchical Clustering dan Data Table. Langkah pertama adalah memilih widget File untuk mengimpor data yang akan dianalisis.
3. Pilih data yang akan digunakan untuk analisis. Pada laporan ini, data yang digunakan adalah Data Penumpang Titanic, yang diperoleh dari platform https://www.kaggle.com/. Dataset ini mencakup total 891 data penumpang dengan 12 atribut, termasuk informasi penting seperti usia, jenis kelamin, kelas tiket, jumlah saudara atau pasangan, serta status keselamatan penumpang.
4. Hubungkan widget File dengan widget Distances untuk menghitung jarak antar data yang telah diimpor, sehingga memungkinkan analisis lebih lanjut seperti clustering atau visualisasi hubungan data.
5. Selanjutnya, hubungkan widget Distances dengan widget Distance Matrix. Gambar di bawah memperlihatkan matriks jarak yang dihasilkan, yang merepresentasikan tingkat kedekatan atau perbedaan antar data dalam dataset berdasarkan metrik jarak tertentu.
6. Langkah selanjutnya adalah menghubungkan widget Distances dengan widget Hierarchical Clustering. Widget ini berfungsi untuk melakukan pengelompokan data secara hierarkis, memungkinkan analisis struktur data berdasarkan tingkat kedekatan antar data. Proses ini menghasilkan dendrogram, sebuah diagram berbentuk pohon yang menggambarkan proses pengelompokan data pada berbagai tingkat kesamaan secara visual. Data yang dipilih adalah data (C1).
7. Hasil dari pengelompokan ini dapat dilihat lebih rinci dengan menghubungkan widget Hierarchical Clustering ke widget Data Table, yang menampilkan data C1 yang telah dikelompokkan sesuai dengan hasil clustering.