Proses Mining tool - LANDASAN TEORI - IMPLEMENTASI DATA PROJECT DALAM PROSES MINING DAN PERBAND

BAB II LANDASAN TEORI

2.3 Proses Mining tool

ProM (yang merupakan kependekan dari Process Mining framework) adalah kerangka kerja Sumber Terbuka untuk algoritma proses mining. ProM menyediakan platform untuk pengguna dan pengembang algoritma proses mining yang mudah digunakan dan mudah diperluas. Misi dari proses mining adalah untuk menjadi platform mining proses de facto str di dunia akademik dengan membentuk komunitas kontributor dan pengguna yang aktif serta diakui, dan untuk menciptakan kesadaran akan kekuatan teknologi proses mining dengan mempromosikan aplikasi dan penyerapan industri. Visi dari ProM adalah untuk secara aktif memajukan teknologi process mining yang canggih dengan mengembangkan metode yang benar-benar berfungsi, dengan menciptakan komunitas terbuka, dan dengan menyediakan platform yang stabil dan mudah diperluas, yang secara optimal mendukung proses mining.

(processmining.org n.d.)

Gambar 2.4 Interface dari ProM Lite 1.2

Terlihat seperti gambar 2.4 merupakan tampilan awal dari aplikasi ProM Lite 1.2

Pada intinya, kerangka kerja ProM mampu memuat event log, menjalankan plugin, dan menampilkan hasilnya. Saat memuat event log, format yang digunakan adalah XES. Setelah event log dimuat, ada beberapa jenis plug-in yang dapat diterapkan di atasnya. Sebagai contoh:

1. Ada plug-in untuk mengurutkan, mengonversi, memfilter, dan menambahkan informasi event log;

2. Ada plug-in untuk mengekstrak model aliran kontrol, jejaring sosial, dan jenis model lainnya dari event log;

3. Ada plug-in untuk mengkonversi antara berbagai jenis model dan untuk menganalisis sifat-sifat model tersebut;

4. Ada plug-in untuk memeriksa kesesuaian antara model aliran kontrol dan event log yang diberikan. (Ferreira 2017, 87)

Menurut (Ferreira 2017, 87), daftar plug-in yang tersedia di ProM terus bertambah, dan ProM menyediakan kerangka kerja untuk memanggil salah satu plug-in plug-ini pada set plug-input tertentu, yang biasanya terdiri dari event log, model, atau keduanya.

Fitur utama dari ProM adalah bahwa output dari plug-in (mis. event log yang difilter, atau model aliran kontrol) dapat digunakan sebagai input ke plugin lain. Dengan cara ini menjadi mungkin untuk melakukan analisis dengan menerapkan urutan plug-in. Misalnya, seseorang dapat menggunakan plug-in preProcessing untuk memfilter event log input, kemudian plug mining untuk menghasilkan model aliran kontrol, dan akhirnya plugin analisis untuk menganalisis sifat struktural dari model yang dihasilkan.

2.3.2 Disco

Disco adalah alat process mining yang dibuat oleh Fluxicon, sebuah perusahaan baru yang didirikan oleh dua lulusan PhD dari Universitas Teknologi Eindhoven. Disco adalah alat yang sangat user-friendly, di mana orang akan menemukan jalannya dengan cukup mudah, setidaknya untuk seseorang yang sudah terbiasa dengan proses mining. Titik awal untuk menggunakan alat ini adalah membuka file log, yang bisa dalam format CSV atau dalam format XES. Jika file log adalah CSV, perlu untuk memilih kolom mana yang akan digunakan sebagai id kasus, tugas, pengguna, dan cap waktu. Di Disco, kolom tugas dan pengguna masing-masing disebut aktivitas dan sumber daya. (Ferreira 2017, 82)

Menurut (Batyuk and Voityshyn 2018, 29-30), Disco memungkinkan mengimpor event log dalam format mining proses klasik (CSV, MXML, XES), XLS dan XLSX didukung juga. Selain itu, Disco mendefinisikan format data acara aslinya yang disebut FXL yang lebih efisien pada set data besar daripada format klasik. Penambang disko adalah algoritma proses mining yang digunakan oleh produk perangkat lunak ini.

GUI Disco memiliki tiga tampilan utama: (a) peta, (b) statistik, (c) kasus. Tampilan peta menyediakan representasi visual dari aliran kontrol proses termasuk visualisasi frekuensi dan metrik kinerja. Pemfilteran tampilan peta didasarkan pada frekuensi kegiatan dan jalur, jangka waktu, kinerja, titik akhir, dll. Tinjauan umum yang informatif tentang event log disediakan oleh tampilan statistik. Tampilan kasus memberikan representasi nyaman dari data mentah event log. Kasus pada tampilan ini dikelompokkan berdasarkan apa yang disebut varian (varian adalah satu "dijalankan" melalui proses dari awal hingga akhir). Karena sebagian besar kasus event log biasanya

hanya mengikuti beberapa varian yang berbeda, penting untuk mengetahui varian apa yang paling sering. (Batyuk and Voityshyn 2018, 30)

2.3.3 Process Mining for Python (PM4Py)

Process Mining for Python (PM4Py) adalah pustaka python yang mendukung (state-of-the-art) proses mining algoritma di python. Ini sepenuhnya open source dan dimaksudkan untuk digunakan dalam proyek akademis dan industri. (pypi.org 2020). PM4Py bertujuan untuk menjembatani kesenjangan, menyediakan integrasi dengan perpustakaan sains data canggih, misalnya, p, numpy, scipy, dan scikit-learn, memberikan tinjauan global arsitektur dan fungsionalitas PM4Py, disertai dengan beberapa contoh penggunaannya yang representatif. (Berti, van Zelst and Van der Aalst 2019, 1)

2.3.3.1 Graphviz

Graphviz adalah perangkat lunak visualisasi grafik open source. Visualisasi grafik adalah cara merepresentasikan informasi struktural sebagai diagram grafik dan jaringan abstrak. Ini memiliki aplikasi penting dalam jaringan, bioinformatika, rekayasa perangkat lunak, database dan desain web, pembelajaran mesin, dan antarmuka visual untuk domain teknis lainnya. Program tata letak Graphviz mengambil deskripsi grafik dalam bahasa teks sederhana, dan membuat diagram dalam format yang bermanfaat, seperti gambar dan SVG untuk halaman web; PDF atau Postscript untuk disertakan dalam dokumen lain; atau ditampilkan di browser grafik interaktif. Graphviz memiliki banyak fitur yang berguna untuk diagram beton, seperti opsi untuk warna, font, tata letak simpul tabel, gaya garis, hyperlink, dan bentuk khusus. (graphviz.org n.d.)

2.3.3.2 Anaconda

Anaconda adalah platform ilmu data sumber terbuka yang menyatukan alat terbaik untuk ilmu data. Ini adalah tumpukan ilmu data yang mencakup lebih dari 100 paket populer berdasarkan Python, Scala, dan R. Dengan bantuan manajer paketnya, konda, pengguna dapat bekerja dengan ratusan paket dalam berbagai bahasa dan melakukan preProcessing data, pemodelan, pengelompokan , klasifikasi, dan validasi dengan mudah. (Yan and Yan n.d.)

Dalam dokumen IMPLEMENTASI DATA PROJECT DALAM PROSES MINING DAN PERBANDINGAN HASIL DENGAN MENGGUNAKAN TOOLS PROM, DISCO DAN PM4Py (PROCESS MINING FOR PHYTON) (Halaman 30-34)