ANALISIS DAN PERANCANGAN SISTEM
3.2 Analisis Sistem
Adapun cara yang penulis ajukan untuk mengidentifikasi jenis mangrove terdapat beberapa proses. Dalam penelitian ini, proses-proses yang dilakukan adalah mengambil data dari seluruh sumber data yang telah ditentukan, selanjutnya terdapat proses awal pre-processing yang dilakukan baik secara otomatis melalui aplikasi dan secara manual untuk memastikan ketepatan data, dengan demikian dapat dilanjutkan untuk memproses pembentukan dari suatu model Long Short Term Memory (LSTM). Pembahasan langkah-langkah secara detail pada bagian selanjutnya. Arsitektur umum yang dibentuk bisa dilihat pada gambar berikut:
16
Adapun penjelasan dari gambar di atas, antara lain:
3.2.1 Input
Tahap awal yang dilakukan adalah mempersiapkan input berupa dataset mangrove yang terdiri dari 10 atribut yaitu ketinggian air, suhu air, kelembapan udara, tds, orp, do, pH, datetime, dan lokasi yang berjumlah 2342 baris yang nantinya akan dibersihkan melalui proses pre-processing. Data yang digunakan merupakan data penelitian oleh (Ibrahim, 2021)
3.2.2 Data Preparation
Data preparation atau bisa disebut data preprocessing adalah proses normaliasi yang dilakukan terhadap dataset agar sesuai dengan nilai yang telah ditetapkan.
Dalam penelitian ini, tahap data preparation dibagi menjadi 2 tahap antara lain, data cleaning, dan data labeling.
3.2.2.1 Data Cleaning
Pada data cleaning dilakukan proses seleksi data untuk memeriksa data yang berulang serta menghilangkan dan memperbaiki instance atau feature yang salah pada dataset.
Data yang salah akan dibuang karena mampu mengurangi tingkat akurasi. Proses cleaning ini dapat di gambarkan pada Gambar 3.3.
Gambar 3.3. Proses pembersihan data
Berdasarkan Gambar 3.3, pertama dataset akan dimuat terlebih dahulu, kemudian akan dilakukan pengecekan setiap baris apakah berupa angka desimal (float) atau tidak secara berulang sebanyak baris yang ada pada dataset. Apabila terdapat
17
angka 0. Begitu seterusnya sampai baris terakhir data. Selanjutnya paramater data yang tidak akan digunakan dalam penelitian akan di delete seperti ketingian air, suhu udara, kelembapan udara, tds, dan orp. Sehingga hanya menyisakan parameter pH, suhu air dan DO.
3.2.2.2 Data Labeling
Proses terakhir dari data preparation yaitu data labeling, dimana pelabelan data dilakukan untuk menentukan output berdasarkan feature yang digunakan yaitu suhu udara, pH dan Dissolved Oxygen (DO).
Setelah proses data preparation selesai maka file akan disimpan kedalam CSV baru yang terdiri dari 4 kolom, yaitu pH, suhu air, DO dan label. Output dari proses dapat terlihat pada tabel berikut:
Tabel 3.1 Hasil Data Output dari preparation
pH Suhu Air DO Label
Pada tahap process dilakukan dua bagian yaitu proses testing dan proses training. Data dibagi menjadi 2, 70% data untuk testing dan 30% data untuk validation. Selanjutnya pembuatan model berdasarkan parameter yang di input.
Jumlah node pada neural network terlebih dahulu ditentukan, terkhusus pada hidden layer, sebab hidden layer memiliki peran penting dalam menghitung hasil akhir dari neural network. Pada penelitian ini permodelan yang digunakan menggunakan LSTM yang memiliki 3 hidden layer.
18
3.2.3.1 Proses Training
Pada proses training dilakukan permodelan LSTM yang diawali dengan menentukan banyaknya hidden layer (layer tersembunyi), tingkatan neuron dan jumlah epoch yang akan dipakai.
Kemudian proses training akan di jalankan, dimana model akan dilatih menggunakan data training yang telah disediakan. Data latih akan diproses dengan permodelan yang sudah dibuat yaitu lstm model. Dimana pada lstm model data akan masuk ke neuron melalui hidden layer.
Pada satu neuron data yang terletak pada cell state akan melalui forget gate untuk ditentukan apakah data tersebut akan disimpan atau dibuang, dimana penentuannya ditentukan melalui fungsi aktivasi dan dua kondisi. Apabila hasilnya berupa 0 maka data pada cell state akan dibuang dan apabila hasilnya 1 maka data akan pertahankan. Selanjutnya data pada cell state akan dilanjutkan melalui input gate yang mana input gate ini memiliki dua fungsi yaitu untuk mengupdate atau menambahkan data pada cell state
Setelah dimodifikasi dan ditambahkan diperbaharui data pada cell state akan dilanjutkan mealui output gate. Dimana data pada cell state akan diubah untuk disampaikan pada neuron selanjutnya melalui hidden layer selanjutnya dan akan terus berlangsung sebanyak nilai epoch yaitu 10. Dalam penelitian ini, data yang tersimpam di dalam cell state berupa, ph, suhu, do dan label dimana data inilah yang akan berpengaruh pada pengidentifikasian mangrove.
Bobot dan bias akan terus diperbaharui untuk memperoleh model yang sesuai.
Setelah satu literasi process training selesai, maka dilakukan proses validasi untuk mengetahui kinerja model hasil training.
Training result akan divalidasi setiap batch dengan dataset validation untuk melihat apakah hasil yang diberikan sesuai dengan nilai yang sebenarnya. Proses validasi akan menghasilkan error yang disebut loss. Output dari proses ini yaitu sebuah model neural network yang disebut learned model yang sudah selesai di training yang nantinya akan di load kembali ketika akan melakukan proses testing. Selain itu total akurasi dan loss juga akan tercetak pada setiap akhir proses training.
19
3.2.3.2 Proses Testing
Setelah model diperoleh dari proses training, selanjutnya dilakukan pengujian menggunakan sumber data testing yang sudah didapat dari proses preparation.
learned model dimuat kembali dan menghitung hasil keluaran berdasarkan parameter-parameter yang diberikan pada saat proses training yang sudah ada didalam learned model. Tahap ini dilakukan untuk dapat mengetahui efektifitas dari algoritma Long Short Term Memory (LSTM) dalam melakukan proses identifikasi.
3.2.4 Output (Hasil Akhir)
Adapun output dari keseluruhan tahapan dengan LSTM adalah persentase tingkat kelayakan hidup tanaman mangrove Pulau Sembilan yang dibagi dalam 3 zona, dan dimuat dalam bentuk diagram dan tabel