Fakultas Ilmu Komputer Universitas Brawijaya
Peramalan Hasil Panen Kelapa Sawit Menggunakan Metode Multifactors
High Order Fuzzy Time Series yang Dioptimasi dengan K-Means Clustering
(Studi Kasus: PT. Sandabi Indah Lestari Kota Bengkulu)
Yessica Inggir Febiola1, Imam Cholissodin2 , Candra Dewi3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya Email: 1[email protected], 2[email protected], 3[email protected]
Abstrak
Berdasarkan data volume ekspor yang dicatat oleh Kementerian Pertanian dari tahun 2012 hingga tahun 2016, kelapa sawit (Elaeis guineensis Jacq) menjadi salah satu pusat perhatian pemerintah dan investor. Pada perusahaan perkebunan kelapa sawit, salah satunya ialah PT. Sandabi Indah Lestari Kota Bengkulu terjadi kendala pada hasil panen kelapa sawit yang tidak sesuai dengan target yang diharapkan. Target ini berupa jumlah hasil panen dan waktu yang digunakan untuk melakukan hasil panen kelapa sawit. Ketika hasil panen tidak sesuai target, hal ini dapat menyebabkan anggaran produksi yang tidak sesuai dengan yang direncanakan. Oleh karena itu perusahaan membutuhkan peramalan hasil panen untuk meminimalisasi adanya kendala yang ditimbulkan dari hasil panen yang tidak sesuai target. Metode Multifactors High Order Fuzzy Time Series yang dioptimasi dengan K-Means Clustering untuk menentukan subinterval yang digunakan dapat membantu dalam melakukan peramalan hasil panen kelapa sawit. Alur dari metode ini yaitu penentuan Universe of Discourse, penentuan jumlah cluster, pembentukan subinterval dengan K-Means Clustering, pembentukan himpunan Fuzzy, fuzzifikasi, pembentukan Fuzzy Logic Relationship (FLR), dan defuzzifikasi. Penelitian ini menggunakan beberapa faktor yang terdiri atas hasil panen kelapa sawit setiap bulan, luas lahan, umur tanaman, dan jumlah pokok kelapa sawit. Dari hasil pengujian didapatkan jumlah cluster, jumlah order, jumlah data latih, dan threshold yang optimal secara berturut-turut yaitu 8, 6, 107, dan 6 dengan nilai AFER terbaiknya yaitu 36,98%.
Kata kunci: kelapa sawit, peramalan, Multifactors High Order Fuzzy Time Series, K-Means Clustering, AFER
Abstract
Based on the export volume data recorded by the Ministry of Agriculture from 2012 to 2016, palm oil (Elaeis guineensis Jacq) became one of the centres of Government and investor attention. In the oil palm plantation company, one of which is PT. Sandabi Indah Lestari Bengkulu occurs constraints on palm oil crops that do not match the target expected. This target is the sum of harvest and when it is used to harvest the oil palm. When crops do not match the target, it can cause budgets of production that do not match the planned. Therefore, the company requires forecasting the crops to minimize the constraints caused by the crops that are not suitable for the target. The Multifactor High Order Fuzzy Time Series method that is optimized with K-Means Clustering to determine which subintervals are used can help in forecasting the oil palm harvest. The plot of this method is the determination of the Universe of discourse, the determination of the number of clusters, the formation of subintervals with K-Means Clustering, the formation of the fuzzy set, the fuzzification process, the formation of Fuzzy Logic Relationship (FLR), and the defuzzification process. This research uses several factors that lacte over the harvest of oil palm Lot month, land area, age of the plant, and the amount of oil palm trees. From the results of the tested the sum of clusters, the sum of orders, the sum of training data, and the optimal threshold in the successive are 8, 6, 107, and 6 with the best AFER value of 36,98%.
Fakultas Ilmu Komputer, Universitas Brawijaya
1. PENDAHULUAN
Indonesia adalah negara yang masih mengandalkan sektor pertanian dalam menunjang perekonomian negara dengan meninjau cakupan komoditas, hasil produksi, dan pengusahaannya yang masih dikelola oleh masyarakat menengah ke bawah diseluruh penjuru Indonesia (Sinaga & Hendarto, 2012). Banyak sekali komoditas pertanian yang dikembangkan di Negara Indonesia. Mulai dari padi, jagung, gandum, teh, kopi, cengkeh, kelapa sawit, dan masih banyak komoditas pertanian yang lainnya.
Berdasarkan data volume ekspor yang dicatat oleh Kementerian Pertanian dari tahun 2012 hingga tahun 2016, terdapat lima komoditas dengan volume ekspor terbesar yaitu komoditas karet, kelapa sawit, kelapa, kakao, dan kopi (Murjoko, 2017). Dari kelima komoditas tersebut, kelapa sawit (Elaeis guineensis Jacq) menjadi salah satu pusat perhatian pemerintah dan investor. Hal ini disebabkan oleh kelapa sawit yang merupakan sumber daya alam hayati yang bisa diperbarui serta didukung dengan lahan yang luas.
Terdapat banyak perusahaan swasta yang bergerak di perkebunan kelapa sawit, misalnya ialah PT. Sandabi Indah Lestari Kota Bengkulu. Perusahaan ini berdiri sejak tahun 1999 dan melakukan penanaman hingga tahun 2011 dengan hasil panen yang dimulai pada tahun 2004. Jumlah panen dari kelapa sawit tidak selalu stabil. Ada kalanya hasil panen kelapa sawit mengalami penurunan dan membuat anggaran produksi tidak balik modal atau mengalami kerugian. Perusahaan perkebunan menginginkan hasil panen panen kelapa sawit dengan jumlah dan waktu yang tepat atau sesuai target produksi. Hasil panen kelapa sawit memberikan pengaruh terhadap anggaran upah pekerja, jumlah target permintaan olahan, dan anggaran panen. Dalam menentukan target jumlah hasil panen, perusahaan melakukan perhitungan panen atau dapat juga melakukan peramalan terhadap hasil panen dengan tujuan menentukan kebijakan yang akan digunakan. Ketika perusahaan melakukan hasil panen yang tidak sesuai dengan anggaran, maka akan dilakukan koreksi dengan nilai 5% - 12% pada hasil panen setiap bulannya.
Beberapa pembahasan penelitian mengenai hasil panen kelapa sawit di antaranya yaitu penelitian oleh (Sinaga, et al., 2018) dengan melakukan peramalan terhadap produksi kelapa
sawit dengan Jaringan Syaraf Tiruan menggunakan metode Backpropagation.
Penelitiannya menggunakan beberapa faktor yaitu usia tanaman, luas lahan, jumlah pokok kelapa sawit, dan hasil panen per bulan. Hasil yang diperoleh berupa MAPE dengan nilai 10,0047%. Penelitian selanjutnya oleh Azmiyati & Tanjung (2016) melakukan peramalan pada jumlah tandan buah segar kelapa sawit menggunakan Fuzzy Time Series Chen yang dikombinasikan dengan Algoritme Ruey Chyn
Tsur. Hasil penelitian yang diperoleh yaitu TBS
kelapa sawit yang disiapkan untuk proses produksi minyak kelapa sawit CPO sebanyak 1.382.570 dengan nilai AFER 0,22%.
Dari penelitian yang ada diperoleh nilai AFER yang baik pada Fuzzy Time Series Chen, namun memiliki kelemahan dalam penentuan panjang interval. Oleh sebab itu penelitian ini akan melakukan peramalan hasil panen kelapa sawit pada PT. Sandabi Indah Lestari Kota Bengkulu menggunakan metode Fuzzy Time
Series yang berfokus pada Multifactors High Order Fuzzy Time Series karena faktor yang
digunakan lebih dari satu faktor. Untuk pembentukan subinterval menggunakan
K-Means Clustering. Terdapat penelitian yang
membandingkan antara Multifactors High
Order Fuzzy Time Series (MHOFTS) dengan Fuzzy Time Series Chen dengan menghasilkan
nilai error lebih baik yaitu 1,76% dibanding dengan FTS Chen 2,47%. Penelitian tersebut dilakukan oleh Yupei Lin dan Yiwen Yang (2009). Pola data yang berdasarkan runtut waktu dapat dipelajari dengan menggunakan metode
Fuzzy Time. Sementara K-Means Clustering
dapat membantu pembentukan subinterval dengan melakukan klasterisasi data dengan sederhana dan mudah. Penelitian Fuzzy Time
Series dengan K-Means Clustering pernah
dilakukan oleh Zhiqiang Zhang & Qiong Zhu (2012) dengan hasil nilai MSE sebesar 227,17 lebih baik dibanding metode Huarng dan Jilani. 2. LANDASAN KEPUSTAKAAN
2.1 Data Penelitian
Dalam melakukan peramalan pada penelitian ini, maka digunakan data berupa hasil panen kelapa sawit tahun 2016-2017 pada PT. Sandabi Indah Lestari yang berada di Kota Bengkulu. Data berisi 4 faktor yaitu hasil panen kelapa sawit setiap bulan, umur tanaman, luas lahan, dan populasi pokok.
Fakultas Ilmu Komputer, Universitas Brawijaya
2.2 K-Means Clustering
K-Means ialah sebuah metode yang
digunakan dalam pengelompokkan data non-hierarkhi dengan melakukan partisi data dalam bentuk beberapa cluster (Sudono, et al., 2013). Kelebihan dari algoritme K-Means ialah mudah dan sederhana dalam implementasi, skalabilitas, kecepatan dalam konvergensi, dan kemampuan dalam beradaptasi untuk data yang jarang (Oyelade, et al., 2010). K-Means dapat melakukan pengelompokkan data dengan waktu komputasi yang cepat dan efisien serta dalam jumlah data yang cukup besar. Selain itu,
K-Means juga mempunyai kelemahan yaitu pada
penentuan pusat cluster yang tergantung pada inisiasi pusat cluster awal yang diberikan (Alfina, et al., 2012). Dari hal ini menyebabkan hasil cluster yang terbentuk bersifat lokal optimal.
Langkah-langkah dari K-Means Clustering (Anggodo, et al., 2017):
1. Menentukan jumlah k cluster yang ingin digunakan dan centroid setiap cluster. 2. Melakukan pengklasteran data berdasarkan
jarak terdekat dengan Euclidiean Distance pada persamaan 1. 𝐷(𝑥2, 𝑥1) = √∑𝑝𝑗=1= (𝑥2𝑗− 𝑥1𝑗)2 (1) Keterangan: D = jarak p = dimensi data 𝑥1= letak titik 1 𝑥2= letak titik 2
3. Menghitung nilai centroid (pusat cluster) pada setiap cluster dengan Persamaan 2. 𝑉𝑗 = 1
𝑛𝑗∑ 𝑑𝑎𝑡𝑎𝑝 𝑛
𝑝=0 (2)
Keterangan:
𝑉𝑗 = nilai centroid dari cluster j 𝑛𝑗 = jumlah objek dalam cluster j 𝑑𝑎𝑡𝑎𝑝 = vektor data ke p.
4. Mengulangi langkah ke-2 hingga nilai
centroid tidak berubah. Atau tidak ada data
yang berpindah cluster.
2.3. Multifactors High Order Fuzzy Time
Series
Metode Multifactors High Order Fuzzy
Time Series (MHOFTS) merupakan metode Fuzzy Time Series yang menggunakan beberapa
faktor dalam memberikan pengaruh untuk peramalan yang dilakukan berdasarkan data historis dalam proses pembentukan Fuzzy Logic
Relationship (Wijaya, et al., 2018). Ketika
peramalan dilakukan dengan menggunakan lebih dari satu faktor, maka hasilnya tidak hanya bergantung pada faktor yang ada. Akurasi peramalan dapat ditingkatkan dengan mempertimbangkan pada jumlah faktor yang digunakan dan order yang digunakan (Jilani, et al., 2008).
Pada pembentukan subinterval yang digunakan ialah metode Means Clustering.
K-Means Clustering menggantikan proses pembentukan subinterval agar subinterval yang didapatkan mempunyai tingkat kemiripan yang cukup untuk merefleksikan distribusi dari data asli.
Langkah-langkah melakukan perhitungan dengan Multifactors High Order Fuzzy Time
Series(Lee, et al., 2006):
1. Melakukan perhitungan Universe of Discourse (U)
Universe of Discourse (U) merupakan range yang digunakan pada variable linguistic serta digunakan pada aturan fuzzy
(Putri, et al., 2017). Nilai mean dari setiap faktor dihitung guna mendapatkan nilai standar deviasi. Rumus dari perhitungan nilai
mean terdapat pada Persamaan 3.
Mean = ∑𝑛𝑖=1𝑑𝑎𝑡𝑎 / n (3) Variabel n merupakan jumlah data yang digunakan. Standar deviasi (𝜎) dapat dihitung menggunakan rumus yang terdapat pada Persamaan 4. 𝜎 = 1 𝑛−1∑ (𝑑𝑎𝑡𝑎 − 𝑚𝑒𝑎𝑛) 2 𝑛 𝑖=1 (4)
Variabel n merupakah jumlah data yang digunakan.
Sementara nilai U dapat ditentukan melalui perhitungan pada Persamaan 5.
U = [Dmin – 𝜎, Dmax + 𝜎] (5)
Keterangan:
Dmin : Data dengan nilai terkecil
Dmax : Data dengan nilai terbesar
𝜎 : Standar deviasi
2. Menentukan jumlah dari cluster
Pengelompokkan data atau clustering dilakukan untuk membagi data ke dalam beberapa cluster dengan memperoleh pusat
cluster. Setelah didapatkan pusat cluster,
Fakultas Ilmu Komputer, Universitas Brawijaya subinterval. Jumlah cluster (k) dapat ditentukan secara random.
3. Pembentukan subinterval
Untuk mendapatkan jumlah cluster sejumlah k, maka proses klasterisasi
dilakukan dengan metode K-Means Clustering. Tahapan yang dilakukan yaitu
membagi U ke dalam k subinterval: (Dmin, d1),
(d1, d2), (d2, d3), ... (dn-1, Dmax), d merupakan
titik tengah dua pusat cluster. Untuk k subinterval dapat didefinisikan sebagai u1, u2, u3, ..., uk. Subinterval yang terbentuk dengan
panjang yang berbeda mampu merefleksikan struktur data yang kompleks lebih baik dibanding ketika subinterval memiliki panjang yang sama (Putri, et al., 2017). 4. Membentuk Fuzzy set
Pembentukan himpunan fuzzy Ai (i = 1, 2, 3,
..., k) dapat dilakukan dengan Persamaan 6. 𝐴1= 𝑓11 𝑢1 + 𝑓12 𝑢2 + ⋯ + 𝑓1𝑘 𝑢𝑘 (6) 𝐴𝟐= 𝒇𝟐𝟏𝒖𝟏 +𝒇𝟐𝟐𝒖𝟐 + ⋯ + 𝒇𝟐𝒌𝒖 𝒌 … = ⋯ + ⋯ + ⋯ + ⋯ 𝐴𝑘= 𝑓𝑘1 𝑢1 + 𝑓𝑘2 𝑢2 + ⋯ + 𝑓𝑘𝑘 𝑢𝑘
𝑓𝑖𝑗 merupakan derajat keanggotaan dari 𝑢𝑗 pada himpunan fuzzy 𝐴𝑖.
5. Fuzzifikasi
Fuzzifikasi merupakan proses yang bertujuan untuk mengubah bilangan tegas pada data sampel untuk dijadikan dalam bentuk bilangan fuzzy (Wijaya, et al., 2018). Data yang sudah berbentuk bilangan fuzzy akan dihitung derajat keanggotaannya. Misal: {A(t)}, {B(t)}, {C(t)}, dan {D(t)}
t = 1, 2, 3, ..., n, yang merupakan faktor time series yang mempengaruhi.
n = Jumlah data
6. Membentuk FLR (Fuzzy Logic Relationship) Untuk membentuk fuzzy time series, maka melakukan pemilihan data pelatihan sejumlah n periode. Misalnya ketika ingin melakukan peramalan dengan order 3, maka digunakan data untuk 3 periode sebelum t (waktu yang ingin diramal) adalah t-3, t-2, hingga t-1 dimana t = 4, 5, ..., n. Hasil FLR ditunjukkan melalui Persamaan 7.
(𝐴(𝑡−3,𝑖3), 𝐵(𝑡−3,𝑗3),𝐶(𝑡−3,𝑝3), 𝐷(𝑡−3,𝑞3)),
(𝐴(𝑡−2,𝑖2), 𝐵(𝑡−2,𝑗2),𝐶(𝑡−2,𝑝2), 𝐷(𝑡−2,𝑞2)),
(𝐴(𝑡−1,𝑖1), 𝐵(𝑡−1,𝑗1),𝐶(𝑡−1,𝑝1), 𝐷(𝑡−1,𝑞1)) →
𝐴(𝑡,𝑖4) (7)
7. Defuzzifikasi
Defuzzifikasi merupakan kebalikan dari tahap fuzzifikasi. Defuzzifikasi ialah proses pemetaan bilangan dari himpunan fuzzy ke dalam bentuk bilangan real atau bilangan tegas (Abadi, 2005). Melakukan pencocokan untuk mengetahui kecocokan FLR data latih dengan FLR data uji. Hasil dari nilai selisih
antecedent factor antara kedua FLR tersebut
harus mendapatkan nilai yang lebih kecil dari nilai threshold yang telah ditentukan untuk memperoleh kecocokan. Antecedent factor merupakan faktor yang terletak di sebelah kiri FLR. Setelah mendapat FLR data latih yang cocok, maka data dikelompokkan berdasarkan nilai fuzzifikasinya. Metode
centroid digunakan dalam perhitungan
defuzzifikasi. Rumus untuk menghitung tahap defuzzifikasi ditunjukkan melalui Persamaan 8.
𝑟𝐻 =
∑𝑘1𝑖=1𝑐𝑖 𝑥 𝑓𝑖
∑𝑘𝑖𝑖=1𝑓𝑖 (8)
Keterangan:
𝑟𝐻 = hasil peramalan data ke-H 𝑐𝑖 = pusat cluster i
𝑓𝑖 = frekuensi munculnya 𝐴(∗,1) (nilai fuzzifikasi) pada proses pencocokkan. 2.4. Perhitungan Performa dengan AFER
Average Forecasting Error Rate atau
disebut AFER yaitu salah satu metode yang digunakan untuk menghitung performa peramalan. Nilai AFER dinyatakan dalam bentuk persentase selisih antara data hasil peramalan dengan data aktual (Anwary, 2011). Ketika nilai AFER mendekati 0 atau semakin kecil, maka peramalan yang dilakukan semakin mendekati dengan kebenaran. Rumus yang digunakan untuk menghitung AFER (Nugraha, et al., 2017) melalui Persamaan 9.
AFER = ∑ |𝑋𝑎− 𝐹𝑎| 𝑋𝑎 𝑛 𝑎=1 𝑛 (100%) (9) Keterangan:
𝑋𝑎 = Data aktual ke-a
𝐹𝑎 = Data hasil peramalan ke-a n = Jumlah data uji
Fakultas Ilmu Komputer, Universitas Brawijaya 100% merupakan nilai yang digunakan untuk menghasilkan persentase.
3. METODOLOGI PENELITIAN
Melakukan implementasi untuk peramalan hasil panen kelapa sawit dengan metode
Multifactors High Order Fuzzy Time Series
(MHOFTS) dan K-Means Clustering merupakan permasalahan dalam penelitian ini. K-Means
Clustering digunakan untuk melakukan optimasi
pada pembentukan subinterval. Langkah-langkah dalam melakukan penelitian ini ialah menentukan tipe dari penelitian yang dilakukan, strategi penelitian, partisipan yang membantu jalannya penelitian, lokasi dilaksanakannya penelitian, teknik untuk pengumpulan data, teknik analisis data, dan implementasi algoritme. 4. PERANCANGAN
4.1. Perancangan Algoritme
Pada penelitian peramalan ini menggunakan metode berupa MHOFTS dan
K-Means Clustering yang digambarkan melalui
Gambar 1.
Gambar 1. Diagram Alir Algoritme
Berikut langkah-langkah pada algoritme yang digunakan:
1. Perhitungan Universe of Discourse
Penentuan nilai U diperoleh dari nilai terendah dan tertinggi data yang ditambah atau dikurangi dengan standar deviasi. Sebelumnya dilakukan perhitungan nilai mean dan standar deviasi. Perhitungan nilai U ini menggunakan Persamaan 3, 4, dan 5.
2. Penentuan jumlah cluster
Jumlah cluster ditentukan secara random sebagai masukan dalam penelitian ini. Penentuan jumlah cluster sebanyak faktor yang digunakan.
3. Pembentukan subinterval
Pada pembentukan subinterval, digunakan
K-Means Clustering sebagai optimasinya. Metode
tersebut digunakan untuk mendapatkan nilai subinterval yang optimal. K-Means Clustering dilakukan dengan menggunakan Persamaan 1 dan 2. Setelah mendapatkan pusat cluster, maka ditentukan subinterval berdasarkan nilai Dmin,
Dmax dan pusat cluster yang diperoleh.
4. Pembentukan Fuzzy Set
Setelah penentuan subinterval, maka dibentuk Fuzzy set. Fuzzy set dilambangkan dengan Ai (i = 1, 2, 3, ..., n). Himpunan fuzzy
dibentuk dengan Persamaan 6. 5. Fuzzifikasi
Tahapan fuzzifikasi akan mengubah dari data
crisp menjadi data fuzzy. Langkah yang bisa
dilakukan ialah melakukan perhitungan untuk mengetahui derajat keanggotaan dari setiap data ke dalam himpunan fuzzy. Pada penelitian ini penentuan derajat keanggotaan menggunakan grafik fungsi bahu. Dengan menggunakan derajat keanggotaan tertinggi, maka dihasilkan nilai fuzzifikasi pada data tersebut.
6. Pembentukan FLR (Fuzzy Logic Relationship)
Terbentuknya FLR berdasarkan jumlah order yang telah ditentukan. Dengan menggunakan data hasil fuzzifikasi, maka didapatkan nilai
antecedent factor dan nilai secedent factor. Antecedent factor merupakan hasil fuzzifikasi
dari faktor yang digunakan dan terletak di ruas kiri, sementara secedent factor merupakan hasil fuzzifikasi faktor utama yang akan diramalkan.
Fakultas Ilmu Komputer, Universitas Brawijaya FLR dengan order 3 terdapat pada Persamaan 7. 7. Defuzzifikasi
Proses defuzzifikasi merupakan proses kebalikan dari fuzzifikasi yang mana pada defuzzifikasi dilakukan pengembalian data fuzzy ke dalam bentuk data crisp yang merupakan hasil peramalan. Terdapat nilai threshold yang digunakan sebagai batasan dalam menentukan kecocokan FLR data latih dan data uji. Frekuensi atau jumlah kecocokan terhadap FLR data latih akan digunakan pada proses perhitungan Defuzzifikasi sesuai Persamaan 8.
5. HASIL DAN PEMBAHASAN 5.1. Pengujian Jumlah Cluster
Tujuan dari pengujian ini ialah untuk mendapatkan nilai cluster optimal dalam pembentukan subinterval dengan K-Means
Clustering. Selain untuk membentuk subinterval, pusat cluster dari faktor hasil panen juga digunakan dalam proses
defuzzifikasi.
Dalam pembentukan pusat cluster yang sesuai, terjadi penyusutan jumlah cluster dikarenakan terdapat satu atau lebih cluster yang kosong. Beberapa parameter lainnya yang digunakan pada pengujian ini ialah jumlah data uji 63, jumlah order 8, jumlah data latih 107, dan nilaithreshold 6.
Gambar 2. Grafik pengujian jumlah cluster Dari hasil pengujian berdasarkan Gambar 2 dapat disimpulkan bahwa jumlah cluster yang semakin banyak, maka terjadi peningkatan pula pada nilai AFER. Namun dari penentuan jumlah
cluster ini dapat berdampak pada proses
penentuan batas subinterval yang digunakan, penentuan fuzzifikasi hingga proses defuzzifikasi. Ketika jumlah cluster yang bertambah banyak, maka memberikan dampak pada jumlah interval yang terbentuk dan tingginya nilai selisih yang diperoleh saat defuzzifikasi.
5.2. Pengujian Jumlah Order
Dilakukan pengujian jumlah order guna mengetahui nilai order yang optimal pada peramalan ini. Jumlah urutan data yang digunakan pada tahapan FLR disebut dengan
order. Dari nilai AFER yang dihasilkan pada
pengujian ini, dapat diketahui nilai order yang optimal. Di dalam pengujian ini, beberapa parameter yang bernilai tetap yaitu jumlah data uji 63, jumlah cluster 8, jumlah data latih 107, dan nilai threshold 6.
Gambar 3. Grafik pengujian jumlah order Grafik hasil pengujian dari jumlah order pada Gambar 3 menjelaskan bahwa ketika jumlah order yang digunakan semakin banyak, maka hasil peramalan akan mempunyai nilai AFER menurun lalu mengalami kenaikan. Alasannya yaitu jumlah order yang meningkat mengakibatkan jumlah FLR yang dapat dibentuk semakin sedikit. Sehingga ketika jumlah FLR sedikit, maka semakin sedikit pula jumlah data latih yang dapat digunakan.
5.3. Pengujian Jumlah Data Latih
Jumlah data latih yang diuji digunakan untuk menentukan jumlah optimal data latih pada peramalan ini. Penentuan jumlah data latih dilakukan pada saat proses defuzzifikasi. Pada saat defuzzifikasi sudah terbentuk FLR sebanyak jumlah data yang dikurangi dengan jumlah
order, kemudian ditentukan jumlah data latih
yang diinginkan. Dalam pengujian ini menggunakan beberapa parameter tetap diantaranya yaitu jumlah data uji 63, jumlah
cluster 8, jumlah order 6, dan nilai threshold 6.
0 50 100 150 5 8 10 20 30 40 50 60 70 80 90 1 0 0 rat a-rat a AFE R Cluster 0 50 100 150 200 2 3 4 5 6 7 8 9 10 11 12 rat a-rat a AFE R Order
Fakultas Ilmu Komputer, Universitas Brawijaya
Gambar 4. Grafik pengujian jumlah data latih Grafik hasil pengujian pada Gambar 4 menjelaskan bahwa terjadi penurunan dan kenaikan nilai AFER seiring bertambahnya data latih. Ketika menggunakan data latih yang jumlahnya terlalu sedikit, maka data latih untuk proses pembelajaran juga kurang. Selain itu, pada kasus ini juga dipengaruhi dengan keadaan data yang tidak stabil atau mengalami perubahan yang drastis pada saat kenaikan atau penurunan. Faktor yang digunakan mempunyai nilai yang berbeda dan cukup besar pada setiap bulannya. Hal ini menyebabkan data uji sulit untuk mempelajari pola atau rule dari data latih yang digunakan.
5.4. Pengujian Nilai Threshold
Penentuan nilai threshold yang optimal pada peramalan ini diperoleh melalui pengujian nilai threshold. Threshold merupakan nilai ambang batas yang digunakan pada saat defuzzifikasi. Penggunaan nilai threshold yaitu pada saat pencocokan FLR data latih dengan data uji. Pengujian ini menggunakan parameter tetap misalnya jumlah data uji 63, jumlah cluster 8, jumlah order 6, dan jumlah data latih 107.
Gambar 5. Grafik pengujian nilai threshold Grafik hasil pengujian yang ditunjukkan melalui Gambar 5 menjelaskan jika semakin tinggi nilai threshold, maka banyak data yang seharusnya tidak memiliki kecocokan dengan data uji, namun masuk ke dalam range
threshold. Ketika menggunakan threshold yang
bernilai kecil, maka sulit untuk menemukan FLR
data latih yang memiliki kecocokan terhadap FLR data uji karena nilai selisih antecedent
factor keduanya tidak masuk range threshold.
Sebaliknya, ketika banyak FLR data latih dan FLR data uji yang mirip sehingga membuat selisih antara data latih dan data uji menjadi bernilai kurang dari threshold atau bahkan bernilai 0 dan membuat banyak kecocokan antara kedua FLR tersebut pada threshold yang besar.
5.5. Pengujian Sistem Terhadap Metode Tanpa Optimasi
Pengujian ini digunakan untuk mengetahui metode multifactors high order fuzzy time series memberikan hasil peramalan yang lebih baik ketika dioptimasi atau tidak dioptimasi dengan
K-Means Clustering. Parameter yang digunakan
pada metode dengan optimasi ialah nilai parameter terbaik dari hasil pengujian, sementara parameter yang digunakan oleh metode tanpa optimasi ialah parameter terbaik dari metode tanpa optimasi. Terdapat tiga perbandingan yang dilakukan yaitu pertama perbandingan antara metode optimasi K-Means dengan metode MHOFTS yang menggunakan masing-masing parameter terbaik keduanya. Berikut hasil perbandingan menggunakan parameter terbaik dengan nilai yang berbeda dengan ditunjukkan melalui Tabel 1.
Tabel 1. Tabel Perbandingan AFER dengan Nilai Parameter Terbaik dari Metode
Parameter MHOFTS – K-Means MHOFTS
Data Uji 63 63 Cluster 8 70 Order 6 2 Data Latih 107 107 Threshold 6 18 AFER 36,98 33,903
Dari Tabel 1 tersebut dapat dilakukan pengujian nilai parameter terbaik dari kedua metode. Hasil pengujian dari nilai parameter terbaik pada kedua metode ditunjukkan melalui Gambar 6 dan Gambar 7.
0 200 400 600 57 67 77 87 97 107 117 127 137 147 rat a-rat a AFE R DataLatih 0 100 200 300 3 6 9 12 15 18 21 24 27 30 rat a-rat a AFE R Threshold
Fakultas Ilmu Komputer, Universitas Brawijaya
Gambar 6. Grafik hasil pengujian nilai parameter terbaik MHOFTS – K-Means
Gambar 7. Grafik hasil pengujian nilai parameter terbaik MHOFTS
Dari hasil kedua grafik pada Gambar 6 dan Gambar 7, terlihat bentuk grafik yang berbeda dikarenakan indeks data uji yang berbeda. Hal ini disebabkan oleh jumlah order yang berbeda sehingga mempengaruhi panjang FLR. Selain itu, dapat disimpulkan bahwa metode optimasi ini memberikan hasil peramalan yang kurang baik dibandingkan dengan metode multifactors
high order fuzzy time series tanpa dilakukan
optimasi. Hal ini dikarenakan pembentukan jumlah cluster yang kurang bagus yang disebabkan adanya penghapusan jumlah cluster yang kosong sehingga nilai jumlah cluster tidak selalu tetap untuk masing-masing faktor. Namun, pada parameter terbaik metode MHOFTS terjadi kegagalan peramalan yang bernilai NaN pada tiga data uji sehingga bernilai 0.
Perbandingan yang kedua yaitu membandingkan kedua metode dengan menggunakan nilai parameter terbaik dari metode MHOFTS yang dioptimasi dengan
K-Means Clustering. Dengan menggunakan nilai
parameter yaitu data uji 63, jumlah cluster 8,
order 6, data latih 107, dan threshold 6, mampu
menghasilkan nilai AFER pada MHOFTS –
K-Means sebesar 36,98% dan pada MHOFTS
sebesar 222,383%. Hasil perbandingan ditampilkan ke dalam grafik pada Gambar 8.
Gambar 8. Grafik hasil perbandingan menggunakan nilai parameter terbaik dari MHOFTS - K-Means
Clustering
Dilihat pada Gambar 8 di atas, terdapat nilai minus pada hasil peramalan metode MHOFTS dikarenakan jumlah cluster yang terlalu sedikit tanpa adanya pengelompokkan cluster
sebelumnya. Selain itu, pada metode MHOFTS juga terdapat beberapa kegagalan peramalan sehingga hasil peramalan bernilai NaN atau 0.
Perbandingan yang ketiga yaitu membandingkan kedua metode dengan menggunakan nilai parameter terbaik dari metode MHOFTS. Dengan menggunakan nilai parameter yaitu data uji 63, jumlah cluster 70,
order 2, data latih 107, dan threshold 18 dapat
menghasilkan nilai AFER pada MHOFTS –
K-Means sebesar 33,657% dan pada metode
MHOFTS sebesar 33,903%. Hasil perbandingan ditampilkan dalam grafik pada Gambar 9.
Gambar 9. Grafik hasil perbandingan menggunakan nilai parameter terbaik dari MHOFTS Pada grafik Gambar 9 terlihat perbandingan menggunakan nilai parameter terbaik dari MHOFTS tanpa dilakukan optimasi. Hasil dari kedua metode tersebut terdapat beberapa kegagalan peramalan yang bernilai NaN atau 0. Metode optimasi K-Means Clustering dapat melakukan peramalan dengan baik pada
Fakultas Ilmu Komputer, Universitas Brawijaya parameter terbaik yang dihasilkan oleh metode MHOFTS. Namun, penghapusan yang terjadi pada jumlah cluster cukup besar.
Dari ketiga perbandingan di atas, maka optimasi (sistem) dapat menghasilkan nilai AFER terbaik ketika melakukan perbandingan dengan nilai parameter yang sama (parameter metode dengan K-Means Clustering dan metode tanpa K-Means Clustering). Namun metode dengan optimasi (sistem) akan memperoleh nilai AFER kurang baik ketika perbandingan yang pertama dengan membandingkan nilai parameter terbaik keduanya.
6. KESIMPULAN DAN SARAN
6.1. Kesimpulan
Hasil kesimpulan yang diperoleh berdasarkan penelitian ini ialah:
1. Jumlah cluster mempengruhi terbentuknya subinterval pada MHOFTS. Jumlah cluster optimal ialah 8 dengan nilai AFER sebesar 38,394% yang artinya bahwa dengan menggunakan cluster yang serjumlah 8 menghasilkan tingkat kesalahan peramalan pada sistem sebesar 38,394%.
2. Parameter order, data latih, dan threshold mempengaruhi proses MHOFTS pada pembentukan FLR hingga Defuzzifikasi. Hasil nilai parameter order, data latih, dan
threshold secara berurutan yaitu 6, 107, dan 6
dengan AFER 37,705%, 37,735%, dan 36,516%. Ketiga parameter mempengaruhi hasil peramalan sistem dengan tingkat kesalahan yang cukup tinggi dikarenakan data yang digunakan kurang bervariasi pada faktor umur tanam, luas lahan, dan populasi pokok.
3. Adanya 3 kali perbandingan untuk mengetahui parameter yang digunakan antara metode MHOFTS yang dioptimasi dengan MHOFTS tanpa optimasi. Ketika melakukan perbandingan menggunakan masing-masing parameter terbaik metode, maka menunjukkan hasil yang kurang baik pada MHOFTS yang dioptimasi sebesar 36,98% dibandingkan dengan MHOFTS tanpa optimasi sebesar 33.65%.
6.2. Saran
Beberapa saran yang dapat digunakan untuk penelitian selanjutnya berdasarkan hasil dari penelitian ini yaitu:
1. Melakukan pengujian cluster menggunakan metode lain seperti k-fold cross validation atau silhoutte coefficient untuk mendapatkan jumlah cluster dengan nilai AFER yang lebih baik.
2. Melakukan filterisasi pada data yang digunakan dengan metode ilmu statistika untuk menangani data pencilan (outlier). Misalnya metode cook’s distance, leverage
value, DFiTs, Boxplot, dan lainnya.
3. Menggunakan faktor lain yang memberikan pengaruh pada hasil panen kelapa sawit. Faktor tersebut di antaranya yaitu faktor genetik, faktor lingkungan, atau faktor teknik budidaya kelapa sawit.
4. Menggunakan metode optimasi yang lain untuk mendapatkan interval yang lebih baik, contohnya Algoritme Genetika.
7. DAFTAR PUSTAKA
Abadi, M., 2005. Pemodelan Tingkat Inflasi di Indonesia dengan Menggunakan Sistem Fuzzy.
Jurnal Ekonomi dan Pendidikan , Volume 2 No
2, pp. 113-121.
Alfina, T., Santosa, B. & Barakbah, A. R., 2012. Analisa Perbandingan Metode Hierarchical Clustering, K-Means dan Gabungan Keduanya dalam Cluster Data (Studi Kasus: Problem Kerja Praktek Teknik Industri ITS). Jurnal Teknik ITS, Volume 1 No 1.
Anggodo, Y. P. et al., 2017. Hybrid K-means Dan Particle Swarm Optimization Untuk Clustering Nasabah Kredit. Jurnal Teknologi
Informasi Dan Ilmu Komputer, Volume 4 No. 2,
pp. 104-110.
Anwary, A. A., 2011. Prediksi Kurs Rupiah
Terhadap Dollar Amerika Menggunakan Metode Fuzzy Time Series, Semarang: Universitas Diponegoro.
Azmiyati, S. & Tanjung, W. N., 2016. Peramalan Jumlah Tandan Buah Segar (Tbs) Kelapa Sawit dengan Metode Fuzzy Time Series Chen dan Algoritma Ruey Chyn Tsur (Studi
Fakultas Ilmu Komputer, Universitas Brawijaya Kasus Pada PT. Xyz). Jurnal PASTI, Volume VIII No. 1, pp. 36-48.
Jilani, T. A., Burney, S. M. A. & Ardil, C., 2008. Multivariate High Order Fuzzy Time Series Forecasting For Car Road Accidents.
International Journal of Computer and Information Engineering, Volume 2 No. 6, pp.
2038-2043.
Lee, L.-W., Wang, L.-H., Chen, S.-M. & Leu, Y.-H., 2006. Handling Forecasting Problems Based on Two-Factors High-Order Fuzzy Time Series. IEEE TRANSACTIONS ON FUZZY
SYSTEMS, Volume 14 No. 3, pp. 468-477.
Lin, Y. & Yang, Y., 2009. Stock Markets Forecasting Based on Fuzzy Time Series Model.
IEEE Conference Publication, pp. 782-886.
Murjoko, 2017. Analisis Kinerja Ekspor 5
Komoditas Perkebunan Unggulan Indonesia Tahun 2012-2016. Yogyakarta, THE 5TH
URECOL PROCEEDING.
Nugraha, T., Furqon, M. T. & Adikara, P. P., 2017. Peramalan Permintaan Daging Sapi Nasional Menggunakan Metode Multifactors High Order Fuzzy Time Series Model. Jurnal
Pengembangan Teknologi Informasi dan Ilmu Komputer, Volume 1 No 12, pp. 1764-1770.
Oyelade, O. J., Oladipupo, O. O. & Obagbuwa, I. C., 2010. Application of k-Means Clustering algorithm for prediction of Students’ Academic Performance. International Journal of Computer
Science and Information Security, Volume 7 No.
1, pp. 292-295.
Putri, N., Santoso, E. & Adinugroho, S., 2017. Prediksi Volume Impor Beras Nasional dengan Metode Multi-Factors High-Order Fuzzy Time Series. Jurnal Pengembangan Pengembangan
Teknologi Informasi dan Ilmu Komputer,
Volume 1 No 12, pp. 1771-1778.
Sinaga, D. M. & Hendarto, M., 2012. Analisis Kebijakan Pengelolaan Perkebunan Kelapa Sawit di Provinsi Sumatra Utara. Diponegoro
Journal of Economics, Volume 1 No. 2, pp.
1-13.
Sinaga, R. F. P., Setiawan, B. D. & Marji, 2018. Peramalan Produksi Kelapa Sawit
Menggunakan Jaringan Syaraf Tiruan Dengan Metode Backpropagation (Studi Kasus PT.Sandabi Indah Lestari). Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, Volume 2 No. 11, pp. 4613-4620.
Sudono, I., Utaminingsih, W. & Lestari, S., 2013. Pengelompokkan Produksi Padi Nasional dengan Pendekatan Data Mining Konsep K-Means. Jurnal Irigasi, Volume 8, pp. 72-89. Wijaya, A. B., Dewi, C. & Rahayudi, B., 2018. Peramalan Curah Hujan Menggunakan Metode High Order Fuzzy Time Series Multi Factors.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, Volume 2 No. 3, pp. 930-939.
Zhang, Z. & Zhu, Q., 2012. Fuzzy Time Series Forecasting Based On K-Means Clustering.