• Tidak ada hasil yang ditemukan

Jumlah semua band sebanyak 126 band.

Setelah dilakukan tahap pra-proses yang dilakukan oleh Piantari (2011), yaitu dengan menghilangkan band berupa derauserta adanya

water absorption, menghasilkan band yang efektif digunakan sebanyak 109 band. Water absorption merupakan salah satu faktor yang mempengaruhi data hasil dari teknik penginderaan jauh, khususnya hyperspectral imaging.

Atmosfer yang mengelilingi bumi terdiri dari gas berupa uap air dan berbagai gas

8 lainnya. Hal ini berpengaruh, ketika sensor

hyperspectral mengirimkan transmisi gelombang elektromagnetik ke objek di bumi, maka pada rentang tertentu terdapat gelombang atau band yang terganggu oleh gas tersebut, sehingga gelombang elektromagnetik tersebut tidak sampai ke objek di bumi. Akan tetapi, gelombang tersebut diserap oleh uap air di atmosfer. Keadaan ini disebut dengan water absorption. Berdasarkan Lau (2004), terdapat beberapa gas yang menyerap radiasi dan menyebabkan noise pada data hymap (Tabel 2). Tabel 2 Penyerapan gas di atmosfer

Gas Absportion (μm) H2O 0.94, 1.14, 1.38, 1.88 (Gao et al. 1993) 0.69, 0.72, 0.76 (Aspinall et al. 2002) O2 0.76, 0.6-1.3 (Gao et al. 1993) CO2 2.01, 2.08 (Gao et al. 1993) 1.6, 2.005, 2.055 (Aspinall et al. 2002) O3 0.6 (Gao et al. 1993) 0.35, 9.6 (Aspinall et al. 2002) N2O 2.0-2.5 CO 2.0-2.5 CH4 2.35 (Gao et al. 1993)

Band derau dan water absorption berada pada panjang gelombang antara 1359-1460 nm, 1774-1970 nm dan 2420-2500 nm. Jumlah data

hymap disesuaikan dengan jumlah data yield

aktual, sehingga dihasilkan sebanyak 34 data. Bootstrapping (8-fold)

Keakuratan model suatu prediksi dilihat dari seberapa besar error yang dihasilkan antara nilai prediksi dan nilai aktual. Semakin kecil atau error mendekati nilai 0, maka keakuratan suatu model prediksi dapat dikatakan baik. Contoh pembagian dataset dapat dilihat pada Lampiran 3.

Teknik ini menghasilkan dataset model yang terbaik dengan memilih nilai error

terkecil, berdasarkan root mean square error

(RMSE). Jumlah resampling data yang digunakan sebanyak 8 dataset. Setiap dataset

terdiri dari data training dan data testing. Contoh bootstrapping (8-fold) pada data dengan 109 band pada Tabel 3.

Tabel 3 Hasil dataset8-fold train-test

Dataset RMSE R2 1 1.027 0.168 2 1.722 0.184 3 1.161 0.499 4 1.336 0.861 5 0.326 0.97 6 0.966 0.046 7 1.762 0.167 8 1.175 0.046

Berdasarkan tabel tersebut, dataset ke-5 merupakan dataset yang memiliki nilai RMSE terkecil sebesar 0.326 dengan nilai korelasi R2 sebesar 0.97 mendekati nilai 1, berarti terdapat korelasi yang hampir sempurna. Oleh karena itu, dataset tersebut yang akan digunakan untuk proses selanjutnya. Gambar 8 menampilkan sebaran nilai yield aktual dan yield prediksi untuk data testing.

Gambar 8 Grafik sebaran yield terbaik. Implementasi RFE-SVR

Penggunaan Recursive Feature Elimination -Support Vector Machine (RFE-SVR) pada data

hyperspectral melibatkan beberapa parameter, seperti γ (GammaԐ, toleransi epsilon, serta koefisien penalti C. Selain ketiga parameter tersebut, terdapat beberapa kernel yang dipakai, yaitu kernel linear, kernel polinomial, kernel radial basis function (RBF) dan kernel sigmoid. Parameter (Gamma), epsilon, C

Penentuan parameter epsilon digunakan sebagai toleransi akurasi terhadap data training. Konstanta C menentukan trade off antara ketipisan fungsi f pada SVR. Pemilihan nilai parameter tersebut berpengaruh terhadap model dari SVR yang akan dipakai. Model SVR yang baik adalah model dengan nilai error terkecil dan nilai determinasi R2 yang mendekati satu.

RMSE = 0.336 R2 = 0.97

9 Penelitian ini mencoba beberapa

penggunaan parameter tersebut sampai dihasilkan model terbaik. Suatu model dikatakan baik apabila data pelatihan yang di

training serta testing menggunakan data yang sama dengan training memiliki nilai error

mendekati nilai 0 dan koefisien determinasi R2 mendekati nilai satu.

Nilai epsilon yang semakin kecil, maka toleransi error yang dibatasi kecil juga. Sebaliknya, nilai epsilon yang besar, maka toleransi error yang dibatasi besar pula. Pemilihan epsilon dilakukan dengan metode

trial and error. Nilai epsilon tidak terlalu berpengaruh terhadap model yang dihasilkan. Hasil percobaan penggunaan beberapa parameter epsilon dapat dilihat pada Gambar 9.

Gambar 9 Perbandingan epsilon. Grafik tersebut memperlihatkan penggunaan beberapa epsilon yang dilihat berdasarkan nilai RMSE. Pemilihan epsilon mempertimbangkan koefisien determinasi R2 juga. Nilai epsilon yang baik yaitu epsilon ( Ԑ < 1. Epsilon yang digunakan yaitu 0.07. Hasil selengkapnya dapat dilihat pada Lampiran 4.

Percobaan yang sama dilakukan terhadap koefisien C dan parameter gamma ( ). Hasil untuk koefisien C pada Gambar 10a. Hasil dengan error minimum terdapat pada koefisien C sebesar 27- 210 (128-1024). Kemudian dilakukan pencarian ulang antara rentang tersebut dan didapatkan hasil pada Gambar 10b. Berdasarkan grafik tersebut dapat dilihat nilai C yang besar menghasilkan error yang kecil. Akan tetapi, tidak terlalu banyak perubahan nilai error-nya. Koefisien C yang ditetapkan yaitu sebesar 210.5 (1448.2).

Hal penting dalam Support Vector Regression yaitu memaksimumkan margin pada prediksi data. Nilai C yang terlalu besar tidak memperhatikan perubahan maksimum margin, sehingga C yang terlalu besar menghasilkan nilai error yang konstan. Sedangkan, nilai C

yang terlalu kecil terlalu memperhatikan nilai penalti dalam SVR.

Gambar 10 Perbandingan koefisien C. Parameter gamma ɣ digunakan dalam pembentukan kernel radial basis function

(RBF) dan kernel sigmoid pada pemetaan data dari dimensi yang rendah ke dimensi yang lebih tinggi. Hasil pemilihan gamma pada rentang 2-7- 24 dapat dilihat pada Gambar 11a. Grafik 11a memperlihatkan gamma dengan error kecil pada rentang 23– 24 (8-16), sehingga dilakukan pemilihan rentang yang lebih kecil lagi. Kurva pada Gambar 11b berhimpit antara perhitungan menggunakan beberapa gamma. Akan tetapi, nilai gamma lebih dari 12.34 dengan nilai C mulai dari 128 menghasilkan nilai yang sama. Oleh karena itu, gamma yang dipilih sebesar 11.31. Perhitungan hasil selengkapanya dapat dilihat pada Lampiran 5.

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 C=8 C=128 C=1024 R M S E 0.001 0.01 0.07 1 = 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.01 0.03 0.13 0.50 2.00 8.00 16.00 R M S E Gamma ɣ (a) 2 8 128 512 1024 C = 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.01 0.03 0.13 0.50 2.00 8.00 16.00 R M S E Gamma ɣ (b) 181.02 256 362.04 512 724.08 1448.2 C =

10 Gambar 11 Perbandingan parameter gamma.

Penggunaan Kernel

Kernel yang digunakan dalam RFE-SVR menentukan keakuratan pembuatan model suatu prediksi sehingga memperoleh error yang seminimum mungkin. Penggunaan kernel

bertujuan untuk memetakan data ke dimensi yang lebih tinggi supaya dapat dipisahkan secara linear. Oleh karena itu, perhitungan dengan beberapa kernel digunakan untuk memperoleh kernel yang cocok terhadap data

hyperspectral ini. a Kernel Linear

Kernel linear merupakan kernel yang paling sederhana. Perhitungan kernel tidak melibatkan parameter gamma. Oleh karena itu, hanya digunakan koefisien epsilon � dan penalti C dalam proses SVR. Hasil pengurangan band

terhadap error menggunakan kernel ini dapat dilihat pada Gambar 12.

Gambar 12 Perbandingan jumlah band terhadap

error dan weightkernel linear. Penggunaan kernel linear tidak cocok dengan seleksi fitur RFE. Hal ini terbukti pada saat pengurangan fitur dari 109 band sampai satu band, error yang dihasilkan tidak menurun, tetapi berlaku sebaliknya. Akan tetapi, pengurangan band terhadap weight berlaku sesuai teori, ketika jumlah band berkurang, maka nilai weight meningkat. Hal ini dikarenakan, fitur yang dibuang adalah fitur yang memiliki w minimum. Nilai RMSE semua

band yaitu sebesar 0.5666 dengan R2 sebesar 0.5022, sedangkan pada akhir iterasi satu band

menghasilkan RMSE yang lebih besar yaitu 0.7901 dengan R2 yang jauh lebih kecil yaitu 0.0551. Nilai error ini secara kenyataan di lapangan berpengaruh sebesar 0.5666 ton yield

per hektar. Gambar 13 menunjukkan sebaran nilai yield prediksi terhadap nilai yield aktual pada kernel linear. Sesuai dengan nilai R2 yang diperoleh, sebaran tidak berkumpul ke garis linear, masih terdapat data pencilan yang tidak dapat diprediksi dengan baik.

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 R M S E Koefisien C (a) 0.125 0.5 2 8 16 ɣ= 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.125 0.5 2 8 32 128 512 1024 R M S E Koefisien C (b) 8.72 9.51 10.37 11.31 12.34 13.45 ɣ=

11 Gambar 13 Sebaran prediksi yieldkernel linear.

b Kernel Sigmoid

Pengujian menggunakan kernel sigmoid memerlukan koefisien C dan parameter pada pemetaan input space ke feature space. Penggunaan kernel sigmoid sama dengan kernel

linear, tidak menghasilkan pengurangan band. Nilai RMSE tidak berkurang seiring dengan naiknya weight pada perhitungan RFE (Gambar 14).

Gambar 14 Perbandingan jumlah band terhadap

error dan weightkernel sigmoid. Nilai RMSE saat 109 band yaitu sebesar 0.7958 yang berarti secara riil di lapangan terdapat perbedaan sebanyak 0.7958 ton/ha, dengan R2 yang kecil sebesar 0.0239. Nilai RMSE yang seharusnya turun, saat iterasi terakhir diperoleh hasil yang sebaliknya dengan nilai RMSE = 79.7637 atau setara 79.7637 ton/ha dan R2 = 0.038. Gambar 15 merupakan

sebaran prediksi yield terhadap nilai yield aktual dengan R2 yang sangat kecil. Hasil prediksi menggunakan kernel sigmoid tidak menunjukkan adanya keterkaitan antara yield

prediksi dan yield aktual, sehingga error yang dihasilkan cukup besar.

Gambar 15 Sebaran prediksi yield kernel

sigmoid.

c KernelRadial Basis Function

Pemetaan pada kernelRadial Basis Function

(RBF) membutuhkan parameter gamma . Parameter ini menentukan tebal atau tipisnya jarak antara support vector dengan hyperplane. Parameter yang telah dipilih, yaitu sebesar 11.31 dan C = 1448.2. Hasil menggunakan

kernel RBF terdapat pengurangan band

sebanyak 39 band (Gambar 16).

Metode RFE-SVR dengan kernel ini mendapatkan band optimal sebanyak 70 band

dengan RMSE sebesar 0.0901 dan R2 sebesar 0.9874. Perubahan nilai RMSE berkurang seiring dengan berkurangnya jumlah band. Akan tetapi, pada saat pengurangan jumlah

band tertentu, nilai RMSE kembali meningkat. Hal ini mengindikasikan bahwa pada jumlah

band tersebut, band sudah tidak dapat dikurangi lagi. Penggunaan kernel RBF ini menghasilkan RMSE = 0.0901 yang berarti prediksi yield

setiap hektar di lapangan, terdapat kesalahan seberat 0.0901 ton.

RMSE = 0.5666 R2 = 0.5022

RMSE = 0.7958 R2 = 0.0239

12 Gambar 16 Perbandingan jumlah band terhadap

error dan weightkernel RBF. Sebaran nilai yield prediksi terhadap nilai

yield aktual pada kernel RBF dapat dilihat di Gambar 17. Berdasarkan nilai R2 yang mendekati angka 1, sebaran data berkumpul ke satu garis, meskipun ada beberapa data yang masih diluar garis, sehingga masih ada error

sebesar RMSE = 0.0901. Akan tetapi, sebaran prediksi yang diperoleh sudah cukup baik dari pemilihan kernel lainnya.

Gambar 17 Sebaran prediksi yieldkernel RBF. d Kernel Polinomial

Kernel polinomial yang digunakan yaitu berderajat tiga. Hasil training dengan 109 band

memperoleh nilai RMSE sebesar 0.3857 dan R2 sebesar 0.8014 (Gambar 18). Pengujian kernel

polinomial dengan RFE-SVR hanya berkurang 17 band sehinga hasil akhir yang tersisa sebanyak 92 band optimal dengan RMSE = 0.3055 dan R2 = 0.8754. RMSE sebesar 0.3055 setara dengan kesalahan seberat 0.3055 ton/ha di lapangan.

Gambar 18 Perbandingan jumlah band terhadap

error dan weightkernel Polinomial. Gambar 19 menunjukkan sebaran nilai prediksi yield terhadap nilai yield aktual. Data sebaran cukup baik karena data berkumpul di satu garis, meskipun ada beberapa data jauh dari kumpulan data lainnya karena data tersebut tidak dapat diprediksi dengan baik.

Gambar 19 Sebaran prediksi yield kernel

polinomial. Simpang Error

Selain menggunakan error RMSE, pengujian RFE-SVR pada data hyperspectral ini mencoba beberapa penerapan kaidah error

dalam tiga bentuk norm. Berdasarkan pengujian sebelumnya, kernel terbaik yang digunakan yaitu kernel RBF. Oleh karena itu, pengujian terhadap bentuk norm dilakukan pada kernel

RBF saja.

RMSE 0.0901

R2 = 0.9874

RMSE = 0.3857 R2 = 0.8754

13 Norm ini terdiri dari tiga bentuk yaitu norm-

1, norm-2, dan norm-∞. Hasil training dengan RFE-SVR dengan norm-1 memperoleh error = 2.7486 dan R2 = 0.9859 serta jumlah band

optimal sebanyak 87 band (Gambar 20).

Gambar 20 Perbandingan jumlah band dengan

error norm-1.

Sedangkan, hasil pengujian norm-∞ memperoleh 66 band dengan error = 0.3001 dan R2 = 0.9847 (Gambar 21). Perbandingan lebih lengkap antara semua kaidah norm dapat dilihat pada Tabel 4. Perbandingan menggunakan kaidah p-norm dengan hasil pengurangan band terbaik yaitu dengannorm-∞ karena pada bentuk norm ini, meminimalkan dari error maksimum, yaitu nilai maksimum dari selisih error antara data aktual dengan data prediksi. Selain itu, jumlah band yang diperoleh lebih kecil dengan nilai RMSE yang tidak jauh berbeda dengan bentuk norm lainnya.

Gambar 21 Perbandingan jumlah band dengan

error norm-∞.

Tabel 4 Perbandingan seleksi fitur menggunakan kaidah p-norm

Kaidah band error RMSE R2

Norm-1 87 2.7486 0.0959 0.9859 Norm-2 70 0.0901 0.0901 0.9874 Norm-∞ 66 0.3001 0.0984 0.9847 Konfigurasi band yang didapatkan dengan

kernel RBF dapat dilihat di Tabel 5. Angka 1 menunjukkan bahwa rentang band tersebut adalah band terbaik, sedangkan angka 0

menunjukkan band tersebut tidak terlalu berpengaruh terhadap model prediksi.

Tabel 5 Konfigurasi band terbaik

Band (nm) Konfigurasi band 459- 973 0011111111111111101001100001111111111 989- 1623 1100111000100001000111000100111111111 1648- 2396 10000000011011111001111111111111110

KESIMPULAN DAN SARAN Kesimpulan

Berdasarkan analisa dalam pembahasan, hasil penelitian ini dapat ditarik kesimpulan, yaitu

1 Penggunaan Recursive Feature Elimination-

Support Vector Machine (RFE-SVR) pada data hyperspectral mampu mengurangi band

sekitar 30% (dari 109 band menjadi 70

band) dengan hasil RMSE yang lebih kecil serta koefisien determinasi (R2) mendekati nilai satu dibandingkan dengan SVR tanpa seleksi fitur.

2 Kernel Radial Basis Function (RBF) merupakan kernel terbaik yang dipakai dalam RFE-SVR dengan nilai RMSE sebesar 0.0901 setara dengan nilai kesalahan seberat 0.0901 ton/ha di lapangan serta korelasi determinasi (R2) sebesar 0.98. 3 Bentuk norm-∞ merupakan bentuk norm

terbaik dengan pengurangan band sebanyak 43 band dari 109 band.

Saran

Beberapa hal yang dapat dilakukan berdasarkan penelitian ini yaitu

1 Penggunaan seleksi fitur lain yang dapat digabung dengan SVR, seperti Embedded Feature Selection (EFS).

2 Penggunaan data untuk proses klasifikasi pada fase tumbuh padi.

3 Penggunaan data yang lebih banyak untuk pembuatan model prediksi yang lebih baik.

DAFTAR PUSTAKA

Archibald R, Fann G. 2007. Feature selection and classification of hyperspectral images with support vector machine.

IEEE Geoscience and Remote Sensing Letters 4(4):674-677.

SELEKSI HYPERSPECTRAL BAND MENGGUNAKAN RECURSIVE

Dokumen terkait