BENTUK FUNGSI KEANGGOTAAN PADA MODEL REGRESI
DENGAN VARIABEL DEPENDEN FUZZY SIMETRIS
Iqbal Kharisudin
Jurusan Matematika FMIPA Universitas Negeri Semarang Email: [email protected]
Abstrak
Dalam tulisan ini dibahas suatu model regresi fuzzy dengan variabel dependen fuzzy simetris dan variabel independen tegas menggunakan pendekatan kuadrat terkecil. Ditunjukkan bahwa solusi model ini merupakan generalisasi dari model regresi biasa. Selanjutnya ditunjukkan bentuk solusi untuk beberapa jenis fungsi keanggotaan variabel dependen fuzzy simetris yang berbeda dan pengaruhnya terhadap model yang diperoleh.
Kata kunci: fungsi keanggotaan, variabel fuzzy simetris, solusi iteratif.
Pendahuluan
Analisis regresi linear dengan model fuzzy pertama kali diusulkan oleh Tanaka, dkk. [21] pada tahun 1982. Berdasarkan metode ini, koefisien regresi merupakan bilangan fuzzy yang dapat dinyatakan sebagai interval dengan fungsi keanggotaan. Perkembangan teori fuzzy pada analisis regresi sejak dikemukakan oleh Tanaka dkk. sangat pesat. Referensi yang cukup lengkap berkaitan dengan perkembangan metode regresi fuzzy diantaranya seperti Chang dan Ayyub [3] dan Shapiro [19]. Pendekatan lain yang juga banyak diteliti adalah kuadrat terkecil dalam analisis regresi fuzzy. Pendekatan ini telah banyak diteliti dalam dua dekade terakhir, di antaranya oleh Celmins [1], Diamond [8], Chang dan Lee [2], Ma dkk. [18], Wu [22].
Penalaran statistik dipengaruhi oleh beberapa jenis sumber ketidakpastian, seperti: keacakan, ketidaktepatan, ketidakjelasan, ketidaktahuan sebagian, dan sebagainya. Dalam konteks analisis regresi, terdapat beberapa aspek ketidakpastian yang sering diperhatikan, yaitu ketidakpastian berkaitan dengan: (1) hubungan antara variabel dependen dengan variabel independen, (2) hubungan antara data terobservasi dengan "semesta" data yang mungkin, dan (3) ketidakpastian nilai-nilai variabel terobservasi (Coppi [4]).
Dalam paradigma statistik tradisional, ketidakpastian (1) dan (2) telah banyak ditangani dengan sangat memuaskan. Untuk menjawab permasalahan ketidakpastian (3), telah banyak para peneliti yang mencoba mengusulkan berbagai metode sebagai alternatif.
I. Kharisudin, Jurusan Matematika FMIPA UNNES email: [email protected].
Seminar Nasional Statistika IX
Seiring dengan perkembangan penelitian, pada dekade terakhir, telah banyak penelitian yang berupaya mengembangkan koalisi antara teori himpunan fuzzy dan teori statistik. Tujuan yang hendak dicapai di antaranya adalah untuk: (1) memperkenalkan permasalahan analisis data baru berkaitan dengan ralasional fuzzy, (2) membangun model formal yang menggabungkan randomness dengan fuzziness, (3) mengembangkan metodologi statistik
univariate dan multivariate dalam menangani data bernilai fuzzy, dan (4) menyertakan
konsep fuzzy dalam membantu menyelesaikan permasalahan statistik tradisional dengan data non-fuzzy (Coppi dkk. [7]).
Dalam tulisan ini dibahas salah satu pendekatan kuadrat terkecil dalam analsis regresi fuzzy yang diusulkan oleh D'Urso dkk. Metode yang digunakan untuk menemukan model linear adalah meminimalkan fungsi jarak fuzzy antara variabel terobservasi dan variabel output yang didefinisikan dalam suatu ruang metrik tertentu. Tulisan yang membahas masalah ini di antaranya D'Urso dan Gastaldi [10], [11], Coppi dan D'Urso [5], D'Urso [9], D'Urso dan Giordani [12], D'Urso dan Giordani [13], Coppi dkk. [6], D'Urso dan Santoro [15], [14]. Dalam makalah ini dilakukan investigasi terhadap beberapa jenis fungsi keanggotaan variabel dependen fuzzy simetris. Variabel ini menggambarkan data fuzzy yang dibedakan berdasarkan nilai , yaitu nilai yang merepresentasikan kekaburan data di sekitar nilai pusatnya. Akan diselidiki pengaruh perbedaan tingkat kekaburan terhadap bentuk solusi dan hasil estimasi model.
1. Beberapa Pengertian dalam Konsep Fuzzy
Teori himpunan fuzzy didasarkan pada logika multi nilai sehingga fungsi karakteristiknya memetakan nilai-nilai kedalam suatu range tertentu yang menunjukkan derajat keanggotaan setiap anggota. Dalam konteks ini, fungsi karakteristik disebut dengan fungsi keanggotaan dan range adalah interval [0,1]. Fungsi keanggotaan memetakan setiap anggota himpunan fuzzy ke dalam derajat keanggotaan dari 0 sampai dengan 1, yaitu:
1.1. Bilangan Fuzzy. Bilangan fuzzy didefinisikan berdasarkan konsep himpunan fuzzy. Bilangan fuzzy dapat didefinisikan secara umum dengan menggunakan konsep himpunan fuzzy normal dan konveks maupun secara khusus dengan menggunakan fungsi keanggotaan.
Definisi 1.1.1. (Taheri [20], Giachetti dan Young [16]). Bilangan fuzzy adalah himpunan fuzzy normal dan konveks pada garis real yang memenuhi (i) terdapat tepat satu dengan dan (ii) bersifat upper semi-continuous.
Definisi 1.1.2. (Zimmermann [24]). Misalkan L (dan R) adalah fungsi berbentuk turun dari
ke dengan ; untuk setiap ; untuk setiap ;
atau ( untuk setiap dan ). disebut bilangan fuzzy jika untuk dalam , fungsi keanggotaan didefinisikan
dimana disebut nilai mean dari dan dan masing-masing disebut tepi (spread) kiri dan tepi kanan. Bilangan fuzzy dinyatakan dengan
1.2. Jarak dan Ruang Metrik Bilangan Fuzzy. Pada bagian ini dikemukakan definisi jarak antara dua bilangan fuzzy simetris dan sifat ruang metrik berdasarkan definisi jarak tersebut. Misalkan menyatakan himpunan semua bilangan fuzzy simetris.
Definisi 1.2.1. (Yang dan Ko [23]). Misalkan dan
adalah bilangan fuzzy di dalam Jarak antara dua bilangan fuzzy dan didefinisikan dengan
dengan dan .
Nilai dan menyatakan pengaruh bentuk dari fungsi keanggotaan terhadap jarak antara dua bilangan fuzzy. Nilai dan memiliki peran ganda, yaitu berhubungan dengan variabilitas fungsi keanggotaan dan menurunkan penekanan pada tepi, karena pada kenyataannya bobot pusat lebih besar daripada bobot tepi. Selanjutnya pada definisi 1.2.1, jika kedua bilangan adalah bilangan fuzzy simetris ( , , dan
), maka diperoleh jarak antara dua bilangan fuzzy simetris dan , yaitu:
2. Model Regresi Fuzzy dengan Variabel Dependen Fuzzy Simetris
Ide dasar analisis regresi fuzzy yang dikembangkan adalah memodelkan pusat (center) dari variabel dependen fuzzy simetris dengan mengadopsi model regresi klasik, selanjutnya secara simultan memodelkan tepi variabel dependen fuzzy melalui regresi linear sederhana. Hubungan antara (variabel dependen fuzzy simetris) dengan
(variabel independen tegas) dinyatakan dengan model ([15],[10]):
dengan dan (2.0.1)
dimana adalah vektor 1-an berukuran , matriks berukuran berisi vektor dan variabel input ; , masing-masing adalah vektor pusat terobservasi dan vektor pusat interpolasi berukuran ; , masing-masing adalah vektor tepi terobservasi dan vektor tepi interpolasi berukuran ; vektor koefisien/parameter regresi untuk berukuran ; b dan d koefisien/parameter regresi untuk model tepi; serta , adalah vektor residual.
Model regresi tersebut di bangun atas tiga model linear. Pertama interpolasi pusat dari observasi fuzzy, kedua dan ketiga adalah model untuk batas bawah (pusat – tepi) dan model untuk batas atas (pusat + tepi) yang dibangun berdasarkan model pertama. Dalam kasus variabel output adalah simetris, maka tepi kiri sama dengan tepi kanan, sehingga model kedua dan model ketiga mempunyai estimasi tepi yang sama.
2.1. Optimasi Fungsi Objektif. Berdasarkan kriteria kuadrat terkecil, parameter dari model (2.0.1) diestimasi dengan meminimalkan kuadrat jarak antara variabel dependen terobservasi dengan nilai teoritis yang berkorespondensi yang didefinisikan melalui model (2.0.1). Untuk tujuan ini, digunakan konsep jarak Euclid untuk bilangan fuzzy (seperti pada definisi 1.2.1), yaitu:
Nilai parameter berkaitan dengan bentuk fungsi dari jenis variabel fuzzy. Berdasarkan jenis fungsi keanggotaan bilangan fuzzy simetris, nilai pada dasarnya merupakan penyesuaian tepi kiri dan tepi kanan pada saat perhitungan batas bawah dan batas atas bilangan fuzzy , . Pada persamaan (2.1) menyatakan bobot
yang berbeda antara pusat dengan tepi (kiri maupun kanan). Dalam estimasi parameter regresi, nilai didefinisikan secara subjektif sesuai dengan bobot pusat dan tepi variabel fuzzy dengan memperhatikan bentuk spesifik dari fungsi keanggotaan yang memberikan karakter setiap datum fuzzy. Secara umum bobot tersebut selalu kurang dari satu, dengan alasan bahwa bobot untuk tepi selalu kurang dari bobot untuk pusat variabel fuzzy.
Berdasarkan model (2.0.1), basis jarak (2.1) dapat ditulis menjadi
Dengan demikian fungsi objektif kuadrat terkecil menjadi
(2.1.1)
2.2. Solusi Kuadrat Terkecil Iteratif. Untuk menentukan solusi masalah (2.1.1), dicari turunan parsial terhadap parameter a, b, dan d untuk nilai sama dengan nol, sehingga diperoleh sistem persamaan sebagai berikut.
(2.2.1)
(2.2.2)
(2.2.3)
Solusi iteratif dari sistem persamaan di atas diperoleh dengan mengasumsikan bahwa X mempunyai rank penuh. Prosedur optimisasi dengan menggunakan algoritma iteratif berdasarkan persamaan (2.2.1) - (2.2.3) tidak dijamin diperolehnya minimum global, hanya minimum lokal saja. Dengan demikian, sangat disarankan untuk menggunakan algoitma iterasi dengan beberapa nilai awal untuk mengetahui stabilitas solusi ([15], [6]).
Selanjutnya dapat dilihat bahwa pada kasus variabel dependen tegas (crisp) yaitu dan maka estimasi yang termuat dalam (2.2.1) akan menghasilkan solusi kuadrat terkecil biasa yaitu . Dengan demikian model dan solusi pada sistem persamaan di atas merupakan generalisasi dari model regresi linear klasik, jika variabel dependen memuat ketidakpastian.
3. Solusi Iteratif pada Variabel Fuzzy Simetris Khusus
Dalam bagian ini dibahas bentuk-bentuk solusi kuadrat terkecil iteratif pada model regresi fuzzy dengan varaibel dependen fuzzy simetris khusus. Variabel fuzzy simetris dinyatakan dengan , dengan menyatakan pusat dan menyatakan tepi kiri dan tepi kanan (tepinya simetris) dengan fungsi keanggotaan sebagai berikut.
dengan adalah fungsi dari ke dengan ; untuk setiap ;
untuk setiap ; ( atau untuk setiap dan ).
Bentuk khusus variabel fuzzy simetris seperti
Berdasarkan fungsi
keanggotaan tersebut, dapat didefinisikan beberapa jenis topologi dari variabel fuzzy simetris, yaitu variabel fuzzy dengan fungsi keanggotaan segitiga simetris, normal, parabolik, dan akar kuadrat. Setiap jenis fungsi keanggotaan tersebut menyebabkan perbedaan tingkat ketidakpastian di sekitar pusat variabel fuzzy yang bersangkutan. Gambar 1 menyatakan representasi geometris dari beberapa jenis variabel fuzzy di atas.
Gambar 1. Fungsi keanggotaan beberapa jenis variabel fuzzy simetris
3.1. Fungsi Keanggotaan Segitiga Simetris. Fungsi keanggotaan bilangan (variabel) fuzzy segitiga simetris merupakan jenis fungsi keanggotaan yang paling umum digunakan dalam aplikasi teori fuzzy. Variabel fuzzy segitiga simetris dinyatakan dengan fungsi segitiga simetris, L, yang mempunyai bentuk untuk dan 0 untuk yang lain. Fungsi keanggotaan yang bersesuaian berbentuk untuk
dan 0 untuk yang lain. Dalam hal ini, diambil nilai , dengan untuk dan 0 untuk yang lain,
sehingga diperoleh
Dengan demikian diperoleh solusi iteratif model (2.0.1) yaitu bentuk khusus dari persamaan (2.2.1) s.d. (2.2.3) untuk fungsi keanggotaan segitiga:
(3.1.1) (3.1.2) : akar kuadrat : normal : segitiga : parabolik
(3.1.3) Sebagai catatan, bahwa (3.1.2) dan (3.1.3) sama dengan solusi iteratif yang bersesuaian dari model umum (2.2.2) dan (2.2.3) (juga pada kasus fungsi keanggotaan simetris lain). 3.2. Fungsi Keanggotaan Normal. Variabel fuzzy dikatakan sebagai variabel fuzzy normal (simetris) dinyatakan dengan (dengan menetapkan ) didefinisikan dengan fungsi keanggotaan berbentuk
Pada variabel fuzzy normal, diperoleh nilai . Dengan demikian diperoleh solusi iteratif model (2.0.1) dengan bentuk khusus persamaan (2.2.1) untuk fungsi keanggotaan normal yaitu:
(3.2.1) 3.3. Fungsi Keanggotaan Parabolik. Variabel fuzzy parabolik dinyatakan dengan fungsi L, yang mempunyai bentuk untuk dan 0 untuk yang lain.
Fungsi keanggotaan yang bersesuaian berbentuk untuk dan 0 untuk yang lain. Dalam hal ini, diambil nilai
, dengan , untuk dan 0 untuk yang lain,
sehingga diperoleh
Dengan demikian diperoleh solusi iteratif model (2.0.1) dengan bentuk khusus persamaan (2.2.1) untuk fungsi keanggotaan parabolik yaitu:
(3.3.1) 3.4. Fungsi Keanggotaan Akar Kuadrat. Variabel fuzzy akar kuadrat dinyatakan
dengan fungsi L, yang mempunyai bentuk , untuk dan 0 untuk
yang lain. Fungsi keanggotaan yang bersesuaian berbentuk , untuk
dan 0 untuk yang lain. Dalam hal ini, diambil nilai , dengan , untuk dan 0 untuk yang lain,
sehingga diperoleh
Dengan demikian diperoleh solusi iteratif model (2.0.1) dengan bentuk khusus persamaan (2.2.1) untuk fungsi keanggotaan akar kuadrat yaitu:
4. Hasil dan Pembahasan
Pada bagian ini, ditunjukkan hasil analisis regresi fuzzy untuk beberapa jenis fungsi keanggotaan dengan data simulasi. Dilakukan simulasi dengan 6 variabel independen masing-masing sebanyak 25 unit sampel dan untuk setiap unit dibangkitkan variabel dependen fuzzy, seperti dirangkum dalam tabel 1. Berdasarkan tabel 1 diharapkan variabel dependen fuzzy bergantung pada variabel independen dengan estimasi koefisien
, , dan
Diperhatikan model untuk beberapa fungsi keanggotaan variabel dependen fuzzy, yaitu
fungsi keanggotaan segitiga simetris , fungsi keanggotaan normal ,
fungsi keanggotaan parabolik , dan fungsi keanggotaan akar kuadrat .
Penentuan model dan seleksi variabel dilakukan dengan menggunakan kriteria koefisien determinasi dan indeks Mallows ([17]). Perhitungan dibuat dengan menggunakan program MATLAB.
Tabel 1. Pembangkitan data simulasi Variabel
independen tegas
Nilai diekstrak dari v.r. uniform pada interval [0,20] Nilai diekstrak dari v.r. uniform pada interval [30,55] Nilai diekstrak dari v.r. uniform pada interval [10,25]
Nilai diekstrak dari v.r. uniform pada interval [25,50] Nilai diekstrak dari v.r. uniform pada interval [40,60] Nilai diekstrak dari v.r. uniform pada interval [0,100] Catatan v.r.: variabel random
Variabel dependen fuzzy
Nilai pusat dan tepi variabel dependen fuzzy dibangkitkan dari: dan
dengan : matriks berukuran yang berisi vektor kolom dan nilai-nilai variabel independen tegas hasil simulasi; : vektor variabel random normal dengan mean 0 dan standar deviasi 1. Parameter yang diharapkan dari model adalah
Untuk menentukan banyaknya variabel independen yang sesuai (signifikan), diestimasi model regresi fuzzy untuk setiap nilai dengan banyaknya variabel independen. Untuk setiap , diperhatikan kombinasi yang mungkin dengan variabel independen dari 6 variabel independen.
Tabel 2. Kandidat model dengan Variabel independen 1 23444.418098 0.704598 0.662398 5136.0332 2 11250.053080 0.858248 0.829898 2457.7377 3 2971.749611 0.962556 0.952702 640.1842 4 87.760782 0.998894 0.998526 8.2896 5 73.684916 0.999072 0.998689 7.1958 6 72.794153 0.999083 0.998624 9.0000
Pada tabel 2 didaftar nilai-nilai minimum JKE, nilai maksimum dan , dan nilai minimum yang diperoleh untuk setiap model dengan variabel independen. Sebagai catatan bahwa jika diperoleh nilai yang sama, maka diperhatikan beberapa kombinasi untuk suatu nilai [17]. Berdasarkan kriteria (maksimum) dan indeks (minimum) untuk keempat nilai lambda (fungsi keanggotaan: akar kuadrat, segitiga, parabolik, dan normal) diperleh model terbaik untuk , dengan variabel independen . Hasil seleksi variabel khusus untuk nilai dirangkum pada tabel 2.
Tabel 3. JKE, , , dan untuk beberapa nilai
JKE
0.333 67.137342 0.999154 0.998805 7.221020 0.500 73.684916 0.999072 0.998689 7.195788 0.667 82.851094 0.998956 0.998527 7.167365 98.922575 0.998755 0.998242 7.130646
Tabel 4. Hasil estimasi untuk beberapa nilai
0.333 0.046945 2.020674
0.500 0.046945 2.020617
0.667 0.046945 2.020538
Selanjutnya pada tabel 3 dirangkum JKE, , , dan untuk beberapa nilai yang berbeda. Terlihat bahwa jika nilai semakin besar maka Jumlah Kuadrat Error (JKE) juga semakin besar. Sedangkan kecenderungan nilai , , dan semakin kecil. Hal ini menggambarkan bahwa semakin kecil nilai , yaitu semakin kecil ukuran "fuzziness" pada data, maka akan semakin besar kontribusi variabel independen terhadap varaibel dependen. Sebagai perbandingan jika dilakukan estimasi dengan menggunakan regresi kuadrat terkecil biasa atau dengan mengambil nilai pada model regresi fuzzy, yaitu dengan mengasumsikan tepi variabel dependen fuzzy sama dengan nol, diperoleh estimasi:
Berdasarkan tabel 4, terlihat bahwa hasil estimasi pusat model regresi fuzzy sedikit berbeda untuk nilai yang berlainan, namum demikian hasil tersebut berkisar pada nilai estimasi dengan menggunakan regresi kuadrat terkecil biasa. Dengan menggunakan model regresi fuzzy, selain model pusat, dapat diestimasi model tepi.
Daftar Pustaka
1. A. Celmins, Multidimensional least-squares fitting of fuzzy models, Math. Model. 9 (1987), 669-690.
2. P. T. Chang and E. S. Lee, A generalized fuzzy weighted least-squares regression, Fuzzy Sets and Systems 82 (1996), 289-298.
3. Y.-H. O. Chang and B. M. Ayyub, Fuzzy regression methods-a comparative
assessment, Fuzzy Sets and Systems 119 (2001), 187-203.
4. R. Coppi, Management of uncertainty in statistical reasoning: The case of regression
analysis, International Journal of Approximate Reasoning 47 (2008), 284-305.
5. R. Coppi and P. D'Urso, Regression analysis with fuzzy informational paradigm: a
least squares approach using membership function information, Int. J. Pure Appl.
Math. 8 (2003), no. 3, 279-306.
6. R. Coppi, P. D'Urso, P. Giordani, and A. Santoro, Least squares estimation of a linear
regression model with LR fuzzy response, Computational Statistics & Data
Analysis 51 (2006), 267-286.
7. R. Coppi, M. A. Gil, and H. A. L. Kiers, The fuzzy approach to statistical analysis, Computational Statistics & Data Analysis 51 (2006), 1-14.
8. P. Diamond, Fuzzy least squares, Information Sciences 46 (1988), 141-157.
9. P. D'Urso, Linear regression analysis for fuzzy/crisp input and fuzzy/crisp output data, Computational Statistics & Data Analysis 42 (2003), 47-72.
10. P. D'Urso and T. Gastaldi, A least-squares approach to fuzzy linear regression
analysis, Computational Statistics & Data Analysis 34 (2000), 427-440.
11. ---, An "orderwise" polynomial regression procedure for fuzzy data, Fuzzy Sets and Systems 130 (2002), 1-19.
12. P. D'Urso and P. Giordani, Fitting of fuzzy linear regression models with multivariate
response, Int. Math. J. 3 (2003), no. 6, 655-664.
13. ---, A weighted fuzzy c-means clustering model for fuzzy data, Computational Statistics & Data Analysis 50 (2006), no. 6, 1496-1523.
14. P. D'Urso and A. Santoro, Fuzzy clusterwise linear regression analysis with
symmetrical fuzzy output variable, Computational Statistics & Data Analysis 51
(2006), 287-313.
15. ---, Goodness of fit and variable selection in the fuzzy multiple linear regression, Fuzzy Sets and Systems 157 (2006), 2627-2647.
16. R. E. Giachetti and R. E. Young, A parametric representation of fuzzy numbers and
their arithmetic operators, Fuzzy Sets and Systems 91 (1997), 185-202.
17. I. Kharisudin and Subanar, Fuzzy regression analysis with symmetrical fuzzy
dependent variable, submitted to The Proceeding of IICMA 2009, Yogyakarta,
October 12-13, 2009.
18. M. Ma, M. Friedman, and A. Kandel, General fuzzy least squares, Fuzzy Sets and Systems 88 (1997), 107-118.
19. A. F. Shapiro, Fuzzy regression and the term structure of interest rates revisited, Unpublished paper, Penn State University, 2005.
20. S. M. Taheri, C-fuzzy numbers and a dual of extension principle, Information Sciences 178 (2008), 827-835.
21. H. Tanaka, S. Uejima, and K. Asai, Linear regression analysis with fuzzy model, IEEE Transactions on Systems, Man and Cybernetics 12 (1982), no. 6, 903-907.
22. H. C. Wu, Fuzzy least squares estimators in linear regression analysis for imprecise
input and output data, Computational Statistics & Data Analysis 42 (2003),
203-217.
23. M.-S. Yang and C.-H. Ko, On a class of fuzzy c-numbers clustering procedures for
fuzzy data, Fuzzy Sets and Systems 84 (1996), 49-60.
24. H. J. Zimmermann, Fuzzy set theory and its applications, Kluwer Academic Publisher, Boston, 1991.