• Tidak ada hasil yang ditemukan

Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan Algoritma Genetika

N/A
N/A
Protected

Academic year: 2017

Membagikan "Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan Algoritma Genetika"

Copied!
36
0
0

Teks penuh

(1)

KAJIAN ANALISIS REGRESI LINIER BERGEROMBOL

DENGAN PENDEKATAN ALGORITMA GENETIKA

AEP HIDAYATULOH

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(2)
(3)

PERNYATAAN MENGENAI SKRIPSI DAN

SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA

Dengan ini saya menyatakan bahwa skripsi berjudul Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan Algoritma Genetika adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini.

Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor.

Bogor, Februari 2015

Aep Hidayatuloh

(4)

ABSTRAK

AEP HIDAYATULOH. Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan Algoritma Genetika. Dibimbing oleh AGUS MOHAMAD SOLEH dan BAGUS SARTONO.

Analisis Regresi Linier Bergerombol (RLB) dengan pendekatan Algoritma Genetika (AG) mampu mencari solusi terbaik pada data bergerombol berdasarkan nilai adjusted R-square (R2adj), namun belum mampu mendeteksi jumlah gerombol optimum yang terbentuk karena semakin besar asumsi banyaknya gerombol maka nilai R2adj juga semakin tinggi. Analisis ini juga mampu menggerombolkan suatu amatan dengan baik sehingga dapat meningkatkan kemampuan analisis regresi linier. Jika dibandingkan dengan analisis regresi linier klasik, analisis ini mampu menghasilkan parameter dugaan dan R2adj pada data bergerombol yang lebih baik. Program untuk analisis RLB dengan pendekatan AG dapat dilihat di http://bit.ly/CLRwGA.

Kata kunci: algoritma genetika, regresi linier bergerombol

ABSTRACT

AEP HIDAYATULOH. The Study of Clustered Linear Regression Analysis with Genetic Algorithms Approach. Supervised by AGUS MOHAMAD SOLEH and BAGUS SARTONO.

(5)

Skripsi

sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika

pada

Departemen Statistika

KAJIAN ANALISIS REGRESI LINIER BERGEROMBOL

DENGAN PENDEKATAN ALGORITMA GENETIKA

AEP HIDAYATULOH

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

(6)
(7)

Judul Skripsi : Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan Algoritma Genetika

Nama : Aep Hidayatuloh NIM : G14090097

Disetujui oleh

Agus Mohamad Soleh, MT Pembimbing I

Dr Bagus Sartono, MSi Pembimbing II

Diketahui oleh

Dr Anang Kurnia, MSi Ketua Departemen

(8)

PRAKATA

Puji dan syukur penulis panjatkan kepada Allaah Subhanahu wa ta’ala atas segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Karya ilmiah ini diberi judul Kajian Analisis Regresi Linier Bergerombol dengan Pendekatan Algoritma Genetika.

Terima kasih penulis ucapkan kepada Bapak Agus Mohamad Soleh, MT dan Bapak Dr Bagus Sartono, MSi selaku pembimbing yang telah bersabar dalam memberikan nasihat kepada penulis.

Terima kasih juga kepada:

1. Seluruh Dosen dan Staf Departemen Statistika FMIPA IPB atas segala bantuannya.

2. Bapak Harianto Tanudjaja dan seluruh staf PT Ganesha Cipta Informatika yang telah membantu selama penulisan karya ilmiah ini.

3. Bapak, Ibu, Kakak dan adik-adikku yang selalu menjadi motivasi bagi penulis, serta seluruh keluarga atas segala doa dan dukungannya.

4. Teman seperjuangan Syarif Amrulla, Linda Erijayanti, Mochammad Fachrouzi Iskandar, Dyah Ayuning Pawestri, Muhammad Hafid, dan seluruh teman-teman Statistika 46. Tidak lupa juga satu-satunya teman sedaerah, Fatih Mulia Utama.

5. Seluruh pihak yang sudah memberikan dukungannya demi selesainya penulisan karya ilmiah ini.

Penulis menyadari bahwa karya ilmiah ini masih belum sempurna. Demi lebih sempurnanya karya ilmiah ini penulis mengharapkan saran dan kritik dari pembaca. Semoga karya ilmiah ini dapat memberikan banyak manfaat.

Bogor, Februari 2015

(9)

DAFTAR ISI

DAFTAR TABEL vi

DAFTAR GAMBAR vi

DAFTAR LAMPIRAN vi

PENDAHULUAN 1

Latar Belakang 1

Tujuan Penelitian 2

TINJAUAN PUSTAKA 2

Algoritma Genetika 2

METODE 5

Data 5

Prosedur Analisis Data 6

HASIL DAN PEMBAHASAN 9

Ilustrasi Penerapan 9

Kajian Kinerja Analisis Regresi Linier Bergerombol dengan Pendekatan

Algoritma Genetika 11

Diskusi 19

SIMPULAN DAN SARAN 19

Simpulan 19

Saran 20

DAFTAR PUSTAKA 20

LAMPIRAN 21

(10)

DAFTAR TABEL

1 Parameter regresi data 2 gerombol 5

2 Parameter regresi data 3 gerombol 6

3 R2adj dan jumlah anggota gerombol hasil dugaan 10

4 Nilai R2adj* 12

5 Nilai R2adj tertinggi dari 30 ulangan pada data dengan 2 gerombol 12 6 Hasil pendugaan gerombol optimal berdasarkan urutan 13 7 Pendugaan parameter data dengan 2 gerombol (regresi linier klasik) 14 8 Pendugaan parameter data dengan 2 gerombol (RLB-AG) 15 9 Pendugaan gerombol optimal berdasarkan urutan pada data 1 dengan 3

gerombol 16

10 Pendugaan parameter data dengan 3 gerombol (regresi linier klasik) 17 11 Pendugaan parameter data dengan 3 gerombol (RLB-AG) 18

DAFTAR GAMBAR

1 Ilustrasi teknik pindah-silang dan mutasi 4

2 Bagan alir analisis RLB dengan pendekatan AG 7

3 Diagram pencar 10

4 Performa RLB dengan pendekatan AG 11

DAFTAR LAMPIRAN

1 Sebaran data pada data dengan 2 gerombol 21

2 Sebaran data pada data dengan 3 gerombol 22

(11)

PENDAHULUAN

Latar Belakang

Data yang diperoleh pada suatu penelitian sering kali berasal dari satu populasi yang sama namun tidak sepenuhnya dapat digambarkan hanya dengan satu model. Data tersebut sebenarnya terdiri dari beberapa subpopulasi atau gerombol dan masing-masing memiliki model regresi yang berbeda. Data seperti ini akan menghasilkan model yang tidak efektif jika menggunakan analisis regresi linier klasik dengan menggunakan pendugaan Metode Kuadrat Terkecil (MKT) untuk melihat hubungan antara peubah respon dan peubah penjelas. Permasalahan lain yang terjadi pada data seperti ini adalah tidak diketahui banyaknya gerombol yang terbentuk dan amatan atau objek yang termasuk dalam suatu gerombol juga tidak diketahui. Permasalahan-permasalahan di atas memerlukan penanganan khusus agar model yang dihasilkan oleh MKT lebih baik dalam menggambarkan karakteristik data tersebut. Pendugaan parameter regresi linier dengan MKT membutuhkan informasi tambahan, yaitu gerombol yang terbentuk pada data. Oleh sebab itu, dibutuhkan solusi yang mampu menangani masalah regresi pada kasus seperti ini.

Beberapa metode yang ada untuk analisis pada permasalahan tersebut antara lain adalah pada penelitian Ari dan Guvernir (2002) menggunakan MARS, RSBF,

k-Nearest Neighborhood Regression (KNNR), dan Regresi Linier Bergerombol (RLB), sedangkan yang digunakan pada penelitian Barman dan Dabeer (2011) menggunakan Individual Regression (IR), Collective Regression (CR), Algoritma EM, Algoritma K-rataan, Singular Value Thresholding, Metode Curds dan Whey, dan Regresi Lokal (LoR). Berdasarkan penelitian terhadap beberapa algoritma tersebut, Ari dan Guvernir (2002) menyatakan RLB memiliki hasil yang lebih baik, sedangkan Barman dan Dabeer (2011) menyatakan LoR memiliki hasil terbaik. RLB merupakan perluasan dari metode regresi linier klasik yang membagi data menjadi beberapa subgugus data, sehingga dapat memberikan hasil yang lebih akurat untuk fungsi regresi linier. Pendekatan ini juga mengeliminasi permasalahan yang disebabkan oleh korelasi antar peubah penjelas yang sering terjadi dalam dunia nyata (Ari dan Guvernir 2002). Pada penelitian ini dilakukan analisis RLB dengan menggunakan pendekatan algoritma genetika.

(12)

2

Tujuan Penelitian

Penelitian ini bertujuan memberikan metode alternatif dalam permasalahan analisis regresi linier bergerombol. Hasil yang diharapkan dari penelitian ini adalah:

1. Mengevaluasi kemampuan metode analisis regresi linier bergerombol dengan pendekatan algoritma genetika.

2. Memberikan informasi jumlah gerombol dan penggerombolan amatan yang terbentuk pada data.

3. Membentuk persamaan regresi linier yang mampu menggambarkan data bergerombol dengan baik.

4. Mengukur keakuratan parameter regresi hasil dugaan dengan parameter regresi aktual.

5. Menerapkan analisis pada data berukuran sedang dan besar.

TINJAUAN PUSTAKA

Algoritma Genetika

Antoniou dan Lu (2007) menyatakan proses optimasi adalah proses untuk mendapatkan hasil terbaik. Umumnya hasil yang diinginkan adalah nilai maksi-mum atau minimaksi-mum. Salah satu Algoritma yang saat ini sedang berkembang dan mulai banyak diterapkan dalam menyelesaikan permasalahan optimasi adalah Algoritma Genetika. Algoritma Genetika (AG) adalah sebuah teknik optimasi dan pencarian solusi berdasarkan prinsip-prinsip genetika dan seleksi alam. AG memungkinkan sebuah populasi terdiri dari banyak individu untuk berkembang dibawah aturan seleksi tertentu menuju keadaan yang mengoptimumkan fungsi

fitness (misalnya meminimumkan fungsi biaya) (Haupt dan Haupt 2004). AG diperkenalkan oleh John H. Holland pada tahun 1975. Prinsip dasar AG mengadaptasi proses teori evolusi alam. Secara garis besar, proses evolusi yang terjadi adalah seleksi dari populasi awal, pindah-silang (crossover), mutasi, dan seleksi alam.

Proses seleksi alam yang terjadi melibatkan proses perubahan gen pada individu-individu melalui proses perkembangbiakan sehingga menghasilkan ketu-runan terbaik. Setiap individu memiliki informasi penting yang telah dikodekan dan dikenal sebagai kromosom. Individu yang baik akan menghasilkan keturunan yang baik dan ukuran kebaikan suatu individu dilihat dari nilai kesuaian (fitness). Nilai kesuaian diperoleh dari hasil evaluasi individu terhadap fungsi kesuaian yang ingin dicari nilai optimumnya. AG juga sudah banyak digunakan pada penelitian tentang optimasi dalam berbagai bidang, diantaranya adalah pada penyusunan kelompok belajar (Angga dan Lestari 2012), untuk desain ruang dalam rumah (Liliana 2006), dan tentang penyelesaian masalah transportasi (Sarwadi dan Anjar 2004).

Beberapa istilah AG yang digunakan dalam penelitian ini.

(13)

3 numerik. Dalam penelitian ini gen adalah bilangan numerik yang menunjukkan gerombol.

Kromosom : gabungan dari beberapa gen yang menggambarkan karakteristik suatu individu.

Individu : suatu nilai yang menyatakan solusi. Keturunan : individu baru hasil pindah-silang.

Populasi : kumpulan individu yang akan diproses dalam siklus evolusi untuk mencari solusi terbaik.

Fungsi kesuaian : fungsi yang akan dicari nilai optimumnya.

Nilai kesuaian : menyatakan kebaikan suatu individu atau solusi yang diperoleh dari fungsi kesuaian.

AG lebih sesuai untuk mencari solusi terbaik/optimum global dari kemungkinan solusi yang berukuran besar atau masalah yang rumit. Pada masalah yang tidak terlalu rumit, metode lain yang lebih sesuai mungkin dapat menemukan solusi lebih cepat dibandingkan AG (Haupt dan Haupt 2004).

Operator-operator genetika yang terlibat dalam AG adalah 1. Inisialisasi Populasi.

Membentuk populasi awal yang dibutuhkan pada proses pencarian solusi. Sivanandam dan Deepa (2008) menyatakan ada dua hal penting dari populasi yang digunakan dalam AG, (1) inisial generasi populasi dan (2) ukuran populasi. Dalam praktiknya, sekitar 100 individu dalam populasi sudah cukup, tetapi ukurannya bisa berubah menyesuaikan dengan waktu dan kemampuan komputasi yang digunakan. Populasi dapat dibangkitkan secara acak, berdasarkan teori tertentu, atau menggunakan suatu metode. Aturan atau batasan yang mengikat saat pembangkitan populasi harus benar-benar diperhatikan. Pada penelitian ini populasi awal dibangkitan secara acak.

2. Seleksi

AG juga melakukan seleksi terhadap individu seperti seleksi alam. Sebanyak g individu yang terpilih diharapkan adalah individu terbaik yang akan dijadikan sebagai tetua pada tahapan pindah-silang. Tetua umumnya dipilih berdasarkan nilai kesuaian, namun beberapa metode seleksi tidak menggunakannya. Sivanandam dan Deepa (2008) menyebutkan ada beberapa teknik seleksi yang dapat digunakan, diantaranya adalah

a. Seleksi acak

Individu dipilih secara acak dari populasi tanpa memerhatikan nilai kesuaian.

b. Seleksi Peringkat

Individu diperingkatkan berdasarkan nilai kesuaian yang paling baik. Pada kasus memaksimumkan suatu fungsi, individu yang memiliki nilai kesuaian paling tinggi dipilih untuk diakukan pindah-silang.

c. Seleksi Roda Rolet

(14)

4

d. Seleksi Turnamen

Beberapa individu (tiga atau empat) dipilih secara acak dari populasi. Kemudian bandingkan nilai kesuaian. Individu dengan nilai kesuaian yang paling tinggi dipilih untuk pindah-silang, sedangkan yang lain dikembali-kan ke dalam populasi agar memiliki kemungkinan terambil lagi.

3. Pindah-silang

Pindah-silang adalah proses yang melibatkan 2 individu dari tetua yang terpilih untuk menghasilkan individu atau keturunan baru yang disebut anak. Dua tetua ditukarkan gen dalam kromosomnya. Cara penukaran gen seperti penukaran unsur yang ada pada vektor. Beberapa teknik pindah-silang adalah : a. Satu titik (Single point)

Masing-masing kromosom dipotong pada satu titik silang dengan panjang yang sama. Kemudian bagian-bagian ini saling ditukarkan. Teknik pindah-silang inilah yang akan digunakan pada penelitian ini. Ilustrasinya seperti Gambar 1(a).

b. Dua titik (Two/Double point)

Sama seperti pada teknik pindah-silang satu titik, tetapi menggunakan dua titik silang. Masing-masing kromosom dipotong pada 2 titik silang dengan panjang yang sama. Kemudian bagian-bagian ini saling ditukarkan seperti Gambar 1(b).

c. Seragam (Uniform)

Teknik ini dilakukan dengan membangkitkan bilangan acak Seragam(0,1) sesuai panjang kromosom dan nilainya dibulatkan. Misalnya jika nilai bilangan acak adalah 1 maka gen ditukar, jika 0 gen tetap. Proses pindah-silang akan terlihat seperti Gambar 1(c).

(a) Teknik pindah-silang satu titik (b) Teknik pindah-silang dua titik

(15)

5 4. Mutasi

Mutasi diperlukan untuk menjaga agar solusi yang diperoleh bersifat lebih luas. Tingkat terjadinya mutasi ini umumnya sangat kecil, yaitu sekitar 1% atau kurang. Mutasi tidak bisa diatur terlalu besar karena perubahan dari generasi ke generasi akan seperti langkah acak dan akan terlalu lama mencapai konvergensi (Sartono 2010). Proses mutasi dilakukan dengan mengganti beberapa gen, misalnya 1 diganti dengan 2 dan sebagainya. Gambar 1(d) memberikan ilustrasi teknik mutasi tersebut.

METODE

Data

Data yang digunakan pada penelititan ini adalah hasil pembangkitan. Ukuran data dibagi 3, yaitu data berukuran kecil (100 amatan), sedang (1000 amatan) dan besar (5000 amatan) (Barman dan Dabeer 2011). Data yang digunakan pada simulasi terdiri atas 2 dan 3 gerombol dengan bentuk hubungan linier antara peubah X dan Y pada masing-masing gerombol berbeda satu dengan yang lainnya. Percobaan dilakukan pada data rekaan dengan 2 peubah penjelas yang dibangkitkan dengan persamaan berikut.

X1 = 50 – 3.275 θ dan X2= 20 + 14 θ,

dengan θ~Seragam(0,1). εodel untuk masing-masing gerombol ke-i adalah

Yi= β0i + β1iX1 + β2i X2 + , i = 1, 2, .., c,

dengan c adalah banyaknya gerombol, sedangkan ~N(μ=0, σ2=10). Tabel 1 dan Tabel 2 menunjukkan parameter yang digunakan untuk mambangkitkan data simulasi.

Tabel 1 menunjukkan parameter regresi yang digunakan untuk membangkit-kan data dengan gerombol sebanyak 2. Perbedaan antara data 1, data 2, dan data 3 adalah bentuk hubungan linier antara peubah X1 dan X2 dengan Y. Data 1

Tabel 1 Parameter regresi data 2 gerombol

(16)

6

mempunyai bentuk hubungan linier positif. Antara gerombol 1 dan 2 membentuk pola linier sejajar yang ditunjukkan oleh β1 yang bernilai negatif dan β2 yang

bernilai positif dengan nilai yang sama untuk masing-masing gerombol. Namun karena nilai β0 untuk gerombol 1 dan 2 berbeda maka bentuk pola hubungan

liniernya sejajar tapi tidak berhimpit. Data 2 juga mempunyai bentuk hubungan linier positif antara peubah X1 dan X2 dengan Y. Pola yang terbentuk antara

gerombol 1 dan 2 tidak sejajar yang terlihat dari nilai β1 yang bernilai negatif dan

β2 yang bernilai positif tapi tidak sama untuk masing-masing gerombol.

Perbedaan parameter tersebut menyebabkan kemiringan pada pola hubungan linier masing-masing gerombol berbeda sehingga bentuk hubungan linier antara peubah X2 dan Y pada gerombol 1 lebih landai dibandingkan dengan gerombol 2.

Selanjutnya data 3 mempunyai bentuk hubungan linier anatara peubah X1 dan X2

dengan Y yang berbeda untuk masing-masing gerombol. Plot antara Y dengan X1

dan X2 untuk masing-masing data dengan 2 gerombol dapat dilihat di Lampiran 1.

Parameter regresi yang digunakan untuk membangkitkan data dengan 3 gerombol ditunjukkan pada Tabel 2. Bentuk hubungan linier antara peubah X1 dan

X2 dengan Y pada data 1 sejajar antar gerombol yang dapat dilihat berdasarkan β1

dan β2 yang bernilai sama. Pada data 2, masing-masing gerombol mempunyai

kemiringan yang berbeda. Gerombol pertama cukup miring, satu gerombol lagi lebih landai, sedangkan gerombol lainnya mempunyai bentuk hubungan linier negatif antara peubah X2 dan Y. Data 3 mempunyai 2 gerombol dengan bentuk

hubungan linier antara peubah X2 dan Y yang sejajar. Satu gerombol lainnya

mempunyai bentuk hubungan linier negatif antara peubah X2 dan Y. Plot antara Y

dengan X1 dan X2 untuk masing-masing data dengan gerombol sebanyak 3 dapat

dilihat di Lampiran 1.

Prosedur Analisis Data

Analisis regresi linier bergerombol (RLB) dengan pendekatan AG adalah sebuah metode yang meningkatkan keakuratan dari regresi linier klasik dengan membagi sebuah gugus data ke dalam beberapa subgugus data. Metode ini

(17)

7

merupakan integrasi antara analisis regresi linier dan analisis gerombol. Prosedur analisis yang digunakan pada penelitian ini dibagi menjadi 2 bagian, yaitu penyusunan program menggunakan SAS/IML, SAS/Base, SAS/Graph, dan SAS Macro yang dievaluasi berdasarkan data berukuran kecil dan penerapan pada data sedang dan besar. Pada bagian pendugaan banyaknya gerombol optimum penggerombolan amatan dilakukan masing-masing 30 ulangan pada data yang sama dan pada pendugaan parameter dilakukan 500 ulangan dengan data yang berbeda-beda. Proses analisis RLB dengan pendekatan AG dapat dilihat pada Gambar 2 untuk 1 kali ulangan. Penjelasan detail prosesnya adalah sebagai berikut.

1. Menenentukan asumsi banyaknya gerombol.

Penentuan banyaknya gerombol yang digunakan pada penelitian ini adalah 2 sampai 5 gerombol. Hal ini karena diduga banyaknya gerombol yang terbentuk berada diantara nilai tersebut.

(18)

8

2. Menginisialisasi populasi awal.

Populasi awal dibangkitkan secara acak sebanyak 210 individu dengan pembangkitan dari sebaran Seragam(1, c), dengan c adalah asumsi banyaknya gerombol.

3. Menghitung nilai kesuaian.

Misalnya terdapat satu gugus data yang terdiri dari n amatan, peubah respon Y dan peubah penjelas X. Jika pada data tersebut terbentuk c gerombol maka gen yang terbentuk berupa bilangan numerik 1, 2, 3 sampai c. Kromosom yang dalam kasus ini sekaligus sebagai individu yang terbentuk berupa sebuah vektor yang mempunyai n unsur. Unsur-unsur vektor tersebut adalah kode gerombol. Jika unsur pertama mempunyai gen 1 maka amatan pada data tersebut termasuk anggota gerombol 1, gen 2 menunjukkan amatan termasuk gerombol 2, dan seterusnya hingga gen c menunjukkan amatan termasuk ke dalam gerombol ke-c. Individu tersebut pada analisis ini diperla-kukan seperti peubah kategorik. Pada analisis regresi linier, jika sebuah peubah berkategori (nominal atau ordinal) maka perlu diubah menjadi satu atau beberapa peubah boneka, dalam kasus ini akan terbentuk sebanyak c - 1.

Sebagai ilustrasi, misalnya ada data dengan satu peubah respon Y, 2 dalam RLB dengan pendekatan AG, yaitu

Y = β0 + β1X1 + β2X2 + 1S1 + 2S2 + 3S1X1 + 4S1X2 + 5S2X1 + 6S2X2 +

Model di atas jika dituliskan dalam notasi matriks adalah seperti berikut. Y = Xβ + Z'� + ε

, vektor parameter regresi untuk peubah bebas.

Z' = [ S1 S2 S1X1 S1X2 S2X1 S2X2 ], matriks peubah bebas S1, S2 dan

interaksinya dengan peubah X1 dan X2.

δ = [

1

2], parameter regresi untuk peubah S

(19)

9

4. Mengevaluasi kekonvergenan nilai kesuaian.

Misalnya g adalah banyaknya individu terbaik yang akan dipilih pada tahap seleksi individu. Proses analisis dikatakan konvergen jika selisih antara nilai maksimum dan minimum nilai R2adj dari g individu terpilih yang sudah diurutkan pada iterasi ke-i ≤ α, yaitu α = 10-6. Jika metode sudah konvergen maka proses berhenti, tetapi jika belum konvergen maka dilanjutkan ke tahap berikutnya. Penentuan maksimum iterasi juga perlu dilakukan untuk mence-gah program terus berjalan pada kondisi yang tidak mungkin konvergen, yaitu ditentukan sebanyak 2000 iterasi.

5. Menyeleksi individu.

Pada penelitian ini ditentukan g = 15 individu terpilih yang memiliki nilai kesuaian tertinggi untuk menjadi tetua pada proses pindah silang. Teknik seleksi yang digunakan adalah seleksi peringkat berdasarkan nilai R2adj.

6. Melakukan proses pindah-silang.

Pindah-silang dilakukan terhadap masing-masing 2 tetua untuk menghasilkan keturunan baru dengan teknik satu titik. Penentuan titik silang pada penelitian ini ditentukan pada tengah-tengah kromosom atau dengan proporsi sekitar 50%:50%.

7. Melakukan proses mutasi pada individu.

Proses mutasi pada penelitian ini hanya dilakukan pada anak hasil pindah-silang untuk menjaga kualitas tetua dan memastikan nilai kesuaiannya tidak menurun. Peluang terjadinya mutasi ditentukan sebesar 0.8%.

8. Menggabungkan anak hasil mutasi dengan induknya.

9. Mengulangi tahap 3 sampai 8 hingga nilai kesuaian konvergen atau setelah mencapai iterasi maksimum.

10.Mengulangi tahap 1 sampai 9 dengan banyaknya gerombol yang berbeda. 11.Bandingkan nilai R2adj tertinggi dari hasil masing-masing gerombol. Gerombol

yang memiliki nilai R2adj paling tinggi maka itulah gerombol optimal yang terbentuk.

12.Mengulang tahap 2 sampai 8 sebanyak 30 kali untuk memperoleh pola nilai

R2adj dan pengelompokkan data, dan mengulang 500 pada data yang berbeda untuk menduga parameter. Asumsi banyaknya gerombol dalam pendugaan parameter disesuai-kan dengan jumlah gerombol yang sudah diketahui.

HASIL DAN PEMBAHASAN

Ilustrasi Penerapan

Terdapat data dengan satu peubah respon Y dan dua peubah penjelas, yaitu X1 dan X2. Data tersebut terdiri dari 100 amatan. Dari data tersebut ingin

(20)

10

Kebaikan model regresi linier diukur dari besarnya nilai R2adj. Karena itu diterapkan analisis regresi linier klasik pada data tersebut dan diperoleh nilai R2adj sebesar 46.91%. Artinya hanya 46.91% keragaman data yang dapat dijelaskan oleh model tersebut. Hal ini menunjukkan bahwa model yang sudah diperoleh masih belum cukup baik untuk menduga nilai Y. Berdasarkan diagram pencar pada Gambar 3, dicurigai terbentuk gerombol pada data tersebut. Oleh sebab itu, dibutuhkan solusi yang dapat mengatasi permasalahan analisis regresi linier pada data bergerombol tersebut. Solusi ini diharapkan mampu menghasilkan nilai R2adj yang lebih tinggi dibandingkan dengan yang dihasilkan oleh analisis regresi linier klasik. Salah satu solusi yang dapat digunakan pada data dengan kondisi seperti ini adalah analisis RLB dengan pendekatan AG.

Analisis ini mencari solusi terbaik berdasarkan nilai R2adj dan melakukan penggerombolan untuk masing-masing amatan. Tabel 3 menunjukkan nilai R2adj maksimum yang menunjukkan solusi terbaik untuk data tersebut. Jika diasumsi-kan ada 2 gerombol maka nilai maksimum yang diperoleh adalah 99.08%, sedangkan jika diasumsikan ada 5 gerombol nilai maksimumnya adalah 99.70%. Nilai R2adj yang diperoleh ini sangat jauh berbeda dibandingkan dengan hasil yang diperoleh dari analisis regresi linier klasik. Berdasarkan pendekatan hasil tersebut, gerombol optimum yang terbentuk pada data tersebut adalah gerombol yang memiliki nilai R2adj maksimum paling tinggi, yaitu 5 gerombol. Secara keseluru-han, penerapan analisis RLB dengan pendekatan AG mampu menghasilkan nilai

R2adj lebih tinggi dibandingkan dengan hasil dari analisis regresi linier klasik. Pada Tabel 3 juga disajikan jumlah anggota gerombol untuk masing-masing asumsi banyaknya gerombol dari hasil penduggan. Jika diasumsikan terbentuk 2

Gambar 3 Diagram pencar

(21)

11 gerombol maka dari 100 amatan tersebut sebanyak 55 amatan dimasukkan ke dalam gerombol 1 dan 45 amatan ke dalam gerombol 2. Jika terbentuk 3 gerombol maka sebanyak 10 amatan masuk ke dalam gerombol 1, 37 amatan masuk ke dalam gerombol 2 dan sebanyak 53 amatan menjadi anggota gerombol 3. Selanjutnya untuk asumsi banyaknya gerombol 4 dan 5 dapat dilihat pada tabel.

Kajian Kinerja Analisis Regresi Linier Bergerombol dengan Pendekatan Algoritma Genetika

Konvergensi

Kemampuan dan performa analisis RLB dengan pendekatan AG dilihat berdasarkan nilai R2adj dan kesalahan penggerombolan. Penentuan banyaknya gerombol yang terbentuk diperoleh dari nilai R2adj maksimum antar asumsi banyaknya gerombol. Gerombol yang menghasilkan nilai paling tinggi maka gerombol tersebutlah yang dianggap sebagai gerombol optimum. Seperti yang sudah dijelaskan di awal, AG akan mencari solusi terbaik dengan memilih individu-individu yang memiliki nilai kesuaian terbaik. Setiap generasi yang dihasilkan akan memiliki nilai kesuaian maksimum yang lebih baik atau sama dengan nilai kesuaian maksimum generasi sebelumnya. Nilai kesuaian atau R2adj akan mempunyai pola meningkat pada setiap generasinya.

Gambar 4 menunjukkan performa dari analisis RLB denggan pendekatan AG yang dilihat berdasarkan peningkatan nilai R2adj tiap iterasi pada data berukuran kecil. Analisis ini menghasilkan R2adj yang sangat kecil di iterasi awal dan terus meningkat pada iterasi-iterasi berikutnya. Seperti terlihat pada Gambar 4, analisis ini mampu mencapai konvergen karena selisih nilai maksimum dan minimum R2adj dari g = 15 individu terpilih kurang dari α. Pada data berukuran sedang dapat mencapai konvergen dengan iterasi yang lebih banyak dibandingkan dengan jumlah iterasi pada data berukuran kecil. Pada data berukuran besar masih sulit untuk mencapai konvergensi sehingga program baru akan berhenti setelah mencapai iterasi maksimum, yaitu hingga 2000 iterasi. Walau demikian, pola nilai

R2adj terus meningkat.

(22)

12

Kemampuan Mendeteksi Gerombol dan Menduga Parameter Regresi

Evaluasi RLB dengan pendekatan AG dilakukan pada data bangkitan mulai dari 2 sampai dengan 5 gerombol. Analisis RLB pada data bangkitan yang sudah diketahui gerombolnya menghasilkan nilai R2adj*. Namun pada kenyataannya ini tidak pernah diketahui sebelumnya. Nilai R2adj* dari masing-masing data ditunjuk-kan pada Tabel 4 dengan R2adj* pada data 1, data 2, dan data 3 dengan 2 gerombol masing-masing adalah 99.08%, 99.91%, dan 98.46%.

Selanjutnya pada Tabel 5 disajikan ringkasan nilai R2adj dugaan dari 30 ulangan untuk masing-masing data. Pada data 1, jika diasumsikan terbentuk 2 gerombol maka diperoleh nilai minimum sebesar 83.89%, median sebesar 88.53% dan maksimumnya sebesar 99.08% (dengan regresi klasik hanya 46.91%). Nilai maksimum R2adj jika diasumsikan terbentuk 2 gerombol sudah sesuai dengan nilai

R2adj* pada data 1 dengan 2 gerombol dan jika diasumsikan terbentuk 5 gerombol maka nilai minimumnya sebesar 95.22%, median sebesar 99.46%, dan maksimum sebesar 99.77%. Semakin besar asumsi banyaknya gerombol terlihat nilai maksimumnya semakin tinggi.

Pada data 2, analisis ini menghasilkan nilai R2adj minimum sebesar 72.81%, median sebesar 98.42%, dan nilai maksimum sebesar 99.91% dengan asumsi tebentuk 2 gerombol. Karena nilai R2adj* dari data 2 adalah 99.91%, maka metode ini juga mampu mencapai nilai optimum. Jika diasumsikan terbentuk 5 gerombol maka diperoleh nilai minimum sebesar 99.91%, median sebesar 99.96%, dan

Tabel 5 Nilai R2adj tertinggi dari 30 ulangan pada data dengan 2 gerombol

(23)

13 maksimum sebesar 99.98%. Selanjutnya, pada data 3 dengan asumsi terbentuk 2 gerombol menghasilkan nilai minimum sebesar 76.55%, median sebesar 98.50%, dan nilai maksimum sebesar 98.50%. Pada data ini analisis RLB dengan pendekatan AG juga mampu mencapai nilai optimum karena nilai R2adj*-nya adalah 98.46%. Jika diasumsikan terbentuk 5 gerombol maka nilai minimum sebesar 99.30%, median sebesar 99.52%, dan maksimum sebesar 99.64%. Berdasarkan hasil dari data-data tersebut terlihat pola nilai R2adj yang sama, yaitu nilainya akan semakin tinggi seiring besarnya asumsi banyaknya gerombol. Walau demikian, analisis ini sudah mampu memperoleh nilai R2adj yang mendekati R2adj* dari masing-masing data. Hal tersebut dapat dilihat dari nilai maksimum untuk gerombol yang terbentuk sebanyak 2 gerombol.

Banyaknya gerombol yang sesuai dengan data bangkitan diharapkan mempunyai nilai R2adj paling tinggi atau selalu berada pada urutan paling atas jika diurutkan berdasarkan nilai R2adj. Tabel 6 menampilkan urutan gerombol hasil pendugaan dari 30 kali ulangan pada data bangkitan dengan 2 gerombol. Pada data 1, jika diprediksi terbentuk 2 gerombol maka hasilnya menempati urutan terakhir sebanyak 19 kali dan tidak memiliki nilai R2adj paling tinggi, sedangkan jika terbentuk 5 gerombol hasilnya menempati urutan teratas sebanyak 21 kali. Dengan kata lain, jika diasumsikan ada 2 gerombol hasilnya hampir selalu berada pada urutan terakhir atau nilai R2adj paling kecil. Pola urutan yang terlihat dari 30 ulangan tersebut menunjukkan semakin banyak gerombol yang diduga akan menghasilkan nilai R2adj dugaan yang semakin tinggi pula seperti yang diperlihatkan pada Tabel 5.

Kemampuan analisis RLB dengan pendekatan AG membentuk gerombol pada data sudah cukup baik. Pada data 1 dengan asumsi terbentuk 2 gerombol dan nilai R2adj yang paling tinggi, tidak ada kesalahan penggerombolan data yang dapat dilihat di Lampiran 3. Pada data tersebut terdapat 55 amatan yang termasuk ke dalam gerombol 1 dan 45 amatan yang termasuk ke dalam gerombol 2. Hasil pendugaan juga menunjukkan jumlah yang sama, yaitu 55 amatan untuk gerombol 1 dan 45 amatan untuk gerombol 2. Hal ini menunjukkan penggerombol sudah sesuai dengan gerombol yang ada pada data. Sama halnya untuk data 2 yang dapat

(24)

14

dilihat di Lampiran 4. Penggerombolan amatan pada data 3 terjadi kesalahan penggerombolan amatan jika diasumsikan ada 2 gerombol. Dari 55 amatan yang sebenarnya termasuk gerombol 1, ada 1 amatan yang dimasukkan ke dalam gerombol 2. Dari 45 amatan yang termasuk gerombol 2, 2 diantaranya dimasukkan ke dalam gerombol 1 seperti disajikan pada Lampiran 5. Berdasarkan Lampiran 1 terlihat sebaran data antara peubah Y dan X2 untuk data 3 membentuk

perpotongan jika dibuat garis regresi. Hal ini yang menyebabkan terjadi kesalahan penggerombolan. Karena AG bersifat stokastik maka hasilnya dapat berbeda untuk setiap kali menjalankan program tersebut.

Pendugaan parameter dengan analisis regresi linier klasik dan RLB dengan pendekatan AG dilakukan untuk masing-masing 500 data yang berbeda. Hasil pendugaan parameter menggunakan regresi klasik pada data dengan 2 gerombol disajikan pada Tabel 7. Hasil pendugaan pada data 1 menunjukkan rata-rata nilai

R2adj sebesar 54.66% yang dapat dikatakan sangat kecil untuk ukuran kebaikan suatu model. Karena parameter yang digunakan untuk membangkitkan data terdiri atas 2 gerombol sehingga b0 hasil dugaan dan parameternya berbias. Namun pada

data ini pendugaan dengan regresi klasik menghasilkan b1 dan b2 yang mendekati

parameternya karena bentuk hubungan linier antara gerombol 1 dan 2 adalah sejajar. Dilihat dari besarnya nilai b0 yang diperoleh, diperkirakan jika dibuat garis

regresi maka garis tersebut akan berada di antara gerombol 1 dan 2.

Kebaikan persamaan regresi hasil pendugaan menggunakan regresi klasik pada data 2 rata-ratanya adalah 5.55% yang jauh lebih kecil dibandingkan nilai

R2adj dari data 1. Hal tersebut karena bentuk hubungan linier antara peubah Y dan X tidak sejajar dan juga menyebabkan koefisien regresi berbeda cukup jauh dari parameternya. Jika dibuat garis regresi seperti pada data 1 di atas maka garis tersebut juga akan berada di antara gerombol 1 dan 2. Pada data 3 rata-rata nilai

R2adj lebih besar dibandingkan dengan hasil pendugaan pada data 2 namun masih termasuk nilai yang sangat kecil untuk ukuran kebaikan suatu model. Nilai

Tabel 7 Pendugaan parameter data dengan 2 gerombol (regresi linier klasik)

Data Statistik b0 b1 b2

R2adj (%)

1 Rata-rata 104.64 -7.53 18.77 54.66

Galat baku 358.15 7.27 1.78 5.30

Parameter gerombol 1 155.80 -7.65 18.76 Parameter gerombol 2 6.50 -7.65 18.76

(25)

15 parameter dugaan yang diperoleh dari analisis regresi klasik pada data ini juga berbias karena parameter yang digunakan untuk membangkitkan terdiri atas 2 gerombol. Nilai b1 dan b2 negatif yang menandakan bahwa hubungan linier antara

Y dengan X1 dan X2 negatif, padahal bentuk hubungan linier antara Y dan X2

adalah positif.

Selanjutnya, hasil pendugaan parameter menggunakan analisis RLB dengan pendekatan AG disajikan pada Tabel 8 yang menunjukkan hasil yang diperoleh dari data dengan 2 gerombol. Rata-rata nilai ukuran kebaikan model pada data 1, baik untuk masing-masing gerombol maupun secara keseluruhan, sangat tinggi dibandingkan dengan hasil yang diperoleh dari analisis regresi linier klasik. Rata-rata nilai b0 yang dihasilkan masih cukup jauh berbeda dengan parameternya yang

menandakan bahwa nilainya tidak kekar. Namun untuk nilai b1 dan b2 yang

dihasilkan sudah cukup baik karena mendekati parameternya. Hasil serupa juga diperoleh pada data 2 yang menghasilkan rata-rata R2adj tinggi dan koefisien regresi yang mendekati parameternya. Nilai b0 yang diperoleh dari data-data ini

berbeda jauh dengan parameternya, tapi nilai b1 dan b2 sudah mendekati

parame-ternya. Rata-rata R2adj juga sangat tinggi dibandingkan dengan hasil yang diperoleh dari analisis regresi linier klasik yang hanya memiliki rata-rata sebesar 14.66%. Hasil pendugaan parameter dengan analisis ini terhadap data 3 menghasilkan nilai b0, b1, dan b2 yang sudah mendekati parameternya. Nilai R2adj secara keseluruhan dan masing-masing gerombol juga sangat tinggi. Nilai galat baku dari Tabel 8 lebih kecil dan parameter dugaan untuk data-data tersebut juga lebih dekat dibandingkan dengan hasil regresi linier klasik. Berdasarkan hasil

Tabel 8 Pendugaan parameter data dengan 2 gerombol (RLB-AG)

(26)

16

tersebut, analisis RLB dengan pendekatan AG mampu menghasilkan pendugaan parameter yang lebih baik pada data bergerombol dibandingkan dengan analisis regresi linier klasik.

Hasil yang diperoleh dari 30 ulangan analisis RLB dengan pendekatan AG pada data dengan 3 gerombol tidak jauh berbeda dari pola yang diperoleh pada data dengan 2 gerombol. Pada Tabel 9 disajikan urutan gerombol berdasarkan nilai R2adj untuk data 1. Hasil tersebut menunjukkan semakin besar asumsi banyaknya gerombol akan menghasilkan R2adj yang lebih tinggi, sehingga gerom-bol 3 sebagian besar berada pada urutan ke-3. Pola ini masih sama dengan pola yang diperoleh dari data dengan 2 gerombol (Tabel 6). Penggunaan R2adj sebagai fungsi kesuaian belum mampu memberikan hasil penentuan gerombol optimum dengan baik.

Pendugaan parameter pada data dengan 3 gerombol menggunakan regresi linier klasik disajikan pada Tabel 10. Sama halnya dengan Tabel 7, untuk data 1 menunjukkan bahwa nilai b1 dan b2 mampu mendekati parameternya karena

bentuk hubungan linier antar gerombol adalah sejajar (Lampiran 2). Namun nilai b0 tidak mampu diduga dengan baik sehingga hasilnya berbias dan nilai R2adj yang diperoleh juga sangat kecil. Parameter dugaan dari data 2 menggunakan analisis regresi linier klasik terlihat jauh berbeda dengan parameternya. Pendugaan parameter pada data seperti ini terlihat tidak efektif karena selain dugaan parameternya yang jauh menyimpang, ukuran kebaikan modelnya juga sangat kecil. Selain itu, b2 bernilai positif padahal ada satu model yang memiliki nilai

negatif. Hasil pada data 3 juga mempunyai parameter dugaan yang jauh menyim-pang dari parameternya dan nilai R2adj yang sangat kecil jika menggunakan analisis regresi linier klasik. Nilai b1 dan b2 keduanya bernilai positif padahal ada

parameter yang keduanya positif, keduanya negatif dan ada juga model dengan b1

negatif dan b2 positif. Berdasarkan hasil tersebut ternyata pendugaan analisis

regresi linier pada data bergerombol menghasilkan parameter yang berbias dan nilai R2adj yang sangat kecil.

Pendugaan parameter menggunakan analisis RLB dengan pendekatan AG pada data dengan 3 gerombol disajikan pada Tabel 11. Hasil untuk analisis pada data 1 memperlihatkan bahwa parameter dugaan sudah mendekati parameter yang digunakan untuk membangkitkan data, dan simpangannya juga cukup kecil dan nilai R2adj yang diperoleh juga cukup tinggi. Jika dibandingkan dengan hasil yang diperoleh dari analisis regresi klasik parameter dugaan yang diperoleh juga lebih baik dan nilai R2adj yang jauh lebih tinggi, tapi simpangan untuk b0 masih cukup

tinggi. Hasil pendugaan parameter pada data 2 juga menunjukkan parameter Tabel 9 Pendugaan gerombol optimal berdasarkan urutan pada data 1 dengan

(27)

17

dugaan yang sudah cukup mendekati parameter yang digunakan untuk membang-kitkan data. Nilai R2adj yang dihasilkan juga sangat tinggi baik untuk masing-masing gerombol maupun secara keseluruhan.

Selanjutnya untuk pendugaan parameter pada data 3 menghasilkan penduga-an ypenduga-ang juga cukup baik. Hasil parameter dugapenduga-an ypenduga-ang diperoleh sudah mendekati parameternya dan nilai R2adj yang sangat tinggi untuk masing-masing gerombol ataupun secara keseluruhan. Jika dibandingkan dengan hasil yang diperoleh dari analisis regresi linier klasik, hasil dari analisis RLB dengan pendekatan AG lebih baik dalam pendugaan parameter dan model yang dihasilkan juga memiliki ukuran kebaikan yang tinggi untuk data bergerombol. Penggunaan analisis RLB dengan pendekatan AG pada data seperti ini juga menghasilkan pendugaan parameter yang lebih baik dibandingkan dengan analisis regresi linier klasik. Namun galat baku yang diperoleh untuk semua b0 sangat besar. Hal ini

menunjuk-kan bahwa nilai pendugaan b0 tidak bersifat kekar (robust), sedangkan nilai b1 dan

b2 galat bakunya cukup kecil.

Waktu Proses

Waktu yang dibutuhkan untuk memproses data dengan 100 amatan, 2 peubah bebas dan asumsi gerombol antara 2 sampai 5 gerombol adalah sekitar 1 menit. Software yang digunakan adalah SAS versi 9.2 pada komputer personal dengan spesifikasi prosesor 2.0 GHz, RAM 2 GB dan sistem operasi Microsoft Windows 7 Ultimate 32-bit. Semakin banyak asumsi gerombol yang dicobakan maka waktu yang dibutuhkan pun semakin lama. Begitupun halnya jika amatan atau peubah bebas lebih banyak.

Tabel 10 Pendugaan parameter data dengan 3 gerombol (regresi linier klasik)

Data Statistik b0 b1 b2 R2adj(%)

1 Rata-rata 307.28 5.11 19.62 12.17

Galat baku 1111.06 22.89 5.27 6.17

Parameter gerombol 1 515.80 5.65 19.65 Parameter gerombol 2 209.00 5.65 19.65 Parameter gerombol 3 1.50 5.65 19.65

2 Rata-rata 324.40 -0.10 2.49 2.69

Galat baku 294.57 5.99 1.48 3.66

Parameter gerombol 1 105.80 1.76 8.76 Parameter gerombol 2 15.80 1.76 8.76 Parameter gerombol 3 1186.50 -7.57 -16.96

3 Rata-rata -190.02 2.87 3.83 0.36

Galat baku 1136.80 23.36 5.34 2.35

(28)

18 Tabel 11 Pendugaan parameter data dengan 3 gerombol (RLB-AG)

Data Statistik

Gerombol 1 Gerombol 2 Gerombol 3

b0 b1 b2

R2adj

(%) b0 b1 b2

R2adj

(%) b0 b1 b2

R2adj (%) 1 Rata-rata 514.33 6.25 18.44 97.28 267.41 5.82 17.09 93.79 0.43 6.10 19.89 96.02

Galat baku 109.19 4.78 7.08 1.94 1196.52 28.14 26.47 5.25 90.76 5.34 10.49 4.21 Rata-rata

R2adj (%)

95.67

Parameter

gerombol 515.80 5.65 19.65 209.00 5.65 19.65 1.50 5.65 19.65

2 Rata-rata 0.44 -2.83 13.59 96.22 -20.24 -0.74 -5.34 98.58 -24.60 0.27 4.00 98.56 Galat baku 875.43 18.96 12.25 4.87 184.19 4.21 7.09 1.96 466.25 11.93 13.88 2.86 Rata-rata

R2adj (%)

97.86

Parameter

gerombol 0.80 -1.76 12.88 -19.00 -1.26 -5.76 -16.50 0.57 3.96

3 Rata-rata 121.38 1.34 8.45 95.94 16.20 3.01 7.74 93.65 1204.99 -9.76 -12.89 98.47 Galat baku 281.97 3.24 7.77 5.08 427.17 8.34 9.22 4.83 105.15 6.02 7.31 3.05 Rata-rata

R2adj (%) 94.53

Parameter

(29)

19 Diskusi

Dari segi waktu, analisis RLB dengan pendekatan AG ini mampu mengha-silkan solusi terbaik dalam yang waktu relatif singkat. Penerapan program pada data berukuran kecil membutuhkan waktu sekitar 1 menit hingga proses selesai. Namun, jika diterapkan pada data besar maka dibutuhkan waktu yang lebih lama. Pada data berukuran sedang dibutuhkan waktu sekitar 1 jam untuk melakukan analisis ini hingga selesai, sedangkan pada data berukuran besar dibutuhkan waktu lebih dari 5 jam tetapi tidak mencapai konvergen. Nopiah et al. (2010) menyatakan bahwa kompleksitas waktu proses dari AG adalah linier terhadap banyaknya iterasi atau generasi.

Analisis RLB dengan pendekatan AG menggunakan program SAS/IML, SAS/Base, dan SAS Macro mampu menghasilkan solusi terbaik. Namun, dalam praktiknya dibutuhkan beberapa kali ulangan untuk memeroleh hasil terbaik. Jika hanya dilakukan satu kali ulangan maka hasil yang diperoleh mungkin bukan solusi optimal. Nugroho (2008) tentang pencarian jalur alternatif menyatakan bahwa penggunaan bilangan acak pada AG menyebabkan beberapa kali pencarian tidak menghasilkan solusi optimal. Oleh sebab itu, diperlukan beberapa kali ulangan untuk mendapatkan solusi optimum. Program yang digunakan untuk analisis RLB dengan pendekatan AG ini masih mempunyai keterbatasan. Beberapa diantaranya adalah penentuan besarnya peluang mutasi, banyaknya peubah penjelas, banyaknya asumsi gerombol yang dicobakan, fungsi kesuaian yang berpengaruh terhadap hasil penentuan gerombol optimum, dan banyaknya amatan.

SIMPULAN DAN SARAN

Simpulan

Berdasarkan hasil yang diperoleh, kemampuan analisis RLB dengan pende-katan AG dapat dikatakan sudah baik karena analisis ini mampu mencari nilai

(30)

20

Saran

Pada penelitian selanjutnya dibutuhkan penerapan teknik atau metode lain untuk mengetahui banyaknya gerombol optimum. Misalnya fungsi kesuaian yang digunakan adalah A = R2adj – P, dengan P adalah sebuah nilai penalti yang lebih besar dari 0 jika gerombol yang diasumsikan tidak sesuai. Banyaknya asumsi gerombol yang dicobakan juga dapat ditambah. Inisialisasi populasi awal dapat menggunakan teknik atau metode lain sehingga waktu proses metode ini akan lebih cepat. Program untuk analisis RLB dengan pendekatan AG disusun menggunakan SAS/Base, SAS/IML, dan SAS Macro. Program tersebut dapat dilihat di http://bit.ly/CLRwGA.

DAFTAR PUSTAKA

Angga K, Lestari J. 2012. Penerapan Algoritma Genetik pada Proses Penyusunan Kelompok Belajar di Sekolah. BIT. 9(1).

Antoniou A, Lu WS. 2007. Practical Optimization: Algorithms and Engineering Applications. New York(US) : Springer.

Ari B, Guvernir HA. 2002. Clustered Linear Regression. Knowledge-Based System. 15:169-175.

Barman K, Dabeer O. 2011. Clustered Regression with Unknown Cluster. arXiv. 1103.4480v1.

Haupt RL, Haupt SE. 2004. Practical Genetic Algoritms. Canada(US) : John Wiley & Sons, Inc.

Liliana. 2006. Implementasi Algoritma Genetika untuk Desain Ruang dalam Rumah. Seminar Nasional Sistem dan Informatika[Internet]. 2006 Nop 17. Bali

(ID); [diunduh 2014 Feb 19]. Tersedia pada:

https://yudiagusta.files.wordpress.com/2009/11/73-76-snsi06-12-implementasi-algoritma-genetika-untuk-desain-ruang-dalam-rumah.pdf

Nopiah ZM, Khairir MI, Abdullah S, Baharin MN, Arifin A. 2010. Time Complexity Analysis of the Genetic Algorithm Clustering Method. Proceeding Recent Advances In Signal Processing, Robotics And Automation[Internet]. [Waktu dan tempat pertemuan tidak diketahui]. Tersedia pada: http://www.wseas.us/e-library/conferences/2010/Cambridge/ISPRA/ISPRA-28.pdf

Nugroho WT, Purwadi J, Haryono NA. 2008. Algoritma Genetika dalam Pencarian Jalur Alternatif. Jurnal Informatika. 4(1):61-68

Sartono B. 2010. Pengenalan Algoritma Genetik untuk Pemilihan Peubah Penjelas dalam Model Regresi Menggunakan SAS/IML. Forum Statistika dan Komputasi. 15(2):10-15.

Sarwadi, Anjar KSW. 2004. Algoritma Genetika untuk Penyelesaian Masalah Vehicle Routing. Jurnal Matematika dan Komputer. 7(2):1-10.

(31)

21 Lampiran 1 Sebaran data pada data dengan 2 gerombol

Data 1

Data 2

Data 3

(32)

22

Lampiran 2 Sebaran data pada data dengan 3 gerombol Data 1

Data 2

(33)

23 Lampiran 3 Jumlah anggota gerombol hasil penggerombolan pada data 1

Gerombol aktual

Gerombol hasil dugaan

1 2 3 4 5

2 gerombol

1 55 0

2 0 45

3 gerombol

1 35 0 20

2 0 45 0

4 gerombol

1 48 4 3 0

2 0 4 5 36

5 gerombol

1 8 10 8 16 13

(34)

24

Lampiran 4 Jumlah anggota gerombol hasil penggerombolan pada data 2 Gerombol

aktual

Gerombol hasil dugaan

1 2 3 4 5

2 gerombol

1 55 0

2 0 45

3 gerombol

1 23 32 0

2 0 0 45

4 gerombol

1 0 49 3 3

2 39 0 3 3

5 gerombol

1 16 0 18 21 0

(35)

25 Lampiran 5 Jumlah anggota gerombol hasil penggerombolan pada data 3

Gerombol aktual

Gerombol hasil dugaan

1 2 3 4 5

2 gerombol

1 54 1

2 2 43

3 gerombol

1 1 32 22

2 43 0 2

4 gerombol

1 29 2 23 1

2 0 8 1 36

5 gerombol

1 0 1 26 1 27

(36)

26

RIWAYAT HIDUP

Penulis dilahirkan di Bekasi pada tanggal 25 Nopember 1991. Putra pertama dari pasangan Bapak Hasim dan Ibu Anis. Tahun 2009 penulis lulus dari SMAN 2 Cikarang Utara dan pada Bulan Agustus di tahun yang sama diterima sebagai mahasiswa Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor (FMIPA IPB) melalui jalur Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN).

Selama mengikuti perkuliahan penulis menjadi tim pengajar Kalkulus Tingkat Persiapan Bersama (TPB) di lembaga Bimbingan Belajar Mafia Clubs pada tahun 2010. Penulis juga aktif menjadi anggota kepanitiaan kompetisi dan seminar nasional Statistika Ria 2011. Disamping itu, penulis menjadi asisten praktikum mata kuliah Komputasi Statistika yang membahas penggunaan perangkat lunak SAS dan R pada semester ganjil tahun 2011/2012 dan 2014/2015.

Gambar

Gambar 1  Ilustrasi teknik pindah-silang dan mutasi
Tabel 1  Parameter regresi data 2 gerombol
Tabel 2  Parameter regresi data 3 gerombol
Gambar 2  Bagan alir analisis RLB dengan pendekatan AG
+7

Referensi

Dokumen terkait

Analisis regresi model II dengan menggunakan metode pendugaan ordinary least product merupakan metode pendugaan yang terbaik dibandingkan dengan kedua metode pendugaan

Masalah pendugaan parameter pada analisis regresi linier berganda merupakan masalah yang menarik pada beberapa penelitian, yaitu penelitian yang memiliki tujuan utama untuk

Analisis regresi model II dengan menggunakan metode pendugaan ordinary least product merupakan metode pendugaan yang terbaik dibandingkan dengan kedua metode pendugaan

Dari Tabel 4.1 dapat dilihat bahwa nilai estimasi parameter regresi klasik memberikan hasil yang berbeda dengan analisis regresi kuantil sehingga analisis regresi klasik

Setelah data di-input kedalam software SPSS, maka langkah selanjutnya adalah melakukan estimasi (pendugaan) model (persamaan) regresi linier, baru dilanjutkan dengan pengujian

Bentuk fungsi parameter model regresi asymptotic dapat dipisah, sehingga dalam pendugaan parameternya menggunakan Metode Kuadrat Terkecil (MKT) untuk parameter linier dan MKT

Dokumen ini menyajikan hasil uji asumsi klasik untuk regresi linier, termasuk uji linieritas dan uji

Deskripsi Mata kuliah ini membicarakan model regresi linier sederhana pendugaan parameter, interpretasi koefisien regresi, pengujian hipotesis, prediksi, dan koefisien determinasi,