TINJAUAN PUSTAKA Bayesian Network - Analisis Tingkat Kesukaan Konsumen dengan Metode Bayesian

BN merupakan suatu model peluang grafis yang merepresentasikan suatu gugus peubah dan peluang bebasnya (Neapolitan 2004). Model ini didasarkan atas teorema Bayes. Teorema Bayes menyatakan jika S suatu ruang contoh dan {A1,.…, An} merupakan sekatan S dengan syarat P( ≠0, i=1, …, n;

 . Jika B merupakan suatu kejadian pada ruang contoh S dengan syarat P(B)≠0, maka secara matematis kaidah peluang Bayes dapat dituliskan sebagai berikut (Nasoetion & Rambe, 1984):

|

_∑ ^|_|

⁽¹⁾

Menurut Hassan (2007) diacu dalam Purwadi (2009), BN merupakan pasangan dari (G,P) di mana G=(N,E) adalah Directed Acylic Graph (DAG) atau graf berarah, sedangkan P adalah sebaran peluang bersyarat.

Gambar 1Graf berarah dengan nodeN={P,Q,R} dan edgeE={(P,Q),(P,R)}

PENDAHULUAN

Latar belakang

Analisis tingkat kesukaan konsumen terhadap suatu produk merupakan salah satu cara yang dilakukan produsen dalam mengevaluasi produk yang dikeluarkannya. Analisis ini memberikan penilaian pada berbagai aspek produk. Hasil penilaian konsumen ini merupakan hal penting untuk memperbaiki aspek mana yang harus ditingkatkan agar produknya tetap disukai para konsumen. Data yang digunakan umumnya berskala ordinal yang diperoleh melalui survei langsung pada konsumen. Metode yang selama ini banyak digunakan oleh instansi riset pemasaran adalah analisis regresi berganda. Namun demikian dalam penggunaannya sering dihadapkan dengan tidak terpenuhinya asumsi analisis regresi. Salah satu pendekatan yang dapat digunakan untuk menganalisis data berskala ordinal adalah Bayesian Network (BN).

BN merupakan pendekatan yang digunakan untuk mengetahui hubungan antar peubah dalam bentuk jaringan (networks). Metode ini cocok diterapkan pada data yang berskala ordinal. Metode BN yang sering digunakan adalah Simple Naïve Bayesian, akan tetapi metode ini mengasumsikan antar peubah penjelas saling bebas, sedangkan dalam kenyataannya asumsi kebebasan antar-peubah penjelas ini sering tidak terpenuhi sehingga berkembang berbagai metode alternatif untuk mengatasi kondisi ini.

Salah satu metode alternatif yang dapat digunakan adalah Semi Naïve Bayesian. Metode ini dibangun untuk mengurangi pengaruh ketidakbebasan antar peubah penjelas (Zeng & Web 2005). Lesmanawati (2008) menggunakan algoritma Backward Sequential Elimination (BSE) dan Forward Sequential Selection (FSS) dalam penelitiannya untuk mengklasifikasi nilai mutu ujian komprehensif mahasiswa Departemen Statistika IPB.

Metode alternatif yang lainnya adalah BN Terboboti (Weighted Bayesian Network). Metode ini dibangun dengan menggunakan suatu pembobot dalam menyusun struktur BN. Metode alternatif ini pernah digunakan oleh Purwadi (2009) dalam penelitiannya untuk penetapan daerah tertinggal. Algoritma yang digunakan adalah algoritma Maximum Spanning Tree dan Equivalence Classes.

Kedua metode alternatif tersebut digunakan saat kondisi peubah penjelas tidak

saling bebas. Penelitian ini akan membandingkan tingkat keakuratan klasifikasi yang lebih baik antara metode Semi-Naive Bayesian dan BNTerboboti.

Tujuan Tujuan penelitian ini adalah:

1. Menerapkan metode BN dalam analisis tingkat kesukaan konsumen pada suatu produk.

2. Membandingkan metode BN Terboboti (algoritma Maximum Spanning Tree dan Equivalence Classes) dan Semi-Naïve Bayesian (algoritma BSE dan FSS) dalam kemampuan mengklasifikasikan tingkat kesukaan pada kasus produk biskuit. 3. Menganalisis perubahan persentase

peubah respon akibat perubahan persentase peubah penjelas dan sebaliknya.

TINJAUAN PUSTAKA

Bayesian Network

 . Jika B merupakan suatu kejadian pada ruang contoh S dengan syarat P(B)≠0, maka secara matematis kaidah peluang Bayes dapat dituliskan sebagai berikut (Nasoetion & Rambe, 1984):

|

_∑ ^|_|

⁽¹⁾

Gambar 1Graf berarah dengan nodeN={P,Q,R} dan edgeE={(P,Q),(P,R)}

Martono (1990) menyebutkan suatu graf G=(N,E) terdiri atas dua gugus objek yaitu N=(n1,n2, n3,…) adalah suatu gugus tak

kosong yang unsur-unsurnya disebut simpul (node)dan gugus E=(e1,e2, e3,…) yaꜜg uꜜsur -unsurnya disebut sisi (edge), sedemikian sehingga masing-masing edge ek diidentifikasikan dengan pasangan tidak terurut (ni, nj).

Parents didefinisikan sebagai node yang dijadikan syarat dan child adalah node yang diberikan syarat. Pada Gambar 1 dapat dijelaskan bahwa P merupakan parent dari Q dan R atau dapat dijelaskan bahwa Q dan R merupakan child dari P.

Pembuatan model dalam BN melibatkan dua langkah yaitu:

1. Membuat struktur jaringan

Struktur jaringan dalam BN dibentuk dalam suatu graf. Sebuah graf terdiri dari kumpulan node dan edge. Node merupakan titik simpul dan edge merupakan garis yang menghubungkan titik node tersebut.

2. Mengestimasi nilai peluang setiap node. Algoritma Naïve Bayesian

Naïve Bayes merupakan salah satu algoritma pembangun struktur BN dengan asumsi antar peubah penjelas saling bebas (naive). Algoritma Naïve Bayesian bekerja secara sederhana dalam membangun model BN, yaitu dengan menghubungkan semua peubah penjelas ke peubah respon. Arah hubungan (edge) pada BN semuanya mengarah ke peubah respon karena asumsi naïve menyatakan bahwa peubah penjelas diasumsikan saling bebas. Struktur BN yang dibangun dengan algoritma ini dapat dilihat pada Gambar 2. Node P sebagai peubah respon dan node Q, R, dan S sebagai peubah penjelas.

Gambar 2 Struktur BN dengan algoritma naïve bayesian.

Langkah kerja algoritma Naïve Bayes menurut Frank et al. (1999) dalam membangun struktur BN sebagai berikut:

1. Seluruh peubah dalam keadaan diskret (jika ada peubah kontinu didiskretisasi terlebih dahulu).

2. Menentukan peubah respon.

3. Hubungkan semua peubah penjelas pada peubah respon dengan edge.

4. Semua arah edge peubah penjelas menuju ke peubah respon.

5. Menghitung peluang bersyaratnya. Semi Naïve Bayessian

Metode Semi Naive Bayesian secara garis besar dapat dibagi dalam dua kelompok. Kelompok pertama membangun simple naïve Bayesian dengan menggunakan sekumpulan peubah penjelas baru yang dapat dihasilkan dari proses deleting attributes dan joining attributes.Kelompok ini membangun struktur Bayesian dengan menyeleksi peubah yang memberikan keakuratan yang tinggi. Kelompok kedua membangun simple naive Bayesian dengan membuat struktur garis penghubung secara jelas di antara peubah-peubah penjelas yang menunjukkan hubungan ketidakbebasan (saling mempengaruhi) antar peubah penjelas (Zheng & Webb 2005).

Metode semi naïve Bayesian yang digunakan pada penelitian ini adalah deleting attributes. Zheng & Webb (2005) menjelaskan bahwa ada dua pendekatan yang dapat digunakan dalam deleting attributes, yaitu BSE dan FSS. Baik BSE maupun FSS memiliki tujuan yang sama, yaitu memilih atau menentukan himpunan bagian dari peubah penjelas yang dapat menyebabkan terjadinya peningkatan akurasi terbesar dari simple naive Bayesian.

BSE diawali dengan menggunakan keseluruhan set peubah penjelas, kemudian dilakukan proses eliminasi peubah yang dapat menyebabkan terjadinya peningkatan akurasi terbesar. Sedangkan FSS menggunakan cara yang berlawanan dengan BSE, yaitu diawali dengan gugus himpunan peubah penjelas yang kosong, kemudian dilakukan proses penambahan peubah yang dapat menyebabkan terjadinya peningkatan akurasi paling besar. Baik proses eliminasi maupun penambahan peubah terus dilakukan hingga tidak ada lagi peningkatan akurasi (Langley & Sage 1994; Zeng & Web 2005).

Himpunan bagian dari peubah-peubah yang terpilih diasumsikan saling bebas dan dinotasikan sebagai Attribute = {bg1, . . . , bgn}. sedangkan kategori-kategori pada peubah yang terpilih dinotasikan sebagai {g1,…, gn}. Kaidah klasifikasi pada BSE dan FSS

(2) dilakukan dengan memilih peluang bersama yang terbesar berdasarkan rumus:

∏ |

dengan:

arg max :.argumen yang memaksimumkan fungsi.

: peubah penjelas ke-j j=g1, ..., gn. gk : kategori ke-k dari peubah penjelas

yang terpilih

: peubah yang menjadi syarat : peluang prior kejadian

| : peluang kejadian b setalah a terjadi. Penjabaran langkah-langkah algoritma BSE dari Zeng & Web (2005) menurut Lesmanawati (2008) adalah sebagai berikut: 1. Diawali dengan proses klasifikasi simple

naive Bayesian dengan menggunakan seluruh peubah penjelas.

( P0 = p adalah banyaknya peubah penjelas awal ; P = P0 ; n = p-1; i = 1).

2. Hitung akurasi dugaan klasifikasi yang dihasilkan, notasikan sebagai C0.

3. Tentukan kombinasi n peubah penjelas yang mungkin terbentuk dari p peubah penjelas yang tersedia dengan cara mengeliminasi sebuah peubah penjelas. 4. Lakukan proses klasifikasi simple naïve

Bayesian untuk setiap kombinasi peubah penjelas yang telah terbentuk pada langkah ketiga serta hitung akurasi dugaan klasifikasinya.

5. Tentukan kombinasi peubah penjelas yang menghasilkan tingkat akurasi dugaan terbesar. Notasikan tingkat akurasi dugaan klasifikasi terbesar tersebut sebagai Ci. 6. Bandingkan Ci dengan C0 :

 Jika Ci ≤ C0, proses eliminasi peubah selesai.

 Jika Ci > C0, kembali ke langkah tiga untuk melanjutkan proses eliminasi peubah dari n peubah penjelas yang diperoleh pada langkah lima dengan menetapkan C0 = Ci ; n= n-1; p = p-1; i = i +1.

7. Proses eliminasi peubah penjelas berhenti jika semua peubah penjelas sudah tereliminasi.

Sedangkan penjabaran langkah-langkah akgoritma FSS dari Zeng & Web (2005) menurut Lesmanawati (2008) adalah sebagai berikut:

1. Diawali dengan set peubah penjelas kosong.

(P0 = 0 adalah banyaknya peubah penjelas mula-mula; n = P0+2; i = 1 ).

2. Tambahkan satu peubah penjelas dan lakukan proses klasifikasi simple naïve Bayesian dengan menggunakan satu peubah penjelas untuk setiap peubah penjelas yang tersedia.

3. Tentukan peubah penjelas yang menghasilkan tingkat akurasi dugaan klasifikasi terbesar. Notasikan tingkat akurasi dugaan terbesar tersebut sebagai C0.

4. Tambahkan kembali satu peubah penjelas sebagai dasar klasifikasi, lalu tentukan kombinasi n peubah penjelas yang mungkin terbentuk dari p peubah penjelas yang tersedia. Kombinasi harus mengandung peubah penjelas yang diperoleh pada langkah tiga.

5. Lakukan kembali proses klasifikasi simple naive Bayesian untuk setiap kombinasi peubah penjelas yang telah terbentuk pada langkah empat serta hitung akurasi dugaan klasifikasinya.

6. Tentukan kombinasi peubah penjelas pada langkah empat yang menghasilkan tingkat akurasi dugaan terbesar. Notasikan tingkat akurasi dugaan terbesar tersebut sebagai Ci.

7. Bandingkan Ci dengan C0 :

 Jika Ci ≤ C0, proses penambahan peubah berhenti/selesai.

 Jika Ci > C0, kembali ke langkah empat untuk melanjutkan proses penambahan peubah dari n peubah penjelas yang diperoleh pada langkah enam dengan menetapkan C0 = Ci ; n = n+1; i = i+1. 8. Proses penambahan peubah penjelas

berhenti jika semua peubah penjelas yang tersedia sudah masuk/sudah ditambahkan.

BN Terboboti

BN Terboboti adalah metode untuk menyususn struktur BN dengan menggunakan suatu nilai pembobot pada setiap edge. Nilai pembobot yang digunakan dapat berupa jarak, korelasi, dan kekuatan hubungan lainnya. Pada penelitian ini digunakan algoritma Maximum Spanning Tree dan Equivalence Classes.

Algoritma Maximum Spanning Tree

Maximum Spanning Tree adalah himpunan bagian dari suatu graf G yang tidak memiliki siklus namun memiliki node yang sama seperti G. Syarat Spanning tree adalah semua

node terhubungkan dan memiliki bobot (Munir 2003).

Penggunaan algoritma maximum spanning tree untuk analisis tingkat kesukaan adalah mencari bobot paling maksimum dari nilai korelasi. Korelasi yang digunakan adalah korelasi spearman karena datanya merupakan berskala ordinal. Korelasi menggambarkan kedekatan hubungan antara dua peubah sehingga semakin tinggi nilainya maka hubungan antara kedua peubah semakin kuat Terdapat dua jenis algoritma spanning tree, yaitu prim dan kruskal. Dalam penelitian ini digunakan algoritma prim.

Berdasarkan definisi yang dikemukakan Munir (2003), maka penjabaran langkah-langkah algoritma Maximum Spanning Tree dalam membangun BN adalah sebagai berikut:

1. Seluruh peubah dalam keadaan diskret (jika ada peubah kontinu didiskretisasi terlebih dahulu).

2. Mencari korelasi spearman seluruh peubah yang ada dan menggunakan korelasi tersebut sebagai bobot untuk setiap edge. 3. Memilih peubah penjelas yang memiliki

edge dengan bobot terbesar dengan peubah respon lalu menghubungkan kedua peubah tersebut dan menentukan arah edge. 4. Mencari edge dengan bobot terbesar

berikutnya. Edge antara peubah yang sudah terhubungkan pada langkah ke-3 dengan peubah lain yang belum terhubungkan namun bukan merupakan siklus

5. Menghubungkan peubah baru yang didapat pada langkah ke-4 dan menentukan arah edge.

6. Mengulangi langkah ke-4 dan ke-5 hingga seluruh peubah terhubungkan.

7. Menghitung peluang bersyaratnya. Algoritma Equivalence Classes

Jouffe (2008) menyatakan bahwa equivalence classes merupakan salah satu algoritma untuk membangun BN. Algoritma ini digunakan jika tidak diketahui hubungan antar peubah. Algoritma bekerja dengan cara menemukan hubungan berdasarkan pola data seperti spanning tree, sebelum membangun struktur BN equivalence classes terlebih dahulu menyeleksi peubah-peubah yang saling bebas terhadap semua peubah yang lainnya. Uji kebebasan khi-kuadrat digunakan oleh algoritma ini sebagai alat untuk menyeleksi peubah yang saling bebas sekaligus nilai khi-kuadrat sebagai bobot dalam membangun struktur BN.

Langkah-langkah algoritma equivalence classes sesuai definisi Jouffe (2008) dapat dijabarkan sebagai berikut:

1. Seluruh peubah dalam keadaan diskret (jika ada peubah kontinu didiskretisasi terlebih dahulu)

2. Menyeleksi peubah yang saling bebas dengan menggunakan uji khi-kuadrat 3. Mencari nilai uji khi-kuadrat terbesar lalu

menghubungkan peubah tersebut

4. Menentukan arah edge pada peubah yang terhubung

5. Mencari nilai khi-kuadrat terbesar berikutnya (dari peubah yang telah terhubung dengan peubah yang belum terhubung) namun tidak membentuk siklus, lalu menghubungkan peubah tersebut.

6. Menghitung peluang bersyarat.

METODOLOGI

Data

Data yang digunakan dalam penelitian ini adalah data yang didapatkan dari hasil survei suatu instansi riset pemasaran pada tahun 2011. Data ini merupakan data kecenderungan pemilihan suatu produk makanan oleh konsumen, pada penelitian ini kecenderungan pemilihan produk biskuit. Data tersebut terdiri dari sepuluh peubah. Tingkat kesukaan dipilih sebagai peubah respon (Y), dan sebagai peubah penjelas X1- X9 adalah:

X1 : Warna Produk X2 : Kekuatan Aroma X3 : Ketebalan Produk X4 : Kelembutan Produk X5 : Rasa Asin pada Produk X6 : Kekuatan Rasa Susu X7 : Rasa Keju

X8 : Kelezatan Produk

X9 : Kekuatan Rasa setelah dirasakan Masing-masing peubah terdiri dari sembilan kategori sebagai berikut:

1 : sama sekali tidak suka 2 : sangat tidak suka 3 : lumayan tidak suka 4 : agak tidak suka 5 : biasa saja 6 : agak suka 7 : lumayan suka 8 : sangat suka 9 : sangat suka sekali

Perangkat lunak yang digunakan untuk menyusun struktur BN dan mencari peluang bersyarat memiliki keterbatasan kapasitas, sehingga dilakukan pengkategorian ulang untuk semua peubah dengan melakukan