• Tidak ada hasil yang ditemukan

PEMBENTUKAN POHON KLASIFIKASI DENGAN METODE CHAID

N/A
N/A
Protected

Academic year: 2021

Membagikan "PEMBENTUKAN POHON KLASIFIKASI DENGAN METODE CHAID"

Copied!
6
0
0

Teks penuh

(1)

Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 02, No. 1 (2013), hal 45– 50.

45

PEMBENTUKAN POHON KLASIFIKASI

DENGAN METODE CHAID

Yustisia Wirania, Muhlasah Novitasari Mara,Dadan Kusnandar INTISARI

Masalah klasifikasi sering dijumpai pada kehidupan sehari-hari baik mengenai sosial, industri, kesehatan maupun perbankan. Salah satu cara untuk melakukan klasifikasi tersebut adalah dengan menggunakan pohon keputusan dengan metode CHAID (Chi-Squared Automatic Interaction Detection). Metode CHAID dapat memberikan informasi mengenai adanya asosiasi dan interaksi antar variabel independen yang sangat berguna dalam penyusunan model. Metode CHAID menghasilkan diagram pohon yang menyediakan informasi tentang hubungan antara variabel dependen dan variabel independen. Uji yang digunakan untuk menghasilkan diagram pohon adalah uji Chi-Square dan koreksi Bonferroni. Dalam penelitian ini digunakan data hasil usaha tani Desa Sebubus Kecamatan Paloh Kabupaten Sambas tahun 2008 sebagai contoh aplikasi, dengan rata-rata pendapatan masyarakat sebagai variabel dependen. Berdasarkan hasil analisis metode CHAID diperoleh tiga variabel independen yang mempengaruhi rata-rata pendapatan, yaitu luas lahan, hasil produksi dan jumlah modal.

Kata Kunci : pohon keputusan, CHAID, Chi-Square, koreksi Bonferroni. PENDAHULUAN

Pohon keputusan merupakan teknik yang dapat digunakan untuk melakukan klasifikasi terhadap sekumpulan objek. Beberapa model pohon keputusan yang sudah dikembangkan antara lain adalah C5.0, ID3, C4.5, CHAID dan CART. Dalam penelitian ini digunakan metode CHAID untuk mengkaji data yang variabelnya berbentuk kategori. Metode CHAID telah diterapkan dalam berbagai bidang, misalnya pada tahun 1998 Alamudi, et.al menggunakan metode CHAID untuk menganalisis keterkaitan struktural dalam data hasil survei. Dalam penelitian tersebut metode CHAID digunakan untuk melihat hubungan antara faktor keadaan rumah tangga dengan status keamanan pangan rumah tangga. Penelusuran penciri status keamanan pangan rumah tangga pedesaan menurut variabel-variabel keadaan rumah tangga dengan metode CHAID dalam kasus ini secara efisien dapat menentukan variabel-variabel independen yang mempengaruhi variabel dependen. Dari 12 variabel yang digunakan sebelumnya diperoleh tujuh variabel yang mempengaruhi variabel dependen [1]. Dalam penelitian lainnya metode CHAID digunakan untuk melihat interaksi antara karakteristik konsumen dengan seni pertunjukan yang ada di luar negeri atau dalam negeri. Data dikumpulkan melalui survei online dengan lima bagian karakteristik yang cenderung menghadiri seni pertunjukan, masing-masing segmen dilihat persentase respondennya. Uji Chi-Square digunakan untuk menguji perbedaan yang signifikan antara segmen yang satu dengan segmen sasaran yang akan diidentifikasi [2]. Aplikasi metode CHAID lainnya adalah dalam menentukan segmentasi nasabah berdasarkan status kredit. Hasil dari penelitian tersebut adalah nasabah yang memiliki resiko kredit macet paling rendah berjenis kelamin perempuan, berusia diatas 30 tahun dengan penghasilan rata-rata kurang dari Rp1.500.000,00 [3]. Aplikasi metode CHAID selanjutnya yaitu penelitian tentang perbandingan metode CHAID dan CART pada kasus prediksi resiko kredit dan prediksi hipertensi esensial berdasarkan analisis masing-masing metode. Hasil analisis memiliki tingkat keakuratan prediksi resiko kredit yang berbeda, yaitu dengan metode CART 87,27% dan metode CHAID 87,15% [4]. Dalam penelitian lainnya tahun 2007 Kunto dan Khoe menggunakan metode CHAID untuk melihat peminat produk kosmetik facial wash pada pria. Sebanyak 20% pengguna facial wash merasa tidak puas

(2)

dengan kemampuan facial wash untuk melembutkan wajah dan 80% menyatakan puas terhadap kemampuan facial wash untuk melembutkan wajah [5].

Dalam penelitian ini metode CHAID digunakan untuk mengkaji pembentukan pohon klasifikasi, dengan contoh aplikasi data hasil usaha tani desa Sebubus Kecamatan Paloh Kabupaten Sambas tahun 2008. Variabel dependen yang digunakan dalam penelitian ini berskala ordinal. Hasil analisis metode CHAID dari variabel dependen dan variabel independen yang berhubungan membentuk diagram pohon CHAID. Bagian utama dari metode CHAID adalah Square dan koreksi Bonferroni,

Chi-Square berfungsi untuk menganalisis hubungan antara variabel dependen dengan masing-masing

variabel independen. Sedangkan koreksi Bonferroni adalah koreksi yang digunakan untuk kategori variabel independen lebih dari dua dan bergantung pada skala variabel kategori yaitu nominal atau ordinal.

METODE CHAID

Metode CHAID digunakan untuk menduga variabel dependen berdasarkan variabel-variabel independen. Tahapan yang harus dilakukan dalam analisis CHAID untuk menghasilkan sebuah diagram pohon pada dasarnya melalui tiga tahap yaitu penggabungan, pemisahan, dan penghentian. Pada tahap pengabungan dibentuk tabel kontingensi dari variabel dependen dan variabel independen yang telah dikategorikan. Uji Chi-Square digunakan untuk menganalisis hubungan antara variabel dependen dengan masing-masing variabel independen. Hipotesis yang diuji adalah sebagai berikut:

H0: Kedua variabel bebas statistik

H1: Kedua variabel tidak bebas statistik

Pasangan hipotesis tersebut diuji dengan statistik uji Chi-Square yang dihitung dengan rumus berikut [3] :

dimana Ork dan erk masing-masingadalahjumlah pengamatan dan nilai harapan pada baris ke-r dan kolom ke-k. Kriteria pengujian hipotesisnya adalah tolak H0 jika χ²hitung > χ²tabel;0,05 dengan derajat bebas

adalah ( )( ). Jika nilai χ²hitung tidak mencapai taraf signifikan 0,05 gabungkan kedua

kategori menjadi satu kategori campuran. Pengujian hipotesis dilakukan terhadap seluruh kombinasi pasangan variabel dependen terhadap variabel independen. Diantara pasangan-pasangan yang tidak signifikan gabungkan satu pasangan kategori yang paling mirip (nilai χ² terkecil berpasangan dengan nilai χ² terkecil selanjutnya) menjadi satu kategori tunggal. Jika semua pasangan kategori yang tersisa adalah signifikan maka hitung koreksi Bonferroni berdasarkan pada tabel kontingensi yang telah digabung dan nilainya dijadikan taraf uji signifikan. Untuk menentukan persamaan koreksi Bonferroni terlebih dahulu dihitung pengali Bonferroni. Nilai pengali Bonferroni tersebut dihitung berdasarkan tipe variabelnya. Jika skala pengukuran variabelnya merupakan skala ordinal maka nilai pengali Bonferroni dihitung sebagai berikut :

 

1

   

!

1 1

! ! 1 1 1                g c g c g c B

dimana c adalah banyak kategori variabel independen awal ke-i; g adalah banyak kategori variabel independen ke-i setelah penggabungan; dan i adalah 1,2,...,n. Apabila skala pengukuran variabelnya adalah skala nominal maka nilai pengali Bonferroni dihitung dengan rumus sebagai berikut :

2 1 1 2



 

mr k r n k rk rk rk hitung

e

e

o

(3)

  

      1 0 ! ! 1 1 g i c i i g i g B

Persamaan Bonferroni kemudian dihitung dengan rumus sebagai berikut [6]:

) 1 ( B   

dimana α adalah comparison-wise error rate (CWER), adalah family-wide error rate (FWER) dan

B adalah pengali Bonferroni.

Setelah dilakukan koreksi Bonferroni pada variabel independen yang memiliki lebih dari dua kategori, hitung nilai Chi-Square selanjutnya dengan menggunakan taraf signifikan dari hasil koreksi Bonferroni pada Persamaan (1). Tahap pemisahan, pada tahap ini pemisahan node menggunakan variabel independen yang memiliki nilai Chi-Square kurang dari sama dengan tingkat alpha. Jika tidak ada variabel independen dengan nilai yang signifikan tidak dilakukan pemisahan dan node tersebut akan menjadi node akhir. Tahap penghentian, kembali ke tahap penggabungan untuk variabel selanjutnya kemudian hentikan ketika semua kelompok variabel-variabel telah dianalisis. Setelah tidak didapatkan lagi variabel independen dengan masing-masing kategori yang signifikan, maka pembentukan pohon selesai.

Tabel 1. Variabel Independen Untuk Data Hasil Usaha Tani Desa Sebubus Kecamatan Paloh Kabupaten Sambas Tahun 2008

Variabel

Independen Kategori

Variabel

Independen Kategori

Jumlah keluarga 1. antara 0 sampai 5 1. 2. antara 6 sampai 11 Hasil produksi (kg) 1.antara 15 kg sampai 500 kg 2.antara 501 kg sampai 1000 kg 3.antara 1001 kg sampai 5000 kg Pendidikan terakhir 1. Tidak sekolah 2. Tidak tamat SD 3.SD 4.SMP 5.SMA 6.DII 7.S1 Biaya produksi 1. ≤ Rp1.000.000,00 2. > Rp1.000.000,00 Jumlah modal 1. 1. ≤ Rp490.000,00 2. > Rp490.000,00

Sumber modal 1.Sendiri 2. Agen Luas lahan(ha) 1. ≤0,30 ha 2. antara 0,33 ha sampai 0,83 ha 3. > 0,83 ha Penyuluhan 1.Ya 2.Tidak Status lahan 1. Milik Sendiri

2.Sewa

Masalah dalam Pemasaran

1.Kurang konsumen dan harga jatuh 2.Tidak kurang konsumen dan harga tidak jatuh

3.Kurang konsumen dan harga tidak jatuh

4.Tidak kurang konsumen dan harga tidak jatuh Biaya sewa 1. ≤ Rp700.000,00 2. > Rp700.000,00 Nama komoditas 1.Padi 2.Jagung 3.Timun 4.Kacang 5.Cabe 6.Karet Teknologi produksi 1.Tradisional 2.Semi intensif Sumber: [8]

(4)

KLASIFIKASI HASIL USAHA TANI DESA SEBUBUS DENGAN METODE CHAID

Dalam penelitian ini metode CHAID diterapkan pada data hasil usaha tani masyarakat Desa Sebubus Kecamatan Paloh Kabupaten Sambas tahun 2008. Variabel dependennya adalah rata-rata pendapatan dengan dua kategori, yaitu : kurang dari sama dengan Rp 8.460.000 dan lebih dari Rp 8.460.000 dan variabel independennya adalah jumlah keluarga, pendidikan terakhir, luas lahan, status lahan, biaya sewa, nama komoditas, hasil produksi, biaya produksi, jumlah modal, sumber modal, masalah dalam pemasaran, penyuluhan dan teknologi produksi dengan masing-masing kategori seperti yang terdapat pada Tabel 1 [8].

Gambar 1. Diagram Pohon Analisis CHAID Untuk Data Hasil Usaha Tani Desa Sebubus Kecamatan Paloh Kabupaten Sambas Tahun 2008

(5)

Dalam penelitian ini data hasil usaha tani masyarakat Desa Sebubus Kecamatan Paloh Kabupaten Sambas tahun 2008 dianalisis dengan metode CHAID dengan menggunakan program statistik SPSS versi 18 [9]. Metode CHAID menghasilkan sebuah diagram pohon klasifikasi yang menggambarkan pembentukan kelompok variabel independen yang mempengaruhi variabel dependen. Dalam penelitian ini ada 13 variabel independen yang digunakan, dari analisis CHAID menunjukkan bahwa hanya ada tiga variabel independen yang signifikan terhadap variabel dependennya. Diagram pohon hasil analisis CHAID pada Gambar 1 menjelaskan bahwa yang mempengaruhi rata-rata pendapatan adalah luas lahan, hasil produksi dan jumlah modal. Diagram pohon tersebut mempunyai tiga kedalaman, dimana variabel luas lahan membagi pendapatan rata-rata pada kedalaman ke-1, variabel hasil produksi pada kedalaman ke-2 dan variabel jumlah modal pada kedalaman ke-3. Variabel luas lahan merupakan variabel independen terbaik yang digunakan untuk menerangkan variabel rata-rata pendapatan sebagai variabel dependen.

PENUTUP

Dalam penelitian ini metode CHAD digunakan untuk menganalisis hasil usaha tani Desa Sebubus Kecamatan Paloh Kabupaten Sambas tahun 2008. Penerapan Metode CHAID dilakukan melalui tiga tahap yaitu penggabungan, pemisahan dan penghentian. Hasil klasifikasi data hasil usaha tani menunjukkan bahwa sebagian besar petani (95,6%) berpenghasilan kurang dari atau sama dengan Rp8.460.000,00 pertahun. Hal ini terjadi karena pada umumnya petani memiliki lahan yang kecil (0,33 ha-0,83 ha) dan modal yang kecil (≤ Rp490.000 ,00). Kejadian ini mengakibatkan hasil produksi usaha tani tidak maksimal (≤500 kg pertahun). Berdasarkan hasil analisis tersebut peningkatan pendapatan petani di wilayah tersebut dapat dilakukan melalui peningkatan kepemilikan modal dan penyediaan modal yang memadai.

DAFTAR PUSTAKA

[1] Alamudi, A; Wigena, A.H; Aunuddin. Eksplorasi struktur data dengan Metode CHAID. Forum

Statistika dan Komputasi. 1998; (3):10-15.

[2] Park, S.H and Huh, C. An Analysis of the Performing Arts Consumer Developing Market

Segments by Using CHAID, International CHRIE Conference Refereed Track,Event2; 2010.

[3] Kunto,Y.S. dan Hasana, S.N. Analisis CHAID Sebagai Alat Bantu Statistika untuk Segmentasi Pasar. Jurnal Manajemen Pemasaran. 2006; (1):88-97.

[4] Kadir, M.A. Perbandingan Performansi Algoritma Decision Tree CART dan CHAID, Sekolah Teknik Elektro dan Informatika. Bandung; 2004.

[5] Kunto, Y. S. dan Khoe, I. K. Analisis Pasar Pelanggan Pria Produk Facial Wash dikota Surabaya. Jurnal Manajemen Pemasaran. 2007; 2(1): 21-30.

[6] Wals, B. Multiple Comparisons: Bonferroni Corection and Fals Discovery Rates [internet]. 2004 [cited 2012 Apr 16].

Available from: http://nitro.biosci.arizona.edu/workshops/Aarhus2006/pdfs/Multiple.pdf

[7] Ritschard, G. CHAID and Earlier Supervised Tree Methods. Switzerland: Dept of Econometrics. University of Geneva; 2010.

[8] Khamaruzzaman. Aplikasi Classification and Regression Tree (CART) pada klasifikasi Data Hasil Usaha Tani. Pontianak: Jurusan Matematika Fakultas Matematika Ilmu Pengetahuan Alam Universitas Tanjungpura; 2011.

[9] Soleh, Z. A. Ilmu Statistika Pendekatan Teoritis dan Aplikatif disertai Contoh Penggunaan SPSS. Bandung: Rekayasa Sains; 2005.

(6)

YUSTISIA WIRANIA : FMIPA UNTAN Pontianak, yustisiawirania@yahoo.co.id MUHLASAH NOVITASARI MARA : FMIPA UNTAN Pontianak, novee_mara@yahoo.co.id DADAN KUSNANDAR : FMIPA UNTAN Pontianak, dadan_kusnandar@mipa.

Gambar

Tabel 1. Variabel Independen Untuk Data Hasil Usaha Tani Desa Sebubus                                         Kecamatan Paloh Kabupaten Sambas Tahun 2008
Gambar 1. Diagram Pohon Analisis CHAID Untuk Data Hasil Usaha Tani                      Desa Sebubus Kecamatan Paloh Kabupaten Sambas Tahun 2008

Referensi

Dokumen terkait

[r]

Menurut mayoritas ulama yang membolehkan KB, metode kontrasepsi atau alat KB yang dibolehkan adalah yang cara kerjanya mencegah kehamilan (man’ul haml) yang bersifat

SLB Bagian A, yaitu lembaga pendidikan yang memberikan pelayanan pendidikan secara khusus untuk peserta didik yang menyandang kelainan pada penglihatan (Tunanetra).. SLB Bagian B,

Faktor yangg menjadi pendukung humas dalam menyebarkan informasi kepada masyarakat bisa dikategorikan dalam empat hal, yaitu adanya sikap dan sifat rasa saling percaya

menunjukkan bahwa rata-rata kejadian kerusakan pisau pada mesin oil expeller harus ter- sedia sesuai dengan hasil MTTF yang telah dihi- tung, sehingga stok

Berdasarkan hal tersebut, penulis membantu pemilik Yofuku distro dengan mempromosikan melalui internet dengan cara membuat situs web Yofuku distro yang di desain dalam bentuk

Berdasarkan pada hasil tersebut, penerapan metode SQ3R pada pembelajaran Bahasa Indonesia dapat meningkatkan aktivitas belajar dan kemampuan membaca pemahaman

Berdasarkan masalah yang telah diidentifikasi pada saat observasi awal maka telah direncanakan metode pembelajaran pada siklus I ini adalah metode card