PREFER
MENGGUN
FAKULTAS MA
ERENSI KARAKTERISTIK KOPI 3
NAKAN METODE POHON REGRESI
KLASIFIKASI
FITRIYANTO
DEPARTEMEN STATISTIKA
ATEMATIKA DAN ILMU PENGETAHU
INSTITUT PERTANIAN BOGOR
BOGOR
2010
3 IN 1
ESI DAN
RINGKASAN
FITRIYANTO. Preferensi Karakteristik Kopi 3 in 1 Menggunakan Metode Pohon Regresi dan Klasifikasi. Dibimbing oleh AUNUDDIN dan LA ODE ABDUL RAHMAN.
Saat ini, banyak perusahaan yang berlomba-lomba memproduksi kopi 3 in 1. Hal ini menimbulkan tantangan bagi salah satu pihak perusahaan kopi 3 in 1, yaitu PT X yang memproduksi kopi X. Perusahaan ini harus lebih pandai menciptakan produk yang disukai masyarakat agar produknya laris di pasaran. Untuk mengetahui apakah produk sudah disukai oleh konsumen perlu dilakukan evaluasi produk. Tahap awal yang dapat dilakukan oleh PT X adalah eksplorasi data dengan membuat klasifikasi karakteristik kopi X. Analisis yang dapat digunakan untuk membuat klasifikasi adalah metode pohon regresi dan klasifikasi (classification and regression trees). Pohon regresi dan klasifikasi adalah salah satu metode eksplorasi data yaitu berupa teknik pohon keputusan. Pohon keputusan yang digunakan pada penelitian ini adalah pohon klasifikasi. Penelitian ini menghasilkan pohon klasifikasi optimum dengan peubah penjelas yang masuk kedalam pohon yaitu kekuatan aroma kopi dan kekuatan rasa susu. Hasil klasifikasi sebanyak tiga klasifikasi karakteristik kopi X dengan dua klasifikasi memiliki label kelas bahwa konsumen menyukai produk kopi X dan sisanya memiliki label kelas bahwa konsumen biasa saja terhadap produk ini.
PPREFERENSI KARAKTERISTIK KOPI 3 IN 1
MENGGUNAKAN METODE POHON REGRESI DAN
KLASIFIKASI
FITRIYANTO
Skripsi sebagai salah satu syarat untuk memperoleh
gelar Sarjana Statistika pada Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Pembimbing I,
Prof. Dr. Ir. Aunuddin, M.Sc
NIP.19470615 197106 1 001
Pembimbing II,
La Ode Abdul Rahman, S.Si, M.Si
Judul : Preferensi Karakteristik Kopi 3
in
1 Menggunakan Metode Pohon
Regresi dan Klasifikasi
Nama :
Fitriyanto
NRP :
G14061368
Menyetujui:
Mengetahui:
Ketua Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr. Ir. Hari Wijayanto, M.Si
NIP. 19650421 199002 1 001
KATA PENGANTAR
Puji dan syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas segala rahmat, hidayah, kemudahan, dan karunia-Nya sehingga skripsi yang berjudul “Preferensi Karakteristik Kopi 3 in 1 Menggunakan Metode Pohon Regresi dan Klasifikasi ” ini dapat diselesaikan dengan baik.
Pada kesempatan ini, penulis mengucapkan terima kasih kepada:
1. Bapak Prof. Dr. Ir. Aunuddin, M.Sc sebagai ketua komisi pembimbing atas kesabarannya
dalam membimbing dan memberi ide, saran serta kritik membangun selama penulisan karya
ilmiah ini.
2. Bapak La Ode Abdul Rahman, S.Si, M.Si selaku dosen pembimbing atas seluruh masukan dan
dukungan yang diberikan sehingga karya ilmiah ini dapat diselesaikan dengan baik.
3. Ibu Pika Silvianti selaku penguji luar atas kesediaannya memberikan saran dan membantu
penulis dalam menyempurnakan karya ilmiah ini.
4. Bapak Kelik Harjono dan M Mufti Mubarak yang telah bersedia membantu penulis untuk
memperoleh data yang digunakan dalam karya ilmiah ini.
5. Ibu Endang, Mba Susan dan suluruh Ibu pengasuh di Yayasan Namira yang telah membantu
membiayai kuliah penulis
6. Ibu dan kakak tersayang atas segala dukungan dan semangat yang tak henti-hentinya
selama ini.
7. Nurhayati atas diskusi dan semangatnya dalam membantu penulis menyelesaikan penulisan ini.
8. Teman-teman STK 43. “Terima kasih atas diskusi dan motivasinya.”
Penulis sangat berharap karya ilmiah ini dapat bermanfaat bagi penulis dan pembaca.
Bogor, Desember 2010
RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 18 Mei 1988 sebagai anak bungsu dari pasangan Bapak Wardaya dan Ibu Sutarni. Penulis mengawali pendidikan dasar pada tahun 1994 di SD Negeri 03 Petang Jakarta dan lulus pada tahun 2000. Penulis melanjutkan sekolah ke SLTP Negeri 131 Jakarta hingga tahun 2003. Selanjutnya, penulis menamatkan pendidikan menengah atas di SMA Negeri 49 Jakarta pada tahun 2006 dan pada tahun yang sama penulis diterima di Perguruan Tinggi Institut Pertanian Bogor melalui jalur SPMB dengan mayor Statistika dan minor Manajemen Fungsional.
DAFTAR ISI
Halaman
DAFTAR TABEL ... viii
DAFTAR GAMBAR ... viii
DAFTAR LAMPIRAN ... viii
PENDAHULUAN Latar Belakang ... 1
Tujuan ... 1
TINJAUAN PUSTAKA Pohon Regresi dan Klasifikasi ... 1
Pemilihan Pemilah ... 1
Penentuan Simpul Terminal ... 2
Penandaan Label Kelas ... 2
Penentuan Pohon Optimum ... 2
DATA DAN METODE Data ... 3
Metode ... 3
HASIL DAN PEMBAHASAN Deskripsi Peubah Respon ... 3
Analisis Pohon Klasifikasi Menggunakan Metode Pohon Regresi dan Klasifikasi ... 4
SIMPULAN DAN SARAN Simpulan ... 6
Saran ... 6
DAFTAR PUSTAKA ... 6
DAFTAR TABEL
Halaman
1 Statistik Deskriptif Kesukaan Konsumen terhadap Kopi X Secara Keseluruhan ... 3 2 Urutan Pohon Klasifikasi ... 4
DAFTAR GAMBAR
Halaman
1 Struktur Pohon Klasifikasi ... 1 2 Pohon Klasifikasi Optimum ... 4 3 Pohon Klasifikasi Hasil Pengembangan Satu Tahap dari Pohon Klasifikasi
Optimum ... 5
DAFTAR LAMPIRAN
Halaman
1 Karakteristik Peubah ... 8 2 Nilai Tingkat Salah Pengklasifikasian Pengganti Relatif Validasi Silang
Setiap Pohon ... 8 3 Pohon Klasifikasi Hasil Pengembangan Dua TahapdariPohon Klasifikasi
1
PENDAHULUAN
Latar Belakang
Saat ini banyak perusahaan yang
memproduksi kopi 3 in 1 dengan berbagai merek. Salah satu untuk jenis minuman ini adalah kopi X. Kopi X merupakan minuman kopi 3 in 1 susu, yaitu campuran antara kopi, gula dan susu yang diproduksi oleh PT X.
Banyaknya perusahan yang
berlomba-lomba memproduksi kopi 3 in 1,
mengakibatkan adanya persaingan yang ketat. Adanya persaingan menimbulkan tantangan bagi salah satu pihak perusahaan kopi 3 in 1, yaitu PT X. Pihak perusahaan minuman ini harus lebih pandai menciptakan produk agar produknya laris di pasaran.
Pada kenyataannya, sering kali suatu konsumen menginginkan produk dengan karakteristik tertentu. Oleh karena itu, PT X harus menciptakan produk yang disukai konsumen. Untuk mengetahui apakah produk sudah disukai oleh konsumen perlu dilakukan evaluasi produk.
Tahap awal yang dapat dilakukan oleh PT X adalah eksplorasi data. Eksplorasi data yang dapat dilakukan berbentuk klasifikasi. Analisis
yang dapat digunakan untuk membuat
klasifikasi adalah metode pohon regresi dan klasifikasi (classification and regression trees). Sedangkan untuk tahap selanjutnya dapat dilakukan dengan metode lain.
Tujuan
Tujuan penelitian ini adalah membuat klasifikasi karakteristik kopi X yang disukai menggunakan metode pohon regresi dan klasifikasi.
TINJAUAN PUSTAKA
Pohon Regresi dan Klasifikasi
Pohon regresi dan klasifikasi
(classification and regression trees) adalah salah satu metode eksplorasi data yaitu berupa
teknik pohon keputusan. Metode ini
dikembangkan oleh Leo Breiman, Jerome H. Friedman, Richard A. Olshen dan Charles J. Stone sekitar tahun 1980. Pohon regresi dan
klasifikasi merupakan pendekatan yang
populer untuk membangun klasifikasi
berdasarkan pohon biner (Mulier 1998). Metode ini akan menghasilkan pohon regresi
jika peubah responnya kontinu dan
menghasilkan pohon klasifikasi jika peubah responnya kategorik.
Pohon klasifikasi merupakan penyekatan
data secara berulang (rekursif) dan
menghasilkan sekatan yang biner, karena selalu membagi kumpulan data menjadi dua sekatan. Hal ini dapat ditunjukan dalam suatu gambar struktur pohon (Gambar 1).
Gambar 1 Struktur pohon klasifikasi
Menurut Breiman et al. (1993), pohon klasifikasi terdiri dari tiga elemen, yaitu:
1. Pemilihan pemilah.
2. Penentuan simpul terminal. 3. Penandaan label kelas.
Misalkan (X, y) merupakan peubah
penjelas dan peubah respon dengan X=(x1, x2,
..., xq)ЄRq tersusun dari q vektor penjelas dan
y={1, 2, ..., j} vektor label yang berkaitan, sehingga terdapat himpunan data L={(xn, jn),
n=1, 2, ..., N}. T dinamakan pohon klasifikasi sedangkan ∀t∈T dinamakan simpul pohon. Elemen minimum dari T dinamakan akar(T). Jika g,h∈T dan sisi kiri bagian simpul t
(g=l(h)) atau sisi kanan simpul t (g=r(h)), maka h dinamakan simpul induk (induk(g)) dan g dinamakan simpul anak (anak(h)). Jika
h=induk(g) atau h=induk(induk(g)), g dinamakan keturunan(h) dan h dinamakan tertua(g). Tt adalah himpunan bagian dari T yang memuat t dan seluruh keturunan t. Pemangkasan cabang Tt dari T dengan cara menghilangkan seluruh keturunan(t) dari T
yaitu potong seluruh Tt kecuali akar(Tt). Pohon
terpangkas dinotasikan dengan T-Tt
(Kardiana et al. 2006).
Pemilihan Pemilah
Pada tahap ini akan dicari pemilah yang menurunkan tingkat keheterogenan yang paling tinggi dari setiap simpul. Breiman et al.
(1993) menjelaskan bahwa impuritas
merupakan ukuran keheterogenan suatu
simpul. Fungsi impuritas yang dapat
digunakan adalah indeks Gini. Bila nilai impuritas suatu simpul semakin besar maka semakin heterogen simpul tersebut.
Node/ Simpul
A
ya
tidak
2
Nilai impuritas menggunakan indeks Gini pada simpul t, i(t), dapat ditulis sebagai berikut:
= 1 − ∑ |
dimana p(j|t) adalah peluang unit pengamatan dalam kelas ke-j berasal dari simpul t yang dinyatakan sebagai berikut:
| = /
∑ /
dengan adalah peluang awal kelas ke-j,
adalah banyaknya unit pengamatan yang termasuk dalam kelas ke-j, dan adalah banyaknya unit pengamatan yang termasuk dalam kelas ke-j pada simpul t.
Pemilahan dimulai dari ruang umum dengan cara memeriksa nilai-nilai dari setiap peubah penjelas. Misalkan untuk setiap peubah penjelas xq dimana xq ∈X, q=(1, 2, ...,
m). Untuk peubah penjelas yang dapat
diurutkan, pemilah peubah penjelas dilakukan dengan bentuk xq ≤ c lawan xq > c, c adalah bilangan riil . Jika peubah penjelas xq yang tidak dapat diurutkan dengan b kategori, dimana b∈{b1, b2,..., bd}, d adalah banyaknya
kategori peubah penjelas ke-q, maka b
kategori dibagi menjadi dua himpunan saling
lepas (akan terdapat sebanyak 2b-1-1
kemungkinan pemilah)
Misalkan terdapat calon pemilah s yang memilah t menjadi tL(dengan proporsi PL) dan menjadi tR (dengan proporsi PR), maka
kebaikan dari s didefinisikan sebagai
penurunan impuritas:
∆ , = – –
Pengembangan pohon dilakukan dengan cara, pada simpul t1, carilah s* yang
memberikan nilai penurunan impuritas
tertinggi yaitu:
∆ ∗, = max ∈! − −
dengan S adalah gugus yang berisi semua kemungkinan penyekatan.
Maka t1 dipilah menjadi t2 dan t3 menggunakan s*. Dengan cara yang sama dilakukan juga pencarian pemilah terbaik pada t2dan t3 secara terpisah, dan seterusnya.
Sehingga didapatkan penurunan
keheterogenan pohon dengan membelah
simpul t sebagai berikut:
∆" , = # − − $
dimana p(t) adalah peluang amatan berada pada simpul t yang dapat ditulis sebagai berikut:
= % /
Penentuan Simpul Terminal
Suatu simpul t akan menjadi simpul terminal atau tidak akan dipilah kembali, apabila adanya batasan minimum jumlah pengamatan. Umumnya jumlah pengamatan minimum pada simpul sebesar 5 dan terkadang berjumlah 1 (Breiman et al. 1993). Maka selanjutnya t tidak dipilah lagi tetapi dijadikan simpul terminal dan hentikan pembentukan pohon.
Penandaan Label Kelas
Label kelas dari simpul terminal
ditentukan berdasarkan aturan jumlah
terbanyak, yaitu jika P(j0|t) = max P(j|t), maka label kelas untuk terminal t adalah j0 (Breiman et al. 1993).
Penentuan Pohon Optimum
Breiman et al. (1993) menjelaskan bahwa pohon klasifikasi T tidak dibatasi ukurannya. Pohon klasifikasi terbesar memberikan nilai salah pengklasifikasian paling kecil sehingga kita akan selalu cenderung memilih pohon ini untuk prakiraan. Tetapi, pohon ini cukup kompleks dalam menggambarkan struktur data. Sehingga perlu dipilih pohon optimal
yang berukuran sederhana tetapi
memberikan tingkat salah pengklasifikasian pengganti yang kecil.
Salah satu cara penentuan pohon
klasifikasi dengan pemangkasan (pruning).
Pemangkasan berturut-turut memangkas
beberapa bagian pohon. Hal ini bertujuan untuk memperoleh pohon yang berukuran
sederhana. Ukuran pemangkasan yang
digunakan untuk memperoleh ukuran pohon yang optimum adalah biaya kompleksitas (cost-complexcity). Persamaan ukuran biaya kompleksitas adalah:
&' () = & () + '
|
(+ |
)dengan & (, adalah tingkat salah
pengklasifikasian pada pohon bagian Tk untuk k ≥ 1, (- adalah himpunan simpul terminal ,
3
terminal pada Tk, dan α adalah parameter
biaya kompleksitas.
Tingkat salah pengklasifikasian penggganti didapatkan dengan cara amatan induk Lyang berukuran n dibagi secara acak menjadi v
kelompok, yaitu L1, L2, ..., Lv yang sedapat mungkin berukuran sama. Himpunan data untuk membentuk pohon ke-v adalah L(v) = L -
Lv, dimana v = 1, 2, ..., V yang digunakan
untuk membentuk v urutan pohon T(v)(α).
Bila ukuran v besar, maka seharusnya
memiliki tingkat salah pengklasifikasian yang sama dengan T(α) = T(αk) = Tk. Tingkat salah pengklasifikasian pengganti T(α)
sebagai berikut:
&./ ( ' =1% 0 | )
1 1,
dengan N adalah banyaknya data pada L, c(i|j)
adalah biaya salah pengklasifikasian
responden kelas ke-j diklasifikasikan sebagai responden kelas ke-i.
dimana Ni j adalah banyaknya responden kelas ke-j diklasifikasikan sebagai responden kelas ke-i.
1 = % 1 (2)
2
dengan 1 (2) adalah banyaknya responden kelas ke-j diklasifikasikan sebagai responden kelas ke-i oleh T(v)(α).
Kemudian gunakan amatan induk L untuk membentuk urutan {Tk} dengan αk≤α <αk+1.
Definisikan '′, = 4',',5 maka tingkat salah pengklasifikasian pengganti validasi silang pada pohon bagian Tk sebagai
berikut:
&./((
,) = &./((('′,))
Hasil proses pemangkasan berupa sederet pohon klasifikasi Tk dan dengan validasi silang
v-lipatan dapat ditentukan pohon optimum Tk0 sebagai berikut:
&./((,6) = min
, (&./((,))
DATA DAN METODE
Data
Data yang digunakan untuk penelitian ini adalah data CLT (Central Location Test) untuk produk kopi 3 in 1 di beberapa kota di Indonesia yang didapat dari Pixel Research (PT. Global Insight Indonesia). Pengambilan
data dengan mengumpulkan beberapa
responden pada suatu tempat tertentu dan memberikan kopi X yang sudah dihidangkan kemudian responden menjawab pertanyaan pada lembar pertanyaan. Total responden sebanyak 415 orang dari tiga kota yaitu Bandung, Cimahi dan Sukabumi. Produk kopi yang dicobakan kepada responden merupakan produk kopi baru yang dilambangkan dengan produk kopi X. Semua responden merupakan peminum kopi 3 in 1 dengan merek tertentu.
Peubah respon merupakan peubah
kategorik yang bernilai 1 sampai 9 dengan skala ordinal. Responden yang suka dengan produk kopi X (y=3) terdiri dari skala 7 sampai 9, responden yang biasa saja dengan produk kopi X (y=2) terdiri dari skala 5 sampai 6, dan responden yang tidak suka dengan produk kopi X (y=1) terdiri dari skala 1 sampai 4.
Peubah penjelas merupakan peubah
kategorik yang bernilai 1 sampai 5 dengan skala ordinal. Peubah penjelas yang digunakan sebanyak sembilan peubah yang mencirikan karakteristik dari produk kopi 3 in 1 susu. Sembilan peubah penjelas tersebut adalah kekutan aroma kopi, warna, tekstur ampas, kekentalan, kekuatan rasa kopi, kekuatan aroma susu, kekuatan rasa susu, kepahitan, dan kemanisan.
Metode
Tahapan-tahapan yang dilakukan dalam penelitian ini adalah:
1. Melakukan analisis statistika deskriptif terhadap peubah respon.
2. Melakukan analisis pohon klasifikasi
menggunakan metode pohon regresi dan klasifikasi.
3. Melakukan intepretasi hasil.
Software yang digunakan untuk analisis adalah
CART ver 4.0 dan Answertree ver 3.0.
HASIL DAN PEMBAHASAN
Deskripsi Peubah Respon
Deskripsi tingkat kesukaan konsumen terhadap kopi X secara keseluruhan dapat dikategorikan pada Tabel 1.
Tabel 1 Statistik deskriptif kesukaan konsumen terhadap kopi X secara keseluruhan
Frekuensi Persentase
Tidak Suka 3 0.72
Biasa Saja 58 13.98
Suka 354 85.30
4
Pada Tabel 1 dapat dilihat bahwa terdapat tiga kategori yaitu konsumen yang tidak suka, biasa saja dan suka terhadap produk kopi X. Konsumen yang suka terhadap produk kopi X sebanyak 354 orang (85.30%), konsumen yang biasa saja sebanyak 58 orang (13.98%) dan konsumen yang tidak suka sebanyak 3 orang (0.72%). Secara deskriptif dapat dikatakan bahwa sebagian besar konsumen menyukai kopi X.
Analisis Pohon Klasifikasi Menggunakan Metode Pohon Regresi dan Klasifikasi
Hasil analisis berupa urutan pohon klasifikasi. Hasil analisis ini disajikan pada Tabel 2. Pada Tabel 2 dapat dilihat bahwa terjadi pemangkasan pohon klasifikasi dari nomor pohon satu sampai nomor pohon tujuh. Pohon klasifikasi optimum tercapai pada nomor pohon tujuh. Jika nomor pohon semakin besar maka jumlah simpul terminal semakin kecil namun jika nomor pohon
semakin besar maka nilai parameter
kompleksitas semakin besar.
Tabel 2 Urutan pohon klasifikasi
Nomor Pohon Jumlah Simpul Parameter Terminal Kompleksitas
1 26 0
2 23 8.24E-04
3 19 0.001
4 12 0.002
5 8 0.003
6 5 0.005
7** 3 0.006
8 1 0.024
** pohon klasifikasi optimum
Pohon klasifikasi optimum diperoleh dari pemangkasan pohon klasifikasi terbesar yang
menggunakan batasan minimum jumlah
amatan pada simpul induk sebanyak 5 sedangkan simpul anak sebanyak 1. Pohon klasifikasi optimum disajikan pada Gambar 2. Proses pemangkasan pohon klasifikasi ini
dilakukan dengan dasar aturan biaya
kompleksitas minimum dan validasi silang 10 lipatan. Pohon klasifikasi ini tercapai pada parameter kompleksitas bernilai 0.006. Pohon klasifikasi ini memiliki tiga simpul terminal.
Peubah penjelas yang masuk kedalam pohon klasifikasi optimum yaitu kekuatan aroma kopi dan kekuatan rasa susu. Peubah pertama yang menyekat adalah kekuatan aroma kopi. Hal ini menyatakan bahwa peubah ini merupakan peubah yang dominan dalam pembentukan pohon klasifikasi.
Konsumen sebanyak 415 orang, konsumen yang merasa kekuatan aroma kopi sangat
kurang kuat atau kurang kuat sebanyak 71 orang mengelompok pada simpul 1 (kiri) sedangkan konsumen yang merasa kekuatan aroma kopi pas, kuat atau sangat kuat sebanyak 344 orang mengelompok pada simpul 2 (kanan). Simpul 2 merupakan simpul terminal. Penurunan keheterogenan pohon pada simpul pertama sebesar 0.0506.
Gambar 2 Pohon klasifikasi optimum
Pada simpul 1, konsumen yang merasa kekuatan rasa susu sangat kurang kuat atau kurang kuat sebanyak 26 orang mengelompok pada simpul 3 (kiri) sedangkan konsumen yang merasa kekuatan rasa susu pas, kuat atau sangat kuat sebanyak 45 orang mengelompok pada simpul 4 (kanan). Simpul 3 dan 4
merupakan simpul terminal. Penurunan
keheterogenan pohon pada simpul 1
sebesar 0.0307.
Hasil pohon klasifikasi optimum yaitu tiga klasifikasi karakteristik kopi X. Klasifikasi yang terbentuk sebagai berikut:
1. Kekuatan aroma kopi dan kekuatan rasa susu kurang. Label kelas pada klasifikasi ini adalah konsumen biasa saja terhadap kopi X.
2. Kekuatan aroma kopi kurang namun
kekuatan rasa susu pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.
3. Kekuatan aroma kopi pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X. Category % n tidak suka 0.72 3 biasa saja 13.98 58 suka 85.30 354 Total (100.00) 415
Node 0
Category % n tidak suka 0.29 1 biasa saja 6.98 24 suka 92.73 319 Total (82.89) 344
Node 2 Category % n
tidak suka 2.82 2 biasa saja 47.89 34 suka 49.30 35 Total (17.11) 71
Node 1
Category % n tidak suka 0.00 0 biasa saja 26.67 12 suka 73.33 33 Total (10.84) 45
Node 4 Category % n
tidak suka 7.69 2 biasa saja 84.62 22 suka 7.69 2 Total (6.27) 26
Node 3
kesukaan kopi X secara keseluruhan
Kekuatan Aroma Kopi Improvement=0.0506
>kurang kuat <=kurang kuat
Kekuatan Rasa Susu Improvement=0.0307
>kurang kuat <=kurang kuat
sangat kurang kuat, kurang kuat
pas, kuat, sangat kuat
sangat kurang kuat, kurang kuat
5
Karakteristik kopi X yang disukai
konsumen pada pohon klasifikasi ini yaitu kopi X pada klasifikasi kedua dan ketiga. Konsumen yang suka dengan kopi X sebanyak
389 orang, konsumen yang menyukai
karakteristik kopi X pada klasifikasi kedua sebanyak 45 orang sedangkan pada klasifikasi
ketiga sebanyak 344 orang. Hal ini
menjelaskan bahwa sebagian besar konsumen menyukai karakteristik kopi pada klasifikasi ketiga.
Jika pohon optimum dikembangkan satu tahap lagi maka menghasilkan pohon dengan pencabangan dari simpul 2. Pohon ini disajikan pada Gambar 3. Pohon ini tercapai pada parameter kompleksitas bernilai 0.005. Pohon ini memiliki tiga peubah penjelas yang masuk kedalam pohon klasifikasi yaitu kekuatan aroma kopi, kekuatan rasa susu dan kekuatan rasa kopi. Pohon ini memiliki jumlah klasifikasi lebih banyak dibandingkan dengan pohon klasifikasi optimum yaitu sebanyak lima buah.
Pada simpul 2, konsumen yang merasa kekuatan rasa kopi sangat kurang kuat, kurang kuat atau pas sebanyak 323 orang mengelompok pada simpul 5 (kiri) sedangkan konsumen yang merasa kekuatan rasa kopi kuat atau sangat kuat sebanyak 21 orang
mengelompok pada simpul 6 (kanan). Simpul 5 merupakan simpul terminal. Penurunan keheterogenan pohon pada simpul 2 sebesar 0.0158.
Pada simpul 6, konsumen yang merasa kekuatan aroma kopi pas sebanyak 15 orang
mengelompok pada simpul 13 (kiri)
sedangkan konsumen yang merasa kekuatan aroma kopi kuat atau sangat kuat sebanyak 6 orang mengelompok pada simpul 14 (kanan). Simpul 13 dan 14 merupakan simpul terminal. Penurunan keheterogenan pohon pada simpul 6 sebesar 0.0092.
Hasil pengembangan satu tahap dari pohon klasifikasi optimum yaitu pohon klasifikasi dengan lima klasifikasi karakteristik kopi X. Klasifikasi yang terbentuk sebagai berikut: 1. Kekuatan aroma kopi dan kekuatan rasa
susu kurang. Label kelas pada klasifikasi ini adalah konsumen biasa saja terhadap kopi X.
2. Kekuatan aroma kopi kurang namun
kekuatan rasa susu pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.
3. Kekuatan aroma kopi pas atau kuat
namun kekuatan rasa kopi kurang atau pas. Label kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X.
Gambar 3 Pohon klasifikasi hasil pengembangan satu tahap dari pohon klasifikasi optimum
Category % n tidak suka 0.72 3 biasa saja 13.98 58 suka 85.30 354 Total (100.00) 415
Node 0
Category % n tidak suka 0.29 1 biasa saja 6.98 24 suka 92.73 319 Total (82.89) 344
Node 2
Category % n tidak suka 4.76 1 biasa saja 42.86 9 suka 52.38 11 Total (5.06) 21
Node 6
Category % n tidak suka 16.67 1 biasa saja 83.33 5 suka 0.00 0 Total (1.45) 6
Node 14 Category % n
tidak suka 0.00 0 biasa saja 26.67 4 suka 73.33 11 Total (3.61) 15
Node 13 Category % n tidak suka 0.00 0 biasa saja 4.64 15 suka 95.36 308 Total (77.83) 323
Node 5 Category % n
tidak suka 2.82 2 biasa saja 47.89 34 suka 49.30 35 Total (17.11) 71
Node 1
Category % n tidak suka 0.00 0 biasa saja 26.67 12 suka 73.33 33 Total (10.84) 45
Node 4 Category % n
tidak suka 7.69 2 biasa saja 84.62 22 suka 7.69 2 Total (6.27) 26
Node 3
kesukaan kopi X secara keseluruhan
Kekuatan Aroma Kopi Improvement=0.0506
>kurang kuat
Kekuatan Rasa Kopi Improvement=0.0158
>Pas
Kekuatan Aroma Kopi Improvement=0.0092
>Pas <=Pas
<=Pas <=kurang kuat
Kekuatan Rasa Susu Improvement=0.0307
>kurang kuat <=kurang kuat
Sangat kurang kuat, kurang kuat
pas, kuat, sangat kuat
Sangat kurang kuat, kurang kuat
pas, kuat, sangat kuat sangat kurang kuat, kurang kuat, pas
kuat, sangat kuat
6
4. Kekuatan aroma kopi pas dan kekuatan rasa kopi pas atau kuat. Label kelas pada klasifikasi ini adalah konsumen suka terhadap kopi X.
5. Kekuatan aroma kopi dan kekuatan rasa kopi kuat. Label kelas pada klasifikasi ini adalah konsumen biasa saja terhadap kopi X.
Karakteristik kopi X yang disukai
konsumen pada pohon klasifikasi ini yaitu kopi X pada klasifikasi kedua, ketiga dan keempat. Konsumen yang suka dengan kopi X
sebanyak 383 orang, konsumen yang
menyukai karakteristik kopi X pada klasifikasi kedua sebanyak 45 orang, pada klasifikasi ketiga sebanyak 323 orang, dan pada klasifikasi keempat sebanyak 15 orang. Hal ini menjelaskan bahwa sebagian besar konsumen menyukai karakteristik kopi pada klasifikasi ketiga.
Klasifikasi kedua, ketiga dan keempat memiliki label kelas bahwa konsumen menyukai produk X sedangkan sisanya memiliki label kelas bahwa konsumen biasa saja terhadap kopi X. Konsumen terbanyak terdapat pada klasifikasi ketiga yaitu sebanyak 323 orang sedangkan kosumen yang paling sedikit terdapat pada klasifikasi kelima yaitu sebanyak 6 orang.
Pohon klasifikasi yang akan dipilih merupakan pohon klasifikasi yang memiliki nilai RCV terkecil. Jika melihat pohon hasil pencabangan satu tahap dari pohon klasifikasi optimum, pohon ini lebih terperinci namun ada klasifikasi yang jumlah konsumennya sedikit. Sehingga pohon klasifikasi yang dipilih yaitu pohon klasifikasi optimum.
SIMPULAN DAN SARAN
Simpulan
Pohon klasifikasi yang terbentuk sebanyak delapan urutan pohon klasifikasi. Pohon klasifikasi yang akan dipilih merupakan pohon klasifikasi yang memiliki nilai RCV terkecil. Sehingga pohon klasifikasi yang dipilih yaitu pohon klasifikasi optimum.
Pohon klasifikasi optimum menghasilkan
tiga klasifikasi karakteristik kopi X.
Klasifikasi yang terbentuk sebagai berikut: 1. Kekuatan aroma kopi dan kekuatan rasa
susu kurang. Label kelas pada klasifikasi ini adalah konsumen biasa saja terhadap kopi X.
2. Kekuatan aroma kopi kurang namun
kekuatan rasa susu pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.
3. Kekuatan aroma kopi pas atau kuat. Label
kelas pada klasifikasi ini adalah
konsumen suka terhadap kopi X.
Karakteristik kopi X yang disukai yaitu kopi X pada klasifikasi kedua dan ketiga.
Saran
Untuk penelusuran peubah penjelas dalam pendugaan tingkat kesukaan konsumen secara keseluruhan terhadap kopi 3 in 1, dapat menggunakan metode analisis yang lain seperti metode pohon gabungan.
DAFTAR PUSTAKA
Breiman L, JH Friedman, RA Olshen, CJ Stone. 1993. Classification and Regression Trees. New York: Chapman and Hall. Kardiana A, Aunuddin, AH Wigena, H
Wijayanto. 2006. Metode Klasifikasi Berstruktur Pohon Biner: Kasus Prakiraan Sifat Hujan Bulanan di Bogor. Yogyakarta,
17 Juni 2006. Seminar Nasional
Aplikasi Teknologi Informasi (SNATI). hlm: G21-G25.
Kurniawan T. 2002. Penerapan Metode
Pemangkasan dalam CART (Classification
and Regression Trees): Kasus Pendugaan Status Gizi Anak di Kecamatan Bogor
Timur [Skripsi]. Bogor: Fakultas
Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Mulier C. 1998. Learning From Data
Concept, Theory, and Methods. New York: John Wiley & Sons, Inc.
Sinambela YS. 2008. Penerapan Metode
Pohon Klasifikasi dengan Algoritma
CART pada Data Status Daerah Kabupaten di Indonesia [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Wulandari SA. 2004. Analisis Tingkat
Keberhasilan Mahasiswa S2 IPB
7
8
Lampiran 1 Karakteristik peubah
Kode Peubah Keterangan
Y Kesukaan Kopi X Secara Keseluruhan 1: tidak suka 2: biasa saja 3: suka
X1 Kekuatan Aroma Kopi 1: sangat kurang kuat
2: kurang kuat 3: pas 4: kuat 5: sangat kuat
X2 Warna 1: terlalu terang
2: terang 3: pas 4: gelap 5: terlalu gelap
X3 Tekstur Ampas 1: terlalu halus
2: halus 3: pas 4: kasar 5: terlalu kasar
X4 Kekentalan 1: terlalu encer
2: encer 3: pas 4: kental 5: terlalu kental
X5 Kekuatan Rasa Kopi 1: sangat kurang kuat
2: kurang kuat 3: pas 4: kuat 5: sangat kuat
X6 Kekuatan Aroma Susu 1: sangat kurang kuat
2: kurang kuat 3: pas 4: kuat 5: sangat kuat
X7 Kekuatan Rasa Susu 1: sangat kurang kuat
2: kurang kuat 3: pas 4: kuat 5: sangat kuat
X8 Kepahitan 1: sangat kurang pahit
2: kurang pahit 3: pas 4: pahit 5: terlalu pahit
X9 Kemanisan 1: sangat kurang manis
2: kurang manis 3: pas 4: manis
5: terlalu manis
Lampiran 2 Nilai tingkat salah pengklasifikasian pengganti relatif validasi silang setiap pohon Nomor Pohon Tingkat Salah Pengklasifikasian
Pengganti Relatif Validasi Silang
1 0.705 +/- 0.094
2 0.738 +/- 0.095
3 0.770 +/- 0.095
4 0.705 +/- 0.089
5 0.672 +/- 0.085
6 0.705 +/- 0.077
7** 0.672 +/- 0.065
9
Lampiran 2 Pohon klasifikasi hasil pengembangan dua tahap dari pohon klasifikasi optimum
Category % n tidak suka 0.72 3 biasa saja 13.98 58 suka 85.30 354 Total (100.00) 415
Node 0
Category % n tidak suka 0.29 1 biasa saja 6.98 24 suka 92.73 319 Total (82.89) 344
Node 2
Category % n tidak suka 4.76 1 biasa saja 42.86 9 suka 52.38 11 Total (5.06) 21
Node 6
Category % n tidak suka 16.67 1 biasa saja 83.33 5
suka 0.00 0
Total (1.45) 6 Node 14 Category % n
tidak suka 0.00 0 biasa saja 26.67 4 suka 73.33 11 Total (3.61) 15
Node 13 Category % n tidak suka 0.00 0 biasa saja 4.64 15 suka 95.36 308 Total (77.83) 323
Node 5 Category % n
tidak suka 2.82 2 biasa saja 47.89 34 suka 49.30 35 Total (17.11) 71
Node 1
Category % n tidak suka 0.00 0 biasa saja 26.67 12 suka 73.33 33 Total (10.84) 45
Node 4
Category % n tidak suka 0.00 0 biasa saja 8.00 2 suka 92.00 23 Total (6.02) 25
Node 10 Category % n
tidak suka 0.00 0 biasa saja 50.00 10 suka 50.00 10 Total (4.82) 20
Node 9
Category % n tidak suka 0.00 0 biasa saja 100.00 4
suka 0.00 0
Total (0.96) 4 Node 16 Category % n
tidak suka 0.00 0 biasa saja 37.50 6 suka 62.50 10 Total (3.86) 16
Node 15
Category % n tidak suka 0.00 0 biasa saja 28.57 4 suka 71.43 10 Total (3.37) 14
Node 28 Category % n
tidak suka 0.00 0 biasa saja 100.00 2
suka 0.00 0
Total (0.48) 2 Node 27
Category % n tidak suka 7.69 2 biasa saja 84.62 22
suka 7.69 2
Total (6.27) 26 Node 3
kesukaan kopi X secara keseluruhan
Kekuatan Aroma Kopi Improvement=0.0506
>kurang kuat
Kekuatan Rasa Kopi Improvement=0.0158
>Pas
Kekuatan Aroma Kopi Improvement=0.0092
>Pas <=Pas
<=Pas <=kurang kuat
Kekuatan Rasa Susu Improvement=0.0307 >kurang kuat Kepahitan Improvement=0.0094 >kurang pahit <=kurang pahit Kemanisan Improvement=0.0060 >Pas <=Pas Kepahitan Improvement=0.0043
>Sangat kurang pahit <=Sangat kurang pahit
<=kurang kuat
Sangat kurang kuat, kurang kuat
Pas, kuat, sangat kuat
Sangat kurang kuat, kurang kuat
Pas, kuat, sangat kuat
Sangat kurang pahit, kurang pahit
Pas, pahit, terlalu pahit
Sangat kurang manis, kurang manis, pas
Manis, terlalu manis
Sangat kurang pahit Kurang pahit
Sangat kurang kuat, kurang kuat, pas
Kuat, sangat kuat