RINGKASAN
DIAN RARASSANTI. Eksplorasi Metode Klasifikasi pada Data Biner. Di bawah bimbingan ERFIANI dan BAGUS SARTONO.
Banyak metode yang dapat diterapkan dalam proses pengklasifikasian suatu data, terlebih lagi jika data yang dimiliki adalah yang bersifat kuantitatif. Akan tetapi dalam aplikasinya data yang dipergunakan tidak selamanya bersifat kuantitatif, banyak pula penelitian yang dilakukan memakai data kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner. Metode-metode pengklasifikasian yang dapat dipergunakan terhadap data biner masih seringkali menimbulkan berbagai pertanyaan mengenai metode yang cocok dipakai untuk mengklasifikasikannya. Adapun dasar pengklasifikasian suatu data terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Berdasarkan hal tersebut, penelitian ini bertujuan untuk mengeksplorasi metode klasifikasi pada data biner dengan menggunakan data tanaman obat berdasarkan khasiat-khasiat yang dimilikinya.
Hasil klasifikasi yang memberikan hasil terbaik adalah metode Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.
EKSPLORASI METODE KLASIFIKASI PADA DATA
BINER
DIAN RARASSANTI
G14103017
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
RINGKASAN
DIAN RARASSANTI. Eksplorasi Metode Klasifikasi pada Data Biner. Di bawah bimbingan ERFIANI dan BAGUS SARTONO.
Banyak metode yang dapat diterapkan dalam proses pengklasifikasian suatu data, terlebih lagi jika data yang dimiliki adalah yang bersifat kuantitatif. Akan tetapi dalam aplikasinya data yang dipergunakan tidak selamanya bersifat kuantitatif, banyak pula penelitian yang dilakukan memakai data kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner. Metode-metode pengklasifikasian yang dapat dipergunakan terhadap data biner masih seringkali menimbulkan berbagai pertanyaan mengenai metode yang cocok dipakai untuk mengklasifikasikannya. Adapun dasar pengklasifikasian suatu data terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Berdasarkan hal tersebut, penelitian ini bertujuan untuk mengeksplorasi metode klasifikasi pada data biner dengan menggunakan data tanaman obat berdasarkan khasiat-khasiat yang dimilikinya.
Hasil klasifikasi yang memberikan hasil terbaik adalah metode Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.
EKSPLORASI METODE KLASIFIKASI PADA DATA BINER
DIAN RARASSANTI
Skripsi
sebagai salah satu syarat memperoleh gelar Sarjana Sains
pada Departemen Statistika
Fakultas Matematika dan Pengetahuan Alam
Institut Pertanian Bogor
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
2007
RIWAYAT HIDUP
Penulis dilahirkan di Bantul pada tanggal 26 Mei 1985 sebagai anak pertama dari dua bersaudara, anak dari pasangan Slamet Wiranto dan Sumi Awaliati.
Pada tahun 2003 penulis menyelesaikan pendidikan menengah lanjutan atas di SMU Negeri 5 Bogor sedangkan pada tahun yang sama pula diterima di Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui Undangan Seleksi Masuk IPB (USMI).
Selama mengikuti perkuliahan, penulis ikut serta dalam kegiatan Himpro Gamma Sigma Beta (GSB) periode 2003/2004 sebagai staf Departemen Kewirausahaan dan periode 2004/2005 sebagai staf Departemen Eksternal, Keluarga Mahasiswa Muslim Statistika (KAMMUS) periode 2004/2005 sebagai bendahara, dan Decision Centre periode 2006/2007 sebagai sekretaris serta mengikuti kegiatan internal lainnya pula. Penulis juga mengikuti kegiatan Praktek Lapang di PT. Capricorn MARS Indotama pada bulan Februari-April 2007.
KATA PENGANTAR
Alhamdulillahirabbil’alamin, segala puji dan syukur dipanjatkan kehadirat Allah SWT atas segala hidayah, nikmat, dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Shalawat serta salam semoga selalu tercurahkan kepada Rasulullah SAW, keluarga, sahabat dan umatnya hingga akhir zaman.
Karya ilmiah ini berjudul “Eksplorasi Metode Klasifikasi pada Data Biner”. Dalam penelitian ini dilakukan eksplorasi terhadap data tanaman obat yang diklasifikasikan berdasarkan khasiatnya. Dari eksplorasi tersebut didapatkan pengklasifikasian tanaman obat menjadi enam klasifikasi. Hal ini diduga sesuai dengan kandungan fitokimia pada tanaman obat yang berhubungan dengan khasiat yang dapat disembuhkan tanaman obat tersebut.
Terima kasih penulis sampaikan kepada berbagai pihak yang telah membantu dalam penyelesaian karya ilmiah ini, yaitu kepada :
1. Ibu Dr. Ir. Erfiani, M.S dan Bapak Bagus Sartono, S.Si, M.Si terima kasih atas segala bimbingan, saran dan kritik sehingga karya ilmiah ini dapat diselesaikan.
2. Bapak, Ibu, dan dèk Rista yang aku sayangi atas do’a, semangat dan kasih sayang yang tak pernah berhenti mengalir.
3. Segenap staf pengajar di Departemen Statistika FMIPA IPB terima kasih atas pengajaran yang diberikan sehingga penulis dapat menyelesaikan studi dan karya ilmiah ini.
4. Seluruh staf pegawai Departemen Statistika FMIPA IPB: bu Markonah, bu Sulis, bu Dedeh, bang Sudin, mang Dur, mang Herman, pak Ian, bu Aat dan pak Edi yang selalu setia membantu segala keperluan yang menyangkut penyelesaian karya ilmiah ini. 5. Teman-teman seperjuangan di Statistika 40, terimakasih atas segala kekompakan dan
kerjasama yang sudah diberikan selama empat tahun ini. Terlebih lagi Ema (atas tumpangan kost-nya selama beberapa bulan terakhir ini),Lala dan Bayu (atas berbagai bentuk bantuan yang telah diberikan), Ari dan kang masnya, Muti, Daus (teman seperjuanganku), Riko (atas CD-nya), mas Den (atas semua saran yang sudah diberikan), Essy, Rina, Edo, dkk, Anggoro dan seluruh teman-temanku tercinta, terima kasih bantuan dan dukungannya.
6. Mbak Dani’ dan keluarga besarku, mbak Fera, Hurry, the 48’ers, Azzahra crew, juga Halimuners.
7. Semua kakak kelas 39, 38, 37 dan adik-adik Statistika angkatan 41, 42, dan 43.
8. Semua pihak yang telah memberikan dukungan kepada penulis yang tidak dapat disebutkan satu per satu.
Penulis menyadari bahwa masih banyak kekurangan dalam karya ilmiah ini. Semoga karya ilmiah ini dapat bermanfaat.
Bogor, September 2007 Penulis
DAFTAR ISI
Halaman
DAFTAR TABEL ... vii
DAFTAR GAMBAR ... vii
DAFTAR LAMPIRAN ... viii
PENDAHULUAN Latar Belakang ... 1
Tujuan ... 1
TINJAUAN PUSTAKA Data biner ... 1
Klasifikasi ... 1
Analisis gerombol ... 1
Analisis asosiasi ... 3
BAHAN DAN METODE Bahan ... 3
Metode ... 3
HASIL DAN PEMBAHASAN Analisis gerombol ... 4
Analisis asosiasi ... 4
Eksplorasi hasil analisis gerombol dengan analisis asosiasi ... 6
KESIMPULAN ... 6
DAFTAR PUSTAKA ... 7
LAMPIRAN ... 8
DAFTAR TABEL
Halaman
1. Tabel kontingensi data biner ... 2 2. Aturan tunggal dari aturan asosiatif ... 5 3. Klasifikasi dari analisis asosiatif ... 5
DAFTAR GAMBAR
Halaman
1. Grafik asosiasi (Association Graph) ... 5
DAFTAR LAMPIRAN
Halaman
1. Data tanaman obat berdasarkan khasiat yang dimilikinya ... 8 2. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Fourfoul Point ... 11 3. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Dice ... 11 4. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Jaccard ... 12 5. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan
ukuran jarak Ochiai ... 12 6. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Sokal & Sneath 2 ... 13 7. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran
jarak Sokal & Sneath 5 ... 13 8. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Complete Linkage ... 14 9. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Dice ... 15 10. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Ochiai ... 15 11. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New
Group dengan ukuran jarak Sokal & Sneath 5 ... 16 12. Dendogram dari kombinasi metode perbaikan jarak Centroid dengan ukuran jarak
Ochiai ... 16 13. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Average Linkage
within the New Group dan metode Centroid ... 17 14. Tabel aturan asosiasi (association rule) ... 18
PENDAHULUAN
Latar Belakang
Metode klasifikasi merupakan salah satu metode analisis yang diperlukan untuk mengelompokkan objek atau item berdasarkan kemiripan sifat yang dimilikinya. Pengklasifikasian dapat diterapkan pada banyak bidang ilmu pengetahuan, salah satunya pada bidang yang berkaitan dengan ilmu alam. Jenis data dalam bidang ilmu alam yang dianalisis terkadang tidak hanya berupa data yang bersifat kuantitatif, tetapi juga banyak ditemukan data yang bersifat kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner yang hanya memiliki dua kemungkinan nilai yaitu sukses dan gagal.
Metode klasifikasi dibidang ilmu alam sangat banyak, akan tetapi dasar pengklasifikasian suatu data hanya terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol merupakan salah satu analisis peubah ganda yang bertujuan mengelompokkan objek berpeubah banyak ke dalam kelompok-kelompok berdasarkan kemiripan yang dimiliki objek tersebut. Analisis asosiasi adalah teknik untuk menemukan aturan asosiasi antara suatu kombinasi item atau objek. Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, sehingga analisis asosiasi juga sering disebut dengan istilah basket analysis.
Berdasarkan hal tersebut, dapat diketahui bahwa kegunaan kedua metode di atas adalah untuk pengklasifikasian data, dan karena dalam proses klasifikasi data banyak ditemukan kasus data biner, maka penelitian ini mengetengahkan hasil eksplorasi metode klasifikasi pada data biner dengan menggunakan analisis gerombol dan analisis asosiasi. Data yang digunakan adalah data biner tanaman obat berdasarkan khasiat yang dikandungnya.
Tujuan
Tujuan penelitian ini adalah untuk:
1. Mengeksplorasi metode klasifikasi data biner dengan analisis asosiasi pada data tanaman obat.
2. Mengklasifikasikan tanaman obat berdasarkan khasiatnya dengan menggunakan analisis gerombol.
TINJAUAN PUSTAKA
Data biner
Data biner adalah data observasi dimana nilainya hanya memiliki dua kemungkinan. Sebagai contoh bahwa pada komponen peralatan elektronik mungkin bisa rusak atau tidak, atau pada tanaman obat berkhasiat atau tidak dalam mengatasi suatu gangguan kesehatan. Jika pada individu ke-i observasi tersebut dapat dinyatakan oleh sebuah variabel acak Yi, maka pada data biner Yi dapat dinyatakan dengan kode 1 untuk data yang ‘sukses’ dan kode 0 untuk data yang ‘gagal’ (Cox 1970).
Klasifikasi
Klasifikasi menurut Kamus Besar Bahasa Indonesia (KBBI) memiliki arti penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Sedangkan pengklasifikasian berarti proses, cara, atau perbuatan mengklasifikasikan. Dalam statistika, klasifikasi merupakan salah satu metode analisis yang dapat diartikan proses pengelompokan objek berdasarkan kemiripan masing-masing variabel yang dimilikinya (Ludwig & Reynold 1988).
Analisis Gerombol
Analisis gerombol adalah salah satu analisis peubah ganda yang prinsip utamanya adalah mengklasifikasikan individu yang relatif sama atau seragam ke dalam suatu gerombol yang didasarkan pada ukuran kedekatan (ukuran jarak atau ukuran kesamaan). Objek yang terletak dalam suatu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan objek yang terletak dalam gerombol lain (Johnson & Wichern 2002). Dan diharapkan keragaman unit-unit pengamatan dalam satu gerombol lebih homogen daripada keragaman antar gerombol.
Pada jenis data biner, ukuran jarak atau kesamaan dinyatakan dalam bentuk koefisien kesamaan (similarities coefficient) yang nilainya berkisar antara 0 sampai 1. Berbeda dengan konsep jarak untuk data pengukuran, untuk data biner nilai koefisien yang diperoleh bukan menunjukkan kuantitas jarak, tetapi menunjukkan kedekatan dua variabel atau objek. Nilai yang mendekati satu menunjukkan kedua objek tersebut sangat mirip, sedangkan nilai koefisien yang mendekati nol
menunjukkan bahwa kedua objek tersebut tidak mirip.
Koefisien kesamaan diperoleh dengan terlebih dahulu dibuat tabel kontingensi 2x2 untuk setiap pasang objek ke-i dan ke-j, seperti pada Tabel 1 berikut ini (Digby & Kempton 1987):
Tabel 1. Tabel Kontingensi Data Biner
Individu ke-i
Total Individu
ke-j
1 0
1 a b a + b 0 c d c + d Total a + c b + d p dengan:
p = total jumlah objek
a = frekuensi kedua individu bernilai 1 b, c = frekuensi satu objek bernilai 1 dan
objek lainnya bernilai 0
d = frekuensi kedua individu bernilai 0 Terdapat dua teknik penggerombolan pada analisis gerombol, yaitu teknik hirarki dan nonhirarki. Teknik berhirarki digunakan jika jumlah gerombol yang terbentuk tidak diketahui sebelumnya, sedangkan teknik nonhirarki digunakan apabila jumlah gerombol yang terbentuk sudah ditetapkan dari awal (Johnson & Wichern 2002). Metode gerombol berhirarki dapat digunakan untuk menggerombolkan data biner. Di dalam metode tersebut terdapat beberapa metode perbaikan jarak, seperti metode pautan tunggal (Single Linkage), pautan lengkap (Complete Linkage), pautan rataan dalam kelompok (Average Linkage within the New Group), pautan rataan antar kelompok (Average Linkage between Merged Group), Centroid, Median, dan Ward (Johnson & Wichern 2002). Adapun beberapa tipe ukuran kesamaan yang digunakan pada data biner, yaitu seperti:
1. Simple Matching
Ukuran kesamaan bertipe ini merupakan perbandingan objek yang sepadan terhadap jumlah keseluruhan objek yang ada. Ukuran ini memberikan bobot yang sama baik pada objek yang sepadan maupun yang tidak sepadan. Rumusnya diformulasikan sebagai berikut:
p d a+
2. Fourfoul Point
Ukuran kedekatan ini adalah salah satu bentuk ukuran kesamaan yang diperuntukan pada data biner. Adapun formulasinya adalah sebagai berikut:
(
a b)(
a c)(
b d)(
c d)
bc ad + + + + − 3. Jaccard
Nilai koefisien Jaccard adalah suatu indeks dimana nilai d (0-0 sepadan) tidak dimasukkan dalam perhitungan. Ukuran ini pun memberikan bobot yang sama baik pada objek yang sepadan maupun yang tidak sepadan. Persamaannya sebagai berikut: c b a a + + 4. Dice
Ukuran Dice dikenal juga dengan nama ukuran Czekanowski atau ukuran Serensen. Ukuran ini sama dengan ukuran persamaan Jaccard dimana nilai d tidak dimasukkan dalam perhitungan, akan tetapi nilai a (1-1 sepadan) diberikan bobot ganda. Formulasinya adalah:
c b a a + + 2 2
5. Sokal & Sneath 2
Ukuran Sokal & Sneath 2 memberikan bobot yang sama pada objek yang tidak sepadan. Masing-masing objek yang tidak sepadan tersebut diberi bobot ganda. Namun nilai d tidak dimasukkan dalam perhitungan. Berikut formulasinya:
(
b c)
a a
+ +2 6. Ochiai
Ukuran kesamaan ini diperkenalkan ditahun 1957. Rumus ukuran kesamaan Ochiai diformulasikan sebagai berikut:
(
a b)(
a c)
a + + 7. Sokal & Sneath 4
Ukuran kesamaan ini didasari oleh peluang bersyarat dari satu nilai a, sedangkan nilai objek yang lain dinyatakan sebagai predictor yang dihitung dari nilai rata-ratanya. Adapun rumusnya adalah sebagai berikut:
(
)
(
)
(
)
(
)
4 d c d d b d c a a b aa + + + + + + +
8. Sokal & Sneath 5
Ukuran kesamaan ini bebas dari pengkodean objek-objeknya. Adapun rumusnya adalah sebagai berikut:
(
a b)(
a c)(
b d)(
c d)
Wijayati (2002) menyatakan bahwa metode klasifikasi terbaik adalah metode perbaikan jarak Average Linkage within the New Group dengan simple matching sebagai kombinasi ukuran kesamaannya.
Analisis Asosiasi
Analisis asosiasi dikenal sebagai salah satu teknik eksplorasi data yang menjadi langkah awal dari berbagai teknik eksplorasi data lainnya. Dasar analisis asosiasi adalah menemukan aturan asosiasi antar kombinasi item atau objek. Contoh aturan asosiasi dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu (Bajcsy 2002).
Oleh karena itu, analisis asosiasi dapat didefinisikan sebagai suatu proses untuk menemukan semua aturan asosiasi yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence). Penting tidaknya suatu aturan asosiasi dapat diketahui dengan dua ukuran, yaitu support (nilai penunjang) yang berarti persentase kombinasi item dalam database dan confidence (nilai kepastian) yang berarti kuatnya hubungan antar item dalam aturan asosiasi.
Aturan asosiasi biasanya dinyatakan dalam bentuk :
{X1} {X2}
(supp = a%, conf = b%)
dengan X1 merupakan item di sebelah kiri
aturan asosiasi (left hand of rule) sedangkan X2
merupakan item di sebelah kanan aturan asosiasi (right hand of rule). Hal ini berarti b% dari transaksi di database yang memuat item X1
juga memuat item X2. Sedangkan a% dari
seluruh transaksi yang ada di database memuat kedua item itu.
Dua tahap dalam mendapatkan aturan asosiasi (Tan, Steinbach, & Kumar 2004):
• Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database.
• Pembentukan aturan asosiasi
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk
confidence dengan menghitung confidence aturan asosiasi Xi Xj dimana i
≠
j dari support pola frekuensi tinggi Xidan Xj dengan menggunakan rumus
berikut :
Conf (Xi Xj)=
(
( )
)
i j i X X X supp supp ∪BAHAN DAN METODE
Bahan
Data yang digunakan dalam penelitian ini adalah data tanaman obat-obatan tradisional berdasarkan khasiat yang terkandung di dalamnya, yaitu terdiri dari 29 jenis tanaman obat dengan 95 macam gangguan kesehatan yang dapat diatasinya. Dari data yang tercantum, nilai 1 menunjukkan bahwa tanaman obat ke-i berkhasiat mengatasi berbagai gangguan kesehatan tertentu, sedangkan nilai 0 menunjukkan tanaman obat ke-i tidak berkhasiat mengatasi gangguan kesehatan tersebut. Data ini diambil dari PSB (Pusat Studi Biofarmaka) dan dilengkapi informasi dari pustaka “Atlas Tumbuhan Obat Indonesia” (Dalimartha 1999, 2000, 2003). Data yang digunakan terlampir pada Lampiran 1.
Perangkat lunak yang digunakan dalam penelitian ini adalah SPSS 13.0 for Windows, Microsoft Excel, dan SAS Enterprise Miner 4.3.
Metode
Dari data tersebut, dilakukan analisis data dengan menggunakan metode klasifikasi yaitu analisis gerombol dan analisis asosiasi.
Tahapan analisis data yang dilakukan dalam penelitian ini adalah:
1. Analisis data menggunakan analisis gerombol berhirarki dilakukan dengan menggunakan bantuan perangkat lunak SPSS 13.0 for Windows. Pada penelitian ini dikombinasikan 7 metode perbaikan jarak dan 20 ukuran kesamaan. Tujuh metode perbaikan jarak yang digunakan adalah:
Single Linkage Complete Linkage
Average Linkage within the New Group
Average Linkage between Merged Group
Centroid Median Ward
Sementara itu, 20 ukuran kesamaan yang digunakan adalah:
Simple matching Fourfoul point Jaccard Dice
Sokal & Sneath 1 Sokal & Sneath 2 Sokal & Sneath 3 Sokal & Sneath 4 Sokal & Sneath 5 Ochiai
Russel & Rao Rogers & Tanimoto Kulczynski 1 Kulczynski 2 Hamann
Goodman & Kruskal Lambda Anderberg’s D
Yule’s Y Yule’s Q Dispersion
Dengan demikian terdapat 140 kombinasi metode perbaikan jarak dan ukuran jarak yang dilakukan.
2. Analisis data dengan analisis asosiasi, dilakukan pada jumlah level (jumlah item pada aturan asosiasi yang terbentuk) sebanyak 2, hal ini disebabkan karena selain untuk melihat hubungan keeratan antar item di dalamnya, juga akan mempermudah penginterpretasian klasifikasi data tanaman obat berdasarkan khasiatnya tersebut. Adapun tahapannya adalah sebagai berikut: • Analisa pola frekuensi tinggi
Mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database, nilai minimum support yang digunakan adalah sebesar 4%.
• Pembentukan aturan asosiasi
Langkah selanjutnya adalah mencari aturan asosiasi yang memenuhi syarat minimum untuk confidence, nilai minimum confidence yang digunakan adalah sebesar 50%.
Sehingga secara keseluruhan analisis ini dapat diinterpretasikan bahwa 50% dari transaksi di database yang memuat item di sebelah kiri aturan asosiasi (left hand of rule) juga memuat item di sebelah kanan aturan asosiasi (right hand of rule). Sedangkan 4% dari seluruh transaksi yang ada di database memuat kedua item tersebut.
Analisis ini dianalisis menggunakan perangkat lunak SAS Enterprise Miner 4.3 dan dibantu dengan SPSS 13.0 for Windows. 3. Eksplorasi hasil kedua metode tersebut.
Menginterpretasikan hasil klasifikasi yang diperoleh kedua metode kemudian mencari klasifikasi yang sesuai dan serupa dari kedua metode tersebut.
HASIL DAN PEMBAHASAN
Analisis Gerombol
Metode perbaikan jarak Complete Linkage dikombinasikan dengan ukuran kesamaan Ochiai, dan Sokal & Sneath 5 mengklasifikasikan tanaman obat menjadi 5 gerombol. Sedangkan apabila dikombinasikan dengan ukuran kesamaan Fourfoul Point, Dice, Jaccard, dan Sokal & Sneath 2 mengklasifikasikan tanaman obat menjadi 6 gerombol. Dendrogram kombinasi antara metode perbaikan jarak Complete Linkage dapat dilihat pada Lampiran 2-7. Hasil penggerombolan oleh metode Complete Linkage dilampirkan pada Lampiran 8.
Hasil pengklasifikasian pada metode Average Linkage within the New Group yang dikombinasikan dengan ukuran kesamaan Dice membentuk 5 gerombol. Sedangkan jika dikombinasikan dengan ukuran kesamaan Ochiai dan Sokal & Sneath 5 membentuk 6 gerombol (Lampiran 9-11).
Metode perbaikan jarak Centroid membentuk 6 gerombol jika dikombinasikan dengan ukuran kesamaan Ochiai. Dengan dendrogram terlampir pada Lampiran 12. Daftar klasifikasi untuk metode perbaikan jarak Average Linkage within the New Group dan Centroid terlampir pada Lampiran 13.
Metode perbaikan jarak yang digunakan pada penelitian ini adalah Average Linkage within the New Group, Complete Linkage, dan Centroid. Sedangkan ukuran kesamaannya adalah Sokal & Sneath 4, Sokal & Sneath 5, Ochiai, Sokal & Sneath 2, Fourfoul point, Jaccard, Dice. Jumlah gerombol yang terbentuk pada penelitian ini sesuai dengan banyaknya kelompok kandungan fitokimia dari tanaman obat, yaitu sebanyak 5 atau 6 gerombol. Hal ini mengidentifikasikan bahwa metode yang dipergunakan untuk melakukan penggerombolan tanaman obat pada penelitian ini sudah tepat digunakan.
Analisis Asosiasi
Langkah pertama analisis ini adalah analisa nilai frekuensi tinggi atau mencari nilai support dari masing-masing kombinasi rule yang terbentuk. Pada penelitian ini nilai support minimumnya ditetapkan sebesar 4% sehingga
nilai support yang kurang dari nilai 4% dihilangkan. Total kombinasi item yang terbentuk oleh analisis asosiasi pada level 2 adalah sebanyak 102 aturan (rule) asosiasi, akan tetapi setelah proses analisa frekuensi tinggi dilakukan, aturan yang memiliki persentase di atas 4% adalah sebanyak 77 aturan asosiasi yang terlihat pada Gambar 1.
Dari Gambar 1, terlihat bahwa nilai confidence ditandai oleh perbedaan bentuk, sedangkan nilai support ditandai oleh perbedaan warna, seperti pada sambiloto dan daun sendok terlihat memiliki asosiasi yang cukup besar, yaitu dengan support berada di antara 7.5-8.82% dan confidence di antara 50-54.46%, begitu pun tanaman obat yang lainnya. Nilai ini dapat dilihat secara lebih jelas pada tabel asosiasi Lampiran 14.
Setelah itu, tahap selanjutnya adalah mencari aturan asosiasi yang memenuhi syarat minimum untuk confidence, nilai minimum confidence yang digunakan adalah sebesar 50%. Dari 77 aturan asosiasi yang terbentuk tadi kemudian diurutkan berdasarkan left hand of rule untuk mendapatkan dasar pengklasifikasiannya dengan cara mencari aturan asosiasi yang unik atau tunggal yang hanya memiliki satu aturan asosiasi saja. Aturan yang ditemukan adalah:
Tabel 2. Aturan Tunggal dari Aturan Asosiasi gerombol left hand of rule right hand of rule
1 temuputih daun dewa
2 jombang daun sendok
3 rumput mutiara pegagan
4 jahe adas
5 pare mengkudu
Setelah itu, tanaman-tanaman obat yang lain diklasifikasikan sesuai dengan right hand of rule yang terlebih dahulu diurutkan nilai support dan nilai confidence yang menyertainya. Adapun hasil pengklasifikasian yang terbentuk pada analisis asosiasi ini dapat dilihat pada Tabel 3.
Tabel 3. Klasifikasi dari Analisis Asosiasi Gerombol Tanaman obat
1 daun ungu
daun dewa
temuputih
2 kumis kucing keji beling
daun sendok
jombang meniran
sambung nyawa
sambiloto 3 buah makasar
saga
cakar ayam
pegagan picisan
rumput mutiara 4 kunyit
jahe sidaguri adas tempuyung 5 temulawak
mengkudu pare
Gambar 1. Grafik Asosiasi (Association Graph)
Gerombol Tanaman obat iler
lidah buaya
mimba lengkuas
6 mahkota dewa
Klasifikasi pertama terbentuk karena daun ungu dan temuputih memiliki asosiasi yang kuat yaitu daun dewa sebagai penghubung di antara keduanya, selain itu asosiasi daun ungu dan daun dewa memiliki nilai confidence terbesar dari nilai asosiasi yang lainnya, yaitu sebesar 85.71% yang berarti bahwa 85.71% dari khasiat tanaman obat yang memuat daun ungu juga memuat daun dewa, sedangkan 6.32% dari khasiat tanaman obat memuat keduanya.
Pada klasifikasi kedua, daun sendok dan jombang sebagian besar memiliki anggota tanaman obat yang sama, sehingga daun sendok, jombang, dan tanaman obat yang sama di dalamnya dapat dijadikan satu klasifikasi. Kumis kucing juga dapat dijadikan satu, karena tanaman obat yang berasosiasi terhadap kumis kucing sama seperti pada daun sendok dan jombang, sedangkan oleh karena keji beling memiliki asosiasi yang kuat dengan daun sendok dan jombang, maka tanaman ini pun dapat dimasukkan ke dalam klasifikasi kedua.
Sedangkan klasifikasi ketiga terbentuk dikarenakan memiliki asosiasi yang kuat, hal ini terlihat dari nilai confidence & support yang dimiliki anggota tanaman obat di dalamnya relatif cukup besar antara satu dengan yang lainnya. Terlihat pada saga dan pegagan yang memiliki nilai confidence terbesar ke empat dari keseluruhan aturan asosiasi.
Klasifikasi keempat terbentuk karena ada kesamaan asosiasi nilai confidence dan support antara kunyit dan jahe, yaitu dihubungkan dengan tanaman adas. Tempuyung dapat dimasukkan ke dalam klasifikasi ini karena memiliki nilai confidence dan support yang cukup kuat dengan adas dan sidaguri.
Pada klasifikasi kelima, masing-masing item di dalamnya saling memiliki keterkaitan, sehingga tujuh tanaman obat ini dapat dimasukan dalam satu gerombol. Seperti dapat dilihat bahwa mimba hanya berasosiasi dengan iler, sedangkan antara iler dengan lengkuas, lidah buaya, dan juga pare dapat diklasifikasikan ke dalamnya karena memiliki nilai support dan confidence yang paling besar.
Klasifikasi keenam terbentuk karena pada 77 aturan asosiasi yang dihasilkan tidak muncul sama sekali tanaman mahkota dewa,
sehingga mahkota dewa dapat membentuk klasifikasi sendiri.
Eksplorasi Hasil Analisis Gerombol dengan Analisis Asosiasi
Klasifikasi dengan menggunakan analisis gerombol yang dihasilkan pada penelitian ini sesuai dengan Wijayati (2002), yang menyebutkan bahwa metode perbaikan jarak terbaik adalah Average Linkage within the New Group. Sedangkan ukuran kesamaan yang memberikan klasifikasi yang memuaskan adalah Sokal & Sneath 5, hal ini didukung oleh hasil pengklasifikasian analisis asosiasi yang menunjukkan hasil yang sama pula.
Klasifikasi yang dihasilkan dengan menggunakan analisis asosiasi memiliki kemiripan dengan hasil klasifikasi pada analisis gerombol, yaitu pada kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5. Sehingga dalam penelitian ini data tanaman obat dapat diklasifikasikan ke dalam 6 gerombol dimana masing-masing gerombol yang terbentuk diklasifikasikan berdasarkan khasiat yang terkandung di dalam tanaman obat tersebut. Penggerombolan ini pun sesuai dengan kandungan senyawa fitokimia yang cenderung dapat dibagi ke dalam 6 kelompok, yaitu alkaloid, flavonoid, steroid, triterpenoid, saponin dan tanin.
KESIMPULAN
Eksplorasi metode klasifikasi data biner tanaman obat-obatan berdasarkan khasiatnya dapat dilakukan dengan banyak metode. Akan tetapi dasar dari metode pengklasifikasian terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol yang memberikan hasil terbaik adalah metode Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.
DAFTAR PUSTAKA
Bajcsy, P. 2002. Introduction to Data Mining [modul].
Cox, D. R. & Snell E. J. 1996. Analysis of Binary Data. London: Chapman and Hall. Dalimartha, S. 1999. Atlas Tumbuhan Obat
Indonesia. Jilid 1. Depok: Puspa Swara. Dalimartha, S. 2000. Atlas Tumbuhan Obat
Indonesia. Jilid 2. Depok: Puspa Swara. Dalimartha, S. 2003. Atlas Tumbuhan Obat
Indonesia. Jilid 3. Depok: Puspa Swara. Digby, P. G. N & R. A. Kempton. 1987.
Multivariate Analysis of Ecological Communities. New York: Chapman and Hall.
Johnson, R. A. & Wichern, D. W. 2002. Applied Multivariate Statistical Analysis. Ed ke-5. New Jersey: Prentice Hall.
Kamus Besar Bahasa Indonesia. 1989. Jakarta: Balai Pustaka.
Ludwig, J. A. & Reynold, J. F. 1988. Statistical Ecology. Canada: J Wiley. Tan, P.N, M. Steinbach, & V. Kumar. 2004.
Introduction to Data Mining [modul]. Wijayati, A. 2002. Evaluasi Konsep Jarak dan
Metode Penggerombolan untuk Data Biner [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Lampiran 1. Data tanaman obat berdasarkan khasiat yang dimilikinya
NAMA TANAMAN
KHASIAT
Ad
as
Bu
ah
Ma
k
as
ar
Ca
k
ar
A
y
am
D
au
n
De
wa
Da
u
n
Se
nd
ok
Da
u
n
Un
g
u
Il
er
Ja
h
e
Jo
m
ba
ng
K
eji B
elin
g
Ku
m
is
Ku
ci
n
g
K
u
n
y
it
L
eng
kua
s
Li
da
h B
u
ay
a
M
ahko
ta
De
wa
M
engku
du
M
eni
ra
n
Mi
m
b
a
Pa
re
Pe
ga
ga
n
Pi
ci
sa
n
R
u
m
put
M
u
tia
ra
Sa
g
a
S
am
b
ilo
to
Sa
m
b
ung
Ny
aw
a
S
idagu
ri
T
em
p
uy
un
g
Te
m
u
la
w
ak
Te
m
uput
ih
Alzheimer
0 0
0
0
0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 1 0 0 0 0 0 0 0
0 0
Amandel
0 0
0
0
0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 0 0 0
0 0
Anemia
0 0
0
0
0 0 0 0 1 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0
0 0
Arthritis
0 0
0
0
0 0 0 0 0 0 0 0 0 0
0 0 0 1 0 0 0 0 0 0 0 0 0
0 0
Asam
Urat
0 0
0
0
0 0 0 0 1 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0
0 0
Asites
0 0
1
0
0 0 0 0 0 0 0 0 0 0
0 0 1 0 0 0 0 0 0 0 0 0 0
0 0
Asma
1 0
0
0
0 0 0 0 0 0 0 1 0 0
0 1 0 0 0 1 0 0 0 1 0 0 1
1 0
Batu
Empedu
0 0
0
0
1 0 0 0 1 1 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0 0 0
0 0
Batuk
1 0
1
0
1 0 0 1 0 0 0 0 1 1
0 1 0 0 1 0 1 0 0 0 0 0 0
0 0
Batuk/Muntaber
Darah 0 0
1
0
1 0 0 0 0 0 0 0 0 1
0 0 0 0 0 1 1 0 1 0 0 1 0
0 0
Bau
Badan
0 0
0
0
0 0 0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 0 0 0 0 0 0
0 0
Bau
Mulut
0 0
0
0
0 0 0 0 0 0 0 0 1 0
0 0 0 1 0 0 0 0 0 0 0 0 0
0 0
Beri-Beri
0 0
0
0
1 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 0 0 0
0 0
Biang
Keringat
0 0
0
0
0 0 0 0 0 0 0 0 0 0
0 0 0 0 1 0 0 1 0 0 0 0 0
0 0
Bisul
0 0
0
1
1 1 1 0 0 0 0 0 1 0
0 0 1 1 0 1 0 1 1 1 1 0 1
0 0
Bronchitis
0 0
0
1
1 0 0 0 0 0 0 0 1 0
0 0 0 0 0 1 0 0 1 0 0 0 0
0 0
Cacar
0 0
0
0
0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 1 1 0 0 0 0
0 0
Cacingan
0 0
0
0
1 0 1 0 0 0 0 0 0 0
0 1 0 1 1 1 0 0 0 0 0 1 0
0 0
Demam
0 0
0
0
1 0 1 1 0 0 0 1 1 0
0 1 0 1 1 0 0 0 0 0 1 1 0
1 0
Diabetes
Melitus
1 0
0
1
1 0 1 0 1 1 1 0 1 1
0 1 1 1 1 0 0 0 0 1 1 0 0
0 0
Diare
1 1
1
0
1 0 0 1 1 0 0 1 1 0
0 0 1 0 0 0 0 0 0 1 0 0 0
0 0
Difteri
0 0
0
0
0 0 0 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0 0 0 0 0 0
0 0
Disentri
0 1
1
0
1 0 0 0 1 0 0 1 1 0
1 1 0 0 1 0 1 0 0 1 1 1 1
0 0
Flu
0 0
0
0
1 0 0 1 0 0 0 1 0 0
0 0 0 0 0 0 0 0 0 0 0 1 0
0 0
Gangg.
Haid
1 0
0
1
0 1 1 1 0 0 0 1 1 1
0 1 0 0 1 0 0 0 0 0 0 1 0
1 1
Gangg.Pencernaan
0 0
0
0
1 0 0 0 1 0 0 0 0 0
0 1 1 1 1 0 0 0 0 0 0 1 0
0 1
Gangg.Penglihatan
0 0
1
1
1 0 0 0 1 0 0 0 0 0
0 0 1 1 0 1 0 0 0 0 0 0 0
0 0
Gangg.
Sal.Kencing
1 0
1
0
1 0 0 0 1 1 1 0 0 0
0 0 1 0 0 1 0 1 0 0 0 1 1
0 0
Gastritis
0 0
0
0
1 0 0 0 1 0 0 0 0 0
0 0 0 0 0 1 0 0 0 0 0 0 0
0 0
NAMA TANAMAN
KHASIAT Ada
s Bu ah Ma k as ar Ca k ar Aya m Da un De wa Da un S endo k Da un Ung u
Iler Ja
h e Jom b ang K eji B el in g Ku mi s K u ci ng K u n y it Le ng kua s Li da h Bu ay a M ahk ot a De wa M eng ku du M eni ra n Mi mb a Par e P ega g an Picis an Ru m p ut Mu tia ra Sa g a Sam bi lot o S am bun g N y aw a Sid ag u ri Te m p u y un g Te m u la wa k Te m upu tih
Gondongan 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 Gonorhoe 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Hamil Anggur 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 Hepatitis 1 0 1 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 1 1 1 1 1 1 0 1 0 1 0 Hepatoma 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 Herpes 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Hernia 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Hiperkolesterolemia 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 Hipertensi 1 0 0 1 1 0 0 0 1 0 1 1 0 0 0 1 1 0 0 1 0 0 0 1 1 1 1 0 0 Impotensi 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Infeksi 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 0 0 1 0 0 0 0 0 Insomnia 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Jerawat/Flek 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 Kanker 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 0 1 Kegemukan 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 Kejang 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Kelenjar Getah Bening 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 Keputihan 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 Keracunan 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 Kesemutan 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Ketombe 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Kista 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 Kolik 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Konstipasi 0 0 0 0 0 1 1 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 Kurang Nafsu Makan 1 0 0 0 0 0 0 1 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 Kusta 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 Leukimia 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Luka Bakar 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 1 0 0 Malaria 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 Masuk Angin 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Memar/Luka 1 1 1 1 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 1 1 1 1 0 0 1 1 0 1 Melancarkan Asi 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 Mimisan 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Pertumbuhan Rambut 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0
NAMA TANAMAN
KHASIAT Ad
as Buah Ma k as ar Ca k ar A y am Dau n D ewa Daun Se n d o k D aun Un gu Il
er Jah
e Jo m b an g K eji Be lin g Ku mi s Ku ci n g K u n y it Leng ku as Li da h B u ay a M ahk ot a De w a M eng ku du Me n ir an Mi mba Pare Pegagan Picis an Ru m p u t Mut ia ra Sag a S am b ilo to S am b un g Ny aw a Si d agu ri Tem p uy un g Te m u la wa k T em u p u tih
Mual/ Muntah 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Nyeri Otot 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 Oedema 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 Patah Tulang 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 Pegal Linu 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Pembengkakan Payudara 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 Penyakit Kulit 0 1 1 1 1 1 1 0 1 0 0 0 1 1 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 Penyakit Mata 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Perdarahan 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Perut Kembung 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Pikun 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 Proteinuria 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Radang 0 0 0 1 0 0 1 0 1 0 0 1 1 0 0 1 0 0 1 1 0 1 1 0 1 0 0 0 0 Radang Prostat 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Rambut Rontok 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 Reumatik 1 0 1 1 0 0 0 0 0 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 0 1 1 0 1 Sakit Gigi/Gusi 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 Sakit Kepala 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Sakit Limpa 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Sakit Perut 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 1 Sakit Pinggang 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 Sakit Telinga 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 Sariawan 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 0 1 1 1 0 1 0 0 0 0 0 0 Selulit 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Sirosis 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 TBC 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 Terkilir 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 Tumor 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 Usus Buntu 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 Wasir 0 0 0 1 0 1 0 1 0 0 0 0 0 1 0 0 0 1 1 1 0 0 0 0 0 1 1 1 0
Lampiran 2. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Fourfoul Point
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ ILER 7
PARE 19
LIDAH BUAYA 14
MIMBA 18
MENGKUDU 16
TEMULAWAK 28
KUMIS KUCING 11
MENIRAN 17
DAUN SENDOK 5 JOMBANG 9 KEJI BELING 10
RUMPUT MUTIARA 22
SAGA 23
PEGAGAN 20
BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21 DAUN DEWA 4
DAUN UNGU 6
TEMUPUTIH 29
ADAS 1
JAHE 8
LENGKUAS 13
SIDAGURI 26
TEMPUYUNG 27
KUNYIT 12
SAMBILOTO 24
SAMBUNG NYAWA 25 MAHKOTA DEWA 15
Lampiran 3. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Dice
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
JOMBANG 9
MENIRAN 17
PEGAGAN 20
MENGKUDU 16
PARE 19
LENGKUAS 13
DAUN DEWA 4
SAMBILOTO 24
MIMBA 18
RUMPUT MUTIARA 22
SAGA 23
BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21
TEMUPUTIH 29
DAUN UNGU 6
ILER 7
LIDAH BUAYA 14
KEJI BELING 10
SIDAGURI 26
TEMPUYUNG 27
KUNYIT 12
KUMIS KUCING 11
SAMBUNG NYAWA 25
ADAS 1
JAHE 8
TEMULAWAK 28
MAHKOTA DEWA 15
Lampiran 4. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Jaccard
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
JOMBANG 9
MENIRAN 17
PEGAGAN 20
MENGKUDU 16
PARE 19
LENGKUAS 13
DAUN DEWA 4
SAMBILOTO 24
MIMBA 18
RUMPUT MUTIARA 22
SAGA 23
BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21
TEMUPUTIH 29
DAUN UNGU 6
ILER 7
LIDAH BUAYA 14
KEJI BELING 10
SIDAGURI 26
TEMPUYUNG 27
KUNYIT 12
KUMIS KUCING 11
SAMBUNG NYAWA 25
ADAS 1
JAHE 8
TEMULAWAK 28
MAHKOTA DEWA 15
Lampiran 5. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Ochiai
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
JOMBANG 9
MENIRAN 17 PEGAGAN 20
SAMBILOTO 24 SIDAGURI 26
TEMPUYUNG 27
KUNYIT 12
KUMIS KUCING 11
SAMBUNG NYAWA 25
ADAS 1
JAHE 8
TEMULAWAK 28
DAUN DEWA 4
DAUN UNGU 6 LIDAH BUAYA 14
ILER 7
PARE 19
MENGKUDU 16
LENGKUAS 13
MIMBA 18
MAHKOTA DEWA 15 KEJI BELING 10
RUMPUT MUTIARA 22
SAGA 23 BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21 TEMUPUTIH 29
Lampiran 6. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Sokal & Sneath 2
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
JOMBANG 9
MENIRAN 17
PEGAGAN 20
MENGKUDU 16
PARE 19
LENGKUAS 13
DAUN DEWA 4
SAMBILOTO 24
MIMBA 18
RUMPUT MUTIARA 22
SAGA 23
BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21
TEMUPUTIH 29
DAUN UNGU 6
ILER 7
LIDAH BUAYA 14
KEJI BELING 10
SIDAGURI 26
TEMPUYUNG 27
KUNYIT 12
KUMIS KUCING 11
SAMBUNG NYAWA 25
ADAS 1
JAHE 8
TEMULAWAK 28
MAHKOTA DEWA 15
Lampiran 7. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Sokal & Sneath 5
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
MENIRAN 17
JOMBANG 9 SAMBILOTO 24
PEGAGAN 20 SIDAGURI 26
TEMPUYUNG 27
KUNYIT 12
KUMIS KUCING 11
SAMBUNG NYAWA 25 ADAS 1
JAHE 8
LENGKUAS 13 ILER 7
PARE 19 MENGKUDU 16
LIDAH BUAYA 14
TEMULAWAK 28
MIMBA 18
MAHKOTA DEWA 15 KEJI BELING 10
DAUN DEWA 4
DAUN UNGU 6
TEMUPUTIH 29
RUMPUT MUTIARA 22
SAGA 23 BUAH MAKASAR 2 CAKAR AYAM 3
PICISAN 21
Lampiran 8. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Complete Linkage
Gerombol
Complete Linkage
Fourfoul Point Dice=Jaccard =
Sokal & Sneath 2 Ochiai Sokal & Sneath 5
1 jombang jombang jombang jombang
meniran meniran meniran meniran
kumis kucing sambiloto sambiloto sambiloto daun sendok daun sendok daun sendok daun sendok
keji beling pegagan pegagan pegagan
mengkudu sidaguri sidaguri
pare tempuyung tempuyung
lengkuas kunyit kunyit
daun dewa kumis kucing kumis kucing
mimba sambung nyawa sambung nyawa
rumput mutiara
saga
2 buah makasar buah makasar buah makasar buah makasar daun ungu picisan rumput mutiara daun ungu cakar ayam cakar ayam cakar ayam cakar ayam
picisan temuputih picisan picisan
daun dewa saga daun dewa
temuputih temuputih temuputih
rumput mutiara
saga
3 iler iler keji beling keji beling
lidah buaya lidah buaya
mimba keji beling
mengkudu daun ungu
pare
temulawak
4 sidaguri sidaguri - -
tempuyung tempuyung
kunyit kunyit
sambiloto kumis kucing
sambung nyawa sambung nyawa
mahkota dewa
5 adas adas adas adas
jahe jahe jahe jahe
lengkuas temulawak temulawak lengkuas
daun dewa iler
daun ungu mengkudu
lidah buaya pare
iler lidah buaya
pare temulawak
mengkudu mimba
lengkuas
mimba
6 rumput mutiara mahkota dewa mahkota dewa mahkota dewa saga
pegagan
Lampiran 9. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Dice
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
JOMBANG 9
MENIRAN 17
PEGAGAN 20
SAMBILOTO 24
DAUN DEWA 4
SAMBUNG NYAWA 25
MIMBA 18
KEJI BELING 10
RUMPUT MUTIARA 22
SAGA 23
BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21
MAHKOTA DEWA 15
DAUN UNGU 6
ILER 7
LIDAH BUAYA 14
TEMULAWAK 28
MENGKUDU 16
PARE 19
ADAS 1
LENGKUAS 13
JAHE 8
SIDAGURI 26
TEMPUYUNG 27
KUNYIT 12
KUMIS KUCING 11
TEMUPUTIH 29
Lampiran 10. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Ochiai
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
JOMBANG 9
MENIRAN 17
PEGAGAN 20
SAMBILOTO 24
KUMIS KUCING 11
KEJI BELING 10
MAHKOTA DEWA 15
RUMPUT MUTIARA 22
SAGA 23
BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21
DAUN DEWA 4
DAUN UNGU 6
LIDAH BUAYA 14
ILER 7 PARE 19
MENGKUDU 16
LENGKUAS 13
SAMBUNG NYAWA 25
MIMBA 18
TEMULAWAK 28
SIDAGURI 26 TEMPUYUNG 27
KUNYIT 12
ADAS 1
TEMUPUTIH 29
JAHE 8
Lampiran 11. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Sokal & Sneath 5
Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
MENIRAN 17
JOMBANG 9
SAMBILOTO 24
KUMIS KUCING 11
SAMBUNG NYAWA 25
KEJI BELING 10
MAHKOTA DEWA 15
BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21
RUMPUT MUTIARA 22 SAGA 23 PEGAGAN 20 SIDAGURI 26 TEMPUYUNG 27
KUNYIT 12
ADAS 1
JAHE 8
DAUN DEWA 4
DAUN UNGU 6
TEMUPUTIH 29
ILER 7 PARE 19 LIDAH BUAYA 14
MENGKUDU 16
LENGKUAS 13
MIMBA 18
TEMULAWAK 28
Lampiran 12. Dendogram dari kombinasi metode perbaikan jarak Centroid dengan ukuran jarak Ochiai
Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5
JOMBANG 9
PEGAGAN 20
SAMBILOTO 24
KUMIS KUCING 11
MENIRAN 17
KEJI BELING 10
SIDAGURI 26
TEMPUYUNG 27
ADAS 1
MENGKUDU 16
KUNYIT 12
SAMBUNG NYAWA 25
JAHE 8
LENGKUAS 13
LIDAH BUAYA 14
TEMULAWAK 28
ILER 7
PARE 19
MIMBA 18
RUMPUT MUTIARA 22
SAGA 23
DAUN DEWA 4
DAUN UNGU 6
TEMUPUTIH 29
BUAH MAKASAR 2
CAKAR AYAM 3
PICISAN 21
MAHKOTA DEWA 15
Lampiran 13. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Average Linkage within the New Group dan metode Centroid
Gerombol Average Linkage Within the New Group Centroid
Sokal &Sneath 5 Ochiai Dice Ochiai
1 daun sendok daun sendok daun sendok daun sendok
meniran meniran meniran meniran
sambiloto sambiloto sambiloto sambiloto
jombang jombang jombang jombang
sambung nyawa pegagan pegagan pegagan
kumis kucing kumis kucing sambung nyawa kumis kucing keji beling keji beling keji beling keji beling
mimba
daun dewa
2 rumput mutiara rumput mutiara rumput mutiara rumput mutiara
saga saga saga saga
buah makasar buah makasar buah makasar cakar ayam cakar ayam cakar ayam
picisan picisan picisan
pegagan
3 mahkota dewa mahkota dewa mahkota dewa mahkota dewa
buah makasar
cakar ayam
picisan
4 daun ungu daun ungu daun ungu daun ungu
daun dewa daun dewa iler daun dewa
temuputih lidah buaya lidah buaya temuputih
mimba adas
temulawak temulawak
mengkudu mengkudu
pare pare
lengkuas lengkuas
iler jahe
sambung nyawa
5 sidaguri sidaguri sidaguri sidaguri
tempuyung tempuyung tempuyung tempuyung
kunyit kunyit kunyit kunyit
adas adas kumis kucing adas
jahe temuputih temuputih mengkudu
sambung nyawa
6 iler jahe - jahe
pare lengkuas
lidah buaya lidah buaya
mengkudu temulawak
lengkuas iler
mimba pare
temulawak mimba
Lampiran 14. Tabel aturan asosiasi (association rule)
SET_SIZE EXP_CONF CONF SUPPORT LIFT COUNT RULE
2 24,21 85,71 6,32 3,54 6 daun ungu ==> daun dewa 2 29,47 83,33 5,26 2,83 5 kumis kucing ==> jombang 2 18,95 83,33 5,26 4,4 5 kumis kucing ==> meniran 2 32,63 81,82 9,47 2,51 9 saga ==> pegagan 2 31,58 80 8,42 2,53 8 iler ==> mengkudu 2 25,26 80 8,42 3,17 8 iler ==> pare
2 29,47 80 4,21 2,71 4 keji beling ==> jombang 2 24,21 80 4,21 3,3 4 keji beling ==> daun sendok 2 22,11 71,43 5,26 3,23 5 buah makasar ==> lengkuas 2 15,79 71,43 5,26 4,52 5 buah makasar ==> cakar ayam 2 32,63 71,43 5,26 2,19 5 daun ungu ==> pegagan 2 24,21 70 7,37 2,89 7 iler ==> daun sendok
2 31,58 70 7,37 2,22 7 sambung nyawa ==> mengkudu 2 31,58 66,67 4,21 2,11 4 kumis kucing ==> mengkudu 2 26,32 66,67 4,21 2,53 4 kumis kucing ==> adas 2 24,21 66,67 4,21 2,75 4 kumis kucing ==> daun dewa 2 24,21 66,67 4,21 2,75 4 kumis kucing ==> daun sendok 2 31,58 66,67 8,42 2,11 8 kunyit ==> mengkudu
2 29,47 66,67 12,6 2,26 12 meniran ==> jombang 2 17,89 63,64 7,37 3,56 7 tempuyung ==> sidaguri 2 24,21 61,11 11,6 2,52 11 meniran ==> daun sendok 2 29,47 60,87 14,7 2,07 14 daun sendok ==> jombang 2 24,21 60 6,32 2,48 6 iler ==> daun dewa 2 22,11 60 6,32 2,71 6 iler ==> lengkuas
2 29,47 60 6,32 2,04 6 sambung nyawa ==> jombang 2 24,21 60 6,32 2,48 6 sambung nyawa ==> daun dewa 2 24,21 60 6,32 2,48 6 sambung nyawa ==> daun sendok 2 32,63 58,82 10,5 1,8 10 sidaguri ==> pegagan
2 25,26 58,82 10,5 2,33 10 sidaguri ==> pare 2 24,21 58,82 10,5 2,43 10 sidaguri ==> daun sendok 2 26,32 58,33 7,37 2,22 7 kunyit ==> adas
2 17,89 58,33 7,37 3,26 7 kunyit ==> sidaguri 2 25,26 58,33 7,37 2,31 7 lidah buaya ==> pare 2 29,47 57,14 4,21 1,94 4 buah makasar ==> jombang 2 25,26 57,14 4,21 2,26 4 buah makasar ==> pare 2 18,95 57,14 4,21 3,02 4 buah makasar ==> meniran 2 16,84 57,14 4,21 3,39 4 buah makasar ==> picisan 2 31,58 57,14 4,21 1,81 4 daun ungu ==> mengkudu 2 25,26 57,14 4,21 2,26 4 daun ungu ==> pare 2 22,11 57,14 4,21 2,59 4 daun ungu ==> lengkuas 2 17,89 57,14 4,21 3,19 4 daun ungu ==> sidaguri 2 12,63 57,14 4,21 4,52 4 daun ungu ==> lidah buaya 2 10,53 57,14 4,21 5,43 4 daun ungu ==> iler 2 32,63 56,25 9,47 1,72 9 sambiloto ==> pegagan
2 29,47 56,25 9,47 1,91 9 sambiloto ==> jombang 2 32,63 55,56 10,5 1,7 10 meniran ==> pegagan 2 31,58 54,55 6,32 1,73 6 saga ==> mengkudu 2 22,11 54,55 6,32 2,47 6 saga ==> lengkuas 2 13,68 54,55 6,32 3,99 6 saga ==> rumput mutiara 2 32,63 54,55 6,32 1,67 6 tempuyung ==> pegagan 2 26,32 54,55 6,32 2,07 6 tempuyung ==> adas 2 24,21 54,55 6,32 2,25 6 tempuyung ==> daun dewa SET_SIZE EXP_CONF CONF SUPPORT LIFT COUNT RULE
2 24,21 54,55 6,32 2,25 6 temuputih ==> daun dewa 2 31,58 54,17 13,7 1,72 13 pare ==> mengkudu
2 26,32 53,85 7,37 2,05 7 jahe ==> adas
2 32,63 53,85 7,37 1,65 7 rumput mutiara ==> pegagan 2 31,58 53,85 7,37 1,71 7 temulawak ==> mengkudu 2 25,26 53,85 7,37 2,13 7 temulawak ==> pare 2 29,47 53,33 8,42 1,81 8 cakar ayam ==> jombang 2 24,21 53,33 8,42 2,2 8 cakar ayam ==> daun sendok 2 31,58 52,94 9,47 1,68 9 sidaguri ==> mengkudu 2 32,63 52,17 12,6 1,6 12 daun sendok ==> pegagan 2 32,63 50 5,26 1,53 5 iler ==> pegagan
2 22,11 50 5,26 2,26 5 iler ==> mimba 2 12,63 50 5,26 3,96 5 iler ==> lidah buaya 2 24,21 50 14,7 2,07 14 jombang ==> daun sendok 2 25,26 50 6,32 1,98 6 kunyit ==> pare
2 24,21 50 6,32 2,07 6 kunyit ==> daun sendok 2 31,58 50 6,32 1,58 6 lidah buaya ==> mengkudu 2 24,21 50 6,32 2,07 6 lidah buaya ==> daun dewa 2 32,63 50 8,42 1,53 8 picisan ==> pegagan 2 31,58 50 8,42 1,58 8 picisan ==> mengkudu 2 24,21 50 8,42 2,07 8 sambiloto ==> daun sendok 2 24,21 50 8,42 2,07 8 sambiloto ==> daun dewa 2 18,95 50 8,42 2,64 8 sambiloto ==> meniran 2 22,11 50 5,26 2,26 5 sambung nyawa ==> lengkuas 2 16,84 50 5,26 2,97 5 sambung nyawa ==> sambiloto
EKSPLORASI METODE KLASIFIKASI PADA DATA
BINER
DIAN RARASSANTI
G14103017
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
PENDAHULUAN
Latar Belakang
Metode klasifikasi merupakan salah satu metode analisis yang diperlukan untuk mengelompokkan objek atau item berdasarkan kemiripan sifat yang dimilikinya. Pengklasifikasian dapat diterapkan pada banyak bidang ilmu pengetahuan, salah satunya pada bidang yang berkaitan dengan ilmu alam. Jenis data dalam bidang ilmu alam yang dianalisis terkadang tidak hanya berupa data yang bersifat kuantitatif, tetapi juga banyak ditemukan data yang bersifat kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner yang hanya memiliki dua kemungkinan nilai yaitu sukses dan gagal.
Metode klasifikasi dibidang ilmu alam sangat banyak, akan tetapi dasar pengklasifikasian suatu data hanya terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol merupakan salah satu analisis peubah ganda yang bertujuan mengelompokkan objek berpeubah banyak ke dalam kelompok-kelompok berdasarkan kemiripan yang dimiliki objek tersebut. Analisis asosiasi adalah teknik untuk menemukan aturan asosiasi antara suatu kombinasi item atau objek. Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, sehingga analisis asosiasi juga sering disebut dengan istilah basket analysis.
Berdasarkan hal tersebut, dapat diketahui bahwa kegunaan kedua metode di atas adalah untuk pengklasifikasian data, dan karena dalam proses klasifikasi data banyak ditemukan kasus data biner, maka penelitian ini mengetengahkan hasil eksplorasi metode klasifikasi pada data biner dengan menggunakan analisis gerombol dan analisis asosiasi. Data yang digunakan adalah data biner tanaman obat berdasarkan khasiat yang dikandungnya.
Tujuan
Tujuan penelitian ini adalah untuk:
1. Mengeksplorasi metode klasifikasi data biner dengan analisis asosiasi pada data tanaman obat.
2. Mengklasifikasikan tanaman obat berdasarkan khasiatnya dengan menggunakan analisis gerombol.
TINJAUAN PUSTAKA
Data biner
Data biner adalah data observasi dimana nilainya hanya memiliki dua kemungkinan. Sebagai contoh bahwa pada komponen peralatan elektronik mungkin bisa rusak atau tidak, atau pada tanaman obat berkhasiat atau tidak dalam mengatasi suatu gangguan kesehatan. Jika pada individu ke-i observasi tersebut dapat dinyatakan oleh sebuah variabel acak Yi, maka pada data biner Yi dapat dinyatakan dengan kode 1 untuk data yang ‘sukses’ dan kode 0 untuk data yang ‘gagal’ (Cox 1970).
Klasifikasi
Klasifikasi menurut Kamus Besar Bahasa Indonesia (KBBI) memiliki arti penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Sedangkan pengklasifikasian berarti proses, cara, atau perbuatan mengklasifikasikan. Dalam statistika, klasifikasi merupakan salah satu metode analisis yang dapat diartikan proses pengelompokan objek berdasarkan kemiripan masing-masing variabel yang dimilikinya (Ludwig & Reynold 1988).
Analisis Gerombol
Analisis gerombol adalah salah satu analisis peubah ganda yang prinsip utamanya adalah mengklasifikasikan individu yang relatif sama atau seragam ke dalam suatu gerombol yang didasarkan pada ukuran kedekatan (ukuran jarak atau ukuran kesamaan). Objek yang terletak dalam suatu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan objek yang terletak dalam gerombol lain (Johnson & Wichern 2002). Dan diharapkan keragaman unit-unit pengamatan dalam satu gerombol lebih homogen daripada keragaman antar gerombol.
Pada jenis data biner, ukuran jarak atau kesamaan dinyatakan dalam bentuk koefisien kesamaan (similarities coefficient) yang nilainya berkisar antara 0 sampai 1. Berbeda dengan konsep jarak untuk data pengukuran, untuk data biner nilai koefisien yang diperoleh bukan menunjukkan kuantitas jarak, tetapi menunjukkan kedekatan dua variabel atau objek. Nilai yang mendekati satu menunjukkan kedua objek tersebut sangat mirip, sedangkan nilai koefisien yang mendekati nol
PENDAHULUAN
Latar Belakang
Metode klasifikasi merupakan salah satu metode analisis yang diperlukan untuk mengelompokkan objek atau item berdasarkan kemiripan sifat yang dimilikinya. Pengklasifikasian dapat diterapkan pada banyak bidang ilmu pengetahuan, salah satunya pada bidang yang berkaitan dengan ilmu alam. Jenis data dalam bidang ilmu alam yang dianalisis terkadang tidak hanya berupa data yang bersifat kuantitatif, tetapi juga banyak ditemukan data yang bersifat kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner yang hanya memiliki dua kemungkinan nilai yaitu sukses dan gagal.
Metode klasifikasi dibidang ilmu alam sangat banyak, akan tetapi dasar pengklasifikasian suatu data hanya terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol merupakan salah satu analisis peubah ganda yang bertujuan mengelompokkan objek berpeubah banyak ke dalam kelompok-kelompok berdasarkan kemiripan yang dimiliki objek tersebut. Analisis asosiasi adalah teknik untuk menemukan aturan asosiasi antara suatu kombinasi item atau objek. Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, sehingga analisis asosiasi juga sering disebut dengan istilah basket analysis.
Berdasarkan hal tersebut, dapat diketahui bahwa kegunaan kedua metode di atas adalah untuk pengklasifikasian data, dan karena dalam proses klasifikasi data banyak ditemukan kasus data biner, maka penelitian ini mengetengahkan hasil eksplorasi metode klasifikasi pada data biner dengan menggunakan analisis gerombol dan analisis asosiasi. Data yang digunakan adalah data biner tanaman obat berdasarkan khasiat yang dikandungnya.
Tujuan
Tujuan penelitian ini adalah untuk:
1. Mengeksplorasi metode klasifikasi data biner dengan analisis asosiasi pada data tanaman obat.
2. Mengklasifikasikan tanaman obat berdasarkan khasiatnya dengan menggunakan analisis gerombol.
TINJAUAN PUSTAKA
Data biner
Data biner adalah data observasi dimana nilainya hanya memiliki dua kemungkinan. Sebagai contoh bahwa pada komponen peralatan elektronik mungkin bisa rusak atau tidak, atau pada tanaman obat berkhasiat atau tidak dalam mengatasi suatu gangguan kesehatan. Jika pada individu ke-i observasi tersebut dapat dinyatakan oleh sebuah variabel acak Yi, maka pada data biner Yi dapat dinyatakan dengan kode 1 untuk data yang ‘sukses’ dan kode 0 untuk data yang ‘gagal’ (Cox 1970).
Klasifikasi
Klasifikasi menurut Kamus Besar Bahasa Indonesia (KBBI) memiliki arti penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Sedangkan pengklasifikasian berarti proses, cara, atau perbuatan mengklasifikasikan. Dalam statistika, klasifikasi merupakan salah satu metode analisis yang dapat diartikan proses pengelompokan objek berdasarkan kemiripan masing-masing variabel yang dimilikinya (Ludwig & Reynold 1988).