• Tidak ada hasil yang ditemukan

Eksplorasi Metode Klasifikasi Pada Data Biner

N/A
N/A
Protected

Academic year: 2017

Membagikan "Eksplorasi Metode Klasifikasi Pada Data Biner"

Copied!
54
0
0

Teks penuh

(1)

RINGKASAN

DIAN RARASSANTI. Eksplorasi Metode Klasifikasi pada Data Biner. Di bawah bimbingan ERFIANI dan BAGUS SARTONO.

Banyak metode yang dapat diterapkan dalam proses pengklasifikasian suatu data, terlebih lagi jika data yang dimiliki adalah yang bersifat kuantitatif. Akan tetapi dalam aplikasinya data yang dipergunakan tidak selamanya bersifat kuantitatif, banyak pula penelitian yang dilakukan memakai data kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner. Metode-metode pengklasifikasian yang dapat dipergunakan terhadap data biner masih seringkali menimbulkan berbagai pertanyaan mengenai metode yang cocok dipakai untuk mengklasifikasikannya. Adapun dasar pengklasifikasian suatu data terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Berdasarkan hal tersebut, penelitian ini bertujuan untuk mengeksplorasi metode klasifikasi pada data biner dengan menggunakan data tanaman obat berdasarkan khasiat-khasiat yang dimilikinya.

Hasil klasifikasi yang memberikan hasil terbaik adalah metode Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.

(2)

EKSPLORASI METODE KLASIFIKASI PADA DATA

BINER

DIAN RARASSANTI

G14103017

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(3)

RINGKASAN

DIAN RARASSANTI. Eksplorasi Metode Klasifikasi pada Data Biner. Di bawah bimbingan ERFIANI dan BAGUS SARTONO.

Banyak metode yang dapat diterapkan dalam proses pengklasifikasian suatu data, terlebih lagi jika data yang dimiliki adalah yang bersifat kuantitatif. Akan tetapi dalam aplikasinya data yang dipergunakan tidak selamanya bersifat kuantitatif, banyak pula penelitian yang dilakukan memakai data kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner. Metode-metode pengklasifikasian yang dapat dipergunakan terhadap data biner masih seringkali menimbulkan berbagai pertanyaan mengenai metode yang cocok dipakai untuk mengklasifikasikannya. Adapun dasar pengklasifikasian suatu data terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Berdasarkan hal tersebut, penelitian ini bertujuan untuk mengeksplorasi metode klasifikasi pada data biner dengan menggunakan data tanaman obat berdasarkan khasiat-khasiat yang dimilikinya.

Hasil klasifikasi yang memberikan hasil terbaik adalah metode Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.

(4)

EKSPLORASI METODE KLASIFIKASI PADA DATA BINER

DIAN RARASSANTI

Skripsi

sebagai salah satu syarat memperoleh gelar Sarjana Sains

pada Departemen Statistika

Fakultas Matematika dan Pengetahuan Alam

Institut Pertanian Bogor

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

2007

(5)
(6)

RIWAYAT HIDUP

Penulis dilahirkan di Bantul pada tanggal 26 Mei 1985 sebagai anak pertama dari dua bersaudara, anak dari pasangan Slamet Wiranto dan Sumi Awaliati.

Pada tahun 2003 penulis menyelesaikan pendidikan menengah lanjutan atas di SMU Negeri 5 Bogor sedangkan pada tahun yang sama pula diterima di Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor melalui Undangan Seleksi Masuk IPB (USMI).

Selama mengikuti perkuliahan, penulis ikut serta dalam kegiatan Himpro Gamma Sigma Beta (GSB) periode 2003/2004 sebagai staf Departemen Kewirausahaan dan periode 2004/2005 sebagai staf Departemen Eksternal, Keluarga Mahasiswa Muslim Statistika (KAMMUS) periode 2004/2005 sebagai bendahara, dan Decision Centre periode 2006/2007 sebagai sekretaris serta mengikuti kegiatan internal lainnya pula. Penulis juga mengikuti kegiatan Praktek Lapang di PT. Capricorn MARS Indotama pada bulan Februari-April 2007.

(7)

KATA PENGANTAR

Alhamdulillahirabbil’alamin, segala puji dan syukur dipanjatkan kehadirat Allah SWT atas segala hidayah, nikmat, dan karunia-Nya sehingga penulis dapat menyelesaikan karya ilmiah ini. Shalawat serta salam semoga selalu tercurahkan kepada Rasulullah SAW, keluarga, sahabat dan umatnya hingga akhir zaman.

Karya ilmiah ini berjudul “Eksplorasi Metode Klasifikasi pada Data Biner”. Dalam penelitian ini dilakukan eksplorasi terhadap data tanaman obat yang diklasifikasikan berdasarkan khasiatnya. Dari eksplorasi tersebut didapatkan pengklasifikasian tanaman obat menjadi enam klasifikasi. Hal ini diduga sesuai dengan kandungan fitokimia pada tanaman obat yang berhubungan dengan khasiat yang dapat disembuhkan tanaman obat tersebut.

Terima kasih penulis sampaikan kepada berbagai pihak yang telah membantu dalam penyelesaian karya ilmiah ini, yaitu kepada :

1. Ibu Dr. Ir. Erfiani, M.S dan Bapak Bagus Sartono, S.Si, M.Si terima kasih atas segala bimbingan, saran dan kritik sehingga karya ilmiah ini dapat diselesaikan.

2. Bapak, Ibu, dan dèk Rista yang aku sayangi atas do’a, semangat dan kasih sayang yang tak pernah berhenti mengalir.

3. Segenap staf pengajar di Departemen Statistika FMIPA IPB terima kasih atas pengajaran yang diberikan sehingga penulis dapat menyelesaikan studi dan karya ilmiah ini.

4. Seluruh staf pegawai Departemen Statistika FMIPA IPB: bu Markonah, bu Sulis, bu Dedeh, bang Sudin, mang Dur, mang Herman, pak Ian, bu Aat dan pak Edi yang selalu setia membantu segala keperluan yang menyangkut penyelesaian karya ilmiah ini. 5. Teman-teman seperjuangan di Statistika 40, terimakasih atas segala kekompakan dan

kerjasama yang sudah diberikan selama empat tahun ini. Terlebih lagi Ema (atas tumpangan kost-nya selama beberapa bulan terakhir ini),Lala dan Bayu (atas berbagai bentuk bantuan yang telah diberikan), Ari dan kang masnya, Muti, Daus (teman seperjuanganku), Riko (atas CD-nya), mas Den (atas semua saran yang sudah diberikan), Essy, Rina, Edo, dkk, Anggoro dan seluruh teman-temanku tercinta, terima kasih bantuan dan dukungannya.

6. Mbak Dani’ dan keluarga besarku, mbak Fera, Hurry, the 48’ers, Azzahra crew, juga Halimuners.

7. Semua kakak kelas 39, 38, 37 dan adik-adik Statistika angkatan 41, 42, dan 43.

8. Semua pihak yang telah memberikan dukungan kepada penulis yang tidak dapat disebutkan satu per satu.

Penulis menyadari bahwa masih banyak kekurangan dalam karya ilmiah ini. Semoga karya ilmiah ini dapat bermanfaat.

Bogor, September 2007 Penulis

(8)

DAFTAR ISI

Halaman

DAFTAR TABEL ... vii

DAFTAR GAMBAR ... vii

DAFTAR LAMPIRAN ... viii

PENDAHULUAN Latar Belakang ... 1

Tujuan ... 1

TINJAUAN PUSTAKA Data biner ... 1

Klasifikasi ... 1

Analisis gerombol ... 1

Analisis asosiasi ... 3

BAHAN DAN METODE Bahan ... 3

Metode ... 3

HASIL DAN PEMBAHASAN Analisis gerombol ... 4

Analisis asosiasi ... 4

Eksplorasi hasil analisis gerombol dengan analisis asosiasi ... 6

KESIMPULAN ... 6

DAFTAR PUSTAKA ... 7

LAMPIRAN ... 8

(9)

DAFTAR TABEL

Halaman

1. Tabel kontingensi data biner ... 2 2. Aturan tunggal dari aturan asosiatif ... 5 3. Klasifikasi dari analisis asosiatif ... 5

DAFTAR GAMBAR

Halaman

1. Grafik asosiasi (Association Graph) ... 5

(10)

DAFTAR LAMPIRAN

Halaman

1. Data tanaman obat berdasarkan khasiat yang dimilikinya ... 8 2. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran

jarak Fourfoul Point ... 11 3. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran

jarak Dice ... 11 4. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran

jarak Jaccard ... 12 5. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan

ukuran jarak Ochiai ... 12 6. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran

jarak Sokal & Sneath 2 ... 13 7. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran

jarak Sokal & Sneath 5 ... 13 8. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Complete Linkage ... 14 9. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New

Group dengan ukuran jarak Dice ... 15 10. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New

Group dengan ukuran jarak Ochiai ... 15 11. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New

Group dengan ukuran jarak Sokal & Sneath 5 ... 16 12. Dendogram dari kombinasi metode perbaikan jarak Centroid dengan ukuran jarak

Ochiai ... 16 13. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Average Linkage

within the New Group dan metode Centroid ... 17 14. Tabel aturan asosiasi (association rule) ... 18

(11)

PENDAHULUAN

Latar Belakang

Metode klasifikasi merupakan salah satu metode analisis yang diperlukan untuk mengelompokkan objek atau item berdasarkan kemiripan sifat yang dimilikinya. Pengklasifikasian dapat diterapkan pada banyak bidang ilmu pengetahuan, salah satunya pada bidang yang berkaitan dengan ilmu alam. Jenis data dalam bidang ilmu alam yang dianalisis terkadang tidak hanya berupa data yang bersifat kuantitatif, tetapi juga banyak ditemukan data yang bersifat kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner yang hanya memiliki dua kemungkinan nilai yaitu sukses dan gagal.

Metode klasifikasi dibidang ilmu alam sangat banyak, akan tetapi dasar pengklasifikasian suatu data hanya terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol merupakan salah satu analisis peubah ganda yang bertujuan mengelompokkan objek berpeubah banyak ke dalam kelompok-kelompok berdasarkan kemiripan yang dimiliki objek tersebut. Analisis asosiasi adalah teknik untuk menemukan aturan asosiasi antara suatu kombinasi item atau objek. Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, sehingga analisis asosiasi juga sering disebut dengan istilah basket analysis.

Berdasarkan hal tersebut, dapat diketahui bahwa kegunaan kedua metode di atas adalah untuk pengklasifikasian data, dan karena dalam proses klasifikasi data banyak ditemukan kasus data biner, maka penelitian ini mengetengahkan hasil eksplorasi metode klasifikasi pada data biner dengan menggunakan analisis gerombol dan analisis asosiasi. Data yang digunakan adalah data biner tanaman obat berdasarkan khasiat yang dikandungnya.

Tujuan

Tujuan penelitian ini adalah untuk:

1. Mengeksplorasi metode klasifikasi data biner dengan analisis asosiasi pada data tanaman obat.

2. Mengklasifikasikan tanaman obat berdasarkan khasiatnya dengan menggunakan analisis gerombol.

TINJAUAN PUSTAKA

Data biner

Data biner adalah data observasi dimana nilainya hanya memiliki dua kemungkinan. Sebagai contoh bahwa pada komponen peralatan elektronik mungkin bisa rusak atau tidak, atau pada tanaman obat berkhasiat atau tidak dalam mengatasi suatu gangguan kesehatan. Jika pada individu ke-i observasi tersebut dapat dinyatakan oleh sebuah variabel acak Yi, maka pada data biner Yi dapat dinyatakan dengan kode 1 untuk data yang ‘sukses’ dan kode 0 untuk data yang ‘gagal’ (Cox 1970).

Klasifikasi

Klasifikasi menurut Kamus Besar Bahasa Indonesia (KBBI) memiliki arti penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Sedangkan pengklasifikasian berarti proses, cara, atau perbuatan mengklasifikasikan. Dalam statistika, klasifikasi merupakan salah satu metode analisis yang dapat diartikan proses pengelompokan objek berdasarkan kemiripan masing-masing variabel yang dimilikinya (Ludwig & Reynold 1988).

Analisis Gerombol

Analisis gerombol adalah salah satu analisis peubah ganda yang prinsip utamanya adalah mengklasifikasikan individu yang relatif sama atau seragam ke dalam suatu gerombol yang didasarkan pada ukuran kedekatan (ukuran jarak atau ukuran kesamaan). Objek yang terletak dalam suatu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan objek yang terletak dalam gerombol lain (Johnson & Wichern 2002). Dan diharapkan keragaman unit-unit pengamatan dalam satu gerombol lebih homogen daripada keragaman antar gerombol.

Pada jenis data biner, ukuran jarak atau kesamaan dinyatakan dalam bentuk koefisien kesamaan (similarities coefficient) yang nilainya berkisar antara 0 sampai 1. Berbeda dengan konsep jarak untuk data pengukuran, untuk data biner nilai koefisien yang diperoleh bukan menunjukkan kuantitas jarak, tetapi menunjukkan kedekatan dua variabel atau objek. Nilai yang mendekati satu menunjukkan kedua objek tersebut sangat mirip, sedangkan nilai koefisien yang mendekati nol

(12)

menunjukkan bahwa kedua objek tersebut tidak mirip.

Koefisien kesamaan diperoleh dengan terlebih dahulu dibuat tabel kontingensi 2x2 untuk setiap pasang objek ke-i dan ke-j, seperti pada Tabel 1 berikut ini (Digby & Kempton 1987):

Tabel 1. Tabel Kontingensi Data Biner

Individu ke-i

Total Individu

ke-j

1 0

1 a b a + b 0 c d c + d Total a + c b + d p dengan:

p = total jumlah objek

a = frekuensi kedua individu bernilai 1 b, c = frekuensi satu objek bernilai 1 dan

objek lainnya bernilai 0

d = frekuensi kedua individu bernilai 0 Terdapat dua teknik penggerombolan pada analisis gerombol, yaitu teknik hirarki dan nonhirarki. Teknik berhirarki digunakan jika jumlah gerombol yang terbentuk tidak diketahui sebelumnya, sedangkan teknik nonhirarki digunakan apabila jumlah gerombol yang terbentuk sudah ditetapkan dari awal (Johnson & Wichern 2002). Metode gerombol berhirarki dapat digunakan untuk menggerombolkan data biner. Di dalam metode tersebut terdapat beberapa metode perbaikan jarak, seperti metode pautan tunggal (Single Linkage), pautan lengkap (Complete Linkage), pautan rataan dalam kelompok (Average Linkage within the New Group), pautan rataan antar kelompok (Average Linkage between Merged Group), Centroid, Median, dan Ward (Johnson & Wichern 2002). Adapun beberapa tipe ukuran kesamaan yang digunakan pada data biner, yaitu seperti:

1. Simple Matching

Ukuran kesamaan bertipe ini merupakan perbandingan objek yang sepadan terhadap jumlah keseluruhan objek yang ada. Ukuran ini memberikan bobot yang sama baik pada objek yang sepadan maupun yang tidak sepadan. Rumusnya diformulasikan sebagai berikut:

p d a+

2. Fourfoul Point

Ukuran kedekatan ini adalah salah satu bentuk ukuran kesamaan yang diperuntukan pada data biner. Adapun formulasinya adalah sebagai berikut:

(

a b

)(

a c

)(

b d

)(

c d

)

bc ad + + + + − 3. Jaccard

Nilai koefisien Jaccard adalah suatu indeks dimana nilai d (0-0 sepadan) tidak dimasukkan dalam perhitungan. Ukuran ini pun memberikan bobot yang sama baik pada objek yang sepadan maupun yang tidak sepadan. Persamaannya sebagai berikut: c b a a + + 4. Dice

Ukuran Dice dikenal juga dengan nama ukuran Czekanowski atau ukuran Serensen. Ukuran ini sama dengan ukuran persamaan Jaccard dimana nilai d tidak dimasukkan dalam perhitungan, akan tetapi nilai a (1-1 sepadan) diberikan bobot ganda. Formulasinya adalah:

c b a a + + 2 2

5. Sokal & Sneath 2

Ukuran Sokal & Sneath 2 memberikan bobot yang sama pada objek yang tidak sepadan. Masing-masing objek yang tidak sepadan tersebut diberi bobot ganda. Namun nilai d tidak dimasukkan dalam perhitungan. Berikut formulasinya:

(

b c

)

a a

+ +2 6. Ochiai

Ukuran kesamaan ini diperkenalkan ditahun 1957. Rumus ukuran kesamaan Ochiai diformulasikan sebagai berikut:

(

a b

)(

a c

)

a + + 7. Sokal & Sneath 4

Ukuran kesamaan ini didasari oleh peluang bersyarat dari satu nilai a, sedangkan nilai objek yang lain dinyatakan sebagai predictor yang dihitung dari nilai rata-ratanya. Adapun rumusnya adalah sebagai berikut:

(

)

(

)

(

)

(

)

4 d c d d b d c a a b a

a + + + + + + +

8. Sokal & Sneath 5

Ukuran kesamaan ini bebas dari pengkodean objek-objeknya. Adapun rumusnya adalah sebagai berikut:

(

a b

)(

a c

)(

b d

)(

c d

)

(13)

Wijayati (2002) menyatakan bahwa metode klasifikasi terbaik adalah metode perbaikan jarak Average Linkage within the New Group dengan simple matching sebagai kombinasi ukuran kesamaannya.

Analisis Asosiasi

Analisis asosiasi dikenal sebagai salah satu teknik eksplorasi data yang menjadi langkah awal dari berbagai teknik eksplorasi data lainnya. Dasar analisis asosiasi adalah menemukan aturan asosiasi antar kombinasi item atau objek. Contoh aturan asosiasi dari analisa pembelian di suatu pasar swalayan adalah bisa diketahui berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya atau merancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu (Bajcsy 2002).

Oleh karena itu, analisis asosiasi dapat didefinisikan sebagai suatu proses untuk menemukan semua aturan asosiasi yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence). Penting tidaknya suatu aturan asosiasi dapat diketahui dengan dua ukuran, yaitu support (nilai penunjang) yang berarti persentase kombinasi item dalam database dan confidence (nilai kepastian) yang berarti kuatnya hubungan antar item dalam aturan asosiasi.

Aturan asosiasi biasanya dinyatakan dalam bentuk :

{X1} {X2}

(supp = a%, conf = b%)

dengan X1 merupakan item di sebelah kiri

aturan asosiasi (left hand of rule) sedangkan X2

merupakan item di sebelah kanan aturan asosiasi (right hand of rule). Hal ini berarti b% dari transaksi di database yang memuat item X1

juga memuat item X2. Sedangkan a% dari

seluruh transaksi yang ada di database memuat kedua item itu.

Dua tahap dalam mendapatkan aturan asosiasi (Tan, Steinbach, & Kumar 2004):

• Analisa pola frekuensi tinggi

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database.

• Pembentukan aturan asosiasi

Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk

confidence dengan menghitung confidence aturan asosiasi Xi Xj dimana i

j dari support pola frekuensi tinggi Xi

dan Xj dengan menggunakan rumus

berikut :

Conf (Xi Xj)=

(

( )

)

i j i X X X supp supp ∪

BAHAN DAN METODE

Bahan

Data yang digunakan dalam penelitian ini adalah data tanaman obat-obatan tradisional berdasarkan khasiat yang terkandung di dalamnya, yaitu terdiri dari 29 jenis tanaman obat dengan 95 macam gangguan kesehatan yang dapat diatasinya. Dari data yang tercantum, nilai 1 menunjukkan bahwa tanaman obat ke-i berkhasiat mengatasi berbagai gangguan kesehatan tertentu, sedangkan nilai 0 menunjukkan tanaman obat ke-i tidak berkhasiat mengatasi gangguan kesehatan tersebut. Data ini diambil dari PSB (Pusat Studi Biofarmaka) dan dilengkapi informasi dari pustaka “Atlas Tumbuhan Obat Indonesia” (Dalimartha 1999, 2000, 2003). Data yang digunakan terlampir pada Lampiran 1.

Perangkat lunak yang digunakan dalam penelitian ini adalah SPSS 13.0 for Windows, Microsoft Excel, dan SAS Enterprise Miner 4.3.

Metode

Dari data tersebut, dilakukan analisis data dengan menggunakan metode klasifikasi yaitu analisis gerombol dan analisis asosiasi.

Tahapan analisis data yang dilakukan dalam penelitian ini adalah:

1. Analisis data menggunakan analisis gerombol berhirarki dilakukan dengan menggunakan bantuan perangkat lunak SPSS 13.0 for Windows. Pada penelitian ini dikombinasikan 7 metode perbaikan jarak dan 20 ukuran kesamaan. Tujuh metode perbaikan jarak yang digunakan adalah:

Single Linkage Complete Linkage

Average Linkage within the New Group

Average Linkage between Merged Group

Centroid Median Ward

(14)

Sementara itu, 20 ukuran kesamaan yang digunakan adalah:

Simple matching Fourfoul point Jaccard Dice

Sokal & Sneath 1 Sokal & Sneath 2 Sokal & Sneath 3 Sokal & Sneath 4 Sokal & Sneath 5 Ochiai

Russel & Rao Rogers & Tanimoto Kulczynski 1 Kulczynski 2 Hamann

Goodman & Kruskal Lambda Anderberg’s D

Yule’s Y Yule’s Q Dispersion

Dengan demikian terdapat 140 kombinasi metode perbaikan jarak dan ukuran jarak yang dilakukan.

2. Analisis data dengan analisis asosiasi, dilakukan pada jumlah level (jumlah item pada aturan asosiasi yang terbentuk) sebanyak 2, hal ini disebabkan karena selain untuk melihat hubungan keeratan antar item di dalamnya, juga akan mempermudah penginterpretasian klasifikasi data tanaman obat berdasarkan khasiatnya tersebut. Adapun tahapannya adalah sebagai berikut: • Analisa pola frekuensi tinggi

Mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database, nilai minimum support yang digunakan adalah sebesar 4%.

• Pembentukan aturan asosiasi

Langkah selanjutnya adalah mencari aturan asosiasi yang memenuhi syarat minimum untuk confidence, nilai minimum confidence yang digunakan adalah sebesar 50%.

Sehingga secara keseluruhan analisis ini dapat diinterpretasikan bahwa 50% dari transaksi di database yang memuat item di sebelah kiri aturan asosiasi (left hand of rule) juga memuat item di sebelah kanan aturan asosiasi (right hand of rule). Sedangkan 4% dari seluruh transaksi yang ada di database memuat kedua item tersebut.

Analisis ini dianalisis menggunakan perangkat lunak SAS Enterprise Miner 4.3 dan dibantu dengan SPSS 13.0 for Windows. 3. Eksplorasi hasil kedua metode tersebut.

Menginterpretasikan hasil klasifikasi yang diperoleh kedua metode kemudian mencari klasifikasi yang sesuai dan serupa dari kedua metode tersebut.

HASIL DAN PEMBAHASAN

Analisis Gerombol

Metode perbaikan jarak Complete Linkage dikombinasikan dengan ukuran kesamaan Ochiai, dan Sokal & Sneath 5 mengklasifikasikan tanaman obat menjadi 5 gerombol. Sedangkan apabila dikombinasikan dengan ukuran kesamaan Fourfoul Point, Dice, Jaccard, dan Sokal & Sneath 2 mengklasifikasikan tanaman obat menjadi 6 gerombol. Dendrogram kombinasi antara metode perbaikan jarak Complete Linkage dapat dilihat pada Lampiran 2-7. Hasil penggerombolan oleh metode Complete Linkage dilampirkan pada Lampiran 8.

Hasil pengklasifikasian pada metode Average Linkage within the New Group yang dikombinasikan dengan ukuran kesamaan Dice membentuk 5 gerombol. Sedangkan jika dikombinasikan dengan ukuran kesamaan Ochiai dan Sokal & Sneath 5 membentuk 6 gerombol (Lampiran 9-11).

Metode perbaikan jarak Centroid membentuk 6 gerombol jika dikombinasikan dengan ukuran kesamaan Ochiai. Dengan dendrogram terlampir pada Lampiran 12. Daftar klasifikasi untuk metode perbaikan jarak Average Linkage within the New Group dan Centroid terlampir pada Lampiran 13.

Metode perbaikan jarak yang digunakan pada penelitian ini adalah Average Linkage within the New Group, Complete Linkage, dan Centroid. Sedangkan ukuran kesamaannya adalah Sokal & Sneath 4, Sokal & Sneath 5, Ochiai, Sokal & Sneath 2, Fourfoul point, Jaccard, Dice. Jumlah gerombol yang terbentuk pada penelitian ini sesuai dengan banyaknya kelompok kandungan fitokimia dari tanaman obat, yaitu sebanyak 5 atau 6 gerombol. Hal ini mengidentifikasikan bahwa metode yang dipergunakan untuk melakukan penggerombolan tanaman obat pada penelitian ini sudah tepat digunakan.

Analisis Asosiasi

Langkah pertama analisis ini adalah analisa nilai frekuensi tinggi atau mencari nilai support dari masing-masing kombinasi rule yang terbentuk. Pada penelitian ini nilai support minimumnya ditetapkan sebesar 4% sehingga

(15)

nilai support yang kurang dari nilai 4% dihilangkan. Total kombinasi item yang terbentuk oleh analisis asosiasi pada level 2 adalah sebanyak 102 aturan (rule) asosiasi, akan tetapi setelah proses analisa frekuensi tinggi dilakukan, aturan yang memiliki persentase di atas 4% adalah sebanyak 77 aturan asosiasi yang terlihat pada Gambar 1.

Dari Gambar 1, terlihat bahwa nilai confidence ditandai oleh perbedaan bentuk, sedangkan nilai support ditandai oleh perbedaan warna, seperti pada sambiloto dan daun sendok terlihat memiliki asosiasi yang cukup besar, yaitu dengan support berada di antara 7.5-8.82% dan confidence di antara 50-54.46%, begitu pun tanaman obat yang lainnya. Nilai ini dapat dilihat secara lebih jelas pada tabel asosiasi Lampiran 14.

Setelah itu, tahap selanjutnya adalah mencari aturan asosiasi yang memenuhi syarat minimum untuk confidence, nilai minimum confidence yang digunakan adalah sebesar 50%. Dari 77 aturan asosiasi yang terbentuk tadi kemudian diurutkan berdasarkan left hand of rule untuk mendapatkan dasar pengklasifikasiannya dengan cara mencari aturan asosiasi yang unik atau tunggal yang hanya memiliki satu aturan asosiasi saja. Aturan yang ditemukan adalah:

Tabel 2. Aturan Tunggal dari Aturan Asosiasi gerombol left hand of rule right hand of rule

1 temuputih daun dewa

2 jombang daun sendok

3 rumput mutiara pegagan

4 jahe adas

5 pare mengkudu

Setelah itu, tanaman-tanaman obat yang lain diklasifikasikan sesuai dengan right hand of rule yang terlebih dahulu diurutkan nilai support dan nilai confidence yang menyertainya. Adapun hasil pengklasifikasian yang terbentuk pada analisis asosiasi ini dapat dilihat pada Tabel 3.

Tabel 3. Klasifikasi dari Analisis Asosiasi Gerombol Tanaman obat

1 daun ungu

daun dewa

temuputih

2 kumis kucing keji beling

daun sendok

jombang meniran

sambung nyawa

sambiloto 3 buah makasar

saga

cakar ayam

pegagan picisan

rumput mutiara 4 kunyit

jahe sidaguri adas tempuyung 5 temulawak

mengkudu pare

Gambar 1. Grafik Asosiasi (Association Graph)

(16)

Gerombol Tanaman obat iler

lidah buaya

mimba lengkuas

6 mahkota dewa

Klasifikasi pertama terbentuk karena daun ungu dan temuputih memiliki asosiasi yang kuat yaitu daun dewa sebagai penghubung di antara keduanya, selain itu asosiasi daun ungu dan daun dewa memiliki nilai confidence terbesar dari nilai asosiasi yang lainnya, yaitu sebesar 85.71% yang berarti bahwa 85.71% dari khasiat tanaman obat yang memuat daun ungu juga memuat daun dewa, sedangkan 6.32% dari khasiat tanaman obat memuat keduanya.

Pada klasifikasi kedua, daun sendok dan jombang sebagian besar memiliki anggota tanaman obat yang sama, sehingga daun sendok, jombang, dan tanaman obat yang sama di dalamnya dapat dijadikan satu klasifikasi. Kumis kucing juga dapat dijadikan satu, karena tanaman obat yang berasosiasi terhadap kumis kucing sama seperti pada daun sendok dan jombang, sedangkan oleh karena keji beling memiliki asosiasi yang kuat dengan daun sendok dan jombang, maka tanaman ini pun dapat dimasukkan ke dalam klasifikasi kedua.

Sedangkan klasifikasi ketiga terbentuk dikarenakan memiliki asosiasi yang kuat, hal ini terlihat dari nilai confidence & support yang dimiliki anggota tanaman obat di dalamnya relatif cukup besar antara satu dengan yang lainnya. Terlihat pada saga dan pegagan yang memiliki nilai confidence terbesar ke empat dari keseluruhan aturan asosiasi.

Klasifikasi keempat terbentuk karena ada kesamaan asosiasi nilai confidence dan support antara kunyit dan jahe, yaitu dihubungkan dengan tanaman adas. Tempuyung dapat dimasukkan ke dalam klasifikasi ini karena memiliki nilai confidence dan support yang cukup kuat dengan adas dan sidaguri.

Pada klasifikasi kelima, masing-masing item di dalamnya saling memiliki keterkaitan, sehingga tujuh tanaman obat ini dapat dimasukan dalam satu gerombol. Seperti dapat dilihat bahwa mimba hanya berasosiasi dengan iler, sedangkan antara iler dengan lengkuas, lidah buaya, dan juga pare dapat diklasifikasikan ke dalamnya karena memiliki nilai support dan confidence yang paling besar.

Klasifikasi keenam terbentuk karena pada 77 aturan asosiasi yang dihasilkan tidak muncul sama sekali tanaman mahkota dewa,

sehingga mahkota dewa dapat membentuk klasifikasi sendiri.

Eksplorasi Hasil Analisis Gerombol dengan Analisis Asosiasi

Klasifikasi dengan menggunakan analisis gerombol yang dihasilkan pada penelitian ini sesuai dengan Wijayati (2002), yang menyebutkan bahwa metode perbaikan jarak terbaik adalah Average Linkage within the New Group. Sedangkan ukuran kesamaan yang memberikan klasifikasi yang memuaskan adalah Sokal & Sneath 5, hal ini didukung oleh hasil pengklasifikasian analisis asosiasi yang menunjukkan hasil yang sama pula.

Klasifikasi yang dihasilkan dengan menggunakan analisis asosiasi memiliki kemiripan dengan hasil klasifikasi pada analisis gerombol, yaitu pada kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5. Sehingga dalam penelitian ini data tanaman obat dapat diklasifikasikan ke dalam 6 gerombol dimana masing-masing gerombol yang terbentuk diklasifikasikan berdasarkan khasiat yang terkandung di dalam tanaman obat tersebut. Penggerombolan ini pun sesuai dengan kandungan senyawa fitokimia yang cenderung dapat dibagi ke dalam 6 kelompok, yaitu alkaloid, flavonoid, steroid, triterpenoid, saponin dan tanin.

KESIMPULAN

Eksplorasi metode klasifikasi data biner tanaman obat-obatan berdasarkan khasiatnya dapat dilakukan dengan banyak metode. Akan tetapi dasar dari metode pengklasifikasian terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol yang memberikan hasil terbaik adalah metode Average Linkage within the New Group dengan ukuran kesamaan Sokal & Sneath 5, yaitu membagi data tanaman obat berdasarkan khasiatnya menjadi 6 gerombol. Hal ini sesuai dengan hasil klasifikasi pada analisis asosiasi yang menunjukkan hasil yang serupa. Selain itu, analisis ini pun cenderung membentuk klasifikasi tanaman yang sesuai dengan kandungan fitokimia pada tanaman obat tersebut.

(17)

DAFTAR PUSTAKA

Bajcsy, P. 2002. Introduction to Data Mining [modul].

Cox, D. R. & Snell E. J. 1996. Analysis of Binary Data. London: Chapman and Hall. Dalimartha, S. 1999. Atlas Tumbuhan Obat

Indonesia. Jilid 1. Depok: Puspa Swara. Dalimartha, S. 2000. Atlas Tumbuhan Obat

Indonesia. Jilid 2. Depok: Puspa Swara. Dalimartha, S. 2003. Atlas Tumbuhan Obat

Indonesia. Jilid 3. Depok: Puspa Swara. Digby, P. G. N & R. A. Kempton. 1987.

Multivariate Analysis of Ecological Communities. New York: Chapman and Hall.

Johnson, R. A. & Wichern, D. W. 2002. Applied Multivariate Statistical Analysis. Ed ke-5. New Jersey: Prentice Hall.

Kamus Besar Bahasa Indonesia. 1989. Jakarta: Balai Pustaka.

Ludwig, J. A. & Reynold, J. F. 1988. Statistical Ecology. Canada: J Wiley. Tan, P.N, M. Steinbach, & V. Kumar. 2004.

Introduction to Data Mining [modul]. Wijayati, A. 2002. Evaluasi Konsep Jarak dan

Metode Penggerombolan untuk Data Biner [skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

(18)
(19)

Lampiran 1. Data tanaman obat berdasarkan khasiat yang dimilikinya

NAMA TANAMAN

KHASIAT

Ad

as

Bu

ah

Ma

k

as

ar

Ca

k

ar

A

y

am

D

au

n

De

wa

Da

u

n

Se

nd

ok

Da

u

n

Un

g

u

Il

er

Ja

h

e

Jo

m

ba

ng

K

eji B

elin

g

Ku

m

is

Ku

ci

n

g

K

u

n

y

it

L

eng

kua

s

Li

da

h B

u

ay

a

M

ahko

ta

De

wa

M

engku

du

M

eni

ra

n

Mi

m

b

a

Pa

re

Pe

ga

ga

n

Pi

ci

sa

n

R

u

m

put

M

u

tia

ra

Sa

g

a

S

am

b

ilo

to

Sa

m

b

ung

Ny

aw

a

S

idagu

ri

T

em

p

uy

un

g

Te

m

u

la

w

ak

Te

m

uput

ih

Alzheimer

0 0

0

0

0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 1 0 0 0 0 0 0 0

0 0

Amandel

0 0

0

0

0 0 0 0 0 0 0 0 0 0

0 1 0 0 0 0 0 0 0 0 0 0 0

0 0

Anemia

0 0

0

0

0 0 0 0 1 0 0 0 1 0

0 0 0 0 0 0 0 0 0 0 0 0 0

0 0

Arthritis

0 0

0

0

0 0 0 0 0 0 0 0 0 0

0 0 0 1 0 0 0 0 0 0 0 0 0

0 0

Asam

Urat

0 0

0

0

0 0 0 0 1 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0

0 0

Asites

0 0

1

0

0 0 0 0 0 0 0 0 0 0

0 0 1 0 0 0 0 0 0 0 0 0 0

0 0

Asma

1 0

0

0

0 0 0 0 0 0 0 1 0 0

0 1 0 0 0 1 0 0 0 1 0 0 1

1 0

Batu

Empedu

0 0

0

0

1 0 0 0 1 1 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0

0 0

Batuk

1 0

1

0

1 0 0 1 0 0 0 0 1 1

0 1 0 0 1 0 1 0 0 0 0 0 0

0 0

Batuk/Muntaber

Darah 0 0

1

0

1 0 0 0 0 0 0 0 0 1

0 0 0 0 0 1 1 0 1 0 0 1 0

0 0

Bau

Badan

0 0

0

0

0 0 0 0 0 0 0 0 1 0

0 0 0 0 0 0 0 0 0 0 0 0 0

0 0

Bau

Mulut

0 0

0

0

0 0 0 0 0 0 0 0 1 0

0 0 0 1 0 0 0 0 0 0 0 0 0

0 0

Beri-Beri

0 0

0

0

1 0 0 0 0 0 0 0 0 0

0 1 0 0 0 0 0 0 0 0 0 0 0

0 0

Biang

Keringat

0 0

0

0

0 0 0 0 0 0 0 0 0 0

0 0 0 0 1 0 0 1 0 0 0 0 0

0 0

Bisul

0 0

0

1

1 1 1 0 0 0 0 0 1 0

0 0 1 1 0 1 0 1 1 1 1 0 1

0 0

Bronchitis

0 0

0

1

1 0 0 0 0 0 0 0 1 0

0 0 0 0 0 1 0 0 1 0 0 0 0

0 0

Cacar

0 0

0

0

0 0 0 0 0 0 0 0 0 0

0 1 0 0 0 0 0 1 1 0 0 0 0

0 0

Cacingan

0 0

0

0

1 0 1 0 0 0 0 0 0 0

0 1 0 1 1 1 0 0 0 0 0 1 0

0 0

Demam

0 0

0

0

1 0 1 1 0 0 0 1 1 0

0 1 0 1 1 0 0 0 0 0 1 1 0

1 0

Diabetes

Melitus

1 0

0

1

1 0 1 0 1 1 1 0 1 1

0 1 1 1 1 0 0 0 0 1 1 0 0

0 0

Diare

1 1

1

0

1 0 0 1 1 0 0 1 1 0

0 0 1 0 0 0 0 0 0 1 0 0 0

0 0

Difteri

0 0

0

0

0 0 0 0 0 0 0 0 0 0

0 1 0 0 0 0 0 0 0 0 0 0 0

0 0

Disentri

0 1

1

0

1 0 0 0 1 0 0 1 1 0

1 1 0 0 1 0 1 0 0 1 1 1 1

0 0

Flu

0 0

0

0

1 0 0 1 0 0 0 1 0 0

0 0 0 0 0 0 0 0 0 0 0 1 0

0 0

Gangg.

Haid

1 0

0

1

0 1 1 1 0 0 0 1 1 1

0 1 0 0 1 0 0 0 0 0 0 1 0

1 1

Gangg.Pencernaan

0 0

0

0

1 0 0 0 1 0 0 0 0 0

0 1 1 1 1 0 0 0 0 0 0 1 0

0 1

Gangg.Penglihatan

0 0

1

1

1 0 0 0 1 0 0 0 0 0

0 0 1 1 0 1 0 0 0 0 0 0 0

0 0

Gangg.

Sal.Kencing

1 0

1

0

1 0 0 0 1 1 1 0 0 0

0 0 1 0 0 1 0 1 0 0 0 1 1

0 0

Gastritis

0 0

0

0

1 0 0 0 1 0 0 0 0 0

0 0 0 0 0 1 0 0 0 0 0 0 0

0 0

(20)

NAMA TANAMAN

KHASIAT Ada

s Bu ah Ma k as ar Ca k ar Aya m Da un De wa Da un S endo k Da un Ung u

Iler Ja

h e Jom b ang K eji B el in g Ku mi s K u ci ng K u n y it Le ng kua s Li da h Bu ay a M ahk ot a De wa M eng ku du M eni ra n Mi mb a Par e P ega g an Picis an Ru m p ut Mu tia ra Sa g a Sam bi lot o S am bun g N y aw a Sid ag u ri Te m p u y un g Te m u la wa k Te m upu tih

Gondongan 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 Gonorhoe 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Hamil Anggur 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 Hepatitis 1 0 1 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 1 1 1 1 1 1 0 1 0 1 0 Hepatoma 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 Herpes 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Hernia 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Hiperkolesterolemia 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 Hipertensi 1 0 0 1 1 0 0 0 1 0 1 1 0 0 0 1 1 0 0 1 0 0 0 1 1 1 1 0 0 Impotensi 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 Infeksi 0 0 0 1 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 1 1 0 0 1 0 0 0 0 0 Insomnia 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Jerawat/Flek 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 Kanker 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 0 1 Kegemukan 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0 Kejang 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Kelenjar Getah Bening 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 Keputihan 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 Keracunan 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 Kesemutan 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Ketombe 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Kista 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 Kolik 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Konstipasi 0 0 0 0 0 1 1 0 0 1 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 Kurang Nafsu Makan 1 0 0 0 0 0 0 1 1 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 1 0 Kusta 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 Leukimia 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Luka Bakar 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 1 0 0 Malaria 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 Masuk Angin 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Memar/Luka 1 1 1 1 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 1 1 1 1 0 0 1 1 0 1 Melancarkan Asi 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 Mimisan 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Pertumbuhan Rambut 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0

(21)

NAMA TANAMAN

KHASIAT Ad

as Buah Ma k as ar Ca k ar A y am Dau n D ewa Daun Se n d o k D aun Un gu Il

er Jah

e Jo m b an g K eji Be lin g Ku mi s Ku ci n g K u n y it Leng ku as Li da h B u ay a M ahk ot a De w a M eng ku du Me n ir an Mi mba Pare Pegagan Picis an Ru m p u t Mut ia ra Sag a S am b ilo to S am b un g Ny aw a Si d agu ri Tem p uy un g Te m u la wa k T em u p u tih

Mual/ Muntah 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Nyeri Otot 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 Oedema 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 Patah Tulang 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 Pegal Linu 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 Pembengkakan Payudara 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 1 Penyakit Kulit 0 1 1 1 1 1 1 0 1 0 0 0 1 1 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 Penyakit Mata 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Perdarahan 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 Perut Kembung 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Pikun 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 Proteinuria 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Radang 0 0 0 1 0 0 1 0 1 0 0 1 1 0 0 1 0 0 1 1 0 1 1 0 1 0 0 0 0 Radang Prostat 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Rambut Rontok 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 Reumatik 1 0 1 1 0 0 0 0 0 0 1 1 0 0 0 1 0 0 1 0 0 0 0 0 0 1 1 0 1 Sakit Gigi/Gusi 1 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 Sakit Kepala 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Sakit Limpa 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 Sakit Perut 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 1 Sakit Pinggang 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 Sakit Telinga 1 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 Sariawan 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 0 1 1 1 0 1 0 0 0 0 0 0 Selulit 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 Sirosis 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 TBC 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 Terkilir 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 Tumor 0 0 1 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1 1 0 0 0 0 Usus Buntu 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 Wasir 0 0 0 1 0 1 0 1 0 0 0 0 0 1 0 0 0 1 1 1 0 0 0 0 0 1 1 1 0

(22)

Lampiran 2. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Fourfoul Point

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ ILER 7

PARE 19

LIDAH BUAYA 14

MIMBA 18

MENGKUDU 16

TEMULAWAK 28

KUMIS KUCING 11

MENIRAN 17

DAUN SENDOK 5 JOMBANG 9 KEJI BELING 10

RUMPUT MUTIARA 22

SAGA 23

PEGAGAN 20

BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21 DAUN DEWA 4

DAUN UNGU 6

TEMUPUTIH 29

ADAS 1

JAHE 8

LENGKUAS 13

SIDAGURI 26

TEMPUYUNG 27

KUNYIT 12

SAMBILOTO 24

SAMBUNG NYAWA 25 MAHKOTA DEWA 15

Lampiran 3. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Dice

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

JOMBANG 9

MENIRAN 17

PEGAGAN 20

MENGKUDU 16

PARE 19

LENGKUAS 13

DAUN DEWA 4

SAMBILOTO 24

MIMBA 18

RUMPUT MUTIARA 22

SAGA 23

BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21

TEMUPUTIH 29

DAUN UNGU 6

ILER 7

LIDAH BUAYA 14

KEJI BELING 10

SIDAGURI 26

TEMPUYUNG 27

KUNYIT 12

KUMIS KUCING 11

SAMBUNG NYAWA 25

ADAS 1

JAHE 8

TEMULAWAK 28

MAHKOTA DEWA 15

Lampiran 4. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Jaccard

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

JOMBANG 9

MENIRAN 17

PEGAGAN 20

MENGKUDU 16

PARE 19

LENGKUAS 13

(23)

DAUN DEWA 4

SAMBILOTO 24

MIMBA 18

RUMPUT MUTIARA 22

SAGA 23

BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21

TEMUPUTIH 29

DAUN UNGU 6

ILER 7

LIDAH BUAYA 14

KEJI BELING 10

SIDAGURI 26

TEMPUYUNG 27

KUNYIT 12

KUMIS KUCING 11

SAMBUNG NYAWA 25

ADAS 1

JAHE 8

TEMULAWAK 28

MAHKOTA DEWA 15

Lampiran 5. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Ochiai

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

JOMBANG 9

MENIRAN 17 PEGAGAN 20

SAMBILOTO 24 SIDAGURI 26

TEMPUYUNG 27

KUNYIT 12

KUMIS KUCING 11

SAMBUNG NYAWA 25

ADAS 1

JAHE 8

TEMULAWAK 28

DAUN DEWA 4

DAUN UNGU 6 LIDAH BUAYA 14

ILER 7

PARE 19

MENGKUDU 16

LENGKUAS 13

MIMBA 18

MAHKOTA DEWA 15 KEJI BELING 10

RUMPUT MUTIARA 22

SAGA 23 BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21 TEMUPUTIH 29

Lampiran 6. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Sokal & Sneath 2

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

JOMBANG 9

MENIRAN 17

PEGAGAN 20

MENGKUDU 16

PARE 19

LENGKUAS 13

DAUN DEWA 4

SAMBILOTO 24

MIMBA 18

RUMPUT MUTIARA 22

SAGA 23

BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21

TEMUPUTIH 29

DAUN UNGU 6

ILER 7

LIDAH BUAYA 14

KEJI BELING 10

SIDAGURI 26

TEMPUYUNG 27

KUNYIT 12

(24)

KUMIS KUCING 11

SAMBUNG NYAWA 25

ADAS 1

JAHE 8

TEMULAWAK 28

MAHKOTA DEWA 15

Lampiran 7. Dendogram dari kombinasi metode perbaikan jarak Complete Linkage dengan ukuran jarak Sokal & Sneath 5

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

MENIRAN 17

JOMBANG 9 SAMBILOTO 24

PEGAGAN 20 SIDAGURI 26

TEMPUYUNG 27

KUNYIT 12

KUMIS KUCING 11

SAMBUNG NYAWA 25 ADAS 1

JAHE 8

LENGKUAS 13 ILER 7

PARE 19 MENGKUDU 16

LIDAH BUAYA 14

TEMULAWAK 28

MIMBA 18

MAHKOTA DEWA 15 KEJI BELING 10

DAUN DEWA 4

DAUN UNGU 6

TEMUPUTIH 29

RUMPUT MUTIARA 22

SAGA 23 BUAH MAKASAR 2 CAKAR AYAM 3

PICISAN 21

Lampiran 8. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Complete Linkage

Gerombol

Complete Linkage

Fourfoul Point Dice=Jaccard =

Sokal & Sneath 2 Ochiai Sokal & Sneath 5

1 jombang jombang jombang jombang

meniran meniran meniran meniran

kumis kucing sambiloto sambiloto sambiloto daun sendok daun sendok daun sendok daun sendok

keji beling pegagan pegagan pegagan

mengkudu sidaguri sidaguri

pare tempuyung tempuyung

lengkuas kunyit kunyit

daun dewa kumis kucing kumis kucing

mimba sambung nyawa sambung nyawa

rumput mutiara

saga

2 buah makasar buah makasar buah makasar buah makasar daun ungu picisan rumput mutiara daun ungu cakar ayam cakar ayam cakar ayam cakar ayam

picisan temuputih picisan picisan

daun dewa saga daun dewa

temuputih temuputih temuputih

rumput mutiara

saga

3 iler iler keji beling keji beling

lidah buaya lidah buaya

mimba keji beling

mengkudu daun ungu

pare

(25)

temulawak

4 sidaguri sidaguri - -

tempuyung tempuyung

kunyit kunyit

sambiloto kumis kucing

sambung nyawa sambung nyawa

mahkota dewa

5 adas adas adas adas

jahe jahe jahe jahe

lengkuas temulawak temulawak lengkuas

daun dewa iler

daun ungu mengkudu

lidah buaya pare

iler lidah buaya

pare temulawak

mengkudu mimba

lengkuas

mimba

6 rumput mutiara mahkota dewa mahkota dewa mahkota dewa saga

pegagan

Lampiran 9. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Dice

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

JOMBANG 9

MENIRAN 17

PEGAGAN 20

SAMBILOTO 24

DAUN DEWA 4

SAMBUNG NYAWA 25

MIMBA 18

KEJI BELING 10

RUMPUT MUTIARA 22

SAGA 23

BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21

MAHKOTA DEWA 15

DAUN UNGU 6

ILER 7

LIDAH BUAYA 14

TEMULAWAK 28

MENGKUDU 16

PARE 19

ADAS 1

LENGKUAS 13

JAHE 8

SIDAGURI 26

TEMPUYUNG 27

KUNYIT 12

KUMIS KUCING 11

TEMUPUTIH 29

Lampiran 10. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Ochiai

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

(26)

JOMBANG 9

MENIRAN 17

PEGAGAN 20

SAMBILOTO 24

KUMIS KUCING 11

KEJI BELING 10

MAHKOTA DEWA 15

RUMPUT MUTIARA 22

SAGA 23

BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21

DAUN DEWA 4

DAUN UNGU 6

LIDAH BUAYA 14

ILER 7 PARE 19

MENGKUDU 16

LENGKUAS 13

SAMBUNG NYAWA 25

MIMBA 18

TEMULAWAK 28

SIDAGURI 26 TEMPUYUNG 27

KUNYIT 12

ADAS 1

TEMUPUTIH 29

JAHE 8

Lampiran 11. Dendogram dari kombinasi metode perbaikan jarak Average Linkage within the New Group dengan ukuran jarak Sokal & Sneath 5

Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

MENIRAN 17

JOMBANG 9

SAMBILOTO 24

KUMIS KUCING 11

SAMBUNG NYAWA 25

KEJI BELING 10

MAHKOTA DEWA 15

BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21

RUMPUT MUTIARA 22 SAGA 23 PEGAGAN 20 SIDAGURI 26 TEMPUYUNG 27

KUNYIT 12

ADAS 1

JAHE 8

DAUN DEWA 4

DAUN UNGU 6

TEMUPUTIH 29

ILER 7 PARE 19 LIDAH BUAYA 14

MENGKUDU 16

LENGKUAS 13

MIMBA 18

TEMULAWAK 28

Lampiran 12. Dendogram dari kombinasi metode perbaikan jarak Centroid dengan ukuran jarak Ochiai

Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---+---+---+---+---+ DAUN SENDOK 5

JOMBANG 9

PEGAGAN 20

SAMBILOTO 24

KUMIS KUCING 11

MENIRAN 17

KEJI BELING 10

SIDAGURI 26

TEMPUYUNG 27

ADAS 1

MENGKUDU 16

KUNYIT 12

SAMBUNG NYAWA 25

JAHE 8

LENGKUAS 13

LIDAH BUAYA 14

(27)

TEMULAWAK 28

ILER 7

PARE 19

MIMBA 18

RUMPUT MUTIARA 22

SAGA 23

DAUN DEWA 4

DAUN UNGU 6

TEMUPUTIH 29

BUAH MAKASAR 2

CAKAR AYAM 3

PICISAN 21

MAHKOTA DEWA 15

Lampiran 13. Hasil klasifikasi analisis gerombol dengan metode perbaikan jarak Average Linkage within the New Group dan metode Centroid

Gerombol Average Linkage Within the New Group Centroid

Sokal &Sneath 5 Ochiai Dice Ochiai

1 daun sendok daun sendok daun sendok daun sendok

meniran meniran meniran meniran

sambiloto sambiloto sambiloto sambiloto

jombang jombang jombang jombang

sambung nyawa pegagan pegagan pegagan

kumis kucing kumis kucing sambung nyawa kumis kucing keji beling keji beling keji beling keji beling

mimba

daun dewa

2 rumput mutiara rumput mutiara rumput mutiara rumput mutiara

saga saga saga saga

buah makasar buah makasar buah makasar cakar ayam cakar ayam cakar ayam

picisan picisan picisan

pegagan

3 mahkota dewa mahkota dewa mahkota dewa mahkota dewa

buah makasar

cakar ayam

picisan

4 daun ungu daun ungu daun ungu daun ungu

daun dewa daun dewa iler daun dewa

temuputih lidah buaya lidah buaya temuputih

mimba adas

temulawak temulawak

mengkudu mengkudu

pare pare

lengkuas lengkuas

iler jahe

sambung nyawa

5 sidaguri sidaguri sidaguri sidaguri

tempuyung tempuyung tempuyung tempuyung

kunyit kunyit kunyit kunyit

adas adas kumis kucing adas

jahe temuputih temuputih mengkudu

sambung nyawa

6 iler jahe - jahe

pare lengkuas

lidah buaya lidah buaya

mengkudu temulawak

lengkuas iler

mimba pare

temulawak mimba

(28)

Lampiran 14. Tabel aturan asosiasi (association rule)

SET_SIZE EXP_CONF CONF SUPPORT LIFT COUNT RULE

2 24,21 85,71 6,32 3,54 6 daun ungu ==> daun dewa 2 29,47 83,33 5,26 2,83 5 kumis kucing ==> jombang 2 18,95 83,33 5,26 4,4 5 kumis kucing ==> meniran 2 32,63 81,82 9,47 2,51 9 saga ==> pegagan 2 31,58 80 8,42 2,53 8 iler ==> mengkudu 2 25,26 80 8,42 3,17 8 iler ==> pare

2 29,47 80 4,21 2,71 4 keji beling ==> jombang 2 24,21 80 4,21 3,3 4 keji beling ==> daun sendok 2 22,11 71,43 5,26 3,23 5 buah makasar ==> lengkuas 2 15,79 71,43 5,26 4,52 5 buah makasar ==> cakar ayam 2 32,63 71,43 5,26 2,19 5 daun ungu ==> pegagan 2 24,21 70 7,37 2,89 7 iler ==> daun sendok

2 31,58 70 7,37 2,22 7 sambung nyawa ==> mengkudu 2 31,58 66,67 4,21 2,11 4 kumis kucing ==> mengkudu 2 26,32 66,67 4,21 2,53 4 kumis kucing ==> adas 2 24,21 66,67 4,21 2,75 4 kumis kucing ==> daun dewa 2 24,21 66,67 4,21 2,75 4 kumis kucing ==> daun sendok 2 31,58 66,67 8,42 2,11 8 kunyit ==> mengkudu

2 29,47 66,67 12,6 2,26 12 meniran ==> jombang 2 17,89 63,64 7,37 3,56 7 tempuyung ==> sidaguri 2 24,21 61,11 11,6 2,52 11 meniran ==> daun sendok 2 29,47 60,87 14,7 2,07 14 daun sendok ==> jombang 2 24,21 60 6,32 2,48 6 iler ==> daun dewa 2 22,11 60 6,32 2,71 6 iler ==> lengkuas

2 29,47 60 6,32 2,04 6 sambung nyawa ==> jombang 2 24,21 60 6,32 2,48 6 sambung nyawa ==> daun dewa 2 24,21 60 6,32 2,48 6 sambung nyawa ==> daun sendok 2 32,63 58,82 10,5 1,8 10 sidaguri ==> pegagan

2 25,26 58,82 10,5 2,33 10 sidaguri ==> pare 2 24,21 58,82 10,5 2,43 10 sidaguri ==> daun sendok 2 26,32 58,33 7,37 2,22 7 kunyit ==> adas

2 17,89 58,33 7,37 3,26 7 kunyit ==> sidaguri 2 25,26 58,33 7,37 2,31 7 lidah buaya ==> pare 2 29,47 57,14 4,21 1,94 4 buah makasar ==> jombang 2 25,26 57,14 4,21 2,26 4 buah makasar ==> pare 2 18,95 57,14 4,21 3,02 4 buah makasar ==> meniran 2 16,84 57,14 4,21 3,39 4 buah makasar ==> picisan 2 31,58 57,14 4,21 1,81 4 daun ungu ==> mengkudu 2 25,26 57,14 4,21 2,26 4 daun ungu ==> pare 2 22,11 57,14 4,21 2,59 4 daun ungu ==> lengkuas 2 17,89 57,14 4,21 3,19 4 daun ungu ==> sidaguri 2 12,63 57,14 4,21 4,52 4 daun ungu ==> lidah buaya 2 10,53 57,14 4,21 5,43 4 daun ungu ==> iler 2 32,63 56,25 9,47 1,72 9 sambiloto ==> pegagan

(29)

2 29,47 56,25 9,47 1,91 9 sambiloto ==> jombang 2 32,63 55,56 10,5 1,7 10 meniran ==> pegagan 2 31,58 54,55 6,32 1,73 6 saga ==> mengkudu 2 22,11 54,55 6,32 2,47 6 saga ==> lengkuas 2 13,68 54,55 6,32 3,99 6 saga ==> rumput mutiara 2 32,63 54,55 6,32 1,67 6 tempuyung ==> pegagan 2 26,32 54,55 6,32 2,07 6 tempuyung ==> adas 2 24,21 54,55 6,32 2,25 6 tempuyung ==> daun dewa SET_SIZE EXP_CONF CONF SUPPORT LIFT COUNT RULE

2 24,21 54,55 6,32 2,25 6 temuputih ==> daun dewa 2 31,58 54,17 13,7 1,72 13 pare ==> mengkudu

2 26,32 53,85 7,37 2,05 7 jahe ==> adas

2 32,63 53,85 7,37 1,65 7 rumput mutiara ==> pegagan 2 31,58 53,85 7,37 1,71 7 temulawak ==> mengkudu 2 25,26 53,85 7,37 2,13 7 temulawak ==> pare 2 29,47 53,33 8,42 1,81 8 cakar ayam ==> jombang 2 24,21 53,33 8,42 2,2 8 cakar ayam ==> daun sendok 2 31,58 52,94 9,47 1,68 9 sidaguri ==> mengkudu 2 32,63 52,17 12,6 1,6 12 daun sendok ==> pegagan 2 32,63 50 5,26 1,53 5 iler ==> pegagan

2 22,11 50 5,26 2,26 5 iler ==> mimba 2 12,63 50 5,26 3,96 5 iler ==> lidah buaya 2 24,21 50 14,7 2,07 14 jombang ==> daun sendok 2 25,26 50 6,32 1,98 6 kunyit ==> pare

2 24,21 50 6,32 2,07 6 kunyit ==> daun sendok 2 31,58 50 6,32 1,58 6 lidah buaya ==> mengkudu 2 24,21 50 6,32 2,07 6 lidah buaya ==> daun dewa 2 32,63 50 8,42 1,53 8 picisan ==> pegagan 2 31,58 50 8,42 1,58 8 picisan ==> mengkudu 2 24,21 50 8,42 2,07 8 sambiloto ==> daun sendok 2 24,21 50 8,42 2,07 8 sambiloto ==> daun dewa 2 18,95 50 8,42 2,64 8 sambiloto ==> meniran 2 22,11 50 5,26 2,26 5 sambung nyawa ==> lengkuas 2 16,84 50 5,26 2,97 5 sambung nyawa ==> sambiloto

(30)
(31)

EKSPLORASI METODE KLASIFIKASI PADA DATA

BINER

DIAN RARASSANTI

G14103017

DEPARTEMEN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

(32)

PENDAHULUAN

Latar Belakang

Metode klasifikasi merupakan salah satu metode analisis yang diperlukan untuk mengelompokkan objek atau item berdasarkan kemiripan sifat yang dimilikinya. Pengklasifikasian dapat diterapkan pada banyak bidang ilmu pengetahuan, salah satunya pada bidang yang berkaitan dengan ilmu alam. Jenis data dalam bidang ilmu alam yang dianalisis terkadang tidak hanya berupa data yang bersifat kuantitatif, tetapi juga banyak ditemukan data yang bersifat kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner yang hanya memiliki dua kemungkinan nilai yaitu sukses dan gagal.

Metode klasifikasi dibidang ilmu alam sangat banyak, akan tetapi dasar pengklasifikasian suatu data hanya terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol merupakan salah satu analisis peubah ganda yang bertujuan mengelompokkan objek berpeubah banyak ke dalam kelompok-kelompok berdasarkan kemiripan yang dimiliki objek tersebut. Analisis asosiasi adalah teknik untuk menemukan aturan asosiasi antara suatu kombinasi item atau objek. Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, sehingga analisis asosiasi juga sering disebut dengan istilah basket analysis.

Berdasarkan hal tersebut, dapat diketahui bahwa kegunaan kedua metode di atas adalah untuk pengklasifikasian data, dan karena dalam proses klasifikasi data banyak ditemukan kasus data biner, maka penelitian ini mengetengahkan hasil eksplorasi metode klasifikasi pada data biner dengan menggunakan analisis gerombol dan analisis asosiasi. Data yang digunakan adalah data biner tanaman obat berdasarkan khasiat yang dikandungnya.

Tujuan

Tujuan penelitian ini adalah untuk:

1. Mengeksplorasi metode klasifikasi data biner dengan analisis asosiasi pada data tanaman obat.

2. Mengklasifikasikan tanaman obat berdasarkan khasiatnya dengan menggunakan analisis gerombol.

TINJAUAN PUSTAKA

Data biner

Data biner adalah data observasi dimana nilainya hanya memiliki dua kemungkinan. Sebagai contoh bahwa pada komponen peralatan elektronik mungkin bisa rusak atau tidak, atau pada tanaman obat berkhasiat atau tidak dalam mengatasi suatu gangguan kesehatan. Jika pada individu ke-i observasi tersebut dapat dinyatakan oleh sebuah variabel acak Yi, maka pada data biner Yi dapat dinyatakan dengan kode 1 untuk data yang ‘sukses’ dan kode 0 untuk data yang ‘gagal’ (Cox 1970).

Klasifikasi

Klasifikasi menurut Kamus Besar Bahasa Indonesia (KBBI) memiliki arti penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Sedangkan pengklasifikasian berarti proses, cara, atau perbuatan mengklasifikasikan. Dalam statistika, klasifikasi merupakan salah satu metode analisis yang dapat diartikan proses pengelompokan objek berdasarkan kemiripan masing-masing variabel yang dimilikinya (Ludwig & Reynold 1988).

Analisis Gerombol

Analisis gerombol adalah salah satu analisis peubah ganda yang prinsip utamanya adalah mengklasifikasikan individu yang relatif sama atau seragam ke dalam suatu gerombol yang didasarkan pada ukuran kedekatan (ukuran jarak atau ukuran kesamaan). Objek yang terletak dalam suatu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan objek yang terletak dalam gerombol lain (Johnson & Wichern 2002). Dan diharapkan keragaman unit-unit pengamatan dalam satu gerombol lebih homogen daripada keragaman antar gerombol.

Pada jenis data biner, ukuran jarak atau kesamaan dinyatakan dalam bentuk koefisien kesamaan (similarities coefficient) yang nilainya berkisar antara 0 sampai 1. Berbeda dengan konsep jarak untuk data pengukuran, untuk data biner nilai koefisien yang diperoleh bukan menunjukkan kuantitas jarak, tetapi menunjukkan kedekatan dua variabel atau objek. Nilai yang mendekati satu menunjukkan kedua objek tersebut sangat mirip, sedangkan nilai koefisien yang mendekati nol

(33)

PENDAHULUAN

Latar Belakang

Metode klasifikasi merupakan salah satu metode analisis yang diperlukan untuk mengelompokkan objek atau item berdasarkan kemiripan sifat yang dimilikinya. Pengklasifikasian dapat diterapkan pada banyak bidang ilmu pengetahuan, salah satunya pada bidang yang berkaitan dengan ilmu alam. Jenis data dalam bidang ilmu alam yang dianalisis terkadang tidak hanya berupa data yang bersifat kuantitatif, tetapi juga banyak ditemukan data yang bersifat kualitatif. Salah satu jenis data kualitatif yang sering dijumpai di lapangan dan perlu untuk dianalisis adalah data biner yang hanya memiliki dua kemungkinan nilai yaitu sukses dan gagal.

Metode klasifikasi dibidang ilmu alam sangat banyak, akan tetapi dasar pengklasifikasian suatu data hanya terbagi menjadi dua, yaitu analisis gerombol dan analisis asosiasi (Ludwig & Reynold 1988). Analisis gerombol merupakan salah satu analisis peubah ganda yang bertujuan mengelompokkan objek berpeubah banyak ke dalam kelompok-kelompok berdasarkan kemiripan yang dimiliki objek tersebut. Analisis asosiasi adalah teknik untuk menemukan aturan asosiasi antara suatu kombinasi item atau objek. Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan, sehingga analisis asosiasi juga sering disebut dengan istilah basket analysis.

Berdasarkan hal tersebut, dapat diketahui bahwa kegunaan kedua metode di atas adalah untuk pengklasifikasian data, dan karena dalam proses klasifikasi data banyak ditemukan kasus data biner, maka penelitian ini mengetengahkan hasil eksplorasi metode klasifikasi pada data biner dengan menggunakan analisis gerombol dan analisis asosiasi. Data yang digunakan adalah data biner tanaman obat berdasarkan khasiat yang dikandungnya.

Tujuan

Tujuan penelitian ini adalah untuk:

1. Mengeksplorasi metode klasifikasi data biner dengan analisis asosiasi pada data tanaman obat.

2. Mengklasifikasikan tanaman obat berdasarkan khasiatnya dengan menggunakan analisis gerombol.

TINJAUAN PUSTAKA

Data biner

Data biner adalah data observasi dimana nilainya hanya memiliki dua kemungkinan. Sebagai contoh bahwa pada komponen peralatan elektronik mungkin bisa rusak atau tidak, atau pada tanaman obat berkhasiat atau tidak dalam mengatasi suatu gangguan kesehatan. Jika pada individu ke-i observasi tersebut dapat dinyatakan oleh sebuah variabel acak Yi, maka pada data biner Yi dapat dinyatakan dengan kode 1 untuk data yang ‘sukses’ dan kode 0 untuk data yang ‘gagal’ (Cox 1970).

Klasifikasi

Klasifikasi menurut Kamus Besar Bahasa Indonesia (KBBI) memiliki arti penyusunan bersistem dalam kelompok atau golongan menurut kaidah atau standar yang ditetapkan. Sedangkan pengklasifikasian berarti proses, cara, atau perbuatan mengklasifikasikan. Dalam statistika, klasifikasi merupakan salah satu metode analisis yang dapat diartikan proses pengelompokan objek berdasarkan kemiripan masing-masing variabel yang dimilikinya (Ludwig & Reynold 1988).

Gambar

Tabel 1. Tabel Kontingensi Data Biner
Gambar 1. Grafik Asosiasi (Association Graph)
Tabel 1. Tabel Kontingensi Data Biner
Gambar 1. Grafik Asosiasi (Association Graph)

Referensi

Dokumen terkait

#alah satu upaya meningkatkan kualitas sumber daya manusia pada kelompok anak sekolah adalah dengan menyediakan makanan  jajanan yang bergi"i guna memenuhi kebutuhan

,3$ EHUEDVLV ³VLQDX´ dengan materi konsep dasar air pada anak-anak komunitas Sedulur Sikep dapat diterapkan setelah mendapat penilaian layak dari ahli materi,

331 Sofitel Bali Nusa Dua Beach Resort Kawasan Pariwisata BTDC, Lot N5 Nusa Dua Badung 332 KAP. Lasmono Dipokusumo dan Rekan

Berdasarkan tabel diatas dapat dilihat rata-rata pengetahuan ibu hamil tentang kehamilan resiko tinggi pada kelompok kontrol pretest adalah 58,50 sedangkan rata-rata

Prinsip penarikan garis batas yang digunakan dalam penentuan batas pengelolaan laut dan bagi hasil kelautan antara Kota Surabaya dengan Kabupaten Bangkalan dan Kabupaten

(Alm.) atas bimbingan dan segala bantuannya membuka wawasan yang tak ternilai luasnya bagi penulis. Demikian juga ucapan terima kasih kepada Prof.. dan kesempatan yang

Penelitian ini bertujuan untuk mengetahui gambaran kualitas pelayanan kefarmasian dan faktor-faktor yang berpengaruh terhadap pelayanan kefarmasian oleh Apoteker Pengelola

Tidak terdapatnya perbedaan penurunan jumlah koloni Salmonella sp da bakteri Coliform pada limbah cair RPH dengan variasi dosis kalsium hipoklorit karena