Penerapan Hybrid Hierarchical Clustering Via Mutual Cluster
dalam Pengelompokan Kabupaten di Jawa Timur Berdasarkan
Variabel Sektor Pertanian
Dosen Pembimbing :
Santi Wulan Purnami, M.Si. ,Ph.D Dra.Wiwiek Setya Winahju, M.S
Oleh :
Dini Mariyani (1308100002) SEMINAR TUGAS AKHIR 2011
SEMINAR TUGAS AKHIR 2011
Pokok Bahasan
PENDAHULUAN
1METODOLOGI
3TINJAUAN PUSTAKA
2ANALISIS DAN PEMBAHASAN
4KESIMPULAN
5Latar Belakang
Persaingan Pasar Internasional Keunggulan Komoditas di Wilayah Kabupaten Analisis pengelompokan Ekspor Sektor Pertanian Jawa TimurPENDAHULUAN
Produktifitas Sub Sektor PertanianChipman dan Tibshirani (2006) : hybrid hierarchical clustering via mutual cluster
Nugroho (2010) :
hierarchical custering
Permasalahan
Bagaimana karakteristik kondisi sektor
pertanian di tiap kabupaten di Jawa Timur ?
Bagaimana pengelompokan
kabupaten-kabupaten di Jawa Timur berdasarkan variabel
sektor pertanian ?
Tujuan
Mendapatkan karakteristik hasil produksi
komoditi sektor pertanian tiap kabupaten di
Jawa Timur.
Mengelompokkan kabupaten-kabupaten di
Jawa Timur berdasarkan kesamaan variabel
sektor pertanian.
Batasan Masalah
Penelitian ini hanya mencakup variabel sub sektor
tanaman bahan pangan, perkebunan, perikanan,
dan perternakan.
Manfaat
Tambahan informasi bagi Pemerintah di
masing-masing kabupaten di Jawa Timur
mengenai kondisi dan potensi komoditi dalam
sektor pertanian.
Pengelompokan Hirarki (Hierarchical Clutering)
 Pengelompokan hirarki  metode pengelompokan yang didesain berdasarkan jarak antar objek dimana jumlah kelompok tidak diketahui sebelumnya.
 Pengelompokan hirarki terdiri dari dua prosedur, yaitu agglomerative dan divisive.
 Metode aglomeratif berawal dari objek individual sampai semua subgroup tergabung dalam suatu kelompok tunggal. Objek-objek yang paling banyak memiliki kesamaan adalah yang pertama dikelompokkan, dan ini sebagai grup awal.
 Tahapan pengelompokan dengan metode agglomerative :
1. Menghitung jarak antar obyek
2. Menentukan pasangan kelompok yang memiliki jarak terdekat
3. Menghitung kembali jarak berdasarkan metode penggabungan yang dipakai baik pada
obyek yang sudah dan belum membentuk kelompok
4. Menentukan kembali pasangan kelompok yang memiliki jarak terdekat 5. Mengulangi tahapan (2) - (4) sampai n-1 obyek
(Johnson dan Wichern, 2002)
Beberapa teknik pengelompokkan dalam
agglomerative (bottom-up):
Single Linkage : Metode ini menggunakan aturan jarak minimum antar kelompok .
Complete Linkage : Metode ini menggunakan aturan jarak maksimum antar
kelompok.
Average Linkage : d
(ij)k=
Centroid Linkage :
Metode
Ward : Metode ini meminimumkan peningkatan kriteria error sum of square
(ESS) .
(Johnson dan Wichern ,2002)
TINJAUAN PUSTAKA
k ijN N 1 n i m j ij d ij j i j i kj j i j ki j i i j i kn
n
d
n
n
d
n
n
n
d
n
n
n
d
( , ) 2)
(
.
Pengelompokan Non Hirarki (Non Hierarchical Clutering)
Pengelompokan non hirarki  metode pengelompokan yang betujuan
mengelompokkan
n obyek ke dalam k kelompok (k<n).
Metode
k-means  salah satu prosedur pengelompokan non hirarki yang
mengelompokkan obyek berdasarkan jarak terdekat ke pusat kelompok
(means).
Metode
k-means disebut juga tree structured vector quantization (tsvq)
Tahapan pengelompokan dengan metode
k-means :
1.
Mempartisi obyek sebanyak
k cluster
2.Menghitung pusat cluster
3.
Menghitung jarak masing-masing obyek dari pusat cluster
4.Menentukan obyek yang lebih dekat dengan pusat cluster
5.
Jika obyek berpindah dari posisi awal (tahapan 1) maka pusat cluster harus
ditentukan kembali
6.
Mengulangi tahapan (2) - (4) sampai tidak ada lagi obyek yang berpindah
posisi
(Johnson dan Wichern, 2002)
Hybrid Hierarchical Clustering via Mutual Cluster
Hybrid hierarchical clustering via mutual cluster  metode hybrid
clustering yang mengkombinasikan kelebihan dari bottom-up
(agglomerative) dan top-down (tsvq).
Mutual cluster  sekelompok obyek dimana jarak terbesar antar
obyek dalam kelompok lebih kecil daripada jarak ke obyek terdekat
di luar kelompok.
Tahapan hybrid hierarchical clustering via mutual cluster :
1.
Melakukan pengelompokan secara bottom-up
2.
Mengidentifikasi mutual cluster
3.
Melakukan pengelompokan secara top-down dengan mutual cluster
yang telah terbentuk tetap dipertahankan
(Chipman dan Tibshirani, 2006)
Pemilihan Jumlah Kelompok
Pengelompokan dapat dikatakan baik jika memiliki
external
homogeneity (S
b)yang besar dan
internal homogeneity yang kecil
(S
w).
dengan :
S
k= deviasi standar pada kelompok ke-
k
= rata-rata pada kelompok ke-
k
= rata-rata keseluruhan kelompok
K = banyak kelompok
TINJAUAN PUSTAKA
Sektor Pertanian
Pertanian atau usahatani  proses produksi di mana input alamiah
berupa lahan dan unsur hara yang terkandung di dalamnya,sinar
matahari serta faktor klimatologis (suhu,kelembaban udara,curah
hujan,topografi, dsb) berinteraksi melalui proses tumbuh kembang
tanaman dan ternak untuk menghasilkan output primer yaitu bahan
pangan dan serat alam (Akhdaryani, 2003).
Sektor pertanian mencakup sub sektor tanaman bahan makanan
(tanaman pangan dan hortikultura), tanaman perkebunan, peternakan,
kehutanan, dan perikanan.
Sumber Data
METODOLOGI
Data Sekunder Produksi Sektor Pertanian 2009 Kabupaten di Jawa Timur
Variabel Penelitian
METODOLOGI
Sub Sektor Tanaman Bahan Pangan Sub Sektor Perkebunan Sub Sektor Perternakan Sub Sektor Perikanan luas area panen padi (X1),
produksi padi (X2), luas area panen jagung (X3), produksi jagung (X4), luas area panen ubi kayu (X5), produksi ubi kayu (X6), luas area panen kedelai (X7), produksi kedelai (X8), luas area panen kacang hijau (X9), produksi kacang hijau (X10)
luas area panen jambu mente (X11), produksi jambu mente (X12), luas area panen kelapa (X13), produksi kelapa (X14), luas area panen kapuk randu (X15), produksi kapuk randu (X16)
populasi sapi (X17), populasi kambing (X18), populasi domba (X19), populasi ayam buras (X20), populasi ayam petelur
(X21), populasi ayam pedaging (X22), populasi itik (X23), produksi daging sapi (X24), produksi daging kambing (X25), produksi daging domba (X26), produksi daging ayam buras (X27), produksi daging ayam pedaging (X28), produksi daging itik (X29), produksi telur ayam buras (X30), dan produksi telur itik (X31)
Luas area
pemeliharaan ikan (X32), populasi ikan (X33)
Langkah Analisis
METODOLOGI
Menganalisis karakteristik kondisi sektor pertanian di Jawa Timur pada tahun 2009 dengan Statistika Deskriptif
Melakukan pengelompokan kabupaten secara hybrid hierarchical clustering via mutual cluster, top-down
clustering, bottom-up clustering Mendapatkan jumlah hasil pengelompokan
yang terbaik
Mendeskripsikan secara statistik untuk setiap kelompok kabupaten Menganalisis hasil pembentukan kelompok
ANALISIS DAN PEMBAHASAN
Variabel Minimum Kabupaten Maksimum Kabupaten Rata-rata
Deviasi Standar
Luas area panen padi (Ha) 22359 Pamekasan 152370 Jember 65106.52 34481.38
Produksi padi (Ton) 110666 Pamekasan 847251 Jember 384752.7 210103.2
Luas area panen jagung (Ha) 128 Sidoarjo 129420 Sumenep 44382.66 28814.69
Produksi jagung (Ton) 418 Sidoarjo 502824 Tuban 180417.1 111292.9
Luas area panen ubi kayu (Ha) 2 Sidoarjo 25923 Ponorogo 7141 6653.859
Produksi ubi kayu (Ton) 25 Sidoarjo 445861 Ponorogo 110915.5 105610.9
Luas area panen kedelai (Ha) 223 Situbondo 49056 Banyuwangi 9119.966 10311.15
Produksi kedelai (Ton) 329 Situbondo 76434 Banyuwangi 12238.83 15684.42
Luas area panen kacang hijau (Ha) 20 Kediri 18745 Sumenep 2465.966 4001.127
Produksi kacang hijau (Ton) 21 Kediri 21253 Sumenep 2881.621 4647.646
 Deskripsi beberapa sub sektor tanaman bahan makanan di kabupaten-kabupaten Jawa Timur
 Deskripsi beberapa sub sektor perkebunan di kabupaten-kabupaten Jawa Timur pada 2009
ANALISIS DAN PEMBAHASAN
Variabel Minimum Kabupaten Maksimum Kabupaten Rata-rata
Deviasi Standar
Luas area panen jambu mente (Ha) 7 Sidoarjo 10859 Sumenep 1662.897 2779.666
Produksi jambu mente (Ton) 4 Sidoarjo 3744 Sampang 514.1379 932.4675
Luas area panen kelapa (Ha) 873 Mojokerto 51250 Sumenep 9920.241 10453.53
Produksi kelapa (Ton) 402 Mojokerto 41957 Sumenep 8521.724 9418.509
Luas area panen kapuk randu (Ha) 193 Gresik 14924 Pasuruan 2592.207 3087.552
Produksi kapuk randu (Ton) 47 Trenggalek 8224 Pasuruan 993.2414 1639.346
 Deskripsi beberapa sub sektor peternakan di kabupaten-kabupaten Jawa Timur pada 2009
Variabel Minimum Kabupaten Maksimum Kabupaten
Rata-Rata
Deviasi Standar
luas area pemeliharaan ikan (Ha) 14.77 Trenggalek 29902.47 Gresik
2951.4
14 7041.063 populasi ikan 153.9 Magetan 375264.7 Sumenep
25326.
ANALISIS DAN PEMBAHASAN
 Deskripsi beberapa sub sektor peternakan di kabupaten-kabupaten Jawa Timur pada 2009
Variabel Minimum Kabupaten Maksimum Kabupaten
Rata-rata
Deviasi Standar
Populasi sapi potong 11338 Sidoarjo 296978 Sumenep 120447 65358.59
Populasi kambing 22926 Bondowoso 222019 Trenggalek 94583.45 47801.93
Populasi domba 2510 Bangkalan 62415 Bojonegoro 25027.52 14886.21
Populasi ayam buras 250490 Bondowoso 2198824 Blitar 800355.1 465839.1
Populasi ayam petelur 1920 Sampang 9426098 Blitar 728615.1 1793951
Populasi ayam pedaging 25951 Sampang 16551003 Lumajang 2107048 3417600
Populasi itik 10381 Sampang 687788 Blitar 123737.3 151183.1
Produksi daging sapi (Ton) 485312 Magetan 19314742 Sidoarjo 2587954 3551809
Produksi daging kambing (Ton) 69584 Sampang 1293840 Sidoarjo 385146.3 232720.3
Produksi daging domba (Ton) 19498 Bangkalan 307940 Sidoarjo 125897 71494.9
Produksi daging ayam buras (Ton) 427206 Ngawi 3573676 Malang 1248143 876499.3
Produksi daging ayam pedaging (Ton) 22802 Nganjuk 19548202 Sidoarjo 2838408 4103536
Produksi daging itik (Ton) 3618 Madiun 363428 Tulungagung 53076.86 73779.34
Produksi telur ayam buras (Ton) 173429 Bondowoso 1522377 Blitar 554133.8 322528.2
ANALISIS DAN PEMBAHASAN
Ada 6 mutual Cluster kabupaten-kabupaten Jawa Timur yang
terbentuk dengan algoritma bottom-up
 Pacitan (1), Trenggalek (3)  Tulungagung (4), Blitar (5)  Kediri (6 ), Jombang (17)  Situbondo (12), Probolinggo (13)  Jember (9), Bojonegoro (22)  Magetan (20), Pamekasan (28)
ANALISIS DAN PEMBAHASAN
 Pengelompokan hasil mutual cluster tidak terpecah dengan algoritma top-down
 Mutual cluster (1,3), (4,5), (6,17), (20,28), (9,22), dan
ANALISIS DAN PEMBAHASAN
 Pemilihan jumlah kelompok terbaik akan dianalisis dengan tingkat similaritas yang diukur dengan varians dalam kelompok (Sw) dan varians antar kelompok (Sb) Jumlah kelompok terbaik diperoleh dengan melihat nilai Sw seminimal mungkin dan nilai Sb semaksimal mungkin.
Kelompok Sw Sb 2 13713118 9917249 3 12358532 9910264 4 12387309 11312143 5 10854491 10510966 6 9573569 10535348 7 10213098 11065289 8 8948243 12854404
ANALISIS DAN PEMBAHASAN
Pengelompokan kabupaten-kabupaten di Jawa Timur secara top-downKelompok Sw Sb 2 14774335 7874219 3 13473686 8790184 4 11200071 9028125 5 11364842 9931699 6 10208644 9585022 7 8803443 9903467 8 7066164 13789331
ANALISIS DAN PEMBAHASAN
Pengelompokan kabupaten-kabupaten di Jawa Timur secara bottom-upKelompok SW Sb 2 8517728 8617657 3 4557577 29664404 4 6090905 29429796 5 4902919 25854909 6 4099989 23663153 7 3310109 23582238 8 3468525 22031748
ANALISIS DAN PEMBAHASAN
 Sw dan Sbdengan jumlah kelompok sebanyak 8 yang merupakan jumlah kelompok optimal dari hasil hybrid hierarchical clustering
via mutual cluster, bottom-up clustering, dan top-down clustering
Metode Sw Sb
Hybrid hierarchical clustering via mutual cluster 8948243 12854404
Bottom-up clustering 3310109 23582238
ANALISIS DAN PEMBAHASAN
(a) (b)
(c)
Kelompok Kabupaten-kabupaten di Jawa Timur dengan Hybrid Hierarchical Clustering via Mutual
Cluster (a), Bottom-up Clustering (b), dan Top-down Clustering (c)
Kelompok 1 Kelompok 2 Kelompok 3 Kelompok 4 Pacitan Ponorogo Tulungagung Malang Trenggalek Kediri Blitar Pasuruan
Jombang Sidoarjo Tuban Mojokerto
Lamongan Kelompok 5 Kelompok 6 Kelompok 7 Kelompok 8 Lumajang Jember Banyuwangi Magetan Nganjuk Bojonegoro Bondowoso Pamekasan Madiun Sumenep Situbondo
Bangkalan Probolinggo Ngawi Gresik Sampang
Kelompok 1 Kelompok 2 Kelompok 3 Kelompok 4 Pacitan Ponorogo Trenggalek Tulungagung Bojonegoro Malang Kediri Jember
Pasuruan Gresik Banyuwangi Sidoarjo Pamekasan Mojokerto
Jombang Tuban Lamongan
Kelompok 5 Kelompok 6 Kelompok 7 Kelompok 8 Blitar Lumajang Bondowoso Magetan
Nganjuk Situbondo Madiun Probolinggo Bangkalan Ngawi
Sampang Sumenep
Kelompok 1 Kelompok 2 Kelompok 3 Pacitan Magetan Tulungagung Malang Ponorogo Ngawi Blitar Bondowoso Trenggalek Bojonegoro Situbondo Kediri Tuban Probolinggo Lumajang Lamongan Jember Gresik Mojokerto Bangkalan Jombang Sampang Nganjuk Pamekasan Madiun
Kelompok 4 Kelompok 5 Kelompok 6 Kelompok 7 Banyuwangi Pasuruan Sidoarjo Sumenep
Kelompok Karakteristik yang dominan Karakteristik yang tidak dominan
1
produksi padi, luas area panen dan produksi ubi kayu, populasi domba, produksi daging
kambing, domba, dan ayam buras
populasi ayam petelur dan pedaging, serta produksi jambu mente
2 produksi kapuk randu, daging ayam pedaging,
dan sapi
3 populasi kambing dan luas area pe-meliharaan
ikan
populasi sapi potong
4 produksi kelapa dan kedelai serta lu-as area
panen padi dan kedelai
5
luas area panen kelapa, populasi ayam buras dan petelur, populasi itik, produksi telur ayam buras dan itik, serta produksi daging itik
luas area panen jambu mente, produksi ubi kayu, dan populasi domba
6 populasi ayam pedaging
7
luas area panen dan produksi ja-gung, luas area panen dan produksi kacang hijau, luas area panen dan produksi jambu mente, luas area panen kapuk ran-du, serta populasi sapi dan ikan
populasi dan produksi telur ayam buras serta produksi daging ayam pedaging
8
populasi domba, ayam petelur dan pedaging, serta luas area panen dan produksi jambu mente
luas area panen dan produksi padi, jagung, kedelai, kacang hijau, kelapa, serta kapuk randu, luas area panen ubi kayu, populasi kambing, produksi daging sapi, kambing, domba, dan ayam buras, populasi, produksi daging dan telur itik, serta luas area pemeliharaan dan populasi ikan
ANALISIS DAN PEMBAHASAN
Deskripsi karakteristik masing-masing kelompok secara hybrid hierarchical clustering via mutual cluster
ANALISIS DAN PEMBAHASAN
Sebaran Pengelompokan Kabupaten-kabupatendi Jawa Timur dengan Hybrid Hierarchical
Clustering via Mutual Cluster
TUBAN BOJONEGORO NGAWI MAGETAN MADIUN NGANJUKJOMBANG LAMONGAN GRESIK BANGKALAN SAMPANG PAMEKASAN SUMENEP BANYUWANGI SITUBONDO BONDOWOSO JEMBER PROBOLINGGO MALANG BLITAR TULUNGAGUNG TRENGGALEK PONOROGO PACITAN KEDIRI MOJOKERTO PASURUAN SIDOARJO LUMAJANG Jatim _ .sh p Ke lo m p o k 1 Ke lo m p o k 2 Ke lo m p o k 3 Ke lo m p o k 4 Ke lo m p o k 5 Ke lo m p o k 6 Ke lo m p o k 7 Ke lo m p o k 8
Bu kan D a erah Am atan
N
E W
KESIMPULAN
 Kabupaten-kabupaten di Jawa Timur padatahun 2009 memiliki kesenjangan baik di sub sektor tanaman bahan makanan, sub sektor perkebunan, sub sektor
perternakan, maupun sub sektor perikanan
 Pembentukan kelompok kabupaten-kabupaten di Jawa Timur secara hybrid
hierarchical clustering via mutual cluster
diketahui jumlah kelompok terbaik yang dipilih berdasarkan nilai varians dalam kelompok (Sw) yang terkecil dan varians antar kelompok (Sb) yang terbesar yaitu sebanyak 8 kelompok
Kelompok 1
Kelompok
2 Kelompok 3 Kelompok 4 Pacitan Ponorogo Tulungagung Malang Trenggalek Kediri Blitar Pasuruan
Jombang Sidoarjo Tuban Mojokerto Lamongan Kelompok 5 Kelompok 6 Kelompok 7 Kelompok 8 Lumajang Jember Banyuwangi Magetan Nganjuk Bojonegoro Bondowoso Pamekasan Madiun Sumenep Situbondo
Bangkalan Probolinggo Ngawi Gresik Sampang
 Akhdaryani, D. , Muslich, M. dan Ismail, M. Analisis Keunggulan Komparatif Komoditas Andalan Utama Sektor Pertanian Jawa Timur Menjelang Perdagangan Global. Jurnal Aplikasi Manajemen, Vol. 1/No. 1. April 2003.
 Anonim. 2010. Provinsi Jawa Timur Dalam Angka 2010. BPS Provinsi Jawa Timur, Surabaya.
 Anonim. 2011. Berita Resmi Statistik Provinsi Jawa Timur 2011. BPS Provinsi Jawa Timur, Surabaya.
 Anonim. Ekspor produk pertanian Jatim melesat 38,9%. Kabar Bisnis Surabaya, 1 September 2011.
 Bunkers, W.J., Miller, J.R., DeGaetano, A.T., 1996. Definition of Climate Regions in the Northern Plains Using an Objective Cluster Modification Technique. J.Climate 9:130-146.
 Chipman, R. dan Tibshirani, R. 2006. Hybrid Hierarchical Clustering With Applications To Microarray Data.Biostatistics Journal- Oxford England, Vol. 7, Hal. 286-301.
 Hair J.F., Rolph E. Anderson, Ronald L. Tatham, William C. Black. 2006. Multivariate Data Analysis. Sixth Edition, Pearson Education Prentice Hall, Inc.
 Johnson, N. And Wichern, D. 2002. Applied Multivariate Statistical Analysis, 5thEdition. New Jersey: Prentice Hall, Englewood Cliffs.
 Lailiya,A.R. 2011. Pengelompokkan Kabupaten/Kota Di Jawa Timur Berdasarkan Kesamaan Nilai Faktor-Faktor Yang Mempengaruhi Tingkat Pengangguran Terbuka Dengan Metode Hirarki Dan Nonhirarki. Surabaya: Jurusan Statistika FMIPA-ITS.
 Lusminah, 2008. Analisis Potensi Wilayah Kecamatan Berbasis Komoditi Pertanian Dalam
Pembangunan Daerah Di Kabupaten Cilacap. Surakarta: Jurusan Agrobisnis Pertanian-Universitas Sebelas Maret.
 Malik, A., 2006. Keunggulan komparatif dan Kompetitif Tanaman Pangan di Sentra Produksi
Papua (Studi Kasus Kabupaten Jayapura). SEPA Jurnal Sosial Ekonomi Pertanian Vol. 3 No.
1 September 2006 hal.: 1-9. Fakultas Pertanian UNS. Surakarta.
 Nugroho, M.A. 2010. Analisis Pengelompokkan dan Pemetaan Kecamatan Sebagai Dasar
Program untuk Mengatasi Masalah-Masalah Sosial-Ekonomi di Kota Surabaya. Surabaya:
Jurusan Statistika FMIPA-ITS.
 Pranoto, E. 2008. Potensi Wilayah Komoditas Pertanian Dalam Mendukung Ketahanan
Pangan Berbasis Agribisnis Kabupaten Banyumas. Semarang: Jurusan Agribisnis
Pertanian-Universitas Diponegoro.
 Gong X., Richman MB. 1995. On the Application of Cluster Analysis to Growing Season Precipitation Data in North America East of The Rockies. J.Climate 8: 897-931.
 Szymkawiak, A. , Larsen, J. dan Hansen, L.K. 2001. Hirarchical Clustering For Data
Mining. KES-2001 Fifth International Conference on Knowledge-Based Intelligent Information Engineering Systems & Allied Hal 261-265.
 Widiastuti, A. Perekonomian Indonesia. http://www.scribd.com/doc/52731022/
SEKTOR-PERTANIAN. 11 April 2011.