880
ANALISIS DISKRIMINAN DISKRIT UNTUK MENGELOMPOKKAN KOMPONEN
Bernik Maskun
Jurusan Statistika FMIPA UNPAD jay_komang@yahoo.com
Abstrak
Untuk mengelompokkan hasil pengukuran yang diukur dengan p buah variabel dimana penilaian setiap variabel dilakukan dengan pengkategorian yang bersifat biner maka banyak susunan yang mungkin terjadi adalah 2p . Dari sampel yang diperoleh, terlebih dahulu sampel dibagi dalam dua bagian yaitu Analysis Sample sebagai sampel untuk membuat aturan pengklasifikasian dan Holdout Sample sebagai sampel untuk menguji ketepatan kalsifikasi dari aturan klasifikasi. Hair dkk (1988) mengusulkan ukuran sampel untuk sampel analysis adalah 75% dari sampel yang ada. Dari Sampel Analysis selanjutnya dikategorikan atas dua kelompok sampel yaitu kelompok yang baik dan kelompok tidak baik (perlu perbaikan) yang selanjutnya dilakukan pengujian hipotesis kesamaan proporsi dengan statistik uji berbentuk
yang berdistribusi Chi kuadrat dengan dk =2p-1
Jika hasil pengujian bersifat signifikan, selanjutnya lakukan Klasifikasi dengan aturan
1, 2
D D D
Dimana : 1 jika g x1( ) 2 g ( )x ; 2 jika 1 2 ;
( ) i i N x g N
Peluang kesalahan pengklasifikasian dari Sampel analysis dapat di hitung (i) Actual Error Rate (AER) :
2 1 3 1 1 1 2 2 2 ( ) ( ) ... ( ) ( ) ( ) ... ( ) ... ( ) N N N n D D D D D D p D g x g x g x g x g x g x
(ii) Apparent Error Rate (APER) :
APER dihitung dengan terlebih dahulu nilai Ni diurutkan dari nilai terbesar Ni(k)
hingga terkecil Ni(1) kemudian gunakan rumus :
1(1) 1(2) 1( 1) ( 1) 1 ( ) ( ) ( ) ...k n k ( ) ( ) x p D N x N x N x N x N
881
1. PENDAHULUAN
Dalam perindusrian terutama yang menghasilkan produk yang memerlukan ketelitian/presisis yang tinggi seperti komponen AIR BRAKE SYSTEM (sistem pengereman kereta api) yang merupakan hasil produk dari PT. PINDAD (Persero) Bandung untuk memenuhi pesanan khusus dari PT. KAI, maka produk yang dihasilkan harus memenuhi standar yang telah ditentukan. Untuk itu perlu dilakukan pengujian terhadap komponen-komponen Air Brake yang dihasilkan antara lain dengan mengandalkan uji fungsi (tidak diuji secara keseluruhan) yaitu pengujian yang dikerjakan oleh para pekerja dengan cara mencelupkan komponen yang diproduk kedalam air untuk mengetahui bocor atau tidak. Selama kurun waktu Mei 2007 sampai dengan Januari 2009 terdapat fakta terjadinya kebocoran dari produk yang dihasilkan untuk memenuhi pemesanan PT. KAI sebagai berikut :
Tabel 1.1
Jumlah Kebocoran Air Brake System Produk PT. PINDAD
Waktu Sampel Pemeriksaan
Baik % Bocor % Mei 2007 100 73 73,00 27 27,00 Agustus 2007 60 40 67,00 20 33,00 November 2007 500 370 74,00 130 26,00 Juli 2008 510 360 70,59 150 29,41 Januari 2009 336 248 73,80 88 26,20
Terlihat dalam tabel di atas, produk yang mengalami kerusakan (kebocoran) dari waktu ke waktu cenderung meningkat. Tentunya jika hal ini terus menerus berlangsung tidak menutup terjadinya penangguhan pemesanan yang mengakibatkan dapat merugikan kedua belah pihak.
Untuk menentukan apakah produk yang dihasilkan memenuhi standar atau tidak, tentukan dapat dilakukan dengan cara mengklasifikasikan berdasarkan uji yang telah dilakukan untuk setiap komponen produk. Dalam mengklasifikasikan
882
hasil produknya, PT. PINDAD menggunakan 5 komponen dominan dari Air Brake System yang harus diperiksa, dimana untuk tiap komponen dikategorikan dalam data kualitatif berskala nominal (bocor atau tidak bocor).
Berdasarkan data kualitatif untuk ke lima komponen tersebut, dapat ditentukan komponen mana yang paling dominan untuk membedakan klasifikasi satu kelompok dengan kelompok lainnya serta besar peluang kesalahan pengklasifikasiannya.
2. TINJAUAN PUSTAKA
2.1 Pengelompokkan berdasarkan satu variabel prediktor
Pada saat kita dihadapkan pada persoalan pengelompokan dengan memperhatikan satu variabel prediktor, maka univariate classification dapat digunakan dengan tujuan : (i) untuk menaksir besarnya pengaruh variabel pengelompokkan ketika terdapat dua kelompok yang sudah tersedia sebelumnya, dan (ii) untuk menetapkan nilai pemisah variabel respon yang baik untuk menentukan standar agar unit sampel dapat dibagi ke dalam dua kelompok untuk mengidentifikasikan objek dengan tepat.
a. Pengelompokkan berdasarkan dua atau lebih variabel prediktor
Dalam mulivariate pengelompokan dapat dilakukan dengan beberapa merode, diantaranya Analisis Diskriminan. Analisis ini merupakan suatu teknik analisis statistika untuk mengelompokkan setiap objek ke dalam dua kelompok atau lebih berdasarkan kriteria sejumlah variabel bebas (interval atau rasio dan bersifat kuantitatif) sedangkan variabel tidak bebasnya merupakan kategori (non-metrik, nominal atau ordinal yang bersifat kualitatif) (Hair, 1998). Untuk melakukan analisis diskriminan, langkah pertama yang harus dilakukan adalah melakukan pengujian hipotesis apak terdapat perbedaan antara kedua kelompok populasi yang telah diketahui. Apabila terdapat perbedaan antara kedua kelompok maka analisis diskriminan dapat dilakukan, jika tidak terdapat perbedaan maka analisis diskriminan tidak perlu dilakukan.
883 1 2 : o H Melawan 1:1 2 H
Statitik uji nya adalah :
yang berdistribusi Chi kuadrat dengan dk =2p-1
Menentukan Aturan Klasifikasi
Untuk menentukan aturan klasifikasi ; jika banyaknya individu yang berasal dari populasi i pada X = x merupakan variabel acak binom Ni(x), i =
1,2, sehingga banyaknya individu yang terambil menjadi sampel dari dua populasi
1 1 dan N2 2 N( )x merupakan variabel acak Binom dengan
1 2 .
Peluang prior ditaksir oleh i i
N
N dan taksiran untuk peluang susunan
adalah i
i
i
Sehingga taksiran untuk diskriminan adalah :
( ) i i N x g N
2.2.2 Menghitung peluang kesalahan Klasifikasi
Setelah proses klasifikasi, selajutnya dapat diketahui seberapa tepat aturan klasifikasi yang telah ditentukan tersebut dengan menghitung nilai error rate yaitu proporsi kesalahan kalasifikasi dari Holdout Sample. Jika Nilai eror rate kecil maka ketepatan klasifikasi semakin tinggi.
Jika klasifikasi yang dihasilkan dari sampel telah dihitung, dapat pula dihitung dua buah kesalahan klasifikasi yaitu
884 2 1 3 1 1 1 2 2 2 ( ) ( ) ... ( ) ( ) ( ) ... ( ) ... ( ) N N N n D D D D D D p D g x g x g x g x g x g x dan
(ii) Apparent Error Rate (APER)
1(1) 1(2) 1( 1) ( 1) 1 ( ) ( ) ( ) ...k n k ( ) ( ) x p D N x N x N x N x N
2.2.3 Menentukan Variabel Diskriminator dan Subset variabel Terbaik
Untuk menentukan variabel diskriminator dan subset variabel terbaik dalam analisis diskriminan diskrit dua kelompok dapat digunakan Statistik Kullback Divergence.
Variabel Diskriminan terbaik dilakukan dengan langkah langkah sebagai berikut : (1) Hitung nilai j j dengan rumus :
1 1 2 1 2 1 2 2 1 2 1 1 1 2 2 2 1 2 log log j j j j j j j j j j j j w w w Nw w w w Nw J N N N N N w w N N N w w
(2) tentukan nilai j yang maximum : j = max j dengan 1 =j = p
(3) Uji signifikan Z1
Melawan
Statistik ujinya adalah j dengan kriteria tolak Ho jika j > dengan dk = 1
3. APLIKASI
Dalam mengkategorikan apakah setiap produk ISOLATING COCK L I dalam hal ini Air Brake yang dihasilkan oleh PT PINDAD Persero termasuk
885
kategori yang baik atau harus ada perbaikan telah dilakukan pemeriksaan atas 5 komponen : Housing (X1), Flens (X2), Ventilasi (X3), Penutup(X4), dan Segmen
(X5). Masing-masing komponen dinilai atas kriteria bocor (skor 1) atau baik (
skor 0). Dari 336 sampel acak, telah dikelompokkan atas 32 kelompok berdasarkan 5 komponen pemeriksaan sebagai berikut :
Tabel 3.2
Data Hasil Pemeriksaan Lima Komponen ISOLATING COCK L I/Air Brake
Kelompok Komponen Kelompok Jumlah
Hasil Pengujian X1 X2 X3 X4 X5 Baik Jelek 1 0 0 0 0 0 47 0 47 2 1 0 0 0 0 7 2 9 3 0 1 0 0 0 6 0 6 4 0 0 1 0 2 2 14 16 5 0 0 0 1 0 1 45 46 6 0 0 0 0 1 1 5 6 7 1 1 0 0 0 2 1 3 8 1 0 1 0 0 4 12 16 9 1 0 0 1 0 1 13 14 10 1 0 0 0 1 2 2 4 11 0 1 1 0 0 2 5 7 12 0 1 0 1 0 6 4 10 13 0 1 0 0 1 0 1 1 14 0 0 1 1 0 6 21 27 15 0 0 1 0 1 1 4 5 16 0 0 0 1 1 2 8 10 17 1 1 1 0 0 5 1 6 18 1 1 0 1 0 1 3 4 19 1 1 0 0 1 4 2 6 20 1 0 1 1 0 7 6 13 21 1 0 1 0 1 2 2 4 22 1 0 0 1 1 4 2 6 23 0 1 1 1 0 1 20 21 24 0 1 1 0 1 3 5 8 25 0 1 0 1 1 1 3 4 26 0 0 1 1 1 1 12 13 27 0 1 1 1 1 0 5 5 28 1 0 1 1 1 1 9 10 29 1 1 0 1 1 2 1 3 30 1 1 1 0 1 4 0 4 31 1 1 1 1 0 0 2 2 32 1 1 1 1 1 0 0 0 Jumlah 126 210 336
886
Dari 336 buah Air brake dibagi atas dua kelompok sampel yaitu sebagai Analysis Sample sebanyak 252 buah dan sisanya 84 buah sebagai Holdout Sample (Lampiran 1 dan Lampiran 2)
Berdasarkan data dalam Lampiran 1, selanjutnya dilakukan pengujian hipotesis
1 2
: o
H : Tidak terdapat perbedaan proporsi Melawan
1:1 2
H : Terdapat perbedaan proporsi
Statistik uji nya adalah : (Lampiran 3) yang bersifat signifikans dengan Chi-kuadrat tabel = 43,8 untuk dk = 31, ini memberikan hasil yang menyatakan terdapat perbedaan antara kedua kelompok.
Selanjutnya dapat ditentukan variabel diskriminator dan Subset variabel terbaik dalam membedakan kelompok perlu perbaikan dan kelompok tidak perlu perbaikan yaitu dengan menghitung nilai untuk masing-masing variabel pengamatan Xi : Tabel 3.3 Variabel Diskriminator Variabel X1 0,684 X2 0,010 X3 6,717 X4 3,279 X5 0,001
Sedangkan subset variabel terbaiknya adalah : Tabel 3.4
Subset variabel Diskriminator
Variabel Df Nilai kritis
X3 6,72 1 3,84
X4X3 12,76 3 7,81
X4X5X3 17,83 7 14,07
X2X4X5X3 42,69 15 25,00
887
Dari tabel di atas terlihat bahwa variabel X2X4X5X3 mempunyai nilai yang
terbesar, ini dapat diartikan bahwa keempat variabel tersebut merupakan subset variabel yang terbaik untuk membedakan antara kelompok yang perlu perbaikan dan kelompok tanpa perbaikan.
Dari Analysis Sample dapat ditentukakan aturan klasifikasi (Lampiran 4) sebagai berikut :
Tabel 3.5
Tabel Aturan Klasifikasi
Susunan X1 X2 X3 X4 X5 Kelompok Tidak Perlu Memperoleh Perbaikan Perlu Memperoleh Perbaikan 1 0 0 0 0 0 V 2 0 0 0 1 0 V 3 0 0 1 0 0 V 4 0 0 1 1 0 V 5 0 1 0 0 0 V 6 0 1 0 1 0 V 7 0 1 1 0 0 V 8 0 1 1 1 0 V 9 1 0 0 0 0 V 10 1 0 0 1 0 V 11 1 0 1 0 0 V 12 1 0 1 1 0 V 13 1 1 0 0 0 V 14 1 1 0 1 0 v 15 1 1 1 0 0 V 16 1 1 1 1 0 V 17 0 0 0 0 1 V 18 0 0 0 1 1 V 19 0 0 1 0 1 V 20 0 0 1 1 1 V 21 0 1 0 0 1 V 22 0 1 0 1 1 V 23 0 1 1 0 1 V 24 0 1 1 1 1 V 25 1 0 0 0 1 v 26 1 0 0 1 1 V 27 1 0 1 0 1 V 28 1 0 1 1 1 V 29 1 1 0 0 1 v 30 1 1 0 1 1 v 31 1 1 1 0 1 V 32 1 1 1 1 1 V
888
Dari tabel di atas dapat diketahui bahwa untuk susunan : 1 yaitu susunan (0 0 0 0 0 ), 6(0 1 0 1 0), 8(0 1 1 1 0), 9(1 0 0 0 0), 12(1 0 1 1 0), 14(1 1 0 1 0 ), 25(1 0 0 0 1 ), 29(1 1 0 0 1 ), dan 30(1 1 0 1 1) berasal dari kelompok komponen yang tidak perlu memperoleh perbaikan, maka jika terdapat komponen yang mempunyai hasil pemeriksaan sama dengan kelompok pemeriksaan tersebut, maka komponen tersebut dapat dikelompokan tidak perlu perbaikan.
Sedangkan untuk susunan : 2 yaitu susunan (0 0 0 1 0), 3(0 0 1 0 0 ), 4(0 0 1 1 0), 5(0 1 0 0 0 ), 7(0 1 1 0 0 ), 10(1 0 0 1 0 ), 11( 1 0 1 0 0), 13(1 1 0 0 0 ), 15(1 1 1 0 0 ), 16(1 1 1 1 0 ), 17(0 0 0 0 1), 18(0 0 0 1 1 ), 19(0 0 1 0 1), 20(0 0 1 1 1), 21(0 1 0 0 1 ), 22(0 1 0 1 1), 23( 0 1 1 0 1 ), 24(0 1 1 1 1 ), 26(1 0 0 1 1),27(1 0 1 0 1 ), 28(1 0 1 1 1), dan 31(1 1 1 0 1), 32 (1,1,1,1,1,1) sehingga jika terapat komponen mempunya hasil pemeriksaan yang sama dengan kelompok pemeriksaan tersebut, maka komponen tersebut dikelompokan perlu perbaikan.
Perhitungan kesalahan klasifikasi dihitung dari Holdout Sample yang telah dikelompokkan seperti pada Lampiran 2, dan diperoleh matriks klasifikasi sebagai berikut : Tabel 3.6 Matrik Klasifikasi Alokasi Jumlah Tdk Perlu Perbaikan Perlu Perbaikan Alokasi Tidak perlu Perbaikan 13 11 24 Perlu Perbaikan 22 38 60 Jumlah 35 49 84
Dari Tabel 5 dapat dihitung APER = 0,393, atau dapat diketahui kesalahan pengklasifikasian sebesar 39,3 persen.
889
4. KESIMPULAN
1. Dalam mengelompokkan air Brake kedalam kelompok perlu perbaikan dan tidak perlu perbaikan dengan menggunakan 5 variabel pengamatan yang dinilai dalam skala binom di PT Pindad (Persero) menunjukkan peluang kesalahan klasifikasi sebesar 39,3 %
2. Dari ke lima buah variabel pengamatan, variabel X3 (pemeriksaan ventilasi)
merupakan variabel diskriminator yang mempunyai kontribusi paling besar dibandingkan dengan empat variabel lainnya.
3. Pengklasifikasian produk Air Brake, tidak perlu dengan kelima variabel, tetapi cukup dengan 4 buah variabel pengamatan yaitu dengan menghilangkan variabel X1 (Housing) sehingga lebih efisien.
DAFTAR PUSTAKA
Discreate Discriminant Analysis .. New
York, Jonh Wiley & Sons
Hair, Joseph F., Rolph E Anderson., Roland L. tatham., and William C. Black.,
Multivariate Data Analysis
international, Inc., Upper Saddle River, New Jersey. Rencher., Alvin C., (1995 Methods of Multivariate Analysis
Sons, Inc, USA.
Analisis Multivariat, Arti dan Interpretasi
890 Lampiran 1
Tabel Frekuensi Observasi Sample Analysis Susunan X1 X2 X3 X4 X5 Kelompok Jumlah Tidak Perlu Memperoleh Perbaikan Perlu Memperoleh Perbaikan 1 0 0 0 0 0 20 0 20 2 0 0 0 1 0 2 21 23 3 0 0 1 0 0 5 18 23 4 0 0 1 1 0 5 13 18 5 0 1 0 0 0 4 7 11 6 0 1 0 1 0 6 4 10 7 0 1 1 0 0 1 2 3 8 0 1 1 1 0 1 9 10 9 1 0 0 0 0 5 1 6 10 1 0 0 1 0 1 10 11 11 1 0 1 0 0 4 5 9 12 1 0 1 1 0 2 1 3 13 1 1 0 0 0 0 1 1 14 1 1 0 1 0 3 1 4 15 1 1 1 0 0 0 1 1 16 1 1 1 1 0 5 15 20 17 0 0 0 0 1 1 6 7 18 0 0 0 1 1 1 2 3 19 0 0 1 0 1 0 5 5 20 0 0 1 1 1 0 1 1 21 0 1 0 0 1 1 2 3 22 0 1 0 1 1 2 2 4 23 0 1 1 0 1 2 2 4 24 0 1 1 1 1 0 6 6 25 1 0 0 0 1 4 0 4 26 1 0 0 1 1 3 3 6 27 1 0 1 0 1 2 11 13 28 1 0 1 1 1 2 2 4 29 1 1 0 0 1 4 3 7 30 1 1 0 1 1 4 1 5 31 1 1 1 0 1 3 4 7 32 1 1 1 1 1 0 0 0
884 Lampiran 2
Tabel Distribusi Frekuensi Observasi (Holdout Sample)
Sus una n X1 X2 X3 X4 X5 Kelompok Ju mla h Tidak Perlu Memperoleh
Perbaikan Perlu Memperoleh Perbaikan 1 0 0 0 0 0 2 0 2 2 0 0 0 1 0 1 2 3 3 0 0 1 0 0 2 3 5 4 0 0 1 1 0 3 2 5 5 0 1 0 0 0 1 1 2 6 0 1 0 1 0 0 2 2 7 0 1 1 0 0 1 2 3 8 0 1 1 1 0 2 0 2 9 1 0 0 0 0 1 1 2 10 1 0 0 1 0 1 1 2 11 1 0 1 0 0 0 2 2 12 1 0 1 1 0 2 1 3 13 1 1 0 0 0 0 1 1 14 1 1 0 1 0 2 1 3 15 1 1 1 0 0 1 2 3 16 1 1 1 1 0 1 2 3 17 0 0 0 0 1 1 2 3 18 0 0 0 1 1 0 3 3 19 0 0 1 0 1 1 1 2 20 0 0 1 1 1 2 1 3 21 0 1 0 0 1 1 5 6 22 0 1 0 1 1 0 2 2 23 0 1 1 0 1 2 1 3 24 0 1 1 1 1 1 2 3 25 1 0 0 0 1 1 2 3 26 1 0 0 1 1 1 1 2 27 1 0 1 0 1 0 1 1 28 1 0 1 1 1 1 1 2 29 1 1 0 0 1 2 2 4 30 1 1 0 1 1 1 1 2 31 1 1 1 0 1 1 1 2 32 1 1 1 1 1 0 0 0 Tot al Jumlah 35 49 84
885 Lampiran 3
Perhitungan Statistik Uji
Susunan X1 X2 X3 X4 X5 Kelompok Tidak Perlu Memperoleh Perbaikan Perlu Memperoleh Perbaikan 1 0 0 0 0 0 20 0 0.058742 0 2 0 0 0 1 0 2 21 0.043796 0.006549 3 0 0 1 0 0 5 18 0.00862 0.002052 4 0 0 1 1 0 5 13 0.002179 0.000606 5 0 1 0 0 0 4 7 0.000004 0.000001 6 0 1 0 1 0 6 4 0.005241 0.002875 7 0 1 1 0 0 1 2 0.000051 0.000016 8 0 1 1 1 0 1 9 0.016405 0.00261 9 1 0 0 0 0 5 1 0.010595 0.010129 10 1 0 0 1 0 1 10 0.020017 0.003052 11 1 0 1 0 0 4 5 0.000589 0.000235 12 1 0 1 1 0 2 1 0.002465 0.001556 13 1 1 0 0 0 0 1 0 0.000464 14 1 1 0 1 0 3 1 0.005046 0.003853 15 1 1 1 0 0 0 1 0 0.000464 16 1 1 1 1 0 5 15 0.00433 0.001124 17 0 0 0 0 1 1 6 0.007017 0.001324 18 0 0 0 1 1 1 2 0.000051 0.001556 19 0 0 1 0 1 0 5 0 0.002321 20 0 0 1 1 1 0 1 0 0.000464 21 0 1 0 0 1 1 2 0.000051 0.001556 22 0 1 0 1 1 2 2 0.000742 0.000332 23 0 1 1 0 1 2 2 0.000742 0.000332 24 0 1 1 1 1 0 6 0 0.002785 25 1 0 0 0 1 4 0 0.011748 0.001856 26 1 0 0 1 1 3 3 0.001114 0.000499 27 1 0 1 0 1 2 11 0.011431 0.002242 28 1 0 1 1 1 2 2 0.000742 0.000332 29 1 1 0 0 1 4 3 0.002892 0.001496 30 1 1 0 1 1 4 1 0.007785 0.006761 31 1 1 1 0 1 3 4 0.000291 0.000112 32 1 1 1 1 1 0 0 0 0 Total 93 159 = 44,776
886 Lampiran 4
Proses Perhitungan Dalam Menentukan Aturan Klasifikasi
Dengan : i i i N x f x N j Nj N ; j = 1, 2 ; i Susuna n X 1 X 2 X 3 X 4 X 5 Tidak Perlu Memperole h Perbaikan N1 Perlu Memperole h Perbaikan N2 f1(x) f2(x) g1 g2 1 0 0 0 0 0 20 0 0,21 5 0 0,07 9 0 2 0 0 0 1 0 2 21 0,02 1 0,13 2 0,00 7 0,08 3 3 .. 31 1 1 1 0 1 3 4 0,03 2 0,02 5 0,01 2 0,01 6 32 1 1 1 1 1 0 0 0 0 0 0 Total 93 159