• Tidak ada hasil yang ditemukan

PENYEDERHANAAN PEMETAAN STRUKTUR KETERGANTUNGAN VARIABEL MENGGUNAKAN TEKNIK PRINSIPAL KOMPONEN

N/A
N/A
Protected

Academic year: 2021

Membagikan "PENYEDERHANAAN PEMETAAN STRUKTUR KETERGANTUNGAN VARIABEL MENGGUNAKAN TEKNIK PRINSIPAL KOMPONEN"

Copied!
16
0
0

Teks penuh

(1)

PENYEDERHANAAN PEMETAAN

STRUKTUR KETERGANTUNGAN VARIABEL

MENGGUNAKAN TEKNIK PRINSIPAL KOMPONEN

Mike Susmikanti *)

ABSTRAK

PENYEDERHANAAN PEMETAAN STRUKTUR KETERGANTUNGAN VARIABEL MENGGUNAKAN TEKNIK PRINSIPAL KOMPONEN. Struktur pengamatan dari banyak variabel dapat dianalisis dengan perhitungan korelasi. Analisa struktur ketergantungan masing-masing variabel dilakukan, agar dapat memetakan aturan pasti untuk variabel-variabel yang bersangkutan. Persoalan yang dijumpai dalam salah satu aplikasi pengolahan citra mengenai struktur ketergantungan variabel apabila pengamatan variabel bebas yang satu berkoresponden dengan variabel lain sebanyak k variabel dan n pengamatan. Pemetaan struktur ketergantungan variabel akan lebih kompleks yaitu struktur dalam dimensi-n dengan subruang dimensi-k. Dalam persoalan penyederhanaan struktur tersebut, disarankan menggunakan tehnik prinsipal komponen yang metodologinya didasarkan pada rata-rata taksiran bidang dengan orthogonal least

square yang kemudian dikembangkan untuk alasan lebih umum dengan struktur analisa

korelasi. Komputasi analisis eigen dan singular value decomposition dilakukan untuk membentuk suatu dekomposisi serupa terhadap data pengamatan. Singular value decomposition merupakan tahapan pertama dalam analisis prinsipal komponen. Komputasi selanjutnya, membentuk vektor prinsipal komponen yang akan digunakan untuk pemetaan lokasi dalam ruang dimensi yang lebih sederhana.

ABSTRACT

The Simplification of the Mapping of Variable Dependence Structure Using Component Principle Technique. Observation structure of many variables can be analyzed using correlation calculation. The analysis of dependence variable structure of each variable is done in order to be able to map a certain rule for the dependence variable. A problem we meet in one of the applications of image processing concerning variable dependence structure when one independent variable observation corresponds with k variables in n observations. The mapping of variable dependence structure will be more complex, i.e. structure in n-dimensions with a subspace of k-dimensions. In the problem of the structure simplification, it is recommended to use component principle technique where its methodology is based on the average of fitting planes by orthogonal least square, but developed for partical purpose of analyzing correlation structures. The eigenanalysis computation and singular value decomposition used to develop a similar decomposition for observations data. Singular value decomposition is the first step then used in component principle analyses. The next computation, developed the component principle vector wich will be used for location mapping in more simply dimension space. _________________________________________________

(2)

Pendahuluan

Struktur pengamatan dari banyak variabel dapat dianalisis dengan menggunakan korelasi parsial dan korelasi ganda untuk menganalisa struktur ketergantungan dari populasi dengan banyak variabel bebas yang mempunyai sebaran normal. Analisis korelasi parsial diperlukan untuk memutuskan yang mana variabel yang berkorelasi dan yang mana variabel yang konstan. Sedangkan korelasi ganda mengharapkan bahwa satu variabel menjadi tidak bebas terhadap beberapa atau semua variabel yang lain. Pilihan analisis tergantung pada keadaan alamiah dari variabel-variabel tersebut dan informasi eksternal lain. Kesimpulan kita untuk dapat menggambarkan tentang struktur ketidakbebasan variabel tergantung berdasarkan pilihan tersebut diatas. Persoalan yang dijumpai dalam aplikasi pengolahan citra adalah apabila pengamatan variabel yang satu berkoresponden dengan pengamatan pada variabel-variabel lain. Apabila terdapat k variabel bebas yang mempengaruhi dengan n pengamatan, maka pemetaan struktur ketergantungan variabel akan lebih kompleks yaitu struktur dalam ruang dimensi-n dengan subruang dimensi-k. Untuk keperluan hal tersebut yaitu dalam persoalan penyederhanaan struktur disarankan menggunakan tehnik prinsipal komponen. Analisis struktur ketergantungan variabel berdasarkan pada taksiran secara statistik dari koefisien fungsi.

Metodologi Tehnik prinsipal komponen didasarkan atas taksiran rata-rata bidang (orthogonal least square) yang selanjutnya dikembangkan untuk alasan lebih umum dengan struktur analisa korelasi.

(3)

Dekomposisi matriks

Prinsipal komponen dari pengamatan banyak variabel mempunyai distribusi multivariat dengan rata-rata dalam bentuk vektor (terdiri dari beberapa komponen) dan matrikss kovarian. Asumsi bahwa rata-rata dan matriks kovarian ada. Taksiran dari matriks kovarian dinyatakan sebagai sampel matriks kovarian. Matriks data dinyatakan sebagai Xn x p, n menyatakan banyak pengamatan bebas dan p adalah banyak variabel tidak bebas. XTX merupakan matriks order p x p yang simetris dan bujur sangkar. Secara matematik, matriks yang tidak mempunyai rank penuh p, mempunyai akar ciri atau akar karakteristik berbeda. ëi2 adalah akar ciri dan ëi merupakan akar yang positif dari akar ciri disebut nilai-singular (singular value). Zi adalah kolom-kolom atau vektor ciri-vektor ciri.Rank dari matriks kovarian didefinisikan dengan r, dimana r ≤ p dengan akar ciri-akar ciri q yaitu ë12 > ….. > ëq2. Sebelumnya nilai Xij ditransformasi ke nilai standar xij = (Xij – xj )/sj, apabila data pengamatan dari masing-masing variabel bebas mempunyai satuan yang berbeda.

Matriks Z = (z1, z2, ……, zn) dinyatakan sebagai matriks dari vektor ciri, yang memenuhi ZTZ = I. Jika L merupakan matriks diagonal, maka dekomposisi dari suatu matriks XTX adalah ZLZT = Σëi2 (zi ziT).

(4)

Singular Value Decomposition

Singular Value Decomposition merupakan tahap pertama dalam analisis prinsipal

komponen. Analisis digunakan untuk membentuk dekomposisi serupa yang disebut dengan singular value decomposition.

Jika X suatu matriks data dengan order n x p dimana n > p. XTX merupakan matriks simetris kuadrat dengan order p x p yang ingin dicari akar cirinya, maka

XTX = ZLZT (1),

L adalah matriks dengan unsur-unsur akar ciri dan Z matriks vektor ciri. XXT adalah matriks simetris kuadrat dengan order n x n. Rank dari XTX paling banyak adalah p sehingga akan terdapat paling banyak p akar ciri yang tidak nol. Pada prinsipnya akar ciri yang diperoleh dari matriks XXT adalah sama seperti akar ciri pada matriks XTX. Terdapat (n-p) akar ciri dan (n-p) vektor kolom yang diabaikan.

Apabila U menyatakan matriks dari vektor ciri yang berkoresponden dengan p akar ciri seperti dalam matriks XTX. Setiap vektor ciri ui mempunyai order n x 1 yang memenuhi persamaan berikut;

(5)

Dari persamaan (1) dan (2) diperoleh;

X = UL1/2ZT (3)

Bentuk persamaan (3) adalah singular value decomposition dari matriks X. L1/2 adalah matriks diagonal dengan unsur-unsurnya adalah nilai-singular dari matriks XTX. Adapun L1/2L1/2 = L. Unsur-unsur matriks L1/2 dinyatakan dengan ëi yang merupakan nilai-nilai singular, dengan memperhatikan vektor kolom matriks U dan vektor-vektor singular Z.

Jika L1/2 adalah suatu matriks diagonal, maka singular value decomposition yang dinyatakan dengan X merupakan matriks rank-1 sebagai berikut;

X =

=

p

i 1

ëi ui ziT (4)

Apabila akar ciri diurutkan dari terbesar sampai dengan yang terkecil, maka matriks yang pertama yaitu matriks rank-1 adalah matrik terbaik yang mendekati X. Jumlah dua matriks pertama adalah matriks rank-2 yang terbaik sebagai pendekatan X dan seterusnya.

Pendekatan taksiran terbaik untuk urutan pertama yang diberikan dalam hal ini merupakan perbandingan dari nilai akar ciri pertama ë1 atau kuadrat dari nilai singular terhadap jumlah akar ciri seluruhnya. Jadi pendekatan rank-1 merupakan kecocokan terbaik dari ëi2 / Σëi2 , sedangkan pendekatan rank-2 merupakan kecocokan terbaik dari (ë12 + ë22) / Σ ëi2, dan seterusnya.

(6)

Analisis Prinsipal Komponen

Dalam analisis prinsipal komponen suatu matriks data X; dengan menggunakan hasil X = UL1/2ZT dimana ZTZ = I, maka dapat dibentuk suatu matriks berikut;

Wn x p = XZ = UL1/2 (5)

Kolom pertama dari Z adalah vektor ciri pertama dari XTX. Koefisien dalam vektor ciri pertama mendefinisikan fungsi linier dari kolom X (variabel asli) yang dinyatakan dalam kolom pertama W. Kolom kedua W diperoleh dengan menggunakan vektor ciri kedua dari XTX dan seterusnya. WTW = L, W adalah suatu matriks dengan order n x p yang tidak sama dengan X, bersifat bahwa semua kolom-kolomnya adalah ortogonal. Sedangkan L adalah suatu matriks diagonal demikian sehingga semua unsur diluar diagonal utamanya, yaitu penjumlahan dari perkalian antar kolom W adalah nol. Jumlah kuadrat dari kolom ke i matriks W adalah ëi2, yang merupakan unsur diagonal ke i dari matriks L. Jadi jika X adalah suatu matriks n x p dengan n pengamatan dan p variabel, tiap kolom dari W adalah variabel baru yang didefinisikan sebagai transformasi linier dari variabel bebas. Kolom-kolom W adalah komponen prinsipal atau disebut dengan nilai-nilai prinsipal komponen.

Prinsipal komponen pertama dari sample variabel yang kompleks X1, ……,Xp adalah komposisi linier yang dinyatakan dengan;

(7)

Y1 = a11X1 + …….+ ap1Xp (6)

dimana koefisien ai1 adalah unsur-unsur dari vektor ciri ë12 yang berhubungan dengan akar ciri terbesar pada matriks kovarian. Koefisien ai1 adalah unik demikian sehingga a1Ta1 = 1. Transformasi adalah kumpulan variabel ortogonal demikian sehingga prinsipal komponen pertama menghitung kemungkinan terbesar jumlah dari total sebaran, yang diukur dengan ë12.

Prinsipal komponen kedua adalah komposisi linier;

Y2 = a12X1 + …….+ ap2Xp (7)

yang memenuhi batasan a2Ta2 = 1 dan a1Ta2 = 0. Prinsipal komponen kedua menghitung kemungkinan terbesar jumlah sisa sebaran ë22 dan seterusnya. Total sebaran adalah jumlah dari semua akar ciri, yang sama dengan jumlah kuadrat variabel bebas tr(XTX) = tr(WTW) = Σ ëi2.

Pembahasan

Untuk persoalan berikut, Matriks X adalah data hasil pengamatan yang telah distandarisasi untuk beberapa variabel bebas dikarenakan variabel tersebut mempunyai satuan ukuran yang berbeda. Adapun variabel yang diamati antara lain menunjukkan

(8)

rata-rata temperatur minimum per hari (X1), rata-rata-rata-rata temperatur maksimum per hari (X2), total turun hujan (X3) dan tingkat total pertumbuhan perhari (X4) dalam enam lokasi.

X =                   0.602687 0.536780 0.693299 0.359312 -0.732264 0.210455 -0.327028 0.782003 --0.057203 0.120598 0.065406 0.057369 --0.053411 0.210455 0.300866 0.147952 -0.301186 0.777976 -0.209298 0.449895 -0.060996 0.059117 -0.523245 0.178146 XT =             0.602687 0.732264 0.057203 0.053411 0.301186 0.060996 -0.536780 0.210455 0.120598 0.210455 0.777976 0.059117 0.693299 0.327028 0.065406 0.300866 0.209298 0.523245 -0.359312 0.782003 0.057369 0.147952 0.449895 0.178146 XTX =             0.998487 0.065675 0.605416 0.924051 0.065675 0.997106 0.551228 0.355201 0.605416 0.551228 0.998613 0.269761 0.924051 0.355201 0.269761 0.998548

Dari persamaan XTX = ZLZT, diperoleh matriks vektor ciri z;

Z = XTX =             0.736647 0.109450 0.061411 0.664531 -0.026619 0.639161 0.768597 0.004737 -0.264850 0.658070 0.540861 0.451961 -0.621689 0.382671 0.336091 0.595070

(9)

L =             0.0033438 0.0000000 0.0000000 0.0000000 0.0000000 0.2056628 0.0000000 0.0000000 0.0000000 0.0000000 1.5455732 0.0000000 0.0000000 0.0000000 0.0000000 2.2381743

Matrix diagonal untuk nilai-nilai singular L1/2;

L1/2 =             0.0578253 0.0000000 0.0000000 0.0000000 0.0000000 0.4535006 0.0000000 0.0000000 0.0000000 0.0000000 1.2432108 0.0000000 0.0000000 0.0000000 0.0000000 1.4960529 XXT =                   1.25883 0.83545 0.07405 0.23578 0.21892 0.36628 -0.83545 1.29838 0.03984 0.09975 0.66628 0.06336 0.07405 0.03984 0.02512 0.00570 0.03691 0.03364 -0.23578 0.09975 0.00570 0.15852 0.30783 0.19228 -0.21892 0.66628 0.03691 0.30783 0.93961 0.21701 0.36628 0.06336 0.03364 0.19228 0.21701 0.31229

Dari persamaan XTX = ULUT, diperoleh matrix U yang merupakan matriks vektor ciri dari XXT;

U =                   0.388517 0.198051 0.506076 0.617857 0.483383 0.066051 0.235133 0.735647 0.355789 0.325302 0.027685 0.027975 0.565478 0.276186 0.302703 0.007953 0.322151 0.340303 0.707546 0.251616 0.255465 0.811484 0.309165 0.113663

(10)

-Pendekatan rank-1 yang dinyatakan dengan variabel X1 memberikan pendekatan terbaik untuk X dimana X1 = ë1 u1 z1

T

. Kolom pertama dari U yaitu u1 dan kolom pertama dari Z yaitu z1 serta nilai singular pertama ë1 = 1.4960529 memberikan nilai X1 sebagai berikut; X1 = (1.490529)                       0.617857 0.735647 0.027975 0.007953 0.251616 0.113663

-(

-0.595070-0.336091 0.382671 0.621689

)

X1 =                   0.572534 0.352415 0.309518 0.548020 -0.681684 0.419600 0.368525 0.652496 0.025923 0.015956 0.014014 0.024813 0.007370 0.004536 0.003984 0.007054 -0.233159 0.143517 0.126048 0.223176 -0.105325 0.064831 0.056940 0.100816

Kecocokan terbaik dari X1 terhadap X diukur dengan ë1 2

/ Σëi 2

= (1,49053)2/4 = 2,238/4 = 0,56; atau jumlah kuadrat dari perbedaan diantara unsur-unsur X dengan X1. Berarti terdapat 44% selisih

kecocokan dari total jumlah kuadrat unsur-unsur dalam X. Hal ini bukanlah merupakan pendekatan yang baik.

Pendekatan rank-2 dari X diperoleh dengan menambahkan matriks X1 dengan matriks X2 = ë2u2 z2T

(11)

X2 = (1.2432108)                   0.506076 0.235133 0.027685 0.302703 0.707546 0.309165

-(

-0.336091 0.540861 -0.768597 -0.061411

)

X2 =                   0.038637 0.483570 0.340288 0.211455 -0.017952 0.224676 0.158104 0.098246 -0.002114 0.026454 0.018616 0.011568 0.023110 0.289241 0.203539 0.126479 -0.054019 0.676080 0.475757 0.295635 0.023604 0.295416 0.207884 0.129179 X1 + X2 =                   0.533897 0.131155 0.030770 0.759475 -0.699636 0.644276 0.526629 0.554250 0.023809 0.010497 0.004601 0.036381 0.015741 0.284705 0.199555 0.133533 -0.287178 0.819597 0.601805 0.072460 0.081722 0.230584 0.150944 0.229995

Pendekatan X dengan matriks rank-2 yang dinyatakan dengan matriks X1+X2 adalah (ë12+ë22)/

Σëi2 = ((1,4905)2+ (1,2432))2/4 = 0,948 = 0,95. Berarti terdapat selisih kecocokan sebesar 5% diantara X dengan (X1 + X2). Hal ini sudah merupakan pendekatan yang baik.

Jadi Jumlah kuadrat dari semua unsur dalam X adalah Σëi2. Jumlah kuadrat dari semua unsur dalam (X1 + X2) adalah (ë12 + ë22), dan jumlah kuadrat dari semua unsur dalam {X-(X1+X2)} adalah (ë32 + ë42). Jumlah kuadrat dari masing-masing prinsipal

(12)

komponen (akar ciri) pertama adalah ë12 =2,2407, dan jumlah kuadrat untuk prinsipal komponen kedua, ketiga dan keempat masing-masing ë22 = 1,5498, ë32 =0,2062, ë42 = 0.0034 (gambar-1). Keseluruhan nilai akar ciri berjumlah 4.

Dengan cara yang sama diperoleh nilai proporsi berturut-turut untuk ëi2 adalah 0,56; 0,387; 0,052 dan 0,001 dan nilai kumulatifnya adalah 0,56; 0,947; 0,999 dan 1,000 (tabel-1). Walaupun untuk pendekatan matriks rank-3 akan memperoleh kecocokan yang lebih baik, tetapi untuk pendekatan rank-2 sudah cukup baik.

Selanjutnya setelah tahap pertama dengan dekomposisi melalui nilai singular maka dilakukan analisis prinsipal komponen. Vektor prinsipal komponen diperoleh dengan persamaan;

W = UL1/2 atau

W = XZ.

Diperoleh matriks W sebagai berikut;

W =                   − − − − − − − − − − − − − 02246 . 0 08982 . 0 62916 . 0 92435 . 0 02795 . 0 02995 . 0 29232 . 0 10057 . 1 02057 . 0 14752 . 0 03442 . 0 04185 . 0 03270 . 0 12525 . 0 37632 . 0 01190 . 0 01863 . 0 15433 . 0 87963 . 0 37643 . 0 01477 . 0 36801 . 0 38436 . 0 17005 . 0

(13)

Secara geometri , nilai kecocokan terbaik 0,95 yang diperoleh memberi arti bahwa 95% penyebaran titik dalam empat dimensi secara kenyataan hanya mengandung dua dimensi atau titik-titik dalam empat dimensi dapat didekati pada suatu bidang. Berarti hanya 5% penyebaran yang hilang jika dimensi ketiga dan keempat diabaikan dan mudah interpertasinya dalam plot data.

Setiap vektor data dalam X merupakan suatu vektor dalam ruang dimensi-6 dan empat vektor yang didefinisikan sebagai sub-ruang dimensi-4. Vektor-vektor ini tidak ortogonal. Empat vektor dalam W, yang merupakan vektor prinsipal komponen adalah fungsi linier dari vektor-vektor aslinya dan mereka berada dalam ruang vektor dimensi-4. Vektor-vektor prinsipal komponen adalah ortogonal dan didefinisikan demikian sehingga vektor prinsipal komponen mempunyai kemungkinan terbesar.

Arah sumbu prinsipal komponen pertama merupakan sumbu utama dengan absis nilai unsur w1 yang berpasangan dengan nilai unsur w2 sebagai sumbu kedua atau ordinat yang keseluruhannya membentuk elipsoida (gambar-2).

Variabilitas diantara enam lokasi dalam rata-rata temperatur minimum, rata-rata temperatur maksimum, total hujan turun dan total tingkat pertumbuhan dapat disederhanakan dengan hanya memandang dua dimensi (atau variabel) yang didefinisikan oleh prinsipal komponen pertama dan prinsipal komponen kedua (gambar-2). Komponen prinsipal pertama terutama merefleksikan rata-rata temperatur. Komponen prinsipal kedua merupakan suatu ukuran dari total hujan turun dikurangi sebaran diantara temperatur maksimum dan minimum.

(14)

Akar ciri 2,2407 1,5498 0,2062 0,0034 Proporsi 0,56 0,387 0,052 0,001 Nilai Kumulatif 0,56 0,948 0,999 1,000

Tabel-1 : Analisis Ciri Matrik Korelasi

Nomer Komponen

Gambar-1 : Nilai akar ciri untuk masing-masing komponen

0 1.0 0.5 x Lokasi-6 x Lokasi-5 x x Lokasi-3 1 2 3 4 0 1 2 Akar ciri Prinsipal komponen-2 W2

(15)

Gambar-2 : Dua prinsipal komponen yang pertama dari data rata-rata temperatur minimum, rata-rata temperatur maksimum, total hujan turun dan tingkat pertumbuhan per hari untuk enam lokasi.

Kesimpulan

1. Pengamatan dengan banyak variabel bebas yang berkoresponden, dapat disederhanakan struktur ketergantungannya dalam dimensi-2 menggunakan tehnik prinsipal komponen berdasarkan taksiran kuadrat terkecil pada bidang.

0.5 -1.0 - 0.5 -1.0 -0.5 0 1.0 Prinsipal komponen-1 x Lokasi-2 x Lokasi-1 W1

(16)

2. Pembentukan matriks akar ciri dan vektor ciri sangat diperlukan dalam tehnik prinsipal komponen untuk membentuk dekomposisi data pengamatan yang serupa.

3. Single value decomposition digunakan sebagai tahap pertama dalam tehnik prinsipal komponen.

Daftar Pustaka

1. Graybill, Franklin A., “Introduction to Matrices with Applications in Statistics”, Wadsworth Publishing Company, Inc., Belmont, California (1969)

2. Morisson, Donald F., “Multivariate Statistical Methods”, McGraw-Hill Int. Book Company, Tokyo, Japan (1981)

3. Rawlings, John O., “Applied Regression Analysis: A Research Tool”, Wadsworth & Brooks/Cole Advanced Books & Software, Pacific Grove, California (1988)

Referensi

Dokumen terkait

Hasil pengkajian menunjukkan : (a) Tampilan komponen hasil jagung pada introduksi teknologi relatif lebih baik dari pada pola petani, (b) Introduksi teknologi

Apoteker perlu melakukan penggalian informasi dari pengunjung apotek tentang siapa yang sakit, gejala yang dirasakan, riwayat penyakit dan pengobatan, dan sebagainya,

Prasarana Rumah Potong Hewan (RPH) yang telah dibangun oleh Pemerintah Daerah adalah untuk memudahkan pengawasan terhadap hewan yang akan dipotong, begitu pula pengawasan

Hanya sebagian kecil dari udara ini, kira-kira 1/10-nya atau 500 ml adalah udara pasang surut (tidal air ), yaitu yang dihirup masuk dan diembuskan keluar pada pernafasan

Penggunaan metode yang paling banyak adalah: metode ceramah, terjemah, dan hafalan, sedangkan untuk metode tanya jawab dan diskusi jarang digunakan. Salah satu penyebabnya adalah

Tujuan dalam penelitian ini adalah untuk mengembangkan modul kimia berbasis inkuiri terbimbing melalui model desain sistem pembelajaran ADDIE (Analysis, Design,

Bulk Grains Bulk Soft Meals Bulk Animal Protein Meals Liquids – Fats, Oils, Molasses Bagged Animal Protein Meals Bagged Macro Ingredients Bulk Minerals Bagged Macro

Untuk memperoleh bahan tanaman yang dapat menunjang hasil produksi kelak, perlu dilakukan pengamatan dan perlakuan yang lebih baik pada tahap main nursery karena pada tahap