• Tidak ada hasil yang ditemukan

Jumlah muatan setiap pembolehubah dalam komponen

KERANGKA KONSEP DAN METODOLOGI KAJIAN

4.3 Prosedur pemilihan pembolehubah

4.3.3 Jumlah muatan setiap pembolehubah dalam komponen

Selain daripada menunjukkan nilai eigen bagi setiap komponen, perisian SPSS juga mempunyai keupayaan untuk memaparkan nilai muatan setiap pembolehubah secara berasingan. Pembolehubah-pembolehubah yang dimasukkan dalam komponen-komponen awal menurut Vickers (2006) adalah merupakan pembolehubah yang penting. Pembolehubah-pembolehubah ini memiliki jumlah varian yang besar dan mempunyai pengaruh yang kuat dalam pembentukan sistem pengkelasan. Manakala pembolehubah-pembolehubah dalam komponen yang lain pula tidak memainkan peranan yang penting dalam pembangunan sistem pengkelasan kerana mempunyai jumlah varian yang kecil. Pembolehubah-pembolehubah ini perlu dikeluarkan daripada analisis kerana ia tidak memberi sumbangan yang besar terhadap keseluruhan sistem pengkelasan.

118

Lampiran B menunjukkan senarai 40 komponen yang dihasilkan dengan menggunakan analisis PCA dalam perisian SPSS. Berdasarkan kepada jadual yang ditunjukkan dalam lampiran tersebut, dapat disimpulkan di sini bahawa komponen 1 merupakan komponen yang paling penting kerana mempunyai jumlah varian terbesar berbanding dengan komponen-komponen yang lain. Antara pembolehubah-pembolehubah penting yang termasuk dalam komponen ini ialah pembolehubah v101, v131, v138 dan v140 yang masing-masing mempunyai jumlah muatan sebanyak 0.96. Nilai muatan yang tinggi ini menunjukkan bahawa korelasi antara pembolehubah-pembolehubah tersebut dengan komponen 1 adalah tinggi, nilai muatan 0.96 ini mewakili sejumlah 92% ((0.962) x 100) varian pembolehubah v101, v131, v138 dan v140 ditunjukkan dalam komponen tersebut. Ini menunjukkan bahawa pembolehubah-pembolehubah ini mempunyai pengaruh yang kuat dalam komponen satu dan seterusnya memberi kesan yang kuat terhadap penghasilan kluster dalam proses pembangunan sistem pengkelasan.

Nilai muatan tertinggi dalam komponen dua pula adalah 0.90, yang masing-masing ditunjukkan oleh pembolehubah v105, v106 dan v153. Jumlah varian yang ditunjukkan oleh pembolehubah-pembolehubah ini adalah sebanyak 81%. Walau bagaimanapun, jumlah varian yang diterangkan oleh pembolehubah-pembolehubah utama dalam komponen dua ini adalah jauh lebih rendah berbanding dengan jumlah varian pembolehubah utama komponen satu. Ini bersesuaian dengan pernyataan Vickers (2006) yang menjelaskan bahawa komponen-komponen awal yang dihasilkan dengan menggunakan analisis PCA adalah lebih penting berbanding dengan komponen-komponen seterusnya. Oleh itu, dapat disimpulkan di sini bahawa pembolehubah-pembolehubah yang terdapat dalam komponen awal juga adalah lebih berpengaruh jika dibandingkan dengan pembolehubah-pembolehubah dalam komponen yang berikutnya.

119 4.3.4 Analisis Pekali korelasi

Komponen-komponen yang diperolehi daripada analisis PCA dalam konteks kajian sistem pengkelasan ini, tidak akan digunakan secara langsung dalam analisis kluster. Ini kerana matlamat utama analisis PCA dilaksanakan adalah untuk mengenalpasti pembolehubah-pembolehubah yang mempunyai pengaruh yang lebih kuat dalam kumpulan data. Pembolehubah-pembolehubah dalam komponen pertama dengan nilai muatan yang lebih tinggi pula adalah lebih berpengaruh berbanding dengan pembolehubah-pembolehubah yang mempunyai nilai muatan lebih rendah.

Pembolehubah-pembolehubah dengan nilai muatan yang tinggi adalah lebih berpotensi untuk dipilih dan digunakan sebagai input dalam analisis kluster. Walau bagaimanapun, penentuan kekuatan pengaruh pembolehubah dengan mengggunakan analisis PCA sahaja tidak boleh menyelesaikan masalah ini, terutamanya apabila wujud hubungan berbagai (multicolinearity) antara pembolehubah.

Kewujudan masalah hubungan berbagai ini menurut Hair et al. (2009) mempunyai kesan yang besar terhadap keseluruhan sistem pengkelasan yang dibangunkan. Ini kerana pembolehubah yang berkorelasi mempunyai pemberat yang lebih kuat berbanding dengan pembolehubah yang tidak berkorelasi. Memasukkan pembolehubah yang berkorelasi akan menyebabkan kesukaran untuk mencari corak sebenar dalam kumpulan data kerana pembolehubah-pembolehubah ini mempengaruhi keseluruhan proses dalam analisis kluster. Pembolehubah yang berkorelasi juga menunjukkan bahawa lebih banyak maklumat dalam pembolehubah tersebut boleh diperolehi dengan menggunakan pembolehubah pasangannya.

120

Jadual 4.4: Senarai pasangan pembolehubah yang berkorelasi

No Pembolehubah No Pembolehubah

Nilai R

v131 Didiami v140 Elektrik 24 jam sehari 1.00

v138 Air paip yang dirawat v131 Didiami 1.00

v161 Kerja yang tidak jls keterangannya v179 Industri yang tidak jelas keterangannya 1.00

v001 Jumlah Penduduk v039 Warga Warganegara Malaysia 0.99

v030 Agama Islam v020 Etnik Bangsa Melayu 0.99

v003 Jantina Perempuan v026 Belum Pernah Berkahwin 0.97

v026 Belum Pernah Berkahwin v001 Jumlah Penduduk 0.97

v044 Warga Pekerja Asing v025 Etnik Bukan Warganegara 0.97

v022 Etnik Bangsa Cina v192 Etnik ketua isirumah Cina 0.96

v023 Etnik Bangsa India v193 Etnik ketua isirumah India 0.96

v056 Tiada Sijil v048 Sekolah Rendah 0.96

v097 Mesin Basuh v098 Peti Sejuk 0.96

v183 Pertalian Anak telah kahwin v184 Pertalian Menantu 0.96

v020 Etnik Bangsa Melayu v190 Etnik ketua isirumah Melayu 0.95

v027 Berkahwin v002 Jantina Lelaki 0.95

v039 Warga Warganegara Malaysia v027 Berkahwin 0.95

v105 Komputer Peribadi ( PC ) v106 Langganan Internet 0.95

v185 Pertalian Cucu v183 Pertalian Anak telah kahwin 0.95

v033 Agama Hindu v193 Etnik ketua isirumah India 0.94

v108 Tempat kediaman Sesebuah v145 Tandas Curah / Siram 0.94

v180 Pertalian Ketua IR v181 Pertalian Suami / isteri 0.94

v181 Pertalian Suami / isteri v182 Pertalian Anak belum kahwin 0.94

v057 Sijil PMR v049 Sekolah Menengah Rendah 0.93

v005 Penduduk berumur 05 - 09 tahun v182 Pertalian Anak belum kahwin 0.92 v006 Penduduk berumur 10 -14 tahun v182 Pertalian Anak belum kahwin 0.92

v058 Sijil SPM v050 Sekolah Menegah Atas 0.92

v128 Batu dan papan v145 Tandas Curah / Siram 0.92

v159 Operator & Pmsng Loji Mesin v165 Industri Pembuatan 0.92

v039 Warga Warganegara Malaysia V131 Didiami 0.91

v102 Video / VCD / DVD v103 Telefon Talian Tetap 0.91

v081 Jumlah Isirumah 5 orang v027 Berkahwin 0.90

v133 Milik Individu v131 Didiami 0.90

v048 Sekolah Rendah v049 Sekolah Menengah Rendah 0.89

v082 Jumlah Isirumah 6 orang v039 Warga Warganegara Malaysia 0.89

v024 Etnik Bangsa Lain v194 Etnik ketua isirumah Lain-lain 0.87

v046 Tidak Pernah Bersekolah v039 Warga Warganegara Malaysia 0.87

v091 2 Motokar v105 Komputer Peribadi ( PC ) 0.87

v093 1 Motosikal v131 Didiami 0.87

v080 Jumlah Isirumah 4 orang v138 Air paip yang dirawat 0.86

v090 1 Motokar v103 Telefon Talian Tetap 0.86

v104 Telefon Bimbit v105 Komputer Peribadi ( PC ) 0.86

v059 Sijil STPM v054 Sekolah Politek, Maktab, Kolej, Universiti 0.85

v096 Penghawa dingin v091 2 Motokar 0.84

v079 Jumlah Isirumah 3 orang v138 Air paip yang dirawat 0.83

v021 Etnik Bumiputera Lain v191 Etnik ketua isirumah Bumiputera lain 0.82

v083 Jumlah Isirumah 7 orang v082 Jumlah Isirumah 6 orang 0.81

v153 Kerja Profesional v105 Komputer Peribadi ( PC ) 0.81

v055 Sekolah Tidak Diketahui v076 Bidang Tidak Diketahui 0.80

v095 Basikal v048 Sekolah Rendah 0.80

v050 Sekolah Menegah Atas v138 Air paip yang dirawat 0.79

v070 Bdg S.Sosial, pniagaan & udg-udg v071 Bidang Sains 0.79

v099 Ketuhar Gelombang Mikro v106 Langganan Internet 0.79

v152 Ahli Majlis, Peg Kanan & Pengurus v091 2 Motokar 0.79

v126 Rumah batu v144 Tandas Tarik 0.78

v064 Sijil Ijazah atau Diploma Lanjutan v153 Kerja Profesional 0.77

v072 Bdg Kejuruteraan, Pbinaan & Kem. v153 Kerja Profesional 0.77

v084 Jumlah Isirumah 8 orang v048 Sekolah Rendah 0.77

v092 3+Motokar v091 2 Motokar 0.77

v168 Ind. Perniagaan Borong dan Runcit v022 Etnik Bangsa Cina 0.77

Sumber: Analisis SPSS

121

Jadual 4.4 menunjukkan senarai pasangan pembolehubah yang mempunyai hubungan korelasi antara pembolehubah yang mempunyai nilai pekali korelasi melebihi 0.7071 dengan pembolehubah v161, v140, v131, v138 dan v179 mempunyai hubungan korelasi tertinggi. Pembolehubah v161 (Kerja yang tidak jelas keterangannya) sebagai contoh mempunyai hubungan singulariti dengan pembolehubah v179 (industri yang tidak jelas keterangannya), pembolehubah v140 (Elektrik 24 jam sehari) dengan pembolehubah v131 (Didiami) dan pembolehubah v138 (Air paip yang dirawat) juga mempunyai hubungan singulariti dengan pembolehubah v131. Hubungan singulariti atau nilai R = 1.00 menunjukkan bahawa 100% daripada maklumat dalam pembolehubah yang berkorelasi boleh diperolehi dengan menggunakan pembolehubah yang berpasangan dengannya. Oleh itu, salah satu daripada pasangan pembolehubah ini perlu dibuang untuk mengelakkan pertindihan maklumat berlaku semasa proses pengklusteran dilaksanakan.

Dalam kes kajian di negeri Pulau Pinang, hubungan singulariti bagi pembolehubah rumah didiami dengan elektrik 24 jam sehari serta mempunyai bekalan air terawat bukan sesuatu yang luar biasa kerana keseluruhan kawasan di negeri ini mempunyai ketersampaian yang tinggi dan disediakan dengan kemudahan asas yang mencukupi.

Pembolehubah etnik bangsa Melayu pula berkorelasi dengan pembolehubah agama Islam, entik bangsa Cina dengan pembolehubah agama Buddha serta etnik bangsa India mempunyai hubungan yang kuat dengan agama Hindu. Begitu juga dengan pembolehubah v057 (Sijil PMR) dan v058 (Sijil SPM) yang masing-masing mempunyai hubungan berkorelasi dengan v049 (Sekolah menengah rendah) dan v050 (Sekolah menengah atas) yang menunjukkan bahawa pembolehubah-pembolehubah ini

122

mengulang maklumat yang sama. Oleh itu, dalam proses pemilihan pembolehubah ini salah satu daripada pasangan pembolehubah tersebut perlu digugurkan.

Selain daripada membuang salah satu daripada pasangan pembolehubah yang berkorelasi, kaedah penggabungan pembolehubah juga boleh digunakan untuk menyelesaikan masalah pengurangan pembolehubah. Sebagai contoh, sejumlah 16 pembolehubah umur dalam kumpulan data asal boleh digabungkan kepada beberapa unit pembolehubah yang lebih kecil dengan menggunakan analisis pekali korelasi.

Pembolehubah-pembolehubah ini diperolehi daripada soalan C6 dalam borang banci yang dikelaskan mengikut kesesuaian pengguna. Oleh itu, pengkelasan semula pembolehubah dengan menggabungkan pembolehubah umur yang berkorelasi boleh dilakukan bagi mencapai matlamat analisis perlombongan data untuk mendapatkan maklumat maksimum dengan menggunakan pembolehubah yang minimum.

Jadual 4.5: Matrik korelasi pembolehubah umur

00-04 1.00

123

Matrik korelasi pembolehubah umur seperti yang ditunjukkan dalam jadual 4.5, mengandungi sejumlah 15 pembolehubah yang mewakili struktur umur penduduk dalam kawasan kajian. Analisis korelasi yang dijalankan terhadap kesemua pembolehubah tersebut menunjukkan terdapat hubungan korelasi yang kuat antara satu dengan yang lain. Sebagai contoh, pembolehubah 004 (umur 00 hingga 04 tahun) mempunyai hubungan yang sangat kuat dengan pembolehubah 005 (umur 05 hingga 09 tahun). Manakala pembolehubah 006 (umur 10 hingga 14 tahun) juga mempunyai hubungan korelasi yang tinggi dengan pembolehubah 005. Ketiga-tiga pembolehubah ini digabungkan menjadi pembolehubah komposit bagi mewakili penduduk yang berumur 00 hingga 14 tahun.

Selain itu, pembolehubah v009, v010 dan v011 juga boleh digabungkan menjadi satu pembolehubah baru bagi mewakili umur penduduk antara 25 hingga 39 tahun kerana pembolehubah-varibel tersebut masing-masing mempunyai nilai R melebihi 0.82.

Pembolehubah-pembolehubah v012, v013, v014, v015 dan v016 yang masing-masing mewakili pecahan umur penduduk 40-44 tahun, 45-49 tahun, 50-54 tahun, 55-59 tahun dan 60-64 tahun pula digabungkan menjadi pembolehubah baru yang mewakili umur penduduk dari 40 hingga 64 tahun. Manakala pembolehubah v017, v018 dan v019 pula digabungkan menjadi pembolehubah komposit yang mewakili jumlah umur penduduk lebih daripada 65 tahun. Walau bagaimanapun, pembolehubah v007(umur 15-19 tahun) dan v008 (umur 20-24 tahun) dikekalkan kerana tidak berkorelasi dengan sebarang pembolehubah lain.

124 4.3.5 Analisis Sisihan Piawai

Terdapat berbagai kaedah statistik untuk mengukur sisihan data, antaranya termasuklah analisis berkadar, pekali variasi, percentile, interquatile range dan analisis sisihan piawai. Analisis sisihan piawai adalah merupakan analisis yang paling kerap digunakan untuk mengukur sisihan data. Nilai sisihan piawai diperolehi daripada pengiraan punca kuasa dua jumlah varian. Jumlah varian bagi setiap pembolehubah pula diperolehi dengan menggunakan rumus 4.1, di mana μ ialah nilai purata dan N adalah jumlah keseluruhan zon dalam kawasan kajian.

𝜎

2

=

∑(𝑥−𝜇)𝑁 2

Perbandingan nilai sisihan piawai bagi setiap pembolehubah menurut Vickers (2006) membolehkah penentuan pembolehubah dengan sisihan data yang besar dilakukan.

Pembolehubah yang mempunyai variabiliti tinggi menurut Vickers (2006) juga adalah lebih penting berbanding pembolehubah dengan variabiliti yang lebih kecil kerana proses pengklusteran bergantung sepenuhnya kepada data yang mempunyai perbezaan besar antara kawasan. Jadual 4.6 menunjukkan senarai 20 pembolehubah yang mempunyai nilai sisihan piawai terendah berbanding dengan pembolehubah-pembolehubah lain dalam kumpulan data yang sama. Pembolehubah-pembolehubah-pembolehubah ini tidak boleh dimasukkan dalam analisis kluster kerana sebahagian besar daripada pembolehubah tersebut tidak mempunyai sebarang nilai.

(4.1)

125

Jadual 4.6: Senarai pembolehubah dengan sisihan piawai yang kecil

No Pembolehubah Min S.D