Analisis faktor yang mempengaruhi seseor

(1)

BAB I

PENDAHULUAN

1.1 LATAR BELAKANG

Tujuan analisis diskriminan adalah menguji ada-tidaknya hubungan sebab-akibat dari sebuah fenomena. Ciri khusus analisis diskriminan adalah keharusan variabel dependen bertipe kategori, sedangkan variabel independen bertipe rasio.

Kegunaan utama analisis diskriminan adalah kemampuan memprediksi terjadinya variabel dependen dengan masukan data variabel independen, dan kemampuan memilih mana variabel yang secara nyata mempengaruhi dependen dan mana yang tidak.

Berdasarkan kegunaan tersebut, maka penulis ingin menguji sebuah kasus yaitu tentang analisis faktor yang mempengaruhi seseorang memilih bekerja atau kuliah. Dimana variabel dependennya bertipe kategori, yaitu bekerja dan kuliah. Sedangkan umur responden, biaya kuliah, pendapatan orang tua, jumlah saudara, nilai SMA dan IQ adalah variabel independen, karena faktor inilah yang menjadi sebab responden memilih bekerja atau kuliah. Dengan demikan akan diuji apakah ada hubungan kausalitas antara sikap responden secara umum dengan atribut-atribut yang ada.

1.2 RUMUSAN MASALAH

1. Apakah memang ada perbedaan yang jelas antara perilaku responden, sehingga mereka yang memilih bekerja dibedakan jelas dengan mereka yang memilih kuliah.

2. Jika memang ada perbedaan diantara kedua kelompok responden tersebut, faktor mana yang perbedaannya memang nyata dan faktor mana yang sesungguhnya tidak secara jelas berbeda?

1.3 TUJUAN

(2)

BAB II

Missing No. of Extremesa

Count Percent Low High

Umur 41 19.0000 1.18322 9 18.0 0 0

BiayaKuliah 45 7.0178E2 127.40931 5 10.0 0 0

PendapatanOrangTua 44 9.3409E2 176.45499 6 12.0 0 0

JumlahSaudara 43 3.0698 .91014 7 14.0 0 0

NilaiSMA 46 81.0000 4.03320 4 8.0 0 0

IQ 44 1.1948E2 9.02577 6 12.0 0 0

Status 50 0 .0

a. Number of cases outside the range (Q1 - 1.5*IQR, Q3 + 1.5*IQR).

Pada tabel diatas, kolom N menunjukkan jumlah data yang terisi dan kolom missing pada count menunjukkan jumlah data yang hilang dalam jumlah nyata, sementara oercent untuk menghitung persentase dari data yang ada di bagian count. Pada variabel umur data yang terisi adalah 41, dan data yang hilang adalah 9 atau sebanyak 18%. Pada variabel biaya kuliah data yang terisi adalah 45, dan data yang hilang sebanyak 5 data atau sebanyak 10%. Dan begitu seterusnya.

(3)

Summary of Estimated Means

Umur BiayaKulia h

Pendapata nOrangTua

JumlahSau

dara NilaiSMA IQ

Listwise 18.7692 7.6308E2 9.3462E2 2.8462 83.1538 1.2438E2

All Values 19.0000 7.0178E2 9.3409E2 3.0698 81.0000 1.1948E2

EM 19.0278 7.0292E2 9.3246E2 3.0715 80.9106 1.1895E2

Jika digunakan metode LISTWISE, maka rata-rata umur menjadi 18,76 tahun, jumlah saudara menjadi 2,84, nilai SMA menjadi 83,15 dan begitu seterusnya.

Jika digunakan ALL VALUE, maka nilai rata-rata umur menjadi 19,00, jumlah saudara 3,06, nilai SMA menjadi 81,00.

(4)

Status

Total Bekerja Kuliah

Umur Present Count 41 20 21

Percent 82.0 80.0 84.0

Missing % SysMis 18.0 20.0 16.0

BiayaKuliah Present Count 45 23 22

Percent 90.0 92.0 88.0

PendapatanOtangTua Present Count 44 21 23

Percent 88.0 84.0 92.0

JumlahSaudara Present Count 43 20 23

Percent 86.0 80.0 92.0

NilaiSMA Present Count 46 24 22

Percent 92.0 96.0 88.0

IQ Present Count 44 21 23

Percent 88.0 84.0 92.0

Indicator variables with less than 5% missing are not displayed.

(5)

Missing Patterns (cases with missing values)

Case

# Missing % Missing

Missing and Extreme Value Patternsa

(6)

Tabel diatas menggambarkan penyebaran data yang hilang hanya untuk responden yang datanya tidak lengkapdan bukan seluruh responden. Responden yang bernama Ani mempunyai satu missing value data pada variabel IQ, karena missing ada pada 1 dari 7 variabel, maka persentase missing adalah 14,3%.

Responden yang bernama Bima, mempunyai satu missing value data pada variabel nilai SMA, karena missing ada pada 1 dari 7 variabel, maka persentase missing adalah

a. Variables are sorted on missing patterns.

b. Number of complete cases if variables missing in that pattern (marked with X) are not used.

Tabel diatas menunjukkan sisi lain dari penyebaran missing value,dimana missing value dinyatakan per variabel. Pada baris pertama, angka 13 menyatakan ada 13 data yang valid, artinya tidak terdapat missing value pada semua variabelnya.

Angka 6 pada baris kedua menunjukkan adanya 5 data yang missing pada variabel IQ. Jika dilihat pada tabel sebelumnya, maka responden yang mempunyai data missing pada variabel IQ adalah Ani, Rian, Gian, Bowo, Ayu, Andika.

Angka 4 menunjukkan adanya 4 data yang missing pada variabel Nilai SMA. Maka responden yang mempunyai missing pada variabel nilai SMA adalah Bima, Devi, Qori, Herlan. Dan seterusnya untuk baris berikutnya.

(7)

Listwise Correlations

Umur BiayaKulia h

Pendapata nOtangTua

JumlahSau

dara NilaiSMA IQ

Umur 1

BiayaKuliah .520 1

PendapatanOrangTua -.172 .101 1

JumlahSaudara -.190 -.243 -.139 1

NilaiSMA -.031 -.317 .103 .044 1

IQ .139 -.261 -.145 .181 .628 1

Tabel diatas menunjukkan korelasi antar-variabel untuk 13 data. Angka 0,520 pada tabel diatas menyatakan besar korelasi antara variabel umur dan biaya kuliah. Angka 0,101 menunjukkan korelasi antar variabel pendapatan orang tua dengan biaya kuliah. Dan demikian seterusnya untuk korelasi variabel yang lain.

(8)

Pairwise Frequencies

JumlahSaudara 34 38 37 43

NilaiSMA 37 41 40 39 46

IQ 35 39 38 37 40 44

Status 41 45 44 43 46 44 50

Metode pairwise akan memasangkan (pair) variabel yang mempunyai data lengkap, dan tidak menghilangkan sebuah baris begitu saja. Dengan demikian jumlah data bisa berbeda-beda tergantung kelengkapan data dua variabel yang dipasangkan.

Jika yang dipasangkan variabel umur dan biaya kuliah, maka akan ada 36 data yang valid. Namun jika yang dipasangkan variabel biaya kuliah dengan IQ maka akan ada 39 data yang valid. Demikian seterusnya untuk kombinasi variabel lainnya.

Pairwise Correlations

JumlahSaudara -.063 -.107 -.038 1

NilaiSMA -.076 -.017 .112 .008 1

IQ .025 .154 .003 .148 .563 1

(9)

EM Correlationsa

JumlahSaudara .015 -.088 -.054 1

NilaiSMA -.076 -.031 .045 .014 1

IQ .012 .156 -.044 .144 .551 1

a. Little's MCAR test: Chi-Square = 24,899, DF = 30, Sig. = ,730

Pada tabel hanya ada 1 data yang diatas 0,5 yaitu 0,551 artinya pola penyebarab missing value adalah random. Terlihat angka MCAR yang ditampilkan adalah 0,730, maka missing value adalah acak karena besar dari 0,05.

Kesimpulan : missing value yang terjadi adalah bersifatacak. Karena bersifat acak dan tidak memiliki pola tertentu, maka bisa dilakukan perlakuan lanjutan.

2. Mengisi Missing Value

Result Variables

1 Umur_1 9 1 50 50 SMEAN(Umur)

2

BiayaKuliah_1 5 1 50 50SMEAN(BiayaKu

liah)

NilaiSMA_1 4 1 50 50SMEAN(NilaiSM

A)

(10)

Dari tabel result variables diatas terlihat ada 9 data untuk variabel umur yang diganti, 5 variabel biaya kuliah, 6 variabel pendapatan orang tua, 7 variabel jumlah saudara, 4 variabel nilai SMA san 6 vriabel IQ.

3. Uji Data Outlier a. Standarisasi Data

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation

SMEAN(Umur) 50 17.00 21.00 19.0000 1.06904

SMEAN(BiayaKuliah) 50 500.00 980.00 7.0178E2 120.73396

SMEAN(PendapatanOtangT

ua) 50 600.00 1200.00 9.3409E2 165.29896

SMEAN(JumlahSaudara) 50 1.00 5.00 3.0698 .84262

SMEAN(NilaiSMA) 50 75.00 90.00 81.0000 3.86507

SMEAN(IQ) 50 105.00 135.00 1.1948E2 8.45514

Valid N (listwise) 50

Dari tabel diatas dapat dilihat bahwa rata-rata umur responden adalah 19,00 tahun dengan standar deviasi 1,06 tahun. Rata-rata jumlah saudara responden adalah 3,06 orang dengan standar deviasi 0,84. Dan begitu seterusnya.

b. Box Plot Umur

(11)

Biaya Kuliah

Terlihat tidak ada satu pun data biaya kuliah yang ada di luar BoxPlot. Dengan demikian Dengan demikian, bisa dikatakan tidak ada data outlier ataupun ekstrem pada variabel ini.

(12)

Terlihat sebaran data dari variabel IQ bergerombol di sekitar garis uji yang mengarah ke kanan atas, dan tidak ada data yang terletak jauh dari sebaran data. Dengan demikian, data tersebut bisa dikatakan normal.

5. Uji Homokedastisitas Data

Test of Homogeneity of Variance

Levene Statistic df1 df2 Sig.

SMEAN(BiayaKuliah) Based on Mean .859 1 48 .359

Based on Median .959 1 48 .332

Based on Median and with

adjusted df .959 1 47.764 .332

Based on trimmed mean .861 1 48 .358

SMEAN(NilaiSMA) Based on Mean 1.683 1 48 .201

Based on Median .133 1 48 .717

Based on Median and with

adjusted df .133 1 40.406 .717

(13)

Pada baris Biaya Kuliah dari tabel output diatas, dan dengan dasar Mean, didapat angka SIG adalah 0,359. Karena angka SIG > 0,05, maka Ho diterima. Hal ini berarti varians dari data biaya kuliah responden yang memilih bekerja relatif sama dengan data biaya kuliah responden yang memilih kuliah. Sehingga bisa disimpulkan telah terjadi homoskedastisitas variabel biaya kuliah dengan dasar grup status.

Pada baris nilai SMA, dan dengan dasar Mean didapat angka SIG adalah 0,201 maka Ho diterima. Hal ini berarti varians dari data nilai SMA responden yang memilih bekerja relatif sama dengan data nilai SMA responden yang memilih kuliah. Sehingga terjadi homoskedastisitas variabel nilai SMA dengan dasar grup Status.

6. Uji Linearitas Data

(14)

(15)

ANALISIS DISKRIMINAN

1. Menilai Variabel Yang Layak Untuk Analisis

Tests of Equality of Group Means

Wilks' Lambda F df1 df2 Sig.

SMEAN(Umur) .930 3.613 1 48 .063

SMEAN(BiayaKuliah) .994 .314 1 48 .578

ua) .834 9.542 1 48 .003

SMEAN(JumlahSaudara) .970 1.478 1 48 .230

SMEAN(NilaiSMA) .779 13.642 1 48 .001

SMEAN(IQ) .767 14.587 1 48 .000

a. Dengan angka Wilk’s Lambda

Angka Wilks’s Lambda berkisar 0 sampai1. Jika angka mendekati 0 maka data tiap grup cenderung berbeda, sedang jika angka mendekati 1, data tiap grup cenderung sama.

Dari tabel diatas terlihat angka Wilk’s Lambda berkisar antara 0,767 sampai0,994 (mendekati 1). Dari kolom Sig bisa dilihat bahwa hanya variabel biaya kuliah yang cenderung tidak berbeda. Hal ini berarti biaya kuliah untuk mereka yang bekerja atau kuliah ternyata tidak berbeda secara nyata. Hanya disini mendekati angka 1 dulit ditentukan secara pasti, karena hampir semua variabel diatas mempunyai angka Wilk’s Lambda yang besar, namun hanya satu variabel yang tidak lolos. Untuk itu dilakukan pengujian ANOVA

b. Dengan F test

 Variabel pendapatan orang tua, angka Sig nya dibawah 0,05 (0,003). Artinya ada perbedaan antar-grup atau responden yang memilih bekerja atau kuliah. Mungkin mereka yang pendapatan orang tuanya lebih tinggi akan memilih kuliah dibanding mereka yang orang tuanya berpendapatan lebih rendah. Atau mungkin sebaliknya.

 Variabel Nilai SMA, angka Sig nya 0,001. Artinya ada perbedaan antar grup. Mungkin mereka yang nilai SMAnya lebih tinggi akan memilih untuk kuliah daripada mereka yang nilai SMAnya lebih rendah. Atau sebaliknya.

(16)

 Variabel jumlah saudara, angka Signya adalah jauh diatas 0,05 yaitu 0,230. Artinya jumlah saudara seorang responden tidak memengaruhi seorang responden untuk memilih bekerja atau kuliah.

Dari enam variabel, ada tiga varibel yang berbeda secara signifikan untuk dua grup signifikan, yaitu pendapatan orang tua, nilai SMA dan IQ. Dengan demikian, seorang responden memilih bekerja atau kuliah dipengaruhi oleh pendapatan orang tua responden tersebut, nilai ketika di SMA, dan IQ yang dimiliki oleh responden tersebut.

Test Results

Tests null hypothesis of equal population covariance matrices.

Dari tabel terlihat bahwa angka Signya jauh diatas 0,05 yaitu 0,477, yang berarti group covariance matrices adalah sama. Hal ini berarti data diatas sudah memenuhi asumsi analisis diskriminan, sehingga proses bisa dilanjutkan.

Asumsinya adalah:

 Varians variabel bebas untuk tiap grup seharusnya sama. Jika demikian, seharusnya varians dari responden yang memilih bekerja sama dengan varians responden yang memilih kuliah.

 Varians diantara variabel-variabel bebas seharusnya juga sama. Jika denikian, seharusnya varians dari umur sama dengan varians dari biaya kuliah, sama dengan variabel biaya kuliah, pendapatan orang tua dan sebagainya.

Log Determinants

Status Rank Log Determinant

Bekerja 6 25.049

Kuliah 6 24.532

Pooled within-groups 6 25.289

(17)

Terlihat angka Log determinant untuk kategori bekerja 25,049 dan kuliah (24,532) tidak berbeda banyak, sehingga group covariance matrices akan relatif sama untuk kedua grup.

ua) 8.6745E2 125.94122 25 25.000

SMEAN(NilaiSMA) 79.2000 3.24037 25 25.000

SMEAN(IQ) 1.1544E2 7.79536 25 25.000

Kuliah SMEAN(PendapatanOtangT

ua) 1.0007E3 175.13980 25 25.000

SMEAN(NilaiSMA) 82.8000 3.64005 25 25.000

SMEAN(IQ) 1.2352E2 7.15340 25 25.000

Total SMEAN(PendapatanOtangT

ua) 9.3409E2 165.29896 50 50.000

SMEAN(NilaiSMA) 81.0000 3.86507 50 50.000

SMEAN(IQ) 1.1948E2 8.45514 50 50.000

Tabel Group Statistics pada dasarnya berisi data statistik (deskriptif) yang utama, yakni rata-rata dan standar deviasi, dari kedua grup responden.

Responden yang memilih bekerja, rata-rata nilai SMA nya adalah 79,20 sedangkan responden yang memilih kuliah rata-rata nilai SMA nya adalah 82, 80. Sedangkan responden yang memilih bekerja, rata-rata pendapatan orang tuanya adalah 867,550 dan responden yang memilih kuliah, rata-rata pendapatan orangtuanya adalah 1,000,000. Dan responden yang memilih bekerja juga rata-rata memiliki IQ sekitar 115,44 sedangkan responden yang memilih kuliah, rata-rata memiliki IQ sekitar 123,52.

(18)

Variables Entered/Removeda,b,c,d

Kuliah 14.587 1 48.000 .000

2 SMEAN(Pe ndapatanO tangTua)

2.552Bekerja and

Kuliah 15.617 2 47.000 6.302E-6

At each step, the variable that maximizes the Mahalanobis distance between the two closest groups is entered.

a. Maximum number of steps is 6.

b. Maximum significance of F to enter is .05.

c. Minimum significance of F to remove is .10.

d. F level, tolerance, or VIN insufficient for further computation.

Tabel ini menyajikan variabel mana saja dari enam variabel input yang bisa dimasukkan dalam persamaan diskriminan. Karena proses adalah stepwise (beratahap) maka akan dimulai dengan variabel yang mempunyai angka F hitung (statistik) terbesar.

Tahap pemasukan variabel bebas :

 Pada tahap pertama, angka F hitung variabel IQ adalah 14,587, maka pada tahap

pertama ini variabel IQ terpilih.

 Pada tahap kedua, angka F hitung mencapai 15,617, maka pada tahap kedua ini variabel Pendapatan orang tua terpilih.

Kedua variabel tersebut memiliki 2 variabel yang tentunya mempunyai Sig dibawah 0,05, seperti variabel IQ Signya 0,000 dan variabel pendapatan mempunyai Sig jauh dibawah 0,05 yaitu 6,301E-6 atau 0,000006301.

(19)

Variables in the Analysis

Step Tolerance

Sig. of F to

Remove Min. D Squared Between Groups

1 SMEAN(IQ) 1.000 .000

2 SMEAN(IQ)

.939 .000 .763Bekerja and Kuliah

ua) .939 .001 1.167

Bekerja and Kuliah

Pada step 1, variabel IQ adalah variabel pertama yang dimasukkan kedalam model diskriminan. Hal ini disebabkan variabel tersebut mempunyai angka Sig. Of F to Remove yang paling sedikit yaitu 0,000 (jauh di bawah 0,05).

Kemudian pada step 2, dimasukkan variabel kedua yakni, variabel pendapatan orang tua. Variabel tersebut memenuhi syarat, karena mempunyai angka Sig. Of F to Remove dibawah 0,05 yakni 0,001.

Variables Not in the Analysis

Step Tolerance Min. Tolerance Sig. of F to Enter Min. D Squared Between Groups

0 SMEAN(IQ)

1.000 1.000 .000 1.167Bekerja and Kuliah

SMEAN(NilaiSMA)

1.000 1.000 .001 1.091Bekerja and Kuliah

SMEAN(PendapatanOtangTu

a) 1.000 1.000 .003 .763

Bekerja and Kuliah

1 SMEAN(NilaiSMA)

.867 .867 .038 1.655Bekerja and Kuliah

.865 .826 .050 3.114Bekerja and Kuliah

(20)

Pada step 1, terlihat ada 2 variabel, dan variabel pendapatan orang tua dengan Sig of F to Remove adalah 0,001 sehingga variabel tersebut dikeluarkan. Sekarang hanya ada satu variabel yaitu variabel nilai SMA, dan variabel tersebut mempunyai Sig of F to Remove diatas 0,05 (yakni 0,826). Karena sudah tidak ada data variabel yang memenuhi syarat, maka proses pengeluaran variabel berhenti, dan variabel tersebut tidak bisa dikeluarkan, yang berarti variabel tersebut termasuk pada variable not in the analysis, atau variabel yang tidak dianalisis lebih lanjut.

Wilks' Lambda

Step

Number of

Variables Lambda df1 df2 df3

Exact F

Statistic df1 df2 Sig.

1 1 .767 1 1 48 14.587 1 48.000 .000

2 2 .601 2 1 48 15.617 2 47.000 .000

Wilks’s Lambda pada prinsipnya adalah varians total dalam diskriminant scores yang tidak bisa dijelaskan oleh perbedaan diantara grup-grup yang ada. Pada step 1, jumlah variabel yang dimasukkan ada satu (IQ), dengan angka Wilk’s Lambda adalah 0,767. Hal ini berarti 76,7% varans tidak dapat dijelaskan oleh perbedaan antar grup-grup. Kemudian pada step 2, dengan tambahan variabel pendapatan orang tua, angka Wilk’s Lambda turun menjadi 0,601 atau 60,1%. Penurunan angka Wilk’s Lambda tentu baik bagi model diskriminan, karena varians yang tidak bisa dijelaskan juga semakin kecil.

Dari kolom F dan Sig-nya, erlihat baik pada pemasukan variabel 1 dan 2, semuanya adalah signifikan secara statistik. Hal ini berarti kedua variabel tersebut (IQ dan pendapatan orang tua) memang berbeda untuk kedua pilihan responden.

Eigenvalues

Functio

n Eigenvalue % of Variance Cumulative %

Canonical Correlation

1 .665a _100.0 _100.0 _.632

a. First 1 canonical discriminant functions were used in the analysis.

(21)

Wilks' Lambda

Test of Functio

n(s) Wilks' Lambda Chi-square Df Sig.

1 .601 23.949 2 .000

Tabel diatas menyatakanangka akhir dari Wilk’s Lambda, yang sebenarnya sama saja dengan angka terakhir dari step 2 pembuatan model diskriminan. Angka Chi-Square sebesar 23,949 dengan signifikan yang tinggi menunjukkan perbedaan yang jelas antara dua grup responden.

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions

Variables ordered by absolute size of correlation within function.

a. This variable not used in the analysis.

Tabel Structure Matrix menjelaskan korelasi antara variabel independen dengan fungsi diskriminan yang terbentuk terlihat variabel IQ paling erat hubungannya dengan fungsi diskriminan, diikuti oleh variabel pendapatan orang tua dan nilai SMA.

Prior Probabilities for Groups

Status Prior

Cases Used in Analysis

Unweighted Weighted

(22)

(23)

BAB III

PENUTUP

3.1 KESIMPULAN

Dari proses uji data sampai analisis output, dapat disimpulkan bahwa ada perbedaan yang signifikan antara responden yang memilih bekerja dan responden yang memilih kuliah. Hal ini dibuktikan pada analisis Wilk’s Lambda, dimana variabel yang terlihat berbeda adalah variabel IQ dan pendapatan orang tua.

Variabel yang membuat perilaku seseorang yang memilih bekerja atau kuliah berbeda adalah variabel Iqdan pendapatan orang tua. Hal ini terlihat pada step analisis awal, baik bagian Variable In Analysis maupun Variable Not In Analysis.

Jadi, IQ dan pendapatan orang tua mempengaruhi perilaku responden untuk memilih bekerja atau kuliah. Atau mereka yang memiliki IQ dan pendapatan orang tua diatas rata-rata akan memilih untuk kuliah, dan sebaliknya mereka yang memiliki IQ dan pendapatan orang tua yang lebih rendah memilih untuk bekerja.

3.2 SARAN

(24)