DISCRIMINANT DISCRIMINANT
ANALYSIS ANALYSIS
STATISTIK LANJUT MAGISTER PROFESI
F.PSI.UI
Discriminant Analysis
Merupakan teknik parametrik yang digunakan untuk menentukan bobot dari prediktor yg paling baik untuk membedakan dua atau lebih kelompok kasus, yang tidak terjadi secara kebetulan (Cramer, 2004).
DA dipakai untuk menjawab pertanyaan bagaimana individu dapat dimasukkan ke dalam kelompok
berdasarkan beberapa variabel.
DA adalah metode untuk mencari dasar pengelompokan
individu berdasarkan lebih dari 1 IV.
Discriminant Analysis
Persamaan fungsi diskriminan yang dihasilkan untuk memberikan peramalan yang paling tepat
untuk mengklasifikasi individu ke dalam kelompok berdasarkan skor IV.
DA juga merupakan salah satu bentuk Multiple Regression Analysis, dimana DV berupa kategori
Jumlah fungsi diskriminan tergantung dari jumlah
prediktor (IV) atau jumlah kelompok dikurang 1
(yang paling kecil)
Tahap-tahap Perhitungan Analisis Diskriminan
1. Menghitung Nilai Rata-rata IV pada setiap kelompok (deskriptif).
2. Menghitung Nilai Uji-F untuk melihat perbedaan skor IV (prediktor) pada setiap kelompok.
3. Menghitung Nilai Homogenitas Kovarians Dalam Kelompok (dengan Box’s M).
4. Mencari Eigenvalue untuk setiap Discriminant
Function => rasio yg dpt dijelaskan dgn fungsi.
Tahap-tahap Perhitungan Analisis Diskriminan
5. Mencari Nilai Canonical Discriminant Function Coefficients utk setiap fungsi => utk mendptkan bobot dari setiap IV.
6. Mencari Nilai Signifikansi dari Discriminant Function (Wilks’ lambda) => sign. fungsi
7. Menentukan klasifikasi (persentase kasus yang
dapat diidentifikasi dengan benar)
Contoh
Contoh (dalam Cramer, 2004):
VB: skor anxious, restless, depressed, and hopeless
VT: kelompok pasien (normal, cemas, depresi) Analisis diskriminan pada penelitian ini dilakukan untuk melihat prediktor yang paling baik untuk
mengelompokkan pasien berdasarkan jenis gangguan
Pada penelitian ini ada 3 kelompok pasien sehingga
akan diperoleh dua fungsi diskriminan.
Output SPSS untuk Analisis Diskriminan
Group Statistics
2.20 1.30
2.40 .55
2.00 1.00
2.00 .71
4.00 .71
3.60 1.14
2.20 .84
2.60 .89
2.60 .89
2.60 1.14
4.20 .84
3.80 .84
2.93 1.22
2.87 1.06
2.80 1.32
2.80 1.08
ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS KELP
Normal
Cemas
Depresi
Total
Mean Std. Deviation Kesimpulan:
• Kelompok Pasien Normal memiliki skor yang paling rendah dalam semua VB
• Kelompok Pasien Cemas memiliki skor Anxious dan Restless yang paling tinggi
• Kelompok Pasien Depresi memiliki skor Depressed dan Hopeless yang paling tinggi
Tests of Equality of Group Means
.573 4.467 2 12 .035
.737 2.138 2 12 .161
.393 9.250 2 12 .004
.488 6.300 2 12 .013
ANXIOUS RESTLESS DEPRESSE HOPELESS
Wilks'
Lambda F df1 df2 Sig.
Kesimpulan:
Ada perbedaan Skor VB yang signifikan pada setiap kelompok pasien.
Test Results
37.535 .907 20 516.896 .578 Box's M
Approx.
df1 df2 Sig.
F
Tests null hypothesis of equal population covariance matrices.
Kesimpulan:
F tidak signifikan berarti kovarians dalam setiap kelompok adalah homogen, sehingga perhitungan selanjutnya dapat dilakukan (asumsi terpenuhi)
Box's Test of Equality of Covariance Matrices
Summary of Canonical Discriminant Functions
Eigenvalues
2.809a 77.4 77.4 .859
.820a 22.6 100.0 .671
Function 1
2
Eigenvalue % of Variance Cumulative %
Canonical Correlation
First 2 canonical discriminant functions were used in the analysis.
a.
Nilai Eigenvalue menunjukkan perbandingan varians antar kelompok
dengan varians dalam kelompok. Semakin besar nilai Eigenvalue berarti semakin besar fungsi diskriminan (pengaruh masing-masing VB).
Output di atas menunjukkan bahwa fungsi diskriminan pertama lebih besar daripada fungsi diskriminan kedua.
Selain itu, terlihat bahwa fungsi diskriminan pertama menjelaskan 77,4% dari total varians VB dan 22,6% utk fungsi kedua.
Wilks' Lambda
.144 20.330 8 .009
.549 6.289 3 .098
Test of Function(s) 1 through 2
2
Wilks'
Lambda Chi-square df Sig.
Output ini menunjukkan signifikansi dari fungsi diskriminan (yang dilihat dari nilai Wilks’ Lambda dan
χ
2)Pada output di atas, fungsi diskriminan pertama dan kedua (secara bersama) adalah signifikan. Namun jika hanya fungsi diskriminan kedua yang diperhitungkan (dengan menghilangkan fungsi
diskriminan pertama) maka fungsi kedua tidak signifikan.
Standardized Canonical Discriminant Function Coefficients
-,421 ,753 -,391 ,299
,646 ,101
,681 ,292
ANXIOUS RESTLESS DEPRESSE HOPELESS
1 2
Function Interpretasi:
Tabel pertama dan tabel kedua
menunjukkan bahwa depressed dan hopeless merupakan fungsi
diskriminan pertama, sedangkan
anxious dan restless merupakan fungsi diskriminan kedua.
Secara lebih khusus, tabel kedua menunjukkan korelasi antara setiap variabel dengan setiap fungsi
diskriminan. (menunjukkan variabel yg dpt menjadi diskriminan)
Structure Matrix
,719* ,330 ,538* ,537 -,234 ,849*
-,180 ,569*
DEPRESSE HOPELESS ANXIOUS RESTLESS
1 2
Function
Largest absolute correlation between each variable and any discriminant function
*.
Canonical Discriminant Function Coefficient
-,421 ,753 -,397 ,304
,723 ,113
,834 ,358
-1,986 -4,401 ANXIOUS
RESTLESS DEPRESSE HOPELESS (Constant)
1 2
Function
Unstandardized coefficients
Output ini digunakan untuk membuat persamaan fungsi diskriminan Fungsi diskriminan I = -1,986 + -0,421(anxious) + -0,397(restless) +
0,723(depressed) + 0,834(hopeless)
Fungsi diskriminan II = -4,401 + 0,753(anxious) + 0,304(restless) +
Interpretasi
Analisis diskriminan dilakukan untuk mengetahui
apakah dari 4 prediktor, yaitu feeling anxious, restless, depressed, dan hopeless, dapat menentukan apakah
individu akan didiagnosis normal, anxious, dan
depressed. Dari dua fungsi diskriminan yang diperoleh, fungsi pertama memberikan sumbangan sebesar 77%
terhadap varians DV, fungsi kedua menjelaskan 23%
terhadap varians DV.
Latihan:
Seorang peneliti ingin melihat apakah skor tes kemampuan verbal dan skor tes kemampuan numerik dapat
membedakan seorang mahasiswa memiliki IPK tinggi atau rendah.
Group Statistics
67.067 12.8745 12 12.000
65.917 13.7110 12 12.000
84.250 10.6355 12 12.000
82.333 11.3184 12 12.000
75.658 14.5051 24 24.000
74.125 14.8823 24 24.000
VERBAL NUMERIK VERBAL NUMERIK VERBAL NUMERIK IPK
Rendah Tinggi Total
Mean Std. Deviation Unweighted Weighted Valid N (listwise)
Kesimpulan:
Berdasarkan Nilai Wilks’ Lambda, Nilai F, dan Signifikansi : Ada perbedaan Skor Tes Kemampuan Verbal dan Skor Tes
Kemampuan Numerik yang signifikan antara kelompok dengan IPK Tinggi dan IPK Rendah
Tests of Equality of Group Means
.634 12.706 1 22 .002
.683 10.231 1 22 .004
VERBAL NUMERIK
Wilks'
Lambda F df1 df2 Sig.
Pooled Within-Groups Matrices a
139.433 -6.502 -6.502 158.049
1.000 -.044
-.044 1.000
VERBAL NUMERIK VERBAL NUMERIK Covariance
Correlation
VERBAL NUMERIK
The covariance matrix has 22 degrees of freedom.
a.
Kesimpulan:
• Berdasarkan Covarince: matriks kovarians antara variabel verbal dan numerik berbeda untuk masing-masing perbandingan
• Berdasarkan Correlation: tidak ada korelasi antara variabel verbal dan numerik (variabel bebas tidak saling berkorelasi)
Covariance Matricesa
165.753 15.292 15.292 187.992 113.114 -28.295 -28.295 128.106 210.397 67.371 67.371 221.484 VERBAL
NUMERIK VERBAL NUMERIK VERBAL NUMERIK IPK
Rendah Tinggi Total
VERBAL NUMERIK
The total covariance matrix has 23 degrees of freedom.
a.
Kesimpulan:
• Hasil analisis matriks kovarians menunjukkan bahwa nilai kovarians
cukup besar untuk masing- masing kelompok status dengan dua variabel
diskriminan.
• Hasil Box’s M
menunjukkan kovarians pada kedua kelompok adalah sama, sehingga memenuhi asumsi
kovarians dalam analisis diskriminan
Test Results
1.467 .441 3 87120.000 .724 Box's M
Approx.
df1 df2 Sig.
F
Tests null hypothesis of equal population covariance matrices.
Variables Entered/Removeda,b,c,d
VERBAL .634 1 1 22.000 12.706 1 22.000 .002
NUMERIK .478 2 1 22.000 11.446 2 21.000 .000
Step 1 2
Entered Statistic df1 df2 df3 Statistic df1 df2 Sig.
Exact F Wilks' Lambda
At each step, the variable that minimizes the overall Wilks' Lambda is entered.
Maximum number of steps is 4.
a.
Minimum partial F to enter is 3.84.
b.
Maximum partial F to remove is 2.71.
c.
F level, tolerance, or VIN insufficient for further computation.
d.
Kesimpulan:
• Hasil Analisis Diskriminan dengan Metode Stepwise, Nilai Statistik F dan Signifikansinya menunjukkan bahwa Skor Rata-rata Tes
Kemampuan Verbal maupun Skor Tes Kemampuan Numerik adalah berbeda pada kelompok IPK Tinggi dan kelompok IPK Rendah.
Variables in the Analysis
1.000 12.706
.998 8.959 .683
.998 6.823 .634
VERBAL VERBAL NUMERIK Step
1 2
Tolerance F to Remove
Wilks' Lambda
Variables Not in the Analysis
1.000 1.000 12.706 .634
1.000 1.000 10.231 .683
.998 .998 6.823 .478
VERBAL NUMERIK NUMERIK Step
0 1
Tolerance
Min.
Tolerance F to Enter
Wilks' Lambda
Wilks' Lambda
1 .634 1 1 22 12.706 1 22.000 1.733E-03
2 .478 2 1 22 11.446 2 21.000 4.348E-04
Step 1 2
Number of
Variables Lambda df1 df2 df3 Statistic df1 df2 Sig.
Exact F
Kesimpulan:
Dari Tabel Wilks’ Lambda terlihat bahwa skor tes kemampuan verbal dan skor tes kemampuan numerik pada kedua kelompok (IPK tinggi dan rendah) adalah berbeda secara signifikan.
Dari Tabel Eigenvalues dan Wilks’ Lambda Fungsi Diskriminan
Eigenvalues
1.090a 100.0 100.0 .722
Function 1
Eigenvalue % of Variance Cumulative %
Canonical Correlation
First 1 canonical discriminant functions were used in the analysis.
a.
Wilks' Lambda
.478 15.481 2 .000
Test of Function(s) 1
Wilks'
Lambda Chi-square df Sig.
Summary of Canonical Discriminant Functions