ANALISIS FUNGSI DISKRIMINAN | CONTOH ANALISIS DATA STATA Info versi: Kode untuk halaman ini diuji di Stata 12.
Analisis fungsi diskriminan linier (yaitu, analisis diskriminan) melakukan uji multivariat perbedaan antar kelompok. Selain itu, analisis diskriminan digunakan untuk menentukan jumlah minimum dimensi yang diperlukan untuk menggambarkan perbedaan-perbedaan ini. Perbedaan kadang-kadang dibuat antara analisis diskriminan deskriptif dan analisis diskriminan prediktif. Kami akan mengilustrasikan analisis diskriminan prediktif di halaman ini.
Harap dicatat: Tujuan halaman ini adalah untuk menunjukkan cara menggunakan berbagai perintah analisis data. Ini tidak mencakup semua aspek dari proses penelitian yang diharapkan dilakukan oleh para peneliti. Secara khusus, ini tidak mencakup pembersihan dan pemeriksaan data, verifikasi asumsi,
diagnostik model atau analisis tindak lanjut potensial.
Contoh analisis fungsi diskriminan
contoh 1. Sebuah maskapai penerbangan internasional besar telah mengumpulkan data tentang karyawan dalam tiga klasifikasi pekerjaan yang berbeda: 1) personel layanan pelanggan, 2) mekanik dan 3) dispatcher. Direktur Sumber Daya Manusia ingin tahu apakah ketiga klasifikasi pekerjaan ini menarik bagi tipe kepribadian yang berbeda. Setiap karyawan diberikan serangkaian tes psikologi yang mencakup ukuran minat dalam aktivitas di luar ruangan, kemampuan bersosialisasi dan konservatif.
contoh 2.
Ada Fisher (1936) contoh klasik analisis diskriminan yang melibatkan tiga varietas iris dan empat variabel prediktor (lebar kelopak, panjang kelopak, lebar sepal, dan panjang sepal). Fisher tidak hanya ingin menentukan apakah varietas berbeda secara signifikan pada empat variabel kontinu, tetapi ia juga tertarik untuk memprediksi klasifikasi varietas untuk tanaman individu yang tidak diketahui.
Deskripsi data
Mari kita bahas Contoh 1 dari atas.
Kami memiliki file data, discrim.dta, dengan 244 pengamatan pada empat variabel. Variabel psikologis adalah minat luar, sosial dan konservatif.
Variabel kategoris adalah jenis pekerjaan dengan tiga tingkatan; 1) layanan pelanggan, 2) mekanik dan 3) operator.
Mari kita lihat datanya. Itu selalu merupakan ide yang baik untuk memulai dengan statistik deskriptif.
Gunakan https://stats.idre.ucla.edu/stat/stata/dae/discrim, jelas meringkas konservatif sosial luar ruangan
Variabel | Obs berarti Std. Dev. Maks Min
---+--- Luar Ruangan | 244 15.63934 4.839933 0 28 Sosial | 244 20.67623 5.479262 7 35 Konservatif | 244 10.59016 3.726789 0 20
Tabstat Outdoor Sosial Konservatif, oleh (pekerjaan) stat (n berarti SD min max) col (stat)
Ringkasan untuk variabel: konservatif sosial luar ruangan Berdasarkan kategori: Pekerjaan
Pekerjaan | N berarti sd min maks
---+--- Layanan Pelanggan | 85 12.51765 4.648635 0 22 | 85 24.22353 4.335283 12 35 | 85 9.023529 3.143309 2 17 ---+--- mekanik | 93 18.53763 3.564801 11 28 | 93 21.13978 4.55066 9 29 | 93 10.13978 3.242354 0 17 ---+--- Pengiriman | 66 15.57576 4.110252 4 25 | 66 15.45455 3.766989 7 26 | 66 13.24242 3.69224 4 20 ---+--- Jumlah | 244 15.63934 4.839933 0 28 | 244 20.67623 5.479262 7 35 | 244 10.59016 3.726789 0 20 --- berkorelasi konservatif sosial luar ruangan
(obs = 244)
| conser sosial luar ruangan ~ e ---+--- Luar Ruangan | 1.0000
Sosial | -0.0713 1.0000
Konservatif | 0.0794 -0.2359 1.0000 tabulasi pekerjaan
Pekerjaan | Frek. persen cum.
---+--- Layanan Pelanggan | 85 34.84 34.84 mekanik | 93 38.11 72.95 Pengiriman | 66 27.05 100.00 ---+--- Jumlah | 244 100.00
Metode analisis yang mungkin Anda pertimbangkan
Di bawah ini adalah daftar beberapa metode analisis yang mungkin Anda temui.
Beberapa metode yang tercantum cukup masuk akal, sementara yang lain tidak disukai atau memiliki keterbatasan.
Analisis fungsi diskriminan – Fokus halaman ini. Prosedur ini multivariat dan juga memberikan informasi tentang dimensi individu.
Regresi logistik multinomial atau probit multinomial – Ini juga merupakan opsi yang layak.
MANOVA – Tes signifikansi sama dengan analisis fungsi diskriminan, tetapi MANOVA tidak memberikan informasi tentang dimensi individu. Namun,
variabel psikologis akan menjadi variabel dependen dan jenis pekerjaan variabel independen.
Anda dapat menganalisis data ini menggunakan ANOVA satu arah terpisah untuk setiap variabel psikologis. ANOVA terpisah tidak akan menghasilkan hasil multivarian dan tidak melaporkan informasi mengenai dimensi.
Sekali lagi, penunjukan variabel independen dan dependen dibalik seperti pada MANOVA.
Analisis fungsi diskriminan
Kami akan menjalankan analisis diskriminan menggunakan prosedur candisc.
Kita juga bisa menjalankan perintah lda discrim untuk mendapatkan analisis yang sama dengan output yang sedikit berbeda. Ada banyak output, jadi kami akan berkomentar di berbagai tempat di sepanjang jalan.
Candisc Outdoor Sosial Konservatif, Grup (Pekerjaan) Analisis diskriminan linier kanonik
| | Suka- | Kanon. Eigen- Varians | lihood
FCN | Corr. nilai Prop. Kumul. | Rasio F df1 df2 Prob>F
----+---+--- 1 | 0,7207 1,08053 0,7712 0,7712 | 0,3640 52,382 6 478 0,0000 e
2 | 0.4927 .320504 0.2288 1.0000 | 0.7573 38.46 2 240 0.0000 e
--- Ho: ini dan kanon yang lebih kecil. corr. adalah nol; e
= F tepat
Jumlah dimensi diskriminan adalah jumlah kelompok dikurangi 1. Namun, beberapa dimensi diskriminan mungkin tidak signifikan secara statistik.
Dalam contoh ini, ada dua dimensi diskriminan, keduanya signifikan secara statistik. Tes rasio F pertama bahwa kedua korelasi kanonik adalah nol;
uji rasio F kedua bahwa hanya korelasi kanonik kedua adalah nol. Karena kedua tes ini signifikan, maka kedua dimensi itu signifikan dan
diperlukan untuk menggambarkan perbedaan antara ketiga kelompok karyawan.
Korelasi kanonik untuk dimensi satu dan dua masing-masing adalah 0,72 dan 0,49.
Koefisien fungsi diskriminan kanonik standar
| fungsi1 fungsi2
---+--- Luar Ruangan | .3785725 .9261104 Sosial | -.8306986 .2128593 Konservatif | .5171682 -.2914406
Struktur kanonik
| fungsi1 fungsi2
---+--- Luar Ruangan | .3230982 .9372155 Sosial | -.7653907 .2660298 Konservatif | .467691 -.2587426
o Koefisien diskriminan standar berfungsi dengan cara yang analog dengan koefisien regresi standar dalam regresi OLS. Misalnya, peningkatan satu standar deviasi pada variabel outdoor akan
menghasilkan peningkatan standar deviasi 0,3786 dalam nilai prediksi pada fungsi diskriminan 1.
o Struktur kanonik, juga dikenal sebagai pemuatan kanonik atau
pemuatan diskriminan, mewakili korelasi antara variabel yang diamati dan fungsi diskriminan yang tidak diamati (dimensi). Fungsi
diskriminan adalah sejenis variabel laten dan korelasinya adalah pemuatan yang analog dengan pemuatan faktor.
Grup berarti pada variabel kanonik | pekerjaan
---+--- grup1 | Layanan Pelanggan Grup2 | montir
Grup3 | Pengiriman
| fungsi1 fungsi2
---+--- grup1 | -1.2191 -.3890039 Grup2 | .1067246 .7145704 Grup3 | 1.419669 -.5059049
Ringkasan klasifikasi resubstitusi +---+
| Kunci | |---|
| Nomor | | Persen | +---+
| Diklasifikasikan Benar | grup1 grup2 grup3 | Seluruh
---+---+--- grup1 | 70 11 4 | 85
| 82,35 12,94 4,71 | 100.00 | | Grup2 | 16 62 15 | 93
| 17.20 66.67 16.13 | 100.00 | | Grup3 | 3 12 51 | 66
| 4,55 18,18 77,27 | 100.00 ---+---+--- Jumlah | 89 85 70 | 244
| 36,48 34,84 28,69 | 100.00 | | Sebelumnya | 0.3333 0.3333 0.3333 |
Output mencakup rata-rata pada fungsi diskriminan untuk masing-masing dari tiga kelompok dan tabel klasifikasi. Nilai dalam diagonal tabel klasifikasi mencerminkan klasifikasi individu yang benar ke dalam kelompok berdasarkan skor mereka pada dimensi diskriminan.
Secara default, Stata mengasumsikan apriori jumlah orang yang sama di setiap pekerjaan. Ini diwakili oleh 0,3333 Priors dalam tabel di atas. Jika Anda memiliki proporsi yang diharapkan berbeda dalam pikiran, Anda dapat
menentukannya dengan opsi priors.
Selanjutnya, kita akan memplot grafik individu pada dimensi diskriminan.
Karena banyaknya subjek, kami akan mempersingkat label untuk kelompok pekerjaan agar grafik lebih mudah dibaca. Selama kami tidak menyimpan set data, label baru ini tidak akan dibuat permanen.
label mendefinisikan pekerjaan 1 "c" 2 "m" 3 "d", memodifikasi Scoreplot, Msymbol(i)
Fungsi diskriminatnya adalah:
discriminant_score_1 = 0,517*konservatif + 0,379*luar ruangan – 0,831*sosial.
discriminant_score_2 = 0,926*luar ruangan + 0,213*sosial – 0,291*konservatif.
Seperti yang Anda lihat, karyawan layanan pelanggan cenderung berada di ujung dimensi 1 yang lebih sosial (negatif); operator berada di ujung yang
berlawanan; Mekaniknya ada di tengah. Pada dimensi 2 hasilnya tidak begitu jelas; Namun, mekaniknya cenderung lebih tinggi pada dimensi luar ruangan dan karyawan layanan pelanggan dan operator lebih rendah.
Kita juga dapat memplot pemuatan diskriminan untuk variabel ke dimensi diskriminan.
Memuat plot
Tidak mengherankan bahwa variabel sosial kuat pada dimensi sosial, yaitu, ia memiliki beban negatif yang tinggi, dan variabel luar ruangan tinggi pada dimensi luar.
Hal-hal yang perlu dipertimbangkan
Asumsi distribusi normal multivariat berlaku untuk variabel respons. Ini berarti bahwa masing-masing variabel dependen biasanya didistribusikan dalam kelompok, bahwa setiap kombinasi linier dari variabel dependen didistribusikan secara normal, dan bahwa semua himpunan bagian dari variabel harus multivariat normal.
Setiap kelompok harus memiliki jumlah kasus yang cukup besar.
Metode klasifikasi yang berbeda dapat digunakan tergantung pada apakah matriks varians-kovarians sama (atau sangat mirip) di seluruh kelompok.
Analisis fungsi diskriminan non-parametrik, yang disebut kth nearest neighbor, juga dapat dilakukan.
Lihat juga
Panduan online Stata
o Candisc
o Diskrim Referensi
Grimm, L. G. dan Yarnold, P. R. (editor). (1995). Membaca dan Memahami Statistik Multivariat. Washington, D.C.: Asosiasi Psikologi Amerika.
Huberty, CJ dan Olejnik, S. (2006). MANOVA Terapan dan Analisis
Diskriminan, Edisi Kedua. Hoboken, New Jersey: John Wiley dan Sons, Inc.
Stevens, JP (2002). Statistik Multivariat Terapan untuk Ilmu Sosial, Edisi Keempat. Mahwah, New Jersey: Lawrence Erlbaum Associates, Inc.
Tatsuoka, M. M. (1971). Analisis Multivariat: Teknik untuk Penelitian Pendidikan dan Psikologis. New York: John Wiley dan Putra.