PENGKAJIAN PEMBENTUKAN MODEL KLASIFIKASI
DALAM PENGELOMPOKKAN JURUSAN SISWA DI SMA
(Studi Kasus : Siswa SMA Negeri Siau Timur Kabupaten Siau
Tagulandang Biaro Propinsi Sulawesi Utara)
NELDA PONTO
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
PERNYATAAN MENGENAI TESIS
DAN SUMBER INFORMASI
Dengan ini saya menyatakaan bahwa tesis Pengkajian Pembentukan Model Klasifikasi dalam Pengelompokkan Jurusan Siswa di SMA (Studi Kasus : Siswa SMA Negeri Siau Timur kabupaten Siau Tagulandang Biaro Propinsi Sulawesi Utara) adalah karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir tesis ini.
Bogor, Agustus 2012 Nelda Ponto NIM G152100041
ABSTRACT
NELDA PONTO. Assessment of the Formation of the Classification Model in Student of Senior High School Grouping (Case Study : The students of State
Senior High School East Siau, Siau Tagulandang Biaro Regency, North Sulawesi). Supervised by I MADE SUMERTAJAYA and YENNI ANGRAINI.
Modeling that involve categorical response variables give important role in the classification problem. Statistical analysis is applied to solve this problem are discriminant analysis and multinomial logistic regression. Implementation of both methods against student of senior high school of East Siau data produce multinomial logistic regression as best method for classify the students into Scicence Program, Social Program, and Language Program. Classification accuracy of model from resampling is 88.1% and of model validation from Tagulandang Senior High School is 70.6%. The variables give significantly effect in classification students to Science Program or Language Program are Mathematics, English, Chemistry, and German, whereas, classification students into Social Program or Language Program are Economy, English, German, and History.
Keywords: discriminant analysis, classification, multinomial logistic regression
RINGKASAN
NELDA PONTO. Pengkajian Pembentukan Model Klasifikasi dalam Pengelompokkan Jurusan Siswa di SMA (Studi Kasus : Siswa SMA Negeri Siau Timur Kabupaten Siau Tagulandang Biaro Sulawesi Utara). Dibimbing oleh I MADE SUMERTAJAYA dan YENNI ANGRAINI.
SMA merupakan jenjang pendidikan menengah yang mengutamakan penyiapan siswa untuk melanjutkan pendidikan yang lebih tinggi dengan pengkhususan. Perwujudan pengkhususan tersebut berupa diselenggarakan penjurusan di kelas XI yakni, penjurusan pada Ilmu Pengetahuan Alam (IPA), Ilmu Pengetahuan Sosial (IPS), dan Bahasa.
Program penjurusan pada dasarnya dilakukan untuk membantu para siswa sehingga mereka dapat belajar dengan baik sesuai dengan minat, dan bakatnya. Siswa dalam kegiatan pembelajaran tidak dapat disamakan, dengan demikian setiap siswa sebaiknya ditempatkan pada situasi belajar mengajar yang tepat sesuai dengan kemampuannya masing-masing. Kekurangtepatan dalam penempatan jurusan siswa dapat mengakibatkan prestasi belajar siswa rendah.
Model statistika yang dapat digunakan untuk pengklasifikasian objek dengan melibatkan peubah tak bebas kategori dengan sejumlah peubah bebas kontinu adalah analisis diskriminan dan regresi logistik multinomial. Analisis diskriminan adalah teknik statistika yang dipergunakan untuk mengklasifikasikan objek kedalam kelompok berdasarkan sekumpulan peubah-peubah bebas. Analisis diskriminan juga merupakan suatu analisis dengan tujuan membentuk sejumlah fungsi melalui kombinasi linier peubah-peubah asal, yang dapat digunakan sebagai cara terbaik untuk memisahkan kelompok-kelompok individu. Sedangkan regresi logistik multinomial digunakan untuk memodelkan hubungan antara peubah respon dengan kategori lebih dari dua (polytomous) dengan peubah penjelas kategorik dan atau kontinu. Melalui metode regresi logistik multinomial akan dihasilkan peluang dari masing-masing kategori respon yang akan dijadikan sebagai pedoman pengklasifikasian suatu pengamatan akan masuk dalam respon kategori tertentu berdasarkan nilai peluang terbesar.
Tujuan utama yang ingin dicapai dalam penelitian ini, yaitu (1) menerapkan metode analisis diskriminan dan multinomial logistik untuk klasifikasi, (2) mengevaluasi peubah yang konsisten muncul dari metode analisis diskriminan dan multinomial logistik dengan teknik resampling. Data yang digunakan adalah data sekunder dari dua SMA Negeri di Kabupaten Sitaro yaitu SMA Negeri Tagulandang dan SMA Negeri Siau Timur. Data SMA Negeri Siau Timur digunakan untuk pemodelan, sedangkan yang digunakan untuk validasi model adalah data SMA Negeri Tagulandang. Peubah-peubah yang diamati dalam penelitian ini terdiri 14 peubah numerik, yaitu rataan nilai mata pelajaran Agama, PPKn, Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Biologi, Kimia, Sejarah, Geografi, Ekonomi, Sosiologi, TIK, Bahasa Jerman serta 6 peubah kategorik, yaitu : jenis kelamin, pendidikan ayah, pendidikan ibu, pekerjaan ibu, pekerjaan ayah, pendapatan.
Hasil yang diperoleh dalam penelitian ini menunjukkan bahwa tingkat ketepatan prediksi model dengan analisis diskriminan secara keseluruhan adalah sebesar 76.2 persen. Sedangkan tingkat ketepatan prediksi model dengan regresi
logistik multinomial secara keseluruhan adalah sebesar 83.7 persen. Resampling 30 kali menghasilkan metode terbaik adalah regresi logistik multinomial dengan tingkat ketepatan klasifikasi adalah sebesar 88.1%.
Untuk mengelompokkan siswa kedalam jurusan IPA dipengaruhi oleh mata pelajaran Agama, Matematika, Bahasa Inggris, Kimia, Bahasa Jerman dan Pendidikan ayah. Pengelompokkan siswa kedalam jurusan IPS dipengaruhi oleh Bahasa Inggris, Biologi, Sejarah, Geografi, Ekonomi, Bahasa Jerman, dan Jenis kelamin. Validasi model dari SMA Negeri Tagulandang memberikan ketepatan klasifikasi sebesar 70.6%.
© Hak Cipta milik IPB, tahun 2012
Hak Cipta dilindungi Undang-Undang
1. Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumber.
a. Pengutipan hanya untuk kepentingan pendidikan, penelitian,
penulisan karya ilmiah, penyusunan laporan, penulisan kritik, atau tinjauan suatu masalah
b. Pengutipan tidak merugikan kepentingan yang wajar bagi IPB
2. Dilarang mengumumkan dan memperbanyak sebagian atau seluruh
PENGKAJIAN PEMBENTUKAN MODEL KLASIFIKASI
DALAM PENGELOMPOKKAN JURUSAN SISWA DI SMA
(Studi Kasus : Siswa SMA Negeri Siau Timur Kabupaten Siau
Tagulandang Biaro Propinsi Sulawesi Utara)
NELDA PONTO
Tesis
Sebagai salah satu syarat untuk memperoleh gelar Magister Sains pada
Program Studi Statistika Terapan
SEKOLAH PASCASARJANA
INSTITUT PERTANIAN BOGOR
BOGOR
2012
Judul Tesis : Pengkajian Pembentukan Model Klasifikasi dalam
Pengelompokkan Jurusan Siswa di SMA (Studi Kasus: Siswa SMA Negeri Siau Timur Kabupaten Siau Tagulandang Biaro Propinsi Sulawesi Utara)
Nama : Nelda Ponto
NRP : G152100041
Disetujui Komisi Pembimbing
Dr. Ir. I Made Sumertajaya, M.Si Ketua
Yenni Angraini, M.Si Anggota
Diketahui,
Ketua Program Studi Statistika
Dr. Ir. Anik Djuraidah, M.S
Dekan Sekolah Pascasarjana
Dr. Ir. Dahrul Syah, M.Sc.Agr
PRAKATA
Puji syukur penulis panjatkan kepada Tuhan Yang Maha Kuasa, atas kasih dan karunia-Nya sehingga karya ilmiah ini dapat diselesaikan. Judul karya ilmiah ini adalah “Pengkajian Pembentukan Model Klasifikasi dalam pengelompokkan Jurusan Siswa di SMA (Studi Kasus: Siswa SMA Negeri Siau Timur Kabupaten Siau Tagulandang Biaro Propinsi Sulawesi Utara)”.
Terima kasih penulis ucapkan kepada Bapak Dr. Ir. I Made Sumertajaya, M.Si selaku ketua komisi pembimbing dan Ibu Yenni Angraini, M.Si selaku anggota komisi pembimbing yang telah banyak memberi saran. Disamping itu, penulis juga mengucapkan terima kasih kepada bapak Dr. Ir. Asep Saefuddin, M.Sc selaku penguji luar komisi pada ujian tesis, serta seluruh staf Program Studi Statistika.
Ungkapan terima kasih juga disampaikan kepada papa (Ferry Ponto), mama (Magdalena. Togelang), kakak-kakakku (Drs. H. Malendes dan T. Ponto, S.Pd), serta seluruh keluarga atas doa, dukungan dan kasih sayangnya. Terima kasih pula kepada teman-teman Statistika dan Statistika Terapan angkatan 2010, 2011 baik S2 maupun S3 atas bantuan dan kebersamaannya selama ini. Semoga karya ilmiah ini dapat bermanfaat.
Bogor, Agustus 2012
RIWAYAT HIDUP
Penulis dilahirkan di Tulusan pada tanggal 17 maret 1979 dari ayah Ferry Ponto dan ibu Magdalena Togelang. Penulis merupakan putri bungsu dari ketiga bersaudara.
Penulis lulus Sekolah Menengah Atas (SMA) Tahun 1997 selanjutnya pada Tahun 1998 di terima sebagai mahasiswa jurusan matematika FMIPA, Universitas Negeri Manado (UNIMA). Penulis memperoleh gelar sarjana pendidikan tahun 2003.
Pada tahun 2005 penulis diangkat menjadi staf pengajar di SMA Negeri Tagulandang dan tahun 2009 dipindahkan ke SMA Negeri Siau Timur. Selanjutnya pada Tahun 2010 penulis diterima di Program Studi Statistika Terapan pada Sekolah Pascasarjana IPB.
DAFTAR ISI
Halaman
DAFTAR TABEL ... xii
DAFTAR GAMBAR ... xiii
DAFTAR LAMPIRAN ... xiv
PENDAHULUAN ... 1
Latar Belakang ... 1
Tujuan Penelitian ... 3
TINJAUAN PUSTAKA ... 5
Analisis Diskriminan ... 5
Pembentukan Fungsi Diskriminan ... 6
Regresi Logistik Multinomial ... 9
Pengujian Kesesuian Model ... 10
Pereduksian Peubah ... 11
Interpretasi Koefisien... 12
METODOLOGI ... 13
Data Penelitian ... 13
Metode Analisis ... 13
HASIL DAN PEMBAHASAN ... 17
Karakteristik Siswa ... 17
Deskripsi Nilai Rapor Menurut Program Studi ... 19
Analisis Diskriminan ... 20
Analisis Regresi Logistik Multinomial ... 23
Pembangunan Analisis Model Analisis Diskriminan dan Logistik Multinomial dari Hasil Resampling ... 25
Perbandingan Hasil Klasifikasi Analisis Dsikriminan dan Logistik Multinomial ... 28
Penerapan Model Logistik Multinomial ... 29
SIMPULAN DAN SARAN ... 31
Simpulan ... 31
Saran ... 31
DAFTAR PUSTAKA ... 33
DAFTAR TABEL
Halaman
1 Peubah-peubah yang diamati ... 13
2 Distribusi siswa berdasarkan pendidikan orang tua ... 18
3 Nilai rata-rata rapor dan simpangan baku berdasarkan program studi ... 19
4 Nilai-p regresi linier tiap kategori ... 20
5 Koefisien fungsi diskriminan ... 21
6 Nilai rata-rata kelompok ... 22
7 Hasil klasifikasi analisis diskriminan ... 22
8 Analisis logistik multinomial hasil eliminasi langkah mundur ... 23
9 Hasil prediksi logistik multinomial ... 24
10 Fungsi diskriminan ... 24
11 Hasil klasifikasi analisis diskriminan ... 26
12 Hasil dugaan parameter logistik multinomial... 27
13 Ketepatan klasifikasi model logistik multinomial ... 26
14 Ketepatan klasifikasi ... 28
15 Ilustrasi data siswa ... 29
DAFTAR GAMBAR
Halaman 1 Distribusi siswa berdasarkan jurusan ... 17 2 Distribusi siswa berdasarkan jenis kelamin ... 17 3 Distribusi siswa berdasarkan pekerjaan orang tua ... 18
DAFTAR LAMPIRAN
Halaman
1 Pengkodean peubah penjelas kategorik ... 37
2 Hasil analisis logistik multinomial dengan model penuh ... 38
3 Hasil uji asumsi kenormalan ganda ... 39
4 Akar ciri masing-masing fungsi diskriminan ... 41
5 Pengujian Wilks’ Lambda ... 41
6 Peubah-peubah digunakan dalam analisis diskriminan ... 41
7 Jumlah signifikansi peubah-peubah pada analisis logistik multinomial yang dihasilkan dari proses resampling ... 42
8 Jumlah signifikansi peubah-peubah pada analisis diskriminan yang dihasilkan dari proses resampling ... 42
9 Pengklasifikasian objek ke dalam kelompok ... 43
PENDAHULUAN
Latar Belakang
Sekolah Menengah Atas (SMA) merupakan jenjang pendidikan menengah yang mengutamakan penyiapan siswa untuk melanjutkan pendidikan yang lebih tinggi dengan pengkhususan (Depdiknas 2004). Perwujudan pengkhususan tersebut berupa penjurusan. Penjurusan dilakukan pada saat memasuki kelas XI yakni, penjurusan pada Ilmu Pengetahuan Alam (IPA), Ilmu Pengetahuan Sosial (IPS) dan Bahasa.
Penjurusan merupakan upaya strategis dalam memberikan fasilitas kepada siswa untuk menyalurkan bakat, minat dan kemampuan yang dimilikinya yang dianggap paling potensial untuk dikembangkan secara optimal. Sehubungan dengan hal tersebut, maka siswa yang mempunyai kemampuan sains dan ilmu eksakta yang baik biasanya akan memilih jurusan IPA, dan yang memiliki minat pada sosial dan ekonomi akan memilih jurusan IPS, sedangkan yang gemar berbahasa akan memilih jurusan Bahasa (Murniramli 2008). Dengan demikian, karakteristik suatu ilmu menuntut karakteristik yang sama dari yang mempelajarinya. Siswa yang mempelajari suatu ilmu yang sesuai dengan karakteristik kepribadiannya atau minat terhadap suatu ilmu tertentu akan merasa senang ketika mempelajarinya serta faktor kepribadian mempengaruhi secara positif prestasi akademik. Oleh karena itu, penjurusan bukan masalah kecerdasan tetapi juga masalah minat dan bakat siswa (Snow 1986).
Andanawari (2010) menyatakan bahwa minat merupakan suatu keinginan yang cenderung menetap pada diri seseorang untuk mengarahkan pada suatu pilihan tertentu sebagai kebutuhannya, kemudian dilanjutkan untuk diwujudkan dalam tindakan yang nyata dengan adanya perhatian pada obyek yang diinginkannya itu untuk mencari informasi sebagai wawasan bagi dirinya. Menurut UU Nomor 20 tahun 2003, peserta didik berhak mendapatkan pelayanan pendidikan sesuai dengan bakat, minat, dan kemampuannya, sehingga menempatkan siswa pada jurusan tertentu secara tepat berarti memberikan peluang kepada siswa untuk dapat berhasil pada masa yang akan datang. Menurut Subiyanto (1988) kekurangtepatan dalam penempatan jurusan dapat
mengakibatkan prestasi belajar rendah. Hal ini disebabkan karena adanya perbedaan individual antara siswa disekolah yaitu, meliputi perbedaan kemampuan kognitif, motivasi berprestasi, minat dan kreativitas dan dengan adanya perbedaan individu tersebut, maka fungsi pendidikan tidak hanya dalam proses belajar mengajar tetapi meliputi bimbingan konseling, pemilihan dan penetapan siswa sesuai dengan kapasitas individual yang dimiliki (Snow 1986).
Agar kesalahan dalam pemilihan dan penetapan jurusan di SMA dapat diminimalisasi maka perlu ada upaya dalam mencari model yang terbaik. Beberapa analisis statistik telah banyak dikembangkan untuk membantu menyelesaikan masalah-masalah dalam bidang pendidikan, di antaranya adalah analisis regresi logistik, analisis diskriminan, pohon klasifikasi dan Artificial
Neural Network (ANN). Dalam penelitian ini, analisis yang digunakan adalah
analisis diskriminan dan regresi logistik multinomial. Menurut Johnson dan Wichern (1998), analisis diskriminan digunakan untuk mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih. Sedangkan regresi logistik multinomial digunakan untuk memodelkan hubungan antara peubah respon dengan kategori lebih dari dua (polytomous) dengan peubah penjelas kategorik dan atau kontinu. Melalui metode regresi logistik multinomial akan dihasilkan peluang dari masing-masing kategori respon yang akan dijadikan sebagai pedoman pengklasifikasian suatu pengamatan akan masuk dalam respon kategori tertentu berdasarkan nilai peluang terbesar (Hosmer DW & Lemeshow S 2000; Gozali 2005).
Penelitian tentang analisis diskriminan dan regresi logistik multinomial banyak dilakukan antara lain oleh, Maulias (2009) klasifikasi penjurusan siswa SMK Negeri 1 Tual Maluku dengan pendekatan analisis diskriminan dan regresi logistik multinomial. Metode klasifikasi menggunakan fungsi diskriminan (Purnomo 2003).
Berdasarkan uraian di atas, maka dilakukan penelitian untuk pengkajian pembentukan model klasifikasi dalam pengelompokkan jurusan siswa di SMA Negeri Siau Timur. Sebagai peubah respon adalah jurusan yaitu IPA, IPS, dan Bahasa, sedangkan peubah bebas adalah rata-rata nilai rapor kelas X dan data diri siswa.
Tujuan Penelitian
Tujuan penelitian ini antara lain :
1. Menerapkan metode analisis diskriminan dan multinomial logistik untuk klasifikasi.
2. Mengevaluasi peubah yang konsisten muncul dari metode analisis diskriminan dan multinomial logistik dengan teknik resampling.
TINJAUAN PUSTAKA
Analisis Diskriminan
Analisis diskriminan (Discriminant Analysis) adalah salah satu metode analisis multivariat yang bertujuan untuk memisahkan beberapa kelompok data yang sudah terkelompokkan dengan cara membentuk fungsi diskriminan (Johnson & Wichern 1998). Untuk melakukan analisis diskriminan ada dua asumsi yang harus diperhatikan (Dillon dan Goldstein 1984) yaitu :
1. Sejumlah 𝑝 peubah bebas menyebar mengikuti sebaran normal ganda.
2. Matriks peragam berdimensi 𝑝 × 𝑝 dari peubah-peubah bebas dalam setiap kelompok harus homogen.
Uji sebaran normal ganda dapat dilakukan dengan plot khi-kuadrat (Johnson & Winchern 1998). Setiap vektor pengamatan dihitung jarak Mahalanobisnya dengan persamaan:
𝑑𝑖2 = 𝑥𝑖− 𝑥 𝑖 𝑆𝑖−1 𝑥𝑖 − 𝑥 𝑖
dimana setiap 𝑑𝑖2 akan menyebar khi-kuadrat dengan p derajat bebas, bila p menyatakan jumlah peubah.
Plot khi kuadrat akan memeriksa apakah statistik 𝑑𝑖2 mengikuti sebaran khi kuadrat, yaitu dengan mengurutkan 𝑑𝑖2 dari yang terkecil ke yang terbesar 𝑑12 ≤ 𝑑
22 ≤ ⋯ ≤ 𝑑𝑛2 , kemudian memplotkan 𝑑𝑖2 dengan 𝜒𝑝2 𝑖 − 0.5 /𝑛 . Tebaran titik-titik yang membentuk garis lurus menunjukkan kesesuaian pola sebaran 𝑑𝑖2 terhadap sebaran khi-kuadrat yang berati data berasal dari sebaran normal. Jika asumsi normal ganda tidak terpenuhi maka dapat digunakan analisis diskriminan logistik sebagai solusinya (Cacoullos 1973).
Rencher (2002) menyatakan bahwa uji kehomogenan matriks peragam dilakukan menggunakan uji Box’ M, statistik uji yang digunakan adalah :
𝑀 = 𝑆𝑖 𝑆𝑤 𝑔 𝑖=1 𝑣𝑖/2 dengan : 𝑣𝑖 = 𝑛𝑖− 1 𝑆𝑖 = 1 𝑛𝑖−1 𝑥𝑖𝑗 − 𝑥 𝑖 𝑡 𝑥𝑖𝑗 − 𝑥 𝑖 𝑛𝑖 𝑗 =1 𝑆𝑤 = 𝑣𝑖𝑆𝑖 𝑔 𝑖=1 𝑣𝑖 𝑔 𝑖=1
Statistik 𝑀 bernilai antara 0 dan 1, jika nilainya mendekati 0, maka telah cukup bukti untuk menolak Ho pada taraf 𝛼 atau berarti ada matriks peragam populasi normal ganda yang berbeda sedangkan jika nilainya mendekati 1 berarti belum cukup bukti untuk menolak Ho pada taraf 𝛼.
Sebaran statistik uji 𝑀 dapat di dekati dengan sebaran 𝐹 tahapan pengujiannya (Rencher 2002) adalah:
menghitung, 𝑐1 = 1 𝑣𝑖
−
1 𝑣𝑖 𝑔 𝑖=1 𝑔 𝑖=1 2𝑝2 + 3𝑝 −1 6 (𝑝+1)(𝑔−1)dan 𝑐2 = 𝑝−1 𝑝−2 6 𝑔−1 1 𝑣𝑖2 − 1 𝑔𝑖=1𝑣𝑖 2 𝑔 𝑖=1 , serta 𝑎1 = 1 2 𝑔 − 1 𝑝 𝑝 − 1 , 𝑎2 = 𝑎1+2 𝑐2−𝑐12 𝑏1 =1−𝑐1−𝑎1 𝑎2 𝑎1 , 𝑏2 = 1−𝑐1−2 𝑎2 𝑎2
Jika 𝑐2 > 𝑐12, 𝐹 = −2𝑏1ln 𝑀 mendekati sebaran 𝐹𝛼 𝑎1,𝑎2 dan
Jika 𝑐2 < 𝑐12, 𝐹 = −2𝑎2𝑏2ln 𝑀 𝑎2 1 + 2𝑏2ln 𝑀 mendekati sebaran 𝐹𝛼 𝑎1,𝑎2 . Untuk kedua kasus tersebut, tolak 𝐻0 jika 𝐹 > 𝐹𝛼 𝑎1,𝑎2 . Jika asumsi kehomogenan matriks peragam yang tidak terpenuhi maka analisis yang dapat digunakan adalah analisis diskriminan kuadratik ( Gnanadesikan, R. 1977).
Pembentukan Fungsi Diskriminan
Fungsi diskriminan, menurut Johnson dan Winchern (1998) misalkan terdapat 𝑔 kelompok populasi dengan masing-masing ukuran contoh 𝑛𝑖, 𝑖 = 1,2, … , 𝑔, vektor peubah acak populasi ke-𝑖 adalah 𝑋𝑖 = 𝑋1, 𝑋2, … , 𝑋𝑝 , dan baris ke-𝑗 adalah 𝑥𝑖𝑗 maka vektor rataan populasi ke-𝑖 dapat dinyatakan sebagai berikut:
𝑥 = 1
𝑛𝑖 𝑥𝑖𝑗 𝑛𝑖
𝑗 =1 dan vektor rataan populasi adalah
𝑥 = 𝑛𝑖𝑥 𝑖 𝑔 𝑖=1 𝑛𝑖 𝑔 𝑖=1 = 𝑥𝑖𝑗 𝑛𝑖 𝑗 =1 𝑔 𝑖=1 𝑛𝑖 𝑔 𝑖=1
Misalkan 𝑩 matriks peragam antar kelompok, 𝑾 matriks peragam dalam kelompok, dengan matriks keragaman total 𝑻 = 𝑾 + 𝑩. Fungsi diskriminan
disusun dengan memaksimalkan rasio antara ragam antar kelompok dengan ragam antar kelompok. Jika fungsi diskriminan dinyatakan dengan 𝑦 = 𝒂′𝒙 maka yang ingin dicari adalah 𝒂𝒊 sehingga
𝜆 =
𝒂′𝑩𝒂
𝒂′𝑾𝒂
maksimum. Nilai 𝜆 yang maksimum merupakan akar ciri terbesar dari matriks 𝑾−1𝑩 dan 𝒂 merupakan vektor ciri yang sepadan (Sharma 1996).
Menurut Dillon dan Goldstein (1984), bila didefinisikan 𝑛 adalah banyaknya objek dari 𝑔 kelompok, maka matriks 𝑾 berukuran 𝑝 × 𝑝 berasal dari peubah acak 𝑋1, 𝑋2, … , 𝑋𝑝 yang bebas linear dengan 𝑛 − 𝑔 ≥ 𝑝. Sedangkan pangkat matriks 𝑩 sama dengan minimum 𝑝 dan 𝑔 − 1, maka matriks 𝑾−1𝑩 juga berpangkat min(𝑝, 𝑔 − 1). Hal ini berarti banyaknya akar ciri yang mungkin diperoleh oleh matriks 𝑾−1𝑩 adalah min(𝑝, 𝑔 − 1), sehingga banyaknya fungsi diskriminan yang dapat dibangun tergantung pada besaran min(𝑝, 𝑔 − 1).
Peranan relatif suatu fungsi diskriminan ke-𝑟 dalam memisahkan anggota-anggota kelompok diukur dari persentase relatif akar ciri yang berhubungan dengan fungsi diskriminan berikut :
𝑌𝑟 = 𝜆𝑟 𝜆𝑚 𝑠 𝑚 =1 × 100%, 𝑟 = 1,2, … , 𝑠 dengan 𝑠 = min 𝑝, 𝑔 − 1 .
Semua fungsi diskriminan yang terbentuk perlu diuji untuk mengetahui banyaknya fungsi yang dapat menjelaskan perbedaan peubah-peubah penjelas di antara g kelompok (Dillon & Goldstein 1984). Adapun pengujian fungsi diskriminan dapat dilakukan dengan menggunakan statistik V-Barlett melalui pendekatan khi-kuadrat, sebagai berikut :
a). Uji fungsi diskriminan pertama Statistik uji : 𝑉1 = 𝑣𝐸−1 2 𝑝 − 𝑣𝐻+ 1 ln Λ1 dengan : Λ1 = 1 1+𝜆𝑚 𝑠 𝑚 =1 𝑣𝐸 = 𝑁 − 𝑔 = 𝑔𝑖=1𝑛𝑖− 𝑔 𝑣𝐻 = 𝑔 − 1
atau dapat ditulis : 𝑉1 = 𝑁 − 1 − 1 2 𝑝 + 𝑔 ln 1 + 𝜆𝑚 𝑠 𝑚 =1
Jadi bila 𝑉1 < 𝜒2𝛼,𝑝(𝑔−1) artinya persentase relatif yang diterangkan oleh fungsi diskriminan pertama bersifat nyata secara statistik.
b). Uji fungsi diskriminan ke-𝑟 Statistik uji : 𝑉𝑟 = 𝑁 − 1 −1 2 𝑝 + 𝑔 ln 1 + 𝜆𝑚 𝑠 𝑚 =𝑟 Jadi bila 𝑉𝑟 < 𝜒2
𝛼, 𝑝−𝑟+1 𝑔−2 artinya fungsi diskriminan ke-𝑟 masih diperlukan untuk menerangkan perbedaan 𝑝-peubah diantara 𝑔-kelompok. Kriteria masuknya individu kedalam kelompok ke-𝑖 (Gaspersz 1992) bila:
𝑦𝑚 − 𝑦 𝑖𝑚 2 = 𝑎𝑚′ 𝑥𝑖𝑗 − 𝑥 𝑘 2 ≤ 𝑎𝑚′ 𝑥 − 𝑥 𝑘 2 𝑟 𝑚 =1 𝑟 𝑚 =1 𝑟 𝑚 =1 dengan :
𝑦𝑚 = Vektor skor diskriminan ke-m dari obyek
𝑦 𝑖𝑚 = Nilai tengah skor diskriminan ke-m dari kelompok ke-i 𝑎𝑚𝑡 = Vektor koefisien fungsi diskriminan
𝑥𝑖𝑗 = Vektor pengamatan dari objek yang akan dikelompokkan 𝑥 𝑘 = Vektor nilai tengah peubah pembeda dari kelompok ke-i 𝑟 = Banyaknya fungsi diskriminan penggolongan
Dari analisis diskriminan ini dapat pula digunakan untuk mencari peubah-peubah asal yang dianggap dominan untuk digunakan dalam membedakan antar kelompok.
𝑃𝑟𝑒𝑠𝑠 𝑄 merupakan tes statistik untuk mengukur kekuatan dari pengklasifikasian fungsi diskriminan (Hair et al. 1995), statistik 𝑄 dihitung dengan :
𝑃𝑟𝑒𝑠𝑠 𝑄 = 𝑁 − 𝑛 ∗ 𝑔 2 𝑁 𝑔 − 1 dengan : 𝑁 = Jumlah contoh total
𝑛 = Jumlah klasifikasi yang benar 𝑔 = Jumlah grup/kelompok
Statistik 𝑄 kemudian dibandingkan dengan nilai kritis (nilai khi-kuadrat untuk derajat bebas 1 pada taraf 𝛼 tertentu). Jika statistik 𝑄 lebih besar dari nilai kritis berarti persentase hasil klasifikasi yang dihasilkan memiliki kekuatan dalam mengklasifikasikan objek.
Dillon dan Goldstein (1984) menyatakan bahwa dalam menentukan peubah-peubah yang dimasukkan kedalam fungsi diskriminan dapat digunakan analisis diskriminan bertahap (stepwise discriminant). Pada analisis ini diawali dengan fungsi tanpa peubah, fungsi yang terbentuk pada setiap tahap diuji nilai F-parsial untuk setiap peubahnya. Peubah yang memilki nilai F terbesar dimasukkan ke dalam fungsi sedangkan peubah yang memiliki nilai F yang kurang dari 1 tidak akan dimasukkan dalam pembentukan fungsi. Proses akan berhenti bila tidak ada lagi peubah yang dimasukkan atau dikeluarkan.
Regresi Logistik Multinomial
Regresi logistik multinomial merupakan perluasan dari regresi logistik dengan respon biner yang dapat menangani peubah respon dengan kategori lebih dari dua. Hosmer dan Lemeshow (2000) menjelaskan, untuk model regresi dengan peubah respon berskala nominal tiga kategori digunakan kategori peubah hasil Y yang dikode 0, 1, dan 2. Peubah Y terparameterisasi menjadi dua fungsi logit. Sebelumnya perlu ditentukan kategori respon yang digunakan sebagai kategori pembanding terlebih dahulu. Pada umumnya digunakan Y=0 sebagai pembanding. Untuk membentuk fungsi logit, akan dibandingkan Y=1 dan Y=2 terhadap Y=0. Bentuk model regresi yang berupa fungsi peluang dengan p peubah bebas seperti pada persamaan berikut ini:
𝜋 𝑥 = 𝑒𝑥𝑝 𝛽0+ 𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑝𝑥𝑝 1 + 𝑒𝑥𝑝 𝛽0+ 𝛽1𝑥1+ 𝛽2𝑥2 + ⋯ + 𝛽𝑝𝑥𝑝
Transformasi logit akan menghasilkan dua fungsi logit sebagai berikut, dengan menetapkan 𝑥0 = 1. 𝑔1 𝑥 = ln 𝑃 𝑌 = 1 𝑥 𝑃 𝑌 = 0 𝑥 = 𝛽10 + 𝛽11𝑥1+ 𝛽12𝑥2+ ⋯ + 𝛽1𝑝𝑥𝑝 = 𝑥 ′𝛽 1 𝑔2 𝑥 = ln 𝑃 𝑌 = 2 𝑥 𝑃 𝑌 = 0 𝑥 = 𝛽20+ 𝛽21𝑥1+ 𝛽22𝑥2+ ⋯ + 𝛽2𝑝𝑥𝑝 = 𝑥 ′𝛽 2
Berdasarkan kedua fungsi logit tersebut maka didapatkan probabilitas respon atau model regresi logistik multinomial dengan peubah respon berskala nominal tiga kategori sebagai berikut (Hosmer dan Lemeshow, 2000).
𝜋0 𝑥 = 1 1 + 𝑒𝑥𝑝𝑔1 𝑥 + 𝑒𝑥𝑝𝑔2 𝑥 𝜋1 𝑥 = 𝑒𝑥𝑝 𝑔1 𝑥 1 + 𝑒𝑥𝑝𝑔1 𝑥 + 𝑒𝑥𝑝𝑔2 𝑥 𝜋2 𝑥 = 𝑒𝑥𝑝𝑔2 𝑥 1 + 𝑒𝑥𝑝𝑔1 𝑥 + 𝑒𝑥𝑝𝑔2 𝑥
Menurut Hosmer dan Lemeshow (2000), dalam menduga model logit dengan peubah responnya berskala kualitatif, teknik pendugaan parameter yang layak digunakan adalah metode kemungkinan maksimum. Prinsip dari metode kemungkinan maksimum memberikan nilai dugaan parameter suatu fungsi kemungkinan. Fungsi kemungkinan yang ingin dimaksimalkan adalah :
𝐿 𝛽 = 𝑓(𝑌 = 𝑛
𝑖=1
𝑦𝑖 |𝑥𝑖) dengan 𝑛 = banyaknya pengamatan
Pengujian Kesesuaian Model
Pengujian Kesesuaian model dilakukan untuk memeriksa pengaruh peubah-peubah penjelas dalam model. Pengujian dilakukan untuk masing-masing parameter model (𝛽). Pengujian secara simultan dilakukan dengan menggunakan
uji 𝐺 yaitu uji nisbah kemungkinan (likelihood ratio test).
Uji 𝐺 untuk pengujian parameter 𝛽𝑖 dengan hipotesis : 𝐻0: 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑝 = 0
𝐻1: 𝑚𝑖𝑛𝑖𝑚𝑎𝑙 𝑠𝑎𝑙𝑎 𝑠𝑎𝑡𝑢 𝛽𝑖 ≠ 0
Statistik uji yang digunakan adalah statistik uji : 𝐺 = −2 𝑙𝑛 𝐿0
𝐿1 dengan : 𝐿0 = likelihood tanpa peubah bebas
Jika H0 benar, statistik 𝐺 ini mengikuti sebaran 𝜒2 dengan derajat bebas p, Kriteria keputusan yang diambil adalah menolak 𝐻0 jika 𝐺𝑖𝑡𝑢𝑛𝑔 ≥ 𝜒𝛼 (𝑝)2 (Hosmer & Lemeshow 2000). Seandainya 𝐻0 ditolak, maka selanjutnya dilakukan uji Wald untuk menguji parameter 𝛽𝑖 secara parsial. Hipotesis yang diujikan adalah :
𝐻0: 𝛽𝑖 = 0
𝐻1: 𝛽𝑖 ≠ 0, 𝑑𝑖𝑚𝑎𝑛𝑎 𝑖 = 1,2, … , 𝑝
Sedangkan statistik uji Wald sebagai berikut : 𝑊 = 𝛽 𝑖
𝑆 𝐸 𝛽 𝑖
Statistik uji Wald mengikuti sebaran normal baku, dengan 𝛽𝑖 sebagai penduga dan 𝑆 𝐸 𝛽 𝑖 sebagai penduga galat baku 𝛽𝑖. Kriteria keputusan adalah menolak 𝐻0 jika 𝑊 ≥ 𝑍𝛼
2 atau nilai 𝑃 ≤ 𝛼 (Hosmer & Lemeshow 2000).
Pereduksian peubah
Pereduksian peubah dalam regresi logistik dikenal dengan analisis regresi logistik bertatar (stepwise logistic regression), dimana langkah yang dilakukan adalah menambah atau menghilangkan peubah penjelas satu persatu dari model sampai diperoleh peubah-peubah yang berpengaruh nyata terhadap model (Hosmer & Lemeshow 2000). Stepwise logistic regression terdiri dari seleksi langkag maju dan eliminasi langkah mundur.
Metode seleksi langkah maju prosedur dimulai dengan intersep, kemudian peubah penjelas dimasukkan satu persatu ke dalam model dan diuji dengan khi-kuadrat. Apabila peubah penjelas tidak signifikan atau tidak nyata pada nilai 𝛼 yang ditentukan, maka peubah tersebut dikeluarkan dari model dan sebaliknya peubah yang nyata atau signifikan akan dimasukkan ke dalam model. Sedangkan dalam metode eliminasi langkah mundur, prosedur dimulai dengan model penuh yaitu memasukkan seluruh peubah penjelas ke dalam model, kemudian diuji satu persatu. Jika ditemukan peubah penjelas yang tidak nyata pada nilai 𝛼 yang ditentukan maka peubah tersebut dikeluarkan dari model. Pada tiap prosesnya peubah yang memiliki nilai-p yang terbesar akan berakhir ketika peubah penjelas yang berada dalam model memiliki nilai-p kurang dari 0.05. Analisis akan selesai jika tidak ada lagi peubah yang dapat dieliminasi dari model (Garson 2010).
Teknik pereduksian peubah penjelas ini telah tersedia dalam paket pengolahan komputer. Dalam penelitian ini metode pereduksian yang digunakan adalah eliminasi langkah mundur.
Interpretasi Koefisien
Setelah diperoleh model terbaik, dilakukan interpretasi koefisien yang diperoleh. Rasio odds dapat juga dipergunakan untuk memudahkan interpretasi model. Rasio odds adalah ukuran asosiasi yang memperkirakan berapa besar kemungkinan peubah-peubah penjelas terhadap peubah respon (Hosmer dan Lemeshow 2000). Rasio odds untuk 𝑌 = 𝑗 terhadap 𝑌 = 𝑘 yang dihitung pada dua nilai (misal 𝑥 = 𝑎 dan 𝑥 = 𝑏) adalah :
𝛹 𝑎, 𝑏 = 𝑃 𝑌 = 𝑗 𝑥 = 𝑎)/𝑃 𝑌 = 𝑘 𝑥 = 𝑎)
𝑃 𝑌 = 𝑗 𝑥 = 𝑏)/𝑃 𝑌 = 𝑘 𝑥 = 𝑏) = 𝑒𝑥𝑝 𝛽𝑖 𝑎 − 𝑏 Sehingga jika 𝑎 − 𝑏 = 1 maka 𝛹 = 𝑒𝑥𝑝(𝛽𝑖).
Ukuran 𝛹 selalu positif dan umumnya digunakan sebagai pendekatan risiko nisbi (relative risk). Untuk 𝛹 = 1 berarti bahwa 𝑥 = 𝑎 memiliki risiko yang sama dengan 𝑥 = 𝑏 untuk menghasilkan 𝑌 = 𝑗. Bila 1 < 𝛹 < ∞ berarti 𝑥 = 𝑎 memiliki risiko lebih tinggi 𝛹 kali daripada 𝑥 = 𝑏, dan sebaliknya untuk 0 < 𝛹 < 1. Jika peubah penjelas kontinu maka interpretasi koefisien dugaan tergantung pada unit particular dari peubah penjelas. Untuk peubah penjelas kontinu diperlukan unit perubahan sebesar 𝑐, maka rasio odds diperoleh dengan 𝑒𝑥𝑝(𝑐𝛽𝑖) (Hosmer dan Lemeshow 2000).
METODOLOGI Data Penelitian
Data yang digunakan dalam penelitian ini adalah data sekunder yang diambil dari dua SMA di Kabupaten Sitaro yaitu SMA Negeri Tagulandang yang berjumlah 170 siswa dan SMA Negeri Siau Timur yang berjumlah 252 siswa. Peubah yang diambil adalah nilai rataan rapor kelas X dan keterangan pribadi siswa waktu masuk di SMA. Data SMA Negeri Siau Timur Tahun ajaran 2009/2010 dan 2010/2011 digunakan untuk pemodelan. Sedangkan yang digunakan untuk validasi adalah data SMA Negeri Tagulandang. Peubah yang akan digunakan dalam penelitian ini disajikan dalam Tabel 1. Pengkodean untuk peubah dummy dapat dilihat pada Lampiran 1.
Tabel 1 Peubah-peubah yang diamati Peubah
bebas Keterangan
Peubah
bebas Keterangan
X1 Rataan Nilai Agama X11 Rataan Nilai Ekonomi X2 Rataan Nilai PPKn X12 Rataan Nilai Sosiologi X3 Rataan Nilai Bhs Indonesia X13 Rataan Nilai TIK X4 Rataan Nilai Bhs Inggris X14 Rataan Nilai Bhs Jerman X5 Rataan Nilai Matematika X15 Jenis Kelamin
X6 Rataan Nilai Fisika X16 Pendidikan Ayah X7 Rataan Nilai Biologi X17 Pendidikan Ibu X8 Rataan Nilai Kimia X18 Pekerjaan Ayah X9 Rataan Nilai Sejarah X19 Pekerjaan Ibu X10 Rataan Nilai Geografi X20 Pendapatan
Metode analisis
Langkah-langkah yang dilakukan dalam penelitian ini adalah sebagai berikut :
Tahap I : Melakukan analisis diskriminan dan multinomial logit
1. Analisis diskriminan a. Uji asumsi diskriminan
2) Menguji kehomogenan matriks peragam gabungan menggunakan uji Box’M dengan membandingkan signifikansinya terhadap taraf nyata (α). Jika tidak terpenuhi maka tidak dapat membuat fungsi diskriminan linear.
b. Melakukan proses diskriminan
1) Mencari fungsi diskriminan bertahap.
2) Menghitung peranan relatif dari fungsi diskriminan yang didapat dengan mengukur menggunakan persentase relatif akar ciri dari fungsi diskriminan yang terbentuk.
3) Menguji keterandalan fungsi diskriminan dengan uji V-Bartlett yang menggunakan pendekatan khi-kuadrat.
4) Menghitung ketepatan klasifikasi fungsi diskriminan.
5) Menguji keterandalan hasil klasifikasi dari proses analisis diskriminan dengan statistik 𝑄.
2. Analisis multinomial logit
a. Membentuk fungsi logit dari peubah penjelas, yang mana transformasi logit yang digunakan adalah :
𝐿𝑛 𝜋𝑗( 𝑥 )
𝜋𝑘( 𝑥 ) = 𝛽0 + 𝛽1𝑥1 𝑗 + . . . + 𝛽𝑝𝑥𝑝 𝑗
b. Menyelesaikan dugaan parameter dengan metode Kemungkinan Maksimum.
c. Melakukan pengujian parameter dengan statistik uji-G untuk melihat peran seluruh peubah penjelas di dalam model secara simultan.
d. Melakukan pengujian parameter secara parsial dengan statistik uji Wald untuk melihat pengaruh masing-masing peubah penjelas terhadap peubah respon.
e. Melakukan interpretasi koefisien model regresi logistik multinomial dengan Rasio odds.
f. Menghitung ketepatan klasifikasi model logistik.
Tahap II : Mengevaluasi model klasifikasi dengan resampling
1. Melakukan penarikan contoh terhadap data awal yang berjumlah 252 pengamatan. Penarikan contoh dilakukan secara acak dan dilakukan
contoh berukuran sama dengan data awal. Hal ini bertujuan untuk melihat kekonsistenan peubah-peubah yang signifikan terhadap jurusan siswa di SMA. Konsistensi peubah-peubah tersebut akan digunakan sebagai pertimbangan untuk memilih peubah bebas dalam membangun model klasifikasi pengelompokan jurusan siswa di SMA.
2. Pada setiap resampling, data yang terambil kemudian dianalisis menggunakan analisis logistik multinomial dan analisis diskriminan. Dengan demikian, akan diperoleh masing-masing 30 model untuk model logistik multinomial dan model diskriminan.
3. Mengidentifikasi peubah-peubah yang signifikan untuk masing-masing model. Peubah yang signifikan pada 10 model logistik multinomial atau lebih akan digunakan untuk membangun model klasifikasi, demikian pula halnya untuk model diskriminan.
4. Melakukan analisis logistik multinomial dan analisis diskriminan terhadap data awal, dengan peubah bebas yang terpilih pada langkah 3.
5. Mengevaluasi model logistik multinomial dan analisis diskriminan yang diperoleh pada langkah 4 dengan melihat ketepatan klasifikasi masing-masing model.
6. Memilih model klasifikasi terbaik berdasarkan hasil pada langkah 5. Model yang terbaik adalah model yang memiliki tingkat klasifikasi paling tinggi.
Tahap III : Melakukan validasi terhadap model terbaik
Validasi dilakukan dengan menerapkan model terbaik pada data SMA Negeri Tagulandang. Semakin tinggi tingkat ketepatan klasifikasi model yang dihasilkan pada tahap validasi, maka semakin baik kemampuan model dalam mengklasifikasikan siswa ke dalam jurusannya.
HASIL DAN PEMBAHASAN Karakteristik Siswa
Gambar 1 memperlihatkan Karakteristik siswa SMA Negeri Ulu Siau berdasarkan jurusan. Berdasarkan Gambar 1 umumya siswa lebih memilih jurusan IPA daripada jurusan IPS dan Bahasa. Jurusan IPA memiliki persentase terbesar yaitu 41.7% (105 siswa), Jurusan IPS memilki persentase 37.3% (94 siswa), dan jurusan Bahasa memiliki persentase 21.0% (53 siswa). Gambar 2 mendeskripsikan bahwa jurusan IPA dan Bahasa didominasi oleh perempuan yaitu jurusan IPA sebesar 67.6% (71 siswa) dan jurusan Bahasa sebesar 60.4% (32 siswa). Sebaliknya jurusan IPS didominasi oleh laki-laki yaitu sebesar 75.5% (71 siswa). 0,0% 10,0% 20,0% 30,0% 40,0% 50,0%
IPA IPS BAHASA
41,7%
37,3%
21,0%
Gambar 1 Distribusi siswa berdasarkan jurusan
0,0% 10,0% 20,0% 30,0% 40,0% 50,0% 60,0% 70,0% 80,0%
IPA IPS BAHASA
67,6% 24,5% 60,4% 32,4% 75,5% 39,6%
Gambar 2 Distribusi siswa berdasarkan jenis kelamin
Perempuan Laki-laki
Tabel 2 menunjukkan persentase siswa berdasarkan jurusan yang diambil menurut pendidikan orang tua. Berdasarkan Tabel 2 mayoritas pendidikan orang tua siswa adalah Pendidikan Menengah, baik pendidikan ayah maupun pendidikan ibu, kemudian diikuti oleh Pendidikan Dasar dan Pendidikan Tinggi. Perbedaan latar belakang pendidikan orang tua siswa melahirkan persepsi yang berbeda tentang penjurusan. Hal ini mengindikasikan bahwa tinggi rendahnya tingkat pendidikan orang tua mempengaruhi pemilihan jurusan siswa di sekolah.
Tabel 2 Distribusi siswa berdasarkan pendidikan orang tua Program
Studi
Pendidikan Ayah Pendidikan Ibu
Dasar Menengah Tinggi Dasar Menengah Tinggi
IPA 29 50 26 35 48 22 27.6% 47.6% 24.8% 33.3% 45.7% 21.0% IPS 45 42 7 31 53 10 47.9% 44.7% 7.4% 33.0% 56.4% 10.6% Bahasa 22 25 6 23 21 9 41.5% 47.2% 11.3% 43.4% 39.6% 17.0%
Gambaran mengenai persentase untuk masing-masing jenis pekerjaan orang tua siswa dapat dilihat pada Gambar 3. Mayoritas pekerjaan orang tua siswa untuk jurusan IPA adalah PNS yaitu sebesar 57.8%, sedangkan jurusan IPS dan Bahasa mayoritas adalah Non PNS yaitu masing-masing sebesar 39.3% dan 21.4%. 0,0% 10,0% 20,0% 30,0% 40,0% 50,0% 60,0%
IPA IPS Bahasa
57,8%
23,4%
18,8%
39,3% 39,3%
21,4%
Gambar 3 Distribusi siswa berdasarkan pekerjaan orang tua
PNS Non PNS
Deskripsi Nilai Rapor Menurut Program Studi
Berdasarkan laporan hasil prestasi belajar siswa SMA Negeri Siau Timur, diperoleh nilai rata-rata kelas dan simpangan baku untuk setiap mata pelajaran (Tabel 3). Mata pelajaran yang menjadi ciri khas program studi IPA adalah Matematika, Fisika, Kimia, Biologi. Pelajaran ciri khas program studi IPS adalah Sejarah, Ekonomi, Sosiologi, Geografi dan pelajaran ciri khas program studi Bahasa adalah Bahasa Indonesia, Bahasa Inggris, Bahasa Jerman.
Tabel 3 Nilai rata-rata rapor dan simpangan baku berdasarkan program studi
Mata Pelajaran
IPA IPS Bahasa
Rata-rata Simpangan Baku Rata-rata Simpangan Baku Rata-rata Simpangan Baku Agama 82.810 5.046 76.043 5.069 77.793 5.987 PPKn 81.545 5.069 75.863 4.580 76.783 4.855 Bhs Indonesia 79.017 4.731 74.130 4.171 76.519 4.067 Bhs Inggris 75.024 6.123 68.771 5.930 72.717 4.289 Bhs Jerman 73.888 8.010 67.995 6.626 74.179 4.533 Matematika 75.694 5.925 62.213 3.910 63.698 4.710 Fisika 75.624 5.320 64.686 4.196 66.623 4.332 Biologi 79.976 5.706 72.160 4.111 73.321 4.469 Kimia 76.507 5.179 67.580 4.127 69.028 4.563 Sejarah 73.091 3.949 71.535 2.977 71.302 2.831 Geografi 72.929 4.043 69.676 2.964 70.472 3.646 Ekonomi 74.219 5.719 71.511 4.663 70.491 4.365 Sosiologi 79.419 5.493 75.894 4.482 76.349 5.452 TIK 78.367 6.052 74.075 4.970 74.868 5.628
Rata-rata nilai rapor siswa jurusan IPA lebih tinggi dibandingkan jurusan IPS dan Bahasa pada hampir seluruh mata pelajaran kecuali Bahasa Jerman, yang selisihnya pun tidak jauh berbeda dengan siswa jurusan Bahasa. Hal ini menunjukkan bahwa siswa jurusan IPA tidak hanya menguasai mata pelajaran ciri khas IPA saja, namun mereka juga menguasai mata pelajaran lainnya. Meskipun demikian, simpangan baku untuk rata-rata rapor siswa jurusan IPA relatif lebih besar daripada jurusan lain, artinya nilai mata pelajaran untuk jurusan IPA cenderung lebih beragam dibandingkan jurusan IPS dan Bahasa.
Analisis Diskriminan
Analisis Diskriminan dimaksudkan untuk mengetahui sejauh mana peubah-peubah tersebut dapat menentukan kelompok jurusan siswa dan peubah-peubah mana yang menjadi penciri utama sebagai pembeda kelompok jurusan siswa di SMA. Peubah penciri yang akan diamati adalah Rataan nilai mata pelajaran Kelas X ( meliputi : Agama, PPKn, Bahasa Indonesia, Bahasa Inggris, Matematika, Fisika, Biologi, Kimia, Sejarah, Geografi, Ekonomi, Sosiologi, Teknologi Informasi dan Komunikasi (TIK), Bahasa Jerman), Jenis kelamin, Pendidikan ayah, Pendidikan ibu, Pekerjaan ayah, Pekerjaan ibu, dan Pendapatan orang tua.
Pemeriksaan Asumsi Dasar Diskriminan a. Asumsi kenormalan ganda
Hasil plot quantil khi-kuadrat terlihat polanya mengikuti trend linier baik untuk kelompok IPA, IPS maupun Bahasa (Lampiran 3). Kelinieran tersebut terlihat dari hubungan regresi linier antara jarak dan khi-kuadrat yang nyata pada taraf 𝛼 = 0.05, seperti yang terlihat pada Tabel 4.
Tabel 4 Nilai-p regresi linier tiap kategori
Jurusan Siswa Nilai-p
IPA IPS Bahasa .0001 .0001 .0001
Hasil tersebut menunjukkan bahwa hipotesis kenormalan ganda pada analisis diskriminan terpenuhi.
b. Asumsi kehomogenan ragam
Dillon dan Goldstein (1984) menyatakan bahwa salah satu asumsi untuk menghasilkan fungsi diskriminan yang optimal adalah matriks peragam dari peubah penjelas harus homogen. Sehingga dalam pemodelan diskriminan tidak semua peubah penjelas disertakan karena akan mengakibatkan asumsi kehomogenan ragam tidak terpenuhi. Peubah penjelas yang disertakan itu dapat dilihat pada Lampiran 6. Hasil pengujian Box’s M menunjukkan, bahwa matriks peragam untuk ketiga kategori sudah bersifat homogen dengan nilai signifikansi
sebesar 0.073 > 𝛼 = 0.05, maka asumsi kehomogenan matriks peragam peubah penjelas terpenuhi. Selanjutnya akan dilakukan analisis diskriminan.
Pembentukan Fungsi diskriminan
Fungsi diskriminan dibentuk dengan menggunakan metode stepwise
discriminant. Tabel 5 menunjukkan bahwa terdapat 5 peubah penjelas yang
cukup mewakili dalam melihat perbedaan antara kelompok IPA, IPS dan Bahasa. Kelima peubah itu adalah Bahasa Inggris, Fisika Kimia, Ekonomi dan TIK.
Tabel 5 Koefisien fungsi diskriminan
Peubah Fungsi 1 2 Bahasa Inggris -.028 .214 Fisika .219 -.023 Kimia .084 -.051 Ekonomi -.038 -.189 TIK -.060 .030 (Constant) -11.933 1.141
Peubah bertanda positif, artinya setiap kenaikan satu satuan nilai peubah maka akan memberikan skor yang makin tinggi bagi fungsi diskriminan. Sedangkan peubah bertanda negatif, artinya setiap kenaikan satu satuan nilai peubah maka akan memberikan skor yang makin rendah bagi fungsi diskriminan. Peranan relatif suatu fungsi diskriminan dalam memisahkan anggota-anggota kelompok diukur dari persentase relatif akar ciri yang berhubungan dengan fungsi diskriminan itu. Dengan memperhatikan akar ciri pada Lampiran 4, terlihat fungsi pertama adalah 92.5 dan fungsi kedua adalah 7.5, artinya persentase relatif yang dapat dijelaskan oleh fungsi diskriminan pertama adalah 92.5%, sedangkan sisanya sebesar 7.5 dijelaskan oleh fungsi diskriminan kedua.
Untuk mengetahui apakah fungsi diskriminan yang terbentuk dapat menjelaskan perbedaan peubah diantara 3 kelompok atau cukup melibatkan satu atau dua fungsi diskriminan. Adapun uji yang digunakan adalah statistik V-Bartlett melalui pendekatan uji khi-kuadrat. Lampiran 5 menunjukkan hasil yang signifikan, berarti diskriminan sisa setelah di terangkan oleh diskriminan satu
masih bersifat nyata secara statistik, dengan demikian diskriminan kedua masih diperlukan untuk menerangkan perbedaan peubah.
Dari fungsi diskriminan yang terbentuk melalui analisis diskriminan bertahap, lalu dilakukan pengklasifikasian. Pengklasifikasian suatu objek pengamatan baru pada fungsi diskriminan linier, dilakukan dengan mengacu pada konsep jarak bahwa pengklasifikasian suatu objek x dipilih dari jarak objek pengamatan x terhadap vektor rataanya yang terdekat/terkecil pada masing-masing jurusan. Rata-rata kelompok (group centroids) dari jurusan siswa mempunyai nilai yang besarnya berbeda, yaitu dapat dilihat pada Tabel 6. Secara umum keseluruhan proses pengklasifikasian dengan menggunakan fungsi diskriminan dapat dilihat pada Lampiran 9.
Tabel 6 Nilai Rata-rata Kelompok
Jurusan Siswa Fungsi
1 2
IPA 1.433 -.053
IPS -1.177 -.302
Bahasa -.751 .641
Ketepatan Klasifikasi Fungsi Diskriminan
Pengklasifikasian kelompok asal siswa menunjukkan bahwa 76.2% siswa yang diteliti dapat diklasifikasikan dengan benar ke dalam jurusannya sedang sisanya mengalami salah klasifikasi. Tabel 7 menunjukkan bahwa siswa IPA terklasifikasi dengan benar ke dalam jurusannya sebesar 83.8%, siswa IPS 73.4% dan siswa Bahasa 66.0%. Hal ini menunjukkan bahwa, 16.2% siswa IPA, 26.6% siswa IPS, dan 34% siswa Bahasa terklasifikasikan ke jurusan lain.
Tabel 7 Hasil klasifikasi analisis diskriminan Observasi Prediksi (%)
IPA IPS Bahasa Benar
IPA 88 7 10 83.8%
IPS 4 69 21 73.4%
Bahasa 4 14 35 66.0%
Statistik Q dari hasil klasifikasi kebenaran yang sebesar 76.2% adalah 208.3 dan nilai kritis 𝜒0.05(1)2 adalah 3.84. Terlihat statistik Q lebih besar dari nilai kritis sehingga klasifikasi kebenaran yang didapat sebesar 76.2%, secara statistik sudah baik.
Analisis Regresi Logistik Multinomial
Hasil pendugaan model penuh dengan melibatkan 20 peubah penjelas menghasilkan nilai G sebesar 399.939 dan nilai p= 0.000 < 0.05, sehingga dapat ditarik kesimpulan bahwa ada satu atau lebih peubah penjelas yang berpengaruh terhadap pengelompokkan jurusan siswa di SMA. Hasil dari pendugaan model penuh ini dapat dilihat pada Lampiran 2. Selanjutnya, dilakukan pemilihan peubah yang signifikan dengan menggunakan eliminasi langkah mundur. Hasil setelah seleksi dapat dilihat pada Tabel 8.
Tabel 8 Analisis multinomial logistik hasil eliminasi langkah mundur
Program Studi Wald df Sig. Exp(B) 95% C I for Exp(B) Lower Upper IPA Intercept 7.877 1 .005 Bhs_Jerman 24.947 1 .000 .617 .511 .746 Kimia 15.584 1 .000 1.752 1.326 2.314 Bhs_Inggris 16.356 1 .000 .659 .539 .807 [Jenis_Kelamin=1] .127 1 .721 .720 .119 4.376 Agama 5.707 1 .017 1.236 1.039 1.472 Matematika 33.057 1 .000 2.030 1.595 2.584 Sejarah .237 1 .626 .932 .703 1.236 Ekonomi .119 1 .730 .970 .814 1.155 IPS Intercept .483 1 .487 Bhs_Jerman 18.557 1 .000 .735 .639 .846 Kimia .027 1 .869 1.011 .886 1.154 Bhs_Inggris 5.923 1 .015 .863 .767 .972 [Jenis_Kelamin=1] 8.004 1 .005 4.867 1.626 14.565 Agama 1.701 1 .192 1.072 .966 1.190 Matematika .396 1 .529 1.048 .906 1.212 Sejarah 5.625 1 .018 1.249 1.039 1.500 Ekonomi 5.824 1 .016 1.180 1.032 1.350
Berdasarkan Tabel 8, diperoleh nilai G sebesar 352.295 dengan nilai p = 0.000 < 0.05. Oleh karena itu, dapat dikatakan bahwa model ini
berpengaruh nyata pada taraf 5%, sehingga dapat dibentuk model logistik multinomial sebagai berikut:
𝑔 1 𝑥 = −32.094 + 0.212𝑋1 − 0.417𝑋4 + 0.708𝑋5 + 0.561𝑋8 − 0.070𝑋9− 0.031𝑋11 − 0.483𝑋14 − 0.328𝑋15
𝑔 2 𝑥 = −4.707 + 0.070𝑋1 − 0.147𝑋4 + 0.047𝑋5 + 0.011𝑋8 − 0.222𝑋9− 0.166𝑋11 − 0.307𝑋14 − 0.047𝑋15
Interpretasi model regresi logistik multinomial akan lebih mudah dilihat dari nilai rasio oddsnya. Jika suatu peubah memiliki nilai koefisien yang bertanda positif maka nilai rasio odds diatas satu, sedangkan nilai koefisien yang bertanda negatif maka nilai rasio odds dibawah satu.
Pada model pertama terdapat lima peubah penjelas yang signifikan. Interpretasinya adalah setiap bertambahnya satu nilai pada pelajaran Bahasa Jerman maka akan menurunkan peluang siswa masuk ke jurusan IPA menjadi 0.617 kali dibandingkan ke jurusan Bahasa. Setiap bertambahnya satu nilai pada pelajaran Kimia maka akan meningkatkan peluang siswa masuk ke jurusan IPA sebesar 1.752 kali dibandingkan ke jurusan Bahasa. Setiap bertambahnya satu nilai Bahasa Inggris maka akan menurunkan peluang siswa masuk ke jurusan IPA sebesar 0.659 kali dibandingkan ke jurusan Bahasa. Untuk nilai odds Agama sebesar 1.236, artinya siswa lebih cenderung memilih jurusan IPA sebesar 1.236 dibanding Bahasa Setiap bertambahnya satu nilai pada pelajaran Matematika maka akan meningkatkan peluang siswa masuk ke jurusan IPA sebesar 2.030 kali dibanding ke jurusan Bahasa.
Pada model mutinomial logistik kelompok dua terdapat lima peubah penjelas yang signifikan. Interpretasinya adalah setiap bertambahnya satu nilai pada pelajaran Bahasa Jerman maka akan menurunkan peluang siswa masuk ke jurusan IPS sebesar 0.735 kali dibanding ke jurusan Bahasa. Setiap bertambahnya satu nilai pada pelajaran Bahasa Inggris maka akan menurunkan peluang siswa masuk ke jurusan IPS sebesar 0.863 kali dibanding ke jurusan Bahasa. Peubah jenis kelamin dengan dugaan rasio odds sebesar 4.867 yang berarti bahwa siswa laki-laki di duga 4.867 kali akan lebih memilih jurusan IPS sebagai pilihan pertama dibandingkan memilih Bahasa. Setiap bertambahnya satu nilai pada pelajaran Sejarah maka akan meningkatkan peluang siswa masuk ke jurusan IPS sebesar 1.249 kali dibanding ke jurusan Bahasa. Setiap bertambahnya satu nilai pada pelajaran Ekonomi maka akan meningkatkan peluang siswa untuk masuk ke dalam jurusan IPS sebesar 1.180 kali dibanding ke jurusan Bahasa.
Evaluasi Kebaikan Model
Menurut Hosmer dan Lemeshow (1989) salah satu ukuran kebaikan model adalah jika memiliki peluang kesalahan klasifikasi yang minimal. Ketepatan dan kesalahan klasifikasi dapat dilihat dalam tabel klasifikasi.
Tabel 9 Hasil prediksi multinomial logistik Observasi Prediksi (%)
IPA IPS Bahasa Benar
IPA 100 4 1 95.2%
IPS 6 75 13 79.8%
Bahasa 3 14 36 67.9%
% Keseluruhan 83.7%
Berdasarkan Tabel 9 diperoleh total ketepatan klasifikasi analisis regresi logistik multinomial sebesar 83.7 %. Artinya model logistik multinomial mampu mengklasifikasikan siswa ke dalam jurusannya dengan benar sebesar 83.7% dari total siswa keseluruhan. Untuk masing-masing jurusan, model logistik mampu mengklasifikasikan siswa IPA dengan benar sebesar 95.2%, siswa IPS 79.8%, dan siswa Bahasa 67.9%. Hal ini menunjukkan bahwa 4.8% siswa IPA, 20.2% siswa IPS, dan 32.1% siswa Bahasa terklasifikasikan ke jurusan lain.
Pembangunan Analisis Model Diskriminan dan Logistik Multinomial dari Hasil Resampling
Untuk mengevaluasi kekonsistenan peubah-peubah yang masuk dalam model, dilakukan fitting model dengan resampling 30 kali menggunakan analisis diskriminan dan regresi logistik multinomial terhadap data siswa SMA Negeri Siau Timur yang berjumlah 252 pengamatan. Peubah dikatakan konsisten apabila jumlah kemunculannya pada model memberikan pengaruh yang signifikan sebanyak 10 kali atau lebih. Jumlah signifikansi peubah dari hasil resampling untuk analisis diskriminan dan logistik multinomial dapat dilihat pada pada Lampiran 7 dan Lampiran 8.
Analisis Diskriminan
Penentuan peubah penjelas berdasarkan kekonsistenan yang diperoleh melalui
resampling menghasilkan tiga peubah penjelas yang berpengaruh terhadap
pengelompokkan jurusan siswa. Peubah-peubah tersebut adalah Bahasa Indonesia, Biologi dan Sosiologi (Tabel 10). Tingkat ketepatan klasifikasi yang dihasilkan dari model analisis diskriminan adalah 60.3% (Tabel 11).
Tabel 10 Fungsi Diskriminan
Peubah Fungsi 1 2 Bahasa Indonesia .055 .269 Biologi .187 -.117 Sosiologi -.023 -.081 (Constant) -16.616 -5.462
Tabel 11 Hasil Klasifikasi Analisis Diskriminan Observasi Prediksi (%)
IPA IPS Bahasa Benar
IPA 68 12 25 64.8 %
IPS 10 60 24 63.3%
Bahasa 11 18 24 45.3%
% Keseluruhan 60.3%
Analisis Regresi Logistik Multinomial
Peubah-peubah penjelas dengan signifikansi yang konsisten diperoleh sebanyak 15 peubah, di antaranya adalah Bahasa Jerman, Bahasa Inggris, Kimia, Matematika, dan Sejarah (Lampiran 7). Pemodelan analisis regresi logistik multinomial dibangun menggunakan peubah-peubah tersebut, hasilnya dapat dilihat pada Tabel 12. Untuk mengelompokkan siswa ke jurusan IPA, peubah yang berpengaruh adalah mata pelajaran Agama, Bahasa Inggris, Matematika, Kimia, Bahasa Jerman, dan Pendidikan Ayah. Sedangkan untuk mengelompokkan siswa ke jurusan IPS, peubah-peubah yang mempengaruhinya adalah mata pelajaran Bahasa Inggris, Biologi, Sejarah, Geografi, Ekonomi, Bahasa Jerman, dan Jenis Kelamin.
Hasil pemodelan regresi logistik multinomial menunjukkan bahwa dari empat mata pelajaran yang menjadi ciri khas jurusan IPA, ternyata hanya Matematika dan Kimia yang berpengaruh nyata. Hal ini disebabkan oleh korelasi yang cukup kuat antar mata pelajaran. Lampiran 10 menunjukkan bahwa mata pelajaran Fisika memiliki korelasi sebesar 0.823 terhadap Matematika, sementara mata pelajaran Biologi memiliki korelasi sebesar 0.769 terhadap Kimia. Artinya, kemampuan siswa untuk mata pelajaran Fisika dan Biologi sudah tercermin melalui mata pelajaran Matematika dan Kimia.
Tabel 12 Hasil dugaan parameter multinomial logistik
Program Studi B Wald db Sig. Exp(B) 95% C I for Exp(B) Lower Upper IPA Intercept -51.542 8.355 1 .004 Agama .357 4.219 1 .040 1.429 1.016 2.008 PPKn .039 .050 1 .824 1.040 .738 1.466 Bahasa_Inggris -.597 14.280 1 .000 .550 .404 .750 Matematika .815 24.005 1 .000 2.260 1.631 3.132 Biologi .199 1.219 1 .270 1.221 .857 1.739 Kimia .724 12.516 1 .000 2.063 1.381 3.080 Sejarah -.162 .285 1 .593 .851 .470 1.539 Geografi -.058 .073 1 .787 .944 .621 1.435 Ekonomi -.045 .144 1 .705 .956 .756 1.208 Bahasa_Jerman -.572 24.045 1 .000 .564 .449 .709 [Pendidikan_Ayah=1] 3.555 3.577 1 .059 35.001 .879 1394.017 [Pendidikan_Ayah=2] 4.404 4.714 1 .030 81.751 1.535 4354.807 [Pendidikan_Ibu=1] -.186 .011 1 .918 .830 .024 28.574 [Pendidikan_Ibu=2] -1.965 1.185 1 .276 .140 .004 4.821 [Pendapatan=1] -2.057 2.116 1 .146 .128 .008 2.044 [Pendapatan=2] .663 .277 1 .599 1.941 .164 22.903 [Jenis_Kelamin=1] .141 .014 1 .906 1.151 .112 11.794 IPS Intercept -3.928 .256 1 .613 Agama -.055 .481 1 .488 .946 .810 1.106 PPKn .171 2.735 1 .098 1.187 .969 1.454 Bahasa_Inggris -.177 6.072 1 .014 .838 .728 .964 Matematika .009 .012 1 .913 1.009 .853 1.194 Biologi .237 5.915 1 .015 1.268 1.047 1.535 Kimia -.090 1.056 1 .304 .914 .769 1.085 Sejarah .394 7.436 1 .006 1.483 1.117 1.970 Geografi -.287 4.431 1 .035 .750 .574 .980 Ekonomi .179 4.890 1 .027 1.197 1.021 1.403 Bahasa_Jerman -.361 17.484 1 .000 .697 .588 .825 [Pendidikan_Ayah=1] 1.057 1.056 1 .304 2.877 .383 21.603 [Pendidikan_Ayah=2] -.710 .480 1 .488 .491 .066 3.664 [Pendidikan_Ibu=1] .630 .497 1 .481 1.877 .326 10.813 [Pendidikan_Ibu=2] 1.354 2.239 1 .135 3.872 .657 22.809 [Pendapatan=1] -.862 1.118 1 .290 .422 .085 2.087 [Pendapatan=2] -.640 .673 1 .412 .528 .114 2.431 [Jenis_Kelamin=1] 1.962 8.170 1 .004 7.111 1.853 27.297
Model klasifikasi yang disusun menggunakan analisis regresi logistik multinomial memiliki tingkat ketepatan klasifikasi sebesar 88.1% (Tabel 13). Ketepatan klasifikasi model ini lebih tinggi jika dibandingkan dengan model sebelum dilakukan resampling. Hal ini berarti bahwa model logistik multinomial cukup baik dalam mengklasifikasikan siswa ke dalam jurusannya dengan tepat sebanyak 88.1% dari total siswa.
Tabel 13 Ketepatan Klasifikasi Model Logistik multinomial Observasi Prediksi (%)
IPA IPS Bahasa Benar
IPA 99 5 1 94.3%
IPS 4 83 7 88.3%
Bahasa 2 11 40 75.5%
% Keseluruhan 88.1%
Perbandingan Hasil Klasifikasi Analisis Diskriminan dan Logistik Multinomial
Perbandingan hasil klasifikasi analisis diskriminan dan regresi logistik multinomial dalam mengklasifikasi siswa ke dalam jurusan IPA, IPS, dan Bahasa dapat dilihat dari tingkat ketepatan klasifikasi. Semakin besar persentase ketepatan klasifikasi suatu model maka semakin baik dan akurat model tersebut dalam mengklasifikasi jurusan siswa.
Tabel 14 Ketepatan klasifikasi
Model Model Sebelum Resampling (%)
Model Sesudah
Resampling
(%)
Analisis Diskriminan 76.2 60.3
Regresi Logistik Multinomial 83.7 88.1
Berdasarkan Tabel 14, diperoleh informasi bahwa tingkat ketepatan klasifikasi yang dihasilkan model regresi logistik multinomial telah melebihi 80%, baik pada model sebelum maupun sesudah resampling. Sementara tingkat ketepatan klasifikasi model analisis diskriminan sebesar 76.2% pada model
sebelum resampling, dan 60.3% pada model sesudah resampling. Hal ini menunjukkan bahwa regresi logistik multinomial mampu memberikan tingkat ketepatan klasifikasi yang lebih tinggi dibandingkan model analisis diskriminan. Dengan demikian, regresi logistik multinomial merupakan model terbaik yang dapat digunakan untuk menduga siswa memilih jurusan di SMA. Bentuk persamaan logistik multinomial adalah :
𝑔 1 𝑥 = −51.542 + 0.357𝑋1 + 0.039𝑋2− 0.597𝑋4 + 0.815𝑋5 + 0.199𝑋7+ 0.724𝑋8 − 0.162𝑋9 − 0.058𝑋10− 0.045𝑋11− 0.572𝑋14+ 0.141𝑋15+ 3.555𝑋16(1)+ 4.404𝑋16(2)− 0.186𝑋17(1)− 1.965𝑋17(2)− 2.057𝑋20(1)+ 0.663𝑋20(2) 𝑔 2 𝑥 = −3.928 − 0.055𝑋1 + 0.171𝑋2 − 0.177𝑋4 + 0.009𝑋5 + 0.237𝑋7 − 0.090𝑋8 + 0.394𝑋9 − 0.287𝑋10+ 0.179𝑋11− 0.361𝑋14+ 1.962𝑋15+ 1.057𝑋16(1)− 0.710𝑋16(2) + 0.630𝑋17(1)+ 1.354𝑋17(2)− 0.862𝑋20(1)+ 0.640𝑋20(2)
Penerapan Model Logistik multinomial
Nilai peluang pada Tabel 13 memberikan informasi mengenai penerapan model logistik multinomial dalam mengelompokkan jurusan siswa di SMA Negeri Tagulandang Kabupaten Siau Tagulandang Biaro. Peluang seorang siswa untuk masuk ke dalam kategori jurusan tertentu dapat dihitung berdasarkan ilustrasi data pada Tabel 15.
Tabel 15 Ilustrasi data siswa
Peubah bebas Nilai Peubah bebas Nilai
Rataan Nilai Agama 90.0 Rataan Nilai Geografi 75.0 Rataan Nilai PPKn 84.5 Rataan Nilai Ekonomi 71.5 Rataan Nilai Bhs Inggris 67.5 Rataan Nilai Bhs Jerman 83.5 Rataan Nilai Matematika 73.0 Jenis Kelamin Laki-laki Rataan Nilai Biologi 80.0 Pendidikan Ayah SD Rataan Nilai Kimia 70.0 Pendidikan Ibu SD Rataan Nilai Sejarah 87.0 Pendapatan ≤ 1 juta
Sehingga dapat dihitung nilai untuk model logit pertama, yaitu: g 1 x = −51.542 + 0.357 90 + 0.039 84.5 − 0.597 67.5 + 0.815 73 + 0.199 80 + 0.724 70 − 0.162 87 − 0.058 75 − 0.045 71.5 − 0.572 83.5 + 0.141 1 + 3.555 1 + 4.404 0 − 0.186 1 − 1.965 0 − 2.057 1 + 0.663 0 g 1 x = 1.7105
dan nilai untuk model logit kedua, yaitu:
g 2 x = −3.928 − 0.055 90 + 0.171 84.5 − 0.177 67.5 + 0.009 73 + 0.237 80 − 0.090 70 + 0.394 87 − 0.287 75 + 0.179 71.5 − 0.361 83.5 + 1.962 1 + 1.057 1 − 0.710 0 + 0.630 1 + 1.354 0 − 0.862 1 − 0.640(0)
g 2 x = 5.136
Hasil dari model logit dimasukkan ke fungsi peluang, sebagai berikut :
P Y = 0 x = π0 x = 1 1+exp g1 x + exp g2 x = 0.005664 P Y = 1 x = π1 x = exp g1 x 1+exp g1 x + exp g2 x = 0.03133 P Y = 2 x = π2 x = exp g2 x 1+exp g1 x + exp g2 x = 0.963007
Nilai peluang terbesar adalah P Y = 2 x = π2 x = 0.963007, artinya siswa masuk ke kategori kedua. Hasil perhitungan lengkap untuk model logistik multinomial dari data siswa SMA Negeri Tagulandang disajikan pada Tabel 16. Ketepatan klasifikasi yang diperoleh model tersebut adalah 70.6%, artinya sebanyak 70.6% siswa SMA Negeri Tagulandang dapat diklasifikasikan dengan benar ke dalam kejurusannya masing-masing. Hal ini menunjukkan bahwa kemampuan model sudah cukup baik dalam mengelompokan siswa ke dalam jurusannya.
Tabel 16 Hasil ketepatan validasi model Observasi Prediksi (%)
IPA IPS Bahasa Benar
IPA 55 16 12 66.3%
IPS 5 48 9 77.4%
Bahasa 0 8 17 68.0%
SIMPULAN DAN SARAN SIMPULAN
Penerapan analisis diskriminan dan regresi logistik multinomial dalam mengelompokkan siswa SMA Negeri Siau Timur memberikan ketepatan klasifikasi masing-masing sebesar 76.2% dan 83.7%. Berdasarkan penentuan peubah dari proses resampling sebanyak 30 kali, diperoleh model terbaik yaitu regresi logistik multinomial dengan tingkat ketepatan klasifikasi sebesar 88.1%.
Pengelompokkan siswa ke dalam jurusan IPA atau Bahasa dipengaruhi oleh mata pelajaran Matematika, Bahasa Inggris, Kimia, dan Bahasa Jerman. Pengelompokkan siswa ke dalam jurusan IPS atau Bahasa dipengaruhi oleh mata pelajaran Ekonomi, Bahasa Inggris, Bahasa Jerman, dan Sejarah. Validasi model yang dilakukan dengan menggunakan data SMA Negeri Tagulandang memberikan ketepatan klasifikasi sebesar 70.6%. Hal ini menunjukkan bahwa kemampuan model regresi logistik multinomial sudah cukup baik dalam mengelompokan siswa ke dalam jurusannya.
SARAN
Penelitian lanjutan dapat dilakukan untuk studi kasus dengan mengambil sampel yang berbeda. Peneliti berikutnya dapat melakukan penelitian tentang penjurusan, apakah benar nilai Biologi merupakan salah satu penentu untuk jurusan IPS sebagaimana penulis temukan pada penelitian ini.
DAFTAR PUSTAKA
Andanawari AG. 2010. Faktor-Faktor yang Mempengaruhi Minat Siswa Melanjutkan Pendidikan ke Perguruan Tinggi dengan Menggunakan Regresi Logistik. [tesis] Bogor. Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
Cacoullos T. 1973. Discriminant Analysis and Applications. New York and London: Academic Press.
Depdiknas. 2004. Pedoman Umum Pengembangan Penilaian. Departemen Pendidikan Nasional.
Dillon W, Goldstein M. 1984. Multivariate Analysis. New York: Wiley.
Garson. 2010. Logistic Regression: Statnotes. North Carolina State University.
http://faculty.chass.ncsu.edu/garson/PA765/Logistic.htm/ [31 Januari 2012]. Gaspersz V. 1992. Teknik Analisis dalam Penelitian Percobaan. Ed ke-1. Tarsito
Bandung.
Ghozali. 2006. Aplikasi Analisis Multivariate dengan program SPSS. Universitas Diponegoro.
Gnanadesikan R. 1977. Methods for Statistical Data Analysis of Multivariate Observations. New York: John Wiley & Sons.
Hair JF, Anderson RE, Tatham RL, Black WC. 1995. Multivariate Data Analysis
with Readings. New Jersey: Prentice-Hall.
Hosmer DW, Lemeshow S. 2000. Applied Logistic Regression. New York: John Wiley & Sons.
Johnson RA, Wichern DW. 1998. Applied Multivariate Statistical Analysis Ed ke-4. New Jersey: Hall.
Maulias SS. 2009. Klasifikasi Penjurusan Siswa SMK Negeri 1 Tual Maluku Tenggara dengan Pendekatan Analisis Diskriminan dan regresi Logistik Multinomial. [tesis]. Surabaya. Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Teknologi Sepuluh Nopember.
Morrison DF. 1990. Multivariate Statistical Methods Ed ke-3. McGraw-Hill Publishing Company.
Murniramli. 2008. Penjurusan di SMA. http://murniramli.wordpress.com/ [31 Januari 2012].