PREDIKSI KEBERHASILAN MAHASISWA PROGRAM MAGISTER
SAINS IPB MENGGUNAKAN METODE POHON REGRESI DATA
LENGKAP DAN DATA TERSENSOR
SUCI KHARISMA LARASATI
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
RINGKASAN
SUCI KHARISMA LARASATI. Prediksi Keberhasilan Mahasiswa Program Magister Sains IPB Menggunakan Metode Pohon Regresi Data Lengkap dan Data Tersensor. Dibimbing oleh KHAIRIL ANWAR NOTODIPUTRO dan BAGUS SARTONO.
Tingkat keberhasilan mahasiswa program Magister Sains IPB dapat diukur dari Indeks Prestasi Kumulatif (IPK) yang dicapai dan masa studinya. Pada penelitian ini dikaji faktor-faktor yang mempengaruhi tingkat keberhasilan mahasiswa program Magister Sains IPB pada masing-masing program studi melalui pembentukan pohon regresi. Salah satu kriteria untuk menghentikan pemisahan pada metode pohon regresi adalah pemilihan banyaknya amatan minimum pada setiap simpul akhir. Amatan minimum yang membuat kuadrat tengah galat baik pada training maupun test sample relatif kecil adalah 5% dari ukuran training sample.
Dalam penelitian ini data masa studi mahasiswa aktif dipandang sebagai data tersensor karena waktu terjadinya kelulusan tidak dapat diamati selama masa penelitian sehingga terlebih dahulu diduga menggunakan analisis daya tahan (Survival Analysis). Hasil dugaannya akan digunakan sebagai peubah respon yang baru dalam pohon regresi sehingga pohon regresi untuk masa studi disebut sebagai pohon regresi data tersensor. Ketidaklengkapan data masa studi mahasiswa aktif yang diatasi dengan menggunakan analisis daya tahan membuat model pohon regresi yang dihasilkan semakin bagus. Pohon regresi masa studi yang diduga dengan analisis daya tahan mampu menghasilkan nilai koefisien determinasi yang lebih besar dari model yang belum diduga dengan analisis daya tahan baik pada data training maupun data test. Sedangkan evaluasi dengan menggunakan MAPE menunjukkan bahwa model training dan model test yang diatasi dengan analisis daya tahan memiliki galat yang lebih kecil dari model tanpa analisis daya tahan. Namun pada model yang diatasi dengan analisis daya tahan terdapat masalah korelasi antar peubah respon masa studi (Y) yang mengakibatkan pendugaan keragaman galat menjadi underestimate (dugaan galat lebih kecil dari nilai galat yang sebenarnya). Hal ini dapat membuat seolah-olah model menjadi fit padahal tidak fit.
Pohon regresi yang dibangun pada masing-masing program studi menunjukkan bahwa peubah yang paling mempengaruhi nilai IPK S2 adalah status perguruan tinggi asal, akreditasi PS S1, kesesuaian program studi di S2 dengan S1, dan usia pada saat diterima sebagai mahasiswa S2. Sedangkan peubah yang paling mempengaruhi masa studi adalah adalah sumber biaya pendidikan pada saat diterima sebagai mahasiswa S2, status perguruan tinggi asal, akreditasi PS S1, jenis pekerjaan, IPK S1, dan durasi dari lulus S1 sampai diterima di S2.
Kata kunci: pohon regresi data lengkap, pohon regresi data tersensor, analisis daya tahan
ABSTRACT
SUCI KHARISMA LARASATI. Successful Prediction of IPB Magister Science Program Student Using Complete Data and Censored Data Regression Tree Method. Supervised by KHAIRIL ANWAR NOTODIPUTRO and BAGUS SARTONO.
The successful rate of IPB Magister Science program student can be measured by using Grade Point Average (GPA) achieved and length of study. This research examine the factors that influence the successful rate of IPB Magister Science program student in every study program through forming regression tree. One of stopping criteria in regression tree method is by choosing the amount of minimum observation in every terminal node. Minimum observation used to relatively minimize Mean Squared Error (MSE) in training as well as sample test is by using 5% of training sample size.
This research sees length of study as censored data because the graduate timing can not be observed in research period. The length of study estimated by using Survival Analysis. The estimated result used as new response variable in regression tree which can be viewed as censored data regression tree. Incompleteness of student length of study can be managed by using survival analysis which can result a better regression tree model. Length of study regression tree which is
estimated by using survival analysis can be able to produce a bigger determinant coefficient value compared with unestimated training data as well as data test by survival analysis. Meanwhile, the evaluation using MAPE can show that estimated training model and test model managed by survival analysis can produce smaller error instead of unanalyzed survival analysis. However, there is a problem for length of study intervariable correlation (Y) which can result underestimated error variance (estimated error is lower than the true error value). This can result inappropriate model.
The regression tree applied for every study program can show that the most influencing variable for S2 GPA is previous university, PS S1 accreditation, the appropriateness of study program in S2 and S1, and the age of student when enter S2. Meanwhile, the most influencing variable for length of study is education financial sources, previous university, PS S1 accreditation, kind of job, S1 GPA, and duration from graduating S1 to enter S2.
PREDIKSI KEBERHASILAN MAHASISWA PROGRAM MAGISTER
SAINS IPB MENGGUNAKAN METODE POHON REGRESI DATA
LENGKAP DAN DATA TERSENSOR
\
SUCI KHARISMA LARASATI
Skripsi
Sebagai salah satu syarat untuk memperoleh gelar Sarjana Sains
pada Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
Judul : Prediksi Keberhasilan Mahasiswa Program Magister Sains IPB
Menggunakan Metode Pohon Regresi Data Lengkap dan Data Tersensor
Nama : Suci Kharisma Larasati
NRP : G14103030
Menyetujui :
Pembimbing I,
Pembimbing II,
Prof. Dr. Ir. Khairil Anwar Notodiputro, M.S.
NIP 130891386
Bagus Sartono, S.Si, M.Si
NIP 132311923
Mengetahui :
Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Pertanian Bogor
Dr. Drh. Hasim, DEA
NIP 131578806
RIWAYAT HIDUP
Penulis dilahirkan di Jakarta tanggal 17 Juni 1985 sebagai anak ketiga dari empat bersaudara dari pasangan Slamet Edy Wiyanto dan Winny Wardhiny.
Pendidikan dasar diselesaikan penulis pada tahun 1997 di SDN Rawa Sapi Bekasi, kemudian tahun 2000 tamat dari SLTP Negeri 5 Tambun Bekasi. Tahun 2003 penulis lulus dari SMUN 1 Bekasi dan pada tahun yang sama diterima sebagai mahasiswa di Departemen Statistika Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI).
Selama mengikuti perkuliahan, penulis pernah aktif berorganisasi sebagai Staf Departemen Kajian Strategis Himpunan Profesi Gamma Sigma Beta dan Manajer Divisi Statistical Science Decision Centre Himpunan Profesi Gamma Sigma Beta. Selain itu, penulis juga pernah mengikuti beberapa kegiatan kepanitiaan seperti Matematika Ria se-Sumatera, Jawa, Bali, Kalimantan dan Sulawesi 2005 dan Studium General & Pelatihan Software SPSS pada tahun yang sama.
Pada bulan Februari-April 2007 penulis diberi kesempatan untuk praktek lapang di Sekolah Pascasarjana IPB, Bogor. Penulis pernah menjadi Asisten Dosen Metode Statistika II pada Semester Genap Tahun Ajaran 2005/2006 dan Metode Statistika pada Semester Ganjil Tahun Ajaran 2006/2007.
KATA PENGANTAR
Alhamdulillah. Segala puji dan rasa syukur penulis panjatkan kehadirat Allah SWT atas segala karunia-Nya sehingga karya ilmiah ini dapat terselesaikan. Shalawat serta salam semoga senantiasa tercurahkan kepada rasul utusan mulia Muhammad saw.
Karya ilmiah merupakan salah satu syarat untuk memperoleh gelar Sarjana Sains pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor. Karya ilmiah ini memuat kajian statistik untuk memprediksi keberhasilan mahasiswa program Magister Sains IPB dengan menggunakan metode pohon regresi data lengkap dan data tersensor.
Terima kasih, kepada semua pihak yang telah berperan serta dalam penyusunan karya ilmiah ini yaitu kepada :
1. Bapak Prof.Dr.Ir. Khairil Anwar Notodiputro, M.S. dan Bapak Bagus Sartono, S.Si, M.Si atas bimbingan dan saran-sarannya selama menyelesaikan tugas akhir ini.
2. Mama dan Papaku tercinta atas do’a, kasih sayang, kesabaran dan segala dukungan lainnya yang diberikan sehingga mendorong penulis untuk memberikan yang terbaik. 3. Mas Faisalku terscinta dan tersayang atas motivasi, perhatian dan kasih sayang yang
diberikan kepada penulis sehingga penulis mampu bangkit kembali dikala sedang jatuh. 4. Saudari-saudariku (Mba Shinta, Ucrit dan Anul) atas keceriaan yang diberikan.
5. Sahabat-sahabatku di Sunflower Girls (Lintang, Ash, Esi, Muti, Memei, dan Indri). Memiliki kalian sebagai sahabat adalah kenangan yang terindah.
6. Semua kawan-kawanku tersayang di 40, adik-adik kelas 41 dan 42 terima kasih atas kebersamaannya selama ini.
7. Mba Fatma, Mas Aman, Bu Tanti, Bu Heni, Mba Anna, Bapak Syamsuar, Bapak Soleh dan seluruh staf Sekolah Pascasarjana yang telah banyak membantu dalam pelaksanaan Praktek Lapang dan proses pengambilan data.
8. Bu Markona, Bu Sulis, Bu Dede, Bu Aat, Pak Iyan, Bang Sudin, Mang Herman dan Gusdur atas segala bantuan yang diberikan serta seluruh staf pengajar Departemen Statistika yang telah membuka wawasan dan pengetahuan selama penulis menuntut ilmu di IPB.
9. Mas Ali, Mas Hadi, Mas Dadin, Mas Heri, dan “Mas-mas” lainnya di Regenstadt Computer yang telah membantu menangani laptop penulis disaat sedang rewel.
10. Semua pihak yang tidak mugkin disebutkan satu-persatu yang telah membantu penulis selama ini.
Semoga semua amal baik dan bantuan yang telah diberikan kepada penulis mendapat balasan dari Allah SWT, dan semoga karya ilmiah ini dapat bermanfaat bagi semua pihak yang membutuhkan
Bogor, Mei 2008
DAFTAR ISI
Halaman DAFTAR GAMBAR ... ix DAFTAR LAMPIRAN ... ix PENDAHULUAN ... 1 Latar Belakang ... 1 Tujuan ... 1Ruang Lingkup Penelitian... 1
TINJAUAN PUSTAKA ... 2
Metode Pohon Regresi ... 2
CART ... 3
Algoritma Pohon Regresi dalam CART... 3
Aturan Pemisahan... 3
Proses Pemisahan... 3
Aturan Penghentian... 4
Statistik pada Simpul Akhir... 4
Koefisien Determinasi (R2)... 4
MAPE (Mean Absolute Percentage Error)... 4
Analisis Daya Tahan... 4
Waktu Ketahanan... 4
Jenis-jenis Sensoring... 4
Fungsi Ketahanan dan Fungsi Hazard... 4
Model Regresi Hazard Proporsional Cox………... 5
METODOLOGI ... 6
Data ... 6
Metode Analisis ... 6
HASIL DAN PEMBAHASAN ... 7
Karakteristik Mahasiswa Pada Masing-masing Program Studi S2 IPB ... 7
Tingkat Keberhasilan Mahasiswa S2... 7
Simulasi Aturan Penghentian Pada Metode Pohon Regresi ... 7
Pendugaan Fungsi Ketahanan Pada Data Masa Studi Mahasiswa Aktif... 8
Pohon Regresi Untuk Masing-masing Program Studi... 8
1. Pohon Regresi IPK S2... 8
2. Pohon regresi Masa Studi S2... 10
KESIMPULAN DAN SARAN ... 11
Kesimpulan... 11
Saran... 12
DAFTAR PUSTAKA ... 12
DAFTAR GAMBAR
Halaman
Gambar 1. Struktur Pohon Regresi ... 2
Gambar 2. Fungsi Ketahanan Masa Studi Seorang Mahasiswa Aktif Pada PS EPN... 8
DAFTAR LAMPIRAN
Halaman Lampiran 1. Frekuensi dan Persentase Mahasiswa S2 SPs IPB Pada Masing-masing Program Studi...14Lampiran 2. Deskripsi Peubah-peubah Kategorik Pada Seluruh Program Studi ... 14
Lampiran 3. Deskripsi Peubah-peubah Kontinu Pada Seluruh Program Studi ... 15
. Lampiran 4. Deskripsi Peubah-peubah Kategorik Pada Masing-masing Program Studi S2... .. 16
Lampiran 5. Deskripsi Peubah-peubah Kontinu Pada Masing-masing Program Studi S2 ...20
Lampiran 6. Algoritma Simulasi Aturan Penghentian Pada Metode Pohon Regresi... 23
Lampiran 7. Hasil Simulasi Aturan Penghentian Pada Metode Pohon Regresi ... 24
Lampiran 8. Pohon Regresi IPK S2 Program Studi EPN... 27
Lampiran 9. Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS EPN... 28
Lampiran 10.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS EPN...28
Lampiran 11.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS SPD...29
Lampiran 12.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS SPD... 29
Lampiran 13.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS PWD... 30
Lampiran 14.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS PWD...30
Lampiran 15.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS TNH... 31
Lampiran 16.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS TNH...31
Lampiran 17.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS DAS... 32
Lampiran 18.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS DAS...32
Lampiran 19.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS AGR... 33
Lampiran 20.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS AGR...33
Lampiran 21.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS ARL... 34
Lampiran 22.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS ARL...34
Lampiran 23.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS ENT/FIT... 35
Lampiran 24.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS ENT/FIT...35
Lampiran 25.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS GMK... 36
Lampiran 26.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS GMK...36
Lampiran 27.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS BRP... 37
Lampiran 27.Deskripsi Tiap Kelompok Nilai IPK S2 dari Pohon Regresi PS BRP... 37
Lampiran 30.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS SVT...38
Lampiran 31.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS KMV...39
Lampiran 32.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS KMV...39
Lampiran 33.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS AIR...40
Lampiran 34.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS AIR...40
Lampiran 35.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS SPL...41
Lampiran 36.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS SPL...41
Lampiran 37.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS TKL...42
Lampiran 38.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS TKL...42
Lampiran 39.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS IKL...43
Lampiran 40.Deskripsi Tiap Kelompok Nilai Masa Studi S2 dari Pohon Regresi PS IKL...43
Lampiran 41.Evaluasi Model dengan Menggunakan Koefisien Determinasi (R2)... 44
Lampiran 42.Evaluasi Model dengan Menggunakan Koefisien Mean Absolute Percentage Error (MAPE)... 45
PENDAHULUAN
Latar BelakangRegresi dalam statistika adalah salah satu metode untuk memodelkan hubungan suatu peubah dengan peubah yang lain. Analisis regresi merupakan salah satu analisis yang paling populer dan luas pemakaiannya. Hampir semua bidang ilmu yang memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini. Penerapannya dapat dijumpai secara luas di banyak bidang seperti teknik, ekonomi, pendidikan, manajemen, ilmu-ilmu biologi, ilmu-ilmu sosial, dan ilmu-ilmu pertanian.
Salah satu masalah yang dapat dijawab dengan analisis regresi adalah memprediksi keberhasilan mahasiswa program Magister Sains IPB berdasarkan indikator-indikator awal pada saat mahasiswa tersebut menjadi mahasiswa IPB. Tingkat keberhasilan tersebut dapat dilihat dari prestasi akademiknya. Hal ini dapat diukur dari Indeks Prestasi Kumulatif (IPK) yang dicapai dan masa studinya. Kombinasi keberhasilan yang diharapkan adalah mahasiswa yang lulus dengan masa studi cepat dan memperoleh IPK tinggi.
Metode pohon regresi merupakan metode alternatif dari teknik regresi yang dapat digunakan dalam memprediksi keberhasilan mahasiswa program Magister Sains IPB. Metode ini dapat mengeksplorasi struktur data yang kompleks baik dimensinya maupun jenis peubahnya, mampu mengidentifikasikan peubah yang kontribusinya dominan terhadap peubah respon, serta hasil analisisnya relatif lebih mudah untuk diinterpretasikan terutama bagi pengguna yang bukan statistisi (Lewis, 2000). Banyaknya amatan minimum pada setiap simpul akhir digunakan sebagai salah satu kriteria untuk menghentikan pemisahan pada metode pohon regresi. Pemilihan banyaknya amatan minimum ini bersifat subyektif sehingga perlu dilakukan simulasi untuk memperoleh jawaban mengenai banyaknya amatan minimum yang tepat sebagai aturan penghentian pada pohon regresi.
Pada penelitian Wulandari (2004), program studi S2 dibagi menjadi tiga gerombol. Hasilnya menunjukkan bahwa peubah yang paling mempengaruhi IPK S2 adalah status perguruan tinggi asal. Sedangkan untuk masa studi, peubah-peubah yang paling mempengaruhinya adalah kesesuaian program studi S1 dengan S2 (gerombol 1), status perguruan tinggi asal (gerombol 2) dan sumber biaya pendidikan (gerombol 3). Penelitian
tersebut tidak menggunakan data mahasiswa aktif sehingga pohon regresi yang dihasilkan hanya merupakan pohon regresi data lengkap.
Sedangkan dalam penelitian ini data masa studi mahasiswa aktif dipandang sebagai data tidak lengkap atau data tersensor karena waktu terjadinya kelulusan tidak dapat diamati selama masa penelitian sehingga terlebih dahulu diduga menggunakan analisis daya tahan (Survival Analysis). Selanjutnya hasil prediksi masa studi mahasiswa aktif dengan analisis daya tahan tersebut akan digunakan sebagai peubah respon yang baru dalam pohon regresi sehingga pohon regresi untuk masa studi disebut sebagai pohon regresi data tersensor. Selain itu, pembentukan pohon regresi pada penelitian ini dilakukan pada masing-masing program studi S2. Hal ini dilakukan karena terdapat perbedaan akreditasi, kompetensi dan mata kuliah pada masing-masing program studi S2. Hasil penelitian ini diharapkan dapat menyempurnakan hasil penelitian sebelumnya.
Berdasarkan uraian tersebut di atas, permasalahan yang dapat dirumuskan dalam penelitian ini adalah:
1. Berapa banyaknya amatan minimum yang tepat untuk menghentikan pemisahan pada metode pohon regresi?
2. Bagaimana cara mengatasi
ketidaklengkapan data pada pohon regresi? 3. Bagaimana pohon regresi data lengkap dan data tersensor yang terbentuk pada tiap program studi yang dapat digunakan untuk memprediksi keberhasilan mahasiswa program Magister Sains IPB?
Tujuan
Berdasarkan permasalahan yang dirumuskan di atas, maka tujuan penelitian ini adalah:
1. Mengetahui banyaknya amatan minimum yang tepat untuk menghentikan pemisahan pada metode pohon regresi.
2. Mengatasi ketidaklengkapan data dalam pohon regresi.
3. Membangun pohon regresi data lengkap dan data tersensor pada tiap program studi yang dapat digunakan untuk memprediksi keberhasilan mahasiswa program Magister Sains IPB.
Ruang Lingkup Penelitian
Penelitian ini mengkaji faktor-faktor yang mempengaruhi tingkat keberhasilan mahasiswa program Magister Sains IPB pada masing-masing program studi melalui pembentukan
t
2t
4t
5t
6t
8t
9t
3t
1t
7t
2pohon regresi data lengkap dan data tersensor. Faktor-faktor yang tercakup dalam penelitian ini adalah jenis kelamin, status perkawinan sebelum menempuh S2, sumber biaya pendidikan pada saat diterima sebagai mahasiswa S2, status penerimaan, status perguruan tinggi asal, akreditasi program studi S1, kesesuaian program studi di S2 dengan S1, jenis pekerjaan mahasiswa sebelum menempuh S2, IPK S1, durasi dari lulus S1 sampai diterima di S2 (tahun), dan usia pada saat diterima sebagai mahasiswa S2 (tahun). Sedangkan tingkat keberhasilan yang diduga adalah IPK S2 dan masa studi. Data yang digunakan adalah data mahasiswa program Magister Sains IPB angkatan 1994 sampai 2004 yang sudah lulus dan yang sudah melewati masa perkuliahan lebih dari 24 bulan (selain data lulusan). Data yang digunakan untuk memprediksi IPK adalah data mahasiswa
yang masih aktif, sudah lulus, Drop Out (DO),
dan Mengundurkan Diri (MD). Sedangkan data yang digunakan untuk memprediksi masa studi adalah data mahasiswa yang masih aktif dan sudah lulus.
Program studi S2 yang tercakup dalam penelitian ini terdiri dari 16 program studi, antara lain:
1. Ilmu Ekonomi Pertanian/EPN 2. Sosiologi Pedesaan/SPD
3. Ilmu Perencanaan Pembangunan Wilayah
dan Pedesaan/PWD
4. Ilmu Tanah/TNH
5. Pengelolaan Daerah Aliran Sungai/DAS
6. Agronomi/AGR
7. Arsitektur Lanskap/ARL
8. Entomologi dan Fitopatologi /ENT/FIT
9. Gizi Masyarakat dan Sumberdaya
Keluarga/GMK
10. Biologi Reproduksi/BRP
11. Sains Veteriner/SVT
12. Kesehatan Masyarakat Veteriner/KMV
13. Ilmu Perairan/AIR
14. Pengelolaan Sumberdaya Pesisir dan
Lautan/SPL
15. Teknologi Kelautan/TKL
16. Ilmu Kelautan/IKL
TINJAUAN PUSTAKA
Metode Pohon RegresiPohon regresi merupakan salah satu metode yang menggunakan kaidah pohon
keputusan (decision tree) yang dibentuk
melalui suatu algoritma pemisahan (if-then
logical) secara rekursif. Analog dengan regresi
biasa, metode ini juga digunakan untuk mengetahui pengaruh peubah penjelas terhadap peubah respon. Perbedaanya adalah bahwa pada pohon regresi, pendugaan respon dilakukan pada kelompok-kelompok pengamatan yang dibentuk berdasarkan peubah-peubah penjelasnya, bukan untuk keseluruhan data sehingga interpretasi hasil lebih mudah dilakukan. Metode pohon regresi
menghasilkan kelompok-kelompok pengamatan yang dicirikan oleh
peubah-peubah penjelas yang memisahkan simpul. Peubah-peubah penjelas yang dianggap berpengaruh terhadap respon adalah peubah-peubah yang muncul sebagai pemisah
(Breiman et al., 1993).
Metode ini menganalisa suatu gugus data dengan cara memisahkannya menjadi beberapa anak gugus (simpul) secara bertahap. Tahap pertama, seluruh data dipisah menjadi anak gugus berdasarkan salah satu peubah yang dipilih sedemikian rupa sehingga memaksimumkan penurunan jumlah kuadrat sisaan. Masing-masing anak gugus kemudian diperiksa kembali secara terpisah dan dibagi lagi berdasarkan pemisah lainnya, demikian selanjutnya sampai tercapai kriteria berhenti tertentu. Anak gugus yang tidak bisa dipisah lagi dinamakan simpul akhir (simpul terminal), sedangkan anak gugus yang masih bisa dipisah lebih lanjut dinamakan simpul dalam. Hasil dari proses pemisahan ini direpresentasikan dalam suatu struktur pohon seperti terlihat
dalam Gambar 1 (Breiman et al., 1993).
Struktur pohon regresi memiliki satu
simpul akar (t1) yang mengandung semua
gugus data. Simpul dalam dilambangkan
dengan lingkaran (t2, t3, t7) sedangkan simpul
akhir dilambangkan dengan persegi (t4, t5, t6, t8,
dan t9). Dugaan respon dilakukan pada semua
simpul akhir.
CART
CART (Classification and Regression
Trees) merupakan metode eksplorasi yang digunakan untuk melihat hubungan antara peubah respon dan peubah penjelas yang meliputi peubah nominal, ordinal, maupun kontinu. Perkembangan metode ini ditandai
dengan diterbitkannya buku Classification and
Regression Tree pada tahun 1984 (Breiman et
al., 1993). Metode ini meliputi metode pohon
klasifikasi dan pohon regresi. Metode pohon klasifikasi digunakan jika peubah respon adalah peubah kategorik. Sedangkan metode pohon regresi digunakan jika peubah respon adalah peubah kontinu. Dalam penelitian ini akan digunakan metode CART untuk pohon regresi.
Algoritma Pohon Regresi dalam CART
Metode pohon regresi menurut Breiman
et al. (1993), terdiri dari tiga bagian penting, yaitu:
1. Aturan pemisahan setiap simpul 2. Aturan penghentian
3. Penentuan nilai dugaan respon bagi setiap simpul akhir.
Aturan Pemisahan
Pohon regresi dibentuk melalui pemisahan gugus data dengan sederetan pemisahanan biner sampai dihasilkan simpul
akhir (Breiman et al., 1993). Aturan
pemisahannya adalah sebagai berikut:
1. Tiap pemisahan hanya begantung pada nilai yang berasal dari satu peubah penjelas.
2. Untuk peubah kontinu Xj, pemisahan
hanya berasal dari pertanyaan “Apakah Xj
≤ ci?” untuk
c
∈
R
. Jadi, jika ruangcontohnya berukuran n dan terdapat sebanyak-banyaknya n nilai amatan yang berbeda pada peubah Xj, maka akan terdapat sebanyak-banyaknya n-1 pemisahan yang berbeda yang dibentuk
oleh gugus pertanyaan {“Apakah Xj ≤
ci?”}, dengan i=1,2,3,...,n-1 dan ci adalah
nilai tengah antara dua nilai amatan
peubah Xj berurutan yang berbeda.
3. Untuk peubah penjelas kategorik,
pemisahan yang terjadi berasal dari semua kemungkinan pemisahan berdasarkan terbentuknya dua anak gugus yang saling
lepas (disjoint). Jika peubah Xj merupakan
peubah kategorik nominal dengan L
kategori, maka akan ada 2L-1-1 pemisahan,
sedangkan jika berupa peubah kategorik ordinal maka akan ada L-1 pemisahan.
Proses Pemisahan
Proses yang dilakukan Breiman et al.
(1993) untuk memisahkan suatu simpul adalah sebagai berikut:
1. Tentukan semua kemungkinan pemisahan
pada tiap peubah penjelas.
2. Pilih pemisahan yang terbaik dari
kumpulan pemisahan tersebut dan pisahkan simpul tersebut menjadi dua anak simpul, yaitu simpul kiri dan simpul kanan. Pemisahan terbaik adalah pemisahan yang memaksimumkan ukuran kehomogenan di dalam masing-masing simpul anak relatif terhadap simpul induknya atau yang memaksimumkan ukuran pemisahan antara dua simpul anak tersebut.
Jumlah Kuadrat Sisaan (JKS) digunakan sebagai kriteria kehomogenan di dalam masing-masing simpul. Misalkan simpul g
berisi anak contoh {(xn,yn)}, n(g) adalah
banyaknya amatan pada simpul g dan nilai respon dalam suatu simpul g diduga oleh rataan respon pada simpul g tersebut, yang dihitung sebagai berikut:
∑
∈=
g xn ny
g
n
g
y
)
(
1
)
(
maka Jumlah Kuadrat Sisaan di dalam simpul g adalah:
[
]
∑
∈−
=
g xn ng
y
y
g
JKS
(
)
(
)
2Misalkan s memisahkan simpul g menjadi
simpul kiri gL dan simpul kanan gR. Kriteria
jumlah kuadrat terkecil adalah:
)
(
)
(
)
(
)
,
(
s
g
=
JKS
g
−
JKS
g
L−
JKS
g
Rφ
Pemisahan terbaik s* adalah pemisahan yang memenuhi kriteria:
);
,
(
max
)
*,
(
s
g
s*φ
s
g
φ
=
∈Ωdimana Ω adalah gugus yang berisi semua
kemungkinan pemisahan. Hal ini berarti bahwa pemisahan yang dipilih adalah pemisahan yang mampu menghasilkan penurunan jumlah kuadrat sisaan terbesar.
Aturan Penghentian
Proses pemisahan akan berhenti jika banyaknya amatan dalam simpul berjumlah
‘tertentu’ (StatSoft Inc., 2003). Breiman et al.
(1993) menyatakan bahwa proses rekursif
berakhir jika banyaknya amatan pada simpul akhir ≤ 5. Selain jumlah amatan minimum, kriteria penghentian pohon regesi juga dipengaruhi oleh penentuan peubah yang berpengaruh terhadap respon.
Statistik pada Simpul Akhir
Pada pohon regresi digunakan statistik rataan respon sebagai dugaan respon pada tiap simpul akhir.
Koefisien Determinasi (R2)
Koefisien determinasi (coefficient of
determination) yaitu nilai untuk mengukur proporsi keragaman peubah respon (Y) yang bisa dijelaskan oleh peubah penjelas (X).
Keragaman total (total variance) dalam
CART adalah ragam dari peubah respon sebelum dipengaruhi oleh peubah-peubah penjelas, atau ragam yang terdapat pada simpul akar. Keragaman ini merupakan penjumlahan
dari keragaman di dalam simpul (within-node
variance) dan keragaman diantara simpul yang
satu dengan simpul yang lain (between-node
variance) (SPSS Inc.,2002).
Keragaman di dalam simpul (within-node
variance) merupakan nilai pendugaan resiko (risk estimate value) yang dihitung sebagai berikut:
sehingga koefisien determinasi (R2) dalam
CART dihitung sebagai berikut:
MAPE (Mean Absolute Percentage Error)
MAPE (Mean Absolute Percentage
Error) merupakan rata-rata persentase kesalahan mutlak atau ukuran ketelitian di (dalam) suatu data deret waktu yang dinyatakan dalam bentuk persentase (Wikipedia Foundation, Inc., 2008). MAPE dihitung dengan rumus sebagai berikut:
MAPE =
Analisis Daya Tahan Waktu Ketahanan
Waktu ketahanan (survival time) adalah
jangka waktu dan awal pengamatan sampai terjadinya suatu peristiwa. Penstiwa itu dapat berupa kegagalan, kematian, respon, timbulnya gejala dan lain-lain (Lee dan Wang, 2003). Dalam hal ini ada dua titik waktu yang penting untuk diperhatikan:
1. Waktu awal, yaitu waktu pada saat terjadinya kejadian awal, seperti waktu seseorang divonis mendenita kanker, waktu pemberian perlakuan, waktu anak mulai sekolah dan lain-lain.
2. Waktu kegagalan, yaitu waktu pada saat terjadinya kejadian akhir, seperti kematian, respon dan perlakuan dan lain-lain.
Waktu awal dan setiap individu tidak harus sama, dapat saja suatu individu dimulai
pada t1 sedangkan individu yang lain dimulai
pada waktu t2 dan seterusnya Dan tidak semua
individu dapat diamati waktu kegagalannya secara penuh Sering dijumpai suatu individu tidak mengalami kegagalan sampai batas waktu penelitian. Hal ini mengakibatkan
ketidaklengkapan data kegagalan (failure time)
yang sering disebut sensoring (censoring).
Jenis-jenis Sensoring
Ada tiga jenis sensoring yaitu:
1. Waktu penelitian ditentukan dalam selang
waktu tertentu, sehingga individu-individu yang tidak mengalami kegagalan dalam selang waktu tersebut tidak dapat ditentukan waktu hidupnya secara pasti
2. Dalam suatu penelitian telah ditetapkan
proporsi kegagalan yang diamati, misal penelitian berjalan sampai 80% individu gagal.
3. Dalam percobaan klinis biasanya periode
penelitian ditentukan sedangkan pasien datang pada waktu yang berbeda-beda sehingga ada pasien yang tidak dapat diamati secara penuh.
Sensoring jenis 1 dan 2 sering disebut
singly censored data sedangkan jenis 3 sering
disebut progressively censored data atau
random censoring. Dan data yang tidak mengandung pengamatan sensor disebut sebagai data lengkap (Lee dan Wang, 2003).
Fungsi Ketahanan dan Fungsi Hazard
Misalkan X menyatakan waktu kegagalan atau waktu kematian, maka X dapat dipandang sebagai suatu variabel acak nonnegatif. Fungsi
ketahanan (Survival function) adalah peluang
seorang individu dapat bertahan hidup hingga
(
)
n Y Y n i i i∑
= − = 1 2 ˆ variance node -within∑
= − n i i i i Y Y Y n 1 ˆ 1 ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = variance total variance node -within 1 2 Rwaktu x (mengalami kejadian sesudah waktu x). Fungsi ketahanan hidup didefinisikan sebagai berikut:
dan dapat ditunjukkan bahwa:
yaitu sebagai berikut:
, maka
,sebab
sehingga
dengan adalah fungsi sebaran kumulatif.
Fungsi lain yang berkaitan dengan fungsi ketahanan adalah fungsi hazard. Fungsi tingkat
hazard (hazard rate function) didefinisikan
sebagai tingkat kegagalan bersyarat yaitu limit dari peluang suatu individu gagal bertahan dalam interval waktu yang sangat pendek dari x sampai , jika individu tersebut telah bertahan hingga waktu x. Fungsi ini didefinisikan sebagai berikut:
dan dapat ditunjukkan bahwa
yaitu sebagai berikut:
dengan adalah fungsi kepekatan peluang, .
Model Regresi Hazard Proporsional Cox
Melalui analisis regresi dapat diketahui pengaruh dari beberapa karakteristik terhadap variabel respon. Dalam regresi hazard proporsional karakteristik-karakteristik ini disebut sebagai kovariat, peubah penjelas atau
variabel bebas (covariates, explanatory
variables or independent variables) dan sebagai variabel responnya adalah waktu ketahanan.
Tingkat kegagalan bersyarat atau tingkat hazard, dinyatakan oleh persamaan:
Jika ingin diketahui tingkat hazard dan individu dengan karakteristik tertentu yang disebut kovanat, maka dapat dinyatakan dengan model
regresi Cox (Cox dan Oakes, 1984) yaitu:
dengan:
x = Waktu hingga suatu kejadian tertentu terjadi
Z =Peubah penjelas dengan Z=(Z1,Z2,…,Zp)
h0(x) = fungsi hazard dasar (baseline hazard
function)
β = vektor koefisien regresi berdimensi p
∫
= > = Pr( ) ~ ( ) ) ( x dt t f x X x S ) ( 1 ) Pr( 1− X ≤ x = −F x =dx
x
dS
x
f
(
)
=
−
(
)
∫
=~ () ) ( x dt t f x S∫
− = −S x x f t dt ~ ) ) ( ) ( 1∫
∫
− = + x x dt t f dt t f ~ ~ 1 ) ( ) ([
]
dx dt t f d dx x S d x∫
− = − ~ ) ( [ ) ( 1 dx x dF dx x dS( ) ( ) 0− = ) ( ) (x dFx dS = − dx x f x dS( )= ( ) −dx
x
dS
x
f
(
)
=
−
(
)
) Pr( ) (x X x F = ≤ x x+Δ[
]
x x X x x X x P x h x Δ ≥ Δ + < ≤ = → Δ | ) (lim
0 ) ( ) ( ) ( ) ( dLnS x x S x f x h = =−(
) (
)
[
]
(
X x)
P x x X x x X x P x Δ ≥ ≥ ∩ Δ + < ≤ = → Δlim0 .[
]
x x X x x X x P x h x Δ ≥ Δ + < ≤ = → Δ | lim ) ( 0[
]
(
X x)
P x x x X x P x Δ ≥ Δ + < ≤ = → Δ 1 . lim 0 ) ( 1 ). ( x S x f = ) ( 1 . ) ( x S dx x dS − = dx x dS x S ) ( . ) ( 1 − =[ ]
S(x) dLn − =)
(
x
f
)
(
).
(
)
(
x
h
x
S
x
f
=
[
]
x x X x x X x P x h x Δ ≥ Δ + < ≤ = → Δ | ) (lim
0(
Z)
x h Z x h Z x h p i i i ' exp ) ( exp ) ( ) | ( 0 1 0 β ⎟⎟= β ⎠ ⎞ ⎜⎜ ⎝ ⎛ =∑
=METODOLOGI
DataData yang digunakan dalam penelitian ini adalah data mahasiswa program Magister Sains IPB angkatan 1994 sampai 2004 yang sudah lulus dan yang sudah melewati masa perkuliahan lebih dari 24 bulan (selain data lulusan). Pengambilan data dilakukan pada tanggal 3 April 2007. Data ini diperoleh dari Sekolah Pascasarjana Institut Pertanian Bogor.
Peubah respon yang diamati adalah: Y1 = Indeks Prestasi Kumulatif (IPK) S2 pada semester terakhir
Y2 = Masa studi (bulan)
Data yang digunakan untuk memprediksi IPK S2 (Y1) adalah data mahasiswa yang
masih aktif, sudah lulus, Drop Out (DO), dan
Mengundurkan Diri (MD). Sedangkan data yang digunakan untuk memprediksi masa studi (Y2) adalah data mahasiswa yang masih aktif dan sudah lulus.
Peubah penjelas yang digunakan antara lain:
X1 = Jenis Kelamin
1 = laki-laki
2 = perempuan
X2 = Status Perkawinan pada saat
diterima sebagai mahasiswa S2 1 = belum menikah
2 = menikah
X3 = Sumber biaya pendidikan pada saat
diterima sebagai mahasiswa S2
1 = beasiswa
2 = sendiri
X4 =Status penerimaan
1 = status biasa 2 = status percobaan
X5 = Status perguruan tinggi asal
1 = BHMN
2 = negeri
3 = swasta 4 = kedinasan 5 = luar negeri
X6 = Akreditasi program studi S1
1 = A 2 = B 3 = C 4 = D
X7 = Kesesuaian program studi di S2
dengan S1 1 = sesuai 2 = tidak sesuai
X8 =Jenis pekerjaan mahasiswa
sebelum menempuh S2 1 = dosen di Perguruan Tinggi
2 = peneliti di Lembaga Penelitian
3 = tenaga advanced professional
4 = fresh graduates
5 = lainnya
X9 = IPK S1
X10 = Durasi dari lulus S1 sampai
diterima di S2 (tahun)
X11 = Usia pada saat diterima sebagai
mahasiswa S2 (tahun)
Penelitian ini merupakan lanjutan dari penelitian Wulandari (2004) dengan menambahkan pilihan 4 (kedinasan) pada peubah status perguruan tinggi asal (X5) dan menambahkan peubah akreditasi program studi S1 (X6) sebagai peubah penjelas.
Metode Analisis
Tahapan-tahapan yang dilakukan dalam penelitian ini adalah:
1. Mendeskripsikan peubah-peubah yang terlibat dalam penelitian ini, seperti tercantum pada Lampiran 4 dan 5.
2. Melakukan simulasi penentuan amatan
minimum yang optimal
a. Simulasi untuk mengetahui
banyaknya amatan minimum yang tepat untuk menghentikan pemisahan pada metode pohon regresi. Algoritma yang digunakan untuk simulasi aturan penghentian dapat dilihat pada Lampiran 6 dan hasilnya dapat dilihat pada Lampiran 7.
3. Menduga masa studi mahasiswa aktif menggunakan analisis daya tahan.
a. Masa studi mahasiswa aktif masih
missing sehingga perlu diduga dengan menggunakan analisis daya tahan. Dugaan masa studi tersebut akan digunakan sebagai respon masa studi yang baru dalam analisis pohon regresi.
4. Membangun pohon regresi dengan algoritma CART untuk masing-masing porgram studi.
a. Data dibagi secara acak ke dalam 2
bagian, 80% data dijadikan sebagai
training sample dan 20% sebagai test sample.
b. Pohon regresi IPK S2 disebut sebagai
pohon regresi data lengkap sedangkan pohon regresi masa studi disebut sebagai pohon regresi data tersensor.
c. Evaluasi model dengan menggunakan
koefisien determinasi (R2) dan MAPE
(Mean Absolute Percentage Error)
yang diterapkan pada data training
dan data test. Pada pohon regresi masa
menghitung R2 dan MAPE hanya data
lengkap (data lulusan) saja.
d. Melakukan interpretasi hasil.
Proses analisis dilakukan dengan
menggunakan software Microsoft Office Excel
2003, SPSS for Windows ver.13.0, SPSS
Answer Tree ver.2.0.1, dan MINITAB ver 14.0.
HASIL DAN PEMBAHASAN
Karakteristik mahasiswa secara keseluruhan pada semua program studi yang tercakup dalam penelitian ini dapat dilihat pada Lampiran 1, 2, dan 3. Berikut ini akan dijelaskan karakteristik mahasiswa pada masing-masing program studi S2 IPB
Karakteristik Mahasiswa Pada Masing-Masing Program Studi S2 IPB
Masing- masing program studi S2 yang terdapat pada penelitian ini memiliki mahasiswa yang sudah lulus dengan persentase terbesar kemudian diikuti oleh mahasiswa aktif.
Sebagian besar program studi memiliki lebih banyak mahasiswa berjenis kelamin laki-laki dibandingkan dengan mahasiswa perempuan. Mahasiswa pada program studi ARL sebagian besar belum menikah (52.78%), sedangkan mahasiswa pada program studi lainnya mayoritas sudah menikah. Sumber biaya pendidikan mahasiswa program Magister Sains IPB sebagian besar berasal dari beasiswa.
Berdasarkan status penerimaannya, masing-masing program studi memiliki lebih banyak mahasiswa yang diterima dengan status biasa Berdasarkan status perguruan tinggi, terlihat bahwa hampir pada masing-masing program studi memiliki mahasiswa yang berasal dari Perguruan Tinggi Negeri dengan persentase terbesar diikuti oleh mahasiswa yang berasal dari perguruan tinggi Badan Hukum Milik Negara/PT-BHMN. Urutan ketiga ditempati oleh perguruan tinggi swasta dan tidak semua program studi memiliki mahasiswa yang berasal dari perguruan tinggi kedinasan dan luar negeri. Mahasiswa program Magister Sains IPB sebagian besar berasal dari program studi S1 yang terakreditasi B, diikuti oleh akreditasi A dan C.
Dilihat dari kesesuaian program studi, sebagian besar mahasiswa pada masing-masing program studi S2 masuk ke dalam program studi yang sesuai dengan program studi S1-nya. Sebagian besar mahasiswa pada
masing-masing program studi bekerja sebagai dosen di perguruan tinggi. Namun pada program studi PWD, KMV, dan SPL lebih banyak terdapat mahasiswa yang bekerja sebagai tenaga
advanced professional. Deskripsi secara lengkap mengenai peubah-peubah kategorik dapat dilihat pada Lampiran 4.
Program studi yang memiliki rata-rata IPK S1 tertinggi adalah AGR dan BRP, yaitu sebesar 3.07. Rata-rata durasi dari lulus S1 sampai diterima di S2 terlama dan rata-rata usia mahasiswa yang paling tua terdapat pada program studi SVT yaitu selama 8.40 tahun dan 32.23 tahun. Sedangkan mahasiswa pada program studi ARL dan EPN masing-masing memiliki rata-rata durasi yang tercepat (4.72 tahun) dan usia termuda (28.79 tahun) dibandingkan dengan program studi lainnya. Untuk mengetahui nilai statistik lima serangkai dan simpangan baku peubah-peubah kontinu pada masing-masing program studi dapat dilihat pada Lampiran 5.
Tingkat Keberhasilan Mahasiswa S2
Rata-rata nilai IPK S2 yang tertinggi diantara semua program studi terdapat pada program studi TKL yaitu sebesar 3.68. Hal ini menunjukkan bahwa secara deskriptif TKL merupakan program studi yang memiliki tingkat keberhasilan paling tinggi dibandingkan dengan program studi lainnya (jika ditinjau dari nilai IPK S2). Sebaliknya program studi SPL memiliki nilai rataan IPK S2 paling rendah (3.44) diantara program studi lainnya.
Masa studi S2 adalah durasi dari masuk S2 sampai memperoleh gelar Magister Sains (lulus). Oleh karena itu data yang digunakan untuk mendeskripsikan masa studi hanya data lulusan saja. Rata-rata mahasiswa yang paling cepat menamatkan pendidikannya terdapat pada program studi KMV yaitu 30.20 bulan. Sedangkan program studi yang memiliki rataan terlama adalah DAS (39.94 bulan).
Banyaknya amatan minimum pada setiap simpul akhir digunakan sebagai salah satu kriteria untuk menghentikan pemisahan pada metode pohon regresi. Pemilihan banyaknya amatan minimum ini bersifat subyektif sehingga diperlukan simulasi untuk mengetahui amatan minimum yang paling optimal.
Simulasi Aturan Penghentian pada Metode Pohon Regresi
Ada beberapa pendapat mengenai banyaknya amatan minimum yang tepat untuk menghentikan pemisahan pada metode pohon
bahwa proses rekursif berakhir jika banyaknya
amatan pada simpul akhir ≤ 5. Sedangkan
Mardein (2001) menetapkan amatan minimum sebanyak 50 untuk ukuran contoh sebesar 1002 (atau sekitar 5% dari ukuran contoh). SPSS Inc. (2002) menyebutkan bahwa banyaknya amatan minimum yang tepat untuk menghentikan pemisahan adalah sebanyak 25 amatan pada simpul dalam dan 1 amatan pada simpul akhir.
Semakin sedikit amatan minimum pada setiap simpul akhir pohon regresi, ada kecenderungan bahwa kuadrat tengah galat
pada training sample semakin kecil. Namun
disisi lain dapat menyebabkan kuadrat tengah galat pada data validasi semakin besar. Untuk itu, dibuat simulasi untuk mengetahui amatan minimum mana yang membuat keduanya relatif kecil.
Simulasi dilakukan dengan menggunakan data mahasiswa program studi EPN supaya
konfigurasi X dan β sesuai dengan data dan
peubah-peubah yang digunakan dalam penelitian ini, yaitu terdiri dari 7 peubah penjelas kategorik nominal, 1 peubah penjelas kategorik ordinal, 3 peubah penjelas kontinu, dan 1 peubah respon kontinu. Aturan penghentian yang dicobakan pada simulasi adalah dengan menggunakan amatan minimum 1 sampai 20 pada setiap simpul akhir, dan dua kali lipatnya pada setiap simpul dalam.
Hasil dari simulasi ini dapat dilihat pada Lampiran 7. Titik optimal adalah titik yang
menunjukkan kedua galat baik di training
maupun test sample sama-sama kecil dan sudah
mulai stabil/mendatar. Hasil simulasi menunjukkan bahwa titik optimal yang paling banyak muncul di semua simpangan baku galat data simulasi terletak pada ukuran amatan minimum 9 di simpul akhir (sekitar 5% dari
ukuran training sample). Jadi titik yang dipilih
sebagai aturan penghentian yang tepat pada metode pohon regresi adalah 5% dari ukuran
training sample.
Dalam penelitian ini data masa studi mahasiswa aktif dipandang sebagai data tersensor karena waktu terjadinya kelulusan tidak dapat diamati selama masa penelitian sehingga terlebih dahulu diduga menggunakan
analisis daya tahan (Survival Analysis).
Pendugaan Fungsi Ketahanan pada Data Masa Studi Mahasiswa Aktif
Analisis daya tahan menghasilkan peluang suatu individu bertahan hingga waktu tertentu sehingga masa studi mahasiswa aktif diduga sebagai waktu pada saat peluang
bertahannya kecil. Dalam penelitian ini, peluang bertahan dianggap kecil jika sudah mencapai 5%. Selanjutnya hasil prediksi masa studi dengan analisis daya tahan ini digunakan sebagai peubah respon masa studi yang baru untuk mahasiswa aktif dalam analisis pohon regresi.
Fungsi ketahanan untuk data masa studi mahasiswa aktif disajikan dalam bentuk plot. Gambar 2 adalah plot antara masa studi dengan waktu ketahanan seorang mahasiswa aktif pada program studi EPN.
Gambar 2. Fungsi Ketahanan Masa Studi Seorang Mahasiswa Aktif Pada
PS EPN
Dari Gambar 2 terlihat bahwa mahasiswa tersebut diprediksi akan menamatkan pendidikan S2-nya selama 47 bulan. Sehingga untuk mahasiswa aktif tersebut dugaan masa studinya adalah 47 bulan. Langkah ini dilakukan terhadap seluruh mahasiswa aktif yang tercakup dalam penelitian ini.
Pohon Regresi untuk Masing-masing Program Studi
1. Pohon Regresi IPK S2
Peubah yang paling mempengaruhi nilai IPK S2 adalah status perguruan tinggi asal, akreditasi PS S1, kesesuaian program studi di S2 dengan S1, dan usia pada saat diterima sebagai mahasiswa S2. Berdasarkan peubah paling berpengaruh yang muncul ini terdapat kecenderungan bahwa kelompok mahasiswa yang berasal dari PT-BHMN, memiliki akreditasi program studi S1 A, berusia lebih muda serta memilih program studi S2 yang sesuai dengan program studi S1 mampu menghasilkan IPK S2 yang lebih tinggi dari kelompok mahasiswa lainnya.
Hasil dari pohon regresi IPK S2 yang akan dibahas adalah pada program studi yang peubah paling berpengaruhnya paling banyak muncul dan yang paling sedikit muncul.
70 68 66 64 62 60 58 56 54 52 50 48 46 44 42 40 38 36 34 32 30 28 26 24 22 20 18 16 14 12 10 8 6 4 2 0 Masa studi(bulan) 1.00 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50 0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 C um S u rv ival
Peubah paling berpengaruh yang paling banyak muncul pada pohon regresi IPK S2 di masing-masing program studi adalah status perguruan tinggi asal (X5). Salah satu program studi yang pada pohon regresinya muncul status perguruan tinggi asal sebagai peubah paling berpengaruh adalah PS EPN.
Pohon regresi IPK S2 untuk program studi EPN terdiri dari 17 simpul dan 9 diantara simpul tersebut merupakan simpul akhir (Lampiran 8). Terbentuknya 9 simpul akhir ini berarti bahwa tingkat keberhasilan mahasiswa EPN dapat dikelompokkan menjadi 9 kelompok IPK S2. Karakteristik dari masing-masing kelompok yang terbentuk terlihat dari faktor (peubah) yang muncul sebagai pemisah. Ringkasan dalam gambar pohon regresi yang terdapat pada Lampiran 8 tersebut disusun dalam aturan jika-maka. Proses serupa dilakukan pada pohon regresi lainnya yang terangkum pada Lampiran 9-40.
Peubah-peubah yang muncul sebagai pemisah kelompok IPK S2 yang terbentuk pada program studi EPN antara lain status perguruan tinggi asal (X5), IPK S1 (X9), sumber biaya pendidikan (X3), jenis pekerjaan (X8), jenis kelamin (X1) dan usia (X11). Deskripsi tiap kelompok nilai IPK S2 pada program studi EPN dapat dilihat pada Lampiran 7.
Berdasarkan lampiran 9 diperoleh bahwa peubah yang paling berpengaruh terhadap nilai IPK S2 mahasiswa PS EPN adalah peubah status perguruan tinggi asal. Mahasiswa yang berasal dari PT-BHMN cenderung menghasilkan nilai IPK S2 yang lebih tinggi dibandingkan dengan perguruan tinggi lainnya. Peubah IPK S1 muncul sebagai pemisah kedua kelompok yang memiliki status perguruan tinggi asal berbeda. Pada kelompok
PT-BHMN, mahasiswa yang memiliki IPK S≤2.69
menghasilkan IPK S2 yang lebih rendah dari IPK S1>2.69. Begitu pula pada kelompok PTN atau PTS, mahasiswa yang memiliki IPK
S1≤3.32 cenderung menghasilkan IPK S2 yang
lebih rendah dari IPK S1>3.32.
Peubah sumber biaya pendidikan memisahkan kelompok mahasiswa yang memiliki IPK S1>2.69, dengan ketentuan bahwa mahasiswa yang memperoleh beasiswa cenderung menghasilkan IPK S2 yang lebih tinggi dari mahasiswa yang membiayai pendidikannnya sendiri. Mahasiswa dari kelompok ini dipisahkan lagi berdasarkan jenis pekerjaannya. Mahasiswa yang bekerja sebagai peneliti di lembaga penelitian atau tenaga
advanced professional mampu menghasilkan IPK S2 yang lebih tinggi dari yang berprofesi sebagai dosen di perguruan tinggi.
Kelompok mahasiswa dengan IPK
S1≤3.32 dipisahkan berdasarkan jenis
kelaminnya. Mahasiswa berjenis kelamin laki-laki menghasilkan IPK S2 yang lebih tinggi dari perempuan. Mahasiswa laki-laki yang
bekerja sebagai tenaga advanced professional
atau dosen di perguruan tinggi menghasilkan IPK S2 yang lebih tinggi dari kategori jenis pekerjaan lainnya. Sedangkan mahasiswa
dengan IPK S1>3.32 yang berusia ≤ 24 tahun
menghasilkan IPK S2 lebih rendah dari usia > 24 tahun.
Evaluasi terhadap model yang dihasilkan
bila diterapkan pada data training
menunjukkan bahwa proporsi keragaman IPK S2 yang bisa dijelaskan oleh model adalah sebesar 61.12%, sedangkan bila diterapkan
pada data test adalah sebesar 52.39%. Nilai
MAPE pada model training dan test adalah
masing-masing sebesar 2.81% dan 3.42%. Peubah paling berpengaruh yang muncul pada pohon regresi IPK S2 program studi DAS paling berbeda dengan program studi lainnya, yaitu kesesuaian program studi di S2 dengan S1 (X7). Pohon ini terdiri dari 13 simpul, 7 diantaranya adalah simpul akhir.
Peubah-peubah yang muncul pada setiap pemisahan pohon regresi IPK S2 PS DAS adalah kesesuaian program studi di S2 dengan S1 (X7), durasi dari lulus S1 sampai diterima di S2 (X10), IPK S1 (X9), jenis kelamin (X1) dan akreditasi program studi S1 (X6). Deskripsi tiap kelompok nilai IPK S2 pada program studi DAS dapat dilihat pada Lampiran 17.
Peubah yang muncul sebagai pemisah pertama dalam menentukan IPK S2 adalah kesesuaian program studi di S2 dengan S1 (X7). Mahasiswa dengan program studi S2 yang sesuai dengan program studi S1 menghasilkan IPK S2 yang lebih tinggi dibandingkan mahasiswa yang tidak sesuai program studinya.
Kelompok mahasiswa yang memiliki program studi S2 sesuai dengan S1 dipisahkan lebih lanjut oleh peubah durasi dari lulus S1 sampai diterima di S2. Mahasiswa yang diterima di S2 setelah lebih dari 6 tahun lulus dari S1 menghasilkan IPK S2 yang lebih tinggi
dari durasi≤6 tahun. Jika mahasiswa dari
kelompok ini memiliki akreditasi program studi S1 A atau B maka dihasilkan IPK S2 tertinggi, yaitu 3.66. Sedangkan mahasiswa yang memiliki durasi lebih cepat dari 6 tahun dipisah lagi secara tersarang oleh jenis kelamin. IPK S2 paling rendah (3.19) dihasilkan oleh kelompok ini jika mahasiswanya berjenis kelamin perempuan.
Untuk kelompok mahasiswa dengan program studi S2 tidak sesuai dengan S1 dipisah lagi oleh IPK S1. Mahasiswa yang
memiliki IPK S1≤2.58 rata-rata menghasilkan
IPK S2 yang lebih tinggi dari kelompok IPK S1>2.58.
Koefisien determinasi yang dihasilkan oleh model pohon regresi IPK S2 PS DAS menunjukkan bahwa 72.10% proporsi keragaman IPK S2 dapat dijelaskan oleh model
training sample, sedangkan model test sample
menghasilkan koefisien determinasi sebesar
62.30%. Nilai MAPE untuk model training
adalah sebesar 2.14%, sedangkan untuk model
test adalah sebesar 3.51%.
2. Pohon Regresi Masa Studi S2
Peubah yang muncul sebagai peubah yang paling mempengaruhi masa studi mahasiswa S2 IPB adalah sumber biaya pendidikan pada saat diterima sebagai mahasiswa S2, status perguruan tinggi asal, akreditasi PS S1, jenis pekerjaan, IPK S1, dan durasi dari lulus S1 sampai diterima di S2. Berdasarkan peubah paling berpengaruh yang muncul ini terlihat bahwa mahasiswa yang memperoleh beasiswa, berasal dari perguruan tinggi negeri, memiliki akreditasi program studi S1 lebih rendah dari A (B atau C), bekerja sebagai peneliti di LP , tenaga
advanced professional, dosen di PT atau fresh graduates (selain kategori pekerjaan “lainnya”), memiliki IPK S1 yang lebih tinggi dan mempunyai durasi tunggu dari S1 ke S2 lebih singkat cenderung mampu menyelesaikan studinya lebih cepat dari mahasiswa dengan karakteristik lainnya.
Pohon Regresi Masa Studi S2 yang dibahas adalah pada program studi ENT/FIT karena memiliki peubah paling berpengaruh yang paling sering muncul, yaitu jenis pekerjaan. Selain itu, PS EPN juga dibahas karena memiliki peubah paling berpengaruh yang berbeda dengan program studi lainnya, yaitu akreditasi program studi S1.
Pohon regresi masa studi PS ENT/FIT terdiri dari 19 simpul dengan simpul akhir sebanyak 10 simpul. Peubah penjelas yang muncul sebagai peubah yang mempengaruhi masa studi mahasiswa program studi ENT/FIT adalah jenis pekerjaan (X8), status penerimaan (X4), usia (X11), durasi dari lulus S1 sampai diterima di S2 (X10), IPK S1 (X9) dan sumber biaya pendidikan (X3).
Pohon ini membedakan masa studi mahasiswa berdasarkan jenis pekerjaannya. Mahasiswa yang termasuk ke dalam kategori
pekerjaan “lainnya” memiliki masa studi yang lebih lama.
Untuk kelompok mahasiswa yang bekerja
sebagai peneliti di LP , tenaga advanced
professional, dosen di PT atau fresh graduates
dipisahkan secara berturut-turut oleh status penerimaan, usia, durasi dari lulus S1 sampai diterima di S2, IPK S1 dan sumber biaya pendidikan. Kelompok mahasiswa yang terbentuk dapat dilihat secara lengkap pada Lampiran 24.
Evaluasi model menunjukkan bahwa 68.16% dan 52.00% proporsi keragaman masa
studi S2 dapat dijelaskan oleh model training
dan test sample. Dari nilai tersebut diketahui bahwa model pohon regresi masa studi yang diatasi dengan analisis daya tahan lebih bagus dari sebelum diatasi dengan analisis daya tahan
yaitu 63.89% untuk model training dan 26.66%
pada model test. Nilai MAPE untuk model
sebelum dan sesudah diatasi dengan analisis daya tahan juga menunjukkan hal yang sama,
yaitu 10.96% dan 8.31% untuk model training
dan test pada model tanpa analisis daya tahan
dan 10.87% dan 6.61% setelah diatasi dengan analisis daya tahan. Ini menunjukkan bahwa ketidaklengkapan data yang diatasi dengan analisis daya tahan dapat memperkecil galat pada model pohon regresi yang terbentuk.
Penerapan analisis pohon regresi pada data masa studi mahasiswa EPN menghasilkan struktur pohon yang terdiri dari 17 simpul, 9 diantaranya adalah simpul akhir. Seperti halnya program studi IKL dan KMV, program studi EPN menghasilkan peubah paling berpengaruh yang berbeda dengan program studi lainnya, yaitu akreditasi program studi S1.
Peubah-peubah yang muncul sebagai pemisah kelompok masa studi S2 yang terbentuk pada program studi EPN antara lain akreditasi program studi S1 (X6), jenis pekerjaan (X8), usia (X11), status perguruan tinggi asal (X5), jenis kelamin (X1), sumber biaya pendidikan (X3) dan durasi dari lulus S1 sampai diterima di S2 (X10). Deskripsi tiap kelompok masa studi S2 pada program studi EPN dapat dilihat pada Lampiran 10.
Peubah akreditasi program studi S1 merupakan peubah yang paling mempengaruhi masa studi mahasiswa pada program studi EPN. Kelompok yang dihasilkan dari penyekatan tersebut adalah mahasiswa yang memiliki akreditasi PS S1 A dan mahasiswa yang berakreditasi PS S1 B atau C dengan rata-rata masa studi lebih singkat. Kelompok mahasiswa yang memiliki akreditasi PS S1 A secara tersarang dipisah lagi oleh jenis pekerjaan dan usia. Masa studi paling lama dari
kelompok ini (59 bulan) dihasilkan jika mahasiswa tersebut bekerja sebagai peneliti di
LP, dosen di PT atau lainnya dan berusia ≤ 26
tahun. Sedangkan yang paling cepat (40 bulan) jika mahasiswa tersebut bekerja sebagai tenaga
advanced professional atau fresh graduates. Untuk kelompok mahasiswa yang memiliki akreditasi PS S1 B atau C dipisahkan lagi secara bertahap oleh status perguruan tinggi asal, jenis kelamin, sumber biaya pendidikan dan durasi dari lulus S1 sampai diterima di S2 dengan ketentuan bahwa mahasiswa yang ; berasal dari PTN atau PTS, berjenis kelamin laki-laki dan sumber biaya dari beasiswa menghasilkan respon masa studi yang paling cepat (32 bulan) diantara semua kelompok masa studi yang terbentuk.
Hasil evaluasi menunjukkan bahwa proporsi keragaman masa studi S2 yang bisa
dijelaskan oleh model training adalah sebesar
54.34%, sedangkan bila diterapkan pada data
test adalah sebesar 38.70%. Nilai ini lebih
besar dari yang dihasilkan oleh model pohon regresi sebelum diduga dengan menggunakan analisis daya tahan, yaitu 42.61% untuk model
training dan 4.63% untuk model test. Nilai MAPE juga menunjukkan bahwa model yang diatasi dengan analisis daya tahan memiliki galat yang lebih kecil dari yang belum diatasi,
yaitu 12.93% dan 17.08% pada model training
dan test tanpa analisis daya tahan dan 11.52%
dan 14.25% setelah diatasi dengan analisis daya tahan.
Ketidaklengkapan data yang diatasi dengan analisis daya tahan mampu membuat model pohon regresi yang dihasilkan semakin bagus. Namun kita perlu berhati-hati karena pada model yang diatasi dengan analisis daya tahan tersebut terdapat korelasi antar peubah respon masa studi (Y), yaitu masa studi mahasiswa aktif tergantung pada data masa studi mahasiswa yang sudah lulus. Hal ini dapat mengakibatkan pendugaan keragaman
galat menjadi underestimate (dugaan galat
lebih kecil dari nilai galat yang sebenarnya) yang membuat seolah-olah model menjadi fit padahal tidak fit.
KESIMPULAN DAN SARAN
KesimpulanKesimpulan yang dapat diambil dari penelitian ini adalah sebagai berikut:
1. Banyaknya amatan minimum yang optimal digunakan sebagai aturan penghentian yang tepat pada metode
pohon regresi adalah 5% dari ukuran
training sample.
2. Ketidaklengkapan data masa studi mahasiswa aktif yang diatasi dengan menggunakan analisis daya tahan membuat model pohon regresi yang dihasilkan semakin bagus. Pohon regresi masa studi yang diduga dengan analisis daya tahan mampu menghasilkan nilai koefisien determinasi yang lebih besar dari model yang belum diduga dengan analisis daya tahan baik pada data
training maupun data test. Sedangkan evaluasi dengan menggunakan MAPE
menunjukkan bahwa model training dan
model test yang diatasi dengan analisis
daya tahan memiliki galat yang lebih kecil dari model tanpa analisis daya tahan. Namun pada model yang diatasi dengan analisis daya tahan terdapat masalah korelasi antar peubah respon masa studi (Y) yang mengakibatkan pendugaan keragaman galat menjadi
underestimate (dugaan galat lebih kecil dari nilai galat yang sebenarnya). Hal ini dapat membuat seolah-olah model menjadi fit padahal tidak fit.
3. Dari hasil pohon regresi yang dibangun pada setiap program studi menunjukkan bahwa semua peubah penjelas yang digunakan dalam penelitian ini muncul sebagai peubah berpengaruh.
a. Peubah yang paling mempengaruhi
nilai IPK S2 adalah status perguruan tinggi asal, akreditasi PS S1, kesesuaian program studi di S2 dengan S1, dan usia pada saat diterima sebagai mahasiswa S2. Peubah yang paling sering muncul
pada kedalaman pohon (tree depth)
ke-2 dan ke-3 adalah IPK S1, sedangkan peubah durasi dari lulus S1 sampai diterima di S2 dan usia paling sering muncul pada kedalaman pohon ke-4 dan ke-5.
b. Untuk masa studi, peubah yang
muncul sebagai peubah yang paling mempengaruhinya adalah sumber biaya pendidikan pada saat diterima sebagai mahasiswa S2, status perguruan tinggi asal, akreditasi PS S1, jenis pekerjaan, IPK S1, dan durasi dari lulus S1 sampai diterima di S2. Peubah lain yang muncul di sebagian besar program studi adalah usia. Peubah yang paling sering muncul pada kedalaman pohon (tree depth) ke-2 adalah jenis
pekerjaan, sedangkan pada kedalaman ke-3 adalah usia. Peubah IPK S1 paling sering muncul pada kedalaman ke-4 dan ke-5.
Saran
Perlu dilakukan penelitian lebih lanjut untuk menemukan solusi atas masalah korelasi antar peubah respon (Y) yang terdapat pada model pohon regresi data tersensor yang diatasi dengan analisis daya tahan.
DAFTAR PUSTAKA
Breiman L, Friedman JH, Olshen RA & Stone CJ. 1993. Classification and
Regression Tree. New York: Chapman and Hall.
Cox, RD and Oakes, D. 1984. Analysis of
Survival Data (Monographs on statistics and applied probability). New York: Chapman & Hall.
Lee, E.T and Wang J.W. 2003. Statistical
Methods for Survival Data Analysis.
Third Edition. New Jersey: John Wiley & Sons, Inc.
Lewis, R. J. 2000. An Introduction to
Classification and Regression Tree (CART) Analysis. California: Department of Emergency Medicine, Harbor-UCLA Medical Centre.
Mardein, Hweli. 2001. Penerapan Metode
Pohon Regresi dan Prosedur Regresi Bertatar Untuk Segmentasi Data. [Skripsi]. Bogor: FMIPA IPB.
SPSS, Inc. 2002. AnswerTree® 3.1 User’s
Guide. Chicago: SPSS Inc.
StatSoft, Inc. 2003. Classification and
Regression Trees (C&RT).
Http://www.statsoft.com/textbook/stcart.h
tml. [02 April 2007].
Wikipedia Foundation, Inc. 2008. Mean
Absolute Percentage Error.
Http://en.wikipedia.org/wiki/Mean_absol ute_percentage_error. [20 Mei 2008]
Wulandari, Syari Agustini. 2004. Analisis
Tingkat Keberhasilan Mahasiswa S2 IPB Menggunakan Pendekatan Pohon Regresi. [Skripsi]. Bogor: FMIPA IPB.
Lampiran 1. Frekuensi dan Persentase Mahasiswa S2 SPs IPB Pada Masing-masing Program Studi
No. Program Studi Jumlah Persentase (%)
1 Ilmu Ekonomi Pertanian/EPN 215 11.38
2 Sosiologi Pedesaan/SPD 92 4.87
3 Ilmu Perencanaan Pembangunan Wilayah dan Pedesaan/PWD 200 10.59
4 Ilmu Tanah/TNH 80 4.24
5 Pengelolaan Daerah Aliran Sungai/DAS 36 1.91
6 Agronomi/AGR 204 10.80
7 Arsitektur Lanskap/ARL 36 1.91
8 Entomologi dan Fitopatologi /ENT/FIT 78 4.13
9 Gizi Masyarakat dan Sumberdaya Keluarga/GMK 125 6.62
10 Biologi Reproduksi/BRP 46 2.44
11 Sains Veteriner/SVT 53 2.81
12 Kesehatan Masyarakat Veteriner/KMV 48 2.54
13 Ilmu Perairan/AIR 146 7.73
14 Pengelolaan Sumberdaya Pesisir dan Lautan/SPL 275 14.56
15 Teknologi Kelautan/TKL 164 8.68
16 Ilmu Kelautan/IKL 91 4.82
Total 1889 100.00
Lampiran 2. Deskripsi Peubah-peubah Kategorik Pada Seluruh Program Studi
No. Peubah
Jenis
Peubah Kategori Peubah Jumlah Persentase
(%)
1 Keterangan Out Nominal Lulus 1673 88.57
Aktif 207 10.96
Drop Out 1 0.05
Mengundurkan Diri 8 0.42
2 Jenis Kelamin Nominal Laki-laki 1088 57.60
Perempuan 801 42.40
3 Status Perkawinan Nominal Belum Menikah 687 36.37
Menikah 1202 63.63
4 Sumber Biaya Pendidikan Nominal Beasiswa 1193 63.16
Sendiri 696 36.84
5 Status Penerimaan Nominal Status Biasa 1331 70.46
Status Percobaan 558 29.54
6 Status Perguruan Tinggi Asal Nominal BHMN 621 32.87
Negeri 962 50.93
Swasta 296 15.67
Kedinasan 7 0.37
Luar Negeri 3 0.16
7 Akreditasi Program Studi S1 Ordinal A 731 38.70
B 914 48.39
C 231 12.23
8 Kesesuaian Program Studi Nominal Sesuai 1676 88.72
Tidak Sesuai 213 11.28
9 Jenis Pekerjaan Nominal Dosen di Perguruan
Tinggi 887 46.96 Peneliti di Lembaga Penelitian 114 6.03 Tenaga Advanced Professional 497 26.31 Fresh Graduates 236 12.49 Lainnya 155 8.21
Lampiran 3. Deskripsi Peubah-peubah Kontinu Pada Seluruh Program Studi
No. Peubah N Minimum Q1 Median Q3 Maximum Mean Std. Deviation 1 IPK S2 1889 2.80 3.37 3.54 3.70 4.00 3.53 0.22 2 Masa studi (Bulan) 1673 19.00 28.00 33.00 40.00 71.00 34.91 9.27 3 IPK S1 1889 2.02 2.77 2.99 3.21 4.00 2.99 0.33 4 Durasi S1 ke S2 (Tahun) 1889 0.00 2.00 5.00 9.00 29.00 6.27 4.82 5 Usia (Tahun) 1889 21.00 26.00 30.00 34.00 54.00 30.79 5.69
Lampiran 4. Deskripsi Peubah-peubah Kategorik Pada Masing-masing Program Studi S2
Program Studi
EPN SPD PWD TNH Peubah Jenis
Peubah
Kategori Peubah Jumlah Persentase (%) Jumlah Persentase (%) Jumlah Persentase (%) Jumlah Persentase (%)
Keterangan Out Nominal Lulus 191 88.84 88 95.65 171 85.50 74 92.5
Aktif 22 10.23 4 4.35 29 14.50 6 7.5
Drop Out 0 0 0 0 0 0 0 0
Mengundurkan Diri 2 0.93 0 0 0 0 0 0
Jenis Kelamin Nominal Laki-laki 116 53.95 54 58.70 137 68.50 45 56.25
Perempuan 99 46.05 38 41.30 63 31.50 35 43.75
Status Perkawinan Nominal Belum Menikah 94 43.72 25 27.17 60 30.00 25 31.25
Menikah 121 56.28 67 72.83 140 70.00 55 68.75
Sumber Biaya Pendidikan Nominal Beasiswa 131 60.93 69 75.00 111 55.50 60 75
Sendiri 84 39.07 23 25.00 89 44.50 20 25
Status Penerimaan Nominal Status Biasa 156 72.56 57 61.96 113 56.50 56 70
Status Percobaan 59 27.44 35 38.04 87 43.50 24 30
Status Perguruan Tinggi Asal Nominal BHMN 86 40.00 41 44.57 63 31.50 22 27.5 Negeri 103 47.91 38 41.30 97 48.50 50 62.5 Swasta 26 12.09 12 13.04 36 18.00 8 10 Kedinasan 0 0 0 0 4 2.00 0 0 Luar Negeri 0 0 1 1.09 0 0 0 0
Akreditasi Program Studi S1
Ordinal A 77 35.81 32 34.78 77 38.50 36 45
B 118 54.88 45 48.91 101 50.50 31 38.75
C 19 8.84 13 14.13 21 10.50 13 16.25
D 1 0.47 2 2.17 1 0.50 0 0
Kesesuaian Program Studi Nominal Sesuai 186 86.51 63 68.48 162 81.00 71 88.75
Tidak Sesuai 29 13.49 29 31.52 38 19.00 9 11.25
Jenis Pekerjaan Nominal Dosen di Perguruan Tinggi 101 46.98 46 50.00 64 32.00 35 43.75
Peneliti di Lembaga Penelitian 14 6.51 12 13.04 11 5.50 18 22.5 Tenaga Advanced Professional 40 18.60 25 27.17 95 47.50 14 17.5 Fresh Graduates 39 18.14 6 6.52 11 5.50 10 12.5 Lainnya 21 9.77 3 3.26 19 9.50 3 3.75