BAB III........................................................................................................................................ 13
3.3 Decision Tree
Decision tree adalah algoritma yang paling banyak digunakan untuk masalah klasifikasi. Sebuah decision tree terdiri dari beberapa simpul yaitu treeβs root, internal node dan leafs. Konsep entropi digunakan untuk penentuan pada atribut mana sebuah pohon akan terbagi (split). Dalam pohon keputusan, setiap simpul internal membagi ruang menjadi dua atau lebih sesuai dengan fungsi diskrit dari input atribut nilai. Dalam kasus yang paling sederhana dan paling sering, setiap tes menganggap sebagai atribut tunggal, sehingga ruang dipartisi kosong disesuaikan dengan nilai atribut. rapa simpul yaitu treeβs root, internal node dan leafs. Konsep menggunakan decision tree dilakukan oleh routing dari simpul akar sampai tiba di simpul daun.
15
Gambar 3.1 Ilustrasi Decision Tree
Menurut Saputra [19], decision tree merupakan metode yang paling efisien untuk menyaring sesuatu lewat pohon keputusan apakah suatu data lolos atau tidak terhadap saringan dengan proses yang cukup cepat dengan tahapan dalam membuat sebuah pohon keputusan sebagai berikut:
1. Menyiapkan data training yang sudah dikelompokkan ke dalam kelas tertentu.
2. Menentukan akar dari atribut, dimana akar akan diambil dari atribut yang terpilih yaitu dengan cara menghitung nilai gain dari masing-masing atribut. Nilai gain yang tertinggi akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung nilai entropy.
Adapun rumus untuk menghitung nilai entropy adalah sebagai berikut:
πΈππ‘ππππ¦ (π¦) = βπ1πππ2π1β π2πππ2π2β. . . βπππππ2ππ (1) dimana:
π1, π2, β¦ , ππ: proporsi kelas 1, kelas 2, β¦, dan kelas n dalam output 3.4 CART
CART (Classification and Regression Tree) merupakan metode eksplorasi data yang didasarkan pada teknik pohon keputusan. Pohon klasifikasi dihasilkan saat peubah respons berupa data kategorik, sedangkan pohon regresi dihasilkan saat peubah respons berupa data numerik [20]. Pohon terbentuk dari proses pemilahan rekursif biner pada suatu gugus data sehingga nilai peubah respons pada setiap gugus data hasil pemilahan akan lebih homogen [20].
16
Gambar 3.2 Ilustrasi CART
Pohon disusun oleh simpul t1, t2, β¦, t5. Setiap pemilah (split) memilah simpul non-terminal menjadi dua simpul yang saling lepas. Hasil prediksi respons suatu amatan terdapat pada simpul terminal [21].
Pembangunan pohon klasifikasi CART meliputi tiga hal [20], yaitu:
1. Pemilihan pemilah (split) 2. Penentuan simpul terminal 3. Penandaan label kelas 3.5 Random Forest
Random forest merupakan salah satu metode klasifikasi yang terdiri dari kumpulan decision trees. Random Forest adalah pengembangan dari metode CART, yaitu dengan menerapkan metode bootstrap aggregating (bagging) dan random feature selection.
Dalam random forest, banyak pohon ditumbuhkan sehingga terbentuk hutan (forest), kemudian analisis dilakukan pada kumpulan pohon tersebut. Pada gugus data yang terdiri atas n amatan dan p peubah penjelas, random forest dilakukan dengan cara:
1. Lakukan bootstrap yaitu mengambil sampel acak berukuran n dengan pengembalian pada tiap dataset.
2. Memilih m dimana m<p peubah penjelas pada setiap simpul, variabel m dipilih secara acak dan m terbaik digunakan untuk membagi simpul. Nilai m konstan selama pertumbuhan forest. Membangun pohon sampai mencapai ukuran maksimum (tanpa pemangkasan) dengan menggunakan sampel bootsrap.
3. Ulangi tahap 1 dan 2 sebanyak k kali, hingga terbentuk sebuah hutan yang terdiri dari k pohon.
17
4. Lakukan pendugaan penggabungan (aggregating) berdasarkan k buah pohon (missal menggunakan majority vote (suara terbanyak) pada kasus klasifikasi atau rata-rata pada kasus regresi).
Error klasifikasi random forest diduga melalui error OOB yang diperoleh dengan cara [22]:
1. Lakukan prediksi terhadap setiap data OOB pada pohon yang bersesuaian. Data OOB (out of bag) adalah data yang tidak termuat dalam contoh bootstrap.
2. Secara rata-rata, setiap amatan gugus data asli akan menjadi data OOB sebanyak sekitar 36% dari banyak pohon. Oleh karena itu, pada langkah 1, masing-masing amatan gugus data asli mengalami prediksi sebanyak sekitar sepertiga kali dari banyaknya pohon. Jika a adalah sebuah amatan dari gugus data asli, maka hasil prediksi random forest terhadap a adalah gabungan dari hasil prediksi setiap kali a menjadi data OOB.
3. Error OOB dihitung dari proporsi misklasifikasi hasil prediksi random forest dari seluruh amatan gugus data asli.
3.6 SMOTE+TL
Synthetic Minority Oversampling Technique (SMOTE) adalah salah satu metode oversampling untuk mengatasi class imbalanced. SMOTE bekerja dengan menghasilkan data synthetic pada kelas minoritas bukan dengan menggunakan replacement atau randomized sampling techniques (Chawla, 2005). Metode SMOTE bekerja dengan mencari k-nearest neighbors (yaitu ketetanggaan terdekat data sebanyak k) untuk setiap data di kelas minoritas, setelah itu dibuat data sintetis sebanyak presentase duplikasi yang diinginkan antara data minor dan k-nearest neighbors yang dipilih secara acak [12].
SMOTE+TL adalah metode SMOTE yang diterapkan dengan metode Tomek Links setelah data di oversampling dengan menggunakan SMOTE. Tomek Link didefinisikan sebagai pasangan data dari kelas yang berbeda, satu dari kelas minoritas dan yang lainnya dari kelas mayoritas (π₯π, π₯π), yang mempunyai neighbors terdekat antar satu sama lain.
Pada metode ini, pertama adalah mengaplikasikan metode SMOTE untuk oversampling kelas minoritas, kemudian diidentifikasi menggunakan Tomek Links dan kedua pasangan data dari masing-masing pasangan dihapus [16].
18 3.7 MWMOTE
MWMOTE merupakan metode yang di usulkan oleh Barua, Islam, Yao & Murase [11] untuk mengatasi masalah class imbalanced secara efisien. Cara kerja MWMOTE adalah dengan menghasilkan sampel synthetic pada data minoritas. MWMOTE dimulai dengan mengindentidikasi data minoritas (Simin), dan diberikan bobot tertentu (Sw), berdasarkan jarak ke data terdekat pada kelas mayoritas. Bobot ini kemudian dikonversi ke probabilitas terpilih Sp dan akan digunakan pada tahap oversampling.
Untuk menghasilkan sampel synthetic yang baru, seluruh data pada kelas minoritas Smin di kelompokkan ke grup M. Kemudian data minoritas x dari Simin dipilih berdasarkan probabilitas terpilih Sp dan data minoritas acak lain pada Smin yang masuk ke dalam kelompok yang sama dengan x digunakan untuk menghasilkan sampel synthetic yang baru dengan cara yang sama dengan SMOTE. Pendekatan ini dilakukan sebanyak yang sebanyak N yang diperlukan dari sampel synthetic.
3.8 Kriteria Evaluasi Kinerja (Performance)
Dalam klasifikasi, hamper tidak mungkin ntuk membuat klasifikasi yang sempurna untuk mengklasifikasikan semua objek. Untuk data tidak seimbang, akurasi lebih didominasi oleh ketepatan pada data kelas minoritas, maka matriks yang tepat adalah AUC (Area Under the ROC Curve), F-Measure, G-mean, Apparent Error Rate (APER), Total Accuracy Rate (1-APER), dan akurasi kelas minoritas (Zhang & Wang, 2011).
Confusion matrix merupakan metode yang menggunakan table matriks seperti pada Tabel 3.1, jika data set hanya terdiri dari dua kelas, kelas yang satu dianggap sebagai positif dan yang lainnya negatif [23].
Tabel 3.1 Confusion Matrix Predictive Class True Class
Positive Negative
Positive True Positive (TP) False Negative (FN) Negative False Positive (FP) True Negative (TN)
Untuk menghitung digunakan persamaan di bawah ini [23]
1. Accuracy digunakan untuk menghitung akurasi hasil klasifikasi.
π΄πππ’ππππ¦ = ππ+ππ
ππ+ππ+πΉπ+πΉπ (2)
19
2. Sensitivity (Recall) atau TPrate yaitu proporsi dari hasil klasifikasi yang bernilai True Positive.
π πππππ = ππ
πΉπ+ππ (3) 3. Specificity atau TNrate yaitu proporsi dari hasil klasifikasi yang bernilai True
Positive.
ππππππππππ‘π¦ = ππ
πΉπ+ππ (4)
4. Precision yaitu bagian dari predicted yang bernilai positive.
ππππππ πππ = ππ
ππ+πΉπ (5)
5. F-Measure merupakan rata-ratatertimbang antara precision dan recall dimana jika nilai F-Measure tinggi maka nilai precision dan recall juga tinggi.
πΉ β ππππ π’ππ = 2 Γπ πππππΓππππππ πππ
π πππππ+ππππππ πππ (6) 6. Area Under Curve (AUC) digunakan sebagai ukuran evaluasi untuk
dataset tidak seimbang,
π΄ππΆ =π πππ ππ‘ππ£ππ‘π¦+ππππππππππ‘π¦
2 (7)
Adapun interval ketepatan klasifikasi yang baik dengan perhitungan AUC adalah sebagai berikut [24]:
Tabel 3.2 Kriteria Nilau AUC Nilai AUC Keterangan
0.5-0.6 Kurang
Remaja adalah mereka yang mengalami masa transisi (peralihan) dari masa kanak-kanak menuju masa dewasa, yaitu antara usia 12-13 tahun hingga usia 20-an, perubahan yang terjadi termasuk drastis pada semua aspek perkembangannya yaitu meliputi perkembangan fisik, kognitif, kepribadian dan sosial [25]. masa remaja adalah peralihan dari masa anak dengan masa dewasa yang mengalami perkembangan semua aspek/ fungsi untuk memasuki masa dewasa [26]. Secara global masa remaja berlangsung antara 12 β
20
21 tahun, dengan pembagian 12 β 15 tahun: masa remaja awal, 15 β 18 tahun: masa remaja pertengahan, 18 β 21 tahun masa remaja akhir [27].
3.10 Perilaku Berisiko
Perilaku beresiko ini adalah perilaku yang memiliki akibat yang serius.
Perilaku yang berisiko adalah perilaku yang dapat menyebabkan kematian atau dapat menimbulkan penyakit pada remaja, yaitu merokok, perilaku yang menyebabkan cedera dan kekerasan, alkohol dan obat terlarang, diet yang dapat menyebabkan kematian, gaya hidup bebas, serta perilaku seksual yang dapat meyababkan kehamilan dan kematian.
Beberapa masalah kesehatan yang terjadi pada remaja berkaitan dengan perilaku berisiko yaitu merokok, minum minuman, beralkohol, penyalahgunaan narkoba, dan melakukan hubungan seksual pranikah [28].
3.11 Road Map Penelitian
Penelitian ini relevan dengan Penelitian pada Pusat Studi Sains Fundamental sebagaimana dapat dilihat pada Gambar 3.3.
Gambar 3.3 Road Map Penelitian Pusat Penelitian Sains Fundamental
Penelitian ini juga relevan dengan salah satu topik penelitian yang dikembangkan oleh ketua peneliti di Laboratorium Statistika Komputasi yang ada di Departemen Statistika ITS sebagaimana Gambar 3.4.
21
Gambar 3.4 Road Map Penelitian Laboratorium Statistika Komputasi
22 BAB IV METODE
4.1 Tahapan Penelitian
Adapun tahapan-tahapan kegiatan untuk penelitian yaitu sebagaimana Tabel 4.1.
Tabel 4. 1 Tahapan Penelitian, Metode, Tugas Tim, Waktu dan target Luaran Tujuan
2 Bulan Mengklasifikasikan data perilaku
3 Bulan Mengetahui metode terbaik untuk
Adapun langkah-langkah analisis pada penelitian ini adalah sebagai berikut.
1. Melakukan eksplorasi pada data dependen dan independen.
2. Melakukan pre-processing data.
3. Membagi data menjadi data training dan data testing.
4. Menerapkan algoritma random forest pada data perilaku berisiko remaja.
a. Mengambil m jumlah variabel prediktor secara acak dan menentukan k pohon yang akan dibentuk.
b. Membentuk tree model dari dataset testing dengan kombinasi m variabel prediktor yang diambil secara acak dan k buah ukuran pohon.
5. Menerapkan algoritma MWMOTE dan SMOTE+TL pada data perilaku berisiko remaja dengan random forest sebagad base classifier.
6. Menglasifikasikan data dan melakukan pengujian akurasi.
7. Membandingkan rata-rata akurasi dan AUC dari hasil klasifikasi dengan menggunakan berbagai metode imbalanced.
23
8. Menginterpretasikan hasil klasifikasi yang mempunyai performa terbaik dan menarik kesimpulan dan saran.
4.2 Diagram Alir
Adapun diagram alir dari penelitian ini adalah sebagai berikut:
Gambar 4.1 Diagram Alir Penelitian 4.3 Luaran
Luaran yang akan dicapai dari penelitian ini adalah sebagai berikut.
1. Publikasi 1 makalah atau paper pada jurnal internasional terindeks scopus berkategori Q2. Rencana di Songklanakarin Journal of Science and Technology (SJST).
2. Satu makalah hasil Conference hasil riset yang telah dilakukan pada seminar nasional maupun internasional.
3. Buku tesis yang sudah selesai.
24 4.4 Organisasi Tim Peneliti
Tabel 4. 2 Susunan Organisasi Tim Peneliti dan Pembagian Tugas
Nama Peran Tugas
Dr. Dra. Kartika Fithriasari, M. Si.
Ketua 1. Mengkoordinasikan : - Penyusunan proposal - Presentasi proposal - Publikasi hasil penelitian - Penyusunan Laporan - Membantu Menyelesaikan
Tujuan 1, bersama Anggota-1 dan
Mahasiswa: Nilam Novita Sari
Judul: Perbandingan Metode Klasifikasi pada Data Imbalanced Menggunakan MWMOTE dan SMOTE+TL pada Perilaku Berisiko Remaja
Dr. Ismaini Zain, M. Si. Anggota 1 1. Membantu Ketua Peneliti 2. Pelaksanaan penelitian
3. Melakukan analisa dan evaluasi data 4. Membantu Menyusun Laporan Dr. Rr.Iswari Hariastuti,
Dra.M. Kes
Anggota 2 1. Membantu Ketua Peneliti
2. Pelaksanaan penelitian
3. Melakukan analisa dan evaluasi data Erma Oktania Permatasari,
S.Si., M.Si.
Anggota 3 1. Membantu Ketua Peneliti
2. Penggunaan dana 3. Pelaksanaan penelitian
4. Melakukan analisa dan evaluasi data 5. Membantu Menyusun Laporan Nilam Novita Sari Mahasiswa
Tesis
1. Melakukan penelitian
2. Membaca literatur secara detail tentang penelitian yang dilakukan
3. Menyusun laporan hasil penelitian 4. Membuat makalah atau paper 4.5 Rencana Anggaran Biaya
Rincian biaya untuk penelitian ini adalah sebagaimana Tabel 4.3.
25
Tabel 4.3 Total Biaya
No Jenis Pengeluaran Biaya Yang Diusulkan (Rp)
1. Honorarium -
2. Pembelian Bahan Habis Pakai 13.130.000
3. Perjalanan 27.900.000
4. Sewa / Peralatan Penunjang Lainnya
8.500.000
Jumlah 49.530.000
Terbilang: Empat Puluh Sembilan Juta Lima Ratus Tiga Puluh Ribu Rupiah.
Uraian secara detail tentang biaya penelitian diberikan pada Lampiran-1.
26 BAB V JADWAL
Penelitian ini direncanakan selama 8 bulan dengan jadwal penelitian sebagai mana Tabel 5.1.
Tabel 5.1 Rencana Kegiatan dan Target Penelitian
No Jenis Kegiatan
Bulan
1 2 3 4 5 6
1. Melakukan persiapan penelitian dan studi pustaka
X 2. Menyempurnakan proposal
Penelitian
X 3. Mensosialisasikan topik
penelitian kepada tim peneliti.
X 4. Menyelesaikan
Tujuan-penelitian dari TESIS
X X X 5. Menyusun Laporan Kemajuan
Penelitian
X 6. Menyusun makalah Jurnal
Internasional terindeks Scopus Q2
X X
7. Menyusun makalah untuk untuk seminar Internasional terindeks Scopus
X
8. Pembuatan Laporan Akhir penelitian.
X
27 BAB VI
DAFTAR PUSTAKA
[1] Santosa, B. 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis.
Yogyakarta: Graha Ilmu.
[2] Han, J., Kamber & M., Pei, J. 2011. Data Mining Concepts and Techniques 3rd Edition.
Waltham: Elsevier Inc.
[3] Berry, M. J. & Linoff, G. S. 2004. Data Mining Techniques for marketing, sale, customer relationship management. Indianapolis: Wiley Publishing, Inc.
[4] Dhawangkhara, M. & Riksakomara, E. 2017. βPrediksi Intensitas Hujan Kota Surabaya dengan Matlab Menggunakan Teknik Random Forest dan CART (Studi Kasus Kota Surabaya)β. Jurnal Teknik ITS, 6(1): 94-99.
[5] Gu, Q., Wang, X. M., Wu, Z., Ning, B. & Xin, C. S. 2016. βImproved SMOTE Algorithm Based on Genetic Algorithm for Imbalanced Data Classificationβ. Journal of Digital Information Management, Vol. 14, No. 2.
[6] Pangastuti, S.S., Fithriasari, K., Iriawan, N. & Suryaningtyas, W. 2019. βClassification Boosting in Imbalanced Dataβ. Malaysian Journal of Science, Vol. 38, No. Sp2, p. 36-45.
[7] Jian, C., Gao, J. & Ao, Y. 2017. βImbalanced Defect Classification for Mobile Phone Screen Glass Using Multifractal Features and a New Sampling Methodβ. Journal of Springer Science and Business Media.
[8] Guo, S., Guo, D., Chen, L. & Jiang, Q. 2016. βA centroid-based gene selection method for microarray data classificationβ. Journal of Theoretical Biology, 400(2016), 32-41.
[9] Jian, C., Gao, J. & Ao, Y. 2016. βA New Sampling Method for Classifying Imbalanced Data Based on Support Vector machine Ensembleβ. Neurocomputing, 193, 115-122.
[10] Untoro, M. C. & Buliali, J. L. 2018. βPenanganan Imbalanced Class Data Laboratorium Kesehatan dengan Majority Weighted Minority Oversampling Techniqueβ. Jurnal Ilmiah Teknologi Sistem Informasi.
[11] Barua, S., Islam, M. M., yao, X. & Murase, K. 2014. βMWMOTE-Majority Weighted Minority Oversampling Technique for Imbalanced Data Set Learningβ. IEEE Trans.
Knowl. Data Eng., 26 (2), 405-425 .
[12] Iriawan, N., Fithriasari, K., Ulama, B.S.S., Suryaningtyas, W., Pangastuti, S.S., Cahyani, N. & Qadrini, L. 2018. βOn The Comparison: Random Forest, SMOTE-Bagging, and Bernoulli Mixture to Classify Bidikmisi Dataset in East Javaβ. 2018 International Conference on Computer Engineering, Network and Intelligent Multimedia (CENIM), Surabaya, Indonesia, 2018, pp. 137-141.
[13] Sastrawan, A. S., Baizal, ZK. A. & Bijaksana, M. A. 2010. βAnalisis Pengaruh Metode Combine Sampling dalam Churn Prediction untuk Perusahaan Telekomunikasiβ.
[14] Sain, H. & Purnami, S. W. 2015. βCombine Sampling Support Vector Machine for Imbalanced Data Classificationβ. Procedia Computer Science, 72, 59-66.
[15] Jatmiko, Y. A., Padmadisastra, S. & Chadidjah, A. 2019. βAnalisis Perbandingan Kinerja Cart Konvemmsional, Bagging dan Random Forest pada Klasifikasi Objek:
Hasil dari Dua Simulasiβ. Media Statistika, 12(2): 1-12.
[16] Santos, M. S., Soares, J. P., Abreu, P. H., Araujo, H. & Santos, J. 2018. βCross-Validation for Imbalanced Dataβ. IEEE Computational Intelligence Magazine, 13(4), p:59-76.
28
[17] Maisya, I. B., Susilowati, A. & Rachmalina, R. 2013. βGambaran Perilaku Berisiko Remja di kelurahan Kebon Kelapa Kecamatan Bogor Tengah Kota Bogor Tahun 2013 (Studi Kualitatif)β. Jurnal Kesehatan Reproduksi, Vol. 4 No 3, p:123-130.
[18] Maharti, V. I. 2015. βFaktor-faktor yang Berhubungan dengan Perilaku Penyalahgunaan Narkoba pada Remaja Usia 15-19 Tahun di Kecamatan Semarang Utara Kota Semarangβ. Jurnal Kesehatan Masyarakat, Vol. 3, No. 3.
[19] Saputra, R. A. 2014. βKomparasi Algoritma Klasifikasi Data Mining untuk Memprediksi Penyakit Tuberculosis (TB): Studi Kasus Puskesmas Karawang Sukabumiβ. Seminar Nasional Inovasi dan Tren (SNIT).
[20] Breiman, Leo. Friedman, J., Olshen, R. and Stone, C. 1984. Classification and Regression Trees. New York: Chapman & Hall.
[21] Dewi, N. K., Syafitri, U. D. & Mulyadi, S. Y. 2011. βPenerapan Metode Random Forest dalam Driver Analysisβ. Forum Statistika dan Komputasi, p: 35-43.
[22] Liaw. A. & Wiener, M. Des 2002. βClassification and Regression by Random Forestβ.
Rnews, Vol. 2/3:18-22
[23] Olson, D. & Yong, Shi. 2008. Pengantar Ilmu Pengalian Data Bisnis. Jakarta: Salemba Empat.
[24] Bekkar, M., Djemaa, H. K. & Alitouche, T. A., 2013. βEvaluation Measure for Models Assessment over Imbalanced Data Setsβ. Journal of Information Engineering and Aplications.
[25] Gunarsa, S. 2006. Psikologi Perkembangan Anak dan Dewasa. Jakarta: Gunung Mulia.
[26] Rumini, S. & Sundari, S. 2004. Perkembangan Anak dan Remaja. Jakarta: PT. Asdi Mahasatya.
[27] Monks, F.J., Knoers, A.M.P. & Haditono, S.R. 2002. Psikologi Perkembangan:
Pengantar dalam Berbagai Bagiannya. Yogyakarta: Gadjah Mada University Press.
[28] Bart, Smet. (1994). Psikologi Kesehatan. PT. Gramedia Widiasarna Indonesia : Jakarta.
29 BAB VII LAMPIRAN
30
Biodata Tim Peneliti
1. Ketua
a. Nama Lengkap : Dr. Dra. Kartika Fithriasari, M.Si.
b. NIP/NIDN : 19691212 199303 2 002
c. Fungsional/Pangkat/Gol : Lektor
d. Bidang Keahlian : Statistik Komputasi
e. Departemen/Fakultas : Statistika/Sains dan Analitika data
f. Alamat Rumah dan No. Telp. : Perum ITS Jl. Teknik Komputer V Blok U-178
Surabaya / 0818396410
g. Riwayat penelitian/pengabdian : Penelitian
No Judul Penelitian Peran Tahun
1 Analisis Twitter Untuk Evaluasi Pembangunan Kota Surabaya Dengan Pendekatan Model Bayesian Hirarki dan Machine Learning
Ketua 2019
2 Pemodelan dan Pemetaan Big-Data Program Bidikmisi Sebagai Early Warning System dalam Rangka Mempersiapkan SDM di Era MEA dengan Pendekatan Hierarchical Bayesian
Anggota 2018
3 Pengembangan Model Detektor Ketepatan Penentuan ROI pada citra MRI Tumor Otak dengan pendekatan Bayesian Skew Normal Mixture Model
Anggota 2018
4 Analisis Twitter untuk Evaluasi Pembangunan Kota Surabaya Dengan Pendekatan Model Bayesian Hirarki Dan Machine Learning
Ketua 2018
5 Pendekatan Binary Logit Model-Bayesian Network Hybrid Untuk Analisis Pencemaran Bakteri Salmonella Sp Pada Udang Vaname (Litopenaeus Vannamei)
Anggota 2017
6 Pemodelan dan Pemetaan Big-Data Program Bidikmisi Sebagai Early Warning System
Anggota 2017
31 dalam Rangka Mempersiapkan SDM di Era MEA dengan Pendekatan Hierarchical Bayesian
Pengabdian
No Judul Penelitian Peran Tahun
1 Analisis dan Survey Tingkat Pemahaman Budaya Surabaya 2018 (Bappeko Surabaya)
Ketua 2018
2 Analisis dan Survey Tingkat Kepedulian Masyarakat Dalam Kegiatan Yang Mendorong Nilai-Nilai Kebangsaan di Surabaya 2018 (Bappeko Surabaya)
Ketua 2018
3 Analisis dan Survey Tingkat persepsi Masyarakat atas pelaksanaan pembangunan kota 2018 (Bappeko Surabaya)
Ketua 2018
4 Pelatihan Pengolahan Data Statistik Sektoral untuk Perangkat Daerah Pemerintah Provinsi Jawa Timur
Anggota 2019
h. Publikasi :
No Judul Penelitian Peran Tahun
1 Classification Boosting in Imbalanced Data
2019 2 Linking Twitter Sentiment
Knowledge with Infrastructure Development
2018
3 On the Comparison of Deep Learning Neural Network and Binary Logistic Regression for Classifying the Acceptance Status of Bidikmisi Scholarship Applicants in East Java
2018
4 On The Markov Chain Monte Carlo Convergence Diagnostic of Bayesian Finite Mixture Model for Income Distribution
2018
5 Bayesian Network Inference In Binary Logistic Regression: A Case Study Of Salmonella Sp
2017
32 Bacterial Contamination On Vannamei Shrimp
6 Clustering the Stationary And Non Stationary Time Series Based On Autocorrelation Distance Of Hierarchical And K-Means Algorithm
2017
7 On The Value At Risk Using Bayesian Mixture Laplace Autoregressive Approach For Modelling The Islamic Stock Risk Investment
2017
i. Paten : -
j. Tugas akhir, Tesis, dan Disertasi yang selesai dibimbing:
No Judul Penelitian Tahun
1 Model Hierarchical Survival pada Kasus Kejadian Demam Berdarah Dengue (DBD) di Kota Surabaya
Tesis 2019
2 Klastering Data Twitter dengan Menggunakan Metode Laten Dirichlet Allocation (LDA) dan Laten Semantic Analysis (LSA)
Tesis 2019
3 Pengaruh Long Memory Terhadap Pengujian Asimetris dan Aplikasinya pada Data Indeks Harga Saham Gabungan
Tesis 2019
4 Analisis Perilaku Remaja Melakukan Seks Pra-Nikah di Jawa Timur Menggunakan CART dengan SMOTE-N-ENN dan Adasyn
Skripsi 2020
5 Klasifikasi Sentimen data Ulassan Wisatawan Candi Borobudur di Situs Tripadvisor Menggunakan SVM dan K-NN
Skripsi 2019
6 Text Clustering untuk Pengelompokkan Topik Aduan
Masyarakat Kepala
Pemerintahan Kota Surabaya dengan K-Means dan Self Organizing Maps
Skripsi 2019
7 Identifikasi Wajah
Menggunakan Multi Layer Perceptron dan Convolutional Neural Network
Skripsi 2019
33 8 Analisis Rekomendasi Film
Menggunakan Kombinasi Single Linkage Clustering dan K-Means Clustering dengan Pendekatan User-Based Collaborative Filtering
Skripsi 2019
9 Analisis Klasifikasi Black Campaign Tweets pada Periode Kampanye Pemilihan Presiden 2019
Skripsi 2019
10 Text Analysis pada Maskapai Penerbangan Indonesia di Twitter Menggunakan Metode K-Means dan Support Vector Machine
Skripsi 2019
11 Perbandingan Metode K-Means dan Fuzzy C-Means untuk Pengelompokkan Tweet yang ditujukan Kepada PT. Kereta Api Indonesia (@Kai121) dengan Menggunakan N-Gram
Skripsi 2019
2. Anggota
a. Nama Lengkap : Dr. Ismaini Zain, M.Si.
NIP/NIDN : 19600525 198803 2 001
b. Fungsional/Pangkat/Gol : Lektor
c. Bidang Keahlian : Studi Demografi, Analisis data Kategorik,
Teknik Sampling, Statistika Sosial
d. Departemen/Fakultas : Statistika/Sains dan Analitika data
e. Alamat Rumah dan No. Telp. : Deltasari Indah AB/9, Sidoarjo / 08123036678 f. Riwayat penelitian/pengabdian :
Penelitian
No Judul Penelitian Peran Tahun
1 Estimasi Kurva Regresi Semiparametrik Multivariabel Menggunakan Pendekatan Estimator Campuran Spline dan Kernel.
Anggota 2018
2 Pengelompokkan
Kabupaten/Kota Berdasarkan Indikator Sanitasi Lingkungan Sebagai Dasar Evaluasi Pencapaian Tujuan SDGs Di Provinsi Jawa Timur
Anggota 2018
34 3 Analisis Faktor-Faktor yang
Mempengaruhi Angka
Kematian Bayi (AKB) Berdasarkan Indikator Sanitasi dan Kesehatan Sebagai Dasar Evaluasi Pencapaian Target SDGs di Provinsi Sulawesi Utara
Anggota 2019
4 Pengelompokan Dan
Pemodelan Kualitas Proses Pendidikan Perguruan Tinggi Negeri Di Indonesia Menurut Jalur Masuk Dengan Pendekatan Metode Ensemble Rock (Robust Clustering Using Links) Dan Similarity Weight And Filter Method (Swfm) Serta Quantile Regression
Ketua 2017
5 Pemodelan Konsumsi Air Bersih dengan Pendekatan Model Tobit Double Hurdle Berbasis Analisis Gender pada Rumah tangga Miskin.
Ketua 2017
Pengabdian
No Judul Penelitian Peran Tahun
1 Program Terapan Bidang Teknologi lnformasi dan Komunikasi (PRODISTIK) Madrasah Aliyah Zainul Hasan I Genggong
2017
2 Kampung Literasi Dolly Jilid Ii:
Penguatan Potensi Menulis Bagi Remaja Di Kawasan Budaya Kelurahan Putat Jaya.
Abdimas Reguler ITS Tahun 2018
2017
3 Pelatihan Tata Cara Penyusunan Proposal Penelitian Dana Ristek Dikti Untuk Dosen Undar Jombang. SK Abdimas Reguler Its.
2018
4 Pelatihan Metodelogi Penelitian Untuk Dosen Stikom β Surabaya. Sk Abdimas Reguler Its
2019
5 Penguatan Kampung Literasi
ITS: Meningkatkan
2019
35 Profesionalisme Petugas Taman Baca Masyarakat (TBM) Di Wilayah Kota Surabaya Melalui Program Mentoring Literasi Berimbang (Balanced
Literacy). ABDIMAS
BERBASIS PENELITIAN ITS tahun 2019:
g. Publikasi :
No Judul Penelitian Peran Tahun
1 Censored Hurdle Negative Binomial Regression (Case Study: Neonatorum Tetanus Case in Indonesia) Provinsi Sumatera Utara, Jurnal Sains dan Seni ITS
2017
h. Paten : -
k. Tugas akhir, Tesis, dan Disertasi yang selesai dibimbing
No Judul Tahun
1 Pemodelan pada data Penerimaan Calon Mahasiswa Baru melalui Jalur Ujian Tulis Semiparametrik untuk data Longitudinal menggunakan Estimator Campuran Spline Truncated dan Deret Fourier
Tesis 2019
Tesis 2019