Decision Tree - PROPOSAL PENELITIAN PASCASARJANA ITS DANA ITS TAHUN 2020

BAB III........................................................................................................................................ 13

3.3 Decision Tree

Decision tree adalah algoritma yang paling banyak digunakan untuk masalah klasifikasi. Sebuah decision tree terdiri dari beberapa simpul yaitu tree’s root, internal node dan leafs. Konsep entropi digunakan untuk penentuan pada atribut mana sebuah pohon akan terbagi (split). Dalam pohon keputusan, setiap simpul internal membagi ruang menjadi dua atau lebih sesuai dengan fungsi diskrit dari input atribut nilai. Dalam kasus yang paling sederhana dan paling sering, setiap tes menganggap sebagai atribut tunggal, sehingga ruang dipartisi kosong disesuaikan dengan nilai atribut. rapa simpul yaitu tree’s root, internal node dan leafs. Konsep menggunakan decision tree dilakukan oleh routing dari simpul akar sampai tiba di simpul daun.

Gambar 3.1 Ilustrasi Decision Tree

Menurut Saputra [19], decision tree merupakan metode yang paling efisien untuk menyaring sesuatu lewat pohon keputusan apakah suatu data lolos atau tidak terhadap saringan dengan proses yang cukup cepat dengan tahapan dalam membuat sebuah pohon keputusan sebagai berikut:

1. Menyiapkan data training yang sudah dikelompokkan ke dalam kelas tertentu.

2. Menentukan akar dari atribut, dimana akar akan diambil dari atribut yang terpilih yaitu dengan cara menghitung nilai gain dari masing-masing atribut. Nilai gain yang tertinggi akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut, hitung nilai entropy.

Adapun rumus untuk menghitung nilai entropy adalah sebagai berikut:

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑦) = −𝑝₁𝑙𝑜𝑔₂𝑝₁− 𝑝₂𝑙𝑜𝑔₂𝑝₂−. . . −𝑝_𝑛𝑙𝑜𝑔₂𝑝_𝑛 (1) dimana:

𝑝₁, 𝑝₂, … , 𝑝_𝑛: proporsi kelas 1, kelas 2, …, dan kelas n dalam output 3.4 CART

CART (Classification and Regression Tree) merupakan metode eksplorasi data yang didasarkan pada teknik pohon keputusan. Pohon klasifikasi dihasilkan saat peubah respons berupa data kategorik, sedangkan pohon regresi dihasilkan saat peubah respons berupa data numerik [20]. Pohon terbentuk dari proses pemilahan rekursif biner pada suatu gugus data sehingga nilai peubah respons pada setiap gugus data hasil pemilahan akan lebih homogen [20].

Gambar 3.2 Ilustrasi CART

Pohon disusun oleh simpul t1, t2, …, t5. Setiap pemilah (split) memilah simpul non-terminal menjadi dua simpul yang saling lepas. Hasil prediksi respons suatu amatan terdapat pada simpul terminal [21].

Pembangunan pohon klasifikasi CART meliputi tiga hal [20], yaitu:

1. Pemilihan pemilah (split) 2. Penentuan simpul terminal 3. Penandaan label kelas 3.5 Random Forest

Random forest merupakan salah satu metode klasifikasi yang terdiri dari kumpulan decision trees. Random Forest adalah pengembangan dari metode CART, yaitu dengan menerapkan metode bootstrap aggregating (bagging) dan random feature selection.

Dalam random forest, banyak pohon ditumbuhkan sehingga terbentuk hutan (forest), kemudian analisis dilakukan pada kumpulan pohon tersebut. Pada gugus data yang terdiri atas n amatan dan p peubah penjelas, random forest dilakukan dengan cara:

1. Lakukan bootstrap yaitu mengambil sampel acak berukuran n dengan pengembalian pada tiap dataset.

2. Memilih m dimana m<p peubah penjelas pada setiap simpul, variabel m dipilih secara acak dan m terbaik digunakan untuk membagi simpul. Nilai m konstan selama pertumbuhan forest. Membangun pohon sampai mencapai ukuran maksimum (tanpa pemangkasan) dengan menggunakan sampel bootsrap.

3. Ulangi tahap 1 dan 2 sebanyak k kali, hingga terbentuk sebuah hutan yang terdiri dari k pohon.

4. Lakukan pendugaan penggabungan (aggregating) berdasarkan k buah pohon (missal menggunakan majority vote (suara terbanyak) pada kasus klasifikasi atau rata-rata pada kasus regresi).

Error klasifikasi random forest diduga melalui error OOB yang diperoleh dengan cara [22]:

1. Lakukan prediksi terhadap setiap data OOB pada pohon yang bersesuaian. Data OOB (out of bag) adalah data yang tidak termuat dalam contoh bootstrap.

2. Secara rata-rata, setiap amatan gugus data asli akan menjadi data OOB sebanyak sekitar 36% dari banyak pohon. Oleh karena itu, pada langkah 1, masing-masing amatan gugus data asli mengalami prediksi sebanyak sekitar sepertiga kali dari banyaknya pohon. Jika a adalah sebuah amatan dari gugus data asli, maka hasil prediksi random forest terhadap a adalah gabungan dari hasil prediksi setiap kali a menjadi data OOB.

3. Error OOB dihitung dari proporsi misklasifikasi hasil prediksi random forest dari seluruh amatan gugus data asli.

3.6 SMOTE+TL

Synthetic Minority Oversampling Technique (SMOTE) adalah salah satu metode oversampling untuk mengatasi class imbalanced. SMOTE bekerja dengan menghasilkan data synthetic pada kelas minoritas bukan dengan menggunakan replacement atau randomized sampling techniques (Chawla, 2005). Metode SMOTE bekerja dengan mencari k-nearest neighbors (yaitu ketetanggaan terdekat data sebanyak k) untuk setiap data di kelas minoritas, setelah itu dibuat data sintetis sebanyak presentase duplikasi yang diinginkan antara data minor dan k-nearest neighbors yang dipilih secara acak [12].

SMOTE+TL adalah metode SMOTE yang diterapkan dengan metode Tomek Links setelah data di oversampling dengan menggunakan SMOTE. Tomek Link didefinisikan sebagai pasangan data dari kelas yang berbeda, satu dari kelas minoritas dan yang lainnya dari kelas mayoritas (𝑥_𝑖, 𝑥_𝑗), yang mempunyai neighbors terdekat antar satu sama lain.

Pada metode ini, pertama adalah mengaplikasikan metode SMOTE untuk oversampling kelas minoritas, kemudian diidentifikasi menggunakan Tomek Links dan kedua pasangan data dari masing-masing pasangan dihapus [16].

18 3.7 MWMOTE

MWMOTE merupakan metode yang di usulkan oleh Barua, Islam, Yao & Murase [11] untuk mengatasi masalah class imbalanced secara efisien. Cara kerja MWMOTE adalah dengan menghasilkan sampel synthetic pada data minoritas. MWMOTE dimulai dengan mengindentidikasi data minoritas (Simin), dan diberikan bobot tertentu (Sw), berdasarkan jarak ke data terdekat pada kelas mayoritas. Bobot ini kemudian dikonversi ke probabilitas terpilih Sp dan akan digunakan pada tahap oversampling.

Untuk menghasilkan sampel synthetic yang baru, seluruh data pada kelas minoritas Smin di kelompokkan ke grup M. Kemudian data minoritas x dari Simin dipilih berdasarkan probabilitas terpilih Sp dan data minoritas acak lain pada Smin yang masuk ke dalam kelompok yang sama dengan x digunakan untuk menghasilkan sampel synthetic yang baru dengan cara yang sama dengan SMOTE. Pendekatan ini dilakukan sebanyak yang sebanyak N yang diperlukan dari sampel synthetic.

3.8 Kriteria Evaluasi Kinerja (Performance)

Dalam klasifikasi, hamper tidak mungkin ntuk membuat klasifikasi yang sempurna untuk mengklasifikasikan semua objek. Untuk data tidak seimbang, akurasi lebih didominasi oleh ketepatan pada data kelas minoritas, maka matriks yang tepat adalah AUC (Area Under the ROC Curve), F-Measure, G-mean, Apparent Error Rate (APER), Total Accuracy Rate (1-APER), dan akurasi kelas minoritas (Zhang & Wang, 2011).

Confusion matrix merupakan metode yang menggunakan table matriks seperti pada Tabel 3.1, jika data set hanya terdiri dari dua kelas, kelas yang satu dianggap sebagai positif dan yang lainnya negatif [23].

Tabel 3.1 Confusion Matrix Predictive Class True Class

Positive Negative

Positive True Positive (TP) False Negative (FN) Negative False Positive (FP) True Negative (TN)

Untuk menghitung digunakan persamaan di bawah ini [23]

1. Accuracy digunakan untuk menghitung akurasi hasil klasifikasi.

𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = ^{𝑇𝑃+𝑇𝑁}

𝑇𝑃+𝑇𝑁+𝐹𝑁+𝐹𝑃 (2)

2. Sensitivity (Recall) atau TPrate yaitu proporsi dari hasil klasifikasi yang bernilai True Positive.

𝑅𝑒𝑐𝑎𝑙𝑙 = ^𝑇𝑃

𝐹𝑁+𝑇𝑃 (3) 3. Specificity atau TNrate yaitu proporsi dari hasil klasifikasi yang bernilai True

Positive.

𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 = ^𝑇𝑁

𝐹𝑃+𝑇𝑁 (4)

4. Precision yaitu bagian dari predicted yang bernilai positive.

𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = ^𝑇𝑃

𝑇𝑃+𝐹𝑃 (5)

5. F-Measure merupakan rata-ratatertimbang antara precision dan recall dimana jika nilai F-Measure tinggi maka nilai precision dan recall juga tinggi.

𝐹 − 𝑀𝑒𝑎𝑠𝑢𝑟𝑒 = 2 ×𝑅𝑒𝑐𝑎𝑙𝑙×𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛

𝑅𝑒𝑐𝑎𝑙𝑙+𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 (6) 6. Area Under Curve (AUC) digunakan sebagai ukuran evaluasi untuk

dataset tidak seimbang,

𝐴𝑈𝐶 =𝑠𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦+𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦

2 (7)

Adapun interval ketepatan klasifikasi yang baik dengan perhitungan AUC adalah sebagai berikut [24]:

Tabel 3.2 Kriteria Nilau AUC Nilai AUC Keterangan

0.5-0.6 Kurang

Remaja adalah mereka yang mengalami masa transisi (peralihan) dari masa kanak-kanak menuju masa dewasa, yaitu antara usia 12-13 tahun hingga usia 20-an, perubahan yang terjadi termasuk drastis pada semua aspek perkembangannya yaitu meliputi perkembangan fisik, kognitif, kepribadian dan sosial [25]. masa remaja adalah peralihan dari masa anak dengan masa dewasa yang mengalami perkembangan semua aspek/ fungsi untuk memasuki masa dewasa [26]. Secara global masa remaja berlangsung antara 12 –

21 tahun, dengan pembagian 12 – 15 tahun: masa remaja awal, 15 – 18 tahun: masa remaja pertengahan, 18 – 21 tahun masa remaja akhir [27].

3.10 Perilaku Berisiko

Perilaku beresiko ini adalah perilaku yang memiliki akibat yang serius.

Perilaku yang berisiko adalah perilaku yang dapat menyebabkan kematian atau dapat menimbulkan penyakit pada remaja, yaitu merokok, perilaku yang menyebabkan cedera dan kekerasan, alkohol dan obat terlarang, diet yang dapat menyebabkan kematian, gaya hidup bebas, serta perilaku seksual yang dapat meyababkan kehamilan dan kematian.

Beberapa masalah kesehatan yang terjadi pada remaja berkaitan dengan perilaku berisiko yaitu merokok, minum minuman, beralkohol, penyalahgunaan narkoba, dan melakukan hubungan seksual pranikah [28].

3.11 Road Map Penelitian

Penelitian ini relevan dengan Penelitian pada Pusat Studi Sains Fundamental sebagaimana dapat dilihat pada Gambar 3.3.

Gambar 3.3 Road Map Penelitian Pusat Penelitian Sains Fundamental

Penelitian ini juga relevan dengan salah satu topik penelitian yang dikembangkan oleh ketua peneliti di Laboratorium Statistika Komputasi yang ada di Departemen Statistika ITS sebagaimana Gambar 3.4.

Gambar 3.4 Road Map Penelitian Laboratorium Statistika Komputasi

22 BAB IV METODE

4.1 Tahapan Penelitian

Adapun tahapan-tahapan kegiatan untuk penelitian yaitu sebagaimana Tabel 4.1.

Tabel 4. 1 Tahapan Penelitian, Metode, Tugas Tim, Waktu dan target Luaran Tujuan

2 Bulan Mengklasifikasikan data perilaku

3 Bulan Mengetahui metode terbaik untuk

Adapun langkah-langkah analisis pada penelitian ini adalah sebagai berikut.

1. Melakukan eksplorasi pada data dependen dan independen.

2. Melakukan pre-processing data.

3. Membagi data menjadi data training dan data testing.

4. Menerapkan algoritma random forest pada data perilaku berisiko remaja.

a. Mengambil m jumlah variabel prediktor secara acak dan menentukan k pohon yang akan dibentuk.

b. Membentuk tree model dari dataset testing dengan kombinasi m variabel prediktor yang diambil secara acak dan k buah ukuran pohon.

5. Menerapkan algoritma MWMOTE dan SMOTE+TL pada data perilaku berisiko remaja dengan random forest sebagad base classifier.

6. Menglasifikasikan data dan melakukan pengujian akurasi.

7. Membandingkan rata-rata akurasi dan AUC dari hasil klasifikasi dengan menggunakan berbagai metode imbalanced.

8. Menginterpretasikan hasil klasifikasi yang mempunyai performa terbaik dan menarik kesimpulan dan saran.

4.2 Diagram Alir

Adapun diagram alir dari penelitian ini adalah sebagai berikut:

Gambar 4.1 Diagram Alir Penelitian 4.3 Luaran

Luaran yang akan dicapai dari penelitian ini adalah sebagai berikut.

1. Publikasi 1 makalah atau paper pada jurnal internasional terindeks scopus berkategori Q2. Rencana di Songklanakarin Journal of Science and Technology (SJST).

2. Satu makalah hasil Conference hasil riset yang telah dilakukan pada seminar nasional maupun internasional.

3. Buku tesis yang sudah selesai.

24 4.4 Organisasi Tim Peneliti

Tabel 4. 2 Susunan Organisasi Tim Peneliti dan Pembagian Tugas

Nama Peran Tugas

Dr. Dra. Kartika Fithriasari, M. Si.

Ketua 1. Mengkoordinasikan : - Penyusunan proposal - Presentasi proposal - Publikasi hasil penelitian - Penyusunan Laporan - Membantu Menyelesaikan

Tujuan 1, bersama Anggota-1 dan

Mahasiswa: Nilam Novita Sari

Judul: Perbandingan Metode Klasifikasi pada Data Imbalanced Menggunakan MWMOTE dan SMOTE+TL pada Perilaku Berisiko Remaja

Dr. Ismaini Zain, M. Si. Anggota 1 1. Membantu Ketua Peneliti 2. Pelaksanaan penelitian

3. Melakukan analisa dan evaluasi data 4. Membantu Menyusun Laporan Dr. Rr.Iswari Hariastuti,

Dra.M. Kes

Anggota 2 1. Membantu Ketua Peneliti

2. Pelaksanaan penelitian

3. Melakukan analisa dan evaluasi data Erma Oktania Permatasari,

S.Si., M.Si.

Anggota 3 1. Membantu Ketua Peneliti

2. Penggunaan dana 3. Pelaksanaan penelitian

4. Melakukan analisa dan evaluasi data 5. Membantu Menyusun Laporan Nilam Novita Sari Mahasiswa

Tesis

1. Melakukan penelitian

2. Membaca literatur secara detail tentang penelitian yang dilakukan

3. Menyusun laporan hasil penelitian 4. Membuat makalah atau paper 4.5 Rencana Anggaran Biaya

Rincian biaya untuk penelitian ini adalah sebagaimana Tabel 4.3.

Tabel 4.3 Total Biaya

No Jenis Pengeluaran Biaya Yang Diusulkan (Rp)

1. Honorarium -

2. Pembelian Bahan Habis Pakai 13.130.000

3. Perjalanan 27.900.000

4. Sewa / Peralatan Penunjang Lainnya

8.500.000

Jumlah 49.530.000

Terbilang: Empat Puluh Sembilan Juta Lima Ratus Tiga Puluh Ribu Rupiah.

Uraian secara detail tentang biaya penelitian diberikan pada Lampiran-1.

26 BAB V JADWAL

Penelitian ini direncanakan selama 8 bulan dengan jadwal penelitian sebagai mana Tabel 5.1.

Tabel 5.1 Rencana Kegiatan dan Target Penelitian

No Jenis Kegiatan

Bulan

1 2 3 4 5 6

1. Melakukan persiapan penelitian dan studi pustaka

X 2. Menyempurnakan proposal

Penelitian

X 3. Mensosialisasikan topik

penelitian kepada tim peneliti.

X 4. Menyelesaikan

Tujuan-penelitian dari TESIS

X X X 5. Menyusun Laporan Kemajuan

Penelitian

X 6. Menyusun makalah Jurnal

Internasional terindeks Scopus Q2

X X

7. Menyusun makalah untuk untuk seminar Internasional terindeks Scopus

8. Pembuatan Laporan Akhir penelitian.

27 BAB VI

DAFTAR PUSTAKA

[1] Santosa, B. 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis.

Yogyakarta: Graha Ilmu.

[2] Han, J., Kamber & M., Pei, J. 2011. Data Mining Concepts and Techniques 3^rd Edition.

Waltham: Elsevier Inc.

[3] Berry, M. J. & Linoff, G. S. 2004. Data Mining Techniques for marketing, sale, customer relationship management. Indianapolis: Wiley Publishing, Inc.

[4] Dhawangkhara, M. & Riksakomara, E. 2017. “Prediksi Intensitas Hujan Kota Surabaya dengan Matlab Menggunakan Teknik Random Forest dan CART (Studi Kasus Kota Surabaya)”. Jurnal Teknik ITS, 6(1): 94-99.

[5] Gu, Q., Wang, X. M., Wu, Z., Ning, B. & Xin, C. S. 2016. ”Improved SMOTE Algorithm Based on Genetic Algorithm for Imbalanced Data Classification”. Journal of Digital Information Management, Vol. 14, No. 2.

[6] Pangastuti, S.S., Fithriasari, K., Iriawan, N. & Suryaningtyas, W. 2019. “Classification Boosting in Imbalanced Data”. Malaysian Journal of Science, Vol. 38, No. Sp2, p. 36-45.

[7] Jian, C., Gao, J. & Ao, Y. 2017. “Imbalanced Defect Classification for Mobile Phone Screen Glass Using Multifractal Features and a New Sampling Method”. Journal of Springer Science and Business Media.

[8] Guo, S., Guo, D., Chen, L. & Jiang, Q. 2016. “A centroid-based gene selection method for microarray data classification”. Journal of Theoretical Biology, 400(2016), 32-41.

[9] Jian, C., Gao, J. & Ao, Y. 2016. “A New Sampling Method for Classifying Imbalanced Data Based on Support Vector machine Ensemble”. Neurocomputing, 193, 115-122.

[10] Untoro, M. C. & Buliali, J. L. 2018. “Penanganan Imbalanced Class Data Laboratorium Kesehatan dengan Majority Weighted Minority Oversampling Technique”. Jurnal Ilmiah Teknologi Sistem Informasi.

[11] Barua, S., Islam, M. M., yao, X. & Murase, K. 2014. “MWMOTE-Majority Weighted Minority Oversampling Technique for Imbalanced Data Set Learning”. IEEE Trans.

Knowl. Data Eng., 26 (2), 405-425 .

[12] Iriawan, N., Fithriasari, K., Ulama, B.S.S., Suryaningtyas, W., Pangastuti, S.S., Cahyani, N. & Qadrini, L. 2018. “On The Comparison: Random Forest, SMOTE-Bagging, and Bernoulli Mixture to Classify Bidikmisi Dataset in East Java”. 2018 International Conference on Computer Engineering, Network and Intelligent Multimedia (CENIM), Surabaya, Indonesia, 2018, pp. 137-141.

[13] Sastrawan, A. S., Baizal, ZK. A. & Bijaksana, M. A. 2010. “Analisis Pengaruh Metode Combine Sampling dalam Churn Prediction untuk Perusahaan Telekomunikasi”.

[14] Sain, H. & Purnami, S. W. 2015. “Combine Sampling Support Vector Machine for Imbalanced Data Classification”. Procedia Computer Science, 72, 59-66.

[15] Jatmiko, Y. A., Padmadisastra, S. & Chadidjah, A. 2019. “Analisis Perbandingan Kinerja Cart Konvemmsional, Bagging dan Random Forest pada Klasifikasi Objek:

Hasil dari Dua Simulasi”. Media Statistika, 12(2): 1-12.

[16] Santos, M. S., Soares, J. P., Abreu, P. H., Araujo, H. & Santos, J. 2018. “Cross-Validation for Imbalanced Data”. IEEE Computational Intelligence Magazine, 13(4), p:59-76.

[17] Maisya, I. B., Susilowati, A. & Rachmalina, R. 2013. “Gambaran Perilaku Berisiko Remja di kelurahan Kebon Kelapa Kecamatan Bogor Tengah Kota Bogor Tahun 2013 (Studi Kualitatif)”. Jurnal Kesehatan Reproduksi, Vol. 4 No 3, p:123-130.

[18] Maharti, V. I. 2015. “Faktor-faktor yang Berhubungan dengan Perilaku Penyalahgunaan Narkoba pada Remaja Usia 15-19 Tahun di Kecamatan Semarang Utara Kota Semarang”. Jurnal Kesehatan Masyarakat, Vol. 3, No. 3.

[19] Saputra, R. A. 2014. “Komparasi Algoritma Klasifikasi Data Mining untuk Memprediksi Penyakit Tuberculosis (TB): Studi Kasus Puskesmas Karawang Sukabumi”. Seminar Nasional Inovasi dan Tren (SNIT).

[20] Breiman, Leo. Friedman, J., Olshen, R. and Stone, C. 1984. Classification and Regression Trees. New York: Chapman & Hall.

[21] Dewi, N. K., Syafitri, U. D. & Mulyadi, S. Y. 2011. “Penerapan Metode Random Forest dalam Driver Analysis”. Forum Statistika dan Komputasi, p: 35-43.

[22] Liaw. A. & Wiener, M. Des 2002. “Classification and Regression by Random Forest”.

Rnews, Vol. 2/3:18-22

[23] Olson, D. & Yong, Shi. 2008. Pengantar Ilmu Pengalian Data Bisnis. Jakarta: Salemba Empat.

[24] Bekkar, M., Djemaa, H. K. & Alitouche, T. A., 2013. “Evaluation Measure for Models Assessment over Imbalanced Data Sets”. Journal of Information Engineering and Aplications.

[25] Gunarsa, S. 2006. Psikologi Perkembangan Anak dan Dewasa. Jakarta: Gunung Mulia.

[26] Rumini, S. & Sundari, S. 2004. Perkembangan Anak dan Remaja. Jakarta: PT. Asdi Mahasatya.

[27] Monks, F.J., Knoers, A.M.P. & Haditono, S.R. 2002. Psikologi Perkembangan:

Pengantar dalam Berbagai Bagiannya. Yogyakarta: Gadjah Mada University Press.

[28] Bart, Smet. (1994). Psikologi Kesehatan. PT. Gramedia Widiasarna Indonesia : Jakarta.

29 BAB VII LAMPIRAN

Biodata Tim Peneliti

1. Ketua

a. Nama Lengkap : Dr. Dra. Kartika Fithriasari, M.Si.

b. NIP/NIDN : 19691212 199303 2 002

c. Fungsional/Pangkat/Gol : Lektor

d. Bidang Keahlian : Statistik Komputasi

e. Departemen/Fakultas : Statistika/Sains dan Analitika data

f. Alamat Rumah dan No. Telp. : Perum ITS Jl. Teknik Komputer V Blok U-178

Surabaya / 0818396410

g. Riwayat penelitian/pengabdian : Penelitian

No Judul Penelitian Peran Tahun

1 Analisis Twitter Untuk Evaluasi Pembangunan Kota Surabaya Dengan Pendekatan Model Bayesian Hirarki dan Machine Learning

Ketua 2019

2 Pemodelan dan Pemetaan Big-Data Program Bidikmisi Sebagai Early Warning System dalam Rangka Mempersiapkan SDM di Era MEA dengan Pendekatan Hierarchical Bayesian

Anggota 2018

3 Pengembangan Model Detektor Ketepatan Penentuan ROI pada citra MRI Tumor Otak dengan pendekatan Bayesian Skew Normal Mixture Model

Anggota 2018

4 Analisis Twitter untuk Evaluasi Pembangunan Kota Surabaya Dengan Pendekatan Model Bayesian Hirarki Dan Machine Learning

Ketua 2018

5 Pendekatan Binary Logit Model-Bayesian Network Hybrid Untuk Analisis Pencemaran Bakteri Salmonella Sp Pada Udang Vaname (Litopenaeus Vannamei)

Anggota 2017

6 Pemodelan dan Pemetaan Big-Data Program Bidikmisi Sebagai Early Warning System

Anggota 2017

31 dalam Rangka Mempersiapkan SDM di Era MEA dengan Pendekatan Hierarchical Bayesian

Pengabdian

No Judul Penelitian Peran Tahun

1 Analisis dan Survey Tingkat Pemahaman Budaya Surabaya 2018 (Bappeko Surabaya)

Ketua 2018

2 Analisis dan Survey Tingkat Kepedulian Masyarakat Dalam Kegiatan Yang Mendorong Nilai-Nilai Kebangsaan di Surabaya 2018 (Bappeko Surabaya)

Ketua 2018

3 Analisis dan Survey Tingkat persepsi Masyarakat atas pelaksanaan pembangunan kota 2018 (Bappeko Surabaya)

Ketua 2018

4 Pelatihan Pengolahan Data Statistik Sektoral untuk Perangkat Daerah Pemerintah Provinsi Jawa Timur

Anggota 2019

h. Publikasi :

No Judul Penelitian Peran Tahun

1 Classification Boosting in Imbalanced Data

2019 2 Linking Twitter Sentiment

Knowledge with Infrastructure Development

2018

3 On the Comparison of Deep Learning Neural Network and Binary Logistic Regression for Classifying the Acceptance Status of Bidikmisi Scholarship Applicants in East Java

2018

4 On The Markov Chain Monte Carlo Convergence Diagnostic of Bayesian Finite Mixture Model for Income Distribution

2018

5 Bayesian Network Inference In Binary Logistic Regression: A Case Study Of Salmonella Sp

2017

32 Bacterial Contamination On Vannamei Shrimp

6 Clustering the Stationary And Non Stationary Time Series Based On Autocorrelation Distance Of Hierarchical And K-Means Algorithm

2017

7 On The Value At Risk Using Bayesian Mixture Laplace Autoregressive Approach For Modelling The Islamic Stock Risk Investment

2017

i. Paten : -

j. Tugas akhir, Tesis, dan Disertasi yang selesai dibimbing:

No Judul Penelitian Tahun

1 Model Hierarchical Survival pada Kasus Kejadian Demam Berdarah Dengue (DBD) di Kota Surabaya

Tesis 2019

2 Klastering Data Twitter dengan Menggunakan Metode Laten Dirichlet Allocation (LDA) dan Laten Semantic Analysis (LSA)

Tesis 2019

3 Pengaruh Long Memory Terhadap Pengujian Asimetris dan Aplikasinya pada Data Indeks Harga Saham Gabungan

Tesis 2019

4 Analisis Perilaku Remaja Melakukan Seks Pra-Nikah di Jawa Timur Menggunakan CART dengan SMOTE-N-ENN dan Adasyn

Skripsi 2020

5 Klasifikasi Sentimen data Ulassan Wisatawan Candi Borobudur di Situs Tripadvisor Menggunakan SVM dan K-NN

Skripsi 2019

6 Text Clustering untuk Pengelompokkan Topik Aduan

Masyarakat Kepala

Pemerintahan Kota Surabaya dengan K-Means dan Self Organizing Maps

Skripsi 2019

7 Identifikasi Wajah

Menggunakan Multi Layer Perceptron dan Convolutional Neural Network

Skripsi 2019

33 8 Analisis Rekomendasi Film

Menggunakan Kombinasi Single Linkage Clustering dan K-Means Clustering dengan Pendekatan User-Based Collaborative Filtering

Skripsi 2019

9 Analisis Klasifikasi Black Campaign Tweets pada Periode Kampanye Pemilihan Presiden 2019

Skripsi 2019

10 Text Analysis pada Maskapai Penerbangan Indonesia di Twitter Menggunakan Metode K-Means dan Support Vector Machine

Skripsi 2019

11 Perbandingan Metode K-Means dan Fuzzy C-Means untuk Pengelompokkan Tweet yang ditujukan Kepada PT. Kereta Api Indonesia (@Kai121) dengan Menggunakan N-Gram

Skripsi 2019

2. Anggota

a. Nama Lengkap : Dr. Ismaini Zain, M.Si.

NIP/NIDN : 19600525 198803 2 001

b. Fungsional/Pangkat/Gol : Lektor

c. Bidang Keahlian : Studi Demografi, Analisis data Kategorik,

Teknik Sampling, Statistika Sosial

d. Departemen/Fakultas : Statistika/Sains dan Analitika data

e. Alamat Rumah dan No. Telp. : Deltasari Indah AB/9, Sidoarjo / 08123036678 f. Riwayat penelitian/pengabdian :

Penelitian

No Judul Penelitian Peran Tahun

1 Estimasi Kurva Regresi Semiparametrik Multivariabel Menggunakan Pendekatan Estimator Campuran Spline dan Kernel.

Anggota 2018

2 Pengelompokkan

Kabupaten/Kota Berdasarkan Indikator Sanitasi Lingkungan Sebagai Dasar Evaluasi Pencapaian Tujuan SDGs Di Provinsi Jawa Timur

Anggota 2018

34 3 Analisis Faktor-Faktor yang

Mempengaruhi Angka

Kematian Bayi (AKB) Berdasarkan Indikator Sanitasi dan Kesehatan Sebagai Dasar Evaluasi Pencapaian Target SDGs di Provinsi Sulawesi Utara

Anggota 2019

4 Pengelompokan Dan

Pemodelan Kualitas Proses Pendidikan Perguruan Tinggi Negeri Di Indonesia Menurut Jalur Masuk Dengan Pendekatan Metode Ensemble Rock (Robust Clustering Using Links) Dan Similarity Weight And Filter Method (Swfm) Serta Quantile Regression

Ketua 2017

5 Pemodelan Konsumsi Air Bersih dengan Pendekatan Model Tobit Double Hurdle Berbasis Analisis Gender pada Rumah tangga Miskin.

Ketua 2017

Pengabdian

No Judul Penelitian Peran Tahun

1 Program Terapan Bidang Teknologi lnformasi dan Komunikasi (PRODISTIK) Madrasah Aliyah Zainul Hasan I Genggong

2017

2 Kampung Literasi Dolly Jilid Ii:

Penguatan Potensi Menulis Bagi Remaja Di Kawasan Budaya Kelurahan Putat Jaya.

Abdimas Reguler ITS Tahun 2018

2017

3 Pelatihan Tata Cara Penyusunan Proposal Penelitian Dana Ristek Dikti Untuk Dosen Undar Jombang. SK Abdimas Reguler Its.

2018

4 Pelatihan Metodelogi Penelitian Untuk Dosen Stikom – Surabaya. Sk Abdimas Reguler Its

2019

5 Penguatan Kampung Literasi

ITS: Meningkatkan

2019

35 Profesionalisme Petugas Taman Baca Masyarakat (TBM) Di Wilayah Kota Surabaya Melalui Program Mentoring Literasi Berimbang (Balanced

Literacy). ABDIMAS

BERBASIS PENELITIAN ITS tahun 2019:

g. Publikasi :

No Judul Penelitian Peran Tahun

1 Censored Hurdle Negative Binomial Regression (Case Study: Neonatorum Tetanus Case in Indonesia) Provinsi Sumatera Utara, Jurnal Sains dan Seni ITS

2017

h. Paten : -

k. Tugas akhir, Tesis, dan Disertasi yang selesai dibimbing

No Judul Tahun

1 Pemodelan pada data Penerimaan Calon Mahasiswa Baru melalui Jalur Ujian Tulis Semiparametrik untuk data Longitudinal menggunakan Estimator Campuran Spline Truncated dan Deret Fourier

Tesis 2019

Dalam dokumen PROPOSAL PENELITIAN PASCASARJANA ITS DANA ITS TAHUN 2020 (Halaman 14-0)