• Tidak ada hasil yang ditemukan

SURAT TUGAS. 4626/D.01/LPPM-UBSI/X/2021 Tentang. Webinar 15 Oktober 2021 Universitas Bina Sarana Informatika TEMA :

N/A
N/A
Protected

Academic year: 2022

Membagikan "SURAT TUGAS. 4626/D.01/LPPM-UBSI/X/2021 Tentang. Webinar 15 Oktober 2021 Universitas Bina Sarana Informatika TEMA :"

Copied!
10
0
0

Teks penuh

(1)

SURAT TUGAS

4626/D.01/LPPM-UBSI/X/2021 Tentang

Webinar 15 Oktober 2021

Universitas Bina Sarana Informatika TEMA :

Python For Data Science With Orange

Menimbang : 1. Bahwa perlu di adakan pelaksanaan Seminar dalam rangka Seminar.

2. Untuk keperluan tersebut, pada butir 1 (satu) di atas, maka perlu dibentuk Peserta Seminar.

MEMUTUSKAN

Pertama : Menugaskan kepada saudara yang tercantum sebagai Peserta Dian Indah Sari SE.AK.MM

Kedua : Mempunyai tugas sbb:

Melaksanakan Tugas yang diberikan dengan penuh rasa tanggung jawab.

Ketiga : Keputusan ini berlaku sejak tanggal ditetapkan, dengan ketentuan apabila dikemudian hari terdapata kekeliruan akan diubah dan diperbaiki sebagaimana mestinya.

Jakarta,7 Oktober 2021

LPPM Universitas Bina Sarana Informatika Ketua

Taufik Baidawi, M.Kom

Tembusan

- Rektor Universitas Bina Sarana Informatika - Arsip

- Ybs

(2)

WEBINAR PYTHON FOR DATA SCIENCE WITH ORANGE

Disusun Oleh :

DIAN INDAH SARI, SE, MM 0426127704

FAKULTAS TEKNIK DAN INFORMATIKA SISTEM INFORMASI

UNIVERSITAS BINA SARANA INFORMATIKA

2021

(3)

1

======================================================================

LAPORAN HASIL KEGIATAN

WEBINAR PYTHON FOR DATA SCIENCE WITH ORANGE

=======================================

======================

BAB I

PENDAHULUAN

1.1. Latar Belakang Kegiatan

Data Mining merupakan sebuah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai basis data. Data mining hadir sebagai bidang yang berusaha mengolah data, yang saat ini semakin banyak dihasilkan dan tersimpan, menjadi suatu pengetahuan yang bermanfaat serta berharga.

Implementasi dari teknik-teknik data mining umumnya dilakukan dengan menggunakan bahasa pemrograman tertentu yang menuntut skill coding seseorang. Orange atau dikenal juga dengan Orange Data Mining merupakan perangkat lunak open source untuk melakukan proses data mining atau data analytic melalui konsep visual programming. Tujuan dari kegiatan ini adalah untuk berbagi pengetahuan tentang konsep- konsep penting dalam data mining serta implementasinya menggunakan aplikasi Orange.

1.2. Maksud dan Tujuan Kegiatan

Maksud dan Tujuan Kegiatan dari kegiatan ini antara lain:

1. Menambah wawasan dosen agar dapat memperoleh pengetahuan tentang konsep data mining dengan orange.

2. Agar dosen dapat terpacu untuk menerapkan data mining menggunakan orange.

3. Menambah referensi bagi dosen dalam menerapkan data mining dengan orange.

(4)

2

BAB II

LAPORAN KEGIATAN

2.1. Bentuk Kegiatan

Bentuk kegiatan berupa workshop atau seminar secara online dengan menggunakan zoom meeting. Dosen dapat mengikuti kegiatan seminar online melalui link zoom yang dibagikan di email masing-masing.

2.2. Pelaksanaan Kegiatan

Kegiatan seminar / workshop dilaksanakan pada : Tanggal : 15 Oktober 2021

Waktu : 9.00 s/d 11.00 WIB

Tempat : Universitas Bina Sarana Informatika

Topik : Webinar Python For Data Science With Orange

Join Zoom Meeting

https://us02web.zoom.us/j/88030938380?pwd=UnlDdmt3bHN4YjVTazQ0bTBTSkc1Zz0 9

Meeting ID: 880 3093 8380 Passcode: 132453

2.3. Hasil Kegiatan

Hasil dari kegiatan ini berupa :

A. Pengetahuan tentang cara membuat Data Mining dengan Orange

Data mining merupakan proses ekstraksi pola-pola dan model-model dari data dalam jumlah besar yang merupakan perpaduan dari ilmu matematika, statistika, dan komputer.

Data mining menjadi salah satu hal yang penting dilakukan karena pada zaman informasi 4.0 ini, manusia memiliki kumpulan data yang sangat banyak, tetapi sebagian besar data tersebut tidak dapat diolah dengan teknik tradisional (big data). Diperlukan suatu cara baru

(5)

3

untuk dapat mengolah data dalam jumlah besar, khususnya untuk mencari informasi dari kumpulan data yang banyak.

Machine learning merupakan kemampuan mesin untuk dapat belajar tanpa perlu diprogram secara eksplisit. Artinya sebuah algoritma dapat belajar untuk menjadi baik pada suatu tugas tertentu, dengan cara belajar dari data dalam jumlah besar. Pada Orange, untuk melakukan data mining kita akan menggunakan sistem widget. Setiap widget punya fungsinya masing-masing dan dapat menerima input atau mengeluarkan output.

Misalnya kita ingin membaca data dari sebuah file, kita bisa menggunakan widget File untuk membaca data dari file tersebut dan menggunakan widget Data Table untuk menampilkan isi data yang sudah dibaca. Sama halnya jika kita ingin membuat sebuah model untuk melakukan data mining seperti klasifikasi atau regresi. Kita bisa menambahkan widget seperti KNN dan Naive Bayes untuk membuat model dan memberikan data ke dalam model tersebut dengan cara menghubungkan sumber data dengan model dengan cara menarik garis penghubung.

Tutorial ini akan berisi 16 video yang akan membahas berbagai topik yang berkaitan dengan data mining.

1. Pendahuluan Data Mining

2. Supervised, Unsupervised, dan Reinforcement Learning 3. Pengenalan Orange

4. Exploratory Data Analysis 5. Preprocessing

6. Metrik

7. Klasifikasi Bunga Iris menggunakan KNN

8. Prediksi Pendapatan Penduduk menggunakan Naive Bayes

9. Klasifikasi Varietas Biji menggunakan Decision Tree dan Ensemble Methods (Random Forest dan AdaBoost)

10. Reduksi Dimensi menggunakan Principal Component Analysis dan t-SNE

(6)

4

11. Regresi Harga Rumah menggunakan Linear Regression 12. Forecasting Penjualan Tiket Pesawat menggunakan ARIMA 13. Clustering Pelanggan Toko menggunakan k-Means

14. Clustering Suhu Daerah di Indonesia menggunakan Hierarchical Clustering (Data Spasial)

15. Prediksi Asosiasi Barang Belanja menggunakan Apriori 16. Text Mining

Python adalah scripting language yang berorientasi objek. Bahasa pemrograman ini dapat digunakan untuk pengembangan perangkat lunak dan bisa dijalankan melalui berbagai sistem operasi. Saat ini, Python juga merupakan bahasa yang populer bagi bidang data science dan analisis. Hal ini dikarenakan oleh dukungan bahasa Python terhadap library – library yang didalamnya menyediakan fungsi analisis data dan fungsi machine learning, data preprocessing tools, serta visualisasi data. Secara umum,

Python memiliki ciri-ciri sebagai berikut:

1. Banyak mendukung library

2. Bahasa yang relatif mudah dipahami

3. Memiliki aturan layout source code yang memudahkan pengecekan code 4. Bahasa yang interpreted karena code dieksekusi satu per satu dan

melakukan debugging lebih mudah dibandingkan dengan bahasa yang di- compile

5. Bahasa yang portable karena hanya code satu kali untuk menjalankan di platform lain

6. Bahasa yang open-source.

Beberapa alasan Python menjadi bahasa yang populer, khususnya dalam ranah analisis data dan data science :

1. Ketersediaan akan open-source library, frameworks, tools untuk data mining, contohnya adalah SciKit Learn, TensorFlow, Keras.

2. Relatif lebih mudah dipahami. Penulisan code di Python relatif lebih singkat dibandingkan bahasa pemrograman yang

(7)

5

3. Multifungsi, tidak hanya untuk data processing, namun juga bisa untuk tugas lain seperti membuat website dan tampilan GUI (Graphical User Interface).

Dalam membuat sebuah proyek data mining dengan Python, dapat menggunakan Anaconda, dimana Anaconda telah menyediakan berbagai kelengkapan Python yang lebih dikhususkan untuk kebutuhan analisis data. IDE (Integrated Development Enviroment) yang dapat digunakan antara lain Jupyter Notebook dengan extension .ipynb yang sudah merupakan bawaan dari Anaconda Navigator atau dengan text editor seperti Sublime, Notepad, Notepad++ dengan extension .py.

Berikut adalah contoh proses yang dilakukan oleh Python untuk proyek data mining sederhana:

1. Data mentah, dapat diimpor ke Python dengan menggunakan library Library ini mempunyai fungsi untuk mengimpor data dengan format csv ke Python.

2. Eksplorasi data dan data preprocessing dapat dilakukan dengan lebih mudah, karena Python telah memiliki fungsi untuk melihat persebaran data dan melakukan manipulasi data untuk handle data yang tidak sesuai. Dalam kasus ini library yang berfungsi adalah sklearn (Sci – kit learn) dan NumPy.

Untuk visualisasi data, salah satu library yang terkenal adalah Matplotlib, dimana dapat membuat visualisasi dari persebaran data termasuk plot dan chart.

3. Pembuatan model data mining dapat dilakukan dengan cepat dengan tersedianya fitur – fitur machine learning yang cukup lengkap dari Sci – kit learn. Setelah memilih metode yang diinginkan, dapat langsung menggunakan fungsi didalam library yang Contoh metode yang tersedia adalah neural network, decision tree, SVM, random forest, regression tree, logistic regression. Tidak hanya Sci – kit learn, ada beberapa library lain yang dapat digunakan seperti Keras, TensorFlow. Pembagian

(8)

6

data testing dan training juga dapat dilakukan dengan library mengikuti metode yang tersedia. Contohnya adalah cross – validation.

4. Evaluasi model yang telah dibuat, seperti menghitung akurasi, spesifisitas, sensitivitas, presisi, error rate dapat ditampilkan dengan mudah dengan menggunakan fungsi classification_score yang tersedia pada Sci – kit learn.

Hanya dengan satu baris, seluruh komponen evaluasi akan ditampilkan.

Tidak hanya itu, fungsi pada Sci-kit learn juga dapat menampilkan confusion matrix yang berisi nilai prediksi dan aktual yang dilakukan dari data testing.

5. Merepresentasikan hasil dari model dapat divisualisasikan dalam bentuk plot ataupun hasil dalam bentuk web. Ketika permintaan penampilan hasil dalam bentuk web, maka hasil dari model dapat disinkronkan karena Python juga mendukung untuk pembuatan web. Selain itu, untuk menampilkan model, dapat menggunakan library – library lain, contohnya adalah graphviz untuk menampilkan decision tree.

(9)

7

BAB III PENUTUP

3.1. Kesimpulan

Kesimpulan dari kegiatan ini antara lain:

1. Alasan Python menjadi bahasa yang populer, khususnya dalam ranah analisis data dan data science yaitu ketersediaan akan open-source library, frameworks, tools untuk data mining, contohnya adalah SciKit Learn, TensorFlow, Keras.

2. Relatif lebih mudah dipahami. Penulisan code di Python relatif lebih singkat dibandingkan bahasa pemrograman yang

3. Multifungsi, tidak hanya untuk data processing, namun juga bisa untuk tugas lain seperti membuat website dan tampilan GUI (Graphical User Interface).

3.2. Saran

Saran yang diberikan dari kegiatan ini antara lain:

1. Bagi pihak Universitas

Disarankan agar pihak Universitas agar tidak mewajibkan kepada mahasiswa dalam penerapan data mining menggunakan orange dalam penelitian.

2. Bagi Dosen dan Mahasiswa

Disarankan agar mahasiswa mempelajari tip dalam penerapan data mining dengan orange.

(10)

Referensi

Dokumen terkait

Dengan diadakannya pelatihan pada Warga RT. 002 Jalan Mampang Prapatan VIII, RT.002/RW.002, Tegal Parang, Kota Jakarta Selatan, Daerah Khusus Ibukota Jakarta ini,

penegakan hukum di Indonesia berpatokan pada asas cepat, tepat, sederhana, tidak bertele-tele, tidak berbeli-belit serta biaya ringan dan beberapa ketentuan dalam

Tahapan penelitian dimulai dengan prapemrosesan data menggunakan transformasi wavelet diskret, esktraksi fitur, reduksi fitur menggunakan PCA (Principal Component

Transformasi bentuk bangunan mengikuti bentuk tapak untuk memaksimalkan penggunaan lahan dan meminimalisir area kosong yang akan tercipta pada tapak, dengan node area pada beberapa

Pengetahuan ialah merupakan hasil “tahu” yang terjadi setelah orang melakukan penginderaan terhadap suatu obyek tertentu. Pengetahuan tentang kesehatan gigi dan

Dengan terjemahan sebagai berikut Fraud (kecurangan) berkenan dengan adanya keuntungan yang diperoleh seseorang dengan menghadirkan sesuatu yang tidak sesuai dengan

Pelaksanaan pengabdian kepada masyarakat bertujuan untuk meningkatkan pemahaman tentang Pemanfaatan E-Marketing Berbasis Media Sosial Sebagai Sarana Promosi Produk Pada

Sistem Informasi Akademik Sekolah ini dibuat untuk membantu mempermudah pekerjaan tata usaha sekolah dan para guru, sehingga tata usaha dapat menyimpan data siswa dan