Data Science Process
Aurisa Rabina 41522010229 Universitas Mercubuana
Informatika
Data Science Process
Data Science Process
Business Understanding
Pemahaman yang mendalam terhadap masalah atau tujuan
bisnis
Data
Understanding
• Identifikasi tujuan bisnis dan pertanyaan ilmu data
• Menganalisis kebutuhan dan Batasan data yang tersedia
• Menentukan parameter keberhasilan proyek
Memahami karakteristik dan kondisi data secara lebih
mendalam
• Eksplorasi data, analisis statistic deskriptif, dan visualisasi lebih lanjut
• Profiling variable untuk memahami tipe, nilai unik dan statistic tambahan
• Eksplorasi korelasi antar variable dan identiikasi pola yang relevan
Data Science Process
Data Preparation
Pengumpulan, pembersihan dan transformasi data agar sesuai
Modelling
• Pengumpulan data dari berbagai sumber
• Pembersihan data untuk mengatasi nilai yang hilang
• Transformasi data ke format yang diperlukan
Pengembangan dan pengujian model prediktif atau analisis data
• Pemilihan dan penerapan model yang sesuai
• Pelatihan model dengan
menggunakan data yang telah dipersiapkan
Data Science Process
Evaluation
Mengukur kinerja model atau solusi terhadap bisnis yang dipakai
Deployment
• Mengukur kinerja model menggunakan metrik yang ditetapkan
• Mengevaluasi hasil dan membandingkan dengan parameter keberhasilan yang ditetapkan
• Menentukan apakah solusi dapat diimplementasikan
Diimplementasikan ke dalam produksi atau digunakan untuk mengambil
keputusan
• Menyusun dan
mengimplementasikan solusi atau model di lingkungan produksi
• Memantau kinerja solusi dan memberikan pembaruan jika diperlukan