MERDEKA BELAJAR KAMPUS MERDEKA (STUDI INDEPENDEN) - DASHBOARD INFORMATIF PERSEBARAN COVID-19 DI INDONESIA PADA DATA AND ARTIFICIAL INTELLIGENCE MENGGUNAKAN MICROSOFT AZURE MACHINE LEARNING DI PT MICROSOFT INDONESIA
KERJA PRAKTIK
Program Studi S1 Teknik Komputer
Oleh:
RIZKY ALIEF FEBRIANSYAH 19410200020
FAKULTAS TEKNOLOGI DAN INFORMATIKA UNIVERSITAS DINAMIKA
2022
1
MERDEKA BELAJAR KAMPUS MERDEKA (STUDI INDEPENDEN) - DASHBOARD INFORMATIF PERSEBARAN COVID-19 DI INDONESIA PADA DATA AND ARTIFICIAL INTELLIGENCE MENGGUNAKAN MICROSOFT AZURE MACHINE LEARNING DI PT MICROSOFT INDONESIA
Diajukan sebagai salah satu syarat untuk menyelesaikan mata kuliah Kerja Praktik
Program : S1 (Strata Satu) Jurusan : Teknik Komputer
FAKULTAS TEKNOLOGI DAN INFORMATIKA UNIVERSITAS DINAMIKA
2022 Disusun oleh:
Nama NIM
: Rizky Alief Febriansyah : 19410200020
“SALAM SATU NYALI, WANI!!!”
~ Rizky Alief Febriansyah ~
“Ku persembahkan karya kerja praktik ini untuk kedua orang tua saya, seluruh keluarga yang saya cintai, teman-teman Data Artificial Intelligence, dan seluruh teman- teman saya yang selalu memberi semangat dan motivasi.”
ABSTRAK
Kampus Merdeka merupakan sebuah kegiatan yang diselenggarakan oleh Kementrian Pendidikan, Kebudayaan, Riset dan Teknologi (Kemendikbudristek) bertujuan untuk mengeksplorasi maahsiswa untuk belajar di luar kegiatan perkuliahan reguler.
Melalui program Kampus Merdeka, mahasiswa dapat mengikuti beberapa program yang ditawarkan seperti Kampus Mengajar, Pertukaran Pelajar, Kewirausahaan, Magang Bersertifikat, dan Studi Independen. Salah satu bentuk kegiatan Kampus Merdeka yang diikuti penulis adalah Studi Independen. Dimana kegiatan Studi Independen yang penulis ikuti diselenggarakan oleh PT Microsoft Indonesia melalui MariBelajar. Program Studi Independen oleh Microsoft melalui MariBelajar memiliki tiga penjurusan belajar antara lain: Microsoft Productivity, Cloud Fundamental, dan Data and Artificial Intelligence.
Dalam pembuatan Capstone Project ini penulis berfokus kepada tema Bidang Kesehatan dimana perancangan arsitektur Data and Artificial Intelligence untuk mengetahui persebaran data COVID-19 (Coronavirus Disease-19) di Indonesia menggunakan data yang di pre-processing pada Microsoft Azure Machine Learning. Hasil dari pembuatan proyek ini adalah sebuah dashboard pada layanan Microsoft PowerBI untuk mengetahui daya persebaran virus Covid-19 di Indonesia dengan fungsionalitas untuk masyarakat.
Kata Kunci: Data and Artficial Intelligence, Azure Machine Leaning, Microsoft Power BI
Program Data and Artificial Intelligence pada Microsoft Learning Track mempersiapkan peserta untuk menjadi seorang Database Engineer, Database Administrator, Data Analyst, Data Visualizatin, dan lain lain. Pada program Data and Artificial Intelligence terdapat sebuah proyek akhir atau disebut Capstone Project yang sudah ditetapkan oleh pihak penyelenggara, terbagi menjadi tiga tema antara lain: Bidang Kesehatan, Bidang Pendidikan, dan Bidang Bisnis.
KATA PENGANTAR
Dengan mengucapkan puji syukur kehadirat Tuhan Yang Maha Esa atas segala karunia-Nya dan hidayah-Nya yang diberikan sehingga penulis dapat menyelesaikan Laporan Kerja Praktik yang berjudul “Kampus Merdeka Bangkit Academy: Rancang Bangun Website Berbasis Cloud Computing Untuk Mendeteksi Penyakit Tanaman Menggunakan Machine Learning”.
Melalui kesempatan yang sangat berharga dan dengan menyelesaikan laporan ini penulis mengucapkan terima kasih yang sebesar-besarnya kepada semua pihak khususnya kepada yang terhormat:
1. Tuhan Yang Maha Esa karena sudah menyertai penulis dari awal hingga akhir kegiatan Studi Independen 2021
2. Bapak Pauladie Susanto, S.Kom., M.T., selaku Ketua Prodi S1 Teknik Komputer Universitas Dinamika
6. Ibu Ade Sitti Nur Zainab, selaku Asisten Mentor program Studi
Independen Bersertifikat Data and Artificial Intelligence di PT Microsoft Indonesia
7. Seluruh rekan-rekan mahasiswa program Studi Independen dan Bersertifikat Data and Artificial Intelligence di PT Microsoft Indonesia yang telah
memberikan dorongan dan bantuan selama kegiatan Kampus Merdeka berlangsung.
3. Ibu Yosefine Triwidyastuti,M.T., selaku Dosen Wali yang membimbing penulis dalam kegiatan Studi Independen 2021
4. Ibu Nurhesti Esa Dwirini, AP.,S.Kom., selaku pembimbing dan memberikan informasi terkait kegiatan Magang dan Studi Independen 5. Ibu Indrajani Sutedja, S.Kom.,M.M., selaku Mentor program Studi
Independen Bersertifikat Data and Artificial Intelligence di PT Microsoft Indonesia
Penulis menyadari bahwa karya yang telah tersusun ini jauh dari kesempurnaan. Untuk itu penulis mengharapkan kritik, saran, dan pendapat yang bersifat membangun dan tidak lupa penulis mengucapkan terima kasih atas segala perhatian dan berharap semoga laporan ini dapat bermanfaat bagi semua pihak.
Surabaya, 1 Juli 2021
Penulis
DAFTAR ISI
Halaman
ABSTRAK ... vii
KATA PENGANTAR ... viii
DAFTAR ISI... x
DAFTAR GAMBAR ... xii
BAB I PENDAHULUAN ... 1
1.1 Latar Belakang ... 1
1.2 Rumusan Masalah ... 2
1.3 Batasan Masalah ... 2
1.4 Tujuan Peneltian ... 2
1.5 Manfaat Penelitian... 3
1.6 Sistematika Penelitian ... 4
BAB II GAMBARAN UMUM STUDI INDEPENDEN MARI BELAJAR ... 5
3.1 Covid-19 ... 10
3.2 Dataset ... 11
3.3 Microsoft Azure ... 11
3.4 Microsoft Azure Machine Learning ... 12
3.5 Multiclass Decision Forest ... 13
3.6 Microsoft Power BI ... 14
BAB IV DESKRIPSI KERJA PRAKTIK ... 15
4.1 Penjelasan Kerja Praktik ... 15
4.2 Pengambilan dataset dan perancangan model ... 15
2.1 Sejarah Singkat Kampus Merdeka ... 5
2.2 Microsoft ... 6
2.3 MariBelajar... 7
2.4 MariBelajar Learning Paths ... 8
2.4.1 Microsoft Productivity: The Modern Workspace Path ... 8
2.4.2 Cloud Fundamental Path ... 9
2.4.3 Data and Artificial Intelligence Path... 9
BAB III LANDASAN TEORI... 10
4.3 Pre-processing dataset menggunakan Azure Machine Learning ... 17
4.4 Klasifikasi algoritma machine learning ... 20
4.5 Visualisasi data pada Microsoft Power BI Desktop ... 22
4.6 Publish dashboard visualisasi pada Microsoft Power BI Service ... 23
BAB V PENUTUP... 24
5.1 Kesimpulan... 24
5.2 Saran ... 24
DAFTAR PUSTAKA ... 25
LAMPIRAN... 25
DAFTAR GAMBAR
Gambar 2. 1 Logo Kampus Merdeka ... 5
Gambar 2. 2 Logo Microsoft ... 6
Gambar 2. 3 Logo MariBelajar ... 7
Gambar 3. 1 Logo Microsoft Azure ... 11
Gambar 3. 2 Logo Microsoft Azure Machine Learning ... 12
Gambar 3. 3 Multiclass Decision Forest ... 13
Gambar 3. 4 Logo Microsoft Power BI ... 14
Gambar 4. 1 File dataset pada OneDrive ... 16
Gambar 4. 2 Tampilan dataset awal sebelum pre-processing pada Azure Machine Learning 16 Gambar 4. 3 Dataset setelah dibagi menjadi kumpulan tabel ... 17
Gambar 4. 4 Tampilan layanan Microsoft Azure ... 17
Gambar 4. 5 Tampilan Microsoft Azure Machine Learning ... 18
Gambar 4. 6 Proses pada Azure Machine Learning menggunakan Pipelines ... 18
Gambar 4. 7 Proses pipeline pada bagian tengah ... 20
Gambar 4. 8 Proses pada Pipeline bagian akhir ... 21
Gambar 4. 9 Model data setelah dilakukan proses pelatihan pada Azure Machine Learning .21 Gambar 4. 10 Tampilan awal pada Power BI Desktop ... 22
Gambar 4. 11 Dashboard Power BI Desktop sebelum publish ke Power BI Service ... 23
Gambar 4. 12 Tampilan dashboard pada Power BI Service ... 23
BAB I PENDAHULUAN
1.1 Latar Belakang
Kampus Merdeka merupakan sebuah kegiatan yang diselenggarakan oleh Kementrian Pendidikan, Kebudayaan, Riset dan Teknologi (Kemendikbudristek) yang bertujuan untuk mengekplorasi mahasiswa untuk belajar di luar kegiatan perkuliahan reguler. Melalui program Kampus Merdeka, mahasiswa dapat mengikuti beberapa program yang ditawarkan seperti Kampus Mengajar, Pertukaran Pelajar, Kewirausahaan, Magand Bersertifikat, dan Studi Independen. Salah satu bentuk kegiatan Kampus Merdeka yang diikuti penulis yaitu adalah Studi Independen. Dimana kegiatan Studi Independen diselenggarakan oleh PT Microsoft Indonesia melalui MariBelajar. Program
Independen pada PT Microsoft Indonesia bersifat menyelesaikan maslaah denga mengdepankan ilmu pengetahuan dan teknologi yang invoatif serta komprehensif terhadap masyarakat. Dimana pernyataan tersebut sesuai dengan visi mis dari Microsoft untuk memberdayakan setiap orang dan organisasi di dunia agar lebih produktif.
1
Studi Independen oleh Microsoft melalui MariBelajar memiliki tiga Learning Track antara lain: Microsoft Productivity, Cloud Fundamental, dan Data and Artificial Intelligence.
Lebih rinci lagi, sub tema Data and Artificial Intelligence pada Learning Track Microsoft mempersiapkan peserta untuk menjadi seorang Database Engineer, Database Administrator, Data Analyst, Data Visualization, dan lain lain.
Sehingga tujuan akhir dari kegiatan Merdeka Belajar Kampus Merdeka Studi
2
1.2 Rumusan Masalah
Berdasarkan pada latar belakang yang telah dijelaskan, maka dirumuskan permasalahan sebagai berikut:
1. Bagaimana perancangan untuk mengolah data lake menjadi target model Machine Learning?
2. Bagaimana perancangan mengolah data target model Machine Learning menjadi sebuah model Machine Learning menggunakan metode linier regression pada layanan Microsoft Azure Machine Learning?
3. Bagaimana perancangan visualisasi hasil model training Machine Learning pada media visualisasi Microsoft Power Business Intelligence (PowerBI)?
1.3 Batasan Masalah
Pada tugas akhir ini, ruang lingkup penelitian hanya akan dibatasi pada:
1.4 Tujuan Peneltian
Berdasarkan uraian latar belakang yang telah dijelaskan, tujuan dari pembuatan alat ini adalah:
1. Merancang data lake yang diberikan oleh PT Microsoft Indonesia untuk diolah 2. menjadi target model Machine Learning.
3. Merancang target model Machine Learning menjadi sebuah model Machine Learning
4. Menggunakan layanan Microsoft Azure Machine Learning.
5. Memvisualisasikan hasil model Machine Learning pada media visualisasi Microsoft Power Business Intelligence (PowerBI).
1.
2.
3.
Dataset yang diambil merupakan data lake yang telah diberikan oleh pihak PT Microsoft Indonesia melalui MariBelajar dengan akses Onedrive.
Metode yang digunakan dalam menghasilkan model Machine Learning adalah menggunakan Linier Regression pada layanan Microsoft Azure Machine Learning.
Media visualisasi yang digunakan adalah menggunakan layanan Microsoft Power BI Desktop dan Microsoft Power BI Service.
3
1.5 Manfaat Penelitian
Dari pembuatan Laporan Kerja Praktik ini diharapkan memberi manfaat bagi beberapa pihak dari segi manfaat teoritis maupun manfaat praktis, diantaranya:
1. Manfaat Teoritis
Diharapkan dari Laporan Kerja Praktik ini dapat memberi manfaat berupa kontribusi di bidang keilmuan terutama pada bidang Data and Artificial Intelligence terapan untuk menyelesaikan permasalahan yang melibatkan pembuatan visualisasi data.
2. Manfaat Praktis
Adapun manfaat praktis dari Laporan Kerja Praktik ini adalah sebagai berikut:
secara signifikan dalam proyek akhir (Capstone Project).
- Bagi Universitas Dinamika, proyek ini merupakan salah satu Laporan Kerja Praktik pertama yang merupakan hasil dari konversi SKS pada program Kampus Merdeka yang bekerja sama dengan Merdeka Belajar Kampus Merdeka Studi Independen. Dengan adanya Laporan Kerja Praktik ini diharapkan dapat menjadi sarana transfer ilmu dari PT
Microsoft Indonesia dan MariBelajar kepada Universitas Dinamika dengan Disiplin Keilmuan Artificial Intelligence.
- Bagi penulis, diharapkan dapat menjadi sebuah pengalaman mengerjakan proyek akhir yang memilki dampak terhadap masyarakat, serta dapat meningkatkan kompetensi penulis di bidang Data and Artificial Intelligence
- Bagi PT Microsoft Indonesia dan MariBelajar, proyek ini merupakan salah satu syarat kelulusan peserta dari program Merdeka Belajar Kampus Merdeka Studi Indpeenden 2021 dengan cara berkontribusi
4
1.6 Sistematika Penelitian
BAB I PENDAHULUAN
Bab ini menjelaskan tentang pendahuluan dari Laporan Kerja Praktik yang membahas tentang latar belakang masalah, rumusan masalah, batasan masalah, tujuan, dan sistematika penulisan.
BAB II GAMBARAN UMUM STUDI INDEPENDEN MARI BELAJAR Bab ini menjelaskan tentang program Studi Independen pada PT Microsoft Indonesia melalui MariBelajar yang menjadi bagian dari program Merdeka Belajar Kampus Merdeka.
BAB III LANDASAN TEORI
program Studi Independen PT Microsoft Indonesia melalui MariBelajar. Bab ini berawal dari pengambilan dataset dan perancangan model Machine Learning, Pre-processing daatset menggunakan Azure Machine Learning, hingga perancangan arsitektur dashboard Data and Artificial Intelligence untuk menyelesaikan permasalahan sesuai dengan latar belakang masalah.
BAB V PENUTUP
Bab ini berisi kesimpulan yang menjawab pertanyaan dari rumusan masalah dan beberapa saran yang bermanfaat dalam pengembangan lebih lanjut dari Laporan Kerja Praktik ini.
Bab ini menjelaskan tentang teori yang mendukung dalam pembahasan Laporan Kerja Praktik yang meliputi definisi dari Data and Artificial Intelligence, media yang digunakan serta metode yang digunakan untuk menyelesaikan masalah.
BAB IV DESKRIPSI KERJA PRAKTIK
Bab ini menjelaskan tentang hasil implementasi dari proyek kerja praktik yang telah dilakukan selama kurang lebih satu bulan pada
BAB II
GAMBARAN UMUM STUDI INDEPENDEN MARI BELAJAR
2.1 Sejarah Singkat Kampus Merdeka
Kampus Merdeka merupakan program yang diselenggarakan oleh Direktorat Jenderal Pendidikan Tingi Kementerian Pendidikan dan Kebudayaan Republik Indonesia yang memungkinkan mahasiswa untuk mengambil program-program tertentu di luar proses perkuliahan dan dikonversikan ke dalam beban studi (SKS) sesuai dengan ketentuan yang berlaku (Kementerian Pendidikan dan Kebudayaan, 2020). Salah satu tujuan dari diadakannnya program Kampus Merdeka adalah untuk meminimalkan kesenjangan antara dunia perkuliahan dan dunia Kerja dengan cara memberikan mahasiswa skill yang diperlukan dalam berbagai cara, diantaranya adalah Magang Bersertifikat dan Studi Independen. Pada program Kampus Merdeka
ditugaskan untuk membimbing mahasiswa dalam menjalankan program Kampus Merdeka.
Gambar 2. 1 Logo Kampus Merdeka (sumber: kampusmerdeka.kemdikbud.go.id)
5
memungkinkan mahasiswa untuk mengambil 1 (satu) semester belajar di luar program studi dan 2 (dua) semester belajar di luar perguruan tinggi.
Beberapa program yang ditawarkan Kampus Merdeka Antara lain di antaranya melakukan magang/praktik kerja di Industri atau tempat kerja lainnya, melaksanakan proyek pengabdian kepada masyarakat di desa, mengajar di satuan pendidikan, mengikuti pertukaran mahasiswa, melakukan penelitian, melakukan kegiatan kewirausahaan, membuat studi/ proyek independen, dan mengikuti program kemanusisaan. Seluruh kegiatan tersebut juga dibimbing oleh Dosen yang telah
6
2.2 Microsoft
Microsoft Corporation merupakan perusahaan multinasional yang beroperasi secara global dan memilki kantor di lebih dari 190 negara serta karyawan berjumlah lebih yang berkantor pusat di Redmond, Washington, yang mengembangkan, membuat, memberi lisensi, dan mendukung berbagai produk dan jasa terkait dengan komputer, termasuk sistem operasi, layanan cross platform, aplikasi produktivitas, aplikasi solusi bisnis, desktop, server alat manajemen, alat pengembangan perangkat lunak, layana video game, dan pelatihan sertifikasi. Perusahaan didirikan oleh Bill Gates dan Paul Allen pada tanggal 4 April 1975. Microsoft melaporkan memperoleh pendapatan lebih dari 80 juta US Dollar pada tahun 2016 (Microsoft, 2017).
digital dalam komputasi awan dan perangkat sistem operasi. Selain di Amerika, Microsft juga melakukan penelitian dan pengembangan di berbgai negara, termasuk Kanada, Republik Rakyat Tiongkok, Denmark, Finlandia, Prancis, India, Irlandia, Israel, Jepang, dan Inggris. untuk operasi dalam penelitian dan pengembangannya, Microsoft mengoperasikan Microsoft Research, sebuah organisasi penelitian ilmu komputer yang bekerja sama dengan universitas terkemuka di seluruh dunia.
Perusahaan mengembangkanproduk secara internal melalui tiga kelompok teknik, termasuk Rekayasa Aplikasi dan Layanan Grup, Grup Rekayasa Cloud, dan Grup Rekayasa Windows dan Perangkat (Microsoft, 2017).
Gambar 2. 2 Logo Microsoft
(sumber: https://id.wikipedia.org/wiki/Microsoft)
Microsoft memilki fokus yang kuat pada penelitian dan pengembangan.
Microsoft berkomitmen signifikan dalam mengembangkan sumber daya signifikan dalam hal teknologi, alat, dan layanan platform yang mencakup pekerjaan secara
7
2.3 MariBelajar
MariBelajar adalah salah satu cabang program dari Studi Independen yang merupakan bagian dari program Kampus Merdeka. Program ini diprakarsai oleh Microsoft. Program ini menyiapkan mahasiswa untuk menjadi seorang professional pada salah satu dari tiga bidang yang akan ditempuh seperti Microsoft Office 365 Productivity, Cloud Fundamental, dan Data and Artificial Intelligence (MariBelajar, 2021). Program ini pada awalnya dilaksanakan pada tahun 2021 dengan
menggenggam misi untuk “Empowering Everyone to Learn” dimana MariBelajar senantiasa ingin memberdayakan setiap orang untuk belajar teknologi agar dapat beradaptasi dan bersaing dengan adanya beragam perubahan yang terjadi. Dalam kaitannya, MariBelajar menyediakan berbagai jenis topik pelatihan diantaranya:
Gambar 2. 3 Logo MariBelajar (sumber: https://maribelajar.org/ ) Microsoft 365 Productivity
Microsoft Power BI
Microsoft Developer Technologies Techsmith Technologies
Pada tahun pertama MariBelajar mengadakan program Sudi Independen ini menerima sebanyak lebih dari 1000 peserta untuk mengikuti program Studi Independen MariBelajar.
8
Program ini dilaksanakan selama satu semester dengan total jam belajar kurang lebih sekitar 900 jam. Pada program tersebut mahasiswa akan belajar dari para ahli mengenai hard-skills mengenai teknologi-teknologi terkini sesuai dengan jalur belajar yang ditempuh dan soft-skills mengenai pengembangan diri dan profesionalitas di tempat kerja. Setelah dinyatakan lulus dari program MariBelajar, peserta akan diberikan kesempatan untuk mengikuti sertifikasi professional sesuai dengan jalur belajar yang ditempuh. Pada Laporan Kerja Praktik ini jalur belajar yang ditempuh (Learning Path) yang ditempuh oleh penulis adalah Data and Artificial Intelligence.
2.4 MariBelajar Learning Paths
Pada program MariBelajar, terdapat tiga jalur pembelajaran yang akan diambil oleh peserta dalam mendalami hard-skills yang diinginkan, berikut penjelasan lebih detail mengenai tiga jalur pembelajaran tersebut.
sesuai dengan Learning Track.
Pada jalur pembelajaran Microsoft Productivity: The Modern Workplace peserta akan melakukan proses belajar dengan tahapan sebagai berikut:
- Microsoft 365 Fundamental (MS-900) - Microsoft Word 365 Pro Plus (MO-100) - Microsoft Excel 365 Pro Plus (MO-200) - Microsoft PowerPoint 365 Pro Plus (MO-300) - Microsoft Outlook 365 Pro Plus (MO-400) - Power Platform Fundamental (PL-900) - Capstone Project
2.4.1 Microsoft Productivity: The Modern Workspace Path
Microsoft Productivity: The Modern Workplace Path mempelajari berbagai rangkaian teknologi Microsoft 365 dan aplikasi produktivitas yang memanfaatkan kekuatan cloud. Selain itu juga mempelajari keahlian dalam pengoperasian berbagai layanan yang ada pada Microsoft 365 seperti, Microsoft Word, Microsoft Excel, Microsoft Power Point, dan Microsoft Power Platform. Pada akhir pembelajaran peserta juga akan dipersiapkan untuk mengikuti 4 (empat) macam ujian sertifikasi
9
2.4.2 Cloud Fundamental Path
Cloud Fundamental Path mempelajari tentang konsep dasar dalam
pembuatan perangkat lunak dan komputasi awan menggunakan layanan Microsoft Azure. Peserta yang mengikuti jalur belajar ini akan mengikuti proses pembelajaran menggunakan platform Microsoft Learn dengan berbagai tema yang telah disediakan seperti, Azure Fundamental, Cloud Security, Compliance, and Identity, Azure Administrator, dan Power Platform. Peserta juga akan dipersiapkan untuk mengikuti 4 (empat) ujian sertfifikasi.
Pada jalur pembelajaran Mobile Development peserta akan melakukan proses belajar dengan tahapan sebagai berikut:
peserta untuk menjadi seorang Data Scientist, Data Engineer, Data Analyst, dan Data Visualization yang mampu menganalisis, menafsirkan kumpulan data yang kompleks dalam jumlah besar, Mengolah, Mengembangkan dan membuat desain arsitektur manajemen data, memelihara atau memonitor infrastruktur data, memvisualisasikan, hingga mengambil kesimpulan pada sebuah data. Peserta juga akan dipersiapkan untuk mengikuti 4 (empat) macam ujian sertifikasi.
Pada jalur pembelajaran Data and Artificial Intelligence peserta akan melakukan proses belajar dengan tahapan sebagai berikut:
- Microsoft Azure Data Fundamental (DP-900) - Microsoft Azure AI Fundamental (AI-900) - Microsoft Power Platform Fundamental (PL-900) - Analyzing Data with Microsoft Power BI (DA-100) - Capstone Project
Microsoft Azure Fundamental (AZ-900)
Microsoft Security, Compliance, and Identity Fundamental (SC-900) Microsoft Power Platform Fundamental (PL-900)
Microsoft Azure Administrator (AZ-104) Capstone Project
2.4.3 Data and Artificial Intelligence Path
Data and Artificial Intelligence path pada MariBelajar mempersiapkan
BAB III LANDASAN TEORI
3.1 Covid-19
Menurut Kemenkes RI (2020), Coronavirus (CoV) adalah keluarga besar virus yang dapat menyebabkan penyakit mulai dari gejala ringan, sedang, hingga berat.
Virus corona adalah zoonosis (ditularkan antara hewan dan manusia). Penelitian menyebutkan bahwa SARS-CoV ditransmisikan dari kucing luwak (civectas) ke manusia dan MERS-CoV dari unta ke manusia. Pada penghujung akhir tahun 2019 ditemukan jenis varian virus corona baru, yakni coronavirus disease 2019 (COVID- 19).
Gejala klinis yang terjadi pada pasien yang terkena Covid-19 diantaranya yaitu, demam, batuk kering, dispnea, kelelahan, nyeri otot, dan sakit kepala (Lapostolle
saluran napas atas (untuk melakukan siklus hidupnya). Setelah itu menyebar ke saluran pernapasan bawah. Pada infeksi akut terjadi peluruhan virus dari saluran napas dan virus dapat berlanjut meluruh beberapa waktu dan virus akan
menginkubasi diri sampai muncul penyakit sekitar 3-7 hari (PDPI, 2020).
10
dkk, 2020). Berdasarkan penelitian yang dilakukan oleh Huang dkk (2020), gejala klinis yang paling sering terjadi pada pasien Covid-19 yaitu demam (98%), batuk kering (76%), dan kelemahan (44%). Gejala lain yang terdapat pada pasien namun tidak begitu sering ditemukan yaitu produksi sputum (28%), sakit kepala (8%), batuk darah (5%), dan diare (3%).
Penularan pada virus Covid-19 terjadi umumnya melalui droplet dan kontak dengan virus kemudian dapat masuk ke dalam mucosa yang terbuka. Setelah terjadi transmisi, virus masuk ke saluran napas atas kemudian bereplikasi di sel epitel
11
3.2 Dataset
Dataset merupakan sekumpulan data yang disusun secara terstruktur yang digunakan untuk klasifikasi dengan metode data mining yaitu proses pengumpulan informasi penting dari suatu data yang besar. Awamnya, dataset dipresentasikan dalam bentuk tabel berupa kolom dan baris. Tiap baris dan kolom tersebut merepresentasikan variabel tertentu. Contohnya, misalkan dalam pengerjaan capstone project yang penulis buat yaitu suatu kolom mewakili lokasi, sedangkan barisnya mewakili nama loksai daerahnya.
Kumpulan data yang ada pada dataset bsa di-load dari sumber data apa pun yang valid, seperti SQL Server Database, Microsoft Access database, ataupun XML File. Dataset tetap ada di memori dan data yang ada di dalamnya bisa dimanipulasi dan di-update tanpa bergantung pada data aslinya. Dengan kata lain, salah satu fungsi dari dataset adalah untuk memperhatikan hubungan antar variabel. Khusunya jika
organisasi mereka.
Gambar 3. 1 Logo Microsoft Azure
Selain itu, Microsoft Azure menawarkan empat bentuk komputasi cloud yang berdeba, dari infrastructure as a service (IaaS), platform as a service (PaaS), software as a service (SaaS), hingga layanan tanpa server. Dengan harga yang ditawarkan oleh Microsoft Azure, terdapat beberapa manfaat bagi para pengguna Microsoft Azure seperti, keamanan terjamin, layanan yang fleksibel dan transparan, dan mendukung keputusan terbaik. Microsoft Azure dapat meningkatkan efisiensi bisnis dengan jumlah data dan variabel yang dimiliki cukup bervariasi.
3.3 Microsoft Azure
Menyadur oleh Microsoft, Microsoft Azure atau sebelumnya dikenal sebagai Windows Azure merupakan platform cloud computing publik milik perusahaan Microsoft. Microsoft Azure menyediakan berbagai layanan cloud, speerti komputasi, analisis tools, ruang penyimpanan data, hingga networking. Platform Microsoft Azure bertujuan untuk membantu bisnis mengelola dan memenuhi tujuan daripada
12
beberapa keunggulan yang dimiliki seperti, dapat meningkatkan skalabilitas bagi pengguna, dapat mengurangi biaya on-premise (infrastructure haedware) secara signifikan.
3.4 Microsoft Azure Machine Learning
Azure Machine Learning merupakan layanan cloud yang tersedia di dalam Microsoft Azure Cloud Computing untuk memprediksi hasil dari sekumpulan data yang ada dan menganalisis keseluruhan datanya untuk memberikan kesimpulan menggunakan beragam algoritma yang dipakai. Layanan Azure Machine Learning tidak hanya menyediakan alat untuk memodelkan analisis prediksi, namun juga menyediakan layanan yang langsung memungkinkan pengguna untuk mengelola
Gambar 3. 2 Logo Microsoft Azure Machine Learning Dengan menggunakan layanan Microsoft Azure Machine Learning, ada beberapa manfaat bagi para penggunanya diantaranya mendeteksi penipuan, menganalisis sentimen berbasis teks, memprediksi kegagalan pada peralatan, memprediksi jumlah produksi pada peralatan, serta membuat pola dan pengenalan gambar. Selain itu, ada pula sejumlah inovasi dari Azure Machine Learning, yaitu Fitur MLOps, Automated ML, dan Visual Machine Learning Interface.
suatu data untuk diprediksi.
13
3.5 Multiclass Decision Forest
Multicalss Decision Forest merupakan metode machine learning untuk klasifikasi. Algoritma ini bekerja dengan cara membangun beberapa pohon keputusan dan memilih kelas output yang paling populer. Dimana dalam pohon keputusan ini adalah sebuah bentuk agregasi dimana setiap pohon dalam Multiclass Decision Forest menghasilkan hostogram frekuensi label yang tidak dinormalisasi.
Pada proses agregasi menjumlahkan histogram dan mendapatkan probabilitas pada setiap tabel.
Gambar 3. 3 Multiclass Decision Forest
Multiclass decision forest memiliki kepercayaan prediksi tinggi memiliki bobot lebih besar dalam keputusan akhir ansambel. Pohon keputusan secara umum adalah model non-parametrik, yang berarti mereka mendukung data dengan distribusi yang bervariasi. Di setiap pohon, serangkaian tes sederhana dijalankan untuk setiap kelas, meningkatkan tingkat struktur pohon hingga simpul daun (keputusan) tercapai.
14
3.6 Microsoft Power BI
Microsoft Power BI merupakan aplikasi software intelligence bisnis yang memungkinkan pengguna untuk mengolah data lebih detail dan menampilkannya dengan grafis yang interaktif. Pada Power BI dapat memvisualisasikan data yang sudah terkoneksi dan bisa mengontrol dan memantau data pengguna dengan mudah.
Aplikasi ini dapat digunakan di bebrapa platform seperti PC/Laptop ataupun smartphone. Power BI bisa berjalan dengan baik di sistem Windows, IOS dan Android. Pada dasarnya Aplikasi ini bisa digunakan secara cuma-cuma atau gratis, namun fitur yang Anda dapatkan tidak akan selengkap versi pro.
Gambar 3. 4 Logo Micrososft Power BI
Microsoft Power BI mengusung 3 konsep kerja yang akan sangat membantu dalam menganalisa data seperti Dashboard, Report, dan Datasets. Datasets
merupakan kumpulan data yang di import atau dikoneksikan pada Power BI.
Sedangkan Report adalah satu atau lebih dari satu halaman visualisasi. Repot bisa berupa chart atau grafik, dan Dashboard sendiri adalah tampilan integrasi yang menampilkan sekumpulan report dari sekumpulan dataset. Dashboard memberikan informasi data, analisa, serta memberikan gambaran dalam bentuk single
visualisasi dashboard.
Menariknya, Power BI dari Microsoft ini sudah bisa Anda integrasikan dengan beberapa aplikasi pengolah data populer yang sudah banyak digunakan di indutri IT seperti alat pengolah data Google Analitycs besutan raksasa teknologi Google, pengolah data dari Oracle, pengolah data Salesforce, Microsoft Dynamic CRM, Mysql, dan masih banyak yang lainnya.
BAB IV
DESKRIPSI KERJA PRAKTIK
4.1 Penjelasan Kerja Praktik
Kerja Praktik yang penulis lakukan adalah bagian dari Capstone Project yang merupakan salah satu syarat kelulusan Program Kampus Merdeka Studi Independen di MariBelajar 2021. Pada bagian pembelajaran Learning Track: Data and Artificial Intelligence disediakan tiga bidang permasalahan untuk pengerjaan Capstone Project yaitu Bidang Bisnis, Bidang Pendidikan, dan Bidang Kesehatan. Adapun bidang yang dipilih oleh penulis untuk dijadikan sebagai tema Capstone Project adalah Bidang Kesehatan yang bernama MariSehat. Topik permasalahan yang diberikan berupa MariSehat ingin memberikan dukungan kepada masyarakat dengan
digunakan untuk proses pre-processing pada Azure Machine Learning. Dataset covid-19 Indonesia sendiri telah disediakan oleh MariBelajar melalui OneDrive dengan format file Comma Separated Value (.csv)
15
menyampaikan informasi yang mudah dipahami mengenai Covid-19 melalui dashboard pada Power BI dengan mengambil dataset persebaran Covid-19 di Indonesia dari Azure Dataset Catalog. Diharapkan solusi teknis yang diberikan berupa dashboard berbasis desktop yang dapat ditampilkan di ruang depan Klinik MariSehat sehingga dapat diakses dan diketahui oleh masyarakat.
4.2 Pengambilan dataset dan perancangan model
Pengambilan dataset diperlukan untuk mempersiapkan data yang akan
16
Gambar 4. 1 File dataset pada OneDrive
Sebelum melakukan pre-processing dataset pada Azure Machine Learning akan dilakukan proses merapikan data dengan dibagi menjadi kumpulan tabel agar proses pada Azure Machine Learning akan berjalan lancar.
Gambar 4. 2 Tampilan dataset awal sebelum pre-processing pada Azure Machine Learning
17
digunakan pada tahap visualisasi data nanti.
Gambar 4. 4 Tampilan layanan Microsoft Azure
Gambar 4. 3 Dataset setelah dibagi menjadi kumpulan tabel
4.3 Pre-processing dataset menggunakan Azure Machine Learning
Setelah merapikan data pada excel, maka selanjutnya data akan diproses pada Azure Machine Learning Studio menggunakan layanan Microsoft Azure yang telah disediakan oleh pihak PT. Microsoft Indonesia. Guna dari melakukan pre-processing tersebut adalah menyunting dataset mana saja yang akan digunakan dan tidak
18
Dalam tahapan pre-processing pada Azure Machine Learning digunakan Pipeline yang bertujuan untuk mengotomatiskan dan mengatur berbagai langkah yang terlibat saat pelatihan model dataset machine learning. Saat membuat pipeline dibutuhkan sumber daya dataset yang digunakan untuk training data, setelah
menyiapkan dataset maka akan membuat jalur untuk mengatur proses training nanti.
Gambar 4. 6 Proses pada Azure Machine Learning menggunakan Pipelines Gambar 4. 5 Tampilan Microsoft Azure Machine Learning
19
Seperti yang dilihat pada gambar 3.6 penulis melakukan sortir untuk memilih data yang akan digunakan dan yang tidak digunakan dan mencari data yang hilang atau tidak terdeteksi seperti null maka akan diganti dengan angak 0 (Nol). Adapun dataset yang dipilih oleh penulis untuk tahapan selanjutnya adalah:
1. New Cases, 2. New Deaths, 3. New Recovered, 4. New Active Cases, 5. Total Cases,
13. Total Deaths per Million, 14. Case Fatality Rate, 15. Case Recovered Rate,
16. Growth Factor of New Cases, 17. Growth Factor of New Deaths, 18. Location.
Data-data tersebut akan dilakukan proses training data dan clean missing data untuk mendapatkan hasil data yang diinginkan.
6. Total Deaths, 7. Total Recovered, 8. Total Active Cases, 9. Population Density, 10. New Cases per Million, 11. Total Cases per Million, 12. New Deaths per Million,
20
Gambar 4. 7 Proses pipeline pada bagian tengah
4.4 Klasifikasi algoritma machine learning
Tahap selanjutnya merupakan klasifikasi algoritma machine learning untuk
3. Algoritma yang dapat melakukan seleksi dan klasifikasi fitur yang terintegrasi
Dan langkah terakhir yaitu mendapatkan model skor data hasil proses algoritma machine learning menggunakan Multiclass Decision Forest yang hasilnya akan diubah kedalam bentuk (.CSV)
melatih data sebelum mendapatkan model skor data yang sudah bisa dipakai. Penulis menggunakan algoritma machine learning Multiclass Decision Forest dimana
algoritma tersebut membangun beberapa pohon/cabang keputusan dan memberikan hasil mayoritas. Adapun beberapa keuntungan dalam menggunakan algoritma Multiclass Decision Forest adalah:
1. Merupakan algoritma yang dapat mewakili batas keputusan non-linier 2. Algoritma yang efisien dalam komputasi dan penggunaan memori selama
pelatihan dan prediksi
21
Gambar 4. 8 Proses pada Pipeline bagian akhir
Hasil data yang telah dilakukan proses pelatihan bisa diunduh dan hasilnya dapat dilihat pada gambar 4.9
Gambar 4. 9 Model data setelah dilakukan proses pelatihan pada Azure Machine Learning
22
4.5 Visualisasi data pada Microsoft Power BI Desktop
Setelah mendapatkan data, maka tahapan selanjutnya yaitu melakukan visualisasi data pada Power BI Desktop untuk membuat Dashboard Informasi Persebaran Covid-19 di Indonesia.
mendukung kustomisasi grafik dan terdapat kurang lebih 30 tools yang bisa
digunakan, seperti seperti Stacked Bar Chart & Stacked Column Chart, Line Chart, Area Chart, Table, dan Pie Chart.
Beberapa fitur yang digunakan penulis untuk visualisasi data yaitu:
1. Card
2. Ribbon Chart 3. Scatter Chart
4. Clusterde column chart 5. Slicer
6. Line chart 7. Filled map
Gambar 4. 10 Tampilan awal pada Power BI Desktop
Power BI sendiri merupakan singkatan dari Power Business Intelligence yang berguna untuk menampilkan data dalam bentuk visual agar mudah dimengerti oleh para pengguna maupun masyarakat. Salah satu fitur yang bertanggung jawab atas visual data yang mudah dipahami adalah fitur Visualizations dimana fitur tersebut
23
Gambar 4. 12 Tampilan dashboard pada Power BI Service
Pada dashboard informasi persebaran covid-19, penulis menampilkan beberapa visualisasi yang tujuannya berguna bagi pengguna maupun masyarakat.
Gambar 4. 11 Dashboard Power BI Desktop sebelum publish ke Power BI Service
4.6 Publish dashboard visualisasi pada Microsoft Power BI Service
Hasil akhir visualisasi pada Power BI dapat dilihat pada gambar 4.11. setelah melakukan proses pembuatan visualisasi pada Power BI Desktop maka akan dipublish dan ditampilkan pada Power BI Service. Dapat dilihat pada gambar berikut:
BAB V PENUTUP
Dari hasil implementasi Dashboard Persebaran Covid-19 Menggunakan Microsoft Azure Machine Learning terdapat beberapa poin kesimpulan dan saran pada Laporan Kerja Praktik ini, diantaranya adalah:
5.1 Kesimpulan
1. Dalam merancang dataset hingga menjadi data yang dapat diolah, semua pekerjaan tersebut menggunakan fitur yang berada pada Microsoft Azure 2. Perancangan dashboard persebaran Covid-19 dilakukan menggunakan
Microsoft Azure Machine Leraning dan menggunakan metode Multiclass Decision Forest untuk mendapatkan hasil yang diinginkan.
24
3. Hasil dashboard persebaran data covid-19 dirancang menggunakan Microsoft Power BI dan ditampilkan melalui Microsoft Power BI Service.
5.2 Saran
Proses arsitektur Data and Artificial Intelligence dan perancangan dataset mungkin bisa menggunakan fitur ataupun algoritma yang lain, disini penulis menggunakan layanan fitur Microsoft Azure Machine Learning dan Microsoft Power BI serta menggunakan algoritma Multiclass Decision Forest
25
DAFTAR PUSTAKA
Microsoft. (2019, 5 Juni). Multiclass Decision Forest. Diakses pada 1 Juni 2022. Dari https://docs.microsoft.com/en-us/previous-versions/azure/machine-
learning/studio-module-reference/multiclass-decision-forest
Microsoft. (2021, 4 November). Multiclass Decision Forest component. Diakses pada 1 Juni 2022. Dari https://docs.microsoft.com/en-au/azure/machine- learning/component-reference/multiclass-decision-forest
Panmore.com. (2018, 8 September). Microsoft Corporation’s Organizational Structure & Its Characteristics (An Analysis). Diakses pada 20 Desember 2021.
Marketline.com. (2017, 25 Juli). Company Profile Microsoft Corporation. Diakses pada 23 Mei 2022.
Glints.com. (2021, 15 September). Mengenal Data Lake, Solusi Mudah Simpan Raw Data Perusahaan. Diakses pada 2 Juni 2022. Dari https://glints.com/id/lowongan/data-lake-adalah/#.YsjmrjdByMo
sis.binus.ac.id. (2019, 25 Juni). Data Lake. Diakses pada 2 Juni 2022. Dari https://sis.binus.ac.id/2019/06/25/data-lake/
docs.microsoft.com. (2022, 15 Juni). Apa itu data lake?. Diaskes pada 22 Juni 2022.
Dari https://docs.microsoft.com/id-id/azure/architecture/data- guide/scenarios/data-lake
Dari https://panmore.com/microsoft-corporation-organizational-structure- characteristics-analysis
Kebudayaan, K. P. (202). Tentang Kampus Merdeka. Retrieved from kampusmerdeka.kemdikbud.go.id:
https://kampusmerdeka.kemdikbud.go.id/web/about
26
glints.com. (202, 20 November). Microsoft Azure, Aplikasi yang Diprediksi Akan Jadi Masa Depan Cloud Services. Diakses pada 2 Juni 2022. Dari https://glints.com/id/lowongan/microsoft-azure-adalah/#.YsjnyTdByMo
solusi.com.(2021, 26 Maret). Mengenal Microsoft Azure Dan Alasan Menggunakannya. Diakses pada 2 Juni 2022. Dari https://www.solusi.com/mengenal-microsoft-azure-dan-alasan-
menggunakannya/
helios.id. (2021, 10 Agustus). Mengenal Microsoft Azure, Solusi Infrastruktur IT Berbasis Cloud yang Lebih Efisien. Diakses pada 2 Juni 2022. Dari https://www.helios.id/blog/detail/mengenal-microsoft-azure-solusi- infrastruktur-it-berbasis-cloud-yang-lebih-efisien
glints.com. (2022, 4 Maret). Microsoft Power BI: Apa Itu, Fitur-Fitur, Harga, Alternatif, dan Manfaat. Diakses pada 3 Juni 2022. Dari https://glints.com/id/lowongan/microsoft-power-bi-adalah/#.YsjpGzdByMo dosc.microsoft.com.(2021, 8 Juli). Apa itu Azure Machine Learning?. Diakses pada 3
Juni 2022. Dari https://docs.microsoft.com/id-id/azure/machine- learning/overview-what-is-azure-machine-learning
solusi.com. (2017, 5 September). Mengenal Power BI Dari Microsoft, Fungsi Dan Perannya Untuk Perkembangan Perusahaan Anda. Diakses pada 3 Juni 2022.
Dari https://www.solusi.com/mengenal-microsoft-power-bi/