Identifikasi
Missing Value
dan
Outlier
pada Proses
Cleansing
Data dengan
Studi Kasus Data Klimatologi Jawa Tengah
1)
Wahyu Andryanto,2)Sri Yulianto, J.P.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi Universitas Kristen Satya Wacana Salatiga, Jawa Tengah 50711
Email : 1)wahyu.andryanto@gmail.com, 2)sriyulianto@gmail.com
Abstract
Valid data such as completeness, correct data, and data consistency are very important for data processing because it affects the accuracy of data. Therefore, with this research we cleansing missing and outlier from data, to validating data that provide better accuracy to processing data. Missing data of Climate data in Central Java period of 2007 to 2011 is cleaned using median substitution method to fill incomplete data, and outlier identification using Z-Score.
Keywords: valid data,missing value, median substitution, Outlier, Z-Score
Abstraksi
Pemilihan data yang valid seperti kelengkapan data, kebenaran data, dan juga konsistensi data sangat penting untuk pengolahan data karena mempengaruhi keakuratan data yang dipakai. Untuk itu, melalui penelitian ini dilakukan proses pembersihan data dari adanya missing dan outlier, untuk menghasilkan data valid sehingga memberikan tingkat akurasi data yang lebih baik untuk pengolahan data. Data kosong atau missing yang terdapat pada data Klimatologi Jawa Tengah periode tahun 2007 sampai dengan tahun 2011 dibersihkan dengan menggunakan metode median substitution untuk mengisi data yang kurang lengkap, serta pengidentifikasian outlier menggunakan metode Z-Score.
Kata kunci : data valid, missing value, median substitution, Outlier, Z-Score.
1)
Mahasiswa Fakultas Teknologi Informasi Universitas Kristen Satya Wacana Salatiga.
2)