PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI DATA MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA

(1)

xix

PERUMUSAN POLA PENYEBARAN DEMAM

BERDARAH MELALUI DATA MINING PADA

DATABASE DINAS KESEHATAN DKI JAKARTA

OLEH

HENDRA LUKITO

NRP : G 651030184

PROGRAM STUDI ILMU KOMPUTER

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

(2)

xxi

PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH

MELALUI DATA MINING PADA DATABASE DINAS

KESEHATAN DKI JAKARTA

HENDRA LUKITO G 651030184

Tesis

Sebagai salah satu syarat untuk memperoleh gelar Magister Sains

Pada Program Studi Ilmu Komputer

PROGRAM STUDI ILMU KOMPUTER

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

BOGOR

2007

(3)

xx SEMINAR SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

Nama : Hendra Lukito

Nomor Pokok : G 651030184 Program Studi : Ilmu Komputer

Judul Penelitian : Perumusan Pola Penye baran Demam Berdarah Melalui Datamining Pada Database Dinas Kesehatan DKI Jakarta

Komisi Pembimbing : Prof. Dr. Ir. Marimin, M.Sc ( Ketua ) Dr.drh. Hamdani Nasution ( Anggota ) Kelompok / Bidang Studi : Keteknikan dan Teknologi Informasi Hari / Tanggal : Kamis, 18 Januari 2007

Waktu : 09.00 – 10.00

(4)

i SURAT PERNYATAAN

Saya menyatakan dengan sebenar – benarnya bahwa segala pernyataan dalam tesis saya berjudul :

PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI DATA MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA

Merupakan gagasan atau hasil penelitian tesis saya sendiri, dengan arahan Komisi Pembimbing, kecuali yang dengan jelas ditunjukkan rujukannya. Tesis ini belum pernah diajukan untuk memperoleh gelar atau capaian akademik lainnya pada program sejenis di perguruan tinggi lain. Semua data dan informasi yang digunakan telah dinyatakan secara jelas dan dapat diperiksa kebenarannya.

Jakarta, 15 Maret 2007 Yang Membuat Pernyataan

(5)

ii

ABSTRACT

HENDRA LUKITO, The Formulation of Demam Berdarah Dengue Spread Pattern Through Datamining of Dinas Kesehatan DKI Jakarta Database. Supervised by MARIMIN and HAMDANI NASUTION.

The Objectives of this research were to identify the most important attributes and to formulate decision rules from Dinas Kesehatan DKI Jakarta database. The real survailance data set used collected from Dinas Kesehatan Jakarta from 2004 until 2005 which include DBD data in Jakarta area. We used data set only from Central Jakarta and South Jakarta area. There are two main steps considered for identification of the pattern of DBD, data mining process building which using Classification based association algorithm and creates application program to implement the algorithm. Three steps procedures are implemented for data mining process building. The first step is to deal with mi ssing values. The second step is the discretization, where, each variable is devided into limited number of values groups. The thrid step is creating rule mining and classification. There are 68 data with yellow DBD condition and 134 data with red DBD cond ition and weather data set consisted of 14 variabels data such as: temperatures, rainy, humadity and sunny. The maximum predictive accuracy for DBD with red condition is 88% and for DBD with yellow condition is 77%. The decision rules are used to predict the condition of DBD. Prediction result from application will be used to forecast the future condition of DBD at certain district. Keywords : DBD (Demam Berdarah Dengue), Datamining, Fuzzy rule base, Winter’s forecast method.

(6)

iii

RINGKASAN

HENDRA LUKITO, Perumusan Pola Penyebaran Demam Berdarah Melalui Datamining Pada Database Dinas Kesehatan DKI Jakarta, Dibawah bimbingan Prof. Dr. Ir. Marimin, M.Sc, Dr. drh. Hamdani Nasution.

Siklus DBD yang terjadi setiap tahun di DKI Jakarta dengan jumlah kasus yang meningkat setiap tahunnya, membuat data survailance tentang DBD yang di catat secara rutin oleh Dinas Kesehatan DKI Jakarta akan menjadi semakin besar, akan tetapi data yang telah di kumpulkan tersebut tidak selalu dapat dimanfaatkan oleh semua pihak, hanya pihak tertentu saja yang dapat memanfaatkan data tersebut secara maksimal. Selain hal tersebut, pada permasalahan DBD terdapat suatu hipotesa awal tentang keterkaitan antara perindukan nyamuk Aedes aegypti dengan suhu, curah hujan dan penyinaran matahari. Dengan menerapkan konsep data mining pada database DBD dan data set cuaca, diharapkan dapat ditemukan pola keterkaitan antar variabel, pada akhirnya dapat dirumuskan pola penyebaran DBD .

Tujuan penelitian ini adalah Merumuskan suatu sistem peringatan dini prediksi meledaknya DBD dan cara penanggulangannya, sehingga dari penelitian ini diharapakan akan didapat manfaat untuk membantu dalam memprediksi pola penyebaran DBD pada daerah DKI Jakarta, dan diambilnya suatu tindakan pencegahan agar DBD tersebut tidak meluas penyebarannya dengan menerapkan sistem pakar tata laksana DBD. Dalam penelitian ini digunakan datamining untuk menggali pola keterkaitan antar variabel pada database DBD khususnya di wilayah Jakarta Selatan dan Jakarta Pusat dan data cuaca pada wilayah yang sama. Metode yang digunakan adalah metode Classification based on Predictive Association Rules

(CPAR). Output yang didapat dari pencarian dengan menggunakan CPAR tersebut berupa aturan – aturan dengan kaidah aturan IF – THEN, yang selanjutnya digunakan dalam membangun suatu sistem pakar untuk mengidentifikasi kemungkinan terjadi

(7)

iv DBD di suatu wilayah didasarkan pada keadaan cuaca di wilayah tersebut. Sistem pakar berbasiskan logika fuzzy ini diberi nama Aplikasi DBD.

Aplikasi DBD dibangun menggunakan Matlab 7.0 R 14, dengan menggunakan fungsi toolbox fuzzy untuk membangun SIF (Sistem Inferensi Fuzzy) dan fasilitas GUI (graphical users interface) untuk antarmukanya. Data masukkan yang digunakan adalah data cuaca yang meliputi suhu udara, curah hujan, penyinaran matahari, kelembaban udara. Data tersebut menjadi acuan untuk melakukan prediksi terhadap kondisi DBD serta tatalaksana tentang DBD. Data cuaca ini kemudian di dekomposisi menjadi himpunan – himpunan fuzzy. Evaluasi aturan fuzzy kemudian diubah menjadi suatu harga numerik untuk menetukan aksi dari output, atau disebut defuzzifikasi. Metode defuzzifikasi yang digunakan adalah metode centroid. Dengan menggunakan himpunan fuzzy, aturan atau rule dan metode defuzzifikasi, maka dapat disusun sistem inferensi fuzzy dengan menggunakan toolbox fuzzy (fuzzy logic toolbox) pada Matlab7.0 R14, proses inferensi yang digunakan adalah model fuzzy Mamdani.

Hasil prediksi dari aplikasi DBD ini dapat digunakan oleh pihak – pihak yang berkepentingan dalam hal penganggulangan wabah DBD, sehingga mereka dapat melakukan tindakan cegah dini dari kemungkinan terjadinya wabah DBD disuatu wilayah. Untuk melakukan prediksi pada tahun selanjutnya dimana data cuaca belum diketahui, maka digunakan metode Winter’s yang dapat memprediksi kemungkinan keadaan cuaca berdasarkan pada data cuaca di tahun sebelumnya, sehingga Aplikasi DBD ini dapat digunakan dalam memprediksi kemungkinan terjadinya DBD di tahun yang akan datang.

Hasil prediksi menggunakan datamining pada database Dinkes DKI Jakarta dikaitkan dengan data cuaca menghasilkan aturan sebanyak 22 aturan untuk Jakarta Selatan dan 29 aturan untuk Jakarta Pusat.

Dari hasil penelitian ini dapat disimpulkan sebagai berikut : Penerapan datamining dengan metode CPAR pada database DINKES DKI Jakarta dikaitkan dengan variabel cuaca, menemukan adanya keterkaitan, yaitu : Kelembaban udara ,

(8)

v Penyinaran matahari dan Curah hujan menjadi penentu utama apakah terjadi wabah DBD pada suatu wilayah, Sebagai tindakan cegah dini wabah DBD, maka diprediksikan kemungkinan wabah DBD untuk tahun 2007 di wilayah Jakarta Selatan adalah : Sepanjang tahun 2007 kemungkianan terjadi wabah DBD dengan kondisi merah, kecuali pada minggu ke 31, 34 dan 35 kondisi wabah DBD menurun sesuai dengan factor cuaca ke kondisi kuning. Dari kesimpulan hasil penelitian tersebut maka dapat diberikan saran – saran sebagai berikut : Perlu ditambahkan atribut – atribut selain atribut cuaca, misalnya data atribut kepadatan penduduk, data bebas jentik suatu wilayah dan data geografis dll yang mempunyai potensi untuk mempengaruhi terjadinya wabah DBD disuatu wilayah, Pengelompokkan atribut lebih dipersempit rentangnya sehingga diharapkan dapat dihasilkan aturan yang lebih detil dan lebih baik.

Kata kunci : Demam Berdarah Dengue (DBD), Datamining, Fuzzy rule base, Metode prediksi Winter’s.

(9)

vi Judul Penelitian : Perumusan Pola Penyebaran Demam Berdarah Melalui

Data Mining Pada Database Dinas Kesehatan DKI Jakarta

Nama : Hendra Lukito

NRP : G651030184

Program Studi : Ilmu Komputer

Menyetujui,

Komisi Pembimbing

Prof. Dr. Ir. Marimin, M.Sc Dr. drh. S.Hamdani Nasution Ketua Anggota

Mengetahui,

Ketua Program Studi Dekan Sekolah Pascasarjana

Ilmu Komputer

Dr. Sugi Guritman Prof. Dr. Ir. Khairil Anwar N, MS

(10)

vii

KATA PENGANTAR

Puji syukur penulis sampaikan kehadirat Allah SWT, atas berkah dan rahmat-Nya, akhirnya penulis dapat menyelesaikan tugas penelitian ini dengan judul ”PERUMUSAN POLA PENYEBARAN DEMAM BERDARAH MELALUI DATA MINING PADA DATABASE DINAS KESEHATAN DKI JAKARTA”. Tugas penelitian ini dibuat untuk memenuhi salah satu persyaratan studi pada program Studi Ilmu Komputer, Sekolah Pascasarjana IPB.

Tugas penelitian ini dapat terselesaikan atas bantuan dari berbagai pihak. Oleh karena itu ijinkan penulis untuk menyampaikan ucapan terima kasih yang sebesar – sebesarnya kepada :

1. Bapak Prof. Dr. Ir. Marimin, M.Sc dan Bapak Dr. drh. Sjahrun Hamdani Nasution, selaku Dosen pembimbing, yang telah sangat membantu dalam membimbing dan mengarahkan penulis, sehingga ide yang sederhana ini dapat menjadi sesuatu yang berguna.

2. Staf pengajar dan karyawan di Program Studi Ilmu Komputer, Sekolah Pascasarjana IPB yang telah membantu selama masa menimba ilmu di kampus Baranangsiang, dan Karyawan Pascasarjana IPB,khususnya ibu Henny, yang telah sangat membantu.

3. Orang Tua tercinta Bapak dan Ibu Suparman, yang selalu mendoakan penulis di dalam setiap nafasnya, dan menjadi motivasi penulis dalam mengejar ilmu sehingga bisa menjadi yang lebih tinggi lagi. ”Terima Kasih atas doanya dan karya ini saya persembahkan untuk Bapak dan Ibu berdua ”.

4. Bapak dan Mama Bambang Pribadi yang mendukung dan mengerti dengan situasi serta kondisi sebagai seorang mahasiswa.

5. Istriku tercinta Santhy Lestari dan anak – anak tersayang, Shafira, Farhan dan Jasmine yang selalu memberi dukungan penuh dan menjadi penyejuk disaat rasa lelah dan jenuh mulai datang me nghampiri. ” Semoga ini bisa menjadi

(11)

viii

motivasi bagi kalian nanti untuk melangkah di masa depan dan kalian harus bisa lebih dari Babab saat ini ”.

6. Rekan – rekan mahasiswa Pascasarjana Ilmu Komputer angkatan ”Matrix”, yang telah membantu dalam memberi saran dan masukkan, khususnya kepada dokter Syafeii yang telah membantu dalam memberikan data dan menjadi tempat penulis berkonsultasi tentang DBD, Herwanto yang telah sangat – sangat membantu dalam mengolah data menggunakan algoritma CPAR yang telah dimodifikasinya, Nana Supriatna yang sama – sama jatuh bangun dalam menyusun tesis ini. Rekan - rekan satu bimbingan Bapak Marimin, khususnya, mas Janawir, mas Hari dan Rein atas dukungan soft copy dan hard copy tesisnya.

7. Segenap keluarga yang telah memberikan dukunga n moral dan spirit, ”tanpa dukungan kalian, karya ini mungkin tidak akan tersusun sebaik ini”.

8. Pimpinan dan rekan sejawat di kantor tempat penulis bekerja, baik selama bekerja di PT. Mitratama, Bapak Viktor Pardede (alm), Bapak Haryanto, dan selama penulis bekerja di PT. Charoen Pokphand Indonesia, khususnya Bapak Bambang Pangestoe dan Bapak Jimmy Perangin angin yang telah mengijinkan penulis untuk menyelesaikan langkah terakhir dalam langkah yang cukup panjang ini.

9. Semua pihak yang telah sangat membantu dalam penulisan ini namun tidak dapat penulis sebutkan satu persatu. ”Terima kasih atas dukungan kalian semua, sehingga tesis ini dapat menjadi sesuatu yang berguna ”.

Berbagai usaha telah penulis upayakan guna terselesaikannya tugas penelitian ini dengan baik, namun penulis menyadari akan kekurangan dan keterbatasan penulis. Oleh karena itu penulis memohon maaf apabila terdapat kesalahan. Akhir kata penulis berharap agar tesis ini dapat berguna bagi masyarakat dalam memerangi masalah DBD yang selalu terjadi. Amin

Jakarta, Februari 2007 Penulis

(12)

ix RIWAYAT HIDUP

Penulis dilahirkan di Balikpapan pada tanggal 21 Oktober 1974, sebagai anak pertama dari 2 bersaudara pasangan bapak H. Suparman S dan ibu Hj. Purbawati Chalid. Pendidikan dasar di tempuh diberbagai temp at di wilayah Indonesia karena orang tua yang bertugas sebagai seorang Tentara TNI AD, antara lain di Singaraja, Kupang, dan menyelesaikannya di Bima – NTB tahun 1986. Pendidikan menengah pertama di selesaikan di SMPN 1 Denpasar Bali tahun 1989. Pendidikan menengah atas penulis jalani di 2 tempat yaitu di SMU 2 Ujung pandang dan diselesaikan di SMA 4 Jogjakarta dengan mengambil jurusan Biologi pada tahun 1992. Pendidikan sarjana ditempuh di Universitas Pembangunan Nasional ” Veteran” Jogjakarta dengan mengambil jurusan Teknik Geologi, Fakultas Teknologi Mineral dan diselesaikan pada tahun 1998. Tahun 2003, penulis meneruskan menimba ilmu di program Pascasarjana IPB, Institut Pertanian Bogor pada program ilmu Komputer .

Setelah menyelesaikan kuliah tingkat Sarjana penulis bekerja di PT. Mitratama dan bekerja paruh waktu di PT. Yanmar Indonesia (1998 – 2005). Sejak November 2005, penulis bergabung di PT. Charoen Pokphand Indonesia sebagai tenaga analisis data di bidang Security dan Community Development.

Saat ini penulis berdomisili di Cilangkap, Jakarta Timur dan dari hasil perkawinan penulis dengan Santhy Lestari, dikaruniai 3 orang anak, Shafira Larasati, M Farhan dan Jasmine Azahra.

(13)

x DAFTAR ISI Halaman SURAT PERNYATAAN i ABSTRACT ii RINGKASAN iii LEMBAR PENGESAHAN v KATA PENGANTAR vi

RIWAYAT HIDUP viii

DAFTAR ISI ix

DAFTAR GAMBAR xiii

DAFTAR TABEL xv

DAFTAR LAMPIRAN xvii

I PENDAHULUAN 1 1.1 Latar Belakang 1 1.2 Tujuan 3 1.3 Ruang Lingkup 3 1.4 Manfaat Penelitian 4 II TINJAUAN PUSTAKA 5

2.1 Demam Berdarah Dengue (DBD) 5

2.1.1 Definisi 5

2.1.2 Penyebab DBD 5

2.1.3 Kasus DBD di wilayah DKI Jakarta 6

2.2 Data Mining 7

2.2.1 Klasifikasi dan Prediksi 10

(14)

xi

2.2.3 Teknik Datamining 12

2.2.3.1 Association Rule 12

2.2.3.2 Classification Based Association 13

2.2.4 Algoritma Appriori 14

2.2.5 Membuat Association Rule berdasarkan Frequent Itemset

16

2.2.6 Classification based on Predictive Association Rules (CPAR)

17

2.2.6.1 Membuat Rule dalam CPAR 18

2.2.7 Membangun Model Prediksi 18

2.3 Sistem Fuzzy 20

2.3.1 Himpunan Fuzzy 20

2.3.2 Fungsi Keanggotaan 20

2.3.3 Operator Himpunan Fuzzy 21

2.3.4 Fungsi Implikasi 22

2.3.5 Sistem Inferensi Fuzzy (FIS) 23

2.4 Prakiraan / Forecasting 25

2.4.1 Teknik Prakiraan Pemulus Eksponensial 25

2.4.2 Metode Winters 26

2.5 Penelitian terdahulu 28

2.5.1 Perbedaan dari penelitian sebelumnya 30

III METODOLOGI 31

3.1 Kerangka Pemikiran 31

3.2 Tata Laksana 34

3.2.1 Pengumpulan Data 34

3.2.2 Data Yang Digunakan 34

(15)

xii

3.3. Pembuatan Program Aplikasi 38

3.3.1 Data mining 38

3.3.2 Pembentukan Basis Aturan 39

3.3.3 Aplikasi DBD 39

3.3.4 Prediksi Cuaca Menggunakan Metode Winter’s

40

IV PERANCANGAN SISTEM 41

4.1 Gambaran Umum Sistem 41

4.2 Analisa Kebutuhan Sistem 42

4.3 Desain Sistem 42

4.3.1 Tahapan Data mining 42

4.3.2 Tahapan Aplikasi DBD 44

4.4 Antar muka 50

V IMPLEMENTASI SISTEM 51

5.1 Implementasi Sistem 51

5.2 Pembangunan Sistem Data mining 52

5.2.1 Pembentukan Sampel Positif dan Sampel Negatif

52

5.2.2 Pembentukan Basis Aturan / Rule Base 53

5.3 Program Aplikasi 55

5.3.1 Input Sistem 55

5.3.2 Proses Evaluasi Sistem 58

5.3.3 Output Sistem 65

5.3.4 Prediksi DBD Tahun Selanjutnya 66

(16)

xiii

VI PENGUJIAN DAN PEMBAHASAN 68

6.1 Mekanisme Pengujian 68

6.2 Pembentukan Model Dengan Data Training 68

6.3 Pelatihan Dengan Data Testing 72

6.4 Pembahasan 73

6.5 Penerapan Aplikasi DBD Per Kecamatan 74 6.5.1 Pembentukan Model Dengan Data Training 75

6.5.2 Pembahasan 81

6.5 Prediksi DBD Tahun 2007 84

6.6 Implikasi Manajerial 89

VII KESIMPULAN DAN SARAN 92

7.1 7.2 Kesimpulan 92 Saran 93 DAFTAR PUSTAKA 94 LAMPIRAN 96

(17)

xiv DAFTAR GAMBAR

Halaman Gambar 1 Jumlah Kasus DBD Bersumber Survailans Aktif RS per Bulan

di DKI Jakarta, 2001 – 2006 ( s/d 17 mei 2006)

6

Gambar 2 Peningkatan data dalam 2 dekade terakhir (Sumber: Fayyad, Piatetsky-Shapiro dan Smyth, 1996)

7

Gambar 3 Pembuatan Model dalam Datamining (adaptasi dari Berry,MJA and Linoff,GS)

9

Gambar 4 Model Proses Pembuatan Datamining 11

Gambar 5 Langkah – Langkah Membangun Model Prediksi 19 Gambar 6 Fungsi Keanggotaan “USIA” dengan representasi Sigmoid 21

Gambar 7 Fungsi Implikasi MIN 23

Gambar 8 Fungsi implikasi DOT 23

Gambar 9 Data mining, multimodel dan fuzzy Model (adaptasi dari Hirota et al)

29

Gambar 10 Sistem Peringatan Dini Prediksi Meledaknya DBD dan Cara Penanggulannya

32

Gambar 11 Tahapan Penelitian 33

Gambar 12 Arsitektur system Aplikasi DBD 37

Gambar 13 Model Aplikasi DBD 41

Gambar 14 Fuzzifikasi Suhu 46

Gambar 15 Fuzzifikasi Curah Hujan 47

Gambar 16 Fuzzifikasi Penyinaran Matahari 47

Gambar 17 Fuzzifikasi Kelembaban Udara 48

Gambar 18 Antarmuka Aplikasi DBD 50

Gambar 19 Tabel Data Selama 1 Tahun 55

Gambar 20 Grafik Selama 2 Tahun 56

(18)

xv Halaman Gambar 22 Tatalaksana Berdasarkan SOP Dinkes DKI Jakarta 57 Gambar 23 FIS Editor Untuk Data Atribut Cuaca dan Kondisi DBD,

Wilayah Jakarta Selatan

58

Gambar 24 Membership Function Untuk Atribut Suhu 59 Gambar 25 Membership Function Untuk Atribut Curah Hujan 60 Gambar 26 Membership Function Untuk Atribut Matahari 60 Gambar 27 Membership Function Untuk Atribut Kelembaban 61

Gambar 28 Rule Editor Jakarta Selatan 62

Gambar 29 Rule Editor Jakarta Pusat 63

Gambar 30 Rule Viewer Untuk Jakarta Selatan 64

Gambar 31 Rule Viewer Untuk Jakarta Pusat 64

Gambar 32 Tombol Mendapatkan Output dan Input Data 65

Gambar 33 Interface Metode Winter’s 66

Gambar 34 Prediksi Suhu Tahun 2007 Dengan Metode Winter’s 85 Gambar 35 Prediksi Curah Hujan Tahun 2007 Dengan Metode Winter’s 85 Gambar 36 Prediksi Matahari Tahun 2007 Dengan Metode Winter’s 85 Gambar 37 Prediksi Kelembaban Tahun 2007 Dengan Metode Winter’s 86 Gambar 38 Hasil Prediksi DBD Tahun 2006 – 2007 Wilayah Kebayoran

Baru

87

(19)

xvi DAFTAR TABEL

Halaman Tabel 1 Klasifikasi Daerah Berdasarkan Kasus DBD di Suatu

Wilayah

6

Tabel 2 Transaksi Penjualan Barang 15

Tabel 3 Contoh Data Penjualan yang Bersifat Musiman 26 Tabel 4 Contoh Hasil Penerapan Metode Winter’s 28 Tabel 5 Atribut yang Digunakan Dalam Algoritma CPAR 43

Tabel 6 Atribut Cuaca dan Himpunan Fuzzy 45

Tabel 7 Selang Nilai untuk Hasil Output pada Hi mpunan Fuzzy 49

Tabel 8 Input dan Output Aplikasi DBD 50

Tabel 9 Tabel Diskrit Untuk Wilayah Yakarta Selatan 52

Tabel 10 Sampel Data Positif 53

Tabel 11 Sampel Data Negatif 53

Tabel 12 Hasil Pemasukkan Data Untuk Wilayah Jakarta Selatan 54 Tabel 13 Data Survailans DBD Tahun 2005 Minggu 1 - 4 69 Tabel 14 Data Survailans DBD Tahun 2004 Minggu 1 - 4 69 Tabel 15 Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan

Tahun 2005

69

Tabel 16 Data DBD Setelah Dibagi Berdasarkan Jumlah Kecamatan Tahun 2004

69

Tabel 17 Aturan Data Training Dengan GSR 99% 69

Tabel 22 Data Testing Untuk Wilayah Jakarta Selatan 73 Tabel 23 Data DBD Untuk Wilayah Jakarta Selatan 73

(20)

xvii Tabel 24 Data Survailance DBD Tahun 2005 Untuk Kecamatan Wil.

Jak-Pus

76

Tabel 25 Data Survailance DBD Tahun 2005 Untuk Kecamatan Wil. Jak - Sel

76

Tabel 33 Data Cuaca Jakarta Selatan Tahun 2005 84

Tabel 34 Data Cuaca Jakarta Selatan Tahun 2006 84

(21)

xviii DAFTAR LAMPIRAN

Lampiran 1 Cara Perolehan Dan Pengolahan Data 95

Lampiran 2 Data Cuaca dan DBD Wilayah Jakarta Selatan Tahun 2004 97 Lampiran 3 Data Cuaca dan DBD Wilayah Jakarta Selatan Tahun 2005 98 Lampiran 4 Data Cuaca dan DBD Wilayah Jakarta Pusat Tahun 2004 99 Lampiran 5 Data Cuaca dan DBD Wilayah Jakarta Pusat Tahun 2005 100 Lampiran 6 Data Diskrit Cuaca Dan DBD Jakarta Selatan Tahun 2004 101 Lampiran 7 Data Diskrit Cuaca Dan DBD Jakarta Selatan Tahun 2005 102 Lampiran 8 Data Diskrit Cuaca Dan DBD Jakarta Pusat Tahun 2004 103 Lampiran 9 Data Diskrit Cuaca Dan DBD Jakarta Pusat Tahun 2005 104 Lampiran 10 Aturan – Aturan Hasil Datamining Menggunakan Metode

CPAR

105

Lampiran 11 Hasil Prediksi Cuaca Menggunakan Metode Winter’s Tahun 2007

(22)

BAB I

PENDAHULUAN

1. Latar Belakang

Data mining sebagai cabang baru dalam ilmu komputer yang mulai berkembang sejak tahun 1990, saat ini mulai banyak diaplikasikan pada beberapa aspek kehidupan, hal ini di dukung oleh semakin bertambah besarnya data ya ng dikumpulkan pada kegiatan bisnis modern dan kehidupan modern. Akan tetapi sering terjadi data yang dikumpulkan tersebut menjadi tidak berguna, karena tidak semua pihak mengerti dan dapat menggunakan, sehingga data tersebut harus di konversi menjadi informasi dan pengetahuan yang berguna.

Data mining adalah proses dalam mencari berbagai model, kesimpulan dan nilai dari kumpulan data yang diberikan (Kantardzic, 2003). Dalam proses tersebut digunakan berbagai macam alat bantu data analisis yang berasal dari beberapa cabang ilmu pengetahuan seperti statistik, neural network dan lain lain untuk mendapatkan pola dan hubungan dalam data tersebut untuk membuat suatu predeksi yang valid.

Dalam perkembangannya, terdapat 2 tujuan utama dari data mining, prediksi dan

diskripsi. Prediksi menggunakan beberapa variable dari data set yang digunakan untuk memprediksi sesuatu dari variable dari yang dikehendaki, sedangkan deskripsi lebih memfokuskan pada menemukan pola dari suatu data sehingga dapat dengan mudah di interprestasikan oleh penggunanya.

Penelitian di bidang kesehatan dengan mengimplementasikan data mining untuk memprediksi penyebaran suatu penyakit telah banyak di lakukan, antara lain penelitian yang dilakukan oleh Brossette et.al (2000), dimana mereka menerapkan Data mining surveillance system (DMSS) dalam mendeteksi infeksi nosocomial di Amerika dengan menggunakan data dari RS Universitas Alabama di Birmingham selama 15 bulan. DMSS di design untuk menemukan pola – pola yang berguna yang mungkin tidak dapat di temukan oleh sistem tradisional. Metode data mining yang coba di terapkan dalam DMSS adalah association rules. Penelitian lain yang juga mencoba memprediksi tentang penyakit adalah penelitian yang dilakukan oleh Scales dan Embrechts (2003), mereka mencoba

(23)

memprediksi penyakit serangan jantung kardiovaskular. Metode data mining yang coba diterapkan oleh mereka adalah metode artificial neural network dan fuzzy logic analisis, dari penelitian mereka metode ini memberikan hasil yang cukup efektif. Penelitian terakhir dalam bidang kesehatan dengan menggunakan datamining dilakukan oleh Herwanto (2006), dari database pasien diabetes yang dimiliki oleh RS Pertamina, diolah dengan menggunakan datamining, sehingga didapat aturan – aturan yang dapat membantu dalam memprediksi kapan dan pada kondisi apa gula seseorang dapat naik dan mengakibatkan gangguan yang serius.

Demam Berdarah Dengue (DBD), adalah suatu penyakit yang disebabkan oleh nyamuk Aedes Aegypti dan merupakan penyakit yang sangat gampang sekali terjadi di masyarakat. Pengelolaan lingkungan tempat tinggal yang belum seragam dalam penanganannya, juga sangat memungkin terjadi wabah DBD, walaupun lingkungan di sekitar rumah kita telah dikelola dengan baik, hal ini disebabkan karena radius terbang dari nyamuk tersebut ± 100m dari tempat mereka berkembang biak. Selain hal tersebut, pada permasalahan DBD terdapat suatu hipotesa awal tentang keterkaitan antara perindukan nyamuk Aedes aegypti

dengan suhu, curah hujan dan penyinaran matahari.

Datamining dengan berbagai keunggulannya dan berbagai macam metode yang ada, di coba diterapkan pada database Demam Berdarah Dengue (DBD) yang disusun oleh Dinas Kesehatan (DINKES) DKI Jakarta setiap tahun dalam rangka mengantisipasi dan memonitor penyebaran suatu penyakit (Data Surveilans Penyakit Tahun 2004, Dinkes Propinsi DKI Jakarta, 2005). Siklus DBD yang terjadi setiap tahun di DKI Jakarta dengan jumlah kasus yang meningkat setiap tahun, membuat data yang dikumpulkan menjadi semakin membesar, akan tetapi data yang telah di kumpulkan tersebut tidak selalu dapat dimanfaatkan oleh semua pihak, hanya pihak tertentu saja yang dapat memanfaatkan data tersebut secara maksimal. Dengan menerapkan konsep data mining pada database DBD dan data set cuaca, diharapkan dapat ditemukan pola keterkaitan antar variable data, nilai – nilai pengetahuan yang dapat di gali dan pada akhirnya, dapat dirumuskan pola penyebaran dari DBD .

(24)

Secara umum rumusan substansi penelitian ini dapat dinyatakan sebagai berikut : “Apakah konsep data mining yang di dukung dengan system pakar dapat diterapkan dalam database DBD, sehingga di peroleh perumusan pola penyebaran DBD di daerah DKI Jakarta”.

2. Tujuan Penelitian

Tujuan penelitian ini adalah :

a. Menerapkan data mining dengan metode Classification based on Predictive Association Rules (CPAR) pada database DINKES DKI Jakarta untuk menemukan pola dari DBD yang terus berulang dan relasinya dengan faktor – faktor alam seperti suhu, penyinaran matahari , curah hujan dan kelembaban.

b. Merumuskan suatu sistem peringatan dini prediksi meledaknya DBD (selanjutnya di sebut “Aplikasi DBD”) dan cara penanggulangannya, sehingga dapat digunakan oleh semua pihak yang berkepentingan.

3. Ruang Lingkup

Obyek Penelitian di batasi pada :

a. Analisis konsep – konsep data mining pada database DBD, guna mendapatkan pola keterkaitan antar variabel.

b. Merumuskan model pola penyebaran DBD di daerah Jakarta Pusat dan Jakarta Selatan dengan berdasarkan kondisi yang memicu ledakan DBD dengan menerapkan sistem pakar.

c. Data yang digunakan dalam penelitian ini adalah :

- Data primer Kejadian DBD di DKI Jakarta yang meliputi 2 wilayah (Pusat, Selatan) selama tahun 2004 – 2005.

- Data primer suhu, curah hujan dan kelembaban udara di wilayah Jakarta Selatan dan Jakarta Pusat selama tahun 2004 – 2005.

(25)

4. Manfaat Penelitian

Manfaat dari penelitian ini untuk dapat menambah :

a. Dari segi Metodologi : untuk menguji konsep data mining dan metode yang digunakan pada suatu data yang besar dan membantu dalam menemukan pola keterkaitan dari data tersebut.

b. Dari segi Substansi : untuk membantu dalam memprediksi pola penyebaran DBD pada daerah DKI Jakarta, sehingga dapat di ambil suatu tindakan pencegahan agar DBD tersebut tidak meluas penyebarannya dengan menerapkan sistem pakar tata laksana DBD.

(26)

BAB II

TINJAUAN PUSTAKA

2.1. Demam Berdarah Dengue (DBD) 2.1.1. Definisi

Demam Berdarah dengue (DBD) adalah demam virus akut yang ditularkan oleh nyamuk Aedes Aegypti, disertai sakit kepala, nyeri otot, sendi dan tulang, penurunan jumlah sel darah putih dan timbulnya ruam – ruam pada kulit. DBD ini sering pula disertai dengan pembesaran hati serta manifestasi pendarahan dan apabila terjadi kegagalan sirkulasi darah dan pasien terjatuh maka penderita dapat mengalami apa yang disebut dengue shock syndrome (DSS) (DINKES DKI Jakarta, Demam Berdarah Aedes Aegypti, www.dinkesdkijarta.gov).

2.1.2. Penyebab DBD

DBD adalah penyakit pada daerah tropis seperti halnya Indonesia, ditularkan oleh nyamuk Aedes aegypti yang menggigit di siang dan sore hari. Nyamuk ini membawa virus yang terdiri dari 1 diantara 4 serotipe virus yang berbeda antigen. Virus ini termasuk dalam kelompok Flavivirus dan serotipenya adalah DEN-1, DEN-2, DEN-3, DEN-4. Infeksi oleh salah satu jenis serotipe ini akan memberikan kekebalan seumur hidup tetapi tidak menimbulkan kekebalan terhadap serotipe yang lainnya, sehingga seseorang yang hidup dalam daerah endemis DBD dapat mengalami infeksi sebanyak 4 kali dalam hidupnya. Masa tunas virus dengue berkisar 3 – 15 hari. Pada demam dengue (Dengue Fever) permulaan sakit biasanya mendadak. Pada umumnya ditemukan sindrom trias yaitu demam tinggi, nyeri pada anggota badan dan timbulnya ruam pada kulit. Lama demam berkisar 4 – 5 hari. Ruam berupa bercak kemerah-merahan bersifat makulopapular yang hilang pada penekanan. Penderita demam dengue mengalami pembesaran kelenjar getah bening servikal. Beberapa ahli menyebut pembesaran ini sebagai tanda Castelani dan merupakan ciri khas pada demam dengue. Pada demam dengue jarang dijumpai manifestasi perdarahan Faktor resiko penting pada DBD adalah serotipe virus dan faktor penderita seperti umur dan status imunitas.

(27)

2.1.3. Kasus DBD di Wilayah DKI Jakarta

Untuk wilayah DKI Jakarta sejak tahun 2001 sampai dengan 2006 ini, kasus DBD merupakan kasus yang terus menerus terjadi, bahkan sudah bisa disebut sebagai suatu siklus tahunan yang terus berulang, bahkan pada tahun 2004 bulan februari dan maret, terjadi KLB DBD (7072 kasus) untuk wilayah DKI Jakarta secara umum.

Gambar 1. Jumlah Kasus DBD Bersumber Surveilans Aktif RS Per Bulan di DKI Jakarta, 2001 – 2006 (s.d 17 Mei 2006)

Proses pengendalian nyamuk Aedes aegypti sebagai vector pembawa penyakit DBD dilakukan dengan berbagai cara, antara lain : Fogging (penyemprotan di daerah yang posistif atau negative DBD), pemberian abate sebagai cara pengendalian jentik nyamuk, program 3M yang dilakukan secara berkesinambungan diseluruh wilayah DKI Jakarta.

0 1000 2000 3000 4000 5000 6000 7000 8000 KASUS 2001 919 1016 1091 625 907 651 706 511 341 244 232 194 2002 84 386 689 933 1131 879 489 328 207 192 205 227 2003 540 784 1454 2318 2745 2685 1070 474 380 473 471 677 2004 1625 7072 7052 1478 702 573 500 368 281 305 256 428 2005 1172 2484 1625 1236 1469 1347 1385 2524 1903 2147 2624 3537 2006 2470 2433 2876 2981 1310

(28)

Untuk melihat keefektifitasan dan sebagai kontrol dari kegiatan tersebut pihak Dinkes DKI Jakarta mencoba untuk memetakan daerah kecamatan di wilayah DKI Jakarta menjadi 3 bagian berdasarkan laporan survailence tentang kejadian DBD, yaitu :

Tabel 1. Klasifikasi Daerah Berdasarkan Kasus DBD di Suatu Kecamatan

2.2 Data Mining

Dalam 2 dekade ini telah terjadi peningkatan data yang sangat besar dari segala sektor dalam kehidupan sehari-hari. Di estimasikan setiap bulannya terjadi peningkatan data 20x lebih cepat dari bulan sebelumnya (Fayyad, Piatetsky-Shapiro dan Smyth 1996). Hal ini dapat mengakibatkan terjadinya penumpukan data yang berakibat pada kemungkinan tersisihnya data – data penting yang berguna. Data mining atau Knowledge discovery in Database (KDD) mempunyai kemampuan untuk melakukan pencarian dan menemukan data penting yang tersisih tersebut.

Gambar 2. Peningkatan Data Dalam 2 Dekade Terakhir (Sumber : Fayyad, Piatetsky-Shapiro dan Smyth ,1996)

Dalam 1 minggu terjadi 1- 5 kasus DBD KUNING

Dalam 3 minggu berturut-turut tidak terjadi kasus DBD.

HIJAU

Dalam 1 minggu terjadi lebih dari 5 kasus DBD MERAH

KETENTUAN KATEGORI

(29)

Berbagai definisi dari data mining dari beberapa refrensi, adalah sebagai berikut ;

Data mining adalah proses dalam mencari berbagai model, kesimpulan dan nilai dari kumpulan data yang diberikan (Kantardzic, 2003).

Data mining adalah proses menyarikan informasi dari kumpulan – kumpulan data (Brookshear, 2003).

Dari berbagai definisi tersebut, dapat di ambil suatu kesimpulan bahwa data mining berkaita n dengan mencari pola dan relasi yang tersembunyai dalam data yang besar dengan tujuan prediksi atau deskripsi. Terdapat 2 jenis data mining, yaitu directed data mining dan undirected data mining. Directed data mining digunakan jika sudah diketahui secara pasti apa yang akan di prediksi, sehingga proses pencarian pola dan relasi dapat langsung diarahkan pada tujuan tertentu, misalnya untuk membuat prediksi tentang sesuatu yang tidak kita ketahui, model ini sering di sebut model prediksi. Model seperti ini menggunakan pengalaman untuk menentukan nilainya. Salah satu kunci dari model prediksi ini adalah data yang cukup besar dengan hasil yang sudah diketahui, sehingga dapat digunakan dalam melatih model tersebut.

Undirected data mining berkaitan dengan menelusuri pola dan relasi dalam data, pada undirected data mining ini, tujuan yang ingin dicapai adalah bagaimana model yang kita buat dapat memberikan solusi atas persoalan yang kita permodelkan. Dalam prakteknya, data mining sering merupakan gabungan dari keduanya.

Proses dalam data mining adalah suatu proses yang interaktif dan iterative, melibatkan beberapa langkah dengan beberapa pertimbangan yang harus di buat oleh penggunanya. Fayyad, Piatetsky-Shapiro dan Smyth (1996) memberikan beberapa langkah dasar dalam mempersiapkan data mining

1. Mempersiapkan data set : memilih data, atau memfokuskan pada sample data yang akan kita cari pola atau relasinya

2. Membersihkan data dan memproses data

3. Mengurangi data, dalam proses ini menemukan feature yang berguna untuk merepresentasikan data disesuaikan dengan tujuan

(30)

4. Menyesuaikan tujuan dari data mining dengan metode data mining yang ada, seperti clustering, regression, classification, fuzzy

5. Explorasi analisis, model dan hipotesis, dalam proses ini di pilih algoritma, metode yang akan digunakan dalam mencari pola dari suatu data set.

6. Proses Data mining, mencari pola dan relasi dari data set.

7. Interpretasi pola – pola yang di dapat , dalam proses ini proses dapat berulang (iteratif) dari 1 sampai 7. Pada proses ini juga dapat dilengkapi dengan visualisasi dari pola yang didapat.

8. Menggunakan hasil dari pola dan relasi yang ditemukan. Pada proses ini dilakukan pemeriksaan dan perbaikan

Langkah – langkah dasar ini di ilustrasikan pada gambar 3,

Gambar 3 . Pembuatan Model dalam DataMining (adaptasi dari Berry and Linoff)

(31)

2.2.1. Klasifikasi dan Prediksi

Klasifikasi dan prediksi adalah dua bentuk analisis data yang bisa digunakan untuk mengekstrak model dari data yang berisi kelas-kelas atau untuk memprediksi trend data yang akan datang. Klasifikasi memprediksi data dalam bentuk katagori, sedangkan prediksi memodelkan fungsi-fungsi dari nilai yang kontinyu. Klasifikasi data dilakukan dengan dua tahapan. Pada tahap pertama, model dibentuk dengan menentukan kelas-kelas data. Model dibentuk dengan menganalisa database tuples yang dinyatakan dengan atribut.Dalam konteks klasifikasi, data tuples disebut juga disebut Data sample. Data sample ini membentuk training data set yang selanjutnya dianalisa untuk membangun model. Setiap sample yang membentuk training set disebut training sample dan secara acak dipilih dari sample population. Karena label kelas dari setiap training sample telah diketahui, maka tahapan ini disebut juga supervised learning. Supervised learning ini kebalikan dari unsupervised learning, dimana pada

unsupervised learning label kelas dari setiap training sample tidak diketahui. Pada tahap kedua, model digunakan untuk klasifikasi. Pertama, akurasi model prediksi (atau classifier) ditentukan menggunakan data test. Sample ini secara acak dipilih, independent dengan training sample. Akurasi dari model pada

test set adalah prosentase dari sample test set yang diklasifikasikan oleh model dengan benar. Untuk setiap sample test, label kelas yang telah diketehui dibandingkan dengan model kelas prediksi yang telah dilatih untuk sample

tersebut. Jika akurasi dari model bisa diterima, maka model bisa digunakan untuk mengklasifikasikan data tuples dimana label kelasnya tidak diketahui. Misalnya,

classification rule yang telah dihasilkan dari analisis data dari pelanggan yang ada dapat digunakan untuk memprediksi credit rating dari pelanggan baru.

Prediksi bisa dipandang sebagai pembentukan dan penggunaan model untuk menguji kelas dari sample yang tidak berlabel, atau untuk menguji nilai atau rentang nilai dari suatu atribut. Dalam pandangan ini, klasifikasi dan regresi adalah dua jenis masalah prediksi, dimana klasifikasi digunakan untuk memprediksi nilai-nilai diskrit atau nominal, sedangkan regresi digunakan untuk memprediksi nilai-nilai yang kontinyu. Untuk selanjutnya penggunaan istilah

(32)

pengggunaan istilah prediksi untuk memprediksi nilai-nilai yang kontinyu sebagai

prediction (Han & Kamber, 2001).

2.2.2 MetodologiData mining

Ada beberapa konsep yang penting pada data mining. Konsep pertama berkaitan dengan mencari pola di dalam data. Biasanya berupa kumpulan data yang sering muncul. Tetapi secara umum berupa suatu daftar atau pola data yang muncul lebih sering dari yang diharapkan saat dilakukan secara acak. Konsep yang kedua adalah sampling, yang bertujuan untuk memperoleh keterangan mengenai populasi dengan mengamati hanya sebahagian saja dari populasi itu.

Hal lain yang juga penting yang berhubungan dengan data mining adalah validasi model prediksi yang muncul dari algoritma data mining. Model digunakan untuk membuat prediksi tentang suatu record yang menggambarkan keadaan nyata yang baru, dan model terbatas hanya merefleksika n basis data histori dimana model tersebut dibuat. Model adalah deskripsi dari data historis dimana model tersebut dibangun untuk bisa diterapkan ke data baru dengan tujuan membuat prediksi tentang nilai-nilai yang terputus atau untuk membuat pernyataan tentang nilai yang diharapkan, sedangkan Pola adalah suatu kejadian atau kombinasi kejadian dalam suatu basis data yang terjadi atau muncul lebih sering dari yang diharapkan (Berson et al., 2001).

Gambar proses pembuatan datamining dengan menggunakan konsep Berson et al

disajikan dalam gambar berikut ini

Data Historis Model Pembuatan Model Record Prediksi 1 4 3

Gambar 4. Model proses pembuatan data mining Sumber: Berson, 2001.

(33)

2.2.3. Teknik Data mining

Ada tiga hal pokok yang harus diperhatikan untuk keberhasilan penerapan

data mining, yaitu; teknik data mining, data itu sendiri, dan model data. Teknik adalah pendekatan umum untuk memecahkan masalah, dan biasanya terdapat banyak cara yang bisa digunakan. Masing-masing cara mempunyai algoritma nya sendiri-sendiri. Istilah teknik digunakan untuk menunjukkan pendekatan konseptual untuk menyaring informasi dari data. Algoritma menunjukkan detil tahap demi tahap dari cara tertentu untuk mengimplementasikan suatu teknik.

Data mining bisa berupa predictive atau descriptive. Perbedaan ini menunjukkan tujuan dari penggunaan data mining. Tujuan utama predictive data mining adalah mengotomatisasikan proses pembuatan keputusan dengan membuat model yang punya kemampuan untuk melakukan prediksi atau mengestimasi suatu nilai. Umumnya hasil dalam predictive data mining akan langsung ditindak lanjuti Sehingga tolok ukur yang paling penting pada model adalah akurasinya.

Data mining sering juga bersifat descriptive. Tujuan utama descriptive data mining adalah untuk menggali pola yang ada di dalam data. Descriptive data mining sering menghasilkan action, tetapi bukan berupa urutan aksi yang bisa diotomatisasikan secara langsung dari hasil model (Berry & Linoff, 2000).

Descriptive mining, yaitu proses untuk menemukan karakteristik penting dari data dalam suatu basis data. Clustering, Association, dan Sequential mining

adalah beberapa contoh dari teknik descriptive mining.

Predictive mining, yaitu proses untuk menemukan pola dari data untuk membuat prediksi. Classification, Regression dan Deviation adalah teknik dalam

predictive mining.

2.2.3.1 Association Rule

Association rule merupakan salah satu teknik data mining yang paling banyak digunakan dalam penelusuran pola pada sistem pembelajaran

unsupervised. Metodologi ini akan mengambil seluruh kemungkinan pola-pola yang diamati dalam basis data. Association rule menjelaskan kejadian-kejadian yang sering muncul dalam suatu kelompok. Misalnya metodologi ini bisa digunakan untuk menganalisa produk-produk mana saja yang sering dibeli oleh

(34)

seorang pelanggan secara bersamaan (analisa keranjang belanja). Hasil analisis tersebut bisa digunakan untuk menentukan peletakan produk di toko.

Satu itemset adalah himpunan bagian A dari semua kemungkinan item I. Satu itemset yang mengandung i item disebut i-itemset. Prosentase transaksi yang mengandung itemset disebut support. Untuk suatu itemset yang akan diamati, support-nya harus lebih besar atau sama dengan nilai yang dinyatakan oleh user, sehingga itemset tersebut dikatakan sering muncul (frequent).

Bentuk umum aturan asosiasi adalah A1,A2,…,An → B1,B2,…,Bm, yang berarti jika item Ai muncul, item Bj juga muncul dengan peluang tertentu.

Misalkan X adalah itemset. transaksi T dikatakan mengandung X jika dan hanya jika X ⊆ T. Aturan X ⇒ Y menyatakan himpunan basis data transaksi dengan tingkat kepercayaan (confidence) C, jika C% dari transaksi dalam D yang mengandung X juga mengandung Y. Rule X ⇒ Y mempunyai support dalam transaksi set D jika S% dari transaksi dalam basis data berisi X ∪ Y. Tingkat kepercayaan menunjukkan kekuatan implikasi, dan support menunjukkan seringnya pola terjadi dalam rule. Sebagai contoh diberikan aturan : A, B ⇒ C dengan S = 0.01 dan C = 0.8. Hal ini berarti bahwa 80% dari semua pelanggan yang membeli A dan B juga membeli C, dan 1% dari semua pelanggan membeli ketiga item tersebut.

Miningassociation rule dilakukan dalam dua tahap, yaitu

1. Mencari semua association rule yang mempunyai minimum support Smin

dan minimum confidence Cmin. Itemset dikatakan sering muncul (frequent)

jika Support(A) ≥ Smin.

2. Menggunakan itemset yang besar untuk menentukan association rule

untuk basis data yang mempunyai tingkat kepercayaan C di atas nilai minimum yang telah ditentukan (Cmin.).

2.2.3.2 Classification-Based Association

Saat ini, salah satu teknik data mining telah dikembangkan adalah dengan menerapkan konsep association rule mining dalam masalah klasifikasi. Ada beberapa metode yang bisa digunakan, antara lain association rule clustering system (ARCS) dan associative classification (Han & Kamber, 2001). Metode

(35)

ARCS melakukan association rule mining didasarkan pada clustering kemudian menggunakan aturan yang dihasilkan untuk klasifikasi. ARCS, melakukan

association rule mining dalam bentuk Aquant1 ∧ Aquant2 ⇒ Acat, dimana bentuk

Aquant1 dan Aquant2 adalah data test yang atributnya punya rentang nilai, Acat

menunjukkan label kelas untuk atribut kategori yang diberikan dari training data. Metode associative classification mining menghasilkan aturan dalam bentuk

condset ⇒y, dimana condset adalah sekumpulan item dan y adalah label kelas. Aturan yang sesuai dengan minimum support tertentu disebut frequent. Rule

mempunyai support s jika s% dari sample dalam data set yang mengandung

condset dan memiliki kelas y. Aturan yang sesuai dengan minimum confidence

disebut accurate. Aturan mempunyai confidence c jika c% dari sample dalam data set yang mengandung condset memiliki kelas y. Jika beberapa rule mempunyai

condset yang sama, maka rule dengan confidence tertinggi dipilih sebagai

possible rule (PR). Metode associative classification mining menggunakan algoritma association rule, seperti algoritma Appriori untuk menghasilkan

association rule, kemudian memilih sekelompok aturan yang mempunyai kualitas tinggi dan menggunakan aturan tersebut untuk memprediksi data. Associative classification masih kurang efisien karena seringkali menghasilkan aturan dalam jumlah yang besar (Yin & Han, 2003).

Metode classification-based association lainnya adalah CPAR (Classification based on Predictive Association Rule). Algoritma ini mengambil ide dari FOIL (First Order Inductive Leaner) dalam menghasilkan aturan dan mengintegrasikannya dengan associative classification.

2.2.4. Algoritma Appriori

Algoritma apriori menghitung seringnya itemset muncul dalam basis data melalui beberapa iterasi. Setiap iterasi mempunyai dua tahapan; menentukan kandidat dan memilih serta menghitung kandidat. Pada tahap pertama iterasi pertama, himpunan yang dihasilkan dari kandidat itemset berisi seluruh 1-itemset, yaitu seluruh item dalam basis data. Pada tahap kedua, algoritma ini menghitung

support-nya mencari melalui keseluruhan basis data Pada akhirnya hanya

(36)

(frequent). Sehingga setelah iterasi pertama, seluruh i-itemset yang sering muncul akan diketahui. Pada iterasi kedua, algoritma appriori mengurangi sekelompok kandidat itemset yang dihasilkan dari iterasi pertama dengan menghapus kandidat

itemset yang tidak sering muncul. Penghapusan ini berdasarkan pengamatan yaitu apakah itemset tersebut sering muncul atau tidak.

1. k = 1

2. C1 = I (semua item) 3. While Ck > 0

( a ). Sk = Ck

( b ).Ck + 1 = Semua himpunan dengan k=1 elemen yang terbentuk

dengan menggabungkan dua itemset dalam sk

( c ). Ck + 1 = Ck + 1 ( d ). S = S + Sk ( e ). k + + 4. return S

Tabel 2. Transaksi Penjualan Barang

A B C D E

Pelanggan 1 1 0 1 1 0

Misalkan pada tabel 2, akan dicari seluruh itemset dengan minimal support

Smin = 50%. Sehingga itemset dianggap sering muncul jika ia terdapat pada paling

tidak di 50% transaksi. Dalam setiap iterasi, algoritma appriori membentuk kandidat set, menghitung jumlah kejadian dari setiap kandidat dan memilih

itemset didasarkan pada minimum support yang telah ditentukan sebelumnya yaitu 50%.

Pada tahap pertama iterasi pertama, semua item adalah kandidat. Algoritma

appriori hanya menelusuri semua transaksi dalam basis data dan membuat daftar kandidat, yaitu ;

C1 = [ (A), (B), (C), (D), (E) ] L1 = [ (A), (B), (C), (D), (E) ]

(37)

Pada tahap berikutnya , algoritma appriori menghitung terjadinya setiap kandidat dan berdasarkan nilai minimumsupport Smin, kemudian menentukan itemset yang

sering muncul, setelah tahap ini kandidat berisi: L1 = [(A),(B), (C), (E) ]

D dikeluarkan karena nilai S = 25%, hanya ada satu transaksi dari keseluruhan empat transaksi..

Untuk menelusuri himpunan 2-itemset, karena himpunan bagian (subset) dari

2-itemset juga mempunyai minimum support yang sama, algoritma appriori

menggunakan L1 * L1 untuk membuat kandidat. Operasi * didefinisikan sebagai berikut ;

Lk * Lk = [X U Y dimana X,Y Ε Lk, (X∩Y=K-1 ), Untuk k =1 ⇒ |L1| . |(L1)-1)/2| = 4 . 3/2 = 6

Pada iterasi kedua kandidat berisi :

C2 = [ (A,B), (A,C), (A,E), (B,C), (B,E), (C,E) ].

Pada tahap berikutnya , algoritma appriori menghitung terjadinya setiap kandidat dan berdasarkan nilai minimumsupport Smin, kemudian menentukan itemset yang

sering muncul, setelah tahap ini kandidat berisi: L2 = [ (A,C), (B,C), (B,E), (C,E) ]

Himpunan 3-itemset dihasilkan dari S2 menggunakan operasi yang sudah ditentukan sebelumnya L2 * L2. Langkah praktisnya, dari L2 dengan item yang pertama sama, yaitu (B,C), (B,E),dinyatakan pertama. Kemudian algoritma

appriori akan mencek apakah 2-itemset (C,E), yang berisi item kedua dari (B,C), (B,E) terdapat pada L2 atau tidak. Karena (C,E) ada dalam L2, maka ( B,C,E ) menjadi kandidat 3-itemset.

Karena tidak ada kandidat 4-itemset, maka algoritma ini berakhir.

2.2.5. Membuat Association Rule berdasarkan Frequent Itemset

Tahap kedua dalam penelusuran assosiation rule didasarkan pada seluruh

i-itemset yang sering muncul, yang didapat dari tahap pertama. Untuk rule yang mengandung X1, X2, X3 → X4, rule tersebut dianggap bermakna jika kedua

itemset tersebut X1, X2, X3, X4 dan X1, X2, X3 adalah frequent. Sehingga tingkat kepercayaan C dari rule tersebut dihitung sebagai hasil bagi dari support itemset, yaitu :

(38)

C = S(X1, X2, X3, X4) / S(X1, X2, X3).

Strong association rule adalah rule dengan tingkat kepercayaan C diatas Smin.

Misalkan dari tabel 1 akan dicek apakah association rule (B,C) → E adalah strong rule.

Pertama harus dipilih hubungan support dari tabel L2 dan L3. S(B,C) = 2, S(B,C,E) = 2

C((B,C) → E ) = S(B,C,E)/S(B,C) = 2/2 = 1 (100%)

Karena tingkat kepercayaan adalah maksimal, maka jika transaksi berisi item B dan C maka transaksi tersebut juga berisi item E.

2.2.6. Classification based on Predictive Association Rules (CPAR)

Klasifikasi pada penelitian ini menggunakan association rule, menurut Yin X, Han J, 2003, algoritma yang efektif untuk digunakan dalam masalah klasifikasi adalah CPAR. Pada algoritma ini klasifikasi diimplementasikan dalam tiga tahap:

rule generation, rule evaluation dan classification.

Pada proses rule generation, CPAR membangun rule dengan menambahkan literal satu persatu. Pada setiap tahapan proses, CPAR menghitung

Gain dari setiap perhitungan. Setelah masing-masing sampel diproses untuk mendapatkan rule, sampel ini digunakan kembali didalam perhitungan Gain tetapi dengan mengurangi bobot dengan decay factor. Bobot sampel dikurangi hingga mencapai nilai minimum yang dihitung oleh parameter w yaitu bobot seluruh sampel positif. Bobot seluruh contoh pada awal proses diset 1.

Setelah proses rule generation, CPAR mengevaluasi setiap rule untuk menentukan kekuatan prediksinya. Untuk rule r = p1 ∧ p2 ... ∧ pn → c, CPAR

mendefinisikan ekspektasi akurasi sebagai sebagai berikut :

L.A = (nc+1) / (ntotal + f)

Dimana L.A adalah Laplace Accuracy, f adalah jumlah kelas, ntotal adalah juimlah

total sampel yang memenuhi body dari aturan, nc adalah jumlah sampel yang

memenuhi kelas c.

Klasifikasi berupa sekumpulan rule untuk setiap class, CPAR menggunakan s rules terbaik setiap kelas, yang dipilih berdasarkan Laplace accuracy.

(39)

Pada algoritmna CPAR nilai gain yang dipilih adalah nilai gain yang terbaik pada setiap iterasinya, sehingga untuk atribut yang nilai gain-nya hampir sama, maka CPAR melakukan pemilihan yang terbaik. Pemilihan atribut tersebut dilakukan dengan menghitung dan menerapkan gain similarity ratio. Semua atribut dengan nilai gain lebih besar dari best Gain x gain similarity ratio akan dipilih dan diproses lebih lanjut

2.2.6.1 Membuat Rule Dalam CPAR

Dalam datamining, setiap aturan di-bangun dari dataset yang tersisa, CPAR hanya memilih literal yang terbaik dan mengabaikan seluruh literal lainnya. CPAR membuat rules dengan menambahkan literal satu per satu. Setelah CPAR menemukan literal terbaik p, literal lainnya misalnya q yang Gain-nya mirip dengan p (misalnya hanya berbeda 1%) akan dicari. Selain terus membangun rule

dengan menambahkan p ke r, q juga ditambahkan ke current rule r untuk membuat rule baru r’

2.2.7 Membangun Model Prediksi

Keberhasilan dalam membangun model prediksi dalam datamining lebih banyak tergantung pada proses bukan pada teknik yang digunakan, dan proses tersebut sangat tergantung pada data yang digunakan untuk menghasilkan model .Tantangan utama dalam membangun model prediksi adalah mengumpulkan data awal yang cukup dalam membangun suatu aturan - aturan. Dalam preclassified, hasilnya sudah diketahui, dan karenanya preclassified digunakan untuk melatih model, himpunan data tersebut disebut model set.

Berry & Linoff memberikan langkah-langkah dasar dalam membangun model prediksi

1. Model dilatih menggunakan preclassified data, dengan mengambil sebagian data dari dataset yang disebut training set. Pada tahap ini, algoritma data mining mencari pola-pola dari nilai yang diprediksi.

2. Model diperbaiki menggunakan himpunan bagian lain dari data yang disebut

test set. Model perlu diperbaiki agar tidak hanya bisa bekerja pada training set.

(40)

3. Performance model diestimasi atau membandingkan performance beberapa model, dengan menggunakan himpunan data ketiga, yang didapat dari gabungan himpunan data pertama dan kedua, yang disebut evaluation set. 4. Model diterapkan ke score set. Score set bukan preclassified, dan bukan

bagian dari model set. Hasil dari data tersebut tidak diketahui. Predictive score

akan digunakan untuk membuat keputusan.

Dataset adalah preclassified data yang digunakan untuk membangun model. Dataset perlu dipecah ke dalam tiga komponan, training set, test set dan

evaluation set.

Gambar 5 menggambarkan langkah-langkah dasar dalam membangun model prediksi (Berry & Linoff, 2000)

Training Set Test Set Evaluation Set Score Set Model (Kasar) Model (Perbaikan) Model (terbaik) Prediksi Training set digunakan untuk membangun model

Test set digunakan untuk memperbaiki model

Evaluation set digunakan untuk menilai akurasi yang diharapkan dari model saat diterapkan ke data di luar model set

Model yang terbaik diterapkan ke score set

untuk menghasilkan prediksi

Gambar 5. Langkah-langkah membangun model prediksi Sumber: Berry & Linoff, 2000

(41)

2.3 Sistem Fuzzy

Sistem fuzzy pertama kali diperkenalkan oleh Prof. L. A. Zadeh dari Barkelay pada tahun 1965. Sistem fuzzy merupakan penduga numerik yang terstruktur dan dinamis. Sistem ini mempunyai kemampuan untuk mengembangkan sistem intelijen dalam lingkungan yang tak pasti. Sistem ini menduga suatu fungsi dengan logika fuzzy. Dalam logika fuzzy terdapat beberapa proses yaitu penentuan himpunan fuzzy, penerapan aturan IF-THEN dan proses inferensi fuzzy (Marimin, 2002).

2.3.1. Himpunan Fuzzy

Ada beberapa hal yang perlu diketahui dalam memahami sistem fuzzy yaitu, [Kusumadewi] variabel fuzzy, himpunan fuzzy, semesta pembicaraan dan domain. Variabel Fuzzy merupakan variabel yang akan dibahas dalam sistem fuzzy misalnya umur, temperatur, permintaan, dsb. Himpunan Fuzzy merupakan suatu group yang mewakili suatu kondisi tertentu dalam variabel fuzzy misalnya variabel umur dibagi atas 3 himpunan fuzzy yaitu muda, parobaya dan tua. Semesta Pembicaraan adalah keseluruhan nilai ya ng diperbolehkan untuk dioperasikan dalam suatu variabel fuzzy misalnya semesta pembicaraan variabel umur adalah 0 sampai 100. Domain adalah keseluruhan nilai yang diijinkan dalam semesta pembicaraan dan boleh dioperasikan dalam himpunan fuzzy misalnya domain umur muda 20 – 45, domain parobaya 25 – 65 dan domain tua 45 – 70.

2.3.2. Fungsi Keanggotaan

Fungsi keanggotaan (membership function) adalah kurva yang menunjukkan pemetaan titik input data ke dalam nilai keanggotaan yang mempunyai interval 0 – 1. Ada beberapa fungsi keanggotaan yang digunakan antara lain representasi kurva sigmoid, trapesoid dan triangular. Contoh representasi fungsi keanggotaan sigmoid disajikan pada gambar 6.

(42)

Gambar 6 : Fungsi Keanggotaan ”USIA” dengan representasi Sigmoid.

2.3.3. Operator Himpunan Fuzzy

Seperti himpunan biasa, ada beberapa operasi yang didefinisikan secara khusus untuk mengkombinasikan himpunan fuzzy. Ada 3 operator dasar yang diciptakan Zadeh yaitu operator AND, OR dan NOT. Nilai keanggotaan baru sebagai hasil dari operasi 2 himpunan disebut α -predikat.

Operator AND merupakan operasi interseksi pada himpunan. α -predikat yang dihasilkan diperoleh dengan mengambil nilai keanggotaan terkecil antar elemen pada himpunan bersangkutan. Misal nilai keanggotaan umur 27 pada himpunan muda adalah µMUDA[27] = 0,6 dan nilai keanggotaan 2 juta pada himpunan penghasilan TINGGI adalah µGAJITINGGI[2juta]= 0,8, maka α -predikat untuk usia MUDA dan berpenghasilan TINGGI adalah nilai keanggotaan minimun :

µMUDA∩GAJITINGGI = min(µMUDA[27], µGAJITINGGI[2juta]) = min (0,6 ; 0,8)

= 0,6

Operator OR merupakan operasi union pada himpunan. α -predikat yang dihasilkan diperoleh dengan mengambil nilai keanggotaan terbesar antar elemen pada himpunan bersangkutan. Misal nilai keanggotaan umur 27 pada himp unan muda adalah µMUDA[27]= 0,6 dan nilai keanggotaan 2 juta pada himpunan penghasilan TINGGI adalah µGAJITINGGI[2juta]= 0,8, maka α -predikat untuk usia MUDA atau berpenghasilan TINGGI adalah nilai keanggotaan maksimum :

(43)

= max (0,6 ; 0,8) = 0,8

Operator NOT merupakan operasi komplemen pada himpunan. α -predikat yang dihasilkan diperoleh dengan mengurangkan nilai keanggotaan elemen pada himpunan dari 1. Misal nilai keanggotaan umur 27 pada himpunan muda adalah

µMUDA[27]= 0,6 maka α -predikat untuk usia TIDAK MUDA adalah : µMUDA’[27] = 1 - µMUDA[27

= 1 - 0,6 = 0,4

2.3.4. Fungsi Implikasi

Tiap aturan (proposisi) pada basis pengetahua n fuzzy akan berhubungan dengan suatu relasi fuzzy. Bentuk umum aturan yang digunakan dalam fungsi implikasi adalah :

IF x is A THEN y is B

x dan y adalah skalar sedang A dan B adalah himpunan fuzzy. Proposisi yang mengikuti IF disebut anteseden, sedangkan proposisi yang mengikuti THEN disebut konsekuen. Secara umum ada 2 fungsi implikasi yaitu fungsi implikasi Min (minimum) dan fungsi implikasi DOT (product).

Misal bentuk aturan sebagai berikut :

[R1] IF Permintaan NAIK AND Stok SEDIKIT THEN Produksi TINGGI

Nilai keanggotaan Permintaan 8.000 pada himpunan Permintaan NAIK adalah

µNAIK[8.000]= 0,7 dan nilai keanggotaan Stok 10.000 pada himpunan Stok SEDIKIT adalah µSEDIKIT[10.000]= 0,9 maka fungsi implikasi untuk Produksi TINGGI adalah perpotongan nilai keanggotaan minimum sehingga nilai keanggotaan Produksi TINGGI adalah µTINGGI=0,7.

Aplikasi Fungsi implikasi Min (minimum) memotong output diilustrasikan pada gambar 7.

(44)

Gambar 7 : Fungsi implikasi MIN

Aplikasi Fungsi implikasi DOT (product) akan menskala output disajikan pada gambar 8.

Gambar 8 : Fungsi implikasi DOT

2.3.5 Sistem Inferensi Fuzzy (SIF)

Ada beberapa metode untuk merepresentasikan hasil logika fuzzy yaitu metode Tsukamoto, Mamdani dan Sugeno.

Pada metode Tsukamoto, setiap konsekuen direpresentasikan dengan himpunan fuzzy dengan fungsi keanggotaan monoton. Output hasil inferensi masing-masing aturan adalah z, berupa himpunan biasa (crisp) yang ditetapkan berdasarkan α -predikatnya. Hasil akhir diperoleh dengan menggunakan rata-rata terbobotnya.

α 1z1 + α 2z2 z = –––––––––––– α 2 + α 2

Pada metode Mamdani, aplikasi fungsi implikasi menggunakan MIN, sedang komposisi aturan menggunakan metode MAX. Metode Mamdani dikenal juga dengan metode MAX-MIN. Inferensi output yang dihasilkan berupa bilangan fuzzy maka harus ditentukan suatu nilai crisp tertentu sebagai output. Proses ini dikenal dengan defuzzifikasi. Ada beberapa metoda yang dipakai dalam defuzzifikasi antara lain metode centroid. Pada metode ini penetapan nilai crisp dengan cara mengambil titik pusat daerah fuzzy.

(45)

Metode Sugeno mirip dengan metode Mamdani, hanya output (konsekuen) tidak berupa himpunan fuzzy, melainkan berupa konstanta atau persamaan liniar. Ada dua model metode Sugeno yaitu model fuzzy Sugeno orde nol dan model fuzzy Sugeno orde satu.

Bentuk umum model fuzzy Sugeno orde nol adalah :

IF (x1 is A1) o (x2 is A2) o ….. o (xn is An) THEN z = k

Bentuk umum model fuzzy Sugeno orde satu adalah :

IF (x1 is A1) o (x2 is A2) o ….. o (xn is An) THEN z = p1* x1 + … pn* xn + q

Defuzzifikasi pada metode Sugeno dilakukan dengan mencari nilai rata-ratanya. Contoh aplikasi fuzzy pada datamining adalah pada penyelesaian masalah pemilihan pakaian berikut ini ;

Diasumsikan faktor utama dalam pemilihan pakaian adalah sebagai berikut f1 = style, f2 = qualitas, f3 = harga, sehingga F = {f1,f2,f3}. Tingkatan umum yang

digunakan pada seleksi adalah e1 = sangat baik , e2 = baik , e3 = sedang , e4 =

buruk, sehingga E = {e1,e2,e3,e4}. Untuk tiap-tiap potong pakaian “u”, faktor

penentu evaluasi adalah didapat dari hasil survey. Sebagai contoh, jika hasil survey menunjukkan “style” faktor f1 = 60% untuk sangat baik, 20% untuk baik,

10% untuk sedang, 10% untuk buruk, sehingga faktor penentu evaluasi mempunyai vektor R1(u) :

R1(u) = { 0.6, 0.2, 0.1, 0.1}

Secara umum, kita dapat membuat faktor penentu evaluasi untuk vektor f2 dan f3 R2(u) = { 0.1,0.5, 0.3, 0.1 }

R3(u) = { 0.1, 0.3, 0.4, 0.2}

Sehingga berdasar hal diatas kita dapat membuat matrix evaluasi

          ) ( 3 ) ( 2 ) ( 1 u R u R u R =           0.2 0.4 0.3 0.1 0.1 0.3 0.5 0.1 0.1 0.1 0.2 0.6

(46)

Jika weight vector dari pembeli adalah W(u) = { 0.4, 0.4, 0.2 }

Perkalian dari matrix W(u) dan R(u) adalah berdasarkan komposisi max – min fuzzy rules, dimana hasil evaluasi adalah digambarkan dalam fuzzy set D(u) = [ d1,d2,d3,d4] :

D(u) = W(u)

.

R(u) = [0.4 0.4 0.2]

.

          0.2 0.4 0.3 0.1 0.1 0.3 0.5 0.1 0.1 0.1 0.2 0.6 = [0.4 0.4 0.3 0.2] Dimana, d1 dihitung berdasarkan langkah-langkah berikut :

d1 = (w1 ´ r11) V (w2 ´ r21) V (w3 ´ r31)

= (0.4 ´ 0.6 ) V(0.4 ´ 0.1) V (0.2 ´ 0.1) = 0.4 V 0.1 V 0.1

= 0.4

Nilai untuk d2 , d3 , d4 hampir sama, dimana ´ dan V merepresentasikan operator

min dan max. Karena komponen terbesar D(u) adalah d1 = 0.4 dan d2 = 0.4 di saat

yang sama, sehingga analisa untuk pakaian ini berada diantara „sangat baik“ dan „baik“

2.4. Prakiraan / Forecasting

2.4.1 Teknik Prakiraan Pemulusan Ekspo nensial

Teknik ini pertama kali diperkenalkan pada tahun 1970 oleh George E P Box dan Gwilym M Jenkins dalam bukunya ” Time Series Analysis : Forecasting and Control”. Dasar dari teknik ini adalah , Pengamatan sekarang (Zt) tergantung pada 1 atau beberapa pengamatan sebelumnya (Zt-k) dengan kata lain, model time series dibuat karena secara statistik ada korelasi antar deret pengamatan untuk melihat adanya dependensi antar pengamatan . Kita dapat melakukan uji korelasi antar pengamatan yang dikenal sebagai auto correlation function (acf)

(47)

2.4.2 Metode Winters

Teknik prakiraan dengan metode Winters digunakan untuk data yang mempunyai pola musiman dan kecenderungan. Sebagai contoh pola data yang bersifat musiman dan kecenderungan dapat dilihat pada tabel 3 . Data pada tabel 3 menunjukkan pola musiman kuartalan, dalam pengertian pola data antar kuartal untuk tahun yang berbeda mempunyai pola yang sama dengan periode yang tetap, yaitu selang 3 bulanan. Karena pola 3 bulanan, maka dalam 1 (satu) tahun terdapat 4 musim atau dalam hal ini dinotasikan dengan L = 4

Tabel 3. Contoh data penjualan yang bersifat musiman

Tahun Kuartal Periode

( t ) Penjualan ( Xt) 1987 I II III IV 1 2 3 4 36 39 43 34 1988 I II III IV 5 6 7 8 38 41 50 39 1989 I II III IV 9 10 11 12 47 51 58 47

Metode Winters didasarkan atas 3 persamaan pemulusa, yaitu untuk pola data stationer (St), kecenderungan (bt) dan indeks musiman (It).

St = ? Xt / It-L + (1 – ? )(St-1 + bt -1) ………(a)

bt = ß(St - St-1 ) + (1 – ß ) bt-1 ……….(b)

It = d Xt / St + (1- d ) It-L ………....(c)

Prakiraan untuk m periode mendatang dirumuskan sebagai berikut F t+m = (St + b t.m) I t -L + m ………..(d)

Untuk melakukan prakiraan dengan metode Winters harus tersedia data histories minimal 2 tahun, hal ini karena kalau data yang tersedia hanya 1 tahun,

(48)

maka factor kecenderungan untuk kuartal tertentu tidak dapat diketahui. Kecenderungan pada kuartal tertentu hanya dapat diketahui apabila tersedia data, misalnya kuartal I tahun 1987 dan kuartal I tahun 1998.

Insilisasi diperlukan dalam menggunakan teknik Winters ini, hal ini dapat dijelaskan sebagai berikut, misalkan untuk melakukan prakiraan pada periode ke-5 (dengan m = 1), maka dari persamaan (d) diperlukan nilai S5 dari rumus (a)

diperlukan nilai I0. Nilai I0 belum terdefinisi, untuk data pola musiman kuartalan

seperti tabel 3 (L = 4), inisialisasi minimal diperlukan untuk menetapkan : a. Nilai indeks musiman pada setiap kuartal pada tahun pertama

b. Factor kecenderungan kuartal terakhir pada tahun pertama ( b4 atau b awal), dan

c. Nilai S 4 (atau S awal)

Insialisasi indeks musiman pada tahun pertama ditetapkan dengan rumusan sebagai berikut :

It = Xt / X ……….untuk setiap t = 1,2,3…L, dimana

X = ? X i / L

Insialisasi b awal untuk data histories yang tersedia sebanyak 2L, ditetapkan

dengan rumusan sebagai berikut :

b awal = 1/L {(X L+1 – X1)/L + ( X L+2 – X2 )/L + …+(X L+L – XL)/L}

Inisialisasi untuk S awal ditetapkan dengan menggunakan rumusan sebagai berikut :

? Xt + 3L 2 b awal – 2 b awal . ? t . I t

S awal = ---

2 L

Nilai inisialisasi akan menentukan ukuran kecermatan prakiraan dan demikian juga dengan nilai parameter ?, ß, dan d.

Sebagai contoh misalkan untuk data pada tabel 3, parameter pemulus yang digunakan adalah ? = 0.2, ß = 0.1 dan d = 0.05 dan sebagai himpunan periode / data uji adalah periode t = 6 s/d t = 12. Dengan menggunakan parameter m = 1, maka hasil perhitungan dapat dilihat pada tabel 4.

Jika dilakukan prakiraan untuk periode ke 13 atau kuartal I tahun 1990, dengan m=1 , berarti periode dasarnya adalah t = 12, sehingga :