Aplikasi Identifikasi Penyebab Kematian Pada Penelitian Cirai UPK-FK UNPAD

(1)

SKRIPSI

Diajukan untuk Menempuh Ujian Akhir Sarjana

Program Strata Satu Jurusan Teknik Informatika

Fakultas Teknik dan Ilmu Komputer

Universitas Komputer Indonesia

TRI MULYANI

10109799

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK DAN ILMU KOMPUTER

(2)

i Oleh Tri Mulyani

10109799

Sepeti penelitian pada umumnya, penelitian CIRAI juga mempunyai kegiatan utama berupa pengumpulan data penelitian. Pengolahan data penelitian yang komplek seperti data kematian membutuhkan sebuah aplikasi yang mampu mengelola data penelitian dari proses input data sampai penyajian informasi yang dibutuhkan. Data kematian yang diolah disini merupakan data otopsi verbal dengan acuan data korespondensi ICD 10. Salah satu teknik yang dapat digunakan untuk melakukan proses penyajian informasi data hasil penelitian adalah data mining. Dimana data mining dapat menggali pengetahuan atau knowledge dalam data. Teknik data mining yang dipakai dalam aplikasi identifikasi penyebab kematian disini adalah classification dengan decision tree. Teknik ini melakukan proses pencarian model atau fungsi yang menjelaskan atau membedakan konsep atau kelas dari suatu objek yang belum diketahui labelnya.

Dengan adanya aplikasi identifikasi penyuebab kematian ini dapat membantu pihak penelitian dalam mengelola data penelitian dan menghasilkan informasi identifikasi penyebab kematian dari hasil data penelitian. Aplikasi ini berguna baik dari pihak entri data untuk mengelola data penelitian (input, edit dan delete) maupun dari pihak manajer data untuk mengidentifikasi penyebab kematian untuk proses penelitian selanjutnya dari data hasil penelitian yang diinputkan oleh pihak entri data.

(3)

ii by

Tri Mulyani 10109799

As research in general, CIRAI research also has major activities in the form of gathering research data. Processing of complex research data such as mortality data requires an application that is able to manage research data from the data input process until the presentation of information needed. Mortality data are processed here is a verbal autopsy data with reference data corresponding ICD10 as reference. One technique that can be used to make the process of presenting data information is data mining. Which is data mining can discover knowledge in the data. Data mining techniques used in the identification of the cause of death application here is the classification with decision tree. These techniques make the search process or model that explains the functions or classes or distinguishes the concept of an unknown object label.

With this cause of death identification application can help the research in managing research data and produce information identifying the cause of death from the results of the research data. This application is useful both from the data entry for managing research data (input, edit and delete) as well as from the data manager to identify the cause of death for the further study of the research results of the input data by the data entry.

(4)

iii

Puji syukur kehadirat Allah SWT, karena atas berkat rahmat, taufik dan hidayah-Nya penulis dapat menyelesaikan laporan tugas akhir dengan baik. Tugas akhir dengan judul “APLIKASI IDENTIFIKASI PENYEBAB KEMATIAN PADA PENELITIAN CIRAI UPK - FK UNPAD” _{ini diajukan untuk} memenuhi salah satu syarat kelulusan program Sarjana Jurusan Teknik Informatika Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia.

Pada kesempatan ini dengan segala kerendahan hati, penulis ingin menyampaikan ucapan terima kasih yang sebesar-besarnya atas kerja sama, bantuan dan dorongan banyak pihak terutama kepada :

1. Orang tua yang selalu memberi dukungan baik secara moril dan materiil. 2. Mira Kania Sabariah, S.T.,M.T. selaku ketua jurusan Teknik Informatika

Universitas Komputer Indonesia.

3. Andri Heryandi, S.T.,M.T. selaku dosen pembimbing atas bimbingan dan bantuannya dalam penyusunan tugas akhir ini.

4. Galih Hermawan, S.Kom.,M.T. Selaku dosen wali kelas IF-17K Jurusan Teknik Informatika.

(5)

6. Prof. Dr. Cissy B. Kartasasmita.dr, SpA(K), MSc selaku pimpinan Penelitian yang memberikan ijin untuk penulis melaksanakan penelitian tugas akhir di CIRAI.

7. dr. Kuswandewi Mutyara, MSc sebagai project manager pada penelitian CIRAI.

8. dr. Putri Teesa M.Kes., sebagai data manager CIRAI atas bantuan dan penjelasannya tentang sistem yang sedang berjalan.

9. Seluruh Staff CIRAI dan UPK yang telah membantu semua kegiatan dalam melaksanakan tugas akhir sehingga berjalan dengan lancar dan baik sesuai rencana.

10.Kakak-kakak dan ponakan, kalianlah salah satu alasan untuk semua ini, serta seluruh kelurga di Yogya untuk doa yang selalu diberikan.

11.Semua teman-teman skripsi 2011 khususnya anak bimbingan pak Andri Heryandi, atas kerjasamanya.

12.Semua teman-teman IF-17K, Alif, Om Hari, Dani, Opik, Panji, Epul ,Ade, Icha, Ugan Widhie, Rizal dan semuanya yang tidak bisa penulis sebut satu persatu, atas dukungannya satu sama lain.

13.Teman – teman PT eBdesk Indonesia, mas Josef, Reni, Nunu untuk solusi validasi yang sudah diberikan.

14.Maurice van Leeuwen, untuk ide, saran dan motivasinya.

(6)

Akhirnya atas segala bantuan, dukungan dan kebaikan yang telah diberikan dalam penyusunan Tugas Akhir ini, penulis mengucapkan terima kasih, semoga Tugas Akhir ini bermanfaat bagi penulis khususnya dan bagi pembaca pada umumnya.

Bandung, Juli 2011

(7)

1 1.1 Latar Belakang Masalah

Penelitian CIRAI yang merupakan kependekan dari Community-based and

Integrated Research of Influenza adalah salah satu kelompok kerja yang dilakukan

oleh Unit Penelitian Kesehatan (UPK) Fakultas Kedokteran Universitas

Padjajaran - Rumah Sakit Hasan Sadikin (UPK FK – Unpad) tentang penyakit

influenza. Seperti penelitian kesehatan pada umumnya CIRAI mempunyai

kegiatan utama mengumpulkan data objek penelitian, dimana data tersebut

dikelola dalam beberapa modul aplikasi yang terintregasi satu sama lain dalam

sebuah sistem berbasis web.

Dengan berkembangnya data penelitian, saat ini CIRAI melakukan

pengambilan data kematian didaerah penelitian dengan metode otopsi verbal,

tujuannya untuk mengidentifikasi penyebab kematian. Dari kegiatan ini akan

dihasilkan data otopsi verbal yang harus dikelola ke dalam sistem yang sudah

terintegrasi untuk menghasilkan sebuah informasi berupa pendukung diagnosa

tentang identifikasi penyebab kematian berdasarkan symptoms atau gejala yang

berhubungan dengan penyakit influenza yang dimiliki almarhum sebelum

meninggal. Dimana pada modul aplikasi yang sudah ada, untuk mendapatkan

informasi setiap modulnya, masih dilakukan secara manual.

Karena form manual otopsi verbal standar WHO yang digunakan cukup

(8)

meminimalisasi kesalahan input data. Sedangkan sumber data kematian yang

didapat dari form otopsi verbal tersebut harus bisa digali keterkaitan dan

informasinya berdasarkan data korespondensi penyebab kematian untuk otopsi

verbal dengan kode ICD-10. ICD-10 merupakan standarisasi penyebab kematian

berdasarkan data otopsi verbal yang juga sudah disediakan oleh WHO melalui

penelitian selama 3 tahun. Hal ini untuk menghindari kerancuan atau pendapat

subjective mengenai hasil data otopsi verbal.

Dengan memanfaatkan data otopsi verbal dan data korespondensi

penyebab kematian dengan kode ICD-10, dapat diketahui informasi identifikasi

penyebab kematian oleh symptoms influenza melalui teknik data mining. Kenapa

data mining, karena data mining dapat menggali informasi yang tersimpan dalam

data, dalam hal ini informasi mengenai symptoms influenza dari data otopsi

verbal.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah dipaparkan sebelumnya, maka

rumusan masalah yang mendasari pembuatan tugas akhir ini adalah bagaimana

membangun sebuah aplikasi identifikasi penyebab kematian yang dapat

mengelola data otopsi verbal dan menggunakannya untuk menghasilkan informasi

identifikasi penyebab kematian oleh symptoms influenza berdasarkan data

korespondensi penyebab kematian ICD-10 dengan implementasi data mining.

Informasi identifikasi penyebab kematian yang ditampilkan berupa prosentase

kemungkinan almarhum meninggal karena verbal autopsy themes berdasarkan

(9)

1.3 Maksud dan Tujuan

Berdasarkan permasalahan-permasalahan yang ditemukan, maka maksud

dari pembuatan tugas akhir ini adalah membuat aplikasi identifikasi penyebab

kematian dengan otopsi verbal dan implementasi data mining untuk menghasilkan

informasi identifikasi penyebab kematian oleh symptoms influenza berdasarkan

data korespondensi penyebab kematian dengan ICD-10 pada penelitian CIRAI.

Adapun tujuan yang ingin dicapai dari perancangan tugas akhir ini adalah:

1. Menyediakan sebuah aplikasi identifikasi penyebab kematian dengan

pengelolaan data otopsi verbal.

2. Memudahkan staf entri data penelitian untuk mengelola data otopsi verbal

ke dalam sistem.

3. Menyediakan fasilitas penyajian informasi identifikasi penyebab kematian

dengan otopsi verbal yang diperlukan untuk digunakan pada kepentingan

penelitian selanjutnya.

1.4 Batasan Masalah/Ruang Lingkup kajian

Agar dalam perancangan ini dapat mencapai sasaran dan tujuan yang

diharapakan, maka permasalahan yang ada dibatasi sebagai berikut :

1. Implementasi di fokuskan pada data otopsi verbal dengan acuan data

korespondensi daftar penyebab kematian untuk otopsi verbal ICD-10.

2. Aplikasi menghasilkan informasi identifikasi penyebab kematian yang

(10)

korespondensi daftar penyebab kematian untuk otopsi verbal ICD-10 oleh

pakar, dalam hal ini dokter penelitian untuk memperoleh data relasi antara

symptoms dengan jenis verbal autopsy themes yang diakibatkannya

sebagai basis pengetahuan (knowledge base).

3. Pengolahan data diawali dengan input data bersih dari lapangan dalam

bentuk form manual (hardcopy) ke dalam sistem, dilengkapi dengan

proses edit dan delete jika diperlukan.

4. Menu aplikasi dibedakan menjadi dua bahasa dari dua modul yang ada,

untuk modul data entri menggunakan bahasa Indonesia dan untuk modul

admin (data manager) menggunakan bahasa Inggris. Pertimbangan untuk

data entry karena form manual dalam bahasa Indonesia. Sedangkan

pertimbangan untuk data manager dikarenakan ada dokter penelitian yang

merupakan warga Asing, yang sesekali membutuhkan melihat aplikasi,

maka akan lebih mudah jika menu nya menggunakan bahasa Inggris.

Kebijakan penggunaan bahasa ini diluar sistem yang dibangun, penulis

hanya mengimplementasikankan modul yang penulis buat sesuai

kebijakan yang berlaku pada sistem yang berjalan.

5. Pemodelan sistem aplikasi otopsi verbal ini menggunakan Use Case

Diagram dan UML.

6. Bahasa pemrograman yang digunakan dalam aplikasi ini adalah PHP

(11)

Dengan pembatasan masalah tersebut diharapkan agar jangan sampai

menyimpang dari topik yang terdapat dalam skripsi ini. Sedangkan hal lain yang

ada hubungannya dengan masalah ini adalah sebagai pendukung saja, sehingga

pembahasan yang ada semakin jelas.

1.5 Metodologi Penelitian

Metode penelitian dalam skripsi ini dibagi dalam dua tahap yaitu tahap

pengumpulan data dan tahap implementasi sistem.

1.5.1 Tahap Pengumpulan Data

Pada tahap pengumpulan data penulis menggunakan metodologi penelitian

kualitatif yang terdiri dari kombinasi metode-metode berikut ini:

a. Metode Pengamatan/Observasi

Pengumpulan data dengan cara mengamati secara langsung di lapangan

yaitu form manual sebagai sarana pengumpulan data serta konsep atau

alur data yang terjadi.

b. Metode Wawancara

Pengumpulan data dengan cara mengadakan wawancara secara langsung

dengan responden yaitu dokter lapangan yang berkaitan dan terlibat

langsung dengan data yang akan dianalisis guna memperoleh data yang

tepat dan akurat.

(12)

Dengan membaca dan meneliti dokumen-dokumen, buku-buku, referensi

yang berkaitan dengan masalah yang diteliti guna mengumpulkan data dan

informasi yang diperlukan

d. Studi Literatur

Studi literatur yaitu pengumpulan data dengan cara mengumpulkan

literatur, jurnal, paper dan bacaan-bacaan yang ada kaitanya dengan judul

penelitian.

1.5.2 Tahap Implementasi Sistem

Teknik analisis data dalam implementasi sistem menggunakan paradigma

perangkat lunak secara Prototyping, yang meliputi beberapa proses diantaranya :

Gambar 1.1 Prototyping Method

a. Pengumpulan Kebutuhan dan perbaikan

Menetapkan segala kebutuhan untuk pembangunan perangkat lunak.

(13)

Tahap penerjemahan dari keperluan atau data yang telah dianalisis ke

dalam bentuk yang mudah dimengerti oleh user.

c. Bentuk Prototipe

Menerjemahkan data yang telah dirancang ke dalam bahasa pemrograman

(Program contoh atau setengah jadi )..

d. Evaluasi Pelanggan Terhadap Prototipe

Program yang sudah jadi diuji oleh pelanggan, dan bila ada kekurangan

pada program bisa ditambahkan. Pelanggan yang dimaksud disini adalah

komponen penelitian (dokter ahli) dengan pengujian apakah sesuai dengan

kebutuhan analisa data penelitian.

e. Perbaikan Prototipe

Perbaikan program yang sudah jadi, sesuai dengan kebutuhan konsumen.

Kemudian dibuat program kembali dan di evaluasi oleh konsumen sampai

semua kebutuhan user terpenuhi.

f. Produk Rekayasa

Program yang sudah jadi dan seluruh kebutuhan user sudah terpenuhi

1.6 Sistematika Penulisan

Sistematika penulisan skripsi disini terbagi menjadi beberapa sub bab dari

pokok bahasan, secara umum dapat dijabarkan sebagai berikut :

(14)

Pada bab ini penulis membahas tentang latar belakang tugas akhir, perumusan

masalah, maksud dan tujuan tugas akhir, batasan masalah, metode penelitian dan

sistematika pelaporan tugas akhir.

BAB II TINJAUAN PUSTAKA

Pada bab ini penulis menguraikan secara singkat mengenai sejarah institusi

tempat penelitian dilakukan, landasan teori, model proses perangkat lunak, basis

data, metode perancangan dan implementasi sistem, PHP, Apache dan MySQL.

BAB III ANALISIS DAN PERANCANGAN

Pada bab ini membahas tentang analisis sistem, analisis masalah, Analisis

Kebutuhan Fungsional Analisis Non Fungsional, Perancangan Sistem,

Perancangan Database, Perancangan Antarmuka

BAB IV IMPLEMENTASI DAN PENGUJIAN

Pada bab ini membahas tentang Implementasi,Pengujian Sistem, Pengujian

Alpha.

BAB IV KESIMPULAN

Pada bab ini merupakan penutup yaitu berupa kesimpulan yang berisi kesimpulan

dari pembahasan pada bab sebelumnya serta saran yang mungkin berguna bagi

(15)

9 2.1Tinjauan Tempat Penelitian

2.1.1 Profil Instansi

CIRAI – Community-based and Integrated Research of Avian Influenza

adalah salah satu kelompok kerja yang dilakukan oleh Unit Penelitian

Kesehatan (UPK) Fakultas Kedokteran Universitas Padjajaran – Rumah

Sakit Hasan Sadikin tentang penyakit flu burung (sekarang meng-generalize

pada penyakit influenza), bekerja sama dengan Colorado University dan Dinas

kesehatan serta Dinas Peternakan provinsi Jawa Barat.

Seluruh jajaran sivitas akademika FK Unpad - RSHS, memberikan

perhatian sangat besar terhadap penelitian. Institusi ini memberikan penambahan

sumber daya untuk penelitian, pengembangan laboratorium, dan

mengakomodasikan pertemuan-pertemuan khusus untuk membahas penelitian.

Momentum ini sebaiknya di manfaatkan oleh kita semua untuk meningkatan

kredibilitas institusi dan karir kita khususnya dalam penelitian. Dalam hal ini,

Unit Penelitian Kesehatan saat ini masih berusaha mengembangkan working

group, kapasitas laboratorium sambil memperbaiki sistem administrasi dan

pendataan penelitian. Disamping upaya ini, minat dari institusi luar yang ingin

bekerja sama sangat besar. Dewasa ini ini sudah terbentuk 6 working group.

(16)

Disease (Influenza dan Dengue) dimana CIRAI ada didalamnya. Di bidang

Onkologi, kelompok kerja yang sudah mulai bergerak aktif adalah kelompok Ca

Cervix dan Human Papiloma Virus. Masing-masing kelompok kerja diharapkan

akan dapat menggarap aspek yang luas mulai dari topic ilmiah dasar sampai

penelitian aplikatif, agar sumbangan di berbagai lini bisa tampak. Dalam

pelaksanaannya sinergi kegiatan tetap sangat diharapkan karena secara praktis

kegiatan pengembangan dan penelitian bidang kesehatan menggunakan

metodologi dan instrumen yang sama.

2.1.2 Sejarah Instansi

Unit Penelitian Kesehatan Fakultas Kedokteran Universitas

Padjadjaran/Rumah Sakit Hasan Sadikin (selanjutnya disebut UPK-FKUP/RSHS)

didirikan pada tahun 1991 berdasarkan Surat Keputusan Bersama (SKB) Dekan

FK UNPAD No.14/PT06.H4.FK/Kep/N/91 dan Direktur RS Hasan Sadikin

Bandung No. 801A/D/IV/Kepeg/III/1991. Berdirinya UPK-FKUP/RSHS tersebut

antara lain dilatarbelakangi oleh

1. Program Fakultas Kedokteran UNPAD untuk membina dan

mengembangkan kegiatan-kegiatan penelitian di kalangan staf akademik

sebagai bagian bagian perwujudan Tri Dharma Perguruan Tinggi.

2. Piagam kerja sama antara Universitas Padjadjaran dengan Vlaamse

Interuniversitaire Raad (VLIR) Belgia yang ditandatangani pada tahun 1986

(17)

klinik dan biostatistik dalam rangka turut serta meningkatkan status

kesehatan di Jawa Barat.

3. Keterlibatan peneliti yang berasal dari lembaga berbeda yang tidak dapat

dipisahkan, yaitu Fakultas Kedokteran UNPAD sebagai lembaga pendidikan

dan Rumah Sakit Umum Pusat dr. Hasan Sadikin sebagai lembaga

pelayanan kesehatan.

4. Pemikiran bahwa penelitian kesehatan merupakan kegiatan yang tidak dapat

dipisahkan dalam mengembangkan dan mengantisipasi kemajuan ilmu

pengetahuan dan teknologi.

Bertitik tolak pada SKB tersebut, pada awalnya kegiatan UPK-FKUP/RSHS

dititikberatkan pada bidang kajian epidemiologi klinik yang ditopang oleh adanya

8 kelompok studi yang terlibat dalam program kerja sama UNPAD – VLIR

Belgia.

Mengingat perkembangan ilmu pengetahuan dan teknologi, semakin

beragamnya tantangan dan peluang yang dihadapi, serta diperlukan pendekatan

multidisiplin dalam mengatasi permasalahan kesehatan yang berkembang, maka

UPK-FKUP/RSHS telah pula mengembangkan kegiatannya yang meliputi bidang

kajian ilmu kedokteran dasar, ilmu kedokteran klinik hingga bidang kesehatan

masyarakat termasuk epidemiologi klinik dan biostatistik yang sebelumnya telah

dikembangkan serta bidang manajemen pelayanan kesehatan. Wujud pelaksanaan

(18)

2.1.3 Logo Instansi

Logo CIRAI sendiri se

sementara yang dimiliki oleh C

Gambar 2.1 Logo CIRA

Logo CIRAI mence

pengertian komunitas itu send

organisme yang berbagi lingk

yang sama. Dalam komunita

sebenarnya belum memiliki bentuk baku, berikut

h CIRAI:

AI (Community-based And Integrated Research o

Avian Influenza)

cerminkan lambang sebuah komunitas, dim

ndiri adalah “Sebuah kelompok sosial dari beber

gkungan, umumnya memiliki ketertarikan dan ha

itas manusia, individu-individu di dalamnya d ut logo

h of

dimana

berapa

habitat

(19)

memiliki maksud, kepercayaan, sumber daya, preferensi, kebutuhan, risiko dan

sejumlah kondisi lain yang serupa”. Organisasi disini karena CIRAI melibatkan

beberapa pihak luar seperti Colorado University, Dinas Peternakan dan lain – lain.

Sedangkan gambar virus didalamnya adalah virus avian influenza dimana

komunitas ini menitik beratkan pada penelitian virus tersebut.

2.1.4 Struktur Organisasi

Berikut ini adalah struktur organisasi dari working group atau kelompok

kerja Community and Integrated Research of Avian Influenza (CIRAI):

(20)

2.1.1.1. Research Leader

Pimpinan penelitian atau Research Leader merupakan pimpinan

tertinggi penelitian. Bertugas mengendalikan kegiatan manajerial serta berperan

dalam pengendalian kerjasama antara satu bagian dengan bagian yang lainnya,

tugas utamanya adalah memimpin penelitian dan bertanggung jawab terhadap

seluruh kelangsungan hidup penelitian.

2.1.1.2. Project Manager

Bertanggung jawab dalam mengawasi dan koordinasi pembangunan

sebuah proyek penelitian, melakukan evaluasi, estimasi waktu dan mengambil

keputusan menyangkut pembangunan suatu proyek penelitian.

2.1.1.3. Laboratory Manager

Bertanggung jawab dalam mengawasi dan koordinasi tentang kegiatan

laboratorium untuk penelitian, termasuk didalamnya pengadaan alat dan hasil

penelitian dari specimen yang didapat di lapangan oleh dokter lapangan.

2.1.1.4. Fields Manager

Bertanggung jawab dalam mengawasi dan koordinasi tentang kegiatan

penelitian dilapangan baik itu dokter lapangan di setiap puskesmas yang

(21)

2.1.1.5. Data Manager

Bertanggung jawab dalam mengawasi dan koordinasi tentang semua

aliran data penelitian yang masuk, pengolahannya sampai reporting data yang

dihasilkan. Membawahi bidang IT dan data entry yang bertugas untuk

memasukkan data penelitian ke dalam system yang dibuat oleh team IT.

2.2 Landasan Teori

2.2.1 Sistem Informasi

Pengertian Sistem Informasi sendiri mempunyai banyak versi, diantaranya

adalah sebagai berikut:

1. Sistem informasi adalah aplikasi komputer untuk mendukung operasi dari

suatu organisasi: operasi, instalasi, dan perawatan komputer, perangkat lunak,

dan data.

2. Sistem Informasi adalah sekumpulan komponen dari informasi yang saling

terintegrasi untuk mencapai tujuan yang spesifik. Komponen yang dimaksud

adalah komponen input, model, output, teknologi, basis data (data base),

kontrol atau komponen pengendali.

3. Sistem Informasi adalah Proses yang menjalankan fungsi mengumpulkan,

memproses, menyimpan, menganalisis, dan menyebarkan informasi untuk

kepentingan tertentu; kebanyakan SI dikomputerisasi.

4. Sistem informasi adalah sekumpulan komponen pembentuk sistem yang

(22)

bertujuan menghasilkan suatu informasi dalam suatu bidang tertentu. Dalam

sistem informasi diperlukannya klasifikasi alur informasi, hal ini disebabkan

keanekaragaman kebutuhan akan suatu informasi oleh pengguna informasi.

Kriteria dari sistem informasi antara lain, fleksibel, efektif dan efisien.

5. Sistem informasi adalah kumpulan antara sub-sub sistem yang saling

berhubungan yang membentuk suatu komponen yang didalamnya mencakup

input-proses-output yang berhubungan dengan pengolaan informasi (data yang

telah dioleh sehingga lebih berguna bagi user)

6. Suatu sistem informasi (SI) atau information system (IS) merupakan

aransemen dari orang, data, proses-proses, dan antar-muka yang berinteraksi

mendukung dan memperbaiki beberapa operasi sehari-hari dalam suatu bisnis

termasuk mendukung memecahkan soal dan kebutuhan pembuat-keputusan

manejemen dan para pengguna yang berpengalaman di bidangnya.

2.2.2 Data

Data adalah fakta atau apapun yang dapat digunakan sebagai input dan

menghasilkan informasi. Data adalah kenyataan yang menggambarkan suatu

kejadian dan kesatuan kenyataan. Data merupakan suatu istilah yang berbentuk

jamak dari kata “datum” yang berarti fakta atau bagian dari fakta yang

mengandung arti yang menghubungkan dengan kenyataan, simbol-simbol,

gambar-gambar, kata-kata, angka-angka, hurufhuruf yang menunjukan suatu ide,

objek, kondisi dan situasi. Menurut the Liang Gie: ”Data atau bahan keterangan

(23)

pengetahuan untuk dijadikan dasar guna penyusunan keterangan pembuatan

kesimpulan atau penetapan keputusan, atau data ibarat bahan mentah yang melalui

pengolahannya tertentu lalu menjadi keterangan (informasi)”. Kumpulan data

yang saling berkaitan, berhubungan yang disimpan secara bersama-sama

sedemikian rupa tanpa pengulangan yang tidak perlu, untuk memenuhi berbagai

kebutuhan disebut basis data (database). Data-data ini harus mengandung semua

informasi untuk mendukung semua kebutuhan sistem. Proses dasar yang dimiliki

oleh database ada empat, yaitu:

1. Pembuatan data-data baru (create database)

2. Penambahan data (insert)

3. Mengubah data (update)

4. Menghapus data (delete)

Database merupakan salah satu komponen yang penting dalam sistem informasi,

karena merupakan basis dalam menyediakan informasi pada para pengguna.

Database menjadi penting karena munculnya beberapa masalah bila tidak

menggunakan data yang terpusat, seperti adanya duplikasi data, hubungan antar

data tidak jelas, organisasi data dan update menjadi rumit. Jadi tujuan dari

pengaturan data dengan menggunakan database adalah :

a. Menyediakan penyimpanan data untuk dapat digunakan oleh organisasi saat

(24)

b. Cara pemasukan data sehingga memudahkan tugas operator dan menyangkut

pula waktu yang diperlukan oleh pemakai untuk mendapatkan data serta

hak-hak yang dimiliki terhadap data yang ditangani.

c. Pengendalian data untuk setiap siklus agar data selalu up-todate dan dapat

mencerminakan perubahan spesifik yang terjadi di setiap sistem.

d. Pengamanan data terhadap kemungkinan penambahan, modifikasi, pencurian

dan gangguan-gangguan lain. Penyusunan basis data meliputi proses

memasukkan data kedalam media penyimpanan data, dan diatur dengan

menggunakan perangkat Sistem Manajemen Basis Data (Database

Management System / DBMS).

2.2.3 Pengenalan Pola, Data Mining, dan Machine Learning

Pengenalan pola adalah suatu disiplin ilmu yang mempelajari cara-cara

mengklasifikasikan obyek ke beberapa kelas atau kategori dan mengenali

kecenderungan data. Tergantung pada aplikasinya, obyek-obyek ini bisa berupa

pasien, mahasiswa, pemohon kredit, image atau signal atau pengukuran lain yang

perlu diklasifikasikan atau dicari fungsi regresinya (Santoso, 2007).

Data mining diartikan sebagai suatu proses ekstraksi informasi berguna

dan potensial dari sekumpulan data yang terdapat secara implisit dalam suatu

basis data. Pada dasarnya data mining berhubungan dengan analisa data dan

penggunaan teknik-teknik perangkat lunak untuk mencari pola dan keteraturan

(25)

Machine Learning adalah suatu area dalam artificial intelligence atau

kecerdasan buatan yang berhubungan dengan pengembangan teknik-teknik yang

bisa diprogramkan dan belajar dari data masa lalu. Pengenalan pola, data mining

dan machine learning sering dipakai untuk menyebut sesuatu yang sama. Bidang

ini bersinggungan dengan ilmu probabilitas dan statistik kadang juga optimasi.

Machine learning menjadi alat analisis dalam data mining (Santoso, 2007).

Dengan diperolehnya informasi-informasi yang berguna dari data-data

yang ada, hubungan antara item dalam transaksi, maupun informasi

informasi-yang potensial, selanjutnya dapat diekstrak dan dianalisa dan diteliti lebih lanjut

dari berbagai sudut pandang. Informasi yang ditemukan ini selanjutnya dapat

diaplikasikan untuk aplikasi manajemen, melakukan query processing,

pengambilan keputusan dan lain sebagainya. Dengan semakin berkembangnya

kebutuhan akan informasi, semakin banyak pula bidang-bidang yang rnenerapkan

konsep data mining.

2.2.3.1Tahapan Data Mining

Dalam proses data mining, data-data yang ada, tidak dapat langsung diolah

dengan menggunakan sistem data mining. Data-data tersebut harus dipersiapkan

terlebih dahulu agar hasil yang diperoleh dapat lebih maksimal, dan waktu

komputasinya lebih minimal. Proses persiapan data ini sendiri dapat mencapai

60% dari keseluruhan proses dalam data mining. Adapun tahapan-tahapan yang

(26)

Gambar 2.3 Tahapan Data Mining

1. Pembersihan Data (Data Cleaning)

Pembersihan data merupakan proses menghilangkan noise dan data yang

tidak konsisten atau data tidak relevan. Pada umumnya data yang

diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen,

memiliki isian-isian yang tidak sempurna seperti data yang hilang, data

yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga

(27)

dimiliki. Data-data yang tidak relevan itu juga lebih baik dibuang.

Pembersihan data juga akan mempengaruhi performasi dari teknik data

mining karena data yang ditangani akan berkurang jumlah dan

kompleksitasnya.

2. Seleksi Data (Data Selection)

Data yang ada pada database sering kali tidak semuanya dipakai, oleh

karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari

database.

3. Integrasi Data (Data Integration)

Integrasi data merupakan penggabungan data dari berbagai database ke

dalam satu database baru. Tidak jarang data yang diperlukan untuk data

mining tidak hanya berasal dari satu database tetapi juga berasal dari

beberapa database atau file teks. Integrasi data dilakukan pada

atribut-aribut yang mengidentifikasikan entitas-entitas yang unik seperti atribut

nama, jenis produk, nomor pelanggan dan lainnya. Integrasi data perlu

dilakukan secara cermat karena kesalahan pada integrasi data bisa

menghasilkan hasil yang menyimpang dan bahkan menyesatkan

pengambilan aksi nantinya.

(28)

Transformasi data melakukan peringkasan data dengan mengasumsikan

bahwa data telah tersimpan dalam tempat penyimpanan tunggal. Pada

langkah terakhir, data telah di ekstrak dari banyak basis data ke dalam

basis data tunggal. Tipe peringkasan yang dikerjakan dalam langkah ini

mirip dengan peringkasan yang dikerjakan selama tahap ekstraksi.

5. Proses Mining

Merupakan suatu proses utama saat metode diterapkan untuk menemukan

pengetahuan berharga dan tersembunyi dari data. Didalamnya termasuk

proses menjalankan algoritma, setelah semua proses sebelumnya

dikerjakan, maka algoritma data mining sudah siap untuk dijalankan.

6. Presentasi Pengetahuan

Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang

digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.

Tahap terakhir dari proses data mining adalah bagaimana

memformulasikan keputusan atau aksi dari hasil analisis yang didapat.

Ada kalanya hal ini harus melibatkan orang-orang yang tidak memahami

data mining. Karenanya presentasi hasil data mining dalam bentuk

pengetahuan yang bisa dipahami semua orang adalah satu tahapan yang

diperlukan dalam proses data mining. Dalam presentasi ini, visualisasi

juga bisa membantu mengkomunikasikan hasil data mining (Han, 2006).

(29)

Berikut beberapa jenis teknik Data Mining yang paling populer dikenal

dan digunakan:

1. Association Rule Mining

Association rule mining adalah teknik mining untuk menemukan aturan

assosiatif antara suatu kombinasi item. Penting tidaknya suatu aturan assosiatif

dapat diketahui dengan dua parameter, support yaitu persentase kombinasi item

tsb. dalam database dan confidence yaitu kuatnya hubungan antar item dalam

aturan assosiatif. Algoritma yang paling populer dikenal sebagai Apriori dengan

paradigma generate and test, yaitu pembuatan kandidat kombinasi item yang

mungkin berdasar aturan tertentu lalu diuji apakah kombinasi item tersebut

memenuhi syarat support minimum. Kombinasi item yang memenuhi syarat tsb.

disebut frequent itemset, yang nantinya dipakai untuk membuat aturan-aturan

yang memenuhi syarat confidence minimum. Algoritma baru yang lebih efisien

bernama FP-Tree.

2. Classification

Klasifikasi data adalah suatu proses yang menemukan properti-properti

yang sama pada sebuah himpunan obyek di dalarn sebuah basis data, dan

mengklasifikasikannya ke dalam kelas-kelas yang berbeda menurut model

klasifikasi yang ditetapkan (Badriyah, 2007).

Classification adalah proses untuk menemukan model atau fungsi yang

(30)

memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu

sendiri bisa berupa aturan “jika-maka”, berupa decision tree, formula matematis

atau neural network. Decision tree adalah salah satu metode classification yang

paling populer karena mudah untuk diinterpretasi oleh manusia.

Decision tree merupakan struktur flowchart yang menyerupai tree

(pohon), dimana setiap simpul internal menandakan suatu tes pada atribut, setiap

cabang merepresentasikan hasil tes, dan simpul daun merepresentasikan kelas

atau distribusi kelas. Alur pada decision tree di telusuri dari simpul akar ke simpul

daun yang memegang prediksi kelas untuk contoh tersebut. Decision tree mudah

untuk dikonversi ke aturan klasifikasi (Kusnawi,2007).

Forward Chaining atau disebut juga penalaran maju adalah aturan-aturan

diuji satu demi satu dalam urutan tertentu. Inference Engine akan mencocokkan

fakta atau statement dalam Knowledge Base dengan situasi yang dinyatakan

dalam rule bagian IF. Jika fakta yang ada dalam Knowledge Base sudah sesuai

dengan kaidah IF, maka rule itu distimulasi dan rule berikutnya diuji. Proses

pengujian rule satu demi satu berlanjut sampai satu putaran lengkap melalui

seluruh perangkat rule (Andi, 2003). Untuk lebih jelasnya dapat kita lihat alur

(31)

Gambar 2.4 Metode forward chaining

3. Clustering

Berbeda dengan association rule mining dan classification dimana kelas

data telah ditentukan sebelumnya, clustering melakukan penge-lompokan data

tanpa berdasarkan kelas data tertentu. Bahkan clustering dapat dipakai untuk

memberikan label pada kelas data yang belum diketahui itu. Karena itu clustering

sering digolongkan sebagai metode unsupervised learning. Prinsip dari clustering

adalah memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan

kesamaan antar kelas/cluster. Clustering dapat dilakukan pada data yan memiliki

beberapa atribut yang dipetakan sebagai ruang multidimensi.

Banyak algoritma clustering memerlukan fungsi jarak untuk mengukur

kemiripan antar data, diperlukan juga metode untuk normalisasi bermacam atribut

yang dimiliki data. Beberapa kategori algoritma clustering yang banyak dikenal

adalah metode partisi dimana pemakai harus menentukan jumlah k partisi yang

diinginkan lalu setiap data dites untuk dimasukkan pada salah satu partisi, metode

(32)

bottom-up yang menggabungkan cluster kecil menjadi cluster lebih besar dan

top-down yang memecah cluster besar menjadi cluster yang lebih kecil. Kelemahan

metode ini adalah bila bila salah satu penggabungan/pemecahan dilakukan pada

tempat yang salah, tidak dapat didapatkan cluster yang optimal. Pendekatan yang

banyak diambil adalah menggabungkan metode hierarki dengan metode

clustering lainnya seperti yang dilakukan oleh Chameleon.

2.2.4 DBMS, MySQL dan SQL

2.2.4.1DBMS

Basis data atau database adalah kumpulan informasi yang disimpan di

dalam komputer secara sistematik sehingga dapat diperiksa menggunakan suatu

program komputer untuk memperoleh informasi dari basis data tersebut. Database

digunakan untuk menyimpan informasi atau data yang terintegrasi dengan baik di

dalam komputer.

Untuk mengelola database diperlukan suatu perangkat lunak yang disebut

DBMS atau Database Management System. DBMS merupakan suatu sistem

perangkat lunak yang memungkinkan pengguna untuk membuat, memelihara,

mengontrol, dan mengakses database secara praktis dan efisien. Dengan DBMS,

pengguna akan lebih mudah mengontrol dan memanipulasi data yang ada.

2.2.4.2MySQL

Sedangkan MySQL adalah Relational Database Management System

(33)

Public License). Dimana setiap orang bebas untuk menggunakan MySQL, namun

tidak boleh dijadikan produk turunan yang bersifat komersial. MySQL sebenarnya

merupakan turunan salah satu konsep utama dalam database sejak lama, yaitu

SQL (Structured Query Language). MySQL memiliki beberapa keistimewaan,

antara lain :

1. Portabilitas. MySQL dapat berjalan stabil pada berbagai sistem operasi

seperti Windows, Linux, FreeBSD, Mac Os X Server, Solaris, Amiga, dan

masih banyak lagi.

2. Open Source. MySQL didistribusikan secara open source, dibawah lisensi

GPL sehingga dapat digunakan secara cuma-cuma.

3. Multiuser. MySQL dapat digunakan oleh beberapa user dalam waktu yang

bersamaan tanpa mengalami masalah atau konflik.

4. Performance Tuning. MySQL memiliki kecepatan yang menakjubkan

dalam menangani query sederhana, dengan kata lain dapat memproses

lebih banyak SQL per satuan waktu.

5. Jenis Kolom. MySQL memiliki tipe kolom yang sangat kompleks, seperti

signed / unsigned integer, float, double, char, text, date, timestamp, dan

lain-lain.

6. Perintah dan Fungsi. MySQL memiliki operator dan fungsi secara penuh

yang mendukung perintah Select dan Where dalam perintah (query).

7. Keamanan. MySQL memiliki beberapa lapisan sekuritas seperti level

subnetmask, nama host, dan izin akses user dengan sistem perizinan yang

(34)

8. Skalabilitas dan Pembatasan. MySQL mampu menangani basis data dalam

skala besar, dengan jumlah rekaman (records) lebih dari 50 juta dan 60

ribu tabel serta 5 milyar baris. Selain itu batas indeks yang dapat

ditampung mencapai 32 indeks pada tiap tabelnya.

9. Konektivitas. MySQL dapat melakukan koneksi dengan klien

menggunakan protokol TCP/IP, Unix soket (UNIX), atau Named Pipes

(NT).

10. Lokalisasi. MySQL dapat mendeteksi pesan kesalahan pada klien dengan

menggunakan lebih dari dua puluh bahasa. Meski pun demikian, bahasa

Indonesia belum termasuk di dalamnya.

11. Antar Muka. MySQL memiliki interface (antar muka) terhadap berbagai

aplikasi dan bahasa pemrograman dengan menggunakan fungsi API

(Application Programming Interface).

12. Klien dan Peralatan. MySQL dilengkapi dengan berbagai peralatan (toosl)

yang dapat digunakan untuk administrasi basis data, dan pada setiap

peralatan yang ada disertakan petunjuk online.

13. Struktur tabel. MySQL memiliki struktur tabel yang lebih fleksibel dalam

menangani ALTER TABLE, dibandingkan basis data lainnya semacam

PostgreSQL ataupun Oracle.

2.2.4.3SQL

SQL adalah sebuah konsep pengoperasian database, terutama untuk

(35)

data dikerjakan dengan mudah secara otomatis. Keandalan suatu sistem database

(DBMS) dapat diketahui dari cara kerja optimizer-nya dalam melakukan proses

perintah-perintah SQL, yang dibuat oleh user maupun program-program

aplikasinya. Sebagai database server, MySQL dapat dikatakan lebih unggul

dibandingkan database server lainnya dalam query data. Hal ini terbukti untuk

query yang dilakukan oleh single user, kecepatan query MySQL bisa sepuluh kali

lebih cepat dari PostgreSQL dan lima kali lebih cepat dibandingkan Interbases.

2.2.5 Bahasa Pemograman WEB

2.2.5.1HyperText Markup Language (HTML)

HyperText Markup Language (HTML) adalah sebuah bahasa markup yang

digunakan untuk membuat sebuah halaman web, menampilkan berbagai informasi

di dalam sebuah Penjelajah web Internet dan formating hypertext sederhana yang

ditulis kedalam berkas format ASCII agar dapat menghasilkan tampilan wujud

yang terintegerasi. Dengan kata lain, berkas yang dibuat dalam perangkat lunak

pengolah kata dan disimpan kedalam format ASCII normal sehingga menjadi

home page dengan perintah-perintah HTML. Bermula dari sebuah bahasa yang

sebelumnya banyak digunakan di dunia penerbitan dan percetakan yang disebut

dengan SGML (Standard Generalized Markup Language), HTML adalah sebuah

standar yang digunakan secara luas untuk menampilkan halaman web. HTML saat

ini merupakan standar Internet yang didefinisikan dan dikendalikan

penggunaannya oleh World Wide Web Consortium (W3C). HTML dibuat oleh

(36)

pada tahun 1989 (CERN adalah lembaga penelitian fisika energi tinggi di

Jenewa).

2.2.5.2JavaScript

JavaScript diperkenalkan pertama kali oleh Netscape pada tahun 1995.

Pada awalnya bahasa yang sekarang disebut JavaScript ini dulunya dinamai

LiveScrip” yang berfungsi sebagai bahasa sederhana untuk browser Netscape

Navigator 2 yang sangat populer pada saat itu. Kemudian sejalan dengan sedang

giatnya kerjasama antara Netscape dan Sun (pengembang bahasa pemrograman

Java) pada masa itu, maka Netscape memberikan nama JavaScript kepada bahasa

tersebut pada tanggal 4 desember 1995. Pada saat yang bersamaan Microsoft

sendiri mencoba untuk mengadaptasikan teknologi ini yang mereka sebut sebagai

Jscript di browser milik mereka yaitu Internet Explorer 3. JavaScript sendiri

merupakan modifikasi dari bahasa pemrograman C++ dengan pola penulisan yang

lebih sederhana dari bahasa pemrograman C++.

JavaScript adalah bahasa pemrograman yang khusus untuk halaman web

agar halaman web menjadi lebih hidup. Kalau dilihat dari suku katanya terdiri dari

dua suku kata, yaitu Java dan Script. Java adalah bahasa pemrograman

berorientasi objek, sedangkan Script adalah serangkaian instruksi program. Ada

beberapa hal yang harus diperhatikan dalam pengelolaan pemrograman

JavaScript, diantaranya JavaScript adalah case sensitive, yang artinya JavaScript

membedakan huruf besar dan huruf kecil, dimana huruf T tidak sama dengan

(37)

2.2.5.3Asynchronous JavaScript and XMLHTTP (AJaX)

Asynchronous JavaScript and XMLHTTP, atau disingkat AJaX, adalah

suatu teknik pemrograman berbasis web untuk menciptakan aplikasi web

interaktif. Tujuannya adalah untuk memindahkan sebagian besar interaksi pada

komputer web surfer, melakukan pertukaran data dengan server di belakang layar,

sehingga halaman web tidak harus dibaca ulang secara keseluruhan setiap kali

seorang pengguna melakukan perubahan. Hal ini akan meningkatkan

interaktivitas, kecepatan, dan usability. Ajax merupakan kombinasi dari:

1. DOM yang diakses dengan client side scripting language, seperti VBScript

dan implementasi ECMAScript seperti JavaScript dan JScript, untuk

menampilkan secara dinamis dan berinteraksi dengan informasi yang

ditampilkan

2. Objek XMLHTTP dari Microsoft atau XMLHttpRequest yang lebih umum di

implementasikan pada beberapa browser. Objek ini berguna sebagai

kendaraan pertukaran data asinkronus dengan web server. Pada beberapa

framework AJAX, element HTML IFrame lebih dipilih daripada XMLHTTP

atau XMLHttpRequest untuk melakukan pertukaran data dengan web server.

3. XML umumnya digunakan sebagai dokumen transfer, walaupun format lain

juga memungkinkan, seperti HTML, plain text. XML dianjurkan dalam

pemakaian teknik AJaX karena kemudahan akses penanganannya dengan

(38)

4. JSON dapat menjadi pilihan alternatif sebagai dokumen transfer, mengingat

JSON adalah JavaScript itu sendiri sehingga penanganannya lebih mudah

Seperti halnya DHTML, LAMP, atau SPA, Ajax bukanlah teknologi spesifik,

melainkan merupakan gabungan dari teknologi yang dipakai bersamaan. Bahkan,

teknologi turunan/komposit yang berdasarkan Ajax, seperti AFLAX sudah mulai

bermunculan.

2.2.5.4Cascading Style Sheets (CSS)

Cascading Style Sheet (CSS) merupakan salah satu bahasa pemrograman

web untuk mengendalikan beberapa komponen dalam sebuah web sehingga akan

lebih terstruktur dan seragam.

Sama halnya styles dalam aplikasi pengolahan kata seperti Microsoft Word

yang dapat mengatur beberapa style, misalnya heading, subbab, bodytext, footer,

images, dan style lainnya untuk dapat digunakan bersama-sama dalam beberapa

berkas. Pada umumnya CSS dipakai untuk memformat tampilan halaman web

yang dibuat dengan bahasa HTML. CSS dapat mengendalikan ukuran gambar,

warna bagian tubuh pada teks, warna tabel, ukuran border, warna border, warna

hyperlink, warna mouse over, spasi antar paragraf, spasi antar teks, margin kiri,

kanan, atas, bawah, dan parameter lainnya.[1] CSS adalah bahasa style sheet yang

digunakan untuk mengatur tampilan dokumen. Dengan adanya CSS

memungkinkan kita untuk menampilkan halaman yang sama dengan format yang

(39)

2.2.5.5PHP

PHP (akronim dari PHP Hypertext Preprocessor) yang merupakan bahasa

pemrogramman berbasis web yang memiliki kemampuan untuk memproses data

dinamis. PHP dikatakan sebagai sebuah server-side embedded script language

artinya sintaks-sintaks dan perintah yang kita berikan akan sepenuhnya dijalankan

oleh server tetapi disertakan pada halaman HTML biasa. Aplikasi-aplikasi yang

dibangun oleh PHP pada umumnya akan memberikan hasil pada web browser,

tetapi prosesnya secara keseluruhan dijalankan di server. Pada prinsipnya server

akan bekerja apabila ada permintaan dari client. Dalam hal ini client

menggunakan kode-kode PHP untuk mengirimkan permintaan ke server (dapat

dilihat pada gambar dibawah). Ketika menggunakan PHP sebagai server-side

embedded script language maka server akan melakukan hal-hal sebagai berikut :

• Membaca permintaan dari client/browser

• Mencari halaman/page di server

• Melakukan instruksi yang diberikan oleh PHP untuk melakukan

modifikasi pada halaman/page.

• Mengirim kembali halaman tersebut kepada client melalui internet atau

(40)

Gambar 2.5 Cara Kerja PHP

2.2.6 Web Server dan Apache

2.2.6.1Web Server

Web server adalah software yang menjadi tulang belakang dari world wide

web (www). Web server menunggu permintaan dari client yang menggunakan

browser seperti Netscape Navigator, Internet Explorer, Modzilla, dan program

browser lainnya. Jika ada permintaan dari browser, maka web server akan

memproses permintaan itu kemudian memberikan hasil prosesnya berupa data

yang diinginkan kembali ke browser. Data ini mempunyai format yang standar,

disebut dengan format SGML (standar general markup language). Data yang

berupa format ini kemudian akan ditampilkan oleh browser sesuai dengan

kemampuan browser tersebut. Contohnya, bila data yang dikirim berupa gambar,

(41)

menampilkan gambar tersebut, dan jika ada akan menampilkan alternatifnya saja.

Web server, untuk berkomunikasi dengan client-nya (web browser) mempunyai

protokol sendiri, yaitu HTTP (hypertext transfer protocol).

Dengan protokol ini, komunikasi antar web server dengan client-nya dapat

saling dimengerti dan lebih mudah. Seperti telah dijelaskan diatas, format data

pada world wide web adalah SGML. Tapi para pengguna internet saat ini lebih

banyak menggunakan format HTML (hypertext markup language) karena

penggunaannya lebih sederhana dan mudah dipelajari. Kata HyperText

mempunyai arti bahwa seorang pengguna internet dengan web browser-nya dapat

membuka dan membaca dokumen-dokumen yang ada dalam komputernya atau

bahkan jauh tempatnya sekalipun.

Hal ini memberikan cita rasa dari suatu proses yang tridimensional, artinya

pengguna internet dapat membaca dari satu dokumen ke dokumen yang lain

hanya dengan mengklik beberapa bagian dari halaman-halaman dokumen (web)

itu. Proses yang dimulai dari permintaan webclient (browser), diterima web

server, diproses, dan dikembalikan hasil prosesnya oleh web server ke web client

lagi dilakukan secara transparan. Setiap orang dapat dengan mudah mengetahui

apa yang terjadi pada tiap-tiap proses. Secara garis besarnya web server hanya

(42)

2.2.6.2Apache

Apache merupakan web server yang paling banyak dipergunakan di

Internet. Program ini pertama kali didesain untuk sistem operasi lingkungan

UNIX. Namun demikian, pada beberapa versi berikutnya Apache mengeluarkan

programnya yang dapat dijalankan di Windows NT. Apache mempunyai program

pendukung yang cukup banyak. Hal ini memberikan layanan yang cukup lengkap

bagi penggunanya. Beberapa dukungan Apache :

1. Kontrol Akses. Kontrol ini dapat dijalankan berdasarkan nama host atau

nomor IP.

2. CGI (Common Gateway Interface). Yang paling terkenal untuk digunakan

adalah perl (Practical Extraction and Report Language), didukung oleh

Apache dengan menempatkannya sebagai modul (mod_perl).

3. PHP (Personal Home Page/PHP Hypertext Processor). Program dengan

metode semacam CGI, yang memproses teks dan bekerja di server.

Apache mendukung PHP dengan menempatkannya sebagai salah satu

modulnya (mod_php). Hal ini membuat kinerja PHP menjadi lebih baik.

4. SSI (Server Side Includes).

Web server Apache mempunyai kelebihan dari beberapa pertimbangan di

atas, antara lain adalah :

(43)

2. Apache mudah sekali proses instalasinya jika dibanding web server

lainnya seperti NCSA, IIS, dan lain-lain.

3. Mampu beroperasi pada berbagai platform sistem operasi.

4. Mudah mengatur konfigurasinya. Apache mempunyai hanya empat file

konfigurasi.

5. Mudah dalam menambahkan peripheral lainnya ke dalam platform web

(44)

38

3.1 Analisis Sistem

Analisis sistem diperlukan untuk menganalisa sistem penelitian CIRAI

yang sudah berjalan, menganalisa permasalahan yang ada pada sistem penelitian

dan menganalisa kebutuhan yang diperlukan oleh penelitian saat ini.

3.1.1 Analisis Sistem Penelitian

Penelitian CIRAI yang merupakan kependekan dari Community-based and

Integrated Research of Influenza adalah salah satu kelompok kerja yang dilakukan

oleh Unit Penelitian Kesehatan (UPK) FK UNPAD - Rumah Sakit Hasan Sadikin

tentang penyakit influenza. Seperti penelitian kesehatan pada umumnya CIRAI

mempunyai kegiatan utama mengumpulkan data objek penelitian, dimana data

tersebut dikelola menjadi beberapa modul aplikasi yang terintregasi satu sama lain

dalam sebuah sistem berbasis web.

Dengan berkembangnya data penelitian, saat ini CIRAI melakukan

pengambilan data kematian didaerah penelitian dengan metode otopsi verbal,

tujuannya untuk mengidentifikasi penyebab kematian oleh symptoms influenza.

Dari kegiatan ini akan dihasilkan sebuah data otopsi verbal yang harus dikelola

oleh sistem untuk menghasilkan sebuah informasi berupa pendukung diagnosa

tentang identifikasi penyebab kematian oleh symptoms influenza, dengan acuan

(45)

Dimana pada modul aplikasi yang sudah ada, untuk membuat sebuah laporan

setiap modulnya, masih dilakukan secara manual oleh dokter penelitian. Manual

disini maksudnya, setelah data masuk ke database sistem, dokter akan

mendownloadnya dalam bentuk file excel, dan akan mengolahnya secara manual

untuk menghasilkan informasi yang dibutuhkan. Berikut ini adalah alur prosedur

dari sistem otopsi verbal yang sedang berjalan:

(46)

3.1.2 Analisis Masalah

Dari analisis sistem yang sedang berjalan, dapat dilihat bahwa

permasalahan dalam sistem penelitian CIRAI adalah dibutuhkan sebuah modul

aplikasi yang dapat mengelola data otopsi verbal dan menghasilkan informasi

berupa hasil identifikasi penyebab kematian oleh symptoms influenza untuk setiap

kasus otopsi verbal yang ada dengan acuan data korespondensi penyebab

kematian untuk otopsi verbal dengan kode ICD-10.

3.1.3 Solusi yang ditawarkan

Dari permasalahan yang telah dipaparkan dalam analisis masalah, maka

dapat disimpulkan bahwa saat ini pihak penelitian CIRAI membutuhkan sebuah

modul aplikasi otopsi verbal yang dapat mengelola data kematian dan

mengolahnya menjadi sebuah informasi dalam bentuk prediksi identifikasi

penyebab kematian dengan menggunakan acuan data korespondensi daftar

penyebab kematian untuk otopsi verbal dan hubungannya dengan kode ICD-10.

Untuk aplikasi otopsi verbalnya sendiri, berdasarkan bentuk form manual

otopsi verbal standar WHO yang komplek dengan pengkodean serta kondisi

disetiap pertanyaannya, penulis memberikan solusi sebuah aplikasi yang user

friendly dengan validasi disetiap pertanyaannya untuk meminimalisasi kesalahan

input data. Sedangkan untuk penyajian informasi dalam bentuk identifikasi

penyebab kematian, salah satu solusi yang dapat diterapkan adalah dengan data

mining, karena data mining dapat ‘menggali’ knowledge yang tersimpan dalam

(47)

verbal. Teknik mining yang akan digunakan adalah teknik Classification berupa

decision tree. Dan jenis tree yang akan diterapkan adalah forward chaining tree,

dimana algoritma forward chaining ini dapat menjawab kebutuhan penelitian,

karena menggunakan data symptoms influenza sebagai fakta dan data

korespondensi penyebab kematian untuk otopsi verbal dengan kode ICD-10

sebagai kaidah untuk memperoleh suatu kesimpulan.

3.1.4 Analisis Data

Dari analisa sistem yang akan dibangun, dapat diusulkan struktur data

yang akan digunakan oleh sistem. Dalam hal ini data dibagi menjadi dua kategori,

yaitu data pengolahan otopsi verbal, dan data siap mining dari data pengolahan

otopsi verbal tersebut. Usulan struktur data pengolahan otopsi verbal tersebut

terdiri dari tabel t_vo, t_vo_kematian, t_vo_observasi, t_vo11,t_vo12, t_vo12 ,

t_vo22, t_vo31, t_vo32 dan t_vo33. Pembagian tabel tersebut didasarkan pada

pola form dan design form aplikasi yang sesuai dengan form manual otopsi

verbal. Berikut tabel deskripsi dari pembagian tabel – tabel tersebut :

Tabel 3.1 Deskripsi masing – masing tabel otopsi verbal

No Tabel Deskripsi

1 t_vo Tabel utama, berisi informasi umum dari form otopsi verbal

2 t_vo_kematian Tabel yang berisi catatan riwayat kematian termasuk surat kematian 3 t_vo_observasi Tabel yang berisi informasi hasil

(48)

4 t_vo11 Tabel yang berisi informasi Penyakit atau kejadian yang mengarah pada kematian, untuk kategori umur 1 (usia kematian dibawah 4 minggu)

5 t_vo12 Tabel yang berisi informasi gejala sebelum kematian, untuk kategori umur 1 (usia kematian dibawah 4 minggu)

6 t_vo21 Tabel yang berisi informasi Penyakit atau kejadian yang mengarah pada kematian, untuk kategori umur 2 (usia kematian 4 minggu - 14 tahun)

7 t_vo22 Tabel yang berisi informasi gejala sebelum kematian, untuk kategori umur 2 (usia kematian 4 minggu - 14 tahun)

8 t_vo31 Tabel yang berisi informasi Penyakit atau kejadian yang mengarah pada kematian dan cidera/kecelakaan, untuk kategori umur 3 (usia kematian 15 tahun keatas)

9 t_vo32 Tabel yang berisi informasi gejala penyakit pada wanita dan gejala yang berkaitan dengan kehamilan sebelum kematian, untuk kategori umur 3 (usia kematian 15 tahun keatas)

10 t_vo33 Tabel yang berisi informasi

perawatan dan pelayanan kesehatan saat masa akhir hidup almarhum, untuk kategori umur 3(usia kematian 15 tahun keatas)

Sedangkan untuk aplikasi data miningnya sendiri akan membutuhkan tabel

(49)

3.1.5 Analisis Data Mining

Metode yang digunakan dalam proses mining dalam melakukan pencarian

informasi mengenai identifikasi penyebab kematian disini menggunakan metode

Decision Tree. Dimana jenis decision tree yang digunakan adalah forward

chaining tree. Dalam penulisan tugas akhir ini akan dilakukan proses pencarian

informasi dari sekumpulan data atau fakta berupa influenza symptoms, untuk

menemukan suatu kesimpulan yang menjadi solusi dari permasalahan yang

dihadapi yaitu jenis verbal autopsy themes sebagai hasil identifikasi penyebab

kematian. Proses akan mencari kaidah-kaidah dalam basis pengetahuan yang

premisnya sesuai dengan data-data tersebut, kemudian dari kaidah-kaidah tersebut

diperoleh suatu kesimpulan. Sesuai landasan teori data mining yang dijelaskan

pada bab sebelumnya, berikut tahapan proses mining identifikasi penyebab

kematian pada penelitian CIRAI:

1. Pembersihan Data (Data Cleaning)

Proses data mining dalam aplikasi ini terdiri dari dua sumber data, yaitu data

otopsi verbal hasil dari modul pengolahan otopsi verbal dalam aplikasi ini

sendiri dan data korespondensi hasil penyebab kematian dengan ICD – 10.

Kedua data tersebut mempunyai atribut-atribut data yang tidak relevan yang

perlu dibersihkan, berikut keterangan proses pembersihan data tersebut :

1.1Pembersihan Data Korespondensi Hasil Penyebab Kematian dengan

(50)

Dari batasan masalah yng ada, bahwa aplikasi ini dibatasi pada symptoms

influenza saja, maka proses pembersihan data dalam proses mining disini adalah

menghilangkan noise untuk field symptoms influenza. Data yang digunakan

untuk proses mining disini terdiri dari dua sumber data, yaitu data otopsi verbal

dan data korespondensi penyebab kematian untuk otopsi verbal dengan kode

ICD-10. Penghilangan noise pada data ICD-10, dilakukan dengan melakukan

pencocokan dengan symptoms influenza yang akan digunakan sesuai keterangan

pakar. Data ICD-10 dalam bentuk PDF, contohnya untuk kasus tema otopsi

verbal Campak, symptoms fotopobia dan tidak mendapat vaksin campak, tidak

terdapat pada data otopsi verbal, maka dihilangkang, seperti terlihat pada

gambar berikut:

(51)

1.2Pembersihan Data Otopsi Verbal

Data symptoms otopsi verbal menggunakan pengkodean disetiap

kontennya dimana pengkodean tersebut adalah sebagai berikut:

Tabel 3.3 Keterangan Pengkodean Data Symptoms Otopsi Verbal

No Kode Keterangan

1 1 Ya

2 2 Tidak

3 998 Tidak Tahu

Dari pengkodean tersebut, maka data symptoms yang akan dipakai hanya

data dengan isian 1 yang artinya Ya. Contohnya data symptoms dapat

dilihat pada isi tabel t_vo33 yang berisi symptoms untuk kematian kategori

umur diatas 15 tahun berikut ini:

Tabel 3.4 Contoh Data Symptoms Sebelum Dibersihkan

id_vo vo901 vo902 vo903 vo904 vo905 vo906 vo907 vo908 vo909 vo910

2. Seleksi Data (Data Selection)

Proses ini merupakan proses pemilihan data penelitian CIRAI yang akan

(52)

penentuan symptoms influenza yang telah dilakukan, maka hanya beberapa

field dari beberapa tabel yang akan digunakan, yaitu:

1. Tabel t_vo(id_vo, vo301)

2. Tabel t_vo12 (vo913, vo914,vo917,vo919,vo921,vo923)

3. Tabel t_vo22 (vo512,vo803, vo804, vo808, vo809, vo824)

4. Tabel t_vo33 (vo512,vo902, vo903,vo907,vo908,vo933)

Pemilihan atribut tersebut merupakan hasil analisis dari data korespondensi

penyebab kematian untuk otopsi verbal dengan kode ICD-10 dengan tabel

otopsi verbal terpilih. Dari data korespondensi penyebab kematian untuk

otopsi verbal dengan kode ICD-10 dipelajari dan dipilih symptoms influenza

dan kemudian di cocokkan dengan attribute dari tabel t_vo12, t_vo22 dan

t_vo33. Setelah dianalisis, symptoms influenza tersebut tidak sama antara

masing - masing tabel t_vo12, t_vo22 dan t_vo33, karena symptoms untuk

masing – masing kategori umur akan berbeda. Dan berikut keterangan dari

setiap atribut tersebut:

Tabel 3.5 Keterangan Atribut

Tabel Atribut Keterangan

t_vo id_vo Id otopsi verbal t_vo vo301 Nama almarhum t_vo12 vo906 kejang

t_vo12 vo911 penurunan_kesadaran t_vo12 vo913 demam

(53)

t_vo22 vo803 demam

t_vo22 vo806 demam_turun_naik t_vo22 vo807 menggigil

t_vo22 vo808 batuk t_vo22 vo809 batuk_3mgg t_vo22 vo812 napas_cepat t_vo22 vo814 dispnea t_vo22 vo815 dispnea_3mgg t_vo22 vo818 mengi

t_vo22 vo841 penurunan_kesadaran t_vo22 vo844 kejang

t_vo22 vo851 urin_sedikit t_vo22 vo852 ruam t_vo22 vo856 _{mata_merah} t_vo22 vo858 penurunan_berat t_vo22 vo863 bengkak

t_vo33 vo902 demam

t_vo33 vo905 demam_turun_naik t_vo33 vo907 batuk

t_vo33 vo908 batuk_3mgg t_vo33 vo989 penurunan_berat t_vo33 vo982 ruam

t_vo33 vo960 penurunan_kesadaran t_vo33 vo963 kejang

(54)

3. Integrasi Data (Data Integration)

Dalam penulisan tugas akhir kali ini diasumsikan bahwa data yang diambil

sudah berupa tabel-tabel dalam satu server. Dari sumber data yang sudah

dijabarkan sebelumnya, berikut integrasi data yang diusulkan untuk

penyelesaian mining identifikasi penyebab kematian, dari data korespondensi

penyebab kematian untuk otopsi verbal dengan kode ICD-10 terbentuk tabel

t_tema, dari tabel otopsi verbal terpilih terbentuk tabel t_symptoms dimana

hubungan keduanya adalah many to many, maka menghasilkan tabel

t_temasymp sebagai tabel referensi. Berikut struktur tabel – tabel tersebut :

Tabel 3.6 Struktur Tabel t_symptoms

Field Type Null Default

id_symp int(11) No

Symptoms varchar(50) No Keterangan varchar(100) Yes NULL

Tabel 3.7 Isi Tabel t_symptoms

id_symp symptoms keterangan

1 demam Demam

2 demam_turun_naik Demam Turun Naik

3 batuk Batuk

4 batuk_3mgg Batuk kurang dari 3 minggu 5 penurunan_berat Penurunan Berat Badan

6 ruam Ruam

7 penurunan_kesadaran Penurunan Kesadaran

8 kejang Kejang

(55)

11 dispnea Dispnea / Sesak Napas 12 dispnea_3mgg Dispnea kurang dari 3

minggu 13 nyeri dada Nyeri Dada

14 dahak Produksi dahak meningkat 15 mata_merah Matah merah

16 bengkak Pembengkakan / Edema

17 mengi Mengi

Tabel 3.8 Struktur Tabel t_tema

Field Type Null Default

id_va int(11) No

kode_va varchar(8) Yes NULL tema_va varchar(100) Yes NULL

Tabel 3.9 Isi Tabel t_symptoms

id_va kode_va tema_va

1 VA-01.07 Campak 2 VA-01.10 Malaria

3 VA-01.13

Infeksi Saluran Napas Bawah (termasuk pneumonia dan bronkitis akut)

4 VA-05.01 Penyakit Paru Obstruktif Kronis 5 VA-05.02 Asma

Tabel 3.10 Struktur Tabel t_temasymp

Field Type Null Default Links to

(56)

Tabel 3.11 Isi Tabel t_temasymp

4. Tranformasi Data (Data Transformation)

Dalam proses ini data akan ditransformasikan ke dalam data yang siap untuk

di mining, hasil dari transformasi data ini menghasilkan tabel t_kasus. Proses

tranformasi dimulai dari proses pembersihan tabel t_kasus untuk user sedang

(57)

semua kategori umur untuk setiap kematian pada data otopsi verbal dan

hasilnya akan disimpan dalam tabel t_kasus. Berikut struktur tabel t_kasus :

Tabel 3.12 Struktur Tabel t_kasus

Field Type Null Default Links to

id_vo int(11) No t_vo -> id_vo

id_symp int(11) No t_symptoms -> id_symp id_user int(11) No user -> id_user

Tabel 3.13 Isi Tabel t_kasus

id_vo id_symp id_user

(58)