PENDAHULUAN
1.1. Latar Belakang Masalah
Perkembangan teknologi informasi telah mampu mengubah persepsi manusia terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas. Informasi telah menjadi hal yang sangat berharga dan sangat diminati saat ini. Bahkan, kini banyak perusahaan yang rela membayar mahal untuk memperoleh sejumlah informasi. Hal ini jelas berkaitan dengan berkembangnya teknologi dunia pada saat ini. Jika sepuluh atau dua puluh tahun yang lalu informasi hanya dipandang sebagai faktor penunjang dalam proses produksi, saat ini informasi telah diperhitungkan sebagai salah satu faktor utama. Memang secara klasik para praktisi dan akademisi memandang sistem informasi hanya sebagai fungsi pendukung dalam operasi perusahaan. Namun sekarang, praktisi dan akademisi telah memandang sistem informasi sebagai suatu ‘kunci’ bagi perusahaan untuk memperoleh keunggulan kompetitif. Untuk selanjutnya, pembahasan informasi pada tulisan ini akan lebih difokuskan dalam bidang bisnis.
Dunia bisnis yang penuh persaingan membuat para pelakunya harus selalu memikirkan strategi-strategi terobosan yang dapat menjamin kelangsungan bisnis mereka. Salah satu aset utama yang dimiliki oleh perusahaan masa kini adalah data bisnis dalam jumlah yang luar biasa banyak. Namun, kadang kala data-data tersebut hanya dikumpulkan dan didokumentasikan tanpa diproses lebih lanjut menjadi informasi-informasi yang lebih berguna untuk perkembangan perusahaan. Banyaknya data menjadi salah satu masalah tersendiri bagi perusahaan. Penumpukan data yang boleh dibilang tidak bermanfaat, sering juga disebut sebagai “Rich Of Data But Poor Of
Information” atau biasa juga disebut sebagai “Kuburan Data”. Padahal, jika dicermati, pada faktanya data-data tersebut mengandung variabel-variabel informasi yang sering kali tidak terlihat secara kasat mata. Hal ini menimbulkan kebutuhan akan adanya teknologi yang dapat memanfaatkannya untuk membangkitkan “pengetahuan-pengetahuan” baru, yang dapat membantu dalam pengaturan strategi bisnis. Teknologi data mining hadir sebagai solusi. Skripsi ini akan mengulas permasalahan bisnis yang ada dan dasar-dasar data mining melalui bahasan kegunaan, cara kerja dan metodologi-metodologi populer pada teknologi ini.
Bagi sebuah perusahaan berskala kecil ataupun menengah, pengolahan data dapat dilakukan dengan sistem database yang sederhana. Namun, bagi perusahaan yang bergerak dalam skala yang lebih besar, yang memiliki sejumlah item yang sangat banyak untuk dipasarkan, sistem database sederhana akan menjadi kurang efektif dan efisien untuk mengatasi setiap transaksi yang terjadi. Data yang ada akan sangat sulit diproses sehingga akan semakin sulit pula bagi perusahaan untuk menemukan sejumlah informasi yang diinginkan. Apalagi, tingkat persaingan dalam dunia bisnis sudah mencapai level yang sangat tinggi akibat dibukanya pasar bebas dalam era ini. Karena itu para manajer perusahaan dituntut untuk secara cepat dan tepat menghasilkan keputusan yang bermanfaat bagi perusahaan. Dengan demikian, diperlukan suatu sistem komputerisasi yang mampu membantu manajer dalam tugasnya mengambil keputusan.
Data mining memang salah satu cabang ilmu komputer yang relatif baru. Sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dan sebagainya. Ada pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau analisis statistik yang berjalan atas dasar database.
Namun pihak lain berpendapat bahwa database berperanan penting dalam data mining karena data mining mengakses data yang ukurannya besar (sampai terabyte) dan terlihat peran penting database terutama dalam optimisasi query-nya. Definisi sederhana dari data mining adalah ekstraksi informasi atau pola yang penting atau menarik dari data yang ada di database yang besar. Dalam jurnal ilmiah, data mining juga dikenal dengan nama Knowledge Discovery in Databases (KDD).
1.2 Ruang Lingkup
Perumusan masalah yang ingin dirancang dalam skripsi ini adalah cara menciptakan suatu aplikasi data mining yang dapat diterapkan disebuah lembaga pendidikan. Aplikasi data mining diharapkan dapat membuat peningkatan secara maksimal untuk bagian marketing dari lembaga pendidikan tersebut.
Ruang lingkup pada skripsi ini dibatasi sebagai berikut.
− Data yang digunakan dalam aplikasi merupakan data-data yang ada pada Lembaga Pendidikan Global Lingua “Easy English”.
− Data yang digunakan merupakan data perusahaan selama periode tertentu, dan bukan merupakan data terbaru dengan alasan menjaga privasi perusahaan.
− Adanya fasilitas login yang bertujuan membatasi user yang berwenang menggunakan program aplikasi ini.
− Program akan mengelompokan data menjadi cluster-cluster berdasarkan kemiripan satu data dengan data yang lain.
− Pembuatan aplikasi data mining menggunakan metode item’s clustering, yaitu Clustering Large Application based on Randomized Search dan metode item’s classification, yaitu Naive Bayes Classification.
− Program yang dibuat hanya akan memberikan informasi yang bersifat membantu manajer dalam operasional perusahaan, tanpa menawarkan suatu solusi pemecahan masalah.
1.2.1 Komponen Perancangan
Komponen perancangan yg terlibat dalam sistem inin adalah sistem operasi, bahasa pemrograman dan Database Management System (DBMS). Sistem operasi yang digunakan adalah Microsoft Windows sebagai sistem operasi yg paling umum digunakan. Bahasa pemrograman menggunakan Delphi 7.0. Database Management System (DBMS) menggunakan SQL Server 2000 yg digunakan dalam mengimplementasikan aplikasi.
1.3 Tujuan dan Manfaat 1.3.1 Tujuan
Tujuan dari skripsi ini adalah sebagai berikut.
− Menerapkan metode clustering dan classification pada data perusahaan. − Mengelompokan data item menjadi cluster-cluster dengan tingkat similaritas
tertentu antar cluster sehingga memudahkan user untuk menggali informasi yang mungkin akan dimunculkan dari aplikasi yang dibuat.
1.3.2 Manfaat
Manfaat dari program aplikasi ini adalah membantu manajer dalam mengidentifikasi data yang telah terbagi dalam cluster-cluster, sehingga bila ada informasi yang tergali, manajer dapat dengan cepat dan tepat menindaklanjutinya.
Hal ini selain akan menghemat waktu operasional perusahaan, juga dapat meningkatkan kinerja perusahaan secara keseluruhan, sehingga mampu memberi kontribusi yang cukup besar terhadap perkembangan perusahaan.
1.4 Metodologi
. Langkah-langkah dalam pengerjaan skripsi akan dijelaskan sebagai berikut. a. Studi literatur mengenai :
− Teori tentang data mining dan algoritma-algoritmanya.
− Teori tentang clustering beserta algoritma Clustering Large Application based on Randomized Search .
− Teori tentang classification beserta algoritma Naive Bayes Classification.
− Data mining dengan menggunakan Delphi 7.0 dan SQL Server 2000. b. Pengumpulan data
Data input didapat dari perusahaan tempat studi kasus, yakni Lembaga Pendidikan Global Lingua “Easy English”.
c. Perencanaan dan Pembuatan Perangkat Lunak:
− Pengolahan raw data yang ada, sesuai dengan format yang dapat diolah oleh SQL Server 2000 (Preprocessing).
− Pengelompokan data melalui metode Clustering Large Application based on Randomized Search.
− Pengklasifikasian data melalui metode Naive Bayes Classification. − Modul analisis data dengan menggunakan Delphi 7.0
d. Pengujian dan Analisis Perangkat Lunak
− Pengujian program aplikasi yang telah dibuat. − Analisis hasil output dari program aplikasi. e. Pengambilan Kesimpulan
Pengambilan kesimpulan dengan membandingkan hasil output program dengan kenyataan di lapangan. Sedapat mungkin dilakukan perbaikan-perbaikan sehingga mendapatkan hasil yang maksimal.
1.5 Sistematika Penulisan
Untuk mempermudah mendapat gambaran tentang isi dari pembahasan skripsi ini, disusunlah bab-bab berikut ini.
Bab 1 Pendahuluan
Bab ini akan diuraikan mengenai latar belakang masalah, ruang lingkup masalah, tujuan dan manfaat pembahasan masalah, metodologi penelitian serta sistematika penulisan.
Bab 2 Landasan Teori
Dalam bab ini diuraikan mengenai metode, konsep serta teori-teori umum dan khusus yang relevan dan berguna dalam memecahkan masalah yang sedang dihadapi, yang diambil dari berbagai sumber pustaka.
Bab 3 Perancangan Program
Dalam bab ini akan diuraikan profil perusahaan, spesifikasi rancangan yang akan dibuat, analisa tentang keperluan dari program, bagaimana proses yang terjadi, data-data yang diperlukan serta menampilkan STD (State Transition Diagram) dari rancangan.
Bab 4 Implementasi dan Evaluasi
Pada bab ini akan dijelaskan mengenai hasil yang diperoleh dari data yang digunakan dan penjelasan serta maksud dari hasil yang diperoleh.
Bab 5 Kesimpulan dan Saran
Pada bab ini akan diberikan kesimpulan dari hasil perancangan program berdasarkan penulisan dari bab-bab sebelumnya, dan saran-saran untuk pengembangan lebih lanjut.