1. PENDAHULUAN
1.1. Latar Belakang
Dewasa ini sistem perekonomian dan seluruh aspek dalam kehidupan manusia berangsur–angsur berubah dari tingkat sistem industri menjadi sistem informasi dimana pada tingkat sistem ini tidak lagi mengandalkan kemajuan secara fisik yaitu kekuatan finansial dan kekuatan pengaruh namun mengandalkan kekuatan individu di dalam mengumpulkan informasi secara akurat. Tidak terkecuali di dalamnya adalah data–data baik itu data yang bersifat mentah ataupun yang bersifat olahan. Sehingga pencarian informasi menjadi perhatian secara khusus karena sangat berhubungan dengan mampu tidaknya pencari informasi mempertahankan kedudukannya di tengah persaingan dan perebutan informasi.
Dengan tingginya persaingan mencari informasi banyak yang mengharapkan disediakannya sebuah wadah untuk menampung semua informasi yang dibutuhkan dalam hal ini peran dunia maya atau cyber yang sangat dibutuhkan terutama di dalam pengiriman data dan informasi tanpa harus menggunakan alat yang secara fisik sangat besar dan merepotkan serta menghabiskan dana. Dengan adanya wadah cyber sehingga memunculkan sebuah wadah lain di dalam wadah cyber untuk menghubungkan informasi tersebut dengan si pencari informasi dan wadah tersebut adalah web engine atau sering disebut dengan search engine. Di dalam engine ini diharapkan bahwa si pencari informasi dapat lebih leluasa dan mudah di dalam mencari isi informasi (yang biasanya dikemas dalam bentuk abstrak–abstrak panjang untuk memudahkan di dalam membaca maupun menyusunnya). Kemudahan yang diharapkan dalam hal ini adalah kemudahan di dalam mencari isi informasi itu tanpa harus mencetaknya terlebih dahulu. Selain itu pembacaan informasi juga sangan membutuhkan dukungan dari sistem pencarian dan penyajian informasi yang cepat dan praktis serta mudah sehingga diharapkan
pula nantinya informasi tersebut menambah minat seseorang untuk mencari informasi (memperkaya ilmu baik itu untuk kepentingan bersama ataupun untuk kepentingan pribadi).
Namun pada kenyataannya yang terjadi adalah sebaliknya, pada dasarnya bukan menjadi sebuah kenyataan yang menyakitkan jika ternyata memang kenyataan kurang begitu bersahabat dengan harapan yang ditimbulkan karena dari kesemua itu di sebabkan sebelumnya teknologi untuk mencapai harapan itu masih belum ditemukan. Kenyataan yang dimaksud adalah kenyataan bahwa masih banyak search engine masih berkutat dengan metode lama di dalam mencari maupun menyajikan data sehingga hanya dapat memberikan informasi secara sepenggal dan untuk mengetahui penggalan yang lain dibuat supaya si pencari informasi membuka dan mencetaknya terlebih dahulu. Akibatnya pencarian dan penyajian data menjadi tidak praktis karena penyajian dilakukan secara membabi–buta karena pada dasarnya abstrak hanya disimpan tidak di–index.
Untuk memecahkan masalah ini tentu saja diperlukan sebuah teknologi lainnya untuk mengubah kenyataan itu mendekati harapan yang diinginkan.
Dalam hal ini teknologi yang dikedepankan adalah teknologi data mining, teknologi ini adalah sebauh teknologi yang dapat mengatur pencarian berdasarkan keywords yang dimasukkan kemudian dengan teknologi ini pencarian akan menghasilkan relasi antar abstrak, tiap-tiap relasi divisualisasikan dalam bentuk sebuah nilai. Dimana nilai ini akan menunjukkan seberapa dekat abstrak yang muncul tersebut dengan keywords yang dimasukkan, dan diasumsikan bahwa keywords yang dimasukkan mewakili apa yang akan dicari oleh user. Teknologi ini juga dikembangkan hingga membuat index dan mengklasifikasikannya ke dalam beberapa kelas yang relevan dengan isi dari abstrak yang diinginkan (clustering) dan kemudian menyajikannya secara berantai satu abstrak dengan abstrak yang lainnya (Text Mining Tools on the Internet An overview, Jan van Gemert, 2000).
Yang dimaksudkan berantai dalam pengertian ini adalah antara satu abstrak dengan abstrak yang lainnya saling mendukung baik fisik informasi ataupun
hubungan yang mengacu pada salah satu aspek di antara kedua abstrak tersebut.
Dalam tugas akhir ini penulis hendak menyajikan, menulis, merinci, dan meneliti teknologi ini serta membuatnya agar mampu untuk membantu para pencari informasi lainnya agar dapat menggunakan teknologi ini dalam rangak pencapaian harapan yang dimaksud.
1.2. Perumusan Masalah
Pada pokok masalah Tugas Akhir ini penulis yang hendak menulis, dan meneliti, serta membuat sebuah software search engine data mining dengan menggunakan Faster Algorithm. Beberapa masalah yang muncul adalah :
• Mengapa menggunakan data mining ?
• Kemudian mengapa pula menggunakan Faster Algorithm ?
• Bagaimana untuk data masukannya dan bagaimana pula cara memasukkannya ?
• Bagaimana untuk mengatur penilaian pada tiap-tiap abstrak dan bagiamana pula cara untuk menampilkannya di dalam struktur pencarian yang benar ?
• Bagaimana cara mencari abstrak yang benar-benar sesuai dengan yang sedang dicari ?
Masalah-masalah yang timbul pada awal perumusan masalah ini dapat dijawab dengan beberapa alasan dan didukung dengan beberapa alasan pendukung secara teoritis. Penggunaan data mining pada search engine ini semata–mata obyek yang akan diteliti adalah sebuah obyek yang berbentuk abstrak. Pada dasarnya teknologi data mining dibagi menjadi 2 bagian besar yaitu text mining dan binary mining. Masing–masing teknologi tersebut memiliki fungsi dan mekanisme yang berbeda antara satu dengan yang lain.
Abstrak merupakan sebuah obyek yang di dalam penyimpanan data fisik–nya hanya berupa karakter–karakter di dalam obyek tersebut tanpa adanya sebuah kompresi ataupun ekstraksi lainnya, sehingga penggunaan teknologi mining pada abstrak mekanismenya juga dibuat sesuai dengan apa yang ada di dalam
abstrak tersebut. Sedangkan untuk binary mining kebanyakan adalah merupakan teknologi mining yang digunakan untuk menangani obyek–obyek lainnya yang metode penyimpanannya menggunakan sistem binary untuk menghindari besarnya kapasitas yang didapatkan jika menyimpannya dalam bentuk obyek yang sesungguhnya.
Namun sesungguhnya penggunaan data mining ini ditujukan untuk relasi yang jelas antara abstrak satu dengan struktur yang sedang dicarinya, selain itu pengembangan yang lebih lanjut pula penggunaan teknologi ini akan membuat aplikasi memiliki fitur dan kemampuan untuk merelasikan abstrak satu dengan abstrak yang lainnya. Karena alasan-alasan maka teknologi ini nantinya dapat diterapkan secara sempurna pada aplikasi search engine ini.
Penggunaan algoritma faster algorithm untuk penyelesaian metode pencarian pada software ini disebabkan karena algoritma ini merupaka algoritma yang paling baik dibandingkan dengan algoritma–algoritma lainnya.
Algoritma ini mengesampingkan metode perulangan yang dimiliki oleh algoritma lainnya sehingga memungkinkan running time untuk pencarian abstrak akan sangat sedikit. Dan penurunan running time yang sedikit itu pula akan menyebabkan peningkatan perbaikan akan semakin besar dibandingkan dengan teknologi lama dari sudut pandang seorang user pencari abstrak.
Secara matematis diperkirakan peningkatan yang akan diperoleh adalah sebesar 40 % dibandingkan dengan teknologi lama.
Data yang dijadikan bahan obyek penelitian adalah abstrak-abstrak pada jurnal penelitian yang diterbitkan oleh Pusat Penelitian Universitas Kristen Petra dengan format pada saat dilakukan penelitian adalah .doc atau dengan menggunakan aplikasi Microsoft Word sebagai aplikasi pembacanya.
Informasi yang akan diambil dari abstrak kemudian dimasukkan ke dalam basis data untuk dilakukan pencarian data.
Penilaian pada tiap-tiap abstrak akan dilakukan dengan menggunakan penghitungan yang diperoleh dari algoritma Faster Algorithms, dimana perhitungan tersebut dilakukan dengan mencari nilai konfidensi yang diperoleh dari tiap-tiap abstrak sebagai abstrak yang dicari. Apa yang telah diproses untuk dicari nantinya akan ditampilkan dalam bentuk aplikasi web,
sehingga user dapat dengan mudah untuk melakukan proses pencarian dari satu item pencarian ke item yang lainnya. Tampilan pencarian akan ditampilkan secara physically sehingga bentuk pencarian nantinya akan berdasarkan pada pilihan pencarian yang dicari dan juga nantinya pencarian juga didasarkan pada nilai yang nantinya keluar sebagai hasil perhitungan dengan menggunakan Faster Algorithms.
1.3. Tujuan Tugas Akhir
Tujuan yang hendak dicapai penulis dalam menyusun, merinci dan meneliti Tugas Akhir ini adalah untuk membuat sebuah bentuk aplikasi pencarian dimana aplikasi ini memuat di dalamnya ekstraksi abstrak yang dicari hingga proses untuk pemilahannya menjadi subyek-subyek kecil dan tujuan yang lain adalah membuat sebuah bentuk aplikasi web sebagai sarana lain untuk menampilkan apa yang dilakukan pada bentuk aplikasi pencariannya. Selain tujuan di atas harapan yang ditimbulkan oleh penulis adalah sebuah aplikasi yang dapat mencari dokumen sesuai dengan yang diharapkan oleh pengguna.
Demikian pula dengan proses-proses yang mendukung terciptanya tujuan yang diharapkan penulis. Proses yang diharapkan ada pada aplikasi ini adalah proses pengecekan dokumen (proses untuk memeriksa apakah dokumen sudah sesuai dengan yang diminta), proses parsing dokumen (proses dimana isi dokumen yang sesuai dengan kriterianya diambil dan disimpan ke dalam basis data), proses indexing (proses dimana isi dokumen yang telah disimpan ke dalam basis data dipisah, dihilangkan dan diproses sedmikian rupa sehingga hasilnya adalah sebuah bentuk kata-kata yang akurasi pencariannya mencapai 80%), proses pencarian (proses untuk mencari dokumen yang sesuai dengan yang dicari, menggunakan perhitungan nilai untuk meyakinkan pengguna bahwa hasil tampilan dokumen tersebut adalah dokumen yang dicari), tampilan bagian yang dicari (proses untuk menampilkan bagian-bagian kata yang dicari di dalam kumpulannya sebagai bagian dari struktur yang sedang dicari-tampilan diharapkan mengguna style Bold untuk menunjukkan bahwa bagian itulah yang sedang dicari), dan yang
terakhir diharapkan aplikasi ini mampu meng-cover akurasi hingga 90%
sesuai dengan pencarian yang diharapkan oleh pengguna.
1.4. Ruang Lingkup
Pada dasarnya pembuatan aplikasi ini terbagi menjadi dua bagian besar.
Kedua bagian besar itu adalah :
• Search Engine
Bagian ini merupakan bagian aplikasi dimana aplikasi yang ada dibuat sedemikian hingga agar semua proses dapat ter-cover di dalam aplikasi ini. Adapun proses yang akan di-cover adalah proses untuk input abstrak, proses parsing abstrak, proses indexing abstrak, proses penilaian dan proses pencariannya. Proses input abstrak menggunakan bahasa pemrograman Java sebagai basis bahasa pemrograman ibunya.
Proses parsing abstrak disini menggunakan komponen JACOB sebagai obyek transfer informasi dari abstrak yang ber-format .doc menjadi bagian-bagian kecil berdasarkan struktur abstrak yang ingin diambil.
Sedangkan proses indexing-nya menggunakan salah satu fitur canggih yang dimiliki oleh Oracle 9i, yaitu Oracle Text 9.2.
Di dalam fitur ini nantinya akan digunakan beberapa hal yang seyogyanya dibutuhkan secara implisit pada saat dilakukan indexing, diantaranya tipe data CLOB ( Character Large Object ) sebagai tipe data di mana difungsikan untuk tipe data bagi retrieval information yang diperoleh pada proses parsing abstrak, Stop Word sebagai fungsi untuk menghilangkan kata-kata yang tidak diperlukan dimana kata- kata tersebut nantinya akan dimasukkan ke dalam basis data, dan index function untuk mengubah informasi yang besar tersebut menjadi subyek-subyek yang kecil.
Proses berikutnya adalah proses pemberian nilai pada tiap-tiap dokumen. Di dalam proses ini pemberian nilai diberikan dengan menggunakan algoritma faster algorithms dimana tiap-tiap dokumen akan diberikan nilai sesuai dengan pencarian itemset yang diambil dari kombinasi kalimat yang hendak dicari. Penentuan nilai nantinya akan
ditentukan pada sub bab berikutnya, sedangkan untuk proses pencariannya dengan menggunakan basis web dan menggunakan bahasa web programming JSP (Java Server Pages). Kesemuanya itu dilakukan dan didasarkan pada asumsi sendiri pada saat diimplementasikan di dalam bab empat.
• Web Engine
Bagian ini merupakan bagian kedua di dalam pembuatan tugas akhir ini yaitu bagian penampilan hasil yang diproses pada bagian sebelumnya. Tampilan dilakukan di atas platform JSP. Secara mekanisme tampilan di dalam web hanya akan dilakukan pada abstrak- abstrak yang memiliki nilai di atas standar minimum support, nilai seberapa percayanya sistem pada hasil pencarian yang telah dilakukan.
Dalam hal ini penentuan nilai tersebut masih belum terperinci dengan baik.
Sebagai bahan dasar atau bahan baku pembuatan aplikasi ini tentu saja tidak lupa penggunaan software juga menjadi bahan yang menentukan kualitas dari aplikasi ini, diantaranya :
- Platform yang digunakan adalah Microsoft Windows 2000 Server.
- Desain pembuatan web menggunakan Macromedia Dreamweaver MX.
- Bahasa pemrograman web yang digunakan adalah Java Script Pages.
- Database yang digunakan adalah Oracle 9i dengan spesifikasi tool yang digunakan adalah Oracle Text
- Web server yang digunakan adalah Allaire JRun Web Server.
- Bahasa pemrograman Data Mining menggunakan Java Programming.
1.5. Metode Penelitian
Pembuatan dan pengembangan aplikasi web ini akan dilaksanakan dalam beberapa tahap :
1.5.1. Tahap Observasi.
Dalam tahap ini, dikumpulkan informasi yang diperlukan untuk mendefinisikan user requirement. Disini didapatkan gambaran tentang indeks saham seperti apa dan apa saja dibutuhkan oleh seorang user di
dalam melihat dan memutuskan keputusannya tentang indeks saham.
Dalam tahap ini juga akan dilakukan Studi Literatur, yaitu dengan mengumpulkan bahan–bahan dan pembelajaran berbagai bahasa pemrograman terutama bahasa pemrograman Java dalam hal ini Java sebagai bahasa utama di aplikasi pencariannya JSP sebagai bahasa web programming serta Oracle sebagai basis utama database yang digunakan.
1.5.2. Tahap Desain Sistem.
Tahap ini merupakan aktualisasi dari hasil analisa yang telah diperoleh.
Dari rancangan alur diagram informasi yang sudah ada, dilakukan desain sistem baik itu dari segi interface–nya maupun segi database–nya dengan feature yang sesuai dengan semua user requirement yang sudah di definisikan, dalam tahap ini juga dibuatkan juga database web, yaitu database yang berisi data–data abstrak yang dimasukkan oleh administrator. Desain sistem pada tahap ini berupa prototyping sistem.
1.5.4. Tahap Pembuatan Aplikasi.
Pada tahap ini, prototyping yang dinilai sudah sesuai dengan keinginan user tersebut akan dikembangkan lebih lanjut sehingga semua feature – nya dapat disajikan dengan baik. Untuk mendukung pembuatan aplikasi ini digunakan bahasa pemrograman Java, JSP, HTML dilengkapi dengan semua library yang dimiliki ke – tiga bahasa tersebut.
1.5.5. Tahap Pengujian dan Implementasi.
Di dalam tahap ini akan dilakukan pengujian pada kondisi lingkungan yang sebenarnya terutama untuk mengetahui berbagai kelebihan dan kekurangan aplikasi ini. Contoh aspek yang akan dijadikan bahan antara lain: waktu proses (running-time), ketepatan dan sebagainya.
1.5.6. Tahap Pemeliharaan dan Jaminan Kualitas.
Didalam tahap ini, software yang sudah selesai diimplementasikan dan diujikan akan diberi pemeliharaan dan jaminan kualitas (maintenance).
1.5.7. Kesimpulan dan Saran.
1.6. Sistematika Penyusunan
BAB 1 : PENDAHULUAN
Berisi latar belakang masalah, tujuan pembuatan Tugas Akhir, perumusan masalah, ruang lingkup, dan metodologi penelitian yang dipakai.
BAB 2 : LANDASAN TEORI
Berisi berbagai teori yang berhubungan dengan algoritma yang digunakan untuk proses indexing.
BAB 3 : DESAIN SISTEM
Berisi semua langkah – langkah di dalam pembuatan program ini sehingga di dalamnya akan dimuat semua hal yang berhubungan dengan program ini.
BAB 4 : IMPLEMENTASI PERANGKAT LUNAK
Berisi perencanaan pembuatan keseluruhan sistem dalam aplikasi yang akan dibuat.
BAB 5 : PENGUJIAN SISTEM DAN APLIKASI
Berisi penjelasan dan hasil pengujian yang dilakukan terhadap aplikasi yang dibuat.
BAB 6 : KESIMPULAN DAN SARAN
Berisi kesimpulan dari hasil pengujian perangkat lunak dan beberapa saran untuk pengembangan lebih lanjut.