Membahas berbagai konsep dasar dan teori-teori yang berkaitan dengan topik masalah yang diambil dan hal-hal yang berguna dalam proses analisis permasalahan.
BAB III ANALISIS DAN PERANCANGAN
Menganalisis masalah dari model penelitian untuk memperlihatkan keterkaitan antar variabel yang diteliti serta model matematis untuk analisisnya.
BAB IV IMPLEMENTASI DAN PENGUJ IAN
Membahas mengenai pengimplementasian aplikasi yang telah dibuat ke perangkat yang akan digunakan serta melakukan pengujian terhadap aplikasi yang telah diimplementasikan tersebut.
BAB V KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran yang sudah diperoleh dari hasil penulisan tugas akhir.
2.1. Definisi Data Dan Konsep Dasar Infor masi
Konsep Informasi tidak akan lepas dari keterhubungan dengan data. Untuk mendapatkan Informasi yang valid maka dibutuhkan data-data yang berhubungan antara satu dengan yang lain agar output sesuai dengan yang diharapkan.
2.1.1. Data
Data adalah kumpulan dari fakta-fakta, kejadian-kejadian yang dapat berupa simbol, angka, huruf, dan lain-lain yang berguna bagi suatu pengolahan data (proses) atau sebagai masukan (input) bagi suatu proses. Data merupakan deskripsi dari sesuatu dan kejadian yang kita hadapi.
2.1.2. Infor masi
Informasi adalah “hasil dari pengolahan data menjadi bentuk yang lebih berguna bagi yang menerimanya, yang menggambarkan suatu kejadian nyata dan dapat digunakan sebagai alat bantu dalam pengambilan suatu keputusan”
(Jogiyanto, 2005). Dalam hal ini data bisa dianggap sebagai obyek yang masih mentah yang belum dapat memberikan arti banyak bagi pemakai sehingga perlu diolah lebih lanjut untuk menghasilkan suatu informasi yang dibutuhkan, sedangkan informasi adalah suatu subyek yang bermanfaat bagi penerimanya. Dengan katalain informasi adalah hasil dari pengolahan atau pemrosesan data. 2.1.3. Kualitas Infor masi
a. Akurat ( accurate )
Informasi harus bebas dari kesalahan-kesalahan dan tidak menyesatkan, dalam hal ini informasi harus jelas mencerminkan maksudnya.
b. Tepat waktu ( time lines )
Informasi yang datang pada penerima tidak boleh terlambat. Informasi yang sudah usang tidak akan mempunyai nilai lagi karena informasi merupakan suatu landasan dalam mengambil sebuah keputusan dimana bila pengambilan keputusan terlambat maka akan berakibat fatal untuk organisasi.
c. Relevan ( relevance )
Informasi harus mempunyai manfaat untuk pemakainya, dimana relevansi informasi untuk tiap-tiap individu berbeda tergantung pada keperluan.
2.1.4. Nilai Infor masi
Nilai dari Informasi (value of information) ditentukan dari dua hal, yaitu manfaat dan biaya mendapatkannya. Suatu Informasi dikatakan bernilai bila manfaatnya lebih efektif dibandingkan dengan biaya mendapatkannya. Kegunaan Informasi adalah untuk mengurangi hal ketidakpastian di dalam proses pengambilan keputusan tentang suatu keadaan.
2.1.5. Siklus Infor masi
Data agar menjadi lebih berarti dan berguna dalam bentuk informasi, maka perlu diolah melalui suatu model tertentu. Data yang telah diolah tersebut kemudian diterima oleh penerima, lalu penerima membuat suatu keputusan dan melakukan tindakan, yang berarti menghasilkan suatu tindakan yang lain yang akan membuat sejumlah data kembali. Data tersebut akan ditangkap sebagai input, dan diproses kembali lewat suatu model dan seterusnya sehingga membentuk
suatu siklus. Siklus ini disebut dengan siklus Informasi (information cycle) atau disebut pula siklus pengolahan data (processing cycles).
Gambar 2.1. Siklus Informasi 2.3. Konsep Dasar Sistem Infor masi
Sistem Informasi adalah “suatu jaringan dari beberapa elemen-elemen yang saling berhubungan serta membentuk satu kesatuan untuk menyediakan informasi yang dibutuhkan oleh organisasi untuk beroperasi dengan cara yang sukses, serta memberi sinyal kepada manajemen dan yang lain terhadap kejadian internal dan eksternal yang penting dan menyediakan suatu dasar informasi untuk pengambilan keputusan” (Wahyono,2004)
2.3.1. Komponen Sistem Informasi
Membangun suatu sistem Informasi diperlukan penggabungan elemen-elemen pendukung tersebut antara lain :
a. Software, merupakan suatu program komputer, struktur data, dan dokumen-dokumen yang saling berhubungan yang digunakan dalam metode logika dan prosedur yang dibutuhkan.
b. Hardware, merupakan perangkat elektronik yang memiliki kemampuan untuk melakukan proses komputerisasi.
c. Brainware, adalah pengguna dan operator perangkat keras atau perangkat lunak.
d. Data, berupa salinan-salinan manual dan deskripsi informasi yang menggambarkan operasi sistem.
2.3.2. Tujuan Sistem Infor masi
Sistem Informasi memiliki beberapa tujuan, yaitu: 1. Integrasi sistem
a. Menghubungkan sistem individu/kelompok
b. Pengkolektifan data dan penyambungan secara otomatis c. Peningkatan koordinasi dan pencapaian sinergi
2. Efisiensi pengelolaan
a. Penggunaan basis data dalam upaya kesamaan pengadministrasian data b. Pengelolaan data berkaitan dengan karakteristik Informasi
c. Penggunaan dan pengambilan Informasi 3. Dukungan keputusan untuk manajemen
a. Melengkapi Informasi guna kebutuhan proses pengambilan kebutuhan b. Akuisisi Informasi eksternal melalui jaringan komunikasi
c. Ekstraksi dari Informasi internal yang terpadu.
2.2. Aplikasi Temu Kembali Informasi
Temu kembali informasi (information retrieval) adalah ilmu pencarian informasi pada dokumen, pencarian untuk dokumen itu sendiri, pencarian untuk
metadata yang menjelaskan dokumen, atau mencari di dalam database, baik relasi database yang stand-alone atau hipertext database yang terdapat pada network seperti internet atau World Wide Web atau intranet, untuk teks, suara, gambar, atau data. Information retrieval (IR) adalah ilmu yang lahir dari berbagai disiplin ilmu, baik ilmu komputer, matematika, ilmu kepustakaan, ilmu informasi, psikologi kognitif, linguistik, statistik, maupun fisika.
Secara prinsip, penyimpanan informasi dan penemuan kembali informasi adalah hal yang sederhana. Misalkan terdapat tempat penyimpanan dokumen-dokumen dan seseorang (user) merumuskan suatu pertanyaan (request atau query) yang jawabannya adalah himpunan dokumen yang mengandung informasi yang diperlukan yang diekspresikan melalui pertanyaan user. User bisa saja memperoleh dokumen-dokumen yang diperlukannya dengan membaca semua dokumen dalam tempat penyimpanan, menyimpan dokumen-dokumen yang relevan dan membuang dokumen lainnya. Hal ini merupakan perfect retrieval, tetapi solusi ini tidak praktis. Karena user tidak memiliki waktu atau tidak ingin menghabiskan waktunya untuk membaca seluruh koleksi dokumen, terlepas dari kenyataan bahwa secara fisik user tidak mungkin dapat melakukannya. Oleh karena itu, diperlukan suatu sistem temu kembali informasi (information retrieval system) untuk membantu user menemukan dokumen yang diperlukannya.
Sistem temu-kembali informasi pada prinsipnya adalah suatu sistem yang sederhana. Misalkan ada sebuah kumpulan dokumen dan seorang user yangmemformulasikan sebuah pertanyaan (request atau query). Jawaban dari pertanyaan tersebut adalah sekumpulan dokumen yang relevan dan membuang dokumen yang tidak relevan.
Sistem temu-kembali informasi pada dasarnya dibagi dalam dua komponen utama yaitu sistem pengindeksan (indexing) yang menghasilkan basis data sistem dan temu-kembali yang merupakan gabungan dari user interface dan look-uptable. Pada bagian selanjutnya akan dijelaskan berbagai macam sistem pengindeksan dan teknik-teknik temu-kembali informasi yang telah dikembangkan.
Hiperteks dan temu-kembali informasi merupakan bidang penelitian yang berbeda satu dengan yang lain. Hiperteks berkisar pada masalah user-disorientation, strategi pengembangan dokumen hiperteks, dan mekanisme konversi dokumen tekstual menjadi bentuk hiperteks (Ellist,1996). Sedangkan temu-kembali informasi bergerak pada topik manipulasi kueri, konsep basis data tekstual, dan relevansi dokumen terhadap kueri (Bodhitama,1997). Penggabungan kedua bidang ini dapat memecahkan masalah-masalah dalam bidang temu kembali informasi. Misalnya, sistem temu-kembali informasi yang didasarkan pada penggunaan operator Boolean, mengandalkan kemampuan pemakai dalam memformulasikan kueri. Hal ini sering mempersulit pengguna. Dengan adanya sistem hiperteks, hal ini dapat di permudah dengan penyediaan antar muka yang memakai pencarian dengan metode browsing.
Smeaton(1991) di dalam Ellist(1996) juga menyatakan bahwa hiperteks dan temu-kembali informasi itu saling berkomplemen satu sama lain. Hiperteks membutuhkan lebih banyak searching sedangkan temu-kembali informasi membutuhkan lebih banyak browsing. Hal yang dimaksud adalah hiperteks akan semakin baik jika disertai dengan fasilitas search, dan temu-kembali informasi membutuhkan browsing dalam melakukan pencarian yang efisien. Adapun
maksud dari searching adalah berusaha mendapatkan atau mencapai tujuan spesifik sedangkan browsing adalah mengikuti suatu path sampai mencapai suatu tujuan. Menurut Brown(1988) didalam Agosti(1993), browsing itu bisa diibaratkan dengan From Where to What. Maksudnya adalah kita tahu dimana posisi kita dalam database dan kita ingin tahu apa yang ada disana (database).
Searching bisa diibaratkan dengan From What to Where. Maksudnya adalah kita tahu apa yang kita inginkan dan kita ingin menemukan dimana dia didalam
database.
Penggabungan sistem temu-kembali lebih dikenal dengan nama search engine, Sistem ini dapat dibagi kedalam dua kategori berdasarkan sumber informasinya yaitu:
1. Worldwide Search Engine
Worldwide Search Engine adalah suatu sistem temu-kembali informasi yang mengambil data-data dari berbagai server di seluruh penjuru dunia. Data-data tersebut diambil melalui program yang disebut dengan “robot” atau “bot”. Program inilah yang melakukan pencarian data pada setiap server, yang kemudian dikirim ke server pusat pada selang waktu tertentu.
2. Local Search Engine
Local search engine adalah suatu sistem temu-kembali informasi yang mengambil data-data dari server tertentu saja. Kata “local”, yang berarti lokal atau setempat, memberi penekanan akan lokasi sumber data yang akan digunakan.
Local search engine tidak dirancang untuk mengarungi belantara internet seperti
untuk pencarian pada objek spesifik dan lebih kecil lingkupnya dibandingkan internet sendiri.
Mengenai pemilihan penerapan sistem temu-kembali berbentuk local search engine atau worlwide search engine tergantung kepada masalah atau jenis informasi yang akan kita sediakan. Penerapan kedua kategori ini hanya akan mempengaruhi cara sistem pengindeksan dari temu-kembali. Sedangkan teknik
retrieval dan rancangan penerapan teknik pada hiperteks akan sama saja, baik pengindeksannya secara local search engine ataupun worldwide search engine.
Sistem temu-kembali yang dibangun terdiri dari berbagai macam teknik
retrieval seperti teknik Boolean biasa dan Boolean berperingkat serta teknik
Extended Boolean berdasarkan p-norm model. Sedangkan teknik pengindeksannya juga terdiri dari beberapa macam antara lain teknik berdasarkan frekuensi kemunculan istilah dan teknik pengindeksan yang dinormalisasi berdasarkan aturan Savoy(1993). Pada sistem ini, teknik retrieval, basis data indeks dan kumpulan dokumen berada dalam sebuah komputer server yang sama (local).
2.3. Text Mining
Text mining adalah salah satu bidang khusus dari data mining. Sesuai dengan buku The Text Mining Handbook, text mining dapat didefinisikan sebagai suatu proses menggali informasi dimana seorang user berinteraksi dengan sekumpulan dokumen menggunakan tools analisis yang merupakan komponen-komponen dalam data mining yang salah satunya adalah kategorisasi.
Tujuan dari text mining adalah untuk mendapatkan informasi yang berguna dari sekumpulan dokumen. Jadi, sumber data yang digunakan pada text mining adalah kumpulan teks yang memiliki format yang tidak terstruktur atau minimal semi terstruktur. Adapun tugas khusus dari text mining antara lain yaitu pengkategorisasian teks (text categorization) dan pengelompokan teks (text clustering). Text Mining tidak jauh berbeda dengan Data Mining. Yang membedakannya adalah pada sumber datanya, dimana Text Mining bersumber dari kumpulan dokumen atau text. Pada Text Mining, informasi yang akan digali biasanya berisi informasi-informasi yang tidak terstruktur, tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antardokumen. Tahapan yang dilakukan secara umum dalam Text Mining adalah: tokenizing, filtering, stemming, tagging dan analyzing.
2.4. Proses Pengklasifikasian
Classification adalah proses untuk menemukan model atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu sendiri bisa berupa aturan jika-maka berbentuk pohon pengambilan keputusan (Decision Tree), formula matematis seperti Bayesian dan
Support Vector Machine atau bisa juga berupa jaringan seperti neural network. Ada lima ukuran yang dapat digunakan untuk mengevaluasi setiap metode :
1. Predictive accuracy yang mengukur tingkat akurasi dalam mengklasifikasikan data baru. Ukuran ini paling sering digunakan sebagai pembanding.
2. Kecepatan. Biaya komputasi untuk menghasilkan classifier dan saat menggunakan classifier pada proses klasifikasi.
3. Robustness. Kemampuan menangani noise dan nilai hilang. 4. Scalability. Kemampuan menangani data dalam jumlah besar. 5. Interpretability. Mengukur sejauh mana model dapat diinterpretasi.
Pada skripsi kali ini, hanya predictive accuracy yang akan digunakan untuk pengklasifikasian artikel teks berdasarkan judulnya.
2.5. Tata Bahasa Bahasa Indonesia
Bahasa Indonesia, sebuah kata dikatakan memiliki morfologi yang dapat membuat kata tersebut berperan sebagai kata benda, kata keterangan atau kata kerja.
Ada banyak ragam pembentukan kata dalam Bahasa Indonesia. Sebagian besar kata dibentuk dengan cara menggabungkan beberapa komponen yang berbeda. Untuk memahami cara pembentukan kata-kata tersebut kita sebaiknya mengetahui lebih dahulu beberapa konsep dasar dan istilah seperti yang dijelaskan berikut ini :
Kata dasar (akar kata), yaitu kata yang paling sederhana yang belum memiliki imbuhan, juga dapat dikelompokkan sebagai bentuk asal (tunggal) dan bentuk dasar (kompleks), tetapi perbedaan kedua bentuk ini tidak dibahas di sini.
Afiks (imbuhan), yaitu satuan terikat (seperangkat huruf tertentu) yang apabila ditambahkan pada kata dasar akan mengubah makna dan membentuk kata baru. Afiks tidak dapat berdiri sendiri dan harus melekat pada satuan lain seperti kata dasar. Istilah afiks termasuk prefiks, sufiks dan konfiks.
Prefiks (awalan), yaitu afiks (imbuhan) yang melekat di depan kata dasar untuk membentuk kata baru dengan arti yang berbeda. Sufiks (akhiran), yaitu afiks (imbuhan) yang melekat di belakang kata dasar untuk membentuk kata baru dengan arti yang berbeda. Konfiks (sirkumfiks atau simulfiks) yang secara simultan (bersamaan), yaitu satu afiks melekat di depan kata dasar dan satu afiks melekat di belakang kata dasar yang bersama-sama mendukung satu fungsi. Kata turunan (kata jadian), yaitu kata baru yang diturunkan dari kata dasar yang mendapat imbuhan.
Keluarga kata dasar, yaitu kelompok kata turunan yang semuanya berasal dari satu kata dasar dan memiliki afiks yang berbeda. Imbuhan adalah suatu unsur struktural yang diikatkan pada sebuah kata dasar. Imbuhan terbagi atas : Awalan (Prefiks), Sisipan (Infiks), Akhiran (Sufiks), Imbuhan Terbelah (Konfiks).
Imbuhan yang terdapat di awal suatu kata, seperti : “me-, ber-, per-,
meng-, di-, ter-, ke- dan se-“. Untuk awalan me- mempunyai aturan khusus, yaitu: 1. tetap, jika huruf pertama kata dasar adalah l, m, n, q, r, atau w.
Contoh: me- + luluh → meluluh, me- + makan → memakan. 2. me- → mem-, jika huruf pertama kata dasar adalah b, f, p*, atau v.
Contoh: me- + baca → membaca, me- + pukul → memukul*, me- + vonis →
memvonis, me- + fasilitas + i → memfasilitasi.
3. me- → men-, jika huruf pertama kata dasar adalah c, d, j, atau t*. Contoh : me- + datang → mendatang, me- + tiup → meniup*.
4. me- → meng-, jika huruf pertama kata dasar adalah huruf vokal, k*, g, h. Contoh: me- + kikis → mengikis*, me- + gotong → menggotong, me- +
hias → menghias.
5. me- → menge-, jika kata dasar hanya satu suku kata.
Contoh: me- + bom → mengebom, me- + tik → mengetik, me- + klik →
mengeklik.
6. me- → meny-, jika huruf pertama adalah s*. Contoh: me- + sapu → menyapu*.
Huruf dengan tanda * memiliki sifat-sifat khusus :
1. Dilebur jika huruf kedua kata dasar adalah huruf vokal.
Contoh : me- + tipu → menipu, me- + sapu → menyapu, me- + kira →
mengira.
2. Tidak dilebur jika huruf kedua kata dasar adalah huruf konsonan. Contoh : me- + klarifikasi → mengklarifikasi.
3. Tidak dilebur jika kata dasar merupakan kata asing yang belum diserap secara sempurna.
Contoh: me- + konversi → mengkonversi.
Bahasa Indonesia, terdapat empat sisipan (infiks), yaitu : -el-, -em-, -er- dan –in-. Sedangkan imbuhan di akhir kata (sufiks) terdapat delapan, yaitu : i, -kan, -an, -man, -wan , -wati, -wi (-wiah) dan –nya. Selain itu juga terdapat sufiks yang berasal dari bahasa asing yaitu: -wan, -wati, -in, -at, - isme, -(is)asi, -logi dan –tas. Juga terdapat akhiran lain yang disebut partikel (P), yaitu: lah, kah, tah, pun. Sufiks juga dapat diberikan untuk menggantikan kata ganti kepunyaan (KK), misalnya: -ku, -mu, dan –nya.
Dalam perkembangannya, morfologi bahasa Indonesia terdapat penambahan :
1. Konfiks (imbuhan terbelah), yaitu gabungan dari infiks dan sufiks tetapi menjadi satu kesatuan yang tidak dapat dipisahkan. Konfiks ini harus mengapit kata dasar. Terdapat beberapa konfiks yaitu: ke - an, ber - an, peng - an, per - an, se - nya.
2. Simulfiks (imbuhan gabungan), yaitu gabungan lebih dari satu awalan atau akhiran, contoh: member – kan untuk memberlakukan dan memberdayakan.
Metode stemming pada tugas akhir ini mengacu yang dibuat oleh Nazief dan Adriani yang berbasiskan pada morfologi bahasa Indonesia dengan definisi sebagai berikut :
kata = stem | kata berimbuhan infleksional | kata berimbuhan derivasional | tidak dikenal kata berimbuhan infleksional = stem Sinf | kata berimbuhan derivasional | tidak dikenal
kata berimbuhan derivasional = stem-Sdr | Pder-stem | Pder- kata berimbuhan derivasional | tidak dikenal
dimana :
Sder = Suffix atau akhiran derivasional Sinf = Suffix atau akhiran infleksional Pder = Prefix atau awalan derivasional
Setiap Sder, Sinf, Pder memiliki aturan sendiri. Metode ini menggunakan kamus untuk menentukan hasil stem. Kata yang hendak di-stem awalnya dicari dalam kamus, apabila tidak ditemukan maka selanjutnya kata tersebut diduga memiliki imbuhan infleksional. Untuk mendapatkan imbuhan infleksional digunakan struktur morfologi kedua. Dalam prosesnya struktur morfologi ketiga akan digunakan karena kata ini diduga terdiri dari imbuhan derivasional dan Sinf.
Apabila kata dasar masih juga belum ditemukan maka kata ini selanjutnya diduga memiliki imbuhan derivasional. Untuk mencari kata dasar dari kata dengan imbuhan derivasional digunakan struktur aturan morfologi ketiga. Apabila kata dasar belum juga ditemukan, maka kata yang hendak di-stem yang akan dikembalikan.
2.6. Stemming
Stemming adalah proses penghilangan prefiks dan sufiks dari kueri dan istilah-istilah dokumen (Grossman, 2002). Stemming dilakukan atas dasar asumsi bahwa kata-kata yang memiliki stem yang sama memiliki makna yang serupa sehingga pengguna tidak keberatan untuk memperoleh dokumen-dokumen yang di dalamnya terdapat kata-kata dengan stem yang sama dengan kuerinya.
Teknik-teknik stemming dapat dikategorikan menjadi: 1. Berdasarkan aturan sesuai bahasa tertentu
2. Berdasarkan kamus
3. Berdasarkan kemunculan bersama.
Proses ini memiliki dua tujuan. Dalam hal efisiensi, stemming
mengurangi jumlah kata-kata unik dalam indeks sehingga mengurangi kebutuhan ruang penyimpanan untuk indeks dan mempercepat proses pencarian. Dalam hal keefektifan, stemming meningkatkan recall dengan mengurangi bentuk-bentuk kata ke bentuk dasarnya atau stem-nya. Sehingga dokumen-dokumen yang menyertakan suatu kata dalam berbagai bentuknya memiliki kecenderungan yang sama untuk ditemukembalikan. Hal tersebut tidak akan diperoleh jika tiap bentuk suatu kata disimpan secara terpisah dalam indeks. Akan tetapi, stemming dapat
menurunkan tingkat precision jika setiap bentuk suatu stem diperoleh, sedangkan yang relevan hanyalah bentuk yang sama dengan yang digunakan dalam kueri (Liddy, 2001).
Parsing dan stemming dalam suatu IRS tergantung pada bahasa yang digunakan dalam dokumen yang akan dicari. IRS untuk Bahasa Inggris kurang optimal untuk menangani dokumen dalam Bahasa Indonesia. Bahasa Indonesia memiliki daftar kata buang (stoplist) serta sistem pembentukan kata yang sangat berbeda dengan bahasa Inggris, sehingga diperlukan IRS yang khusus untuk
PorterStemmer Bahasa Indonesia
Stemming untuk Bahasa Indonesia telah dikembangkan antara lain yang menggunakan aturan berdasarkan algoritme Porter (1980) oleh Akhmadi (2002) yang hanya melakukan pemotongan prefiks dan oleh Ridha (2002) yang melakukan pemotongan prefiks dan sufiks. Stemming berdasarkan kamus untuk Bahasa Indonesia juga telah dikembangkan oleh Nazief (1996) (Nazief, 2000).
Stemming adalah proses penghilangan atau pemotongan imbuhan yang terdapat pada sebuah kata yang mempunyai imbuhan menjadi bentuk kata dasarnya saja, untuk Bahasa Indonesia imbuhan mempunyai peran penting dalam suatu kalimat, karena suatu kata dapat mempunyai arti yang berbeda apabila diberi suatu imbuhan. Yang mengakibatkan setiap kata berimbuhan mempunyai arti yang berbeda dan pembentukan kata baru. Contohnya : kata “diadaptasikan” atau “beradaptasi” menjadi bentuk kata dasar “adaptasi” sebagai istilah. Algoritma ini didahului dengan pembacaan tiap kata dari file sampel. Sehingga input dari algoritma ini adalah sebuah kata yang kemudian dilakukan, pemeriksaan semua
kemungkinan bentuk kata. Setiap kata diasumsikan memiliki 2 Awalan (Prefiks) dan 3 Akhiran (Sufiks). Sehingga bentuknya menjadi :
Prefiks 1 + Pr efiks 2 + Kata Dasar + Akhiran 1 + Akhiran 2 + Akhiran 3. Implementasi Porter Stemmer for Bahasa Indonesia berdasarkan English Porter Stemmer yang dikembangkan oleh W.B. Frakes pada tahun 1992. Karena bahasa Inggris datang dari kelas yang berbeda, beberapa modifikasi telah dilakukan untuk membuat Algoritma Porter dapat digunakan sesuai dengan bahasa Indonesia. Desain dari Porter Stemmer for Bahasa Indonesia dapat dilihat pada gambar 2.2 dibawah ini :
Gambar 2.2. Desain dari Porter Stemmer for Bahasa Indonesia
2.7. Flow Map
Flow Map adalah diagram yang menunjukan aliran data berupa formulir-formulir ataupun keterangan berupa dokumentasi yang mengalir atau
merupakan penggabungan notasi flow chart program. Hal-hal yang harus diperhatikan dalam menggambarkan flow map adalah sebagai berikut:
1. Penggambaran flow map dimulai dari atas halaman ke bagian bawah, kemudian dari kiri kebagian kanan
2. Penggambaran flow map dilakukan berdasarkan pembagian atau sub sistem
3. Dalam flow map harus jelas dimana awal suatu status informasi, kemudian dimana akhir silkus
4. Semua bagian siklus informasi harus jelas Menggunakan kertas kerja yang jelas sesuai dengan yang akan dilakukan dalam sistem