BAB 4 IMPLEMENTASI DAN EVALUASI

(1)

BAB 4

IMPLEMENTASI DAN EVALUASI

Pada bab ini, disajikan spesifikasi sistem yang digunakan, pengujian program serta hasil pengujian. Pengujian dilakukan dengan melakukan pencarian kata kunci terhadap sejumlah dokumen yang dimiliki untuk melihat hasil pengelompokan (klasifikasi) dan pengurutan (sebagai visualisasi) dokumen hasil pencarian sesuai dengan tingkat relevansinya.

4.1 Spesifikasi sistem

Terdapat 2 sistem yang mendukung aplikasi yang dibuat, yaitu software dan hardware. Software merupakan perangkat lunak yang digunakan untuk membuat program aplikasi. Hardware merupakan perangkat keras yang mendukung kerja perangkat lunak.

Spesifikasi perangkat keras yang digunakan dalam menjalankan aplikasi yaitu: prosessor Pentium III 450 MHz, motherboard ASUS P3BF, harddisk 12 GB, dan memory 128 MB.

Spesifikasi dari perangkat lunak yang digunakan dalam membangun aplikasi yaitu: Windows 2000 sebagai Sistem Operasi, J2SDK (Java 2 Software Development Kit, Standart Edition) sebagai Compiler Software.

(2)

4.2 Evaluasi Program Aplikasi 4.2.1 Input Data

Dalam penelitian ini penulis menyediakan sampel yang akan dilakukan pencarian sebanyak 7 buah dokumen sebagai berikut:

“tes1.txt” yang berisi tulisan “Large Scale Singular Value Computations”

“tes2.txt” yang berisi tulisan “Software for the Sparse Singular Value Decomposition” “tes3.txt” yang berisi tulisan “Introduction to Modern Information Retrieval”

“tes4.txt” yang berisi tulisan “Linear Algebra for Intelligent Information Retrieval” “tes5.txt” yang berisi tulisan “Matrix Computations”

“tes6.txt” yang berisi tulisan “Singular Value Analysis of Cryptograms” “tes7.txt” yang berisi tulisan “Automatic Information Organization”

Sejumlah kata yang termasuk daftar stop words disimpan dalam dokumen bernama “ListStopWords.txt”.

Sejumlah kata yang termasuk daftar kata dasar yang akan dipergunakan dalam proses Stemming disimpan dalam dokumen bernama “Dict.txt”.

Dilakukan pencarian terhadap 2 buah frase yaitu “Singular Value” dan “Information Retrieval”.

Akan dibandingkan hasil dari setiap langkah pada program aplikasi dengan perhitungan manual yang ada pada pembahasan teori. Analisa perbandingan akan dicantumkan pada sub bab berikutnya.

(3)

4.2.2 Tampilan Layar

Gambar 4.1 Layar Awal

Hanya ada 1 buah layar pada program aplikasi yang dibuat dengan 10 tombol di mana dari atas ke bawah merupakan urutan langkah–langkah secara bertahap dalam algoritma Lingo. Untuk menjalankan program aplikasi, masukkan satu atau beberapa frase yang ingin dicari kedalam beberapa kotak yang disediakan, kemudian lakukan penekanan tombol secara bertahap mulai dari tombol paling atas hingga paling bawah untuk mendapatkan cara algoritma Lingo bekerja.

Layar dibuat hanya untuk melakukan proses pencarian dokumen dengan algoritma Lingo. Jika ingin menambahkan fasilitas lain dapat dilakukan pengembangan lebih lanjut.

(4)

Gambar 4.2 Tampilan Layar Setelah Penekanan Tombol “Baca Seluruh File”

Dengan menekan tombol “Baca Seluruh File”, program akan melakukan pembacaan terhadap seluruh dokumen dan melakukan penampungan seluruh kata yang ditemukan. Kesulitan sempat dialami oleh penulis dalam melakukan pembacaan dan penampungan per kata yang dibaca, namun hal ini dapat diatasi. Proses penghilangan tanda baca terutama yang menempel pada kata juga dilakukan pada bagian ini. Pada bagian ini juga dilakukan Stemming pada frase yang diinput untuk setelah itu baru disimpan dalam variabel array dinamis

Pembacaan dokumen pada program yang dibuat baru dapat dilakukan pada dokumen dengan ekstensi .txt, karena untuk membaca suatu dokumen berbasiskan .pdf maupun .doc, masing–masing diperlukan metode pembacaan yang berbeda. Pembacaan

(5)

dokumen juga tidak dapat dilakukan pada dokumen bergambar karena tahapan proses algoritma Lingo hanya sebatas melakukan pengolahan tulisan.

Gambar 4.3 Tampilan Layar Setelah Penekanan Tombol “Baca Daftar Stop Words” Tahap selanjutnya, lakukan penekanan tombol “Baca Daftar Stop Words” untuk melakukan pembacaan terhadap sebuah dokumen khusus yang menyimpan daftar kata yang termasuk dalam daftar stop words untuk kemudian disimpan dalam variabel dinamis.

Tujuan melakukan tahap Stop Words Removal adalah untuk melakukan pembuangan sekumpulan kata yang dianggap sebagai kata yang terlalu umum dipakai dalam sistem online, sehingga nilai informasi yang terkandung di dalam kata tersebut sangat sedikit.

(6)

Jika dilihat pada dokumen khusus penyimpan sejumlah kata yang termasuk dalam daftar stop words, 1 buah baris hanya berisi 1 buah kata. Dapat dilakukan penambahan atau pengurangan kata yang termasuk dalam daftar stop words dengan menambahkan atau melakukan penghapusan baris dalam daftar stop words.

Papan Informasi akan menampilkan sejumlah kata yang merupakan hasil pembacaan dari dokumen khusus penyimpan daftar stop words.

Gambar 4.4 Tampilan Layar Setelah Penekanan Tombol “Buang Kata Stop Words” Langkah selanjutnya, lakukan penekanan tombol “Buang Kata Stop Words”. Di tahap ini terjadi pencocokan variabel dinamis berisi seluruh kata yang berasal seluruh dokumen dengan variabel dinamis yang menyimpan seluruh kata yang termasuk dalam

(7)

daftar stop words. Jika kata sama, lakukan pembuangan kata dari variabel dinamis yang menyimpan seluruh kata pada seluruh dokumen.

Papan Informasi akan berisi seluruh kata yang diperoleh dari dokumen yang telah melewati 1 kali proses penyaringan, yaitu proses Stop Words Removal.

Gambar 4.5 Tampilan Layar Setelah Penekanan Tombol “Stemming”

Langkah selanjutnya, lakukan penekanan tombol “Stemming”. Di tahap ini dilakukan pengubahan variabel dinamis berisi seluruh kata yang terdapat pada seluruh dokumen yang ada menjadi kata dasarnya.

Stemming hanya dilakukan pada kata yang bukan merupakan kata dasar. Maka sebelum melakukan proses Stemming, dilakukan proses pencocokkan kata dengan daftar kata yang merupakan kata dasar. Jika kata tidak termasuk dalam daftar kata dasar, baru

(8)

lakukan proses Stemming atas kata tersebut. Setelah kata melalui tahap Stemming dan Stop Words Removal, dipilih sejumlah kata sebagai kandidat kata dengan syarat mucul dalam seluruh dokumen minimal sejumlah n kali.

Papan Informasi akan menampilkan informasi seluruh kata yang diperoleh dari seluruh dokumen yang ada yang telah melewati 2 kali proses penyaringan, Stop Words Removal dan Stemming, juga hasil dari pemilihan kandidat kata.

Gambar 4.6 Tampilan Layar Setelah Penekanan Tombol “Buat Vektor Dokumen dan Normalisasi”

Langkah selanjutnya, lakukan penekanan tombol “Buat Vektor Dokumen dan Normalisasi” untuk mendapatkan term document matrix A yang tiap kolomnya merupakan vektor dokumen yang telah dinormalisasi.

(9)

Term document matrix merepresentasikan seluruh dokumen yang ada, setiap barisnya merepresentasikan setiap kata, dan setiap kolomnya mewakili setiap dokumen. Perhitungan untuk memperoleh term document matrix adalah dengan melakukan pembobotan terhadap jumlah kata yang terdapat pada setiap dokumen. Setelah itu akan dilakukan proses normalisasi, barulah menjadi sebuah term document matrix.

Papan Informasi akan menampilkan term document matrix sebelum dan sesudah dilakukan normalisasi.

Gambar 4.7 Tampilan Layar Setelah Penekanan Tombol “SVD”

Langkah selanjutnya, lakukan penekanan tombol “SVD” untuk mendapatkan matriks U , ∑ , V yang berasal dari matriks A . Matriks U merepresentasikan konsep

(10)

abstrak yang dimiliki oleh semua dokumen yang ada. Matriks ∑ dipergunakan dalam penentuan jumlah kelompok melalui proses iterasi. Matriks V tidak digunakan sama sekali dalam tahapan algoritma Lingo.

Papan Informasi akan menampilkan matriks U dan ∑ sebagai hasil perhitungan dari term document matriks A yang akan dipakai dalam tahapan algoritma Lingo selanjutnya.

Gambar 4.8 Tampilan Layar Setelah Penekanan Tombol “Hitung Banyaknya Kelompok”

Langkah selanjutnya, lakukan penekanan tombol “Hitung Banyaknya Kelompok” untuk menentukan jumlah kelompok yang akan terbentuk. Inisialisasi batas ambang

(11)

pengelompokan q=0.9. Tidak ada ketentuan konstanta yang pasti untuk q , hanya semakin besar nilai dari q , maka semakin banyak jumlah kelompok yang terbentuk.

Papan Informasi akan menampilkan matriks ∑ yang diagonalnya akan dipakai dalam penentuan jumlah kelompok yang akan terbentuk lewat iterasi, dengan melakukan perhitungan nilai Frobenius ( A _F) hingga mencapai kondisi berhenti q_hitung > batas ambang kandidat label (dalam hal ini q=0.9). Jumlah kelompok yang akan terbentuk sama dengan nilai k pada kondisi perhentian. Papan Informasi juga akan menampilkan hasil perhitungan iterasi hingga mencapai kondisi berhenti.

Gambar 4.9 Tampilan Layar Setelah Penekanan Tombol “Buat Vektor Frase dan Normalisasi”

(12)

Langkah selanjutnya, lakukan penekanan tombol “Buat Vektor Frase dan Normalisasi” untuk mendapatkan phrase matrix, di mana setiap kolomnya merupakan vektor frase yang telah dinormalisasi.

Untuk mendapatkan sebuah phrase matrix, dilakukan pembobotan dengan cara yang dalam mendapatkan term document matrix. Normalisasi pada hasil pembobotan baru akan menghasilkan sebuah phrase matrix.

Papan Informasi akan menampilkan phrase matrix sebelum dan sesudah dinormalisasi yang akan dipakai dalam tahapan algoritma selanjutnya sebagai representasi dari frase untuk mencari dokumen yang sesuai dengan frase yang diinput.

(13)

Langkah selanjutnya, lakukan penekanan tombol “Hitung Deskripsi Kelompok” untuk mendapatkan skor sebagai deskripsi dari tiap kelompok. Skor untuk masing-masing kelompok didapat dari maksimum nilai tiap baris matriks M sebagai hasil perkalian UT P

k × yang mewakili setiap kelompok hasil yang terbentuk. k merupakan jumlah kelompok yang terbentuk dari proses iterasi pada tahap “Hitung Banyaknya Kelompok.

Papan Informasi akan menampilkan matriks U, matriks P dan matriks M yang akan menentukan skor yang didapat oleh setiap kelompok.

Gambar 4.11 Tampilan Layar Setelah Penekanan Tombol “Penandaan File Ke Kelompok”

(14)

Langkah selanjutnya, lakukan penekanan tombol “Penandaan File Ke Kelompok” untuk mendapatkan hasil penandaan dokumen ke dalam kelompok-kelompok yang ada. Proses ini diperoleh dengan mengalikan matriks QT_{× sebagai matriks}A _C_{. Kolom} pada matriks C merepresentasikan setiap dokumen, sementara barisnya merepresentasikan kelompok-kelompok yang ada. Nilai tertinggi dalam setiap kolom menjadi skor untuk setiap dokumen yang ada dan baris yang menyimpan skor tertinggi merepresentasikan kelompok dari dokumen.

Pada pembahasan selanjutnya akan ditampilkan hasil pada proses tahapan-tahapan percobaan program aplikasi sesuai data inputan. Setiap hasil yang diperoleh dapat dibandingkan dengan perhitungan manual yang terdapat pada pembahasan teori akan dianalisis.

Tabel 4.1 menampilkan hasil dari proses Preprocessing yang mencakup Stop Words Removal dan Stemming. Pembacaan seluruh dokumen dan penampungan dalam suatu variabel dinamis menghasilkan 33 buah kata.

Kolom kedua adalah kata hasil pembacaan dokumen. Kolom ketiga adalah dokumen asal kata. Jika kolom keempat tercentang, berarti kata termasuk dalam daftar stop words, di mana akan dilakukan pembuangan terhadap kata. Kolom kelima menyatakan perubahan kata setelah melewati proses Stemming., jika kolom kelima kosong, maka kata tidak mengalami pemotongan dalam proses Stemming.

Penyimpanan terhadap dokumen asal kata digunakan pada perhitungan bobot sebelum menghitung term document matrix dan phrase matrix. Variabel dinamis penyimpan kata memiliki nama yang berbeda dengan variabel dinamis penyimpan asal

(15)

kata, namun keduanya bergerak dalam indeks yang sama. Dengan demikian jika dilakukan proses pembuangan kata, maka pembuangan juga dilakukan pada dokumen asal kata pada indeks yang sama.

Proses stemming melakukan pemotongan kata menjadi kata dasarnya, sebagai contoh pada Tabel 4.1, kata dasar dari “Computations” adalah “Computation”.

KATA DOKUMEN ASAL KATA STOP WORD HASIL PROSES STEMMING 1 Large tes1.txt 2 Scale tes1.txt 3 singular tes1.txt 4 Value tes1.txt

5 Computations tes1.txt Computation

6 Software tes2.txt 7 For tes2.txt √ 8 The tes2.txt √ 9 Sparse tes2.txt 10 Singular tes2.txt 11 Value tes2.txt 12 Decomposition tes2.txt 13 Introduction tes3.txt 14 To tes3.txt √ 15 Modern tes3.txt 16 Information tes3.txt 17 Retrieval tes3.txt 18 Linear tes4.txt 19 Algebra tes4.txt 20 For tes4.txt √ 21 Intelligent tes4.txt 22 Information tes4.txt 23 Retrieval tes4.txt 24 Matrix tes5.txt

25 Computations tes5.txt Computation

26 Singular tes6.txt

27 Value tes6.txt

28 Analysis tes6.txt 29 Of tes6.txt √

30 Cryptograms tes6.txt Cryptogram

31 Automatic tes7.txt 32 Information tes7.txt 33 Organization tes7.txt

(16)

Berikut hasil program aplikasi pada proses “Buat Vektor Dokumen dan Normalisasi”: Vektor Dokumen transpos:

                      0 0 0 0 07 . 0 0 0 07 . 0 07 . 0 0 0 11 . 0 0 0 0 11 . 0 0 0 0 07 . 0 11 . 0 0 0 0 07 . 0 0 0 07 . 0 07 . 0 0 0 11 . 0 07 . 0 07 . 0 0 Setelah dinormalisasi:                       0 0 0 0 1 0 0 71 . 0 71 . 0 0 0 910 . 0 0 0 0 83 . 0 0 0 0 56 . 0 83 . 0 0 0 0 56 . 0 0 0 71 . 0 71 . 0 0 0 72 . 0 49 . 0 49 . 0 0

Vektor dokumen terdiri atas baris yang merepresentasikan kata dan satu buah kolom. Vektor dokumen merepresentasikan sebuah dokumen. Vektor dokumen dibentuk dengan menghitung jumlah setiap kata dalam suatu dokumen, kemudian lakukan proses pembobotan, dan terakhir normalisasi. Vektor dokumen menjadi satuan kolom dari suatu term document matrix.

Kecocokan diperoleh antara hasil perhitungan program aplikasi untuk setiap vektor dokumen di atas dibandingkan perhitungan manual yang tercantum pada pembahasan teori.

Berikut hasil program aplikasi pada proses “SVD”.

Dalam tahap perhitungan Singular Value Decomposition akan dihasilkan tiga buah matriks, yaitu U,∑,V .

Diagonal matriks ∑ dengan perhitungan Frobenius norms dipakai dalam iterasi dalam menentukan jumlah kelompok (k) yang akan terbentuk. Matriks V tidak akan digunakan sama sekali dalam tahapan algoritma Lingo.

(17)

Matriks U dapat mendeskripsikan konsep abstrak yang ada pada dokumen. Matriks U dipakai dalam mendapatkan deskripsi dari kelompok dengan cara mengalikan sejumlah transpos sejumlah k kolom matriks U dengan matriks frase (M UT P

k

= ). Nilai maksimum dari setiap baris pada matriks. M menjadi skor bagi tiap kelompok yang akan terbentuk, karena tiap baris M mendeskripsikan kelompok yang akan terbentuk

Berikut analisis hasil matriks A dan U,∑ yang diperoleh pada program aplikasi dibandingkan dengan perhitungan manual.

Term document matrix A hasil perhitungan program aplikasi sebagai berikut.

                = 0 0 0 83 . 0 83 . 0 0 0 0 0 1 0 0 0 72 . 0 0 71 . 0 0 0 0 71 . 0 49 . 0 0 71 . 0 0 0 0 71 . 0 49 . 0 1 0 0 56 . 0 56 . 0 0 0 A

Kecocokan diperoleh antara hasil perhitungan program aplikasi term document matrix A di atas dibandingkan perhitungan manual yang tercantum pada pembahasan teori.

Matriks U sebagai bagian dari matrix A hasil perhitungan program aplikasi sebagai berikut.                 − − − − − − − − = 0 75 . 0 0 66 . 0 0 0 0 92 . 0 0 39 . 0 71 . 0 0 28 . 0 0 65 . 0 71 . 0 0 28 . 0 0 65 . 0 0 66 . 0 0 75 . 0 0 U

Dibandingkan hasil perhitungan manual Matriks U dengan Software MatLab sebagai berikut:

(18)

                − − − − − − = 0 7526 . 0 0000 . 0 6584 . 0 0 0 0 9220 . 0 0 3873 . 0 7071 . 0 0 2738 . 0 0 6519 . 0 7071 . 0 0 2738 . 0 0 6519 . 0 0 6584 . 0 0 7526 . 0 0 U

Kecocokan diperoleh antara hasil perhitungan program aplikasi matriks U di atas dibandingkan perhitungan manual yang tercantum pada pembahasan teori.. Pertukaran tanda antar baris dalam satu kolom tidak menjadi masalah.

Matriks ∑ hasil perhitungan program aplikasi sebagai berikut.

(

1.64 1.56 1.14 0.75 0 0 0

)

=

∑

Jika diagonal matriks di atas dibandingkan dengan hasil perhitungan manual dengan software MatLab sebagai berikut:

                = ∑ 0 0 0 0 0 0 0 0 0 0 7514 . 0 0 0 0 0 0 0 0 1440 . 1 0 0 0 0 0 0 0 5622 . 1 0 0 0 0 0 0 0 6450 . 1

Terdapat kecocokan antara hasil perhitungan program aplikasi matriks ∑ di atas dibandingkan perhitungan manual yang tercantum pada pembahasan teori

Dalam proses “Hitung banyaknya kelompok” dilakukan iterasi dengan Frobenius form untuk mendapatkan jumlah kelompok yang akan terbentuk. Ditetapkan batas ambang kandidat label q=0.9. Iterasi berhenti ketika q_hitung hasil Frobenius form memiliki nilai yang lebih besar daripada batas ambang kandidat label. Jumlah kelompok merupakan nilai k pada perhentian iterasi.

Hasil proses “Hitung banyaknya kelompok” pada program aplikasi sebagai berikut.

(

1.64 1.56 1.14 0.75 0 0 0

)

= ∑

(19)

∑

= = A r j j A 1 2 F σ = 2.64

q hitung = 0.62 , kelompok = 0, q_hitung<q q hitung = 0.85 , kelompok = 1, q_hitung<q

q hitung = 0.96 , kelompok = 2, q_hitung>q ..STOP

Dibandingkan dengan hasil perhitungan manual yang terdapat pada landasan teori sebagai berikut:

∑

= = rA j j A 1 2 F σ = _1.64502₊_1.56222 ₊_1.14402 ₊ _0.75142 = 2.6495

Misalkan kita tetapkan q = 0.9, maka ..

Jika k = 0 → q = 0.6209 6495 . 2 6450 . 1 2 = Jika k = 1 → q = 0.8562 6495 . 2 5622 . 1 6450 . 1 2 2 = + Jika k = 2 → q = 0.9589 6495 . 2 1440 . 1 5622 . 1 6450 . 1 2 2 2 = + +

Perulangan berhenti pada k = 2. Maka jumlah dari kelompok = k = 2.

Hasil perhitungan pada tiap iterasi dengan A _F cocok. Kelompok yang akan terbentuk pada program aplikasi memiliki jumlah yang sama dengan perhitungan jumlah kelompok yang terbentuk secara manual yang terdapat pada dasar teori.

(20)

Berikut hasil Program Aplikasi pada proses “Buat Vektor Frase dan Normalisasi”. Vektor frase transpos:

                      1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 11 . 0 0 0 0 07 . 0 0 0 07 . 0 07 . 0 0 Setelah dinormalisasi:                       1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 83 . 0 0 0 0 56 . 0 0 0 71 . 0 71 . 0 0

Vektor frase terdiri atas satu buah baris yang merepresentasikan kata dan satu buah kolom. Vektor frase merepresentasikan sebuah frase. Vektor frase dibentuk dengan menghitung jumlah setiap kata dalam suatu frase, kemudian lakukan proses pembobotan, dan terakhir lakukan normalisasi. Vektor frase menjadi satuan kolom dari suatu phrase matrix.

Hasil perhitungan vektor frase pada program aplikasi memiliki kecocokan dengan hasil yang diperoleh pada perhitungan secara manual.

Pada proses “Hitung Deskripsi Kelompok” dilakukan perhitungan skor kekerabatan masing-masing kelompok dengan seluruh frase yang diinput. Perhitungan skor untuk masing-masing kelompok diperoleh dengan mengalikan transpos sejumlah k kolom dari matriks U dengan phrase matrix (M UT P

k ⋅

= ). Matriks hasil perkalian tersebut dinamakan matriks M . Dari setiap baris pada matriks M , diambil satu nilai yang maksimum sebagai deskripsi dari tiap kelompok dalam bentuk skor.

(21)

                − − − − − − − − = 0 75 . 0 0 66 . 0 0 0 0 92 . 0 0 39 . 0 71 . 0 0 28 . 0 0 65 . 0 71 . 0 0 28 . 0 0 65 . 0 0 66 . 0 0 75 . 0 0 U       − − − − − = 66 . 0 0 0 0 75 . 0 0 39 . 0 65 . 0 65 . 0 0 2 T U                 = ` 0 0 0 0 83 . 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 71 . 0 0 0 0 1 0 0 71 . 0 0 0 0 0 1 56 . 0 0 P

Phrase matrix yang diperoleh pada program aplikasi memiliki hasil yang cocok jika dibandingkan dengan perhitungan secara manual yang tercantum pada pembahasan teori. P U M T k ⋅ =       = 66 . 0 0 0 0 75 . 0 97 . 0 0 0 39 . 0 65 . 0 65 . 0 0 0 92 . 0 M

Skor yang diperoleh untuk masing-masing kelompok: Information Retrieval (skor: 0.97)

Singular Value (skor: 0.92)

Dibandingkan dengan hasil perhitungan manual yang tercantum dalam pembahasan teori:       = 6600 . 0 0 0 0 7500 . 0 9700 . 0 0 0 3900 . 0 6500 . 0 6500 . 0 0 0 9200 . 0 M

Skor yang diperoleh untuk masing-masing kelompok: Information Retrieval (skor: 0.97).

(22)

Singular Value (skor: 0.92)

Hasil pengelompokan dan skor tiap kelompok yang diperoleh dari program aplikasi cocok dengan hasil perhitungan manual.

Dalam proses “Penandaan File Ke Kelompok” setiap dokumen ditandai ke dalam kelompok yang memiliki kekerabatan paling tinggi dengan dokumen. Penandaan file ke kelompok dilakukan dengan mengalikan transpos dari phrase matrix dengan term document matrix C₌QT_.A_.

Setiap kolom dari matriks C mendeskripsikan setiap dokumen. Diambil nilai maksimum dari tiap kolom untuk mendapatkan kelompok dari dokumen, di mana baris merepresentasikan setiap kelompok.

Berikut hasil program aplikasi “Penandaan File Ke Kelompok”.

      = 83 . 0 0 0 0 56 . 0 0 0 71 . 0 71 . 0 0 T Q                 = 0 0 0 83 . 0 83 . 0 0 0 0 0 1 0 0 0 72 . 0 0 71 . 0 0 0 0 71 . 0 49 . 0 0 71 . 0 0 0 0 71 . 0 49 . 0 1 0 0 56 . 0 56 . 0 0 0 A A Q C₌ T_.       = 56 . 0 0 0 . 1 1 0 0 0 1 0 0 0 1 69 . 0 C

HASIL PENGELOMPOKAN (berdasarkan matriks C) Information Retrieval [0.92]

3

D : Introduction to Modern Information Retrieval skor: 1

4

D : Linear Algebra for Intelligent Information Retrieval skor: 1

7

(23)

Singular Value [skor: 0.92]

2

D : Software for the Sparse Singular Value Decomposition skor: 0.99

6

D : Singular Value Analysis of Cryptograms skor: 0.99

1

D : Large Scale Singular Value Computations skor: 0.69 Others: [yang tidak ditandai kedalam kelompok manapun]

5

D : Matrix Computations

Dibandingkan dengan perhitungan manual yang tercantum dalam pembahasan teori sebagai berikut:

Information Retrieval [skor: 0.97]

3

D : Introduction to Modern Information Retrieval

4

D : Linear Algebra for Intelligent Information Retrieval

7

D : Automatic Information Organization Singular Value [skor: 0.92]

2

D : Software for the Sparse Singular Value Decomposition

6

D : Singular Value Analysis of Cryptograms

1

D : Large Scale Singular Value Computations

Others: [yang tidak ditandai kedalam kelompok manapun]

5

D : Matrix Computations

Program aplikasi dan perhitungan manual memperoleh hasil pengelompokan dan urutan dokumen yang sama.

Dari keseluruhan hasil perhitungan oleh program aplikasi, ternyata hasil pengelompokan dan pengurutan dokumen sama dengan hasil yang diperoleh secara manual.

(24)

Algoritma Lingo merupakan teknologi search engine yang masih baru dan masih jarang ditemukan dalam pengaplikasiannya. Algoritma Lingo mengaplikasikan ilmu matematika dalam proses pencarian dokumen.

Dalam algoritma Lingo, pengembalian hasil pencarian berupa pengelompokan dan pengurutan dokumen sesuai dengan tingkat kerelevanannya. Oleh karena itu, proses pencarian dokumen dengan algoritma Lingo dapat memberikan kemudahan bagi user jika dibandingkan search engine yang umumnya ada saat ini.