• Tidak ada hasil yang ditemukan

Analisis Berita dengan Latent Semantic Indexing untuk Prediksi Kurs Mata Uang.

N/A
N/A
Protected

Academic year: 2017

Membagikan "Analisis Berita dengan Latent Semantic Indexing untuk Prediksi Kurs Mata Uang."

Copied!
20
0
0

Teks penuh

(1)

ABSTRAK

Kurs mata uang rupiah saat ini sangat tidak stabil dan semakin menurun nilainya. Tidak stabilnya kurs akan mempengaruhi banyak hal. Untuk membantu permasalahan ini, dirancang sebuah aplikasi untuk melakukan prediksi kurs rupiah terhadap dolar Amerika dengan menganalisis berita bursa efek, berita ekonomi bisnis, dan moneter di Indonesia. Berita yang digunakan adalah 2 jenis, yaitu ringkasan berita dan berita lengkap. Pada ringkasan berita, topik yang diambil mengenai bursa efek Indonesia, sedangkan pada berita lengkap adalah ekonomi bisnis dan moneter. Untuk melakukan prediksi, digunakan salah satu metode temu balik informasi, yaitu Latent Semantic Indexing (LSI). Prediksi juga dilakukan tanpa menggunakan LSI, tetapi dengan menggunakan kumpulan kata untuk prediksi ‘naik’. Mengacu pada hasil eksperimen, disimpulkan bahwa LSI bukan model yang tepat untuk melakukan prediksi kurs, tetapi baik untuk mengaitkan konteks berita yang tepat, karena berita yang ada pada saat tertentu belum tentu mencerminkan naik turunnya kurs. Kemunculan kata dalam dokumen juga tidak memiliki korelasi dengan naik atau turunnya kurs karena sebuah kata belum tentu memiliki makna yang sama untuk konteks dan dokumen yang berbeda.

(2)

ABSTRACT

Currency rate fluctuates very fast in the world today. To anticipate this

phenomenon, an application is designed to perform Indonesian Rupiah’s rate

prediction against American dollar by analyzing stock exchange, business economic and monetary news in Indonesia. Two types of news are analyzed, i.e.: summarization and full document collection. In the summarization-based

collection, the topic about ‘Indonesian stock exchange’ is collected from Google

search engine results. In the full document collection, the topics about business economic and monetary are collected from Detik Finance. To perform the prediction, an information retrieval method is utilized, i.e. the Latent Semantic Indexing (LSI). The experiment results show that LSI was not a suitable method to

perform currency rate prediction. One of the reasons is that the words’

co-occurrences in the documents provide some indications about the rate’s

movement, but not a real decision. Another reason is that the semantics of a word is not necessarily the same in various documents. Although, the LSI shows good performance for creating connection of words in news documents.

(3)

DAFTAR ISI

LEMBAR PENGESAHAN ... ii

PERNYATAAN ORISINALITAS LAPORAN PENELITIAN ... iii

PERNYATAAN PUBLIKASI LAPORAN PENELITIAN ... iv

PRAKATA ... v

DAFTAR GRAFIK ... xiv

DAFTAR SIMBOL ... xv

DAFTAR KODE PROGRAM ... xvii

DAFTAR RUMUS ... xviii

DAFTAR ISTILAH ... xix

DAFTAR LAMPIRAN ... xx

BAB I PENDAHULUAN ... 1

1.1 Latar Belakang ... 1

1.2 Rumusan Masalah ... 2

1.3 Tujuan ... 2

1.4 Batasan Masalah ... 2

1.5 Sistematika Pembahasan ... 3

BAB II LANDASAN TEORI ... 4

2.1 Temu Balik Informasi (Information Retrieval) ... 4

2.2 Latent Semantic Indexing (LSI) ... 5

2.3 Java ... 9

2.4 Basis Data ... 10

2.5 Entity Relationship Diagram (ERD) ... 10

2.5.1 Entitas ... 10

2.5.2 Relasi ... 10

2.5.3 Atribut ... 10

2.5.4 Kardinalitas ... 11

2.6 Unified Modeling Language (UML) ... 13

2.6.1 Uses Case Diagram ... 13

2.6.2 Activity Diagram ... 13

2.6.3 Class Diagram ... 14

2.7 Jsoup ... 15

2.8 LingPipe ... 15

BAB III ANALISIS DAN DISAIN ... 16

3.1 Metodologi Penelitian ... 16

3.2 Gambaran Keseluruhan ... 18

3.2.1 Persyaratan Antarmuka Eksternal ... 18

3.2.2 Antarmuka dengan Pengguna ... 18

(4)

3.3 Disain Perangkat Lunak ... 24

3.3.1 Pemodelan Perangkat Lunak ... 24

3.3.2 Disain Penyimpanan Data ... 27

3.3.3 Disain Antarmuka ... 27

BAB IV PENGEMBANGAN PERANGKAT LUNAK ... 30

4.1 Pengolahan Data ... 30

4.2 Pembentukan Matriks LSI ... 38

4.3 Implementasi Kelas ... 42

4.3.1 Kelas DataTanggal ... 42

4.3.2 Kelas KataTanggal ... 43

4.3.3 Kelas KamusKata ... 43

4.3.4 Kelas Stopwords ... 44

4.3.5 Kelas KursExcel ... 44

4.3.6 Kelas Berita ... 44

4.3.7 Kelas ListDataTanggal ... 45

4.3.8 Kelas ListKataTanggal ... 46

4.3.9 Kelas ListKamusKata... 47

4.3.10 Kelas ListStopwords ... 48

4.3.11 Kelas ListKursExcel... 49

4.3.12 Kelas ListBerita ... 49

4.3.13 Kelas AbsTableBerita ... 50

4.3.14 Kelas NewsGrabber ... 50

4.3.15 Kelas MatrixRetrieve ... 51

4.3.16 Kelas NewsTokenizer ... 51

4.3.17 Kelas TopResult ... 53

4.3.18 Kelas Lsi... 54

4.4 Implementasi Penyimpanan Data ... 56

4.5 Implementasi Antarmuka ... 57

4.5.1 Form Halaman Utama ... 57

4.5.2 Form Berita ... 58

4.5.3 Form Prediksi ... 59

BAB V TESTING DAN EVALUASI SISTEM ... 61

5.1 Eksperimen ... 61

5.2 Perolehan Kumpulan Kata Untuk Prediksi ‘Naik’ ... 64

5.3 Hasil Eksperimen ... 66

5.4 Evaluasi Terhadap K ... 77

5.5 Evaluasi Terhadap Akurasi ... 78

5.6 Evaluasi Frekuensi Kata ... 80

5.7 Evaluasi Aplikasi ... 81

BAB VI KESIMPULAN DAN SARAN ... 85

6.1 Kesimpulan ... 85

6.2 Saran ... 85

DAFTAR PUSTAKA ... xxi

(5)

DAFTAR TABEL

Tabel 2.1 Matriks Term-Document C (Manning, C. D., et al, 2009 : 414) ... 6

Tabel 2.2 Matriks U (Manning, C. D., et al, 2009 : 414) ... 6

Tabel 2.3 Matriks ∑k (Manning, C. D., et al, 2009 : 414) ... 7

Tabel 2.4 Matriks VT (Manning, C. D., et al, 2009 : 415) ... 7

Tabel 2.5 Matriks ∑2 (Manning, C. D., et al, 2009 : 415) ... 7

Tabel 2.6 Matriks C2 (Manning, C. D., et al, 2009 : 415) ... 8

Tabel 2.7 Jumlah Kata Pada Database ... 37

Tabel 4.1 Statistik Data Berita ... 32

Tabel 4.2 Statistik Jumlah Kurs ... 32

Tabel 5.1 Metode ... 61

Tabel 5.2 Skenario ... 62

Tabel 5.3 Contoh Prediksi Dengan Skenario Top-5 ... 64

Tabel 5.4 Kelebihan dan Kekurangan Metode ... 78

Tabel 5.5 Kelebihan dan Kekurangan Skenario ... 79

Tabel 5.6 Test Case Form Berita ... 81

(6)

DAFTAR GAMBAR

Gambar 2.1 Vektor-Vektor Dokumen Hasil Perhitungan LSI (Manning, C. D., et

al, 2009 : 416) ... 8

Gambar 2.2 Relasi Satu ke Satu ... 12

Gambar 2.3 Relasi Satu ke Banyak ... 12

Gambar 2.4 Relasi Banyak ke Satu ... 12

Gambar 2.5 Relasi Banyak ke Banyak ... 12

Gambar 2.6 Contoh Use Case Diagram ... 13

Gambar 2.7 Contoh Kelas ... 14

Gambar 2.8 Association ... 14

Gambar 2.9 Aggregation ... 14

Gambar 2.10 Composition ... 15

Gambar 2.11 Inheritance ... 15

Gambar 3.1 Flowchart Langkah Kerja ... 16

Gambar 3.2 Use Case Aplikasi Prediksi Kurs Mata Uang ... 24

Gambar 3.3 Use Case Sub-System Mengelola Berita ... 25

Gambar 3.4 Acitivity Diagram Mengelola Berita ... 25

Gambar 3.5 Activity Diagram Prediksi ... 26

Gambar 3.6 Rancangan ERD ... 27

Gambar 3.7 Tampilan Rancangan Form Halaman Utama ... 28

Gambar 3.8 Tampilan Rancangan Form Berita ... 28

Gambar 3.9 Tampilan Rancangan Form Prediksi ... 29

Gambar 4.1 Diagram Kelas Aplikasi Prediksi Kurs ... 42

Gambar 4.2 Kelas DataTanggal ... 43

Gambar 4.3 Kelas KataTanggal ... 43

Gambar 4.4 Kelas KamusKata ... 43

Gambar 4.5 Kelas Stopwords ... 44

Gambar 4.6 Kelas KursExcel ... 44

Gambar 4.7 Kelas Berita ... 44

Gambar 4.8 Kelas ListDataTanggal ... 45

Gambar 4.9 Kelas ListKataTanggal ... 46

Gambar 4.10 Kelas ListKamusKata ... 47

Gambar 4.11 Kelas ListStopwords ... 48

Gambar 4.12 Kelas ListKursExcel ... 49

Gambar 4.13 Kelas ListBerita ... 49

Gambar 4.14 Kelas AbsTableBerita ... 50

Gambar 4.15 Kelas NewsGrabber ... 51

Gambar 4.16 Kelas MatrixRetrieve ... 51

Gambar 4.17 Kelas NewsTokenizer ... 52

Gambar 4.18 Kelas TopResult ... 53

Gambar 4.19 Kelas Lsi ... 56

Gambar 4.20 Implementasi Basis Data ... 56

Gambar 4.21 Form Halaman Utama ... 57

Gambar 4.22 Form Berita ... 58

(7)
(8)

DAFTAR GRAFIK

(9)

nama

DAFTAR SIMBOL

1. Tabel simbol ERD

Tabel nomor 1 ini merupakan tabel mengenai simbol-simbol ERD. Terdapat gambar simbol dan nama dari setiap simbolnya.

Nama Simbol Simbol

Entitas

Relasi

Atribut

Atribut kunci primer

Atribut bernilai banyak

Atribut turunan

2. Tabel Simbol Activity Diagram

Tabel nomor 2 merupakan tabel mengenai simbol activity diagram. Terdapat gambar simbol dan deskripsi untuk setiap simbolnya.

Simbol Deskripsi

Initial state untuk memulai sebuah

activity diagram. nama

nama

nama

(10)

Simbol Deskripsi

Action state menggambarkan proses

atau aktivitas pada activity diagram Decision untuk percabangan jika

terdapat aktivitas yang memiliki kondisi tertentu untuk berhubungan dengan aktivitas lain.

Transition sebagai alur penghubung

antar aktivitas.

Final state untuk mengakhiri sebuah

activity diagram.

3. Tabel Simbol Visibility

Tabel nomor 3 merupakan tabel mengenai simbol visibility untuk diagram kelas. Terdapat bentuk simbol dan deskripsi untuk setiap simbolnya.

Simbol Deskripsi

+ Public visibility berfungsi agar atribut atau operasi dapat diakses

oleh semua kelas.

# Protected visibility berfungsi agar atribut atau operasi hanya dapat

diakses oleh turunan dari kelas tersebut.

~ Package Visibility berfungsi agar atribut atau operasi hanya dapat

diakses oleh kelas pada package yang sama.

- Private Visibility berfungsi agar atribut atau operasi hanya dapat

(11)

DAFTAR KODE PROGRAM

(12)

DAFTAR RUMUS

(13)

DAFTAR ISTILAH

No Istilah Deskripsi

1 Library Koleksi dari rutin-rutin program yang

digunakan untuk membangun dan

mengembangkan perangkat lunak (Wikipedia, 2014).

2 Software Data yang diformat dan disimpan secara

digital, termasuk program komputer,

dokumentasinya, dan berbagai informasi yang bisa dibaca dan ditulis oleh komputer

(Wikipedia, 2014).

3 URL (Uniform Resource

Locator)

Alamat yang mengidentifikasi file tertentu pada Internet, biasanya terdiri dari protokol seperti http, diikuti oleh nama domain (Dictionary.com, 2014).

4 LSI (Latent Semantic

Indexing)

LSI merupakan sebuah metode indexing yang

memasukkan queries ke dalam representasi tingkat rendah, dan juga memungkinkan untuk menghitung nilai kemiripan dari query dokumen ke dalam representasi tingkat rendah dari matriks term-document

(14)

DAFTAR LAMPIRAN

(15)

BAB I

PENDAHULUAN

1.1 Latar Belakang

Kurs mata uang merupakan salah satu hal yang sangat penting bagi kehidupan ini. Saat ini di Indonesia, kurs mata uang rupiah sangat tidak stabil dan semakin menurun nilainya. Kenaikan atau penurunan nilai kurs mata uang tersebut dipengaruhi oleh beberapa faktor, misalnya seperti bencana alam, bursa saham, suku bunga, kondisi perekonomian negara, dan lain-lain. Perubahan nilai kurs mata uang tersebut akan mempengaruhi berbagai macam hal, seperti perekonomian suatu negara, harga barang, suku bunga, harga saham, dan lain-lain. Ketidakstabilan kurs mata uang di Indonesia sekarang ini membuat keresahan salah satunya bagi para pemain saham. Memantau perubahan kurs mata uang sudah menjadi kewajiban dan para pemain saham juga perlu untuk memperkirakan perubahan kurs mata uang di masa akan datang. Jika melakukan kesalahan dalam perkiraan maka akan sangat merugikan para pemain saham tersebut.

(16)

2

dokumen pada tanggal tertentu sebagai landasan untuk menyimpulkan bahwa kurs naik atau turun.

1.2 Rumusan Masalah

Melihat dari latar belakang tersebut, muncul beberapa masalah sebagai berikut:

1. Bagaimana cara melakukan prediksi kurs secara otomatis?

2. Bagaimana hasil pengujian prediksi dengan melihat kemunculan kata dalam dokumen?

1.3 Tujuan

Dengan adanya masalah-masalah tersebut, maka tujuan yang diharapkan sebagai berikut:

1. Prediksi dilakukan dengan menggunakan Latent Semantic Indexing dengan data yang digunakan adalah berita.

2. Hasil pengujian prediksi dengan melihat kemunculan kata dalam dokumen.

1.4 Batasan Masalah

Batasan masalah untuk aplikasi ini adalah sebagai berikut: 1. Aplikasi berbasis desktop.

2. Aplikasi melakukan prediksi kurs mata uang rupiah terhadap dolar Amerika dan menginformasikan kurs naik atau turun tanpa nilai kenaikan dan penurunannya.

3. Faktor yang digunakan untuk melakukan prediksi kurs mata uang adalah ringkasan berita mengenai bursa efek Indonesia, dan berita lengkap mengenai ekonomi bisnis dan moneter.

4. Judul dan ringkasan berita mengenai bursa efek Indonesia yang digunakan berdasarkan hasil dari pencarian pada Google dan beberapa website berita. 5. Berita lengkap mengenai ekonomi bisnis dan moneter yang digunakan

berdasarkan berita yang dipublikasikan pada website Detik Finance. 6. Rentang waktu berita yang digunakan dibatasi antara tanggal 21 Oktober

(17)

3

7. Pemrosesan berita tanpa menggunakan metode stemming.

1.5 Sistematika Pembahasan

Sistematika penulisan yang akan digunakan untuk menyusun laporan adalah sebagai berikut :

BAB I PENDAHULUAN

Bab ini menjelaskan tentang latar belakang, rumusan masalah, tujuan, batasan masalah dan sistematika pembahasan.

BAB II LANDASAN TEORI

Bab ini menjelaskan tentang teori-teori yang berhubungan dengan pembuatan aplikasi dan mendukung aplikasi.

BAB III ANALISIS DAN DISAIN

Bab ini menjelaskan tentang metodologi penelitian, kebutuhan dari aplikasi, perancangan aplikasi, Use Case, Activity Diagram, ERD, dan gambaran arsitektur dari aplikasi yang dibuat.

BAB IV PENGEMBANGAN PERANGKAT LUNAK

Bab ini menjelaskan mengenai langkah kerja dan implementasi dari rancangan aplikasi yang dibuat.

BAB V TESTING DAN EVALUASI SISTEM

Bab ini menjelaskan evaluasi eksperimen dan pengujian dari aplikasi yang dibuat.

BAB VI KESIMPULAN DAN SARAN

Bab ini berisi tentang kesimpulan dan saran yang didapatkan dari hasil eksperimen dan implementasi atau pembuatan aplikasi.

DAFTAR PUSTAKA

(18)

BAB VI

KESIMPULAN DAN SARAN

6.1 Kesimpulan

Kesimpulan yang didapatkan dari hasil analisis ini sebagai berikut:

1. LSI bukan model yang tepat untuk melakukan prediksi kurs, tetapi baik

untuk mengaitkan berita yang tepat, karena berita yang ada pada saat tertentu belum tentu mencerminkan naik turunnya kurs (lihat Tabel 5.4). Contohnya seperti pada sub-bab 5.5, bahwa makna suatu kata tidak dilihat, sehingga kata yang sama walaupun dengan makna yang berbeda dapat dikaitkan. Begitu juga seperti berita bursa saham turun yang biasanya merupakan berita pada tanggal dengan kurs turun, tetapi ditemukan juga pada tanggal dengan kurs naik.

2. Tidak terdapat korelasi kemunculan kata dalam dokumen dengan naik atau turunnya kurs karena sebuah kata belum tentu memiliki makna yang sama untuk konteks dan dokumen yang berbeda, dan kata yang memiliki frekuensi tinggi muncul dalam tanggal, baik dengan kurs naik maupun kurs turun (lihat sub-bab 5.6). Tidak adanya korelasi ini juga menyebabkan penurunan tingkat akurasi pada matriks term-document yang menggunakan TF.

6.2 Saran

Untuk pengembangan aplikasi ini lebih lanjut, berikut ini beberapa saran yang dianjurkan:

1. Penggunaan stemming saat melakukan indexing, sehingga kata-kata yang memiliki kata dasar sama dapat disamakan untuk mengurangi variasi kata. 2. Mengumpulkan data yang lebih banyak dengan domain yang lebih luas

untuk membentuk kaitan kata agar menjadi lebih tepat.

3. Menggunakan model klasifikasi misalnya dengan SVM (Support Vector Machine) dan memprediksi berdasarkan topik dokumen bukan

(19)

DAFTAR PUSTAKA

(2014). Retrieved from Wikipedia: http://id.wikipedia.org/

(2014). Retrieved from Dictionary.com: http://dictionary.reference.com/

Buttcher, S., Clarke, C. L., & Cormack, G. V. (2010). Information Retrieval Implementing and Evaluating Search Engines. London: The MIT Press.

Carpenter, B., & Baldwin, B. (2011). Text Analysis with LingPipe 4. New York: LingPipe Publishing.

Daftar Stop Words List Bahasa Indonesia. (2012, September). Retrieved from Stop Words List, Daftar Kata Dasar, dan Script Algoritma Stemming Bahasa Indonesia:

http://stop-words-list-bahasa- indonesia.blogspot.com/2012/09/daftar-stop-words-list-bahasa-indonesia.html

Dumais, S. T. (1992). Enhanching Performance in Latent Semantic Indexing (LSI) Retrieval. 2-6.

Hamilton, K., & Miles, R. (2006). Learning UML 2.0. United States of America: O'Reilly Media, Inc.

Hedley, J. (2013, September 10). Jsoup: Java HTML Parser. Retrieved from Jsoup Java HTML Parser, with best of DOM, CSS, and jquery: www.jsoup.org

Horstmann, C. S., & Cornel, G. (2008). Core Java™ Volume I-Fundamentals (8th ed.). United State of America: Sun Microsystems, Inc.

Imbar, R. V., & Suteja, R. B. (2006). Pemrograman Web-Commerce dengan Oracle & ASP. Bandung: Informatika.

Kontostathis, A. (2007). Essential Dimensions of Latent Semantic Indexing (LSI).

(20)

Manu, K. (2006). Text Mining Application Programming. Boston: Charles River Media.

Schildt, H. (2005). Java™ A Beginner’s Guide (3rd ed.). United States of America: McGraw-Hill Companies.

Gambar

gambar simbol dan nama dari setiap simbolnya.
Tabel nomor 3 merupakan tabel mengenai simbol visibility untuk diagram

Referensi

Dokumen terkait

Peserta didik dengan kemampuan penalaran matematis kategori rendah apabila peserta didik dapat melakukan manipulasi matematika dengan benar namun kurang lengkap,

Cara bagi hasil yang dilakukan disana dengan sistem kebiasaan di masyarakat, yaitu pemilik tanah menyediakan tanah dan menyediakan biaya yang diperlukan penggarap, dan penggarap

Penelitian ini bertujuan untuk mengetahui perbedaan hasil belajar PKn antara siswa yang dibelajarkan melalui model pembelajaran kooperatif tipe TAI ( Team Assisted

penerimaan negara yang dibagihasilkan kepada daerah dalam bentuk DBH sebesar Rp100.055.194.861.000,00 (seratus triliun lima puluh lima miliar seratus sembilan puluh empat

Dinas Pendidikan, Pemuda dan Olahraga Kabupaten Kuningan sebagai lembaga yang bertanggungjawab kepada publik atau masyarakat yang berkepentingan dalam bidang

5. Pekerjaan pembuatan rangka dinding dan pemasangan dinding pemisah; 6. Pekerjaan pemasangan listplank kayu dan list plafond. Pelaksana pembangunan gedung dan perumahan

Kesimpulan yang dapat diperoleh adalah kemampuan responden yaitu mahasiswa asing (mahasiswa kelompok propinsi Thailand Selatan) dalam memahami percakapan (baik