PENGEMBANGAN ALGORITMA LATENT SEMANTIC ANALYSIS PADA PENILAI ESAI OTOMATIS DALAM BAHASA INGGRIS

(1)

PENGEMBANGAN ALGORITMA LATENT

SEMANTIC ANALYSIS PADA PENILAI

ESAI OTOMATIS DALAM BAHASA

INGGRIS

Martin Sendra, Josep Harianata, Rudy Sutrisno, Derwin

Suhartono

Universitas Bina Nusantara

Jl. K H. Syahdan No. 9 Kemanggisan – Palmerah Jakarta Barat 11480 +62.21 534 5830 / +62.21 530 0244

[email protected], [email protected], [email protected], [email protected]

ABSTRACT

The research objective is to build an algorithm which is able to provide the closest correlation value to human grader in assessing an essay. Hence, the essay quality measurement will be more consistent. In this study, we develop an automated essay scoring system which is used in English essays. An enhanced version of Latent Semantic Analysis (LSA) which is combined with term similarity feature is developed. The term similarity is to provide tolerance value of typo words. The tolerance will be given when typo word has a suggested word, and its frequency is less than the correct words in the essay. The research tested on 119 student’s essay. LSA which is combined with term similarity indicates the correlation level of 0.242 to human judgment, while original LSA algorithm indicates the correlation level of 0.244 to human judgment. The experiment results indicate that LSA with term similarity has a better correlation value compared with the correlation value of original LSA.

(2)

ABSTRAK

Penelitian ini bertujuan untuk membangun pengembangan algoritma yang mampu

memberikan penilaian yang lebih mirip dengan penilai manusia dalam menilai esai,

agar para penilai esai memiliki kualitas penilaian yang konsisten. Pada penelitian ini,

sistem penilai otomatis yang dikembangkan adalah penilaian otomatis pada esai

(Automated Essay Grading) dalam Bahasa Inggris dengan menggunakan metode

Latent Semantic Analysis (LSA) dengan penambahan fitur term similarity. Term

similarity berfungsi untuk memberikan nilai toleransi pada kata yang salah ketik.

Nilai akan diberikan apabila terdapat kata yang salah ketik, dan terdapat kata yang

disarankan, dan memiliki kata tersebut memiliki frekuensi yang lebih sedikit

dibandingkan kata yang benar pada esai. Pada penelitian ini sistem

diimplementasikan menggunakan PHP untuk tampilan dan bahasa pemrograman

Python untuk proses penerapan LSA dengan term similarity. Esai yang diuji pada

penelitian ini berjumlah 119 esai. LSA dengan term similarity menunjukkan rata-rata

selisih nilai sebesar 0,237 dengan penilaian manusia. Kesimpulan yang didapat dari

penelitian ini adalah metode LSA dengan term similarity memiliki tingkat kemiripan

penilaian yang lebih menjanjikan dibandingkan LSA.

Kata Kunci : Automated Essay Grading, Latent Semantic Analysis, Term Similarity.

PENDAHULUAN

Menurut konteks barat, proses edukasi cenderung ke arah memperkuat kemampuan analisa, mempertanyakan, mengevaluasi pengetahuan, mendorong pelajar untuk mengkritisi dan mengkombinasikan pengetahuan untuk mengkritisi kearifan tradisional dan membentuk sudut pandang tersendiri (Hyland, 2009:38). Menurut Hyland (2014:3) menulis merupakan salah satu metode untuk membagikan pemahaman seseorang terhadap suatu topik pengetahuan.

Namun pemahaman tiap individu terhadap suatu topik dapat berbeda satu sama lain, oleh karena itu diperlukan pengujian pemahaman agar makna suatu pengetahuan terjaga sesuai makna aslinya. Menurut Wild, Stahl, Stermsek, dan Neumann (2005:2), esai lebih menilai kualitas pemahaman pengetahuan para pelajar dibandingkan ujian pilihan ganda karena untuk menulis esai.

Memberikan respon pada suatu esai dinilai penting untuk meningkatkan kualitas penulisan esai. Namun kadang kala para pengajar, dapat merasa terbebani ketika terdapat banyak esai yang harus dinilai (Dikli, 2006). Oleh karena itu, penelitian ini dilakukan untuk membantu para pengajar menilai esai melalui sistem penilai esai otomatis. Dalam perkembangannya, terdapat beberapa algoritma untuk menilai esai, seperti Latent Semantic Analysis (LSA), Probabilistic Latent Semantic Analysis (PLSA), Latent Dirichlet Allocation (LDA), dan Generalized Latent Semantic Analysis (GLSA). Berdasarkan penelitian Kakkonen, Myller, Sutinen, dan Timonen (2008) terhadap uji akurasi algoritma LSA, PLSA, LDA, dan KNN, didapatkan hasil pengujian dapat dilihat pada tabel berikut :

(3)

Tabel Perbandingan Hasil LSA, PLSA, LDA, dan KNN (Kakkonen, Myller, Sutinen, dan Timonen, 2008)

Berdasarkan tabel tersebut, dapat dilihat bahwa LSA memiliki akurasi yang lebih tinggi dengan nilai manusia dibandingkan metode lainnya, sehingga pada penelitian ini, pengembangan algoritma dilakukan pada algoritma LSA.

Tujuan yang ingin dicapai dari penelitian ini adalah :

1. Membangun algoritma Latent Semantic Analysis dengan term similarity yang memiliki rata-rata selisih nilai yang lebih tinggi dalam menilai esai dibandingkan dengan algoritma Latent Semantic Analysis.

2. Memberikan perbandingan selisih nilai beberapa algoritma penilai esai otomatis.

Manfaat yang ingin dicapai dari penelitian ini adalah :

1. Membantu institusi atau tenaga pengajar dalam menilai esai dengan lebih akurat. 2. Penilai esai dapat menilai esai dengan lebih akurat dalam waktu yang lebih singkat.

METODE

Metode Penelitian yang digunakan dalam penelitian ini terbagi menjadi 3 tahapan, yaitu pengumpulan data dan analisis dengan studi literatur, wawancara narasumber, analisa aplikasi sejenis, dan kuesioner untuk membangun algoritma yang tepat guna, dilanjutkan dengan metode perancangan dengan mengkombinasikan algoritma LSA dengan term similarity, kemudian algoritma tersebut akan dievaluasi secara objektif dengan menguji selisih nilai dengan membandingkan nilai yang dihasilkan oleh sistem dengan nilai manusia.

(4)

Berikut langkah-langkah proses penilai esai otomatis yang dikembangkan : 1. Esai referensi dan esai mahasiswa diinput ke dalam sistem.

2. Lingual checking akan dilakukan pada esai mahasiswa untuk diuji dan dinilai berdasarkan total kesalahan kata, tata bahasa, dan kesesuaian total kata pada esai dengan kriteria penguji manusia. Pengujian dilakukan dengan Microsoft Word yang dikomputasi dengan Python. Penilaian tata bahasa dan kata dihitung secara terpisah, namun memiliki rumus dan rentang penilaian yang sama. Penilaian kata dan tata bahasa dirumuskan sebagai berikut :

= Persentase (kata /tata bahasa) error / salah = Total (kata /tata bahasa) error / salah

= Total (kata /tata bahasa) pada esai

Untuk menentukan nilai yang didapatkan dari perhitungan penilaian penggunaan kata pada esai, ditentukan dengan rumus :

= Nilai (kata /tata bahasa) error / salah = Persentase (kata /tata bahasa) error / salah

Nilai 0.667 didapatkan dari total nilai maksimum yang dapat diberikan untuk penggunaan (kata /tata bahasa) pada esai. Rentang penilaian penggunaan (kata /tata bahasa) dapat dilihat pada tabel berikut :

(5)

Tabel Rentang Penilaian Penggunaan (kata /tata bahasa) Persentase Kesalahan

Penggunaan (kata /tata bahasa) Nilai 0 % 0.000 0,01 – 12.5 % 0.000 - 0.083 12.51 – 25.0 % 0.083 - 0.167 25.10 – 37.50 % 0.167 - 0.250 37.51 – 50.0 % 0.250 - 0.333 50.01 – 62.5 % 0.333 - 0.417 62.51 – 75.0 % 0.417 - 0.500 75.01 – 87.50 % 0.500 - 0.583 87.51 – 100 % 0.583 - 0.667

Sementara untuk penilaian kesesuaian total kata pada esai dengan kriteria penguji manusia dirumuskan sebagai berikut :

Tabel Persentase Rentang Penilaian Total kata Persentase Total Kata Nilai

0 – 20,32 % 0.000 20,33 – 30,32 % 0.083 30,33 – 40,32 % 0.167 40,33 – 50,32 % 0.250 50,33 – 60,32 % 0.333 60,33 – 70,32 % 0.417 70,33 – 80,32 % 0.500 80,33 – 90,32 % 0.583 90,33 - 100 % 0.667

3. Text preprocessing dilakukan pada esai referensi dan esai mahasiswa dengan menghilangkan stopwords, tokenization, dan stemming untuk mengubah kata menjadi kata dasar.

4. Esai mahasiswa akan diproses dengan metode term similarity. Proses rinci term similarity digambarkan dengan flowchart berikut :

(6)

Apabila terdapat term yang salah ketik, maka dilanjutkan dengan pemeriksaan ketersediaan kata yang disarankan, apabila ada, maka diperiksa jumlah kata yang error dan kata yang disarankan, bila jumlah kata yang error lebih kecil dibandingkan jumlah kata yang disarankan, maka dilakukan perhitungan sebagai berikut :

TS = term similarity = total huruf yang sama

= total huruf pada kata terpanjang = kata yang salah

Dalam perhitungan tersebut, kata terpanjang terpilih berdasarkan hasil perbandingan total huruf kata yang salah ketik dengan kata yang disarankan. Setelah dihitung, maka dilakukan pengecekan ketersediaan term, apabila masih tersedia term¸maka akan dilakukan proses term similarity, bila tidak, maka proses term similarity berakhir.

5. Term yang dihasilkan oleh text preprocessing dan term similarity akan diubah menjadi term-document matrix yang menggambarkan bobot tiap term berdasarkan frekuensi kemunculan term pada setiap document.

6. Term-document matrix akan diproses dalam SVD

untuk mengurangi noise/ term yang tidak dibutuhkan. SVD akan mereduksi matriks menjadi 3 matriks yang nantinya akan disatukan kembali membentuk matriks yang baru.

(7)

7. Hasil dari proses SVD akan membentuk vektor yang akan dihitung tingkat kemiripannya dengan cosine similarity.

8. Hasil penilai esai otomatis didapatkan dari

penjumlahan proses cosine similarity dengan hasil dari proses lingual checking.

9. Nilai yang diberikan penilai esai otomatis diuji tingkat

korelasinya dengan membandingkan dengan nilai yang diberikan manusia.

HASIL DAN PEMBAHASAN

Evaluasi Objektif dilakukan dengan membandingkan hasil penilaian algoritma yang dikembangkan dalam penilai esai otomatis menggunakan Bahasa Inggris dengan algoritma yang pernah dikembangkan sebelumnya. Algoritma yang digunakan sebagai pembanding yaitu algoritma LSA. Berikut hasil perbandingannya :

Gambar Perbandingan Algoritma LSA & LSA TS dengan Human Judge

Dari Gambar di atas, dapat disimpulkan bahwa dalam algoritma LSA, algoritma yang menunjukkan selisih nilai dengan penilaian manusia adalah algoritma LSA dengan term similarity. LSA dengan term similarity memiliki nilai rata-rata selisih sebesar 0.237 , dibandingkan LSA dengan nilai rata-rata selisih sebesar 0,239.

Pengujian berikutnya dilakukan untuk membandingkan algoritma LSA dengan term similarity dengan algoritma GLSA dalam menilai esai, hasil pengujian dapat dilihat pada Gambar berikut

(8)

Gambar Perbandingan Algoritma LSA TS & GLSA dengan Human Judge

Berdasarkan Gambar di atas, dapat disimpulkan bahwa algoritma GLSA memiliki nilai rata-rata selisih sebesar 0,236 dengan penilaian manusia, lebih unggul dibandingkan algoritma LSA dengan term similarity (LSA TS) yang memiliki nilai rata-rata selisih sebesar 0,237. Dalam pengujian yang dilakukan, berikut Tabel perbandingan algoritma LSA TS dengan GLSA.

Tabel Hasil Perbandingan Algoritma LSA TS dengan GLSA

LSA TS GLSA Draw

9 9 101

0.237 0.236 0.241

Dari Tabel di atas, dapat dilihat hasil perbandingan algoritma LSA TS dengan GLSA dalam menilai 119 esai, GLSA dan LSA TS seimbang sebanyak 9 esai. Namun dalam tingkat rata-rata selisih nilai yang dihasilkan, GLSA lebih unggul dengan nilai rata-rata selisih sebesar 0.236, sementara algoritma LSA dengan term similarity memiliki nilai rata-rata selisih sebesar 0.237.

SIMPULAN DAN SARAN

Setelah melakukan penelitian terkait pengembangan algoritma Latent Semantic Analysis dengan term similarity pada penilai esai otomatis dalam bahasa inggris, diperoleh kesimpulan sebagai berikut :

1. Algoritma LSA dengan term similarity menunjukkan performa yang lebih tinggi dibandingkan algoritma LSA. LSA dengan term similarity unggul dengan total sebanyak 31 esai dengan rata-rata selisih nilai sebesar 0.237 , dibandingkan algoritma LSA yang unggul sebanyak 26 esai dengan rata-rata selisih nilai sebesar 0.239.

(9)

2. Dalam perbandingan algoritma LSA dengan term similarity dan GLSA, meskipun menghasilkan penilaian yang sama-sama unggul pada 9 esai, namun algoritma LSA dengan term similarity hanya memiliki rata-rata selisih nilai sebesar 0.237, sementara algoritma GLSA memiliki rata-rata selisih nilai sebesar 0.236. Hal ini menunjukkan GLSA masih lebih unggul dibandingkan algoritma LSA dengan term similarity.

3. Berdasarkan hasil wawancara dengan 3 dosen Bahasa Inggris Universitas Bina Nusantara, diperoleh hasil bahwa sistem penilai esai otomatis yang dikembangkan dapat membantu para penilai esai.

Saran untuk pengembangan lebih lanjut :

1. Training data dalam jumlah yang lebih besar agar algoritma dapat memberikan nilai yang lebih dekat dengan penilaian manusia.

2. Mencoba mengembangkan term similarity dalam algoritma penilai esai otomatis selain LSA seperti PLSA, LDA, dan GLSA.

3. Penambahan fitur pada aplikasi penilai esai otomatis seperti forum / chat sebagai sarana dosen dan mahasiswa berdiskusi untuk meningkatkan kualitas penulisan esai.

4. Penambahan fitur pada aplikasi penilai esai otomatis seperti penanda kesalahan mahasiswa dalam menulis esai agar mahasiswa dapat mengetahui letak kesalahan penulisan yang dilakukan.

REFERENSI

Dikli, S. (2006). Automated Essay Scoring. Turkish Online Journal of Distance Education - TOJDE, 7, 5.

Dikli, S. (2006). An Overview of Automated Scoring of Essays. Journal of Technology, Learning, and Assessment, 5(1). Retrieved [date] from http://www.jtla.org.

Hyland, K. (2009). Second Language Writing. New York: Cambridge University Press.

Hyland, K. (2014). Disciplinary discourses: social interactions in academic writing. Michigan: The University of Michigan Press.

Kakkonen, T., Myller, N., Sutinen, E., & Timonen, J. (2008). Comparison of Dimension Reduction Methods for Automated Essay Grading. Educational Technologi & Society, 275-288. Wild, F., Stahl, C.,Stermsek, G., & Neumann, G. (2005). Parameters driving effectiveness of

automated essay scoring with LSA. IN: Proceedings of the 9th CAA Conference, Loughborough: Loughborough University

(10)

RIWAYAT PENULIS

1.

PERSONAL INFORMATION

Binusian ID 1501151426

Full Name MARTIN SENDRA

E-mail [email protected]

Address JL. TSS RAYA nomor 53, RT 003 RW 004, Kecamatan Tambora, Kelurahan Duri Selatan, DKI Jakarta, Indonesia

Phone Numbers Mobile : 62 - 857 - 73731118 Home : 62 - 21 - 63868377

Gender Male

Birth Place / Date JAKARTA / 16 September 1993

Nationality Indonesia

Marital Status Single

Religion Christian

FORMAL EDUCATION

Sep 2011 – present Bina Nusantara University, Jakarta, Indonesia Bachelor (S1), Computer Science GPA: 3.53 Jul 2008 - Jul 2011 SMA Damai, Jakarta, Indonesia

Senior High School

2.

Binusian ID 1501154535

Full Name JOSEP HARIANATA

Address Ambar Bogor Regency 3 blok F2 no. 18

RT/04 RW/08 kel. Nagrak, kec. Sukaraja, kab. Bogor Bogor 16710

Jawa Barat, Indonesia Phone Numbers Mobile : 62 – 87- 872310474

Home : -

Gender Male

Birth Place / Date JAKARTA/26 Dec 1993

Religion Christian

Sep 2011 – present Bina Nusantara University, Jakarta, Indonesia Bachelor (S1), Computer Science GPA: 3.37 Jul 2008 - Jul 2011 Mardi Yuana, Sukabumi, Indonesia

Senior High

Jul 2005 - Jul 2008 Yuwati Bhakti, Sukabumi, Indonesia Junior High

3.

Binusian ID 1501169013

Full Name RUDY SUTRISNO

(11)

TANGERANG

15122, Banten, Indonesia Phone Numbers Mobile : 62-0898-9207-406

Home : -

Gender Male

Birth Place / Date MEDAN / 17 March1993

Religion Buddha

Sep 2011 – present Bina Nusantara, Jakarta, Indonesia

Bachelor (S1), Computer Science GPA: 3.52 Jul 2008 - Jul 2011 SMAN 57, Jakarta, Indonesia

Senior High

Jul 2005 - Jul 2008 SMP PROVIDENTIA, Jakarta, Indonesia Junior High