2. TINJAUAN PUSTAKA
2.1 Morfologi bahasa Sunda
2.1.2 Kata Ulang
Berbeda dengan bahasa Indonesia, kata ulang dalam bahasa Sunda sangat produktif dan dapat berbeda bentuk dengan kata dasarnya. Bahasa Sunda mempunyai kata ulang yang sangat beragam bentuk.
Kata ulang dalam bahasa Sunda adalah kata yang dibangun mengucapkan kata dua kali atau lebih dari kata dasarnya, sebagian atau seluruhnya (Sudaryat et al. 2007). Ilustrasi dari kata ulang dapat dilihat pada Gambar 2.
Gambar 2 Diagram pembentukan kata ulang.
Kata ulang dalam bahasa Sunda dapat dibagi menjadi dua yaitu gembleng dan
sabagian. Kata ulang juga dapat diberi imbuhan yang dalam bahasa Sunda diberi
nama rarangkenan.
2.1.2.1 Gembleng (seluruhnya)
Kata ulang gembleng (seluruhnya) dibagi lagi menjadi dua yaitu:
1. Dwilingga: Kata ulang dwilingga dibangun dengan cara mengucapkan dua
kali dari kata dasarnya. Terdapat dua dwilingga yaitu:
a. Dwimurni: kata dasar yang diulang tidak berubah, contohnya: bapa
b. Dwireka: kata dasar yang diulang berubah bunyi, contohnya: tajong
(tendang) menjadi tujang-tajong (tendang-tendang).
2. Trilingga: kata dasar diulang tiga kali, dan selalu berubah bunyi, contohnya:
plak-plik-pluk.
2.1.2.2 Sabagian (sebagian)
Kata ulang sabagian (sebagian) dibangun dengan cara mengulang kembali salah satu suku kata dasarnya. Ada dua bentuk kata ulang sabagian, yaitu:
1. dwipurwa, yaitu jika suku kata yang diulang adalah suku kata pertama,
contohnya: tajong (tendang) menjadi tatajong,
2. dwimadya, yaitu jika suku kata yang diulang ada di tengah kata, contohnya:
sabaraha (berapa) menjadi sababaraha.
2.1.2.3 Rarangkenan (kata ulang gabungan)
Kata ulang gembleng atau sabagian dapat digabung dengan imbuhan. Gabungan kata ulang dengan imbuhan dapat mempunyai bentuk sebagai berikut:
1. Rarangkenan di-R, suatu kata ulang dalam bentuk dwimurni atau dwireka
dan dwipurwa dapat diberi awalan di-. Contoh untuk bentuk ini adalah:
rasa menjadi dirasa-rasa, pikir manjadi dipikir-pikir, riung menjadi
diriung-riung (dikelilingi oleh banyak orang), dirarasa, dipipikir,
diririung.
2. Rarangkenan di-R-keun. Kata ulang dalam bentuk dwimurni, dwireka dan
dwipurwa dapat diberi awalan di- dan akhiran -keun, contohnya adalah:
asup menjadi diasup-asupkeun (dimasuk-masukkan), tawar menjadi
ditatawarkeun (ditawar-tawarkan).
3. Rarangkenan mang-R. Kata ulang dwilingga dapat diberi awalan mang-,
dengan contohnya adalah sebagai berikut: kata taun menjadi mangtaun-
4. Rarangkenan ka-R. Kata ulang dalam bentuk dwilingga (dwireka dan
dwimurni) dan dwipurwa dapat diberi awalan ka- dengan contoh sebagai
berikut: kata ombak menjadi kaombak-ombak (kena ombak), kata seuit
menjadi kaseuit-seuit, kata candak menjadi kacacandak.
5. Rarangkenan N-R. Kata ulang dalam bentuk dwilingga (dwireka dan
dwimurni) dapat diberi nasal (N-). Contohnya adalah sebagai berikut: kata
tunggu menjadi nunggu-nunggu (menunggu-nunggu), kata beda menjadi
ngabeda-beda (membeda-bedakan).
6. Rarangkenan N-R-keun. Kata ulang dwimurni dapat diberi nasal (N-) dan
akhiran -keun, contohnya adalah sebagai berikut: kata asup menjadi
ngasup-ngasupkeun (memasuk-masukan), kata sorot menjadi nyorot-
nyorotkeun (menyorot-nyorotkan).
7. Rarangkenan R-eun. Kata ulang dwipurwa dapat mendapat akhiran -eun.
Contohnya adalah sebagai berikut: kata lini (gempa) menjadi lilinieun
(terasa sepeti gempa), kata jauh menjadi jajauheun (terasa jauh)
8. Rarangkenan R-um. Kata ulang dwilingga juga bisa diberi sisipan -um-,
contohnya adalah sebagai berikut: kata tuluy (terus) menjadi tuluy-tumuluy
(keterus-terusan)
9. Rarangkenan pa-R. Kata ulang dwilingga dapat diberi awalan pa-,
contohnya adalah sebagai berikut: kata tarik menjadi patarik-tarik (saling menarik), palaun-laun (saling lambat-lambat).
10. Rarangkenan ti-R. Kata ulang dengan bentuk dwipurwa dapat diberi
awalan ti-, contohnya adalah sebagai berikut: tipoporose, tipaparetot.
11. Rarangkenan R-an. Kata ulang dengan bentuk dwilinga dan dwipurwa
dapat diberi akhiran -an, contohnya adalah: kata layar menjadi lalayaran
(berlayar-layar), kata indit (pergi) menjadi indit-inditan (pergi-pergian), kata kawih menjadi kakawihan (menyanyikan lagu).
12. Rarangkenan R-na. Kata ulang dwilingga dan dwipurwa dapat diberi akhiran -na, contohnya adalah sebagai berikut: kata gede (besar) menjadi
gegedena (yang besarnya), dalit (sahabat) menjadi dalit-dalitna (sahabat-
sahabatnya).
13. Rarangkenan pang-R-na. Kata ulang dwilingga dapat diberi awalan pang-
dan akhiran -na. Contohnya adalah sebagai berikut: alus (bagus) menjadi
pangalus-alusna (yang terbagus), bageur (baik hati ) menjadi pangbageur-
bageurna (yang terbaik hati).
14. Rarangkenan sa-R-na. Kata ulang dwilingga dapat diberi awalan sa- dan
akhiran -na. Contohnya adalah sebagai berikut: hade (bagus) menjadi
sahade-hadena (sebagus-bagusnya), bisa menjadi sabisa-bisana (sebisa-
bisanya).
2.2 Stemming
Stemming adalah proses penghilangan prefiks, infiks dan sufiks dari suatu
kata. Stemming dilakukan atas dasar asumsi bahwa kata-kata yang memiliki stem
yang sama memiliki makna yang serupa sehingga pengguna tidak keberatan untuk memperoleh dokumen-dokumen yang di dalamnya terdapat kata-kata dengan stem
yang sama dengan query-nya. Proses stemming tersebut dapat diilustrasikan dengan Gambar 3.
Gambar 3 Ilustrasi proses stemming. Teknik-teknik stemming dapat dikategorikan menjadi:
- berdasarkan kamus,
- berdasarkan kemunculan bersama.
Stemming dalam sistem temu kembali informasi tergantung pada bahasa
yang digunakan dalam dokumen yang akan dicari. Algoritme stemming untuk bahasa Inggris kurang optimal untuk menangani dokumen dalam bahasa Indonesia. Selain itu bahasa Indonesia pastinya juga memiliki daftar kata buang
(stoplist) serta sistem pembentukan kata yang sangat berbeda dengan bahasa
Inggris, sehingga diperlukan algoritme stemming yang khusus untuk bahasa Indonesia. Demikian juga untuk bahasa Sunda, juga diperlukan algoritme
stemming khusus untuk mencari kata dasar dari suatu kata dalam bahasa Sunda.
Terdapat bermacam-macam jenis stemmer, di antaranya adalah: stemmer
infleksional yaitu stemmer yang membuang imbuhan (inflection) dari kata dengan
menggunakan aturan tata bahasanya. Contoh dari stemmer ini adalah stemmer
yang menggunakan algoritme Potter. Algoritme stemmer infleksional dalam bahasa Indonesia salah satunya diteliti oleh Adriani et al. (2007). Jenis stemmer
yang lain adalah stemmer corpus-based, yaitu stemmer yang menggunakan koleksi dokumen untuk mendapatkan kata dasar dari sebuah kata.
Siregar (1995) dalam penelitiannya menyatakan, untuk mendapatkan kata dasar dari suatu kata berimbuhan, dilakukan proses stemming dan untuk menguji apakah kata hasil stemming tersebut valid maka kata tersebut dibandingkan dengan Kamus Besar bahasa Indonesia. Adriani et al. (2007), meneliti stemmer
morfologi untuk bahasa Indonesia dengan mengemukakan algoritme stemming
yang juga membandingkan kata yang akan di-stem dengan Kamus Besar bahasa Indonesia. Pada penelitian lainnya, Ichsan (1996) mengemukakan teknik stemmer
corpus-based dengan menggunakan statistic co-occurace dari variasi kata untuk
mencari keakuratan hasil stemming. Tala (2003) melakukan modifikasi terhadap algoritme Potter untuk stemming bahasa Indonesia. Semua stemmer-stemmer yang diteliti oleh para peneliti di atas menghasilkan kata dasar dengan menghilangkan imbuhan, sisipan dan akhiran dari kata-kata berimbuhan bahasa Indonesia.