• Tidak ada hasil yang ditemukan

2. TINJAUAN PUSTAKA

2.1 Morfologi bahasa Sunda

2.1.2 Kata Ulang

Berbeda dengan bahasa Indonesia, kata ulang dalam bahasa Sunda sangat produktif dan dapat berbeda bentuk dengan kata dasarnya. Bahasa Sunda mempunyai kata ulang yang sangat beragam bentuk.

Kata ulang dalam bahasa Sunda adalah kata yang dibangun mengucapkan kata dua kali atau lebih dari kata dasarnya, sebagian atau seluruhnya (Sudaryat et al. 2007). Ilustrasi dari kata ulang dapat dilihat pada Gambar 2.

Gambar 2 Diagram pembentukan kata ulang.

Kata ulang dalam bahasa Sunda dapat dibagi menjadi dua yaitu gembleng dan

sabagian. Kata ulang juga dapat diberi imbuhan yang dalam bahasa Sunda diberi

nama rarangkenan.

2.1.2.1 Gembleng (seluruhnya)

Kata ulang gembleng (seluruhnya) dibagi lagi menjadi dua yaitu:

1. Dwilingga: Kata ulang dwilingga dibangun dengan cara mengucapkan dua

kali dari kata dasarnya. Terdapat dua dwilingga yaitu:

a. Dwimurni: kata dasar yang diulang tidak berubah, contohnya: bapa

b. Dwireka: kata dasar yang diulang berubah bunyi, contohnya: tajong

(tendang) menjadi tujang-tajong (tendang-tendang).

2. Trilingga: kata dasar diulang tiga kali, dan selalu berubah bunyi, contohnya:

plak-plik-pluk.

2.1.2.2 Sabagian (sebagian)

Kata ulang sabagian (sebagian) dibangun dengan cara mengulang kembali salah satu suku kata dasarnya. Ada dua bentuk kata ulang sabagian, yaitu:

1. dwipurwa, yaitu jika suku kata yang diulang adalah suku kata pertama,

contohnya: tajong (tendang) menjadi tatajong,

2. dwimadya, yaitu jika suku kata yang diulang ada di tengah kata, contohnya:

sabaraha (berapa) menjadi sababaraha.

2.1.2.3 Rarangkenan (kata ulang gabungan)

Kata ulang gembleng atau sabagian dapat digabung dengan imbuhan. Gabungan kata ulang dengan imbuhan dapat mempunyai bentuk sebagai berikut:

1. Rarangkenan di-R, suatu kata ulang dalam bentuk dwimurni atau dwireka

dan dwipurwa dapat diberi awalan di-. Contoh untuk bentuk ini adalah:

rasa menjadi dirasa-rasa, pikir manjadi dipikir-pikir, riung menjadi

diriung-riung (dikelilingi oleh banyak orang), dirarasa, dipipikir,

diririung.

2. Rarangkenan di-R-keun. Kata ulang dalam bentuk dwimurni, dwireka dan

dwipurwa dapat diberi awalan di- dan akhiran -keun, contohnya adalah:

asup menjadi diasup-asupkeun (dimasuk-masukkan), tawar menjadi

ditatawarkeun (ditawar-tawarkan).

3. Rarangkenan mang-R. Kata ulang dwilingga dapat diberi awalan mang-,

dengan contohnya adalah sebagai berikut: kata taun menjadi mangtaun-

4. Rarangkenan ka-R. Kata ulang dalam bentuk dwilingga (dwireka dan

dwimurni) dan dwipurwa dapat diberi awalan ka- dengan contoh sebagai

berikut: kata ombak menjadi kaombak-ombak (kena ombak), kata seuit

menjadi kaseuit-seuit, kata candak menjadi kacacandak.

5. Rarangkenan N-R. Kata ulang dalam bentuk dwilingga (dwireka dan

dwimurni) dapat diberi nasal (N-). Contohnya adalah sebagai berikut: kata

tunggu menjadi nunggu-nunggu (menunggu-nunggu), kata beda menjadi

ngabeda-beda (membeda-bedakan).

6. Rarangkenan N-R-keun. Kata ulang dwimurni dapat diberi nasal (N-) dan

akhiran -keun, contohnya adalah sebagai berikut: kata asup menjadi

ngasup-ngasupkeun (memasuk-masukan), kata sorot menjadi nyorot-

nyorotkeun (menyorot-nyorotkan).

7. Rarangkenan R-eun. Kata ulang dwipurwa dapat mendapat akhiran -eun.

Contohnya adalah sebagai berikut: kata lini (gempa) menjadi lilinieun

(terasa sepeti gempa), kata jauh menjadi jajauheun (terasa jauh)

8. Rarangkenan R-um. Kata ulang dwilingga juga bisa diberi sisipan -um-,

contohnya adalah sebagai berikut: kata tuluy (terus) menjadi tuluy-tumuluy

(keterus-terusan)

9. Rarangkenan pa-R. Kata ulang dwilingga dapat diberi awalan pa-,

contohnya adalah sebagai berikut: kata tarik menjadi patarik-tarik (saling menarik), palaun-laun (saling lambat-lambat).

10. Rarangkenan ti-R. Kata ulang dengan bentuk dwipurwa dapat diberi

awalan ti-, contohnya adalah sebagai berikut: tipoporose, tipaparetot.

11. Rarangkenan R-an. Kata ulang dengan bentuk dwilinga dan dwipurwa

dapat diberi akhiran -an, contohnya adalah: kata layar menjadi lalayaran

(berlayar-layar), kata indit (pergi) menjadi indit-inditan (pergi-pergian), kata kawih menjadi kakawihan (menyanyikan lagu).

12. Rarangkenan R-na. Kata ulang dwilingga dan dwipurwa dapat diberi akhiran -na, contohnya adalah sebagai berikut: kata gede (besar) menjadi

gegedena (yang besarnya), dalit (sahabat) menjadi dalit-dalitna (sahabat-

sahabatnya).

13. Rarangkenan pang-R-na. Kata ulang dwilingga dapat diberi awalan pang-

dan akhiran -na. Contohnya adalah sebagai berikut: alus (bagus) menjadi

pangalus-alusna (yang terbagus), bageur (baik hati ) menjadi pangbageur-

bageurna (yang terbaik hati).

14. Rarangkenan sa-R-na. Kata ulang dwilingga dapat diberi awalan sa- dan

akhiran -na. Contohnya adalah sebagai berikut: hade (bagus) menjadi

sahade-hadena (sebagus-bagusnya), bisa menjadi sabisa-bisana (sebisa-

bisanya).

2.2 Stemming

Stemming adalah proses penghilangan prefiks, infiks dan sufiks dari suatu

kata. Stemming dilakukan atas dasar asumsi bahwa kata-kata yang memiliki stem

yang sama memiliki makna yang serupa sehingga pengguna tidak keberatan untuk memperoleh dokumen-dokumen yang di dalamnya terdapat kata-kata dengan stem

yang sama dengan query-nya. Proses stemming tersebut dapat diilustrasikan dengan Gambar 3.

Gambar 3 Ilustrasi proses stemming. Teknik-teknik stemming dapat dikategorikan menjadi:

- berdasarkan kamus,

- berdasarkan kemunculan bersama.

Stemming dalam sistem temu kembali informasi tergantung pada bahasa

yang digunakan dalam dokumen yang akan dicari. Algoritme stemming untuk bahasa Inggris kurang optimal untuk menangani dokumen dalam bahasa Indonesia. Selain itu bahasa Indonesia pastinya juga memiliki daftar kata buang

(stoplist) serta sistem pembentukan kata yang sangat berbeda dengan bahasa

Inggris, sehingga diperlukan algoritme stemming yang khusus untuk bahasa Indonesia. Demikian juga untuk bahasa Sunda, juga diperlukan algoritme

stemming khusus untuk mencari kata dasar dari suatu kata dalam bahasa Sunda.

Terdapat bermacam-macam jenis stemmer, di antaranya adalah: stemmer

infleksional yaitu stemmer yang membuang imbuhan (inflection) dari kata dengan

menggunakan aturan tata bahasanya. Contoh dari stemmer ini adalah stemmer

yang menggunakan algoritme Potter. Algoritme stemmer infleksional dalam bahasa Indonesia salah satunya diteliti oleh Adriani et al. (2007). Jenis stemmer

yang lain adalah stemmer corpus-based, yaitu stemmer yang menggunakan koleksi dokumen untuk mendapatkan kata dasar dari sebuah kata.

Siregar (1995) dalam penelitiannya menyatakan, untuk mendapatkan kata dasar dari suatu kata berimbuhan, dilakukan proses stemming dan untuk menguji apakah kata hasil stemming tersebut valid maka kata tersebut dibandingkan dengan Kamus Besar bahasa Indonesia. Adriani et al. (2007), meneliti stemmer

morfologi untuk bahasa Indonesia dengan mengemukakan algoritme stemming

yang juga membandingkan kata yang akan di-stem dengan Kamus Besar bahasa Indonesia. Pada penelitian lainnya, Ichsan (1996) mengemukakan teknik stemmer

corpus-based dengan menggunakan statistic co-occurace dari variasi kata untuk

mencari keakuratan hasil stemming. Tala (2003) melakukan modifikasi terhadap algoritme Potter untuk stemming bahasa Indonesia. Semua stemmer-stemmer yang diteliti oleh para peneliti di atas menghasilkan kata dasar dengan menghilangkan imbuhan, sisipan dan akhiran dari kata-kata berimbuhan bahasa Indonesia.

Dokumen terkait