Fallianda 1 Homsatun Nafiah 2 Universitas Airlangga
II. Kerangka dan Metode Penelitian
Gambar 1. Skema Penelitian
Seperti yang ditunjukkan oleh gambar 1, penelitian ini diawali dengan mengumpulkan beberapa bahan penelitian, yaitu mencari beberapa referensi yang dapat dijadikan sebagai daftar pustaka dan perangkat lunak (software) Python 3.4.2 untuk Windows 7 yang dapat di-download melalui link : https://www.python.org/downloads/windows/. Kemudian file perangkat lunak (software) Python 3.4.2 di-install di laptop yang nantinya untuk alat penelitian.
Tahapan selanjutnya adalah membuat file perangane_awak.csv yang didalamnya terdapat tembung bahasa jawa (ngoko, krama madya, dan krama inggil) dan bahasa indonesia. Kemudian membuat file program perangane_awak.py yang digunakan untuk membaca file perangane_awak.csv.
Tahap terakhir yaitu menguji file program perangane_awak.py dengan menekan tombol F5 pada IDLE (Python 3.4 GUI - 32 bit).
III. Analisis Penelitian
3.1 Pembuatan File perangane_awak.csv
Setelah pengumpulan bahan penelitian seperti yang ditunjukkan oleh gambar 1, maka penulis mulai membuat file perangane_awak.csv menggunakan perangkat lunak (software) Microsoft Office Excel. File perangane_awak.csv didalamya terdapat tembung bahasa jawa (ngoko, krama madya, dan krama inggil) dan bahasa indonesia, seperti yang ditunjukkan oleh tabel 1 di bawah ini.
Ngoko Krama Madya Krama Inggil Bahasa Indonesia
alis alis imba alis
ati manah penggalih hati
awak badan salira tubuh
balung balung tosan tulang
bangkekan bangkekan pamekan pergelangan
tangan
bathuk bathuk palarapan dahi
bokong bokong bocong pantat
brengos brengos gumbala, rawis kumis
cangkem cangkem tutuk mulut
cengel cengel griwa cengel
dhadha dhadha jaja dada
dhengkul dhengkul jengku lutut
dlamakan dlamakan samparan telapak
driji driji racikan jari
154 Prosiding Seminar Leksikografi Indonesia
embun-embunan embun-embunan pasundhulan ubun-ubun
endhas sirah mustaka kepala
epek-epek epek-epek tapak asta telapak tangan
geger geger pengkeran punggung
gelung gelung uker sanggul
getih rah rah darah
githok githok julukan tengkuk
gulu gulu jangga leher
idep idep ibing bulu mata
idu idu kecoh ludah
iga iga unusan tulang iga
ilat ilat lidhah lidah
irung irung grana hidung
janggut janggut kethekan, sadhegan dagu
kempol kempol wengkelan paha
kringet kringet riwe keringat
kuku kuku kenaka kuku
kuping kuping talingan telinga
lambe lambe lathi bibir
luh luh waspa air mata
mata mripat paningal, soca mata
pipi pipi pangarasan pipi
pundhak pundhak pamidhangan bahu
pupu pupu wentis paha
rai rai pasuryan wajah
rambut rambut rikma, rema rambut
riyak riyak jlagra dahak
sirah sirah mustaka kepala
sikil suku ampeyan/sampeyan kaki
susu susu prembayun payudara
suwara swanten swanten suara
tangan tangan asta tangan
umbel umbel gadhing ingus
untu untu waja gigi
uyuh toyan turas kencing
weteng weteng padharan perut
wudel wudel tuntunan pusar
Tabel 1. Perangane Awak (Anonim. 2013 dan Raharjo, 2008)
3.2. Pembuatan File perangane_awak.py
Tahapan selanjutnya adalah membuat file perangane_awak.py seperti yang ditunjukkan oleh gambar 2. File perangane_awak.py ditulis dengan menggunakan IDLE (Python 3.4 GUI - 32 bit).
Gambar 2. Perangane_awak.py
Baris kode program # Nama file: perangane_awak.py menunjukkan keterangan dan tidak diakses pada saat program dijalankan, karena diawal tanda #. Selanjutnya, kode program import csv artinya menggunakan modul csv, karena program ini akan digunakan untuk membaca file bertipe csv, yaitu file perangane_awak.csv.
Kode program selanjutnya, yaitu :
with open('perangane_awak.csv', 'r') as file_csv:
file = csv.reader(file_csv)
menunjukkan file perangane_awak.csv dibuka terlebih dahulu dengan fungsi open('perangane_awak.csv', 'r') sebagai variable file_csv. Lalu variable file_csv yang telah memanggil file perangane_awak.csv dibaca dengan metode file = csv.reader(file_csv).
Selanjutnya menampilkan data yang telah dibaca dalam bentuk daftar (list) dengan menggunakan kode program :
for data in file:
print(data)
3.3. Running File Program perangane_awak.py
Kode program yang telah ditulis menggunakan IDLE (Python 3.4 GUI - 32 bit) dan disimpan dalam file perangane_awak.py, kemudian dijalankan dengan menekan tombol F5 untuk menguji apakah kode program sudah benar atau masih salah. Hasilnya sudah sesuai dengan yang diharapkan, seperti yang ditunjukkan oleh gambar 3 di bawah ini.
156 Prosiding Seminar Leksikografi Indonesia
Hasil output menampilkan daftar (list) yang dibagi menjadi empat kolom, yaitu ngoko, krama madya, krama inggil, dan bahasa Indonesia.
Gambar 3. Output dari perangane_awak.py
IV. Simpulan
Akhirnya kamus tembung bahasa jawa yang terdiri dari ngoko, krama madya, dan krama inggil berbasis teknologi informasi dapat diselesaikan dengan menggunakan Pemrosesan Bahasa Alami (Natural Language Processing, NLP) dengan bahasa pemrograman Python.
Daftar Pustaka
Anonim. 2013. Kamus Jawa Lengkap. Diakses melalui link website https://kamusjawaid.wordpress.com/2013/06/18/kamus-jawa-lengkap/
pada tanggal 25 Juli 2017.
Anonim. 2017. Python. Diakses melalui link website https://www.python.org/ pada tanggal 20 Juli 2017
Bird, S., Klein, E., and Loper, E. 2009. Natural Language Processing with Python. O’Reilly Media, Inc.
Raharjo, S. H. 2008. Kawruh Basa Jawa Pepak. Widya Karya, Semarang.
158 Prosiding Seminar Leksikografi Indonesia
MENINJAU ULANG KAMUS UNGKAPAN BAHASA INDONESIA (1997): UPAYA MEREKAM DAN MENGEMAS
EKSPRESI MASYARAKAT DALAM KARYA LEKSIKOGRAFIS
(KAMUS UNGKAPAN BAHASA INDONESIA (1997) REVISITED:
AN ATTEMPT TO PRESERVE AND PRESENT SOCIAL EXPRESSION IN A LEXICOGRAPHIC WORK)
Totok Suhardijanto
Departemen Linguistik, Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia
[email protected] Nuradji
Redaksi Bahasa Harian KOMPAS [email protected]
Abstrak
Kebutuhan akan kamus ungkapan bagi pemelajar bahasa Indonesia, baik sebagai penutur jati maupun penutur non-jati, merupakan keniscayaan. Oleh sebab itu, makalah ini akan membentangkan proses dan upaya kami dalam merevisi karya leksikografis kami bersama dengan Maman S. Mahayana yang berjudul Kamus Ungkapan Bahasa Indonesia (Gramedia Widiasarana Indonesia, 1997) yang akan diterbitkan ulang dengan memperhatikan berbagai hal, termasuk di dalamnya sebagai kamus yang ditujukan kepada pemelajar bahasa Indonesia. Dalam terminologi leksikografis, Kamus Ungkapan Bahasa Indonesia (1997) (selanjutnya disebut KUBI 1997) mengandungi tipe leksikal yang biasa disebut dengan ungkapan multikata (multiword expression: MWE) yang dapat berupa frasa, idiom, atau bahkan kalimat (lihat Cowie 1988, Moon 1998, Dobrovol'skij & Piirainen 2005).
Menurut Masini (2005:145), MWE—yang juga disebut sebagai frasem (lihat Mel’čuk 1995)—merupakan “lexical units larger than a word that can bear both idiomatic and compositional meanings. (…) the term multi-word expression is used as a pre-theoretical label to include the range of phenomena that goes from collocations to fixed expressions.” Ketika disusun dahulu, KUBI 1997 belum menggunakan konsep dan tipe MWE sebagaimana disebutkan Moon (1998) sehingga ada beberapa konsep atau tipe leksikal yang tidak tercakup di dalamnya. KUBI 1997 disusun
160 Prosiding Seminar Leksikografi Indonesia
berdasarkan konsep yang dikembangkan di dalam Badudu dan kemudian dilanjutkan pada Chaer. Oleh sebab itu, makalah ini membahas upaya kami meninjau kembali entri di dalam KUBI 1997 yang menurut rencana akan kami terbitkan kembali dengan menerapkan konsep MWE. Dalam kertas kerja ini, kami paparkan kriteria pemilihan dan diskusi mengenai ungkapan multikata yang menjadi dasar penyusunan kembali KUBI 1997. Dalam penyusunan kembali KUBI 1997 ini, digunakan korpus Inwac di Sketch Engine dan korpus sastra Indonesia yang dikembangkan Program Studi Indonesia FIB Universitas Indonesia.
Kata kunci: ungkapan multikata, frasem, kamus ungkapan, leksikografi Abstract
The need for idiom dictionary for Indonesian language learners, whether as native speakers or non-native speakers, is a necessity. Therefore, this paper will describe our process and efforts in revising our lexicographic works together with Maman S. Mahayana which is Kamus Ungkapan Bahasa Indonesia (Gramedia Widiasarana Indonesia, 1997) which will be re- published with various matters, including as a dictionary which intended for Indonesian language learners. In the lexicographic terminology, Kamus Ungkapan Bahasa Indonesia (1997) (hereinafter referred to as KUBI 1997) contains a lexical type commonly referred to as multiword expression (MWE expression) which can be phrases, idioms, or even sentences (see Cowie 1988, Moon 1998, Dobrovol 'skij & Piirainen 2005). According to Masini (2005: 145), MWE—also referred to as the frasem (see Mel'čuk 1995)—is a "larger lexical unit than words that can contain idiomatic meanings and compositions. (...) multi-word terms expression is used as a pre-theoretical label to include the range of phenomena that occur from collocations to fixed expressions." When it was first compiled, KUBI 1997 has not used the concept and type of MWE as stated by Moon (1998) so there are some lexical concepts or types that are not covered. KUBI 1997 is based on the concept developed in Badudu and then continued on Chaer.
Therefore, this paper discusses our efforts to review the entries in KUBI 1997 which we plan to resubmit by applying the MWE concept. In this paper, we describe the selection criteria and discussion on the multiwords expression which is the basis of KUBI 1997. In this series of KUBI 1997, we used the Inwac corpus in Sketch Engine and Indonesian literary corpus developed by Department of Indonesian Studies, Faculty of Humanities, University of Indonesia.
Key words: multiword idioms, phrase, idioms dictionary, lexicography
I. Pendahuluan (latar belakang, masalah, tujuan, dan tinjauan