• Tidak ada hasil yang ditemukan

Pencarian Nama yang Memuliki Kesamaan Fonetik Menggunakan Metode Kesamaan String

N/A
N/A
Protected

Academic year: 2017

Membagikan "Pencarian Nama yang Memuliki Kesamaan Fonetik Menggunakan Metode Kesamaan String"

Copied!
43
0
0

Teks penuh

(1)

INDRA KALIANA. Pencarim Nama Yaug Me~uiliki Kesau~am Fonetik Me11gg1111akm Metode Kesamaan String. (Nar~re Searching Based 011 Pl?o~?elic Sir~~ilarily Using SI~'ir~gn/lachi~?gAlgorif/?~~r). Dibilnbing Oleh

JULIO ADISANTOSO dau ABDURRAUF RAMBE.

Iiesamaa~ fonetik men~pakan ukurai~ k e s a n ~ a a ~ ~ yang sangat tergillltung pada bahasa y a ~ g digt~ulakan. Algorilme S o ~ ~ u d e x d m Phonis adalal~ metode yaug tcrke~x~l uutuk menibandingkan kata deugan nie~~il~erllatika~ kkesa~~laau fonetik. Dalani penerapan pada bahasa Indonesia, kedua ~ ~ ~ e t o d e tersebut m e ~ i d a l ~ a t k a ~ ~iiasalali jika uielakukai pencariai terhadap ilania y a ~ g niasih n~euggu~~akau e j a a ~ l m ~ a . Penelitian ini berlujuan uutuk menerapku~ neto ode kess~uaau slriug pada pencluimi llama yailg n~emiliki kesamaan fonetik d m ~ ~ ~ l e ~ i b a ~ ~ d i i ~ g k a ~ i due algorit~ne kesamaan slring yaih~ algoriune Uraku~i-Takeda dan algoritme Selc~~ensial.

Proscs pencarian nalna m e n g g ~ ~ ~ ~ a k ; ~ ~ ~ inclodc kcsainaa~i string ii~i tcrdiri dari dua li~ngl<ah. La11gk;lli perlama adalal~ mc~nbuat kou~binasi kala yang sama ibuetiknya de11lg;ln kata input. Kata-kata ko~ubinasi yang tcrbcntuk it11 discbut varian. L ~ n g k a l ~ l<edua :~dnlah pcncarian pad;l tclts, kat:~log ;I~;III h ~ s i s d;il;~ nsln:l

~ ~ ~ e n g g u ~ l i f l ~ ~ n ~nclode kesaulaa slriug.

Pada pe~~elitiau iiu dibuat prototype program peiicarian ~nenggundcan algonUue Uratani-Takeda dail algoriu~~e Sekue~~sial dengal lile11g~111aka11 enam file basis data yaug ~nenuliki ?@cord uallia oralp deugan ma-rata pu~jang r.ccord dari 10, 50, 100, 150, 200, lungga 250 kankter. Ki~ierja progratn clinilai berdasarka~~ rasio varian yang terbenluk oleh program, waktu pencarian pada basis data dan kebutuha~i memoq.

(2)

G[Wfi'

1vO'L

008

PENCARIAN NAMA YANG MEMILICI ICESAMAAN FONETIIC

MENGGUNAICAN METODE ICESAMAAN STRING

INDRA IULIANA

JURUSAN ILMU KOMPUTER

PAICULTAS MATEMATDL4 DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

(3)

G[Wfi'

1vO'L

008

PENCARIAN NAMA YANG MEMILICI ICESAMAAN FONETIIC

MENGGUNAICAN METODE ICESAMAAN STRING

INDRA IULIANA

JURUSAN ILMU KOMPUTER

PAICULTAS MATEMATDL4 DAN ILMU PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

(4)

INDRA KALIANA. Pencarim Nama Yaug Me~uiliki Kesau~am Fonetik Me11gg1111akm Metode Kesamaan String. (Nar~re Searching Based 011 Pl?o~?elic Sir~~ilarily Using SI~'ir~gn/lachi~?gAlgorif/?~~r). Dibilnbing Oleh

JULIO ADISANTOSO dau ABDURRAUF RAMBE.

Iiesamaa~ fonetik men~pakan ukurai~ k e s a n ~ a a ~ ~ yang sangat tergillltung pada bahasa y a ~ g digt~ulakan. Algorilme S o ~ ~ u d e x d m Phonis adalal~ metode yaug tcrke~x~l uutuk menibandingkan kata deugan nie~~il~erllatika~ kkesa~~laau fonetik. Dalani penerapan pada bahasa Indonesia, kedua ~ ~ ~ e t o d e tersebut m e ~ i d a l ~ a t k a ~ ~iiasalali jika uielakukai pencariai terhadap ilania y a ~ g niasih n~euggu~~akau e j a a ~ l m ~ a . Penelitian ini berlujuan uutuk menerapku~ neto ode kess~uaau slriug pada pencluimi llama yailg n~emiliki kesamaan fonetik d m ~ ~ ~ l e ~ i b a ~ ~ d i i ~ g k a ~ i due algorit~ne kesamaan slring yaih~ algoriune Uraku~i-Takeda dan algoritme Selc~~ensial.

Proscs pencarian nalna m e n g g ~ ~ ~ ~ a k ; ~ ~ ~ inclodc kcsainaa~i string ii~i tcrdiri dari dua li~ngl<ah. La11gk;lli perlama adalal~ mc~nbuat kou~binasi kala yang sama ibuetiknya de11lg;ln kata input. Kata-kata ko~ubinasi yang tcrbcntuk it11 discbut varian. L ~ n g k a l ~ l<edua :~dnlah pcncarian pad;l tclts, kat:~log ;I~;III h ~ s i s d;il;~ nsln:l

~ ~ ~ e n g g u ~ l i f l ~ ~ n ~nclode kesaulaa slriug.

Pada pe~~elitiau iiu dibuat prototype program peiicarian ~nenggundcan algonUue Uratani-Takeda dail algoriu~~e Sekue~~sial dengal lile11g~111aka11 enam file basis data yaug ~nenuliki ?@cord uallia oralp deugan ma-rata pu~jang r.ccord dari 10, 50, 100, 150, 200, lungga 250 kankter. Ki~ierja progratn clinilai berdasarka~~ rasio varian yang terbenluk oleh program, waktu pencarian pada basis data dan kebutuha~i memoq.

(5)

PENCARIAN NAMA YANG MEMILKI ICESAMAAN PONETIIC

MENGGUNAICAN METODE ICESAMAAN STRING

INDRA ICALIANA

Skripsi

Sebagai salah salu syarat ulltuk mcmperoleh gelar

Sarjala Ko~llputer

pada

Progralll Sludi Ill~lu Kc~llpuler

JURUSAN ILMU KOMPUTER

FAICULTAS MATEMATIK.4 DAN E M U PENGETAHUAN ALAM

INSTITUT PERTANIAN BOGOR

BOGOR

(6)

Judul

:

Pencanal Nama yang Memiliki Kesanlaan Fonetik Menggunakan Metode

Kesanlaan String

Nan~a

:

Indra Kaliana

NRP

: GO6496024
(7)

Penulis dilahirka~ d i Balikpapan pada tanggal 12 Februari 1975 sebagai allak ternklur dari 9

bersaudan dari pasangan Ballaruddin Bocrhan dall Siti I-Inpn~ll

Penulis ~~~cnyelesaikall lllasa studillya di Sekolal~ Mene11ga11 Atas 1 Bogor pada ta11un 1996. Pada

tal11111 yaug sama peilulis kuliah di Insilut Perlanial~ Bogor 111elalu jalur USMI sebagai civilas akadcinika

Jurusail llulu Koillpuler Faltullas Matematika d m IPA.

Selalna illeilgikuti perkuliahan pellulis pemah mei~jadi asistell pnklikmn untuk illata kuliah

Bahasa Pemrogranan pada tahun ajarai~ 199711998 clan untuk illata kuliah Organisasi Komputer pada tahun

ajarai~ 199811999, Dala111 kegiatail paktck lapangan penulis mclaksanakaimy;~ di Badall Pengendalian

(8)

Puji da11 syukur penulis paujalkan kepada Allall SWT atas segala ralulu~t dan ka~unia-Nya

sehingga karya tulis ini dapat diselesaikan. Tenla yang dipilih dalam penulisan ini adalah Pencarian Naua

Yang Me~niliki Kesauiaan Fonetik Mengynakm Metode Ke~alliaan String.

Dalaui pel~yelesaian karya tulis ini penulis n~endapalkan bantuan, bilnbiuga~l dan dorongan dari

berbagai pihak. U~ituk itu penulis illgin nlenlberikan ucapan terin~a kasill yaug sangat mendalam, antara

lain kepada :

I . Ayah, Ibu, di~n selurul~ ki~ki~k-kilki~k Lcrcinli~ alas scgilla dot1 dan dukungan bt~ik yang tiada batas.

2. Bapak Ir. Julio Adis;~ntoso, Mkomp. alas bi~nbi~lgan dan anllan selauia penyusunan karya tulis ini

dim Bapak Dr. Ir. Abdurrauf Rambe, M.St. atas sarau dan kritik yang diberikan.

3. Ir. Diniah, M.Si. yang selalu rne~nberi dorongxi dan men~bantu terselesaika~u~ya karya tulis ini.

4. Qiqi, Agus, Lakem, dan Wendas yang nlen~bantu dalam pengauibilan data.

5. Sri, Evi, Dien, Irep, Mbak Shelvie, Melling, Sari, T e y h d m anak-anak konlrakan 35 atas segala

bentuk baltua~uiya.

6. Melina Dwi Handayani, yang telah nlenenlalli dan men~bantu baik uiotivasi uiaupuu saran.

7. Rekiln-rckan mahasiswa/i Il~nu Komputer kllususuya Ilkomer~33 da11 semua pihak yang tidak dapat dicant~uukan satu persatu.

Seuloga kmya ilmiah ini dapat bernlanfaat dan diynakan sebaik-baih~ya.

(9)

DAPTAR IS1

Halaiiiaii DAFTAR GAMBAR

DAFTAR TABEL DAFTAR LAMPIRAN PENDAHULUAN

1

TINJAUAN PUSTAKA 1

2

Perkeiilbangan Ejaan di Indonesia 2

Algoritiiie Kesamaan String 3

METODE PENELITIAN 5

Penguiiipulai Data 5

Pcnibualaii Program 5

5

HASIL DAN PEMBAHASA 5

5

Pengukunii Waklu 6

Analisis Algoritn~e 8

KESIMPULAN DAN SA 8

8

9

DAlTAR PUSTAKA 9

(10)

DAFTAR GAMBAR

H a l a ~ n a n

1. Waktu pencarian pada satu basis data dengan berbagai input 7

2. Grafk perbandingan waktn pencarian antara algoritine Uratani-Takeda

dm

algorihiie Sekuensial

pada beberapa input

...

7

3. Waktu Pe~icarian pada beberapa basis data S

4. his tog ran^ perbandingan waktu pencarian antara algoritnle Uratani-Takeda dan algorihile

Sekuensial pada beberapa basis data 8

DAFTARTABEL

IIalaman

1. Contoli peruballnu kata dari Ejaan V a i Ophuysen ke Ejaan Republik ...

.

.

... 2 2. Perubahan liuruf &ui Ejaan Lama ke Ejaan Baru

...

3

...

3. Rasio antan varian yang terbentuk oleh progranl de~igan yang didapatkan dari basis data G

DAFTAR LAMPIRAN

Halaman

1. Algorit~ne Kesa~naan SLring Uralani-Tnkeda 11

2. Isi dari Fuugsi goto, orrtput, &ui failure 11

3. Algorit~n;~ Pc~nbu;~l:ni Fuugsi golo, ou 12

4. Hasil Percobaan Pengukura Waktu.Pencarian 14

(11)

PENDAHULUAK

Latar Belakang

Setiap ~~lallusia melluliki nama diri uutuk ~lienunjukkan suatu identitas yang illudah diingat oleh orang lain. Nama diri kedudukannya berbeda dengall kata biasa. Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang diyllaknn ole11 pemiliknya. Lain hal~lya dengan kata biasa, terutalna kata-kata asing yang disenp menjadi kata dalam bahasa Indonesia, ejamlya discsuilik;~~~ dcng;~n eja;in yang bcrklku (Mustakim, 1990).

Pencariall llallla diri dalam basis data, katalog pengaralg atau buku telepoli ~llempakall suatu yang ullluln &lam sisteru infor~nasi. Jika diketallui dengall pasti ejaan nania diri itu, aka11 secan mudah ditenlukan llallla tersebut dala111 d d a r nama. Banyak nletode yang diken~bal~gkan untuk nlencari sebuah string dalanl s e k u ~ ~ ~ p u l m string yalig bisa dipakai untuk p e ~ i c a r i a ~ ~ nama. Jika tidak diketallui atau tidak illgat ejaiu~ yang tepat atau jika terjadi kesalahan lllengetik saat mencu' I na111a

dalalil daftar llallla lllaka pellcarim lllungkin aknn mengalami kegagalan, kecuali diyllakan teknik pencarian tertentu.

Dalalll bahast Indoucsia ke~lluligki~lan kesalahan dalall~ pencarian atau pelilbacaan nalila diri aka11 terjadi kare~ia ada llallla yang mcllgyllakan Ejaan Lama. Penulistn liallla din dalall~ ballast Indonesia disesuaikan dengall aturm Ejaan Y N I ~ Dise~llpurnakall (EYD), kecuali untuk llalila diri yang telah disalkan scbelu~ll EYD dan yang lllell~iliki pertirnba~lgan kllusus, ~llistlnya adat istiadat, huku~n, kesejanhan, dan kesi~la~l~bungai identitas pribadi (Mustakim, 1990).

Penelitian untuk ~llencari llallla yang lnellliliki kesalnaan fonetik per~iah dilakukali ole11 Prilliasari (1999) yang mengynakan algorit~lle Soundex dan Phonis. Dalam penerapan pada bahasa I~~donesia, kedua nletode tersebut mendapalkan nlasalah jika ~ l ~ e l a k u k a ~ pellcarian terlladap nana yang masih me~lgynakan Ejaan Lama. Maka pada penelitia~ ini aka11 dicoba lnetode kesamaan string untuk mengatasi masalah pe~lcarian n m a yang masill ~lle~lgynakan Ejam Lama.

Tujuan

Tujuan dari penelitinn ini yaitu :

1. Melllpelajari dan ~llellenpkali nletode kesanlaan string pada pencarial~ llalua yang ~llc~l~iliki kesalllaan fonetik untuk mengatasi masalah Ejaan Lama.

2. Menlbandingkan algoritme kesalllaal~ string yang diken~bangkal ole11 Uratani-T<&eda dengall algoritnle Sekuensial.

TINJAUAN PUSTAICA

M e ~ ~ u r u t Pfeifer et. al. (1996), u k u r a ~ kesa~llaan non-linguistik dapat dibagi me~ijadi tiga kategori yang berbeda yaitu kesanlaan string, kesamaan yang berllubu~igan dengall kesalahan pengetikan, dan kesalllaa~i 1011ctik. Dari katcgori pertarna metode n-gra111s paling umum dipakai. Contoh dari kategori yang kedua yailu metode

Damerau-Levenstein-Metric, dimaia lnetode ini menglutullg penyisipan, penghapusan, substitusi, dac transposisi yang dibutuhkan untuk m e ~ ~ t r a n s f o r n a s i satu slrillg ke siring yang lain. Dalanl dua kategori ini pelllbandillgan kata-kata dilak~kan tanpa ~ilelllperdulikall jenis bahasa yalig digunakan. Sedangkan untuk jenis kategori ketiga, ukuran kesaulaan sangat tergmtulg pada bahasa yang diyllakan. Algorit~ne Soundes dan Phonix addall llietode yang terkenal unluk l~le~llbandingkan kata dengall me~ilperl~atikan kesamam fonetik.

Arti kesamaan fonetik atau kesanlaan bunyi yaitu adallya beberapa huruf dalan~ abjad yang lllellliliki bunyi pengucapan ~lurip alltar llilruf satu dengall liuruf lai~u~ya (Primasari, 1999). Sebagai contoh 1la111a "Joko" dan "Djoko" 111erupakan dua 11a11ia yeng memiliki kesa~llaali fonetik. Beberapa ha1 yang menyebabkan adanya kesanlaan fo~letik yaitu :

1. Kesalalian pendengann, seperti pada llallla Rina dan Rima.

2 . Ingatan yang lemah, llal i ~ u karelia seseoralig lupa aka1 nama yang aka11 dicari dan akibatnya dia lnelakukan pe~~carian dengm mencoba beberapa 11al11a yang mirip bunyinya.

3. Kullur, seperli pada na111a Ferri yang sering diucapkan dengan kata Perri.

4. Ejaan, seperti pada nallla K u ~ c o r o dan Koentjoro.

5. Kebiasaan.

Pada pe~ielitian ini penyebab admya kesamaan fonetik dibatasi pada faktor ejaal~ saja karena ballasa Indonesia mengalallu berbagai pembahan ejaan dari senlenjak pe~ljajahan Belanda lungga

I I I U I I C ~ ~ Ejaan Yalg Disemp~ullak;u~.

Pcngertian Ejnan

Pel~gertiali ejaan secara UIIIUIII berarti

(12)

pelamba~lgan bunyi bahasa, tenuasuk penusahan dan penggabuugannya, yang dilengkapi pula dengan pengguiaan tan& baca. Secara khusus ejaan berarti sebagai pelan~ba~igan bnnyi-bunyi ballam dengan huruF, baik berupa l~uruf demi imrur lnaupun

huruf

yang telal~ disusun ~nenjadi kata, kelo~lipok kata, atau kali~nat (Mustakim, 1990).

Dalani suatu ballasa sistenl eja;ul Iazinulya ll~elnpuliyai tiga aspek, yaitu aspek fonologis yang menyangkut p c l a ~ l b a n ~ n Conem dengan lluruf dan peliyusunall abjad; aspek morfologis yang lnenyangkut pelamba~gai satuan-satuan morfemis, dan aspek siutaksis yang ~neuya~~gkut pela~ubangan ujaran dengan tanda baca. Dengan denlikian, ketentuan-ketentuan yang lnengatur pelalnbangan Co~onem dengan lluruf yang ada dalan bahasa Indonesia, serta pelafalan, pengakroniman, dan penyusunan abjad terniasuk di dalan aspek fonologis. Ketentuan yang lnengatur pernbentukan kata dengan pengi~nbuhan, penggabungan kata, pemenggalan kata, penulisal kata, penyesnaian kosakata asilig ke dalani ballasa Indonesia tennasuk aspek morfologis. Di pihak lain, penulisan dan pelaralal fmsa, klausa, serta kalin~at ter~uasuk aspek sintaksis.

Perkembangan Ejaan di 111donesia

Menurut Mustakiln (1990), sejak nlasa penjajahan Belanda hhgga

mass

kemerdekaan, ejaan dalanl bahasa Indonesia ~ n e ~ ~ g a l a n u bernlacanl perubahan. Perkenlba~igai~ ejaail yang terjadi di Indonesia yaitu :

1. Ejaan Van Ophuysen

Ejaan ini ~nulai bcrlaku sejak tal~nn 1901 yailn saat ditcrbilk;~~mnya buku yang bcrjudul Kilnb Logo1 AJelayn yang disnsun ole11 Ch.A. Van Ophuysen, yang dibantu ole11 Engku Nawawi gelar Sutan Ma'moer d a i Moellam~~md Taib Sutan Ibnldm. Beberapa ha1 yang lnenonjol dari Ejaan Van Oplluysen ini antara lain :

(1) Hurufy ditulis dengan j.

Contoh : yaitu

+

jaitu (2) Humflf ditulis dengall oe

Contoh : nmzfm

+

oellloelll

(3) Humf k pada aW~ir kata alau suku kata ditulis dengan talda ko~na di atas.

Contoh : nlcyat

+

n'jat (4) FIurufj ditulis dengan dj

Contoh : Jakarta

+

Djakarta (5) H u ~ u f c ditulis dengan tj

Coiltoh : c a n

+

t j a a

(6) Gabungal konsonan MI ditnlis dengall ch

2. Ejaan Republik @jam Soewandi)

Ejaan Republik adalah ejaan barn yang disusnn ole11 Panilia Ejaan Ballasa Indonesia yang diketuai oleh Mr. Soewandi. Ejaan ini diresnukan pada tanggal 19 Maret 1947 dan ditetapkan berdasarkan Surat Keputusan Menteri Pendidikan, Pengajaran, dan Kebudayaan Republik Indonesia No~nor 264/Bhg.A, tanggal 19 Maret 1947.

Beberapa perbedaan autan E j a a ~ Republik dengan Ejaan Van Opl~uysen yaitu :

(1) Gabungal huruf oe dalanl Ejaan Van Opl~uysen diganti dengan u dalam Ejaan Republik.

(2) Bunyi l ~ a ~ ~ u a l ~ ( ' ) dalanl Ejaan Van Oplluyseu diganti dengan k dala~n Ejaan Republik. (3) Kata ulang bole11 ditandai dengan angka dua

dala~il Ejaan Republik.

(4) Huruf e taling dan e pepet dalanl E j a a ~ Republik tidak dibedakan.

(5) Tanda trellla (") dalanl Ejaan Van Ophuyse~i dihilangkan dala~il Ejaai Republik.

[image:12.559.293.501.369.469.2]

Ccntoh perubahan dari Ejaan Van Ophuysen ke Ejaan Republik dapat dilihat pada Tabel 1.

Tabel 1. Contoh perubal~ai kata dari Ejaan Val

0 I u sen ke E'aan Re ublik E'aan Van 0 hu sen Eiaan Re ublik

oelnoer ulnur

Ivia'locm maklum

nla-rala rala2

Ekor

senang seliailg

mukll mulai

3. Ejaa~t Melindo

AJeli17do ialah akroninl dari Melayu-Indonesia. Ejaan Melindo, sesuai dengan nananya, merupakan ejaan yang d i s u s u ~ atas kerja sama anhra pihak Indonesia, yang diwakili oleh Slametmuljana, dan pillak Persekutuan Tanah Melayu (Malaysia), yang dipin1piil ole11 Syed Nasir bin Ismail.

(13)

4. Ejaan Baru (Ejaan LBK)

Ejaan Baru pada dasan~ya nlerupakan lanjutan dari usaha yailg telal~ diriiitis ole11 panitia Ejaan Melindo. Karena panitia yang nlenyusliil ejaan tersebut dibentuk oleh Kepala Lenlbaga Bahasa dan Kesusaslra;~~ (LBK) dan diberi llama Panitia Ejaai~ LBK, ejaan baru yang diruniuskan itu pun dikenal dengan nalna Ejaan LBK.

Perubalian yang terdapat dalain Ejaan Barn atau Ejaan LBK antara lain :

(1) Gabungan konsonan dj diubali ~nei~jadi j. Conloh : reiliadja

+

reinaja

(2) Gabungan konsonan tj diuball men-jadi c. Contoh : tjipta

+

cipta

(3) Gabungan konsonan nj diubah menjadi ny. Conloll : njala

+

nyala

(4) Gabungaii konsonan sj diubah nlenjadi sy. Conloh : isjarat

+

isyarat

(5) Gabungan konsonan ch diubah menjadi kh Contoli : macliluk

->

iiiakhluk

(6) Huruf j diubal~ 111enjadi y Contoh : saja

-+

saya

(7) Huruf e taling dru~ e pepet penulisannya tidak dibedakan dan llanya ditulis d e n g a ~ e, tanpa penanda.

(8) Huruf asii~g f, v, dan z diinasukkan ke dala~n sistem ejaai~ bahasa Indonesia karena huruf- lmruf ilu bailyak diguiiakan.

Beberapa perubalian itu ternyata illeninlbulkan berbagai pendapat yang bernada keberalm, baik dari kalangan ahli bahasa sendiri lllaupun dari nlasyarakat uinum. Dengan kata lain, ejaan barn itu belun~ disetujui beberapa piliak selungga peresii~ian~~ya pun belunl dapat dilaksanakan.

5. Ejam Bahasa Indonesia Yang Diselnpurnakan ( E D )

Ejaan Ballasa Indonesia Yang Disempurnakan atau yang lazi~u disebut EYD dinyatakall liiulai berlaku sejak penggunamu1ya diresnukan oleli Preside11 Republik I~~donesia snat itu, Soeliarto, pada tnnggal 16 Aguslus 1972.

Ejaan Bahasa Indonesia yailg Disenlpurnakan it11 pad;) dasanlya tidak disusun secara tiba-tiba. Akan telapi, bahan-baliaiulya tclah dipersiapkan dan dirintis sejak penyusunall konsep Ejaaii Baru. Ole11 karena itu dapat dikatakan balnva konsep- konsep dasar yang ditelapkan dalan~ Ejaau Bahasa 1ndonesi;i yang Disen~purnakali sebenarnya iilerul-lakan kelanjutnn dnri Ejaan Barn atau Ejaan

LBK:

Beberapa kebijakan baru yang ditetapkai~ di dalain EYD alltara lain :

(1) Peruballan Huruf

Ejaan Lanu Ejaan Baru dj

+

djika j

-+

jika tj

+

tjakap c + cakap nj

+

sunji 11y -+ sunyi sj -+ sjukur sy

+

syukur cli

+

achir kh

-+

akhir j

+

supaja y

+

supaya

(2) Huruf f, v, dan z yang iilerupakan unsnr serapan dari bahasa asing dires~uukan pemakaiannya. Misalnya : klulaf, fisik, universitas, &at, kllilmmli.

(3) Huruf q dan

x

yang tidak laziin diynakan dalani bidang illnu pengetahiuan tetap diynakan, ~nisalnya pada kata fwqon dan Selloll.

(I) Penulisan di- sebagai awalan dibedakan dengall di yang ~llerupakan kata dcpan. Sebagai awalan, di- ditulis serangkai kata' dengan unsur yang menyertainya, sedangkan di sebagai kata depan ditulis teryisal~ dari kata yang mengikutinya.

(5) Kata ulang ditulis penuh dengan menylang unsur-unsunlya. Angka dua lidak digunakan sebagai penanda perulangan.

[image:13.564.297.485.402.497.2]

Secara ringkas, lluruf-liuruf yang nlengalailli perubahnn dari Ejaan Lailia ke Ejaan Baru dapat diliiiat pada Tabel 2.

Tabel 2. Perubaliai huruf dari Ejailn Lanla ke Ejaan Baru.

Ejaan Laina

I

Ejaan Baru

I

C

Huruf-liuruf dalan~ Tabcl 2 tersebut akan dipakai untuk ~neinbentuk varian dari illput nanla yang akan dicari.

Algoritme ICesamaan String. 1. Algoritn~e Uratani-Takeda

Algoritn~e yang dipakai pada penelitian iiu yailu algoritine yang dikeiubai~gkai~ ole11 Uratani dzu~Takeda (1993).

(14)

oleli Aho dan Corasick yailu yang ii~elakukan pei~carian string untuk baiiyak input.

Untuk iiielihat c a n kerja dari algorihne ini perl~atikan contoh berikut :

Misalkan terdapat sekuinpulan input yaitu (trace, artist, snrart) yang akan dicari kedalaii~ teks "tl?e- greatest-artist..

". Pertaiia kita ~ilenyaiiiakan

liuruf teraldiir dari seinua input. Karena panjailg input yg paling peudek adalali 5 ~iiaka kita ii~ulai ilieilyesuaikaii dengan liurur ke-5 dari leks daii poir7ter berada di liuruf ke-j dari teks. Pada contoh di bawah ini,

*

~iieliandakan sesuai, seda~ig s

iiie~~unjuMta~~ lidak sesuai.

t r a c e a r t i s t smart

t h e - g r e a t e s t - a r t i s t

X

Karena huruf g tidak sesuai dengall l~uruf tenkhir semua input d a i ~ tidak inuncul di setiap kueri, kita iliciiggcscr input-iiipul itu ke kaiian sebaiiyak 5 lluruf.

t r a c e a r t i s t Smart

t h e - g r e a t e s t - a r t i s t

X'

Pads ko~idisi ini, 11urilf c pada lcks scsuai dengan huruf e pada input "trace". Karei~ailya kita ine~iggeser poir?ter di teks ke kiri satu humf. Karei~a tidak sesuai dan string te dari teks tidak ~iluncnl di semua input, kita geser lagi input-input itu sebanyak 5 huruf ke kanan (atau inenggeser pointer sebai~yak 6 huruf).

t r a c e a r t i s t Smart t h e - g r e a t e s t - a r t i s t . .

Huruf r yang sekarang dibmdingkan tid'ak sesuai dengall huruf tenkliir dari seillua kueri. Lalu kita illelumskall lluruf

r

itu dengan huruf r yang ada di input "sr?zart". Jadi kita iuenggeser input- input ke k a ~ a n sebanyak satu.

t r a c e a r t i s t smart t h e - g r e a t e s t - a r t i s t . .

X I i r

Kita dapat menyesuaikan 1 1 d t, r, dan a dan gagal pada liuruf -. Kare~ia string art iiiuncul pada input "artist" inaka kita nlenggeser input tiga h d ke kanan (dm menggeser pohiter ke kanan sebanyak enam).

t r a c e a r t i s t Smart t h e - g r e a t e s t - a r t i s t

* * * * * *

Pada s a t i ~ , kita ii~elihat bahwa seiilua bud

dari input "ortist" sesuai deng;~ii huruf yaiig ada di dalam leks.

Pada algoritn~e Uratani-Takeda terdapat liga fungsi m a y : goto, otrtpot, dan failrire. Fungsi goto beryiia unluk iiiengetaliui apakali kankter yalig dibandiiigkan saiiia atau tidak. Fungsi ini bemilai lebih besar dari no1 jika karakter yang dibandingkaii saiiia. Fungsi oatpzrt untuk inengetaliui apakali input yalig dicari ditemukan atau tidak. Seda~igka~i fungsi failure diynakan uiilnk ilicnggescr input-input kc kana11 jika terjadi kesalalian atau dengan kata lain jika fiu~gsi goto bernilai 0 atau -1.

Secara umun, proses penyesuaian string dari algcrihne Uratani-Takeda adalali sebagai berikut: inu:ai dari posisi (state) 0, dan inelakukan pencaria~i n~ui~dur dari posisi karakter ke-rrrinler? (nrinler? yaitu panjang idput lerpendek) dari teks. Pcrubal~;~n posisi dilakukarl scbaiiyak iiiongkiii inengyl~akan fungsi goto. Jika posisi iiieiiu~ijultkan ujung kiri dari suatu inpul, bcrarli input tcrsebut il~uncul pada posisi Lerscbut. Jika telali i~ieiicapai posisi di~ilaiia fu~igsi goto bernilai 0 atau -1, poir?ler digeser ke kana1 seb;ulyak nilai yailfi didapat dari fungsi 'ilure, d a ~ i niulai dari posisi 0 lagi.

Algoritme Uratani-Takeda, isi dari fungsi goto, ontprit daii hiltire, serta algoritine pelnbentukkan ketiga fn~igsi tersebut dapat dilillat pada Lainpirim

1-3.

2. Algoritine Sekuensial

Algorit~i~e ini iiierupakaii algoritiilc kesaii~aan string yang paling scderllana dari algoritme- algori(l11e kesamaal string yang ada. Ada juga yang inenyebut algorit~i~e ini algorit~ile BRUTE

FORCE. Algorit~ne Sekueiisial nlelakukan pencariai string input tcrhadap lcks dari kiri ke kaiian dan dilakukan satu per satu karakter.

(15)

1. i : = l ; j : = l ;

2. i f 0

>

17

-

111

+

I) then

3. result : = 0; 4. endprogranr;

5. elseifoj = S;+~.J a17d

(7

= 111) Nie~i

6. rest~lt := 1;

7. e~irluro.cra~ir;

10. &7oto2;

11. else (p, t s;+~.J tlien

12. j := 1; i~icfl);

13. goto2;

14. end;

METODE PENELITIAN

P C I I ~ U I I I ~ ~ ~ : I I I D i ~ t i ~

Data yang diynaknn yaitu data nallla yang dian~bil dari buku petunjuk telepon kota Bogor tallun 2000 sebanyak 4370 buah. Dianlbil juga data akunat dan data nonlor telepon dari nmla yang bersangkutan.

Pembuatan Program

Progranl dibuat m e n g p a k a u pemlgkat lunak Microsoft Visual Basic 5.0 untuk aplikasinya dan Microson Acces 97 unluk basis datanya. Sedangkkan pcrangkat kcras yang digunakau yaitu kompuler dengan processor AMD K5 PR-133,

RAM 64 Mb dan kapasitas hnrclisk 1,2 Gb. Alur dari program terdiri dari beberal~;~ tahap: 1. Input nana.

2. Penlbuat;~~ varian dari input nama. Definisi varian yaitu konbinasi nania yang dapat dibenluk dengan lnerujuk pada Inuuf-humf yang ada pada Tabel 2.

3. Melakukan pencarian ke dalanl basis data. Pcncarian pada basis datanya sendiri dilakukan secara sekuensial yaitu dari record pertallla Iungga dari record ter'akllir. Sedang pencarian pada satu record d i p a k a n algoribne Uratani- Takcda d;ln algorilnle Sekucnsial.

4. Tarllpilkan nama-nana yang d i t e ~ ~ m k m pada basis data dalanl sebuah ddtar.

I'crcobai~n

Pada perlcliriar~ ini pcrcobaan yang dilakukan yailu :

Perhilwgan rasio varian.

Percobaan ini dilaktkan ulltnk mengetahui rasio varian yang ditenlukm pada basis data

dengan varian yang dibuat ole11 program. Input nama yang d i p a k a n yaitu Yanto, Fajar, Yalya, Cahjo, dan Yusuf.

Penykuran waktu

Pada pecobaan ini dianlati waktu pe11carim pada basis data dilillat dari dua faktor, yaitu perbedaan panjang input nama dan perbedaan panjang rata-rata nalua pada basis data.

Ulltuk faktor perbedaan p a n j a g input, nama-nama yang diynakan nle~niliki panjang 3-8 karakter (~uasing-masing 10 nama) yang nantinya akan dia~nati hubungan antara perubahal panjang input dengan w'aktu pencarian.

Sedang unluk raktor perbedaan panjang r;~l;r-r;rt;i n;~ma p;~da basis drlta dip;~kai basis data y;~ng memiliki rata-rat;) paniang pcr record

10, 50, 100, 150, 200 dan 250 l<;~r;~ktcr. Kemudian dianlati bagaimi~na huburlgan anlara pen~bahan panjang rata-nta basis data dengall perubahan waktu pencarian.

Sebagai perbandingan dilakukan juga pencarian dengan menggnnakan algoritrne Sekuensial. Kenludian dialnati perbedam tvaktu pencarinn dari kedua algoritnle tersebut.

IIASIL DAN PEMBAIIASAN

R u i o Varian

?embenlukan varian dilakukan ole11 program dengall c a n merubah 11uruf-huruf Ejaan Lama menjadi lluruf-bud Ejaan Baru atau sebalik~lya dari ln~rul-huruf Ejaau Baru nlenjadi h u r u f - 1 ~ ~ Ejaan Lama sesuai dengan Tabel 2. Jika ada lebih dari satu l~uruf, maka varian itu dibentuk sesuai dengall konlbinasi dari huruf-l-humf yang bisa dirubah. Misalkan nanla "ayu" maka varian yang terbentuk yaitu "ayu", "ayoe", "aju", dan "ajoe".

Pada penelitian ini tidak diperhatikan kesesuaian varian klmsusnya terhadap varian yang kala utanlanya terdapat 11uruf

'3"

dan "ch", tapi hanya kesamaan fonelik yang dipentingkan. Jika kala utanlanya terdapat I I U ~ L I ~ " ~ " , tidak ditckankan apal;i111 "j" di sini ~nerupakan h r u f

'2"

yang nlasil~ Ejazn Lama yang Iebih cender~~ng berubah ke 1 1 u f "y", atau "j" yang sudah bemklh nlexljadi Ejaan Baru (jika dimball kc Ejaan Lanla nlaka menjadi "dj"). Sama halnya dengan "clf' apakah lebih ceuderung untuk berubah menjadi "tj" seperti pada nama "cha~dra" atau lebih ke l~uruf "kl? seperti pada kata "aclunad".
(16)

rasio varian yang dite~nukan pada basis data beragaii dari 67% Iungga 100%.

Besarnya nilai n s i o varian ini dipengaruhi beberapa hal. Yang pertma yaitu karena basis data yang dipakai ha~iya menganbil sebagia~i kecil dari nama-nama yang ada di buku telepon. Jika nienlakai selurull data nanla yang terdapat pa& buku telepon, kenlungkinan rasio varian akan nlencapai 100% besar. Seperti pada input nama ''p~suf' yang memiliki rasio variai sebesar 100%. Hal i ~ i i karena seliiua varian dari nama "yusuf' dimasukkm ke dalali basis data sebelunl percobaan dilakukm.

Hal berikutnya yaitu tidak diperhalilta~u~ya arah perubahan huruf "j". Sebagai contoh, pada nalna "fajar", I i u d

'y

di s i ~ u cenderuig untuk beruball nienjadi huruf

'y

atan "dj" daripada berubah ke l~umf "y". Hal ini dapat dilihat dari hasil yang didapatkan dari basis data llanya terdapat narna "fajar" d m "fadjar". Sedalgkan untuk nalila "cal~,jo", lluruf "j" di sini lebih diucapkan nle~ijadi IluruC "y" dari pada lncnjadi h u r d "j" alim "dj" sehiligga varian yang didapatkan yaitu "calijo", "cal~yo", "tjalljo", dan "tjal~yo".

Tidak diketaliui apakal~ varian yang terbentuk merupakan sebuah nalna depan, nanla tengah, atau liania belakang yang dipisahkan oleh spasi ataukah lnen~pakan potongan dari sebual~ naliia juga lile~ilpe~~garul~i besar kecilnya rasio varian. Contoh varian "jalya" yang tnerupaka~i potoligan dari nania "tjahya" dan varian '?anto" yang lilerupakan potongan dari kata "harjaito" ikut tera~nbil. Akibatnya nilai nsio akan berta~ilbah walau sebellarnya llasil yang didapalkan belum tenlu relevan dengan lialia yang diinginkan.

Jika kita memperhatikai 11al-ha1 tersebut, maka bisa ditentukan tingkat releva~isi dari varian yang terbentuk dan nantinya akan berpengaruh pada output yang dihasilkal.

Tabel 3. Rasio antan varian yalig terbentuk oleh prog

Penguliumn Wnlrtu

Pengukuran waktu pada penelitiai iiii hanya dila?tukan saat ~ilelakukan pencarian pada basis data. Pada percobaan, pengukurUfm waktu dicatat hi~lgga seperseribu detik atau nuli sekon dan dilakukzm sebanyak sepuluh kali ulangan unluk tiap input nalna pa& tiap basis data yang dipakai, kenludian dinta-ratakan.

1. Hubu~igan Waktu dan Panjang Input Nama L a ~ n p i n ~ i 4{a) ~neliwijukkan hasil percobaan penykuran waktu menggunakan algoril~ne Urata~u-Take& dilillat d z i segi perbedaan panj<mg input dengall basis data yang diynakan yaitu yang ~ne~niliki panjang nta-nta nana sebesar 10 kamkter.

Untuk input narila yang nle~niliki p a n j a ~ g 3

karakter, waktu yang dibutullka~~ untuk ~nencari input tersebut pada basis data sekitar 4,l detik. Sedang ulituk input nania dengan panjang 8 karakter, waktu yang dibutulikan untuk ~lielakuka~l pcncarian sckiti~r 3,5 dctik (Gilmbar 1). Semilkin panjang input n a u a yaug dipakai, semakin sedikit waktu yang diperlukan ulituk nlelakukan pencnrian pada basis data.

Semakin cepatnya waktu pencarial seiring dengan pertalnbahan panjang input l l l e ~ p ~ k a n kelcbihan dari algorihne Uralani-Takeda ini. Hal ini karena proses penyesuaia~ string yang dimulai dari kanan pada posisi kankter ke-17rh7le17 dari teks. Jika ada ketidaksesuaian karakler ~iiaka posisi pointer digeser ke kman sebanyak 1iri17le17 karakter. iM7le17 yailu panjang input terpe~idek jika terdapat lebil~ dari salu input. Jika llanya satu input maka 1,ri17lo7 adalal~ panjang input tersebut. Untuk input lullla yang llanya 3 karakter pa~ijangnya, niaka akan ada pergeseran pob7ter ke kanan sebanyak 3 kankter. Jika 111inlen sebesar 4, ~ilaka pointer bergeser sebany<ak 4 karakter. Untuk input na~ila yang nie~niliki nilai I I U I I ~ ~ I I sebesar 8, maka

akan terjadi pergeseran karakler sebanyak 8.

[image:16.559.70.502.558.701.2]
(17)

Ganlbar 1. Waktu pencarian pada satu basis data deilgan berbagai input.

4100-

3900

-

-

2

3700

--

5

2

3500

s

Senlakin besar paljang input, seil~akin bcsar nilai ~ninlen yang dinuliki. Akibatnya pergesenn pointer akan senlakin jauh, yang berakibat waktu pencarian akan seinakin pendek.

Jika dibandiilgkan dengan algorit~~ie Sekuensial di liialia input dan basis data yang d i y n a k a ~ l sans,

terlihat balnva algoritme Uratani-Takeda memiliki waktu pencarian yang lebih cepat untuk seinua input yang dipakai (Gallbar 2). Untuk input nalila dengan panjang 3 kankler waktu peilcarian sebesar 4,l detik, sedang u~ihlk input nailla dengan panjang 8 karakter waktu yang dibutuhkan untuk inelakukan pencarial dala~il basis data sebesar 3,5 detik (La~npiran 4{b)).

Walaupu~i pada algoritille Sekuensial senlakin pnniang input scniakin kccil waklu pencariau, tetapi masih lcbih bcsar dibandingka~l waktu pencarian ineilggu~lakan algoriline Uratani-Takeda. IIU disebabkan ole11 perbedaai~ proses pencarian pada masing-masing algotima. Jika pada algoritille Uratani-Takeda terjadi pergesenil pointer sebesar

111i17len diiiiana besar~lya 11rinle17 tergallluilg peda pmjang input nama. Pada algorihlle Sekuensial pergesaran pointer yang terjadi h a ~ y a sebesar salu karakter unluk selnua panjang input. Selungga ju~nlali perbandingan selllakin banyak dan

akibatnya waktu pencarian inenjadi lebil~ besar.

.. '\?

I

-'-

/

I\T

rata-rata

i\?

-- &\?

-\?

2. Hubungan Waklu dan Panjaig Rata-rata Data Pada percobaan ini akan dianlati bagaimala pengaruh pembahan pruljang rata-rala nailla per

record pada basis data terhadap waktu pencarian. Input nania yang d i y i ~ a k a ~ l yaitu input nania dengall paljang 3 kankter. Basis data yang diguilakan ada G file, yailu Telp.n~db yang berisikan data naua-nama yang asli dari sullber

m

1

dan 5 file lainnya (TelpP5O.mdb, TelpPlOO.mdb, TelpP15O.lndb, TelpP200.mdb, TelpP250) yang berisi data namna-nama yang ditaillbalk,m karakter secara acak di depan nama yang asli selungga panj'mgnya inenjadi 50-250 karakter. Semua file data masing-inasing berisi 4370 record. Hasil percobaau ditunjukkan oleh tabel pada Lanlpiran Sja) clan liistogrampada Gallbar 3.

Panjang input (karakier)

& Uratani-Takeda & Sekuensial

Gambar 2. Gnfik perbandingan ~ a k l u peilcariall antara algoritIiie Urataiu-Takeda d m algorit~ue Sekueilsial pada beberapa input.

Gainbar 3 menunjukkat~ ada peningkata~~ waktu pencarian dengan bertambahny;~ rala-rata panjang pada basis di~l;~. Uiituk basis data dcng:~n r;~ta-nlb~ panjaiig nania sebesar 10 karakter waktu yang dibulutikan 111iluk ~ncncari input nalna dcnga~l pa~ljang 3 karakter sebesar 4,l delik. Dengan mengynakaii input lialna yang sama, waklu pencarian pada basis data yang ral;~-rata panjang datsnya 250 kankter yaitu sekitar 18,9 detik. Sc~nakin besar rata-rata panjang data niaka waktii pencariai aka11 semakin lruua.

Kejadian seperti iiu adalah l ~ a l yang ulnum terji~di pada teinu kenlbali i~lronllasi yang berbasis teks. Semakin besar ukur'm leks yalig pa& basis data, illaka seiuakin lama waktu yang diperlukan, pencarian akan sem,ddn tidak efisien (Salton, 1989). Se~nakin banyak j u ~ n l a l ~ k m k t e r pada basis data, ~ilaka akan il~engakibalkan bertmbalulya jumldi perbandingan saat nielakukan pencarinn.

[image:17.564.292.498.168.336.2]
(18)

me~niliki rata-rata panjang 10 karakter, perbedaim ruerlukan mang m e ~ i ~ o r i sebanyak (2 s

1x1

s

a)

+

1 waktu antara algorih~ie Uratani-Takeda dengan sedangkan algorih~ie Sekuensial tidak ada ine~ilori algoriliie Sekuensial tidak terlalujaul~ yaitu sekitar tanbahm. Algorihlie ini hanya ~lle~nerlukan dua 0,17 detik. Tetapi pada basis data dengan p a n j a g buah variabel yang berfuilgsi sebagai pointer. nta-rata 250 kankter perbedam waktu antara Karena itu ruang ~ileinori yang diperlukml kedua algoritiile ilu lebill dari 8,4 detik (Laillpim algorihlle Sekuensial lebih sedikit

j{b)). Dari siN dapat terlillat kelebillan dari algorilll~c Uratani-Takeda jika diba~idingkan dc11ga11 i~lgoritme Sekuensk~l.

Gainbar 3. Waktu Pencarian pada beberapa basis data.

A~~;ilisis Algoritmc

Telah dikelallui sebelu~llnya ballwa pada algorilrne Uratani-Takeda perpindahan posisi

pointer sebanyak ininlen diiilalia rni17len

mcrupi~kan pn11ji11ig i~ipul lcrpcndck. Pads kasus terburuk, di maria seiiiua karnkter input tidak sailla

deilgan seniua karakter teks yang dicari, illaka pada setiap taliap 11a11ya akan ah satu perbandi~igan dan pergeseraii sebesar nrinlen. Jika panjang total teks yang dicari adalah N maka total perbandingan yang terjadi pada kasus terbumk yaitu sebanyak

L~fininlenj perbandingan.

Pada algoritule Sekuensial, uuluk lucncari pada leks yang sailla dengall panja~ig N di ulana input yang dip'akai lile~niliki panjang sebesar 111,

pergeserau pointer hanya scbauyak satu karakter sehinggn pada kasus tcrburuk banyaknya perba~ldiilgan yaug terjadi yailu sebesar N-in+l

perbaidingan.

Pada algoritl~~e Uratlli-Takeda, terdapat fungsi

goto, ol~tprit, dan failzlre. Fungsi goto dan fungsi failure lilempakan m y dua dili~ensi berukuran

1x1

s

a,

di il~alla

1x1

adalah jui~~lali allggota dalan lumpuna~ karakter

dm

a

yaitu juullah slate. Pada peilelilian ini yailg diynakali limya karakter a-z dau spasi. Jumlah stare ii~aksiilial sama dengan jumlah pa1j;ing selllua input nana ditmnbali satu. Ui~luk iungsi ozitprrt merupakan sebuah vektor berukura~ 1. Jadi algoritule Uratani-Takeda me-

Ganlbar 4. Histogra~il perbandingan waktu pencarian anlara algorilllie Uratani- Takeda clan algorihue Sekuensial pada beberapa basis data.

KESIMPULAN DAN SARAN

Kesi~nl~ulan

Pencarian nama ~llenggul~akan nlelode kesailiaai slring ini dapat iuengatasi masalall Ejam~ Lacia pada llletode Soul~des dan Phonis.

Algoritiile Uratani-Takeda melililiki kinerja yan:: lebih baik dibanding algoritlne Sekuensial. Rata-rata waktu yang dibutuhka~~ oleh algoritlue UralaN yailu sebesar 3,454 detik untuk input dengan pa~ljailg 8 karakter pada basis data dengan rala-rala panjang data 10 karakter dan lS,855 detik untuk input de11gan pai~jang 3 karakter pada basis data deng11 rata-rata panjang 250 karaktcr, lebih sedikit &ri algorit~iie Sckumsial yaitu sebesar 3,629 detik untuk input 8 karakter dan 27,216 dctik untuk basis data dengall rata-rala palijang data sebesar 250 kankter. Tetapi ruang i i ~ e ~ l ~ o r i yang dibutdkan ole11 algorihlle Uralani-Takeda jauh lebil~ banyak dibanding algoritilie Sekuensial.

Saran

(19)

dari baliasa asing ( h b , Inggris, Cina) alau faktor- faktor penyebab kesalilaan fonelik Iainnya, seperli kesalahan pendengaran, ingatan yang lcmah, kultur dan faklor kebiasaan. Perlu diperliatikan juga faklor kesesuaian dari varian yang trbenluk.

DAFTAR PUSTAKA

Boyer, R. S. & Moore, 3. S. 1977. A Fast String Searcliing Algoritluu. C O I ACAd

20:762-772.

Hall, P. A. V. 6i Dowling, G. R. 1980. Approsim;ite String Matclung. ACAd Co11rpr11. Srinqvs. 12:381-402.

Mustaki~n. 1990. T m w J O I I , ~ ~ Ejnn17 Bahasa I~?do~tesia U~tfzik U I I I ~ I I . PT. Gran~edia Pi~staka Utama, Jakarta.

Pfcifer, U., T. Pocrscll & N. Puhl: 1996. Retrieval ElTectivenes of Propcr Na~ne Scarch Methods. I~?for~iralio~t Processing 8.

hfa~?age~lre~?l 32:667-679.

Priit~asari, D. 1999. Tenlu Ke~ibali Nama Mengyliakan Metode Kesamaan Fonetik. Skripsi. Jurusa~~ 11111~ Komputer, Fakultas Malen~atika dan 11111~ Pengetahuan Alam, Institut Perlanim Bogor.

Salton, G. 1989. Azlto17ratic Text Processing: The I ~ f o r ~ i ~ a t i o ~ i , Analysis,a~td Retriei~al of I ~ f a r ~ i r a l i o ~ ~ by Conrpuler. Addison-Wesley Publisliing Cotllpany. Chulada.

Uratani, N. & Takcda, M. 1993. A Fast String Searching Algorihil for Mulliplc Patterns.

J. infor~~i. .Sisl. Adg~iit. 29:775-791.

(20)
(21)

Input : Sebuah string T = alaz.. .a,, Output : kata yang ditemukan Metode :

I* $ n~erupakan silnbol yg tidak n~uncul di setiap kueri *I I* nlb?len adalall pmjang kueri terpendek *I

begin a0 := $;

q := minlen; while q S n d o

state := 0;

while qIstate,aq) > 0 d o SLBLC : - g(SLdLe,ay);

i f outlstate) i empty then print outlstate) endif;

ri := q

-

1

eiidwhile;

4 := q

+

f(state,aq); endwhile;

end.

L a n ~ p i r a ~ ~ 2. Isi dari Fungsi goto, ortipui, dan foilroe.

(;I) Fungsi goto (Ian output

(22)

Algorithm 2. C o ~ ~ s t r u c t i o l ~ of t l ~ c goto and ootput functio~is. Illput : Sekunipulan kueri K = {al, a2, ..., ak).

Oulput : fi~ngsi goto, out, depth, dan lefcend. Metodc :

/* large yaitu bilangan intcgcr positif yg lebih besar dari p;~~ljang kocri-kueri */

/* I~usialisasi g ke fail (10) dan out ke empty */

begin

minlen := large;

newstate := 1; depth101 := 0;

for i := 1 to k do Gnterju,i) endfor;

for each c such that g(O,cl = fail do gI0,cl : = 0 cndfor;

end

procedure Enter(ai,a; ... am, i) :

begin

state := 0; j := m;

while lgIstate,a,l <> fail1 and lj>Ol do State := glstate,a,I;

j := j

-

1; endwhile; while j > 0 do

glstate,a,l := newstate; depthlnewstatel := m

-

j + 1; State ;= newstate;

newstate := newstate i 1;

j : = j

+

1; endwhile;

left-endli) := state; out Istatel : = [a,,a z... a,];

minlen := minlminlen,ml ;

end.

Algoritm 3.1 Construction of tllc fu~lctio~l

Q

Iiipul : fuligsi goto. Oulpul : fuligsi

41

Metode :

Begin

queue : = empty;

for each c such that gt0,cl = s > 0 do queue := queue.^;

+is, := 0; endfor;

while queue f empty do let queue = r.tai1; queue := tail;

for each c such that glr,c) = s # fail do

queue := queue.^;

state := 4111;

while g(state,c)=fail do state := +(statel endwhile; 41s) := glstate,~);

(23)

Algoritllm 3.2 Construction of tlie function shiftl. Iiiput : h~ngsi golo and

4

Output : Tu~igsi sliiftl. Metode :

I* inisialisasi sllifil ke large *I

begin

queue := empty;

for each c such that gi0,cI = s > 0 do queue.^ endfor; while queue t empty do

let queue := =.tail;

queue := tail;

for each c such that gir,cl = s # fail do queue := queue.^;

state := +I=);

while gist ate,^) = fail do

shiftllstate,~) : = min[shiftllstate,c),depthlrjl;

state := bistatel; , . . .

endwhile;

if gistate,cl = 0 then

shiftl(state,cl := min[shiftlistate,cl,depthir)l;

endif; endfor; endwhile; end.

Algoritlili~ 3.3 Colistruction of the fuuctiou sliift2 Input : Cungsi goto, depth, m d leftend

Output : fungsi shiCt2. Mctode :

I*

inisialisasi sl1ili2 kc large

*I

begin

for j := 1 to k do

state := mileft-endijll; while state>O do

shiftllstate) := m i n ~ s h i f t Z ~ s t a t e l , d e p t h l l e f t ~ e n d i j l l l ;

state := +istatel; endwhile;

endfor;

shiftZ(0) := minlen;

queue := (01;

while queue # empty do let queue = =.tail

queue := tail;

for each c such that g(r,ci = s > 0 do

queue := queue.^;

shift2(s) := min[shiEt2(sl,shiftZir)+ll

endfor; endwhile; end.

Algoritlln~ 3.4. Coristructiori of thc failure function. Inl~ut : Cungsi goto, shiltl, daii shir12.

Output : fungsi hilure. ~ e k d e :

for i = 0 to newstate

-

1
(24)

Lampiran 4. Hasil Percobaa~i Pengukuran Waklu.Pencark~n

(a) Tabel l~asil pengukuran vvaklu de~igan beragam input pada basis dala dengan pa~ljang ratil-rata record 10 karaklcr mengglu~akan ;~lgoritme Uratani-Takeda.

(b) Tabel hasil pengukunil waklu pencarian i~lpul ualua dengall pailjang 3 karakler pada beberapa basis data menggunakan algorit~ue Uratani-Takeda.

(c) Tabel hasil pengukuran waktu de11ga11 beragam inpul pada basis data dengall pal~jang rala-rata rccorcl10 karaklcr mcnggunakan a l g o r i t ~ ~ ~ e Sckucnsial.

(25)

La111pi1;ln 5. per ban ding;^^^ Waktu Pcncarizln Antara Algoril~lla Uralalli-Takeda dan Algoritma Sekuensial.

(a)

Tabcl p e r b a ~ l d i ~ ~ g a ~ i waklu pcncarian bcrbagtli inpot nama pad;^ basis dsla dcngan rala-rats

panjang record 10 karaklcr.

(;I) R1bc1 ] I C ~ ~ ; I I I ( ~ ~ I I ~ ; I I I \v;II<ILI ~ > C I I C : I ~ ~ ; I I I i~ipttt I~:II:I:I (ICII~:III p:111.i;111g 3 kir;lkIcr p;icI;~ bcbcr;~~):~

(26)
(27)

Input : Sebuah string T = alaz.. .a,, Output : kata yang ditemukan Metode :

I* $ n~erupakan silnbol yg tidak n~uncul di setiap kueri *I I* nlb?len adalall pmjang kueri terpendek *I

begin a0 := $;

q := minlen; while q S n d o

state := 0;

while qIstate,aq) > 0 d o SLBLC : - g(SLdLe,ay);

i f outlstate) i empty then print outlstate) endif;

ri := q

-

1

eiidwhile;

4 := q

+

f(state,aq); endwhile;

end.

L a n ~ p i r a ~ ~ 2. Isi dari Fungsi goto, ortipui, dan foilroe.

(;I) Fungsi goto (Ian output

(28)

Algorithm 2. C o ~ ~ s t r u c t i o l ~ of t l ~ c goto and ootput functio~is. Illput : Sekunipulan kueri K = {al, a2, ..., ak).

Oulput : fi~ngsi goto, out, depth, dan lefcend. Metodc :

/* large yaitu bilangan intcgcr positif yg lebih besar dari p;~~ljang kocri-kueri */

/* I~usialisasi g ke fail (10) dan out ke empty */

begin

minlen := large;

newstate := 1; depth101 := 0;

for i := 1 to k do Gnterju,i) endfor;

for each c such that g(O,cl = fail do gI0,cl : = 0 cndfor;

end

procedure Enter(ai,a; ... am, i) :

begin

state := 0; j := m;

while lgIstate,a,l <> fail1 and lj>Ol do State := glstate,a,I;

j := j

-

1; endwhile; while j > 0 do

glstate,a,l := newstate; depthlnewstatel := m

-

j + 1; State ;= newstate;

newstate := newstate i 1;

j : = j

+

1; endwhile;

left-endli) := state; out Istatel : = [a,,a z... a,];

minlen := minlminlen,ml ;

end.

Algoritm 3.1 Construction of tllc fu~lctio~l

Q

Iiipul : fuligsi goto. Oulpul : fuligsi

41

Metode :

Begin

queue : = empty;

for each c such that gt0,cl = s > 0 do queue := queue.^;

+is, := 0; endfor;

while queue f empty do let queue = r.tai1; queue := tail;

for each c such that glr,c) = s # fail do

queue := queue.^;

state := 4111;

while g(state,c)=fail do state := +(statel endwhile; 41s) := glstate,~);

(29)

Algoritllm 3.2 Construction of tlie function shiftl. Iiiput : h~ngsi golo and

4

Output : Tu~igsi sliiftl. Metode :

I* inisialisasi sllifil ke large *I

begin

queue := empty;

for each c such that gi0,cI = s > 0 do queue.^ endfor; while queue t empty do

let queue := =.tail;

queue := tail;

for each c such that gir,cl = s # fail do queue := queue.^;

state := +I=);

while gist ate,^) = fail do

shiftllstate,~) : = min[shiftllstate,c),depthlrjl;

state := bistatel; , . . .

endwhile;

if gistate,cl = 0 then

shiftl(state,cl := min[shiftlistate,cl,depthir)l;

endif; endfor; endwhile; end.

Algoritlili~ 3.3 Colistruction of the fuuctiou sliift2 Input : Cungsi goto, depth, m d leftend

Output : fungsi shiCt2. Mctode :

I*

inisialisasi sl1ili2 kc large

*I

begin

for j := 1 to k do

state := mileft-endijll; while state>O do

shiftllstate) := m i n ~ s h i f t Z ~ s t a t e l , d e p t h l l e f t ~ e n d i j l l l ;

state := +istatel; endwhile;

endfor;

shiftZ(0) := minlen;

queue := (01;

while queue # empty do let queue = =.tail

queue := tail;

for each c such that g(r,ci = s > 0 do

queue := queue.^;

shift2(s) := min[shiEt2(sl,shiftZir)+ll

endfor; endwhile; end.

Algoritlln~ 3.4. Coristructiori of thc failure function. Inl~ut : Cungsi goto, shiltl, daii shir12.

Output : fungsi hilure. ~ e k d e :

for i = 0 to newstate

-

1
(30)

Lampiran 4. Hasil Percobaa~i Pengukuran Waklu.Pencark~n

(a) Tabel l~asil pengukuran vvaklu de~igan beragam input pada basis dala dengan pa~ljang ratil-rata record 10 karaklcr mengglu~akan ;~lgoritme Uratani-Takeda.

(b) Tabel hasil pengukunil waklu pencarian i~lpul ualua dengall pailjang 3 karakler pada beberapa basis data menggunakan algorit~ue Uratani-Takeda.

(c) Tabel hasil pengukuran waktu de11ga11 beragam inpul pada basis data dengall pal~jang rala-rata rccorcl10 karaklcr mcnggunakan a l g o r i t ~ ~ ~ e Sckucnsial.

(31)

La111pi1;ln 5. per ban ding;^^^ Waktu Pcncarizln Antara Algoril~lla Uralalli-Takeda dan Algoritma Sekuensial.

(a)

Tabcl p e r b a ~ l d i ~ ~ g a ~ i waklu pcncarian bcrbagtli inpot nama pad;^ basis dsla dcngan rala-rats

panjang record 10 karaklcr.

(;I) R1bc1 ] I C ~ ~ ; I I I ( ~ ~ I I ~ ; I I I \v;II<ILI ~ > C I I C : I ~ ~ ; I I I i~ipttt I~:II:I:I (ICII~:III p:111.i;111g 3 kir;lkIcr p;icI;~ bcbcr;~~):~

(32)

PENDAHULUAK

Latar Belakang

Setiap ~~lallusia melluliki nama diri uutuk ~lienunjukkan suatu identitas yang illudah diingat oleh orang lain. Nama diri kedudukannya berbeda dengall kata biasa. Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang diyllaknn ole11 pemiliknya. Lain hal~lya dengan kata biasa, terutalna kata-kata asing yang disenp menjadi kata dalam bahasa Indonesia, ejamlya discsuilik;~~~ dcng;~n eja;in yang bcrklku (Mustakim, 1990).

Pencariall llallla diri dalam basis data, katalog pengaralg atau buku telepoli ~llempakall suatu yang ullluln &lam sisteru infor~nasi. Jika diketallui dengall pasti ejaan nania diri itu, aka11 secan mudah ditenlukan llallla tersebut dala111 d d a r nama. Banyak nletode yang diken~bal~gkan untuk nlencari sebuah string dalanl s e k u ~ ~ ~ p u l m string yalig bisa dipakai untuk p e ~ i c a r i a ~ ~ nama. Jika tidak diketallui atau tidak illgat ejaiu~ yang tepat atau jika terjadi kesalahan lllengetik saat mencu' I na111a

dalalil daftar llallla lllaka pellcarim lllungkin aknn mengalami kegagalan, kecuali diyllakan teknik pencarian tertentu.

Dalalll bahast Indoucsia ke~lluligki~lan kesalahan dalall~ pencarian atau pelilbacaan nalila diri aka11 terjadi kare~ia ada llallla yang mcllgyllakan Ejaan Lama. Penulistn liallla din dalall~ ballast Indonesia disesuaikan dengall aturm Ejaan Y N I ~ Dise~llpurnakall (EYD), kecuali untuk llalila diri yang telah disalkan scbelu~ll EYD dan yang lllell~iliki pertirnba~lgan kllusus, ~llistlnya adat istiadat, huku~n, kesejanhan, dan kesi~la~l~bungai identitas pribadi (Mustakim, 1990).

Penelitian untuk ~llencari llallla yang lnellliliki kesalnaan fonetik per~iah dilakukali ole11 Prilliasari (1999) yang mengynakan algorit~lle Soundex dan Phonis. Dalam penerapan pada bahasa I~~donesia, kedua nletode tersebut mendapalkan nlasalah jika ~ l ~ e l a k u k a ~ pellcarian terlladap nana yang masih me~lgynakan Ejaan Lama. Maka pada penelitia~ ini aka11 dicoba lnetode kesamaan string untuk mengatasi masalah pe~lcarian n m a yang masill ~lle~lgynakan Ejam Lama.

Tujuan

Tujuan dari penelitinn ini yaitu :

1. Melllpelajari dan ~llellenpkali nletode kesanlaan string pada pencarial~ llalua yang ~llc~l~iliki kesalllaan fonetik untuk mengatasi masalah Ejaan Lama.

2. Menlbandingkan algoritme kesalllaal~ string yang diken~bangkal ole11 Uratani-T<&eda dengall algoritnle Sekuensial.

TINJAUAN PUSTAICA

M e ~ ~ u r u t Pfeifer et. al. (1996), u k u r a ~ kesa~llaan non-linguistik dapat dibagi me~ijadi tiga kategori yang berbeda yaitu kesanlaan string, kesamaan yang berllubu~igan dengall kesalahan pengetikan, dan kesalllaa~i 1011ctik. Dari katcgori pertarna metode n-gra111s paling umum dipakai. Contoh dari kategori yang kedua yailu metode

Damerau-Levenstein-Metric, dimaia lnetode ini menglutullg penyisipan, penghapusan, substitusi, dac transposisi yang dibutuhkan untuk m e ~ ~ t r a n s f o r n a s i satu slrillg ke siring yang lain. Dalanl dua kategori ini pelllbandillgan kata-kata dilak~kan tanpa ~ilelllperdulikall jenis bahasa yalig digunakan. Sedangkan untuk jenis kategori ketiga, ukuran kesaulaan sangat tergmtulg pada bahasa yang diyllakan. Algorit~ne Soundes dan Phonix addall llietode yang terkenal unluk l~le~llbandingkan kata dengall me~ilperl~atikan kesamam fonetik.

Arti kesamaan fonetik atau kesanlaan bunyi yaitu adallya beberapa huruf dalan~ abjad yang lllellliliki bunyi pengucapan ~lurip alltar llilruf satu dengall liuruf lai~u~ya (Primasari, 1999). Sebagai contoh 1la111a "Joko" dan "Djoko" 111erupakan dua 11a11ia yeng memiliki kesa~llaali fonetik. Beberapa ha1 yang menyebabkan adanya kesanlaan fo~letik yaitu :

1. Kesalalian pendengann, seperti pada llallla Rina dan Rima.

2 . Ingatan yang lemah, llal i ~ u karelia seseoralig lupa aka1 nama yang aka11 dicari dan akibatnya dia lnelakukan pe~~carian dengm mencoba beberapa 11al11a yang mirip bunyinya.

3. Kullur, seperli pada na111a Ferri yang sering diucapkan dengan kata Perri.

4. Ejaan, seperti pada nallla K u ~ c o r o dan Koentjoro.

5. Kebiasaan.

Pada pe~ielitian ini penyebab admya kesamaan fonetik dibatasi pada faktor ejaal~ saja karena ballasa Indonesia mengalallu berbagai pembahan ejaan dari senlenjak pe~ljajahan Belanda lungga

I I I U I I C ~ ~ Ejaan Yalg Disemp~ullak;u~.

Pcngertian Ejnan

Pel~gertiali ejaan secara UIIIUIII berarti

(33)

PENDAHULUAK

Latar Belakang

Setiap ~~lallusia melluliki nama diri uutuk ~lienunjukkan suatu identitas yang illudah diingat oleh orang lain. Nama diri kedudukannya berbeda dengall kata biasa. Nallia diri, betapapun aneh ejaa~u~ya, tetap ditulis sesuai dexlgiln ejaan yang diyllaknn ole11 pemiliknya. Lain hal~lya dengan kata biasa, terutalna kata-kata asing yang disenp menjadi kata dalam bahasa Indonesia, ejamlya discsuilik;~~~ dcng;~n eja;in yang bcrklku (Mustakim, 1990).

Pencariall llallla diri dalam basis data, katalog pengaralg atau buku telepoli ~llempakall suatu yang ullluln &lam sisteru infor~nasi. Jika diketallui dengall pasti ejaan nania diri itu, aka11 secan mudah ditenlukan llallla tersebut dala111 d d a r nama. Banyak nletode yang diken~bal~gkan untuk nlencari sebuah string dalanl s e k u ~ ~ ~ p u l m string yalig bisa dipakai untuk p e ~ i c a r i a ~ ~ nama. Jika tidak diketallui atau tidak illgat ejaiu~ yang tepat atau jika terjadi kesalahan lllengetik saat mencu' I na111a

dalalil daftar llallla lllaka pellcarim lllungkin aknn mengalami kegagalan, kecuali diyllakan teknik pencarian tertentu.

Dalalll bahast Indoucsia ke~lluligki~lan kesalahan dalall~ pencarian atau pelilbacaan nalila diri aka11 terjadi kare~ia ada llallla yang mcllgyllakan Ejaan Lama. Penulistn liallla din dalall~ ballast Indonesia disesuaikan dengall aturm Ejaan Y N I ~ Dise~llpurnakall (EYD), kecuali untuk llalila diri yang telah disalkan scbelu~ll EYD dan yang lllell~iliki pertirnba~lgan kllusus, ~llistlnya adat istiadat, huku~n, kesejanhan, dan kesi~la~l~bungai identitas pribadi (Mustakim, 1990).

Penelitian untuk ~llencari llallla yang lnellliliki kesalnaan fonetik per~iah dilakukali ole11 Prilliasari (1999) yang mengynakan algorit~lle Soundex dan Phonis. Dalam penerapan pada bahasa I~~donesia, kedua nletode tersebut mendapalkan nlasalah jika ~ l ~ e l a k u k a ~ pellcarian terlladap nana yang masih me~lgynakan Ejaan Lama. Maka pada penelitia~ ini aka11 dicoba lnetode kesamaan string untuk mengatasi masalah pe~lcarian n m a yang masill ~lle~lgynakan Ejam Lama.

Tujuan

Tujuan dari penelitinn ini yaitu :

1. Melllpelajari dan ~llellenpkali nletode kesanlaan string pada pencarial~ llalua yang ~llc~l~iliki kesalllaan fonetik untuk mengatasi masalah Ejaan Lama.

2. Menlbandingkan algoritme kesalllaal~ string yang diken~bangkal ole11 Uratani-T<&eda dengall algoritnle Sekuensial.

TINJAUAN PUSTAICA

M e ~ ~ u r u t Pfeifer et. al. (1996), u k u r a ~ kesa~llaan non-linguistik dapat dibagi me~ijadi tiga kategori yang berbeda yaitu kesanlaan string, kesamaan yang berllubu~igan dengall kesalahan pengetikan, dan kesalllaa~i 1011ctik. Dari katcgori pertarna metode n-gra111s paling umum dipakai. Contoh dari kategori yang kedua yailu metode

Damerau-Levenstein-Metric, dimaia lnetode ini menglutullg penyisipan, penghapusan, substitusi, dac transposisi yang dibutuhkan untuk m e ~ ~ t r a n s f o r n a s i satu slrillg ke siring yang lain. Dalanl dua kategori ini pelllbandillgan kata-kata dilak~kan tanpa ~ilelllperdulikall jenis bahasa yalig digunakan. Sedangkan untuk jenis kategori ketiga, ukuran kesaulaan sangat tergmtulg pada bahasa yang diyllakan. Algorit~ne Soundes dan Phonix addall llietode yang terkenal unluk l~le~llbandingkan kata dengall me~ilperl~atikan kesamam fonetik.

Arti kesamaan fonetik atau kesanlaan bunyi yaitu adallya beberapa huruf dalan~ abjad yang lllellliliki bunyi pengucapan ~lurip alltar llilruf satu dengall liuruf lai~u~ya (Primasari, 1999). Sebagai contoh 1la111a "Joko" dan "Djoko" 111erupakan dua 11a11ia yeng memiliki kesa~llaali fonetik. Beberapa ha1 yang menyebabkan adanya kesanlaan fo~letik yaitu :

1. Kesalalian pendengann, seperti pada llallla Rina dan Rima.

2 . Ingatan yang lemah, llal i ~ u karelia seseoralig lupa aka1 nama yang aka11 dicari dan akibatnya dia lnelakukan pe~~carian dengm mencoba beberapa 11al11a yang mirip bunyinya.

3. Kullur, seperli pada na111a Ferri yang sering diucapkan dengan kata Perri.

4. Ejaan, seperti pada nallla K u ~ c o r o dan Koentjoro.

5. Kebiasaan.

Pada pe~ielitian ini penyebab admya kesamaan fonetik dibatasi pada faktor ejaal~ saja karena ballasa Indonesia mengalallu berbagai pembahan ejaan dari senlenjak pe~ljajahan Belanda lungga

I I I U I I C ~ ~ Ejaan Yalg Disemp~ullak;u~.

Pcngertian Ejnan

Pel~gertiali ejaan secara UIIIUIII berarti

(34)

pelamba~lgan bunyi bahasa, tenuasuk penusahan dan penggabuugannya, yang dilengkapi pula dengan pengguiaan tan& baca. Secara khusus ejaan berarti sebagai pelan~ba~igan bnnyi-bunyi ballam dengan huruF, baik berupa l~uruf demi imrur lnaupun

huruf

yang telal~ disusun ~nenjadi kata, kelo~lipok kata, atau kali~nat (Mustakim, 1990).

Dalani suatu ballasa sistenl eja;ul Iazinulya ll~elnpuliyai tiga aspek, yaitu aspek fonologis yang menyangkut p c l a ~ l b a n ~ n Conem dengan lluruf dan peliyusunall abjad; aspek morfologis yang lnenyangkut pelamba~gai satuan-satuan morfemis, dan aspek siutaksis yang ~neuya~~gkut pela~ubangan ujaran dengan tanda baca. Dengan denlikian, ketentuan-ketentuan yang lnengatur pelalnbangan Co~onem dengan lluruf yang ada dalan bahasa Indonesia, serta pelafalan, pengakroniman, dan penyusunan abjad terniasuk di dalan aspek fonologis. Ketentuan yang lnengatur pernbentukan kata dengan pengi~nbuhan, penggabungan kata, pemenggalan kata, penulisal kata, penyesnaian kosakata asilig ke dalani ballasa Indonesia tennasuk aspek morfologis. Di pihak lain, penulisan dan pelaralal fmsa, klausa, serta kalin~at ter~uasuk aspek sintaksis.

Perkembangan Ejaan di 111donesia

Menurut Mustakiln (1990), sejak nlasa penjajahan Belanda hhgga

mass

kemerdekaan, ejaan dalanl bahasa Indonesia ~ n e ~ ~ g a l a n u bernlacanl perubahan. Perkenlba~igai~ ejaail yang terjadi di Indonesia yaitu :

1. Ejaan Van Ophuysen

Ejaan ini ~nulai bcrlaku sejak tal~nn 1901 yailn saat ditcrbilk;~~mnya buku yang bcrjudul Kilnb Logo1 AJelayn yang disnsun ole11 Ch.A. Van Ophuysen, yang dibantu ole11 Engku Nawawi gelar Sutan Ma'moer d a i Moellam~~md Taib Sutan Ibnldm. Beberapa ha1 yang lnenonjol dari Ejaan Van Oplluysen ini antara lain :

(1) Hurufy ditulis dengan j.

Contoh : yaitu

+

jaitu (2) Humflf ditulis dengall oe

Contoh : nmzfm

+

oellloelll

(3) Humf k pada aW~ir kata alau suku kata ditulis dengan talda ko~na di atas.

Contoh : nlcyat

+

n'jat (4) FIurufj ditulis dengan dj

Contoh : Jakarta

+

Djakarta (5) H u ~ u f c ditulis dengan tj

Coiltoh : c a n

+

t j a a

(6) Gabungal konsonan MI ditnlis dengall ch

2. Ejaan Republik @jam Soewandi)

Ejaan Republik adalah ejaan barn yang disusnn ole11 Panilia Ejaan Ballasa Indonesia yang diketuai oleh Mr. Soewandi. Ejaan ini diresnukan pada tanggal 19 Maret 1947 dan ditetapkan berdasarkan Surat Keputusan Menteri Pendidikan, Pengajaran, dan Kebudayaan Republik Indonesia No~nor 264/Bhg.A, tanggal 19 Maret 1947.

Beberapa perbedaan autan E j a a ~ Republik dengan Ejaan Van Opl~uysen yaitu :

(1) Gabungal huruf oe dalanl Ejaan Van Opl~uysen diganti dengan u dalam Ejaan Republik.

(2) Bunyi l ~ a ~ ~ u a l ~ ( ' ) dalanl Ejaan Van Oplluyseu diganti dengan k dala~n Ejaan Republik. (3) Kata ulang bole11 ditandai dengan angka dua

dala~il Ejaan Republik.

(4) Huruf e taling dan e pepet dalanl E j a a ~ Republik tidak dibedakan.

(5) Tanda trellla (") dalanl Ejaan Van Ophuyse~i dihilangkan dala~il Ejaai Republik.

[image:34.559.293.501.369.469.2]

Ccntoh perubahan dari Ejaan Van Ophuysen ke Ejaan Republik dapat dilihat pada Tabel 1.

Tabel 1. Contoh perubal~ai kata dari Ejaan Val

0 I u sen ke E'aan Re ublik E'aan Van 0 hu sen Eiaan Re ublik

oelnoer ulnur

Ivia'locm maklum

nla-rala rala2

Ekor

senang seliailg

mukll mulai

3. Ejaa~t Melindo

AJeli17do ialah akroninl dari Melayu-Indonesia. Ejaan Melindo, sesuai dengan nananya, merupakan ejaan yang d i s u s u ~ atas kerja sama anhra pihak Indonesia, yang diwakili oleh Slametmuljana, dan pillak Persekutuan Tanah Melayu (Malaysia), yang dipin1piil ole11 Syed Nasir bin Ismail.

(35)

4. Ejaan Baru (Ejaan LBK)

Ejaan Baru pada dasan~ya nlerupakan lanjutan dari usaha yailg telal~ diriiitis ole11 panitia Ejaan Melindo. Karena panitia yang nlenyusliil ejaan tersebut dibentuk oleh Kepala Lenlbaga Bahasa dan Kesusaslra;~~ (LBK) dan diberi llama Panitia Ejaai~ LBK, ejaan baru yang diruniuskan itu pun dikenal dengan nalna Ejaan LBK.

Perubalian yang terdapat dalain Ejaan Barn atau Ejaan LBK antara lain :

(1) Gabungan konsonan dj diubali ~nei~jadi j. Conloh : reiliadja

+

reinaja

(2) Gabungan konsonan tj diuball men-jadi c. Contoh : tjipta

+

cipta

(3) Gabungan konsonan nj diubah menjadi ny. Conloll : njala

+

nyala

(4) Gabungaii konsonan sj diubah nlenjadi sy. Conloh : isjarat

+

isyarat

(5) Gabungan konsonan ch diubah menjadi kh Contoli : macliluk

->

iiiakhluk

(6) Huruf j diubal~ 111enjadi y Contoh : saja

-+

saya

(7) Huruf e taling dru~ e pepet penulisannya tidak dibedakan dan llanya ditulis d e n g a ~ e, tanpa penanda.

(8) Huruf asii~g f, v, dan z diinasukkan ke dala~n sistem ejaai~ bahasa Indonesia karena huruf- lmruf ilu bailyak diguiiakan.

Beberapa perubalian itu ternyata illeninlbulkan berbagai pendapat yang bernada keberalm, baik dari kalangan ahli bahasa sendiri lllaupun dari nlasyarakat uinum. Dengan kata lain, ejaan barn itu belun~ disetujui beberapa piliak selungga peresii~ian~~ya pun belunl dapat dilaksanakan.

5. Ejam Bahasa Indonesia Yang Diselnpurnakan ( E D )

Ejaan Ballasa Indonesia Yang Disempurnakan atau yang lazi~u disebut EYD dinyatakall liiulai berlaku sejak penggunamu1ya diresnukan oleli Preside11 Republik I~~donesia snat itu, Soeliarto, pada tnnggal 16 Aguslus 1972.

Ejaan Bahasa Indonesia yailg Disenlpurnakan it11 pad;) dasanlya tidak disusun secara tiba-tiba. Akan telapi, bahan-baliaiulya tclah dipersiapkan dan dirintis sejak penyusunall konsep Ejaaii Baru. Ole11 karena itu dapat dikatakan balnva konsep- konsep dasar yang ditelapkan dalan~ Ejaau Bahasa 1ndonesi;i yang Disen~purnakali sebenarnya iilerul-lakan kelanjutnn dnri Ejaan Barn atau Ejaan

LBK:

Beberapa kebijakan baru yang ditetapkai~ di dalain EYD alltara lain :

(1) Peruballan Huruf

Ejaan Lanu Ejaan Baru dj

+

djika j

-+

jika tj

+

tjakap c + cakap nj

+

sunji 11y -+ sunyi sj -+ sjukur sy

+

syukur cli

+

achir kh

-+

akhir j

+

supaja y

+

supaya

(2) Huruf f, v, dan z yang iilerupakan unsnr serapan dari bahasa asing dires~uukan pemakaiannya. Misalnya : klulaf, fisik, universitas, &at, kllilmmli.

(3) Huruf q dan

x

yang tidak laziin diynakan dalani bidang illnu pengetahiuan tetap diynakan, ~nisalnya pada kata fwqon dan Selloll.

(I) Penulisan di- sebagai awalan dibedakan dengall di yang ~llerupakan kata dcpan. Sebagai awalan, di- ditulis serangkai kata' dengan unsur yang menyertainya, sedangkan di sebagai kata depan ditulis teryisal~ dari kata yang mengikutinya.

(5) Kata ulang ditulis penuh dengan menylang unsur-unsunlya. Angka dua lidak digunakan sebagai penanda perulangan.

[image:35.564.297.485.402.497.2]

Secara ringkas, lluruf-liuruf yang nlengalailli perubahnn dari Ejaan Lailia ke Ejaan Baru dapat diliiiat pada Tabel 2.

Tabel 2. Perubaliai huruf dari Ejailn Lanla ke Ejaan Baru.

Ejaan Laina

I

Ejaan Baru

I

C

Huruf-liuruf dalan~ Tabcl 2 tersebut akan dipakai untuk ~neinbentuk varian dari illput nanla yang akan dicari.

Algoritme ICesamaan String. 1. Algoritn~e Uratani-Takeda

Algoritn~e yang dipakai pada penelitian iiu yailu algoritine yang dikeiubai~gkai~ ole11 Uratani dzu~Takeda (1993).

(36)

oleli Aho dan Corasick yailu yang ii~elakukan pei~carian string untuk baiiyak input.

Untuk iiielihat c a n kerja dari algorihne ini perl~atikan contoh berikut :

Misalkan terdapat sekuinpulan input yaitu (trace, artist, snrart) yang akan dicari kedalaii~ teks "tl?e- greatest-artist..

". Pertaiia kita ~ilenyaiiiakan

liuruf teraldiir dari seinua input. Karena panjailg input yg paling peudek adalali 5 ~iiaka kita ii~ulai ilieilyesuaikaii dengan liurur ke-5 dari leks daii poir7ter berada di liuruf ke-j dari teks. Pada contoh di bawah ini,

*

~iieliandakan sesuai, seda~ig s

iiie~~unjuMta~~ lidak sesuai.

t r a c e a r t i s t smart

t h e - g r e a t e s t - a r t i s t

X

Karena huruf g tidak sesuai dengall l~uruf tenkhir semua input d a i ~ tidak inuncul di setiap kueri, kita iliciiggcscr input-iiipul itu ke kaiian sebaiiyak 5 lluruf.

t r a c e a r t i s t Smart

t h e - g r e a t e s t - a r t i s t

X'

Pads ko~idisi ini, 11urilf c pada lcks scsuai dengan huruf e pada input "trace". Karei~ailya kita ine~iggeser poir?ter di teks ke kiri satu humf. Karei~a tidak sesuai dan string te dari teks tidak ~iluncnl di semua input, kita geser lagi input-input itu sebanyak 5 huruf ke kanan (atau inenggeser pointer sebai~yak 6 huruf).

t r a c e a r t i s t Smart t h e - g r e a t e s t - a r t i s t . .

Huruf r yang sekarang dibmdingkan tid'ak sesuai dengall huruf tenkliir dari seillua kueri. Lalu kita illelumskall lluruf

r

itu dengan huruf r yang ada di input "sr?zart". Jadi kita iuenggeser input- input ke k a ~ a n sebanyak satu.

t r a c e a r t i s t smart

Gambar

Tabel 1. Contoh perubal~ai kata dari Ejaan Val
Tabel 2. Perubaliai huruf dari Ejailn Lanla ke
Tabel 3. Rasio antan varian yalig terbentuk oleh prog ran1 dengan yang didapatkan dari basis data
Gambar 2. Gnfik perbandingan ~ a k l u  peilcariall antara algoritIiie Urataiu-Takeda d m  algorit~ue Sekueilsial pada beberapa input
+5

Referensi

Dokumen terkait

Macam roda kemudi atau steering wheel yang kedua adalah roda kemudi kecil, roda kemudi jenis ini memiliki keuntungan tidak memakan banyak tempat. Akan tetapi kerugiannya..

melalui 4 anak perusahaannya yaitu PT Petrokimia Gresik, PT Pupuk Kujang, PT Pupuk Kalimantan Timur, dan PT Pupuk Sriwidjaja Palembang memiliki kapasitas produksi

Berdasarkan uraian tentang permasalahan tersebut, maka penulis yang sedang melakukan internship di perusahaan Red Army Wathces Indonesia diminta untuk melakukakan

Perikanan laut merupakan potensi utama sumberdaya perikanan Indonesia dan memiliki peluang besar untuk dikembangkan. Kondisi ini memberipeluang untuk pengembangan

Panduan ini akan menolong Anda untuk mengajar, menyediakan aktivitas- aktivitas yang berpusat pada siswa dan menilai standar kompetensi yang sejalan dengan judul “Mengakses

(1) UPTD Puskesmas dan RSUD mengajukan permohonan pencairan dana Program Jamkesda untuk setiap pelayanan kesehatan bagi Peserta Program Jamkesda yang telah

Dalam penghimpunan dana zakat dompet dhuafa memiliki strategi tidak jauh beda dengan lembaga amil zakat yang lainnya. Karena penghimpunan dana dalam sebuah lembaga

Metode ini bekerja dengan mengubah berkas audio menjadi domain frekuensi, kemudian menambahkan blok-blok hasil transformasi dengan carrier signal watermark yang telah