• Tidak ada hasil yang ditemukan

Evaluasie van skoner vertaalgeheues

N/A
N/A
Protected

Academic year: 2024

Membagikan "Evaluasie van skoner vertaalgeheues"

Copied!
1
0
0

Teks penuh

(1)

http://www.satnt.ac.za 225 Open Access Page i of ii Inhoudsopgawe Page 1 of 1 Referaatopsomming

Suid-Afrikaanse Tydskrif vir Natuurwetenskap en Tegnologie

ISSN: (Online) 2222-4173, (Print) 0254-3486

Evaluasie van skoner vertaalgeheues

Evaluation of cleaner translation memories: We adapt a supervised learning method to operate as an unsupervised method identifying erroneous entries in translation memories.

Artificial training data is generated to make this possible. We show improved results in a translation memory system and neural machine translation systems with the datasets cleaned by removing the erroneous entries.

Rekenaars kan ’n nuttige rol speel in vertaling. Twee benaderings is vertaalgeheuestelsels en masjienvertaalstelsels. By hierdie twee tegnologieë word ’n vertaalgeheue gebruik – ’n twee­

talige versameling vorige vertalings. ’n Vertaalgeheuestelsel herroep vorige vertaalde seg­

mente wat ’n vertaler kan bystaan in die huidige teks wat vertaal word. By masjienvertaling word ’n teks outomaties van die brontaal na die doeltaal vertaal. Hierdie navorsing doen ondersoek na hoe so ’n vertaalgeheue se kwaliteit verbeter kan word, en bepaal of ’n skoner vertaalgeheue meer geskik is vir ’n spesifieke taak as vantevore.

Deur middel van masjienleer op ’n geannoteerde datastel kan ’n klassifiseerder gebou word om die kwaliteit van ’n vertaalgeheue te verbeter deur foutiewe inskrywings in ’n vertaalgeheue te identifiseer (Wolff 2017). Deur die foutiewe inskrywings uit ’n vertaalgeheue te verwyder, is ’n kleiner, skoner vertaalgeheue beskikbaar vir toepassings. Weens die gebrek aan gepaste data vir opleiding, asook die ongebalanseerde klasverdeling (die verhouding korrek:foutief) in tipiese datastelle, blyk realistiese gebruik in bogenoemde toepassings nie triviaal te wees nie.

Die gekontroleerde benadering word uitgebrei om as ’n ongekontroleerde benadering te funksioneer. Tegnieke vir gekontroleerde leer soos steunvektor­, ewekansigewoud­ en logistieseregressie­klassifiseerders word steeds gebruik, maar kunsmatige opleidingsdata word gegenereer waarmee die gewenste skaal bereik word en die klasverdeling na willekeur bepaal kan word. Hiermee kan ’n parameter dus beïnvloed hoe streng die resulterende klassifiseerder is. Die kunsmatige opleidingsdata word gegenereer deur die doelteks van ongeannoteerde vertalings te versteur deur ’n kunsmatige fout in die vertaling te genereer.

Voorbeelde van sulke foute is die byvoeging of verwydering van ’n letter, ’n woord, ’n leesteken, of selfs ’n groter deel van die segment. Die datastel wat aangevul word met die kunsmatige foutiewe vertalings dien dan as opleidingsdata vir die leermetode.

Die navorsing word intrinsiek en ekstrinsiek geëvalueer. Die intrinsieke evaluasie dui op ’n stelsel wat die klassifikasieakkuraatheid van die gekontroleerde benadering grotendeels benader. Vir ekstrinsieke evaluasie dui eksperimente aan dat so ’n vertaalgeheue beter prestasie in ’n vertaalgeheuestelsel behaal as die vuil basislyn. Neurale masjienvertaalstelsels is bekend daarvoor dat hulle sensitief is vir die kwaliteit van die opleidingsdata, en dat reuse­

hoeveelhede data nodig is om ’n kompeterende stelsel op te lei. As ondersteunende bewys vir die waarde van ’n skoner vertaalgeheue word ’n verbetering ook aangedui by die opleiding van ’n neurale masjienvertaalstelsel, ten spyte van minder opleidingsdata in die skoner datastel.

Literatuurverwysings

Wolff, F., 2017, ‘Combining off-the-shelf components to clean a translation memory’ Machine Translation, 30, 167–181.

Outeurs:

Friedel Wolff, L Pretorius, P Buitelaar Affiliasie:

Skool vir Rekenaarkunde, Universiteit van Suid-Afrika Korresponderende outeur:

F Wolff E-pos:

[email protected] Smutslaan 172, Lyttelton Manor, 0157

Hoe om hierdie artikel aan te haal:

Friedel Wolff, L Pretorius, P Buitelaar, Evaluasie van skoner vertaalgeheues, Suid-Afrikaanse Tydskrif vir Natuurwetenskap en Tegnologie 38(1) (2019).

https://doi.org/10.36303/

SATNT.2019.38.1.782 Kopiereg:

© 2019. Authors.

Licensee: Die Suid- Afrikaanse Akademie vir Wetenskap en Kuns.

Hierdie werk is onder die Creative Commons Attribution License gelisensieer.

Nota: ’n Seleksie van referaatopsommings: Studentesimposium in die Natuurwetenskappe, 25–26 Oktober 2018, SA Akademie- gebou, Pretoria, Suid-Afrika. Gasredakteurs: Prof Rudi Pretorius (Departement Geografie, Universiteit van Suid-Afrika); Prof Chris Swanepoel (Departement Besluitkunde, Universiteit van Suid-Afrika); Me Andrea Lombard (Departement Geografie, Universiteit van Suid-Afrika)

Referensi

Dokumen terkait

Raadsverkiesing: die verkiesing van raadslede deur stemgeregtigde kiesers om as hu lie verteenwoordigers op te tree; Raadsverslag: 'n verslag wat deur n raad aanvaar is as die mening

In die geval van weerspieëling word die onbewuste van kliënte betrek en van ’n hipnotiese toestand waar persone hulself oopstel om meer ontvanklik vir suggestie van ander te wees deur

In die Nederlandse reg hoef ’n selfstandige onderdeel van ’n kerkgenootskap nie gerig te wees op die godsdienstige besinning of verering om oor regspersoonlikheid te beskik nie, maar

In ’n vorm van geleefde religie, in die ritueel van die sing van hierdie geloofslied en deur die performatiewe krag daarvan, kan mense ontgrens en bevry word om die lewensweg te

TEOLOGIESE BETROKKENHEID BY DIE LEWE VAN DIE KERK Die voorstel wat hier voorgelê word kan as volg geformuleer word: Dat ’n struktuur of strukture daargestel word om deur

Dit is korrek om te verklaar dat die gemeenregtelike dienskontrak nie ontwikkel kan word deur statutêre regte van WAV daarin te impliseer nie – maar om die volgende redes is dit nie

Behalwe deur middel van die bespreking in besonderhede van ‘Die groot stilte’ wat ondertoe volg, kan daar binne die bestek van hierdie artikel slegs kortliks ingegaan word op enkele

’n Fisiese model van ’n slimhuis word gebruik om die werking van ’n werklike scenario te illustreer waar DFG van IvA ’n rol kan speel in forensiese ondersoeke na voorvalle wat