«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
327
ОӘК 004
А.С. МУКАНОВА, Г. ШЫНАТАЙ, Б. ЕРГЕШ Л. Н. Гумилев атындағы Еуразия ұлттық университеті, Астана, Қазақстан
ҚАЗАҚ ТІЛІНДЕ ЖҰРНАҚТАР АРҚЫЛЫ СЫН ЕСІМ ТУДЫРУДЫ АВТОМАТТАНДЫРУ
Кез келген тілді оқып үйренудің негізі осы тілде жазылған мәтіннің мағынасын түсінуге және сол тілде өз ойын дұрыс жазуға қажетті грамматикалық (морфологиялық және синтаксистік) ережелер болып табылады. Қазіргі қоғамды компьютерлендіру мен ақпараттандыру кезеңінде көптеген табиғи (ағылшын, француз, орыс, жапон және т.б.) тілдер компьютерлік программалар көмегімен оқытылып үйретіледі. Ол үшін, алдымен, оқытылатын тілдің грамматикалық ережелерінің математикалық моделдері құрылып, оларды талдау мен синтездеу алгоритмдері тұрғызылады.
Қазақ тілі - Қазақстан Республикасының мемлекеттік тілі ретінде елдің ішкі қарым- қатынасында ғана емес, сонымен бірге халықаралық байланыстарда да қолданылуы керек.
Қазақстан Республикасы дүниежүзілік қауымдастыққа біріге отырып, мемлекеттік тілдің даму деңгейін оның қарқынды зерттелуі мен қазақ тілін оқытудың әдістері мен құралдарын жасау негізінде дүниежүзілік деңгейге жеткізуді қамтамасыз ету керек. Сондықтан қазақ тіліндегі морфологиялық ережелерді математикалық лингвистика әдісімен зерттеу және сын есімдерді талдау мен құруды автоматтандыру мәселесі лингвистика және информатика саласында өте өзекті.
Жұмыс қазақ тіліндегі сын есім тудыру жолдарын талдау мен құруды автоматтандыру мәселесін қарастырылып, сын есімнің морфологиялық құрылымын математикалық лингвистика әдісімен зерттеп, морфологиялық ережелердің математикалық моделдері құрылып, сын есімдерді талдау мен тудыру автоматтандырылады. Зерттеу нәтижесінде алғашқы рет қазақ тілінің морфологиялық ережелерінің математикалық моделдері құрылды, сын есімдерді тудыратын жұрнақтар құрылымы контексті бос грамматикаға сәйкестігі дәлелденді, жұрнақтар арқылы сын есімдерді тудыру мен талдау алгоритмдері құрылып, осы алгоритмдерді жүзеге асыратын программа жасалды.
Сын есім грамматикалық ережелерінің математикалық модельдерін тұрғызып, оны синтездеу алгоритмін жасау үшін семантикалық нейрондық желі, сонымен қатар, пән аймағының онтологиялық моделі қарастырылды.
Семантикалық нейронды желі – кейбір операцияларды параллельді немесе квазипараллельді орындайтын, бір бірімен ақпарат алмасатын (мысалы, хабарламалар арқылы) және кейбір ұйымдастырушы принциптер (мысалы, көрінудің бірегей облысы) арқылы бірегей бір бүтінге біріккен өзара динамикалық байланысқан объектілер (нейрондар) желісі. Семантикалық нейронды желіде әрбір нейрон пәндік облыстың моделінің кейбір элементіне немесе мәтін моделіне сәйкес келеді. Элемент – ол мәтін белгілерінің, түсініктердің және бір элементпен қиыстыру немесе абстракциялауға болатын түсініктер арасындағы қатынастардың жиынтығы. Барлық әріптер және сол әріптерден құралған барлық сөздің формасын элемент болып табылуы мүмкін. Морфологиялық және семантикалық талдау жасайтын семантикалық нейронды желінің құрылысы ретінде синхрондалған сызықтық ағашты алуға болады. Сонымен қатар, сөзтүрлену және сөзжасам есептерін шешу үшін де синхрондалған сызықтық ағаш қолданылады [3].
«Сын есім» қолданбалы онтологиясы жалпы онтологияны құрудың принциптері негізінде жасалды, бірақ мұнда білімді көрсету тілі ретінде семантикалық гиперграфтар қолданылады. формализмі онтологияны семантикалық гиперграф түрінде көрсетуге мүмкіндік береді. Мұндағы мәселелік ортаның түсініктер жиыны (гиперграфтың
«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
328
төбелері), үсініктер арасындағы қатынастар жиыны (гиперграфтың доғасы мен қабырғасы), ал – берілген пәндік облыстағы қатынастар мен түсініктер атауының жиыны.
Ал мәселелік ортаның түсініктер жиыны бірнеше ішкі жиындарға бөлінеді:
[2].
Мұндағы бұл мәселелік ортаның барлық ішкі класстарының класы - біз қарастырып отырған қолданбалы онтологияда “Сын есім” класс болып табылады.
мәселелік ортаның құрылымдық түсініктердің ішкі класы - сөз түрлендіруші жұрнақтар, з.е→с.е, ет→с.е. сын есімнің қасиеттері бойынша мағына,құрамына қарай,тұлғасына қарай жіктелулерін ажырату – қарастырып отырған жағдайда сын есімнің қатыстық, сапалық, туынды, негізгі, дара, күрделі түрлері. субстансивтену арқылы сын есімдердің түрленуі – сын есімнің септелуі, жіктелуі және көптік жалғауының жалғануы. Жоғарыда айтылған ережелерге сәйкес қазақ тіліндегі сан есімнің [1] онтологиялық моделі жасалынды (1- сурет).
Сурет 1. Қазақ тіліндегі сан есімнің онтологиялық моделі
Семантикалық және онтологиялық модельдердің негізінде программалық жоба іске асырылды.Программаның толық көрсетілімі 2- суретте көрсетілген.
Сурет 2. Сын есімді тудыру программалық ортасының терезесі
«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
329
Жұмыс нәтижесінде сын есім тудыратын 135-тен астам жұрнақтар арқылы семантикалық кестеде берілген 45000 сөзден 66000 сын есім тудырылды.
Зерттеу барысында құрылған қазақ тілінің морфологиялық ережелерінің математикалық моделдері және сын есімдер мен сын есім тудыратын жұрнақтарды талдау мен құру алгоритмдері жалпы қазақ тілінің дамуы мен кеңінен қолдануына ықпал етеді. Қорыта айтқанда, жұмыс нәтижелерін қазақ тілін оқыту, қазақ тілінде іс жүргізу, қазақ тіліндегі ақпараттардың орфографиясын, морфологиясын және синтаксисін тексеру мүмкіндігі бар қазақ тілінде қарым–қатынас жасайтын зерделік ақпараттық технологиялар мен жүйелерді дайындауда және телекоммуникациялық жүйелерде қазақ тіліндегі ақпаратты дұрыс қабылдау, беру мен өңдеуде, әртүрлі деңгейдегі білім беру мекемелері, оқу орталықтары және сол сияқты басқа да мемлекеттік, мемлекеттік емес кәсіпорындар пайдалана алады.
Әдебиеттер
1. Қазақ тілі: Жалпы білім беретін мектептің сыныбына арналған оқулық/С. Исаев, К.
Назарғалиева, Ж. Дәулетбекова. - Алматы: Атамұра, 2002.-208 бет.
2. Онтология_(информатика) [Электронный ресурс]. Энциклопедия Википедия.
3. Бекманова Г.Т. Методы и алгоритмы распознавания слов казахского языка