«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
327
ОӘК 004.432.
А.С. МУКАНОВА, Г.Т. БЕКМАНОВА
Л. Н. Гумилев атындағы Еуразия ұлттық университеті, Астана, Қазақстан
ҚАЗАҚ ТІЛІ ЕТІСТІКТЕРІ СӨЗЖАСАМДАРЫНЫҢ ФОРМАЛДЫ МОДЕЛІ Жұмыста қазақ тіліндегі сөз таптарының ішіндегі ең күрделі және қарымы ең кең грамматикалық категория болып табылатын етістік және оның жаңа сөзжасамдарын тудыратын жұрнақтар талданып, олардың грамматикалық категориясы бойынша түрлері қарастырылып, етістік тудыруды автоматтандыру үшін қазақ тілі етістіктері сөзжасамдарының онтологиясы онтологиясы жасалынды.
Онтология түсінігі грек тілінен аударғанда онтос – жан,мән,мағына, логос - білім дегенді білдіреді, яғни болмысты зерттейтін философиялық ілім.
Техникалық ғылымдарда онтологияның қолданылуының негізгі мәні белгілі бір білім облысы бойынша мәліметтер жиынының барлығын қамтитын және бөліктік формализацияны концептуальді сызбамен көрсетуі. Концептуальды сызба негізінде түсініктер жиыны + түсініктер жайлы мәліметтер (қасиет, қатынас, шектеу, аксиомалар және түсініктердің бекітілуі, бұл ақпараттардың барлығы таңдалынған пәндік облыс бойынша есептің шешілу процесін сипаттау үшін қажет) беріледі.
Компьютерлік лингвистикамен айналысатын мамандардың арасында онтологияның нақты тұрақталынған (классикалық) анықтамасын Губерт ұсынды: онтология – бұл концептуализацияның эксплицитті спецификациясы, мұнда концептуализация ретінде пәндік облыстың объекттерінің жиындары мен олардың арасындағы байланыстардың сипатталуы түсініледі. Нақты ғылымдардағы онтологияның келесі түрлері бар:
Мета- онтология – пәндік облысқа тәуелсіз жалпы түсініктерді бейнелейді.
Пәндік облыстың онтологиясы – пәндік облыстың формалды бейнеленуі, негізінен мета- онтологиядағы белгілі бір түсініктерді нақтылау немесе пәндік облыстың жалпы терминологиялық базасын анықтау үшін қолданылады.
Желілік онтология – пәндік облыс объектілері мен есептері орындайтын әрекеттің соңғы қорытындысын бейнелеу үшін қолданады. Формалды түрде онтологияның моделі төмендегідей анықталады:
мұндағы,
- пәндік облыстың түсініктерінің соңғы жиындары, - түсініктер арасындағы қатынастардың соңғы жиыны, - интерпретация функциясының соңғы жиыны.
Құрастыру мақсатына қарай онтологияны қолданбалы, сілтемелі, толықтырылуы бойынша, формалды және лингвистикалық онтологиялар деп бөлуге болады.
Формалды онтология класстар, объектілер, қатынастар, функция мен теориялардың негізіндегі түсініктер жиынтығы мен сол түсініктердің бекітулерінің тобынан тұрады.
Онтологияның көптеген модельдері келесі компоненттерден тұрады:
концепттер(түсінік, класстар),
концепттердің қасиеттері (атрибуттары, ролдері),
қатынастар концепттер арасында (тәуелсіздік, функциялар),
қосымша шектеулер,олар аксиомалармен анықталады,
қолданылу мысалдары.
Онтологиялық жүйелерді құрастыру кезінде келесі ережелер қолданылады:
«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
328
• формализациялау, яғни объективті элементтерді бірегей анықтамалық үлгіде сипаттау (терминдер, модельдер және т.б.);
базалық терминдердің шектеулі санын қолдану, соның негізінде қалған түсініктер құрастырылады;
ішкі толықтық және логикалық қарамақайшылықсыздық [4].
Әр түрлі пәндік облыс және әр түрлі тапсырмалар үшін білімді ұсынатын тілдер (модельдері) спектрлері бар. Талдаулар бойынша концептуалды білімдерді бейнелеу үшін семантикалық желілердің таралымы ретінде гиперграфтарды қолданған жөн. Онда арлы қарым- қатынас көрсетіледі, ол объектінің атрибуттары ғана емес, сонымен қатар, объектілердің құрылымдылығын, толықтылығын және олардың арасындағы байланысты толық көрсетуге мүмкіндік береді.
Жалпы жағдайда гиперграфты жұбымен анықталады. Мұндағы – төбелерінің жиыны, ал –
қабырғаларының жиыны. Әрбір қабырға ішкімүшесі болып табылады. Егер төбесі мен қабырғасы инцидиентті деп аталады. үшін арқылы төбесіне инцидиентті қабырғаларды белгілейді; дегеніміз - төбесінің дәрежесі. Қабырғаның дәрежесі e – осы қабырғаға инцидиентті төбелер саны, – арқылы белгіленеді. гиперграфы r-біркелкі деп аталады, егер оның қабырғалары бірдей дәрежесіне ие болса. Егер әрбір қабырғасы 2-ге тең болатын дәрежеге ие болса, онда ол гиперграф граф деп аталады.
гипeрграфының ішкі гиперграфы болады, егер және төбе және қабырға инцидиентті ге болса, сонда тек сонда ғана олар ге инцидиентті болады.
Гиперграфтар бағытталған және бағытталмаған болады. Бағытталмаған графтың қабырғалары буын деп аталады. Бағытталған граф болған жағдайда қабырғасы гипердоға (қысқаша доға) деп аталады және жұбы арқылы беріледі, мұндағы
∅. Мұндағы доғасының басы, ал әрбір төбесі доғасының ақырлы төбесі деп аталады. доғасы төбесінен шығып, жиынынын әрбір төбесіне кіреді.
Бағытталған граф түсінігіне анықтама берcек, егер қабырғалар жиыны , ал доғалар жиыны және болса, онда гиперграф жартылай бағытталған немесе квази бағытталған гиперграф деп аталады. . Егер болса, онда гиперграф бағытталмаған болады, ал егер болса, онда гиперграф толығымен бағытталған болады. және жиынының қуаттылығына байланысты қосымша түсініктемелер енгізіледі. Егер
болса, онда гиперграф бағытталмаған-бағытталған болады. Егер
болса, онда гиперграф сәл бағытталмаған болады. Егер болса, онда гиперграф сәл бағытталған болады.
Егер гиперграф элементтеріне кейбір жиындардан символдар қосылып жазылса, онда ол боялған гиперграф немесе қабырғалары мен төбелері таңбаланған гиперграф деп аталады. Символдар тізбегі – бұл жартылай бағытталған гиперграфпен көрсетілген анықтамалар атауы мен онтология байланысы. Мұндай гиперграфты семантикалық гиперграф деп аталады [3].
Жоғары қарастырып өткен онтологиялық моделдер негізінде етістіктің грамматикалық категориясына [2] қарай 1- суретте көрсетілгендей етістік формалды моделі жасалды.
«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
329
1-сурет. Етістік формалды моделі
Формалды моделде етістіктің категориялары концептілер ретінде алынып, олардың қасиеттері мен өзара қарым- қатынас бейнеленген. Мысалы: жина деген етістіктен етістіктің болымды және болымсыз түрлерін – ма жұрнағын жалғау арқылы жасаса, етіс категориясы көрсетілген төрт етістің жұрнақтары жалғану арқылы етістіктің жаңа формалары туындайды.
Сонымен қатар, басқа да көрсетілген грамматикалық категориялар бойынша басқа етістік сөзжасамдарын тудыруға болады. Етістіктің грамматикалық категорияларын формалды моделдеу арқылы жұмыста төменде көрсетілгендей формалды ережелер жасалынды.
((ет01)с)!ое (((ет01)с)тыр)!өг ((((ет01)с)тыр)ыл)!ые ((((ет01)с)тыр)у)!қа ((((ет01)с)тыр)т)!өг (((((ет01)с)тыр)т)қыз)!өг ((((ет01)с)тыр)ғыз)!өг (((ет01)с)ын)!өз (((ет01)с)па)!бз (((ет01)с)ты)!өе
((((ет01)т)қыз)дыр)!өг ((((ет01)т)қыз)ғыз)!өг (((((ет01)т)тыр)т)қыз)!өг ((((((ет01)т)тыр)т)қыз)дыр)!өг (((((ет01)т)қыз)дыр)т)!?г
(((((((ет01)т)тыр)т)қыз)дыр)т)!өг (((ет01)т)ты)!өе
(((ет01)т)қан)!өе (((ет01)т)атын)!өе (((ет01)т)ар)!ке
(((ет01)л)ма)!бз ((((ет01)л)ма)с)!ое ((ет01)н)!өз
(((ет01)н)ды)!өе (((ет01)н)ған)!өе (((ет01)н)атын)!өе (((ет01)н)ар)!ке (((ет01)н)бақ)!ке (((ет01)н)ып)!өк (((ет01)н)ғалы)!өк
Тұйық рай ЕСІМШЕ КӨСЕМШЕ Етістік негізі
ЕТІС Болымды Болымсыз
Салт Сабақты
РАЙ
ШАҚ
Жалаң Күрделі
Өздік етіс Ырықсыз етіс Өзгелік етіс Ортақ етіс
Ашық рай Неғайбыл рай
Осы шақ Келер шақ Өткен шақ
Жедел Бұрынғы Ауыспалы Бұйрық рай Қалау рай Шартты рай
Қатыстық
Нақ осы Ауыспалы Ауыспалы
Болжалды Мақсатты Етістік
Б Б
Б Б
«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
330
(((ет01)с)ған)!өе (((ет01)с)атын)!өе (((ет01)с)ар)!ке (((ет01)с)пақ)!ке (((ет01)с)ып)!өк (((ет01)с)қалы)!өк (((ет01)с)қанша)!өк (((ет01)с)а)!ок ((ет01)т)!өг (((ет01)т)ыл)!ые ((((ет01)т)ыл)ма)!бз (((ет01)т)па)!бз
(((ет01)т)пақ)!ке (((ет01)т)ып)!өк (((ет01)т)қалы)!өк (((ет01)т)қанша)!өк (((ет01)т)а)!ок (((ет01)т)у)!қа ((ет01)л)!ые (((ет01)л)ды)!өе (((ет01)л)ған)!өе (((ет01)л)атын)!өе (((ет01)л)ар)!ке (((ет01)л)мақ)!ке
(((ет01)н)ғанша)!өк (((ет01)н)ба)!бз (((ет01)л)а)!ок ((ет01)ма)!бз ((ет01)у)!қа ((ет01)ды)!өе ((ет01)ған)!өе ((ет01)йтын)!өе ((ет01)р)!ке ((ет01)ма?)!ке ((ет01)п)!өк ((ет01)ғалы)!өк
Осы формалды ережелер көмегімен етістіктен етістік және есім сөздерден етістік тудыратын жұрнақтарды жалғау арқылы етістік сөзжасамдарын тудыру автоматтандырылады.
2- суретте есім сөзден етістік тудыратын және етістіктен етістік тудыратын жұрнақтарды жалғау арқылы етістік сөзжасамдарын тудыру мүмкіндіктері көрсетілген.
2- сурет. Етістік сөзжасамдары
Мысалда көрсетілгендей бу деген зат есімнен –ла, -лан, -лат, -ыл, -сын, -шы, -ын, - ырқан, -ына жұрнақтары арқылы була, булан, булат, буыл, бусын, буын, бушы, буырқан, буына жаңа етістік сөзжасамдары жасалды [1]. Ал етістіктен етістік тудыратын жұрнақтар арқылы етістіктің жаңа формаларын тудыру көрсетілген. Мұнда тек қана бір етістіктен етістіктің 75- тен астам басқа формаларын алуға мүмкіндік бар.
Әдебиеттер
1. Оралбаева Н, Мадина Ғ, Әбілқаев А. Қазақ тілі. Алматы,1982 2. Ысқақов А.Қазіргі қазақ тілі:Морфология. Алматы,1992
3. С.С. Курбатов, К.А. Найденова, Г.К. Хахалин. Интегрирование интеллектуальных систем анализа/синтеза изображений и текста
4. Хахалин Г.К. Прикладная онтология на языке гиперграфов //Труды II Всероссийской конференции «Знания – Онтологии – Теории». Новосибирск, 2009