ТЕРЕҢ ОҚЫТУДЫ ҚОЛДАНА ОТЫРЫП ЖОЛ БЕЛГІЛЕРІН ТАНУ ЖҮЙЕСІН ҚҰРУ

Б.С. Омаров, Ш. Темиргазиева⃰

әл-Фараби атындағы Қазақ Ұлттық Университеті, Алматы, Қазақстан E-mail: [email protected], [email protected]

Аңдатпа. Жол белгілерін тану - жүргізушілерге апаттың алдын алуға көмектесетін маңызды қадамдардың бірі. Зерттеу жұмысының мақсаты жол қозғалысында нақты уақыт режімінде көлік жүргізушілеріне арналған жол белгілерін тану жүйесін терең оқыту әдістерін пайдалана отырып, модельдің жіктелу нақтылығын арттырып, тану жүйесін әзірлеу. Жол белгі кескіндерін жіктеу кезеңдері жүзеге асырылып, басқа да авторлардың шешімдеріне талдау жүргізілді. Сонымен қатар, бұл жұмыста конвульсиялық нейрондық желі (CNN) автономды жол қозғалысы мен жол белгілерін анықтау және тану жүйесі үшін пайдаланылды. Ұсынылған жүйе жол белгілерінің бейнесін тану бойынша нақты уақыт режімінде жұмыс істейді. Бұл жұмыста қолданыстағы деректер жиынтығы мен жиналған жергілікті жол белгілерін қолдана отырып, 43 түрлі жол белгілерін терең оқытудың көмегімен модельді оқыту қарастырылған. 8 қабатты конвульсиялық нейрондық желі арқылы жол белгілерін анықтау және тану жүйесі ұсынылған, ол жол белгілерінің әр түрін жаттығу арқылы түрлі функцияларды алады. Алдыңғы зерттеу жұмыстарында машиналық оқытудың қарапайым алгоритмдері бойынша модельдер оқытылған болса, ал бұл зерттеу жұмысының өзектілігі терең оқытуды қолдану арқылы, яғни конвульсиялық нейрондық желілер негізінде жіктеу тапсырмасы үшін CNN моделі оқытылды. Зерттеу нәтижесінде терең оқыту әдістерін қолдану арқылы жіктелу дәлдігі 95% алынды. Жұмыстың жаңалығы ретінде қолданылатын деректер жинынтығы мен модельді оқыту алгоритмдерінің тиімділігін арттыру үшін пайдаланатын конвульсиялық желі әдістерінің өзгешелігін, алынған жол белгілері мен оны тану алгоритмдерінің әр алуандығын, сонымен қатар жоғары дәлдік көрсеткішіне қол жеткізуді атап өтуге болады. Бұл жүйеге қоршаған орта факторларының әсерінен шектеулі дәлдік пен өнімділік мәселелерін шешуге, көптеген заманауи жүйелермен салыстырғанда анағұрлым жан-жақты және дәл болуға мүмкіндік берді.

Түйiн сөздер: CNN, нейрондық желі, жол белгілері, терең оқыту, машиналық оқыту.

Кіріспе

Жол-көлiк оқиғасы – көлiк құралдарының жолда жүруі кезінде және оның қатысуымен туындаған, адамның денсаулығына зиян келтіретін немесе ауыр қазаға әкелетін, сонымен қатар, көлік құралдарының, құрылыстардың, жүктердің бүлінуіне не өзге де материалдық шығындарға әкеп соғатын оқиға [1].

Біздің елімізде жол-көлік оқиғасынан зардап шеккендер туралы мәліметтер Армения, Қырғызстан, Тәжікстан сияқты ТМД елдерінің статистикасынан асып түседі. Бұл 20 жылдан астам уақыт ішінде жүзеге асырылған оқиғалар нәтижесі. Инфрақұрылымның негізгі элементтерінің бірі- жол. Көптеген факторлар (мысалы, жаңбыр, қар, жоғары температура, қараңғылық, күннің шағылысуы және жүк көліктері) жол қозғалысының тиімділігіне, жүргізушінің қауіпсіздігіне және көлік құралдарының құнына айтарлықтай әсер ететін әртүрлі зақымдарды тудырады.

ҚР Стратегиялық жоспарлау және реформалар агенттігі Ұлттық статистика бюросының ресми статистикасы бойынша 2020 жылғы көлік қозғалысындағы жол-көлік оқиғаларының саны 13 515.

Келесі кестелер Қазақстандағы жол-көлік оқиғалары бойынша 2020 жылғы статистиканы көрсетеді (1-сурет).

Жол-көлік оқиғалары ең көп Алматы қаласында (3245), Алматы облысында (2150) және Түркістан облысында(1042) байқалады.

Оқиға әсерінен жан тапсырған адамдар саны - 1687, жарақаттанғандар саны - 12 417 [2]. Жол- көлік оқиғаларының басты себептері:

● тиым салынған жерлерде жылдамдықты арттыру;

● жаяу жүргіншілер өткелінен өту кезінде;

● жол жүру бөлігіндегі таңбалармен ұйғарылған талаптарды сақтамау [3].

1-сурет – Ұлттық статистика бюросының ресми статистикасы бойынша 2020 жылғы жол-көлік оқиғаларының саны

Елімізде адам өмірін сақтауда өз көмегін тигізетін жол белгілерін тану жүйесі өте қажет. Жол белгілері көлік жүргізушілердің де, жаяу жүргіншілердің де қауіпсіздігін қамтамасыз ете отырып, жол апаттарының алдын алуға көмектеседі. Сонымен қатар, бағдаршамдар жол қозғалысына қатысушылардың белгілі бір заңдарды сақтауына кепілдік береді, бұл жол ережелерін бұзу ықтималдығын азайтады. Жол белгілері жүргізушілер немесе жаяу жүргіншілер үшін үлкен басымдыққа ие болуы керек. Әртүрлі себептермен, мысалы, шоғырлану, шаршау және ұйқы сияқты факторлар әсерінен жол белгілерін байқамай қалу ықтимал. Жол белгілерін байқамай қалуға ықпал ететін басқа себептерге нашар көру, сыртқы әлемнің әсері және экологиялық жағдайлар, ауа- райының өзгеруі, күннің шағылысуы және т.б. факторлар жатады. Нақты уақыт режиміндегі жол белгілерін тану жүйесі белгілерді тану үшін нақты уақыт режимінде автомобильдің алдыңғы камерасы түсірген суреттерді талдайды. Олар жүргізушіге ескертулер беру арқылы қауіпсіздікті арттыруға көмектеседі.

Соңғы зерттеулерге қарағанда [4-6] мәліметтері бойынша, терең оқыту үлкен өнімділікке қол жеткізе алады, ал деңгейлер санының артуы желінің оқу қабілетін арттырады. Осы ақпаратқа сүйене отырып, зерттеушілер 101 қабаттан тұратын жаңадан жасалған ResNet-101 [7] сияқты нейрондық желілердің жаңа топологияларын құруға айтарлықтай күш салды. Оның өте кішкентай нысандардан көп ақпарат алу қабілеті бірқатар қалдық модульдер мен қосымша конвульсиялық қабаттарды қосу арқылы едәуір жақсарды. Осыған қарамастан, терең бейтарап желілер әрдайым дерлік екі қиындықты жеңеді. Олардың бірі - есептеулердің едәуір көлемін орындау қажеттілігі. Параметрлер санының көбеюі модельдің одан әрі дамуына қарай бейімделуіне әкеледі [8]. Қарапайым оқытуға қарағанда әлдеқайда күрделі модельді оқыту есептеу уақытын да, жад ресурстарын да қажет етеді. Сондықтан терең модельді оқыту процесі есептеу үшін бөлінетін ресурстардың едәуір мөлшерін тұтынуды қажет етеді. Екінші мәселе - күрделілік деңгейі экспоненциалды жылдамдықпен өсуге бейім, бұл оны оқыту кезінде модельдің басқарылмауына әкелуі мүмкін. Желілік модель ақылды болып көріну үшін бізге желінің параметрлеріне үнемі өзгерістер енгізуге және оны үйрену кезінде оның анықтау қабілетін арттыруға мүмкіндік беретін тиісті оңтайландыру ережелерін енгізу қажет [9]. Дөңес функцияның

Вестник Алматинского университета энергетики и связи № 3 (58) 2022

талаптарына сәйкес келуіне байланысты кіші модельдің жоғалту функциясы терең модельдің жоғалту функциясымен салыстырғанда жиі қаттылықтың жоғары деңгейіне ие болады. Терең модельді қолданған кезде, ол дөңес функцияның сипаттамаларына сәйкес келмеуі мүмкін және бұл тіпті бетінің бұзылуына әкелуі мүмкін. Сондықтан сәйкессіздік пен тұрақсыздық жағдайлары оңтайландыру процесінің әртүрлі нүктелерінде көрінеді.

Талқыланғаннан кейін, көптеген параметрлерді қамтитын терең нейрондық желілердің модельдері қол жетімді сақтау мен есептеу ресурстарының көлемін арттыруды қажет етеді. Жеңіл деңгейлі AlexNet [10] - де шамамен 61 миллион параметр бар, мысалы, VGGNet [11] және GoogLeNet [12] сияқты күрделі модельдерді айтпағанда. Шамадан тыс өлшемді бейтарап желі моделін кірістірілген платформада тікелей сақтау мүмкін емес екенін және жадтың өткізу қабілеттілігі шектеуші фактор болуы мүмкін екенін жоққа шығаруға болмайды [13]. Ұялы телефондар, роботтар және өзін-өзі басқаратын көлік құралдары сияқты мобильді есептеу платформаларында күрделі модельдерді сәтті орналастыру қиын міндет болып табылады. Осыған байланысты жеңіл стилі бар желілік модельдер нақты уақыт режимінде анықталған жөн, өйткені олар практикалық тұрғысынан тиімді. Себебі, перифериялық құрылғыларда өңдеу ресурстары шектеулі. Сонымен қатар, жол белгілерін тану үшін SVM, KNN және Random Forest сияқты машиналық оқытудың әртүрлі алгоритмдерін қолдануға болады. Алайда, бұл алгоритмдердің басты кемшілігі - белгілерді алу жеке жүргізілуі керек, ал біз ұсынып отырған CNN конвульсиялық нейрондық желісі белгілерді өздігінен сұрыптайды. Ұсынылған жүйеде конвульсиялық нейрондық желі қолданылады. Осыған байланысты терең оқытуды қолдану, оның түрлі әдістері аясында тану жүйесін құру ғылымға да, қоғамға да үлкен үлес қосады. Осы айтылған ескертулерді қарастыра отырып, бұл жұмыста мынадай зерттеулер ұсынылады:

1) Біз жол белгілерін жылдам әрі тиімді анықтау үшін терең конвульсиялық нейрондық желіні ұсынамыз. Олардың іске асырылуы жол белгілері сияқты шағын нысандарды бір уақытта жіктеп, анықтай алады.

2) Біз модельдің дәлдігін қамтамасыз ету үшін желіні кесу және ядроны жинақтау әдісін қолдана отырып, дәлдікті жоғалтпай модель өлшемін және жұмыс уақытын азайтамыз.

3) Ары қарай жол белгілерін жылдам әрі дәл анықтау үшін 8 қабаттан тұратын конволюциялық нейрондық желіні құрамыз және модель дәлдігі 95%-ды құрады.

Алдыңғы зерттеулерге шолу және талдау

Жол белгілерін анықтау жүйесі – кішігірім нысандарды (белгілер) анықтауға арналған ең танымал жүйелер. Жол белгілерін анықтау әдетте, белгілі бір кескінде жол белгілері болуы мүмкін үміткер аймақтарды жасау үшін түстерді немесе геометриялық мүмкіндіктерді пайдалануды қамтиды.

Кейбір тәсілдер кескінді сегментациялау және белгілерді анықтау үшін RGB түс кеңістігін және түс шегін тікелей пайдаланады. Bouti A. және т.б. зерттеушілер жол белгілерін тану жүйесін екі бөлікке бөліп қарастырды. Бірінші, нақты уақыт режимінде белгілерді анықтау болса, екінші бөлігі деректер жиынтығы арқылы белгілерді анықтау тәсілі. Ол үшін зерттеушілер конвульсиялық нейрондық желілерді қолданды [14]. Ал бұл зерттеуде ұсынылып отырған желі нейрондық желінің архитектурасын пайдаланады. Атап айтқанда, CNN 2D - кескіндерді тану әдісі қолданылады.

Sun Y. және т.б. зерттеушілер [15] екі бөліктен тұратын терең оқытудың жаңа құрылымын ұсынады, оның ішінде жол белгілерін тану басқарылатын толық конвульсиялық желі (FCN) және объектілерді жіктеуге арналған терең конвульсиялық нейрондық желі (CNN) ұсынылған. Ұсынылған тәсіл [15] эксперименталды түрде R-CNN-мен салыстырылады [16]. E. Peng және т.б. зерттеушілер [17] жол белгілерін тануды орындау үшін CNN [18] әдісін қолданады және нәтижелер бұл тәсілдің перспективалы екенін көрсетеді. Алайда, дәлдік пен жылдамдық көрсеткіштері өте төмен дәлдікті көрсеткен. Сол себепті осы кемшіліктерді негізге ала отыра, біз бұл зерттеуде желінің тану дәлдігін арттыру мақсатында accuracy әдісін ұсындық.

Wu Yiqiang және т.б. зерттеушілер [19] кішігірім нысандарға төзімді және жол белгілерінің барлық санаттарын анықтай алатын нақты уақыт режимінде жол белгілерін тану алгоритмін енгізеді.

(кеңейтілген белгілерді таңдау [20, 21] спектрлік кластерлеу сияқты соңғы алгоритмдер арқылы қол жеткізуге болады). Атап айтқанда, объектілерді анықтауға жауап беретін аймақтық ұсыныс модулінен (RPM) және анықталған объектілерді жіктеуге арналған жіктеу модулінен (CM) тұратын екі деңгейлі анықтау құрылымын ұсынылады. Бағдаршамдарды анықтауда түс пен пішін туралы

ақпараттар қолданылған. Мысалы, бағдаршамдарды тану үшін [22] RGB немесе HSV түс кеңістігін пайдаланған. Түстерден басқа, геометриялық ақпарат кеңінен қолданылады. Жол белгілерінің геометриялық белгілері, Хаф түрлендіруі, бұрышты анықтау және проекциялар жол белгілерін нақты орнын анықтау үшін қолданылады [23].

Қойылған тапсырмалар

Алдыңғы авторлар ұсынған зерттеу нәтижелеріне шолу жасай отырып, және аталған кемшіліктерді ескере отырып жұмысты орындау үшін төмендегідей тапсырамалар қойылды:

1. жол белгілерін тану жүйесін құру үшін деректер жиынтығын әзірлеу;

2. деректер жиынтығын екі классқа жіктеу;

3. жіктеудің әдістерін саралап, тиімді әдісті қолдану;

4. конвульсиялық желі негізінде модельді оқыту.

Ең бірінші қадам ретінде деректер жиынтығын әзірлеу өте маңызды қадамдардың бірі, себебі модельді оқытуда деректер үлгісін ұсыну алгоритмдер жұмысының нәтижесінің дәлдігі, модель жұмысына тікелей тәуелді. Зерттеудің бастапқы деректері ретінде jpg форматына түрлендірілген кескіндер жиынтығы қарастырылады. Жіктеу тапсырмасы екі классқа, яғни оқыту және тестілеу классына күрделендіре отырып, классификация әдісіне өтеміз. Неғұрлым пайдалы әрі тиімді әдісті таңдау үшін алгоритмнің дәлдік көрсеткіштері мен орындалу уақыты ескерілді.

Материал мен әдістер

Жол белгілерін анықтау және тану жүйесі бірқатар бөліктерден тұрады, оның ішінде:

1. қажетті ақпаратты алуға мүмкіндік беретін деректерді алудың кешенді процесін;

2. алынған деректер ағынын кадрларға жіктеу;

3. алынған белгілерді анықтау;

4. нейрондық желіні оқыту, сонымен қатар оның тиімділігі мен дәлдігін тест деректерінде бағалау;

5. жол белгілері сақталатын деректер жиынтығы;

6. кадрлардағы объектілерді анықтау;

7. классификациялау;

8. нәтиже алу.

Төмендегі 2-суретте CNN моделіне негізделген жол белгілерін тану жүйесінің архитектурасы бейнеленген.

2-сурет – Жол белгілерін анықтау және тану жүйесінің архитектурасы

Вестник Алматинского университета энергетики и связи № 3 (58) 2022

85 Деректер жиынтығы

Жол белгілері жіктегішін үйрету үшін пайдаланатын деректер жинағы жол белгілерін тану сынағы – GTSRB болып табылады [24]. GTSRB деректер жинағы 43 жол белгілері класынан және 50 000-ға жуық кескіннен тұрады. Қолданылатын деректер жиынтығын 3-суретте көруге болады.

3-сурет – Деректер жиынтығы

Алайда, бұл эталондағы деректерді толықтыру қажет. Сондықтан біз Tsinghua-Tencent 100K [25] деректер жиынтығымен қосымша эксперименттер жүргізу арқылы, онда жарық пен ауа-райы сияқты көптеген аспектілерде үлкен айырмашылықтары бар көптеген жол көріністері, сондай-ақ окклюзия мысалдары бар әдістер қолданылады.

Нейрондық желіні оқыту

Бұл зерттеудің басты мақсаты - жол белгілерін терең оқыту қолдана отырып анықтау және тану жүйесін құру және терең оқыту әдістерін пайдалана отырып жоғары дәлдік көрсеткішін алу.

Алдымен терең оқытуды қолдана отырып, жол белгілерін тану моделін дайындалды және дайындалған модель тестілеуден өткізілді. Модельді оқыту үшін терең оқыту процесі көп уақытты алады, бірақ жіктеудің өзі салыстырмалы түрде қысқа уақытты қамтиды.

Жол белгілерінің бейнесі үшін әр белгіні анықтау мәселесінің мақсаты - белгілі бір пиксель белгінің бір бөлігіне тиісті екенін анықтау. Бұл мәселені шешу үшін ұсынылған шешім CNN-ге негізделген, ол геометриялық кескіндері бар белгілерді классификациялауға арналған. Іріктеу әдісі оқыту деректеріндегі күрделі бірлескен бейімделулердің алдын алу арқылы шамадан тыс орнатуды азайту үшін екі толық байланысты деңгей арасында қолданылады [26]. Әрбір нейронның шығысы 0,5 ықтималдықпен нөлге орнатылады. CNN оқыту графикалық өңдеу блоктары (GPU) арқылы жеделдетіледі. Әрі қарай үдетуге түзетілген сызықтық бірліктерді (ReLU) активация функциясы ретінде пайдалану арқылы қол жеткізіледі, бұл tanh (x) гиперболалық тангенс функцияларына қарағанда тиімді және дәстүрлі нейрондық модельдерде оқу кезеңінде де , бағалау кезеңінде де қолданылатын сигма тәрізді функция. CNN стохастикалық градиентті түсіру (SGD) әдісін қолдана отырып, 48 бірлік пакеттік өлшеммен оқытылады. Тексеру жиынтығында минимумға жету үшін 20 кезеңнен аз уақыт қажет. Сонымен қатар, модель дұрыс үйрену үшін Адам оңтайландыру әдісі мен қатар MacPool мен ReLU белсендіру функциясын қолданудың да маңызы зор.

Adam optimizer градиентті түсірудің екі әдіснамасының тіркесімін қамтиды. Бұл алгоритм градиенттің түсу алгоритмін "экспоненциалды өлшенген орташа" градиенттерді есепке алу арқылы жеделдету үшін қолданылады. Орташа мәндерді пайдалану алгоритмнің минимумға тезірек ауысуына мүмкіндік береді:

𝑚_𝑛 = 𝐸[𝑥^𝑛] (1)

Нейрондық желінің құндылық функциясының градиентін кездейсоқ шама деп санауға болатындығын ескеріңіз, өйткені ол әдетте кездейсоқ деректер пакетінде бағаланады. Бірінші сәт - орташа, ал екінші сәт - орталықтандырылмаған дисперсия (бұл дисперсияны есептеу кезінде орташа мәнді шегермейміз). Кейінірек біз осы мәндерді қалай қолданатынымызды көреміз, дәл қазір оларды қалай алу керектігін шешуіміз керек. Моменттерді бағалау үшін адам ағымдағы шағын партияда бағаланған градиент бойынша есептелген экспоненциалды қозғалатын орташа мәндерді қолданады:

𝑚_𝑡 = 𝛽₁𝑚_𝑡−1+ (1 − 𝛽₁)𝑔_𝑡 (2) 𝑣_𝑡 = 𝛽₂𝑣_𝑡−1+ (1 − 𝛽₂)𝑔²_𝑡 (3)

Мұндағы m және v-қозғалатын орташа мәндер, g-қазіргі мини партиядағы градиент, ал β-жаңа енгізілген алгоритм гиперпараметрлері. Олар сәйкесінше 0.9 және 0.999 әдепкі мәндеріне ие. Бұл құндылықтарды ешкім ешқашан өзгертпейді. Жылжымалы орта векторлары бірінші итерацияда нөлдермен инициализацияланған.

Сынақ кескіндерін өңдеу үшін CNN кескіннің ортасында орналасқан әрбір нүктенің белгі болу немесе болмауы ықтималдығын бере алады. Бұл процедура ықтималдық картасын береді. Нүктенің ықтималдығын оның орталық пикселінің айналасында кездейсоқ айналу нәтижесінде пайда болған әр патчтың ықтималдығын орташа есеппен ^{^P¹^,...,^P^N^} есептеуге болады, мұндағы i - жеке патч үшін есептелген CNN жіктеу ықтималдығы, ал есептеу тиімділігі үшін ықтималдық саны – 5 ке тең.

CNN-де еркіндік дәрежелері көбірек, сондықтан үлкен дисперсия мен аздап ығысуды көрсетеді.

Бұл факт CNN-ді белгілерді анықтау мүмкіндігін асыра бағалауға мәжбүр етеді. Сондықтан тиісті шекті пайдалану керек. Дәлдікті (precision) және еске түсіруді (recall) анықтау:

positive false

positive true

positive P true

_ _

  (4)

negative false

positive true

positive R true

_ _

 

(5) Сонда F1 өлшемі келесідей болады:

R P F PR

 2

(6)

Соңғы ықтималдылықты қайта бағалау үшін қолданылатын шекті мән тексеру мәліметтерінде ең жоғары балл беретін етіп анықталады. Бұл зерттеуде t шекті мәні 0,64-ке тең, онда көрсеткіш максималды болады.

Бағалау өлшемдері

Ұсынылған модельді бағалау үшін әртүрлі өлшемдер қолданылды. Бағалаудың мақсаты скрининг әдісі үшін популяциядан мүмкіндігінше көп жағдайларды анықтау болып табылады.

Сондықтан жалған оң нәтижелер санын көбейту арқылы жалған теріс нәтижелерді азайту керек.

Нәтижесінде үш негізгі көрсеткіш анықталуы керек: шынайы оң нәтижелер жиілігі (TPR), жалған оң нәтижелер жиілігі (FPR) және дәлдік (ACC). Бірінші параметрдің басқаша атауы сезімталдық (SEN) деп аталады және (7) теңдеу түрінде жазылады:

𝑇𝑃𝑅 = 𝑆𝐸𝑁 =^𝑇𝑃

𝑃 (7)

Мұндағы шынайы оң мәндердің саны TP, ал оң даналардың саны P-ға тең.

Екінші мүшені, теңдеу түрінде көрсетілген жалған оң нәтижелердің жиілігін бағалау (8):

FPR FP 

Популяциядағы теріс жағдайлардың жиынтық саны N-ге тең, ал жалған оң нәтижелердің үлесі FP - ге тең, ал шынайы теріс үлгілердің саны N-ге тең. Бұл шынайы теріс нәтижелердің белгілі нақты теріс нәтижелерге қатынасы ретінде жақсы түсіндіріледі. Ерекшелігі SPEC деп аталады, ол (9) теңдеу түрінде берілген:

Вестник Алматинского университета энергетики и связи № 3 (58) 2022

87 N FPR SPEC TN

TNR  1 

Сонымен, дәлдік нақты позитивтер мен шынайы негативтер арасындағы тепе-теңдікті анықтайды. Бұл оң және теріс оқиғалардың саны бірдей болмаған кезде өте пайдалы статистика болуы мүмкін. Бұл (10) теңдеу түрінде көрінеді:

N P

TN ACC TP



  

Зерттеу нәтижелері

Деректер жиынтығы python тілінің scikit-learn кітапханасына енгізілген классификация функциясын қолдану арқылы жіктелді. Деректердің 80% оқытуға, ал 20% тестілеуге қолданылды.

Дәлдік функциялары (accuracy) Adam оңтайландыру алгоритмін қолдану арқылы оңтайландырылды.

Ұсынылған CNN моделі 15 дәуірлік қайталау арқылы тестіленді.

Нейрондық желіні сәтті оқытулар жүргізгеннен кейін оның жұмысын тексеру қажет. Төмендегі 4-суретте CNN конвульсиялық нейрондық желі моделінің оқыту кезеңінің мысалы берілген. Бұл біздің модельдің архитектурасының жүзеге асу кезеңі. Модель архитектурасында жол белгілерін анықтау және тану үшін 8 қабатты конвульсиялық нейрондық желі ұсынылған. Модельдің алғашқы қабатында 30x30, 3 өлшемде, яғни 30x30 өлшемде және түрлі түсті RGB форматтағы сурет алынады.

Келесі қабатта Conv2D ReLU активациялық функциясын қолдана отырып жүзеге асырылады. Үшінші қабатта MaxPool2D бірлестігін қолданылады. MaxPool2D қабаты кеңейтімді, ядро өлшемін, қадамды, кеңейтуді, толтыруды және қайтарылатын индекстерді қамтитын әртүрлі параметрлерді қабылдайды.

Төртінші Conv2D қабатында ReLU активациялық функциясы қолданылады. Бесінші қабат қайта MaxPool2D бірлестігін қолданады. Алтыншы қабатта кірістерді тегістеу үшін Flatten қабаты қолданылады. Келесі қабат – dense қабаты немесе тығыз қабат деп аталады. Бұл алдыңғы қабатпен терең байланысқан қабат, яғни қабат нейрондары оның алдыңғы қабатының әр нейронымен байланысады. Соңғы қабатта алынған ең жоғарғы дәлдікті нәтиженің ықтималдығын 1-ге, ал қате кластардың ықтималдығын 0-ге жақындату үшін шығыс dense қабатында Softmax функциясы қолданылады. Нәтижесінде, танылған жол белгісі алынады.

4-сурет – CNN моделінің оқыту кезеңінен мысал

Matplotlib-деректерді екі өлшемді (2D) графикамен визуализациялауға арналған Python бағдарламалау тіліндегі кітапханасы (3D графикасына да қолдау көрсетіледі). Matplotlib көмегімен біз модельді оқыту және сәйкестендіру дәлдігі мен олардың қателіктерінің кестесі құрылды.

Төменде 5-суретте Matplotlib көмегімен анықталған моделдің дәлдігі бейнеленген. Нәтижеде 14 оқыту дәуірінде алынған модель дәлдігі көрсетілген. Модельдің жіктеу дәлдігі 4 дәуірде 90%-дан асып, 14 дәуірде 95%-ды көрсетеді.

5-сурет – Модельді оқыту және сәйкестендіру дәлдігі

Модельді оқытудағы ең маңызды кезеңдердің бірі жоғалту функциясы. Жоғалту функциясы нейрондық желінің орталығында орналасқан. Ол нақты және қабылданған жауаптар арасындағы қатені есептеу үшін қолданылады (6-сурет).

6-сурет – Модельді оқыту және сәйкестендіру қателігі

Жоғарыдағы суреттерден көрініп тұрғандай, нейрондық желі сәтті оқытылды және жаңа суреттерді өңдеуге дайын.

Төменде 7-суретте осы жүйенің белгілерді тану нәтижесінің мысалы көрсетілген.

Вестник Алматинского университета энергетики и связи № 3 (58) 2022

7-сурет – Модельді оқыту нәтижесінде анықталған жол белгілері

Нәтижелерге сүйене отырып, ең жақсы анықталған категорияда терең оқытуды қолдана отырып, нақты уақыт мезетінде жол белгілерін танудың 95% дәлдігіне қол жеткізілді. Бұл басқа зерттеулермен салыстырғанда дәлдік өлшемі 5,7% -ға жоғары.

Ұсынылып отырған жұмыс нәтижелері өзге авторлардың нәтижелерімен салыстырылды (1- кесте). Салыстыру қолданылған әдіс, деректер жиынтығы және жіктеу дәлдігі нәтижеслерін қарастыра отырып жүргізілді. Соңғы әдебиеттерде ұсынылған әдістер көп жағдайда терең оқытуға негізделеді. Мысалға алар болсақ, CR-CNN, SR-CNN, C-CNN, R-CNN сияқты конволюциялық нейрондық желі негізінде жүзеге асырылған. Біз ұсынған 8 қабатты конволюциялық нейрондық желі соңғы жұмыстармен салыстырғанда жоғарырақ нәтиже көрсетті. Бұл нәтижеге жетуде қолданылған Adam оңтайландыру әдісі мен ұсынылған модель архитектурасының маңызы зор.

1-кесте – Алынған нәтижені салыстыру

Жұмыс Қолданылған әдіс Деректер жинынтығы

Нәтижесі Біздің ұсынған жұмыс 8 қабатты

конволюциялық нейрондық желі

GTSRB 95% жіктеу дәлдігі (ACC) 94% TPR дәлдігі

Li, J., Wang, Z. [27] Viola-Jones GTSDB 87.23% жіктеу дәлдігі Z. Cai and N.

Vasconcelos [28]

CR-CNN COCO 87.4% жіктеу дәлдігі

P. Sun et al. [29] SR-CNN COCO 83.9% жіктеу дәлдігі

W. Hai et al. [30] C-CNN GTSDB 85.4% жіктеу дәлдігі

Z. Zhao et al. [31] R-CNN MS COCO 86.9% жіктеу дәлдігі

J. Cao et al. [32] Faster R-CNN TT100K 91% жіктеу дәлдігі X. Kuang et al. [33] HSV-HOG GTSDB 92.67% жіктеу дәлдігі

90 Қорытынды

Зерттеу барысында қойылған тапсырмалар орындалды. Жол белгілерін анықтау мен танудың жаңа тәсілі ұсынылды. Мәліметтер жинағы көлемін ұлғайтудың шешімі табылды. Желінің өнімділігін арттыру үшін focus loss аймақтық ұсыныстар желісін бақылау үшін қолданылады.

Сонымен қатар, жол белгілерін анықтау үшін 3 конволюциялық және бір толық байланысқан қабат қолданылды, бұл үлкен жол белгілері табылған жағдайда өте пайдалы.

Жұмыстың өзектілігі ретінде терең оқыту көмегімен, яғни нейрондық желілер негізінде CNN конвульсиялық желі моделінің оқытылғандығын атап өткен жөн. Жұмыстың жаңалығы – жиналған жаңа деректер жиынтығын классификациялау әдісі арқылы қолданып, модель дәлдік көрсеткішінің жоғарғы мәнін алуда болып табылады.

Өзге авторлардың жұмыстарында CNN моделі орташа есеппен 90% дәлдікке ие болса, біздің ұсынып отырған желі зерттеу барысында қайта оқытылған CNN моделінің дәлдік көрсеткіші 95%-ға дейін артты. Сонымен қатар, тану кезеңінде дәлдікті арттыру үшін жіктеу желісінде тығыз блоктар қолданылады. Ұсынылған тәсіл жол белгілерінің әртүрлі санаттарын анықтауда және тануда өте жақсы жұмыс істейді. Жол белгілерін анықтау жүйесін құру жол қозғалысындағы адам өмірінің қауіпсіздігін арттыруға үлкен үлесін тигізеді.

Нәтижелерге сүйене отырып, ең жақсы анықталған категорияда терең оқытудың көмегімен нақты уақыт мезетінде жол белгілерін танудың 95% дәлдігіне қол жеткізілді. Ұсынылып отырған зерттеу жұмысы жол-көлік оқиғаларының санының азаюына үлкен көмегін тигізе алады.

ӘДЕБИЕТТЕР ТІЗІМІ/ LIST OF REFERENCES

[1] Russian-Kazakh legal Explanatory Dictionary-reference book (2008). Almaty: Zheti zhargy.

[2] Number of road accidents (2020). Available at:

https://stat.gov.kz/api/getFile/?docId=ESTAT419824

[3] State of accounting for the causes of road accidents in 2020 (2020). Available at:

https://stat.gov.kz/api/getFile/?docId=ESTAT101250

[4] Cox, D., Biel, A. and Hoque, F., “Experimental Design of Artificial Neural-Network Solutions for Traffic Sign Recognition”, In Proceedings of SAI Intelligent Systems Conference, pp. 362-372, 2021.

[5] Dewi, C., Chen, R. C., Liu, Y. T. and Tai, S. K., “Synthetic Data generation using DCGAN for improved traffic sign recognition”, Neural Computing and Applications, 2021.

[6] Atif, M., Zoppi, T., Gharib, M. and Bondavalli, A., “Towards enhancing traffic sign recognition through sliding windows”, Sensors, 22(7), 2683, 2022.

[7] Hu, S. X., Li, D., Stühmer, J., Kim, M. and Hospedales, T. M., “Pushing the Limits of Simple Pipelines for Few-Shot Learning: External Data and Fine-Tuning Make a Difference”, In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 9068-9077, 2022.

[8] Modi, Y., Teli, R., Mehta, A., Shah, K. and Shah, M., “A comprehensive review on intelligent traffic management using machine learning algorithms”, Innovative Infrastructure Solutions, 7(1), 1-14, 2022.

[9] Çetinkaya, Acarman, T., “A Traffic Sign Detection System Linking Hypothesis Tests and Deep Learning Networks”, International Journal of Pattern Recognition and Artificial Intelligence, 36(03), 2255007, 2022.

[10] A. Krizhevsky, I. Sutskever, G.E., “Hinton Imagenet classification with deep convolutional neural networks”, Advances in Neural Information Processing Systems, 2012.

[11] K. Simonyan, A. Zisserman, “Very deep convolutional networks for large-scale image recognition”, arXiv:1409.1556, 2014.

[12] C. Szegedy, et al., “Going deeper with convolutions”, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015.

[13] J. Qiu, J. Wang, S. Yao, K. Guo, B. Li, E. Zhou, J. Yu, T. Tang, et al., “Going deeper with embedded FPGA platform for convolutional neural network”, ACM International Symposium on FPGA, 2016.

[14] Bouti A., Mahraz M. A., Riffi J., Tairi H., “A robust system for road sign detection and classification using LeNet architecture based on convolutional neural network”, SOFT COMPUTING, vol.

24, no. 9, pp. 6721-6733, 2022, doi: 10.1007/s00500-019-04307-6.

Dalam dokumen Untitled (Halaman 83-94)