УДК 004.42.056.53
СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ЗНАНИЙ
Канафин А.
Костанайский Государственный Университет им. А. Байтурсынова, Костанай
Научный руководитель - Махамбетова Г. И. ст. преподаватель кафедры программного обеспечения
В рамках исследований в области технической имитации интеллекта большое значение придаётся разработке систем управления базами знаний (БЗ), как одного из важнейших инструментальных средств новой информационной технологии. К основным функциям управлениям БЗ относятся:
поддержка пользовательского интерфейса;
пополнение и редактирование БЗ;
логический вывод;
поддержка целостности и непротиворечивости знаний;
реорганизации БЗ.
Отметим, что системы управления БЗ (СУБЗ) могут быть встроены в информационно- управляющую систему, например, в системы управления внешней или массовой памятью ЭВМ с целью их интеллектуализации [1].
БЗ и соответственно СУБЗ можно классифицировать по ряду признаков, основным из которых является модель представления знаний. В настоящее время используются следующие основные модели представления знаний: логика предикатов, системы продукций, семантические сети, фреймы, причем в зависимости от выбранной модели существенно различается не только представление, но и алгоритмы обработки знаний [2].
Общепринятые программные реализации СУБЗ на универсальных ЭВМ оказываются громоздкими, дорогими и не обеспечивают необходимой производительности в условиях непрерывно возрастающих требований. Для удовлетворения этих требований необходимо использование средств внутренней интеллектуализации ЭВМ, прежде всего, средств аппаратной поддержки программного обеспечения, что приводит к появлению машин баз данных и знаний, ЛИСП-, ПРОЛОГ-машин, лингвистических процессоров [3].
В данной статье представлена разработка технологии проектирования высокопроизводительных продукционных систем (ПС), получивших в настоящее время наибольшее распространение в качестве средств внутренней интеллектуализации ЭВМ.
Архитектура ПС строится с учетом выбранной стратегии управления логическим выводом, характерной для продукционной модели представления знаний, формализующей их в виде правил "ЕСЛИ условие, ТО действие". БЗ продукционной системы с учётом тенденции к увеличению объёмов хранимой информации обычно размещается в массовых ЗУ на оптических или магнитных дисках. Актуальность решения задачи создания ПС параллельной структуры подтверждается исследованиями, которые показывают, что программная реализация ПС малоэффективна, вследствие существенной доли операций поиска по образцу в общем времени работы системы, достигающей в отдельных случаях 90%. Особую актуальность при проектировании ПС с аппаратной поддержкой функций управления БЗ приобретают вопросы, связанные с разработкой и исследованием стратегий отображения систем продукций на структуру мультипроцессорных систем [4].
В данной работе предлагается реализация ПС в виде транспьютерной сети (ТС) с использованием параллельно - конвейерных принципов обработки информации.
Транспьютеры, представляющие собой однокристальные микропроцессорные системы, имеющие развитую структуру, включающую, в частности, блок реализации операций над
числами с плавающей точкой и четыре специализированных порта ввода - вывода, причём число выводов транспьютера можно увеличить путем использования специального связного адаптера, считаются перспективной элементной базой для построения параллельных архитектур на основе СБИС [5]. Несмотря на ориентацию транспьютеров на построение систем параллельной обработки и лёгкость их физического соединения, существует ряд проблем, связанных, прежде всего, с разработкой программного обеспечения ТС, предназначенных для решения априори определенного класса задач.
Используемый в настоящее время для программирования параллельных алгоритмов в ТС язык ОККАМ является низкоуровневым, чем обусловлен неприемлемо высокий уровень ошибок при разработке и отладке программного обеспечения [6]. Указанный недостаток стал причиной создания языков программирования ТС высокого уровня, облегчающих запись параллельных алгоритмов и получение на её основе правильных ОККАМ - программ, имеющих, однако, узкую область применения, как например, язык LATIN.
Для спецификации логической структуры транспьютерных вычислительных систем предлагается использовать диаграммы потоков данных (ДПД) специального вида, что является результатом развития разрабатываемого автором функционального подхода к проектированию информационного - управляющих систем на основе технологии СБИС [5]. ДПД, применяемые как для спецификации требований, так и в качестве модели вычислений, отличает высокая наглядность и возможность совмещения разных уровней абстракции при описании системы и её компонентов. Кроме того, следует отметить отсутствие семантического разрыва между моделью вычислений в виде ДПД и архитектурой ТС, в которых взаимодействие процессоров осуществляется путём передачи сообщений между узлами сети. Основными элементами предлагаемых ДПД являются: T- преобразователь данных; S - память данных, в том числе на внешних носителях информации; F - распределитель потоков данных; J - соединитель потоков данных; Q - планировщик очереди заявок на обслуживание; E - внешний объект, в том числе, возможно другая ТС. Потоки данных, циркулирующие между элементами ДПД, обозначаются одинарной или двойной линиями, причем для описания динамики протекающих в сети процессов в ДПД могут использоваться потоки управления, обозначаемые штриховыми одно- и двунаправленными линиями.
Технологическая схема процесса проектирования транспьютерных вычислительных систем на основе ДПД включает следующие виды работ:
1) иерархическую спецификацию сети в виде ДПД с использованием контекстно - свободной графовой грамматики с заменой узлов [6];
2) преобразование спецификаций в функциональную структуру сети приемлемого уровня абстракции с использованием атрибутной управляемой графовой грамматики [6];
3) оценку производительности сети путем имитационного моделирования с использования с использованием конечного автомата - распознователя, функционирование которого аналогично работе детерминированной нестирающей машины Тьюринга с оракульными лентами;
4) преобразование функциональной структуры ТС в сетевую модель с использованием расширенных сетей Петри;
5) верификацию ТС с помощью исследования полученной модели (построение графа достижимых состояний);
6) разбиение сетевой модели на фрагменты, каждый из которых является описанием последовательного процесса;
7) разбиение полученного множества последовательных процессов на подмножества, каждое из которых реализуется на отдельном траснпьютере, например, с использованием отношения неортогональности функциональных модулей (ФМ) ДПД, определяющего классы эквивалентности, причем процессы, относящиеся к одному классу, целесообразно реализовать на общем оборудовании [7];
8) генерацию топологии сети;
9) генерацию ОККАМ - программы с использованием выделенных составных параллельных и последовательных процессов, протекающих в ТС, и топологии сети.
Рассмотрим пример спецификации ПС параллельной структуры с помощью ДПД. В представленной системе реализуется стратегия прямого логического вывода с возвратами, характерная для продукционной модели представления знаний. Функционирование системы в общем виде представляется следующем образом. В блоке Т1 на основании содержимого базы S1 - определяется множество продукций - кандидатов на активацию, которые помещаются в очередь Q1. Распределитель F1 последовательно выбирает из очереди Q1 продукции и распределяет их по свободным в данный момент элементам, выполняющим вычисление анцедентов и составляющим блок Т2.
В системе реализуется параллельная обработка анцендентов и косеквентов отдельных продукций. Конвейеризация достигается за счет разбиения обработки продукции на два этапа: вычисление анцендента и выполнение консеквента. Для эффективной работы ПС необходимо использование в системе управления массовой памятью буферизации данных, при этом в буферную память будут заблаговременно считываться фрагменты интеллектуального банка данных с учетом априори определенного отношения зависимости продукционных правил. Следует также отметить, что для уменьшения объема передаваемых данных в системе целесообразно использование номеров продукций и состояний, а не самих продукций и состояний. Поскольку в ПС реализован логический вывод с возвратами, передаваемая между блоками системы информация наряду с номером продукции включает и номер состояния.
Литература
1. Поспелов Г.С. Искусственный интеллект - основа новой информационной технологии. - М.: Наука, 1988. - 280с.
2. Представление и использование знаний / Под редакцией Х. Уэно, М. Исидзука. - М.
Мир, 1989. - 220с.
3. ЭВМ пятого поколения: концепции, проблемы, перспективы / Под редакцией Т.
Мото-ока. - М.: Финансы и статистика, 1984. -110с.
4. Ва Б.У., Лоурай М.Б., Ли Г. ЭВМ для обработки символьной информации. ТИИЭР.
- 1989. - Т.77, №4. - С.5-40
5. Язык ПРОЛОГ в пятом поколении ЭВМ: Сб. статей. - М. Мир, 1988. - 501с.
6. Дубинин В.Н., Зверев С.Л. Проектирование специализированных транспьютерных вычислительных систем на основе диаграмм потоков данных. - Харьков, 1990. - С. 141- 146.
7. Джоунз Г. Программирование на языке ОККАМ: Пер. с англ. - М.: Мир, 1989. - 208с.