УДК 007:001:33(075.8)
СУЛЕЙМЕНОВ Т., КАНТУРЕЕВА М.А., БОЛЫСБЕК М.А., ЗАКИРОВА А.Б.
Евразийский национальный университет им Л. Н. Гумилева, Астана, Казахстан ФОРМАЛИЗАЦИЯ ОЦЕНКИ СЕМАНТИКИ ЗНАНИЙ
Существующая база математического и программного обеспечения для систем управления создала предпосылки для широкого внедрения средств вычислительной техники на верхние уровни иерархии управления и решения сложных проблем связанны с организационным управлением. К числу таких проблем относятся и исследования по информационным семантическим системам, т.е. системам перерабатывающим осмысленную информацию для достижения целей. Решение указанной проблемы требует привлечения методологии диалектического материализма, взаимодействия теории познания, коммуникации, психологии, лингвистики, знаковых систем, прикладных дисциплин математики и других наук. Актуальность этой проблемы обусловлена как необходимостью решения задач связанны с созданием базы знаний. Для информационных систем работающих семантическими информациями, само создание базы знаний тесно связано представлением знаний для обработки, хранения и передачи. Чтобы решит эту задачу, сперва мы должны формально описать знания. Или, алгоритмически оценить семантику знаний.
Объект – первичное и неопределяемое строгое понятие. Оно всегда противопоставляется другому, двойственному ему понятию – субъект. Субъект обладает способностью воспринимать, преобразовывать и использовать информацию об объекте. Эта способность называется интеллектом [1].
Всякий объект обладает определенными свойствами, проявляющими при взаимодействии с другими объектами. Всякое свойство объекта проявляется в рамках того или иного контекста [2]. Такое проявление фиксируется датчиками как сведение об объекте.
Причем всякое сведение описывает два множества объектов. Одно опорное множество Х, для те х объектов которые являются допустимыми для датчика. Другое – множество , для тех объектов из Х, для которых датчиком фиксируются вполне определенные свойства. Тем самым, второе множество есть часть первого, т.е. подмножество, Õ.
Далее, всякое сведение должно иметь указатель (имя) объекта, о котором сообщается в данном сведении. Обозначим через õ тот объект, который указан в сведении. Тогда õ является элементом как опорного множества Х, так и подмножества , т.е. õÕ, õ. В случае табличного представления
õ1,õ2,....,õn
Õ будет выражать строку таблицы. Таким образом указателем объекта будет строка таблицы.Семантика всякого сведения предполагает наличие следующих четырех величин:
опорного множества Х объектов, семантического указателя õ одного из объектов Х, т.е. õ
Õ, подмножества объектов из Х, т.е. Õ и контекст p (семантическая достоверность), которая характеризует выполнение главного условия õ. Здесь информационное представление объекта x [3]. В связи с этим всякое сведение об объекте
Õ
õ будем обозначать триадой
p (õ) (1)Наряду с отдельными сведениями вида (1) об объекте, имеют дело с наборами (семействами) сведений об одном объекте. Такие наборы называют данными об объекте.
ð
1 õ; ð
2 õ;...
ð õ (2)где
1;
2;...
.Если эти данные будут рассматриваться в определенном контексте p, то
ð õ превращается в информацию. В этом случае p будет интерпретироваться как набор атрибутов, а
ð õ как денотаты. Конечно это в реляционном контексте. [4]Определение 1. Непустое семейство элементарных сведений о объекте x из Х назовем информацией о объекте õÕ, и обозначим через Jp
x в заданном контексте Р; если выполняются три условия:1) из
ð õ Jð(õ)следует, что непустое множество, т.е.
ð
õ Ø;2) из
ð õ Jð
õ следует, что любое общее сведение
p ~
õ также принадлежит
xJp , т.е. для любого подмножества
ð~
ðв Х будет ~
( ) х х Jр ;
3) из 1
õ,2 õ Jð
õ следует что
ð1 õ &-
ð2 õ0 Jð
õ .Если задан контекст ð
ð1,ð2,...,ðn
, тогда семантика информации Jp
x выглядит как:
õ
ð õ ð õ ð õ
Jð 1 1 , 2 2 ,..., n n (3) Из (3) видно что, если контекст изменится то семантика той же информации будет интерпретироваться по другому.
Утверждение 1. Всякий
p x однозначно определяет семантику информации Jp
x при заданном p.Доказательство. Пусть кроме Jp
x имеется другая информация J~ð
õ с теми же данными
p x . Рассмотрим любое сведение
ð~ õ в J~ð
õ. Тогда по определению ∆(x) существует менее общее сведение
õ из
õ, ~. Но
õ JÐ
õ и, следовательно, сведение
õ принадлежит Jð
õ,. Тогда по определению информации любое более общее сведение, в частности
ð~ õ , принадлежит Jð
õ . Тем самым доказано, что J~ð
õявляется подсемейством Jð
õ . Аналогично доказывается, что Jð(õ)является подсемейством)
~ ( õ
J ð . Следовательно,
~ ( ) õ J õJð ð . ■
В предлагаемой концепции контекст играет роль информационной единицы при оценке семантики информации и знаний. Если объект õ представляется в виде (р)
õ Jð(õ) , т.е. в виде информационной совокупности, то для оценки семантики этой совокупности введем понятие информационной единицы (èå). В базе данных такой единицей является атрибуты, в медицине симптомы и т.д. По своей диалектической сути èå – это контекст где интерпретируется атрибуты
p x , т.е. ð
èåi x, p
uei обозначим их как p' [4].Определение 2. Элементарным знанием будем называть информацию
ð õ Jð
õзаданную в uei и имеющую следующие свойства:
- всякое подмножество
ðuei ~ множества
ð
õ J uei
õi
p
ue принадлежит Jpuei
x ; - пересечение конечного числа множеств из Jpuei
x принадлежит Jpuei
x- пустое множество Ø не принадлежит Jpuei
x ; - ð ðuei Элементарную знанию обозначимÔ uei
x
если p puei (4)Утверждение 2. Всякая конечная
ð õ информация Jð
õ эквивалентна элементарному знанию Ô uei
x
если p pueiДоказательство. Пусть (x)
1
x;...;n(x)
в контексте p. Тогда их конъюнкция
x
x n
x 1 &...& также принадлежит Jð
õ . По определению Jð
õ для
õ существует i
x из
x , менее общее, чем 0
x , т.е. i 0.Следовательно, среди сведений данных
õ есть сведение i
x 0
x , а остальные сведения более общие чем 0
x0 . Поэтому
x 0
x дает ту же информацию Jð
õ ,что и Jpuei
x значитp puei. Из этого следует, что Jpuei
x является элементарным знанием. ■Определение 3. Носителем элементарного знания Ô uei объекте из Х назовем всякое подсемейство Jpuei
x информации, входящих в состав
p x , что для любого сведения
õ~ из Jp
x существует менее общее сведение
x из
õ , т.е. (p) (
~), в информационном единице uei.Утверждение 3 Если знание Ô uei имеет одиночный носитель Jp
x в uei, то этот носитель определяется однозначно.Доказательство. Приведем от противного. Предположим, что имеются два одинаковых носителя Jp
x и J~p
xдля знаний Ô uei
x
так как J~p
xноситель Ô uei, то J~p
xпринадлежит Ô uei
x
. В свою очередь, по определению носителя Jp
x длялюбой информации из Jp
x , в частности, для ~
õ существует менее общее сведение из носителя, т.е.
ð
~
в uei. Аналогично получается обратное включение
ð
~
, темсамым ~1.■ Обратим особое внимание на предикатную форму записи элементарного знания (4) и ее носителя
Ô uei
p x
Jp'
x uei
p x
Jp
xЗдесь предикатный символ Ô uei
p x
интерпретируется как реализационное отношение свойств õÕ в информационном измерении uei. ∆- как базис Jp
x .Предикатный аргумент интерпретируется как семантический указатель знания о объекте Õ
õ , причем запись (4) означает что для любого Jp
x Ôpuei справедливо xJp
x Из записи (3) можно формально написать семантику элементарного знания.Если определен p puei, тогда семантика элементарного знания Ôuei
p x
выглядит следующим образом:
n
ii
ue p n p
ue p
x J x J x J x
p , ,...,
Ô 1 1 2 2 (5)
Понятно, что два элементарных знания о объекте õÕ uei
p
x
Ô2uei
p'
x
'
1 ,
Ô
будут сравнимы на больше-меньше если одно из знаний uei
p
x
Ô2uei
p'
x
'
1 ,
Ô
мажорует другой (т.е. содержит другой как подмножество). При этом, если
p x
i
p
x
i ue
ue ' 2 '
1 Ô
Ô , то будем говорить, что знание Ô2uei
p'
x
больше знания
p x
uei
'
Ô1 или, что Ô 1uei
x меньше, чем Ô2uei
x и записывать
p x
i
p
x
i ue
ue ' 2 '
1 Ô
Ô . Если для некоторой информации о объекте õ из Х нет знания большей, чем она, то будем ее называть максимальной и обозначать Ômaxuei
p'
x
. Если же для некоторой информации о объекте õ из Х нет знания меньшей, чем она, то будем ее называть минимальной и обозначать Ôminuei
p'
x
. Элементарные знания о разных объектах в одной uei между собой не сравниваются. [4]Теорема. Два элементарных знания Ô 1uei,Ô2uei имеющие одиночные носители
, '
,'
2
1 x J x
J p p сравнимы на большее-меньше тогда и только тогда, когда сравнимы на общность информации J1p'
x ,J2p'
x . Причем, для того чтобы Ô1uei
x Ô2uei
x , необходимо и достаточно, чтобы J1p'
x J2p'
x . Другими словами, среди знаний с одиночными носителями большое знание приносит менее общая информация и только она.Доказательство. Необходимость. Пусть Ô1uei
x Ô2uei
x . Тогда любая информация из Ô 1uei в частности, J1p'
x принадлежит Ô 2uei. Но J2p'
x одиночный носитель Ô 2uei. Следовательно, J2p'
x - менее общая информация, чем J1p'
x , т.е. J2p'
x J1p'
x .Достаточность. Пусть J1p'
x J2p'
x . Тогда информация J1p'
x , как более общее, чем J2p'
x , принадлежит Ô 2uei по определению знание. Следовательно, и любая другая информация из Ô 1uei, как более общее, чем J1p'
x , также принадлежит Ô 2uei. Тем самым имеет место включение Ô 1uei Ô 2uei.Выводы. Формализация оценки семантики знаний, сама по себе является очень сложной задачей. Так, как, одна и та же информация в различных контекстах дает различную семантику. Понятие «данные», «информация» являются основой любого знания, так как именно знание формируется из этих понятий. Без проведения процедуры формирования знаний, будет очень трудно создать БЗ и соответствующую СУБЗ. Поэтому понятие объекта следует рассматривать в информационном пространстве. Только в таком случае появляется возможность формально представлять семантику понятий информации. Если атрибуты свойств объекта будут рассматриваться в более общем контексте то семантика информации нам даст больше информации называемой знанием. Такой подход определения знания дает нам возможность представлять совокупность элементарных знаний в табличной форме [6].
Табличное представление знаний само по себе самостоятельная алгоритмическая задача.
Решение этой задачи помогает создать систему управления базами знаний (СУБЗ) являющейся необходимой частью любой интеллектуальной системы. Онтологическое свойство знаний [7], вытекает именно из семантических свойств информации. Если интерпретировать одну и ту же информацию в разных контекстах, то семантика этой же информации будет другой. Такое свойство информации является предпосылкой появления онтологии знания. Поэтому представление знание через «данные», «информации» имеет принципиальное значение при проектировании БЗ и СУБЗ.
Литература
1. Чечкин А. В. Математическая информатика. – М.: Наука, 1991. – 416 с.
2. Рустамов Н.Т., Темирбеков А.Н., Асабаев О.М. Экспертный подход к созданию продукционной базы знаний // Вестник МКТУ им. Х.А. Яссави. – Туркестан: МКТУ, 2008. -
№1. – С. 92-96.
3. Рустамов Н.Т., Исраилов Р.И., Асабаев О.М., Рустамов Б.К. Информационный метод выявление роли воскулита при мозговом инсульте. Шымкент Труды межд. науч.- прак.
конференций «Казахстан в новом мире и проблемы Национального образования»
посвященной 10-летию университета «Сырдария»., т.3, 2008, с. 371-375.
4. Рустамов Н.Т., Асабаев О.М., Кантуреева М.А. Особенности продукционных знаний.
// Вестник ЕНУ им. Л.Н. Гумилева, № 4 (65), 2008. с. 36-42
5. Темирбеков А.Н., Рустамов Н.Т., Сейдикеримова Д.С., Рустамов Б.К. к вопросу создания базы знаний для хронических заболеваний. // Вестник МКТУ им. Х.А. Яссави, № 1, 2007, с. 15-21
6. Асабаев О.М., Исраилов Р.И., Рустамов Б.К. Продукционная база знаний для мозгового инсульта. Шымкент, Труды международной научно-практической конференции
“Казахстан в новом мире и проблемы национального образования” посвященной 10-летию университета “Сырдария”, т.3, 2008г., с. 342-346.
7. Тузовский А.Ф., Чириков С.В., Ямпольский В.З. Системы управления знаниями (методы и технологии). / Под общей редакцией Ямпольского В.З. – Томск, Изд-во НТЛ, 2005-2006 г.