«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
113
УДК 510.6:512.56:510.53
БАШЕЕВА А.О., САТЕКБАЕВА А.Ж.
Евразийский национальный университет им. Л.Н. Гумилева, Астана, Казахстан ПРИМЕНЕНИЕ СТРУКТУРЫ РЕШЕТКИ В АНАЛИЗЕ ДАННЫХ
Введение
Анализ формальных понятий (АФП) (англ. Formal Concept Analysis, FCA) первоначально рассматривался как ветвь прикладной алгебраической теории решеток (см. [2]). На данный момент это интенсивно развивающаяся область прикладных исследований (см. [6], [7]). Традиционно АФП относят к области концептуальных структур в искусственном интеллекте.
В работе представлено применение теории решеток и методов формального анализа понятий при обработке информации. Средства АФП используется при анализе информации о посещаемости интернет ресурсов, структуры аудиторий сайтов для выделения различных групп среди целевой аудитории и т.д. Данная статья является примером применения этих методов в сфере услуг, а именно анализе отелей города Астаны.
При выборе отеля для проведения конференций, презентаций и даже обычных деловых встреч тет-а-тет вам необходимо учитывать несколько основных моментов:
Наличие конференц-залов и банкетных помещений – вы должны предусмотреть комфортное размещение участников встречи. Возможно, вам необходимо будет специальное оборудование, такое, как проекторы, звуковоспроизводящие устройства.
Расположение отеля в городе – необходимо выбрать такой отель, добираться до которого будет равно удобно со всех аэропортов и вокзалов города.
Наличие в отеле бизнес-центра – важно, чтобы в любой момент вы могли получить или отправить факс, проверить электронную почту, распечатать нужные материалы, сделать переводы денег с карточки и т.д.
Наличие выхода в Интернет – в номерах отеля должны быть специальные розетки для подключения к сети, или же беспроводное подключение.
Наличие СПА-салонов, спортивных залов, бассейнов.
Преимуществом данных методов является наглядное и удобное представление результатов в виде решеток. В отличие от статистических методов, формальный анализ понятий позволяет строить структуры интересов туристов, посетителей и гостей города при выборе гостиниц и отелей в виде решеток формальных понятий, что дает возможность наглядно показать всю структуру интересов.
Данные были взяты из интернет-ресурсов. Для анализа были выбраны 9 отелей г. Астана.
Терминология по теории решеток соответствует [1], по теории анализа формальных понятий [2], [3].
Пример решетки формальных понятий для выбора гостиницы в г. Астане
Критерии выбора гостиницы для каждого туриста свои. Одни путешественники или бизнесмены выбирают гостиницу в зависимости стоимости номера. Для других гостей города основополагающим может быть территориальное расположение гостиницы. Также зачастую ищут гостиницы, например, только возле какой-то достопримечательности города или близлежащих улиц.
Для третьих важен комплекс предоставляемых гостиницей таких услуг, как интернет, кабельное телевидение, развлекательные центры и т.д. Давайте рассмотрим этот вопрос на примере выбора гостиницы в городе Астана.
Для анализа мы выбрали 9 гостиниц. В нашем случае объектами будут гостиницы, а признаками 8 ключевых слов: расположение гостиницы, наличие развлекательных и спа-центров, конференц-залов и т.д.
Как было показано в [2], подмножества произвольного множества, замкнутые относительно заданной на нем операции замыкания образуют полную решетку. Для конечных множеств множество всех понятий формального контекста образует полную решетку со следующими операциями (инфимума) и (супремума):
«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
114
. , , )
, (
, ,
) , (
J j
j J
j j j
J j j
J
j j J
j j j
J j j
B B
B A
A A B
A
Мы использовали программное средство Concept Explorer [4] для построения решеток понятий и адаптированную для вычисления устойчивых понятий и решеток айсбергов реализацию алгоритма AddIntent [7].
Рисунок 1. Решетка формальных понятий для выбора гостиницы
Как читается эта решетка? Каждая вершина решетки – формальное понятие. Рядом с понятием пишутся объекты, которых нет в менее общих понятиях (находящихся под данным понятием), и признаки, которых нет в более общих понятиях. Тогда объем формального понятия – все объекты, написанные напротив данного понятия и всех понятий, менее общих, чем оно. Содержание – признаки, написанные напротив данного понятия и более общих понятий.
Находятся такие формальные понятия алгоритмом «замыканий по одному». Функция начинает работать с самого общего формального понятия, которое содержит все объекты и чаще всего ни одного признака. Затем находятся все остальные понятия рекурсивным добавлением признаков.
Но использовать всю решетку формальных понятий не всегда удобно из-за ее громоздкости.
Количество формальных понятий экспоненциально зависит от размера матрицы.
Когда решетка громоздкая, многие формальные понятия не несут практически никакой информации. Поэтому рационально пренебречь малозначимыми формальными понятиями для получения более простой решетки.
Если на значениях многозначного признака наблюдается порядок, который желательно учесть, то можно использовать порядковую шкалу. Рассмотрим в качестве примера порядковую шкалу для определения варьируемости цен. Благодаря такой шкале гостиницы могут быть упорядочены по уровню цен.
Решетка, построенная по данному контексту, будет выглядеть следующим образом. Получаем вполне читабельную и удобную для анализа решетку:
«Қоғамды ақпараттандыру» III Халықаралық ғылыми-практикалық конференция
115
Рисунок 2. Решетка формальных понятий для определения цен по гостиницам
Выводы
В данной работе мы продемонстрировали применение методов формального анализа понятий к данным, полученным по интернет-ресурсам по городу Астана. В качестве результата получена решетка выбора гостиницы по разным признакам и ценам. Наглядное представление обширных данных может помочь туристу или гостю столицы выбрать гостиницу.
В отличие от статистических методов, формальный анализ понятий позволяет строить структуры интересов туристов, посетителей и гостей города при выборе гостиниц и отелей в виде решеток формальных понятий, что дает возможность наглядно показать всю структуру интересов.
Ввиду ограниченного объема статьи мы описали только часть результатов, значительная доля которых является интерпретацией полученных диаграмм порядка.
Литература
1. Ganter B., Wille R. Formal Concept Analysis// Mathematical Foundations. – Berlin: Springer, 1999.
2. Кедров С.А., Кузнецов С.О. Исследование групп пользователей Интернет-ресурсами методами анализа формальных понятий и разработки данных (Data Mining)//Бизнес-информатика. – 2007. – №1. – С.45-51.
3. Kuznetsov S.O., Ignatov D.I. Concept Stability for Constructing Taxonomies of Web-site Users//Proceedings Satellite Workshop "Social Network Analysis and Conceptual Structures: Exploring Opportunities" at the 5th International Conference Formal Concept Analysis (ICFCA'07, Clermont-Ferrand, France). – 2007. – P.19-24.
4. Евтушенко С.А., Система анализа данных «Concept Explorer»// Труды 7-й Национальной конференции по искусственному интеллекту. – 2000. – С.127-134.
5. Van der Merwe F.J., Obiedkov S., Kouri D.G. AddIntent: A New Incremental Lattice Construction Algorithm, Concept Lattices// Proceedings of the 2nd International Conference on Formal Concept Analysis, Sydney, Australia, Lecture Notes in Artificial Intelligence. – 2004. – Vol. 2961. – P.372- 385.
6. Belohlavek R., Konecny J. Scaling, Granulation, and Fuzzy Attributes in Formal Concept Analysis// The IEEE International Conference on Fuzzy Systems (London, UK, July 23-26, 2007). – P.918- 923.
7. Kuznetsov S.O. On Stability of a Formal Concept// In SanJuan, E., ed.: JIM, Metz, France. – 2003.