БУСТИНГ БИОИНСПИРИРОВАННЫХ АЛГОРИТМОВ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ИНТЕГРАЦИИ ДАННЫХ

  • Ю. А. Кравченко Южный Федеральный Университет
  • Д. В. Балабанов Южный Федеральный Университет
  • А. В. Ковтун Южный Федеральный Университет
Ключевые слова: Интеграция данных, семантическая близость, онтологии, концепты, неоднородные данные, бустинг, генетические и биоинспирированные алгоритмы

Аннотация

В настоящее время интеграция данных является актуальной проблемой. Интеграция
данных может быть представлена на различных уровнях. Современные методы решения
задач интеграции не могут решать семантическую проблему, к тому же они слишком
сложны. На основе исследований методов, используемых на данный момент, можно сде-
лать вывод, что самыми часто используемыми методами, для подходов к решению задачи
неоднородности на семантическом уровне, используются такие эвристики, которые при-
меняют результирующую онтологию. В большинстве случаев, данные информационных
систем представлены как объекты информации, которые в свою очередь формируют не-
кую предметную область или ее часть, в тоже время к каждой части (области) относит-
ся ее собственная онтология. Исходя из этого, при решении задачи семантической неодно-
родности данных нужно привести определения предметных областей и взаимодействия их
объектов. Таким образом можно построить взаимодействие информационных систем,используя согласованную семантику предметной области. Рассматривается семантиче-
ский уровень, на котором данные анализируются с точки зрения их семантических
свойств, а также в аспекте единой онтологии. Для решения данного класса задач предла-
гается использовать эволюционные и биоинспирированные алгоритмы. Предлагается ис-
пользовать бустинг, идея которого состоит в последовательном применении нескольких
алгоритмов. В основе процесса интеграции информационных систем лежит задача оценки
семантической близости объектов неоднородных онтологий, основанной на гибридной
мере подобия, включающей в себя атрибутивную, таксономическую и реляционную. Пред-
ложена структура бустинга биоинспирированных алгоритмов для поиска концептов и
оценки их семантической близости. Предлагается использовать динамическую вероят-
ность выбора алгоритмов на основе полученных результатов.

Литература

1. Бажанова А.И. Мартыненко Т.В. Исследование применения онтологических моделей
для семантического поиска // Матер. II научно-практической конференции студентов,
аспирантов и молодых ученых. – Донецк: ДонНТУ, 2011. – С. 244−248.
2. Вагин В.Н., Михайлов И.С. Разработка метода интеграции информационных систем на
основе метамоделирования и онтологии предметной области // Программные продукты
и системы. – 2008. – С. 22-26.
3. Курейчик В.В., Курейчик Вл.Вл. Биоиспирированный поиск при проектировании и
управлении // Известия ЮФУ. Технические науки. – 2012. – № 11 (136). – С. 178-183.
4. Родзин С.И., Курейчик В.В. Теоретические вопросы и современные проблемы развития
когнитивных биоинспирированных алгоритмов оптимизации // Кибернетика и програм-
мирование. – 2017. – № 3. – С. 51-79.
5. Тузовский А.Ф. Работа с онтологиями в системе управления знаниями организации // Сб.
тезисов докладов второй международной конференция по когнитивной науке CogSci-
2006. – СПб.: СПбГУ, 2006. – Т. 2. – C. 581-583.
6. Батоврин В.К., Когаловский М.Р., Королев А.С., Петров А.Б. Разработка понятийной
схемы (онтологии) для обеспечения единой семантики в среде открытой системы инте-
грации разнородных данных // Телематика-2006: Матер. Всероссийской научно-
методической конференции. – СПб.: Изд-во СПбГУ, 2006. – С. 90-91.
7. Тузовский, А.Ф., Козлов С.В. Работа с онтологиями в системе управления знаниями ор-
ганизации // Сб. тезисов докладов второй международной конференция по когнитивной
науке CogSci-2006 – Санкт-Петербург, 9−13 июня 2006. – СПб.: СПбГУ, 2006. – Т. 2.
– C. 581-583.
8. Тузовский А.Ф. Онтолого-семантические модели в корпоративных системах управления
знаниями: дисс. … д-ра техн. наук. – Томск: Томский политехнический университет,
2007.
9. Скворцов Н.А. Вопросы согласования неоднородных онтологических моделей и онтологи-
ческих контекстов // Онтологическое моделирование. – M.: ИПИ РАН, 2008. – С. 149-166.
10. Курейчик В.В., Курейчик В.М., Сороколетов П.В. Анализ и обзор моделей эволюции //
Известия РАН. Теория и системы управления. – 2007. – № 5. – С. 114-126.
11. Родзин С.И., Курейчик В.В. Состояние, проблемы и перспективы развития биоэвристик
// Программные системы и вычислительные методы. – 2016. – № 2. – С. 158-172.
12. Зайцев А.А., Курейчик В.В., Полупанов А.А. Обзор эволюционных методов оптимизации
на основе роевого интеллекта // Известия ЮФУ. Технические науки. – 2010. – № 12
(113). –С. 7-12.
13. Mayr A., Binder H., Gefeller O., Schmid M. The Evolution of Boosting Algorithms –
From Machine Learning to Statistical Modelling // Methods Inf. Med. – 2014. – Vol. 53.
– P. 419-427.
14. Freund Y. and Schapire R. Experiments with a new boosting algorithm // In Thirteenth International
Conference on Machine Learning. Bari, Italy, 1996. – P. 148-156.
15. Freund Y. and Schapire R. A decision-theoretic generali zation of on-line learning and an application
to boosting // Journal of Computer and System Sciences. – 1997. – Vol. 55 (1).
– P. 119-139.
16. Курейчик В.М., Курейчик В.В., Родзин С.И. Модели параллелизма эволюционных вы-
числений // Вестник Ростовского государственного университета путей сообщения.
– 2011. – № 3 (43). – С. 93-97.
17. Noy N., Musen M. The PROMPT Suite: Interactive Tools For Ontology Merging And Mapping.
– Stanford Medical Informatics, Stanford University, 2003.
18. Ehrig, Marc and Staab, Steffen QOM – Quick Ontology Mapping. in S.A. McIlraith et al.
(Eds.): ISWC 2004, LNCS 3298. – 2004. – Р. 683-697.
19. Курейчик В.М., Курейчик В.В., Родзин С.И., Гладков Л.А. Основы теории эволюционных
вычислений. – Ростов-на-Дону: ЮФУ, 2010. – 222 c.
20. Курейчик В.В., Бова В.В., Курейчик Вл.Вл. Комбинированный поиск при проектировании
// Образовательные ресурсы и технологии. – 2014. – № 2 (5). – С. 90-94.
Опубликован
2019-11-12
Выпуск
Раздел
Раздел II. Анализ данных и управление знаниями