БИОИНСПИРИРОВАННЫЙ АЛГОРИТМ ПРИОБРЕТЕНИЯ НОВЫХ ЗНАНИЙ НА ОСНОВЕ КЛАССИФИКАЦИИ ИНФОРМАЦИОННЫХ РЕСУРСОВ

  • Ю.А. Кравченко Южный федеральный университет
  • И.О. Курситыс
Ключевые слова: Классификация, биоинспирированный алгоритм, светлячковый алгоритм, бэггинг, онтологии, семантическая близость.

Аннотация

Статья посвящена решению задачи приобретения новых знаний, выявления новых закономерностей на основе классификации и последующей интеграции информационных ресурсов с целью повышения эффективности информационных процессов. Актуальность задачи обоснована значительным ростом генерируемой, передаваемой и обрабатываемой информации в сферах науки и бизнеса, и их влиянием на развитие общества в целом. В статье рассмотрены основные проблемы эффективного использования информационных ресурсов и обработки информации для выявления направления решения проблемы. Проанализированы аспекты интеграции информации в информационных системах и современное состояние исследований на тему решения задачи классификации и существующие алгоритмы: пчелиного роя, муравьиной колонии, иммунной системы, роя частиц и т. д.

Предложено решать задачу классификации информационных ресурсов для более эффективной их интеграции. В качестве информационных ресурсов в данной статье используются их онтологические модели. В статье приводится абстрактная модель решения задачи классификации информационных ресурсов на основе представления интеграции как отображения онтологий. Предложено два критерия для классификации в соответствии с семантической близостью онтологий: критерий эквивалентности и критерий иерархичности. Приведена постановка задачи классификации и целевые функции. Для решения задачи классификации по двум критериям разработана двухуровневая архитектура композиции (бэггинга) биоинспирированных алгоритмов. Решения задачи проводится с параллельным использованием нескольких алгоритмов. Для работы в архитектуре бэггинга разработан биоинспирированный алгоритм, основанный на модели поведения светлячков в природе. В статье приведены схемы и правила кодирования решений в светлячковом алгоритме на двух уровнях архитектуры бэггинга. Для оценки эффективности предложенного подхода разработан программный продукт и проведены эксперименты, основанные на разном количестве объектов информационных ресурсов. Критерием эффективности предложенного подхода является степень семантической близости концептов в онтологиях, классифицированных как эквивалентные и подобные. Исследования проводились в сравнении с жадным алгоритмом, работающим напрямую с разработанными правилами решения. Эксперименты показали, что предложенный алгоритм дает эффективное решение с полиномиальной временной сложностью O(tn2).

Литература

1. F. Almeida and C. Calistru, “The main challenges and issues of big data management,” International Journal of Research Studies in Computing, vol. 2(1), 2013.
2. V. Kureychik and A. Semenova, “Combined method for integration of heterogeneous ontology models for big data processing and analysis”, Advances in Intelligent Systems and Computing, vo. 573, 2017, pp. 302-311.
3. M. Norshidah, M. Batiah, M. Suraya, H. Hanif, and M. A. Hafizuddin, “Information System Integration: A Review of Literature and a Case Analysis,” Mathematics and Computers in Contemporary Science. World Scientific and Engineering Academy and Society, 2013, pp. 68-77.
4. M. Chromiak and K. Stencel, “A data model for heterogeneous data integration architecture,” Communications in Computer and Information Science, vol. 424, 2014, 547-556.
5. M.A.M. Shukran, Y.Y. Chung, W.C. Yeh, N. Wahid, and A.M.A. Zaidi, “Artificial Bee Colony based Data Mining Algorithms for Classification Tasks,” Mod. Appl. Sci, vol. 5, 2011, 217–231.
6. D. Martens, M. De Backer, R. Haesen, J. Vanthienen, M. Snoeck and B. Baesens, "Classification With Ant Colony Optimization," in IEEE Transactions on Evolutionary Computation, vol. 11, no. 5, 2007, pp. 651-665.
7. M. Karnan, K. Thangavel, and P. Ezhilarasu, “Ant Colony Optimization and a New Particle Swarm Optimization algorithm for Classification of Microcalcifications in Mammograms,” 16th International Conference on Advanced Computing and Communication, 2008.
8. I.D. Falco, A. D. Cioppa, and E. Tarantino, "Evaluation of particle swarm optimization effectiveness in classification," LNAI3849, 2006, pp: 164- 171.
9. Dr. Chandrika.J, Dr.B.Ramesh, Dr.K.R. Ananda kumar, and R.D. Cunha “Genetic Algorithm Based Hybrid Approach for Clustering Time Series Financial Data,” CSE, 2014, pp. 39-52.
10. O.S. Soliman and A.Adly, "Bio-inspired algorithm for classification association rules," 8th International Conference on Informatics and Systems (INFOS), Cairo, 2012, pp. 154-160.
11. E. Saraç and S. A. Özel, "Web page classification using firefly optimization," 2013 IEEE INISTA, Albena, 2013, pp. 1-5.
12. V. Bova, D. Zaporozhets, and V. Kureichik, “Integration and processing of problem-oriented knowledge based on evolutionary procedures,” Advances in Intelligent Systems and Computing, vol. 450, 2016, pp. 239-249.
13. A.V. Semenova and V.M. Kureichik, “Ensemble of classifiers for ontology enrichment”, Journal of Physics: Conference Series, vol. 1015, issue 3, 2018, article id. 032123.
14. V.M. Kureychik, “Overview and problem state of ontology models development,” 9th International Conference on Application of Information and Communication Technologies, AICT 2015 - Proceedings 9, 2015,pp. 558-564.
15. A. Semenova and V. Kureychik, “Application of swarm intelligence for domain ontology alignment,” Proceedings of the First International Scientific Conference “Intelligent Information Technologies for Industry” (IITI’16): Volume 1 , 2016, pp.261-270.
16. V. Bova, V. Kureichik and D. Zaruba, "Heuristic approach to model of corporate knowledge construction in information and analytical systems," 2016 IEEE 10th International Conference on Application of Information and Communication Technologies (AICT), Baku, 2016, pp. 1-5.
17. V. Kureichik, D. Zaporozhets, and D. Zaruba, “Generation of bioinspired search procedures for optimization problems,” Application of Information and Communication Technologies, AICT 2016 - Conference Proceedings, vol. 10, 2016.
18. A. K. Kar “Bio inspired computing - A review of algorithms and scope of applications,” Expert Systems with Applications, vol. 59, 2016, pp. 20-32
19. D. Zaporozhets, D. Zaruba, and N. Kulieva, “Parallel approach for bioinspired algorithms,” Journal of Physics: Conference Series Ser. “International Conference Information Technologies in Business and Industry 2018 - Enterprise Information Systems”, 2018.
20. I. Fister, I. Fister Jr, X.S. Yang and J. Brest, “A comprehensive review of firefly algorithms,” Swarm and Evolutionary Computation, Elsevier 13, 2013, pp. 34–46.
21. I. Fister, I. Fister Jr, J. Brest and X.S. Yang, “Memetic firefly algorithm for combinatorial optimization,” Bio Inspired Optimisation Methods and Their Applications, vol. 2, 2012, pp. 75–86.
22. S.K. Pal, C.S. Rai and A.P. Singh, “Comparative study of firefly algorithm and particle swarm optimization for noisy non-linear optimization problems,” I J Intelligent Systems and Applications, l, Mecs press, 2012, pp. 50–57.
23. V.V. Bova, E.V. Nuzhnov, V.V. Kureichik, “The combined method of semantic similarity estimation of problem oriented knowledge on the basis of evolutionary procedures,” Advances in Intelligent Systems and Computing, vol. 573, 2017, pp. 74-83.
Опубликован
2019-07-13
Выпуск
Раздел
РАЗДЕЛ I. АЛГОРИТМЫ ОБРАБОТКИ ИНФОРМАЦИИ