BIOINSPIRED APPROACH FOR SOLVING THE PROBLEM OF CLASSIFICATION IN USERS BEHAVIOR PROFILES IN INTELLIGENT INTERNET SERVICES

  • V.V. Bova Southern Federal University
  • Y. A. Kravchenko Southern Federal University
Keywords: Classification, intelligent Internet services, behavioral user profile, EM-algorithm, bioinspired methods, cuckoo search metaheuristics

Abstract

The article deals with the problems of increasing the effectiveness of personal-oriented user interaction
organization in intelligent Internet services for developing a culture of safe behavior in the Internet
space. To solve them, we propose a method for constructing profiles of user behavior based on an analysis
of their information needs, which most closely match their preferences, including the implicit ones.
The relevance of the work is determined by the growing popularity of the idea of personalizing content
and information services in the Internet space. The user's behavior profile is considered by the authors as
a weakly formalized object in the feature space of internal and external characteristics describing its
interaction with an Internet resource. The proposed method is based on the EM-clustering probabilistic
algorithm of the studied data on user characteristics and distributed Internet resources for generating the
structure of the input parameters of classifiers of the user profile generation model. The structure optimization
is realized by the mechanism of selection of informative characteristics of a profile based on the
idea of identifying hidden interests and preferences of users on the one hand, and the ability of a resource
to satisfy interested users of this feature set - on the other. In order to reduce the dimension of the source
data of the attribute space, the classification problem suggests a meta-heuristic algorithm for optimizing
the “cuckoo search”, which is distinguished by scalability and high interpretability of the output data.
Optimization of the parameters of classifiers consists in the selection of the parameters of the membership
function and the labels of classes of the generalized profile so that the numerical criterion for the accuracy
of the classification of resource attributes and user preferences is reduced to a maximum on real data.
To assess the effectiveness of the proposed algorithm, a computational experiment was conducted on test
datasets from the open repository of the UCI Machine Learning Repository. The results of which showed
that the classifier built on test data possesses a higher level of interpretability of the results of the formation
of profiles, while maintaining the accuracy of classification.

References

1. Tingting Z., Chen L.Y., Liang-Hsien T. Understanding user motivation for evaluating online
content: a self-determination theory perspective // Behaviour and Information Technology.
– 2015. – No. 34. – P. 479-491.
2. Deliang W., Lingling X., Chuan C.H. Understanding the continuance use of social network
sites: a computer self-efficacy perspective // Behaviour and Information Technology. – 2015.
– No. 34. – P. 204-216.
3. Алфимцев А.Н., Девятков В.В., Сакулин С.А. Персонализация в гипертекстовых сетях на
основе распознавания действий пользователей и нечеткого агрегирования // Вестник
МГТУ им. Баумана. Сер. «Приборостроение». – 2012. – № 3.
4. Писаренко В.И. Возможности использования педагогических знаний в междисципли-
нарных исследованиях // Современная наука: актуальные проблемы теории и практики.
Серия «Гуманитарные науки». – 2018. – № 12-3. – С. 48-52.
5. Войскунский А., Евдокименко А., Федунина Н. Сетевая и реальная идентичность: сравни-
тельное исследование // Психология. Журнал Высшей школы экономики. – 2013. – Т. 10,
№ 2. – С. 98-121.
6. Bova V.V., Kureichik V.V., Leshchanov D.V. The model of semantic similarity estimation for
the problems of big data search and structuring // Application of Information and Communication
Technologies - AICT 2017. – P. 27-32.
7. Газиев Г.З., Курдюкова Г.Н., Курдюков В.В. Кластеризация Big Data для их анализа и
обработки // Сб. научных статей конференции «Направления и механизмы развития
науки нового времени: от теории до внедрения результатов». – 2017. – С. 150-162.
8. Паутов К.Г., Попов Ф.А. Метод кластеризации тематических профилей пользователей и
его применение для анализа интернет-трафика // Фундаментальные исследования.
– 2015. – № 74. – С. 765-769.
9. Кравченко Ю.А. Оценка когнитивной активности пользователя в системах поддержки
принятия решений // Известия ЮФУ. Технические науки. – 2009. – № 4 (93). – С. 113-117.
10. Курейчик В.М., Картиев С.Б. Алгоритм классификации, основанный на принципах слу-
чайного леса, для решения задачи прогнозирования // Программные продукты и систе-
мы. – 2016. – № 2. – С. 11-15.
11. Сарин К.С., Ворожцов С.А., Аримпилов С.Н. Построение ансамблей нечетких классифи-
каторов на основе метаэвристики "кукушкин поиск" и горной кластеризации // Элек-
тронные средства и системы управления. – 2017. – № 1-2. – С. 26-29.
12. Картиев С.Б., Курейчик В.М. Разработка и исследование алгоритма решения задачи
кластеризации для осуществления вопросно-ответного поиска в информационно-
аналитической системе прогнозирования // Известия ЮФУ. Технические науки. – 2016.
– № 7 (180). – С. 18-28.
13. Марков В.В., Кравченко Ю.А., Кузьмина М.А. Развитие методов семантической фильтра-
ции на основе решения задачи кластеризации биоинспирированными алгоритмами //
Известия ЮФУ. Технические науки. – 2018. – № 4 (198). – С. 175-185.
14. Ходашинский И.А., Анфилофьев А.Е., Бардамова М.Б., Ковалев В.С., Мех М.А., Сонич
О.К. Метаэвристические методы оптимизации параметров нечетких классификаторов //
Информационные и математические технологии в науке и управлении. – 2016. – № 1.
– С. 73-81.
15. Jalalirad A., Tjalkens T. Using feature-based models with complexity penalization for selecting
features // Journal of Signal Processing Systems. – 2018. – Vol. 90, Issue 2. – P. 201-210.
16. Guo G., Zhang J., Thalmann D. Merging trust in collaborative filtering to alleviate data
sparsity and cold start // Knowledge-Based Systems. – 2014. – No. 57. – P. 57-68.
17. Авдеенко Т.В., Макарова Е.С. Метод определения релевантности прецедентов на основе не-
четких лингвистических правил // Научный вестник НГТУ. – 2016. – Т. 62, № 1. – С. 17-34.
18. Бова В.В., Щеглов С.Н., Лещанов Д.В. Модифицированный алгоритм EM-кластеризации
для задач интегрированной обработки больших данных // Известия ЮФУ. Технические
науки. – 2018. – № 4 (198). – С. 154-166.
19. Харченко А.М. Адаптивный расчет функции для динамического ЕМ-алгоритма // Мате-
матика. – 2015. – С. 134.
20. Курейчик В.М., Каланчук С.А. Обзор и состояние проблемы роевых методов оптимиза-
ции // Информатика, вычислительная техника и инженерное образование. – 2016.
– № 1 (25). – С. 1-13.
21. Карпенко А.П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохнов-
ленные природой: учеб. пособие. – М.: МГТУ им. Н.Э. Баумана, 2014. – 446 с.
22. Yang X.S., Deb S. Multiobjective cuckoo search for design optimization // Comput. Oper. Res.
– 2013. – No. 40 (6). – P. 1616-1624.
23. Chifu V.R., Pop C.B., Salomie I., Niculici A.N. Optimizing the semantic web service composition
process using cuckoo search // Intelligent Distributed Computing. – 2012. – No. 5. – P. 93-102.
24. Coelho L.S., Guerra F.A., Batistela N.J., Leite J.V. Multiobjective cuckoo search algorithm
based on duffings oscillator applied to jiles-atherton vector hysteresis parameters estimation //
IEEE Trans. Magn. – 2013. – No. 49 (5). – P. 1745.
25. Репозиторий машинного обучения. – URL: http://www.ics.uci.edu/~mlearn/
MLRepository.html (дата обращения: 24.06.2019).
Published
2019-11-12
Section
SECTION II. DATA ANALYSIS AND KNOWLEDGE MANAGEMENT