БИОИНСПИРИРОВАННЫЙ ПОДХОД К РЕШЕНИЮ ЗАДАЧИ КЛАССИФИКАЦИИ ПРОФИЛЕЙ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ В ИНТЕЛЛЕКТУАЛЬНЫХ ИНТЕРНЕТ-СЕРВИСАХ

  • В. В. Бова Южный Федеральный Университет
  • Ю. А. Кравченко Южный Федеральный Университет
Ключевые слова: Классификация, интеллектуальные Интернет-сервисы, профиль поведения пользо вателя, EM-алгоритм, биоинспирированные методы, метаэвристика «кукушкин поиск»

Аннотация

Рассматриваются проблемы повышения эффективности организации личностно-
ориентированного взаимодействия пользователя в интеллектуальных Интернет-сервисах
для формирования культуры безопасного поведения в Интернет-пространстве. Для их
решения предлагается метод построения профилей поведения пользователей на основании
анализа их информационных потребностей, максимально соответствующих их предпоч-
тениям, в том числе и неявным. Актуальность работы определяется растущей популярно-
стью идеи персонализации контента и информационных услуг в Интернет-пространстве.
Профиль поведения пользователя рассматривается авторами как слабоформализованный
объект в пространстве признаков внутренних и внешних характеристик, описывающих его
взаимодействие с Интернет-ресурсом. Предлагаемый в работе метод основан на вероят-
ностном алгоритме EM- кластеризации исследуемых данных о характеристиках пользо-
вателя и распределенных Интернет-ресурсов для генерации структуры входных парамет-
ров классификаторов модели формирования профиля пользователя. Оптимизация струк-
туры реализуется механизмом отбора информативных признаков профиля, основанного на
идее выявления скрытых интересов и предпочтений пользователей с одной стороны, и
способностью ресурса удовлетворять заинтересованных пользователей этому набору
признаков – с другой. Для снижения размерности исходных данных признакового простран-
ства в задаче классификации предлагается метаэвристический алгоритм оптимизации
«кукушкин поиск», отличающийся масштабируемостью и высокой интерпретируемостью
выходных данных. Оптимизация параметров классификаторов заключается в подборе
параметров функции принадлежности и меток классов обобщенного профиля таким обра-
зом, чтобы численный критерий точности классификации признаков ресурсов и предпоч-
тений пользователей сводился к максимуму на реальных данных. Для оценки эффективно-
сти предложенного алгоритма проведен вычислительный эксперимент на тестовых набо-
рах данных из открытого репозитория UCI Machine Learning Repository. Результаты ко-
торого показали, что построенный на тестовых данных классификатор обладает более
высоким уровнем интерпретируемости полученных результатов формирования профилей,
сохраняя точность классификации.

Литература

1. Tingting Z., Chen L.Y., Liang-Hsien T. Understanding user motivation for evaluating online
content: a self-determination theory perspective // Behaviour and Information Technology.
– 2015. – No. 34. – P. 479-491.
2. Deliang W., Lingling X., Chuan C.H. Understanding the continuance use of social network
sites: a computer self-efficacy perspective // Behaviour and Information Technology. – 2015.
– No. 34. – P. 204-216.
3. Алфимцев А.Н., Девятков В.В., Сакулин С.А. Персонализация в гипертекстовых сетях на
основе распознавания действий пользователей и нечеткого агрегирования // Вестник
МГТУ им. Баумана. Сер. «Приборостроение». – 2012. – № 3.
4. Писаренко В.И. Возможности использования педагогических знаний в междисципли-
нарных исследованиях // Современная наука: актуальные проблемы теории и практики.
Серия «Гуманитарные науки». – 2018. – № 12-3. – С. 48-52.
5. Войскунский А., Евдокименко А., Федунина Н. Сетевая и реальная идентичность: сравни-
тельное исследование // Психология. Журнал Высшей школы экономики. – 2013. – Т. 10,
№ 2. – С. 98-121.
6. Bova V.V., Kureichik V.V., Leshchanov D.V. The model of semantic similarity estimation for
the problems of big data search and structuring // Application of Information and Communication
Technologies - AICT 2017. – P. 27-32.
7. Газиев Г.З., Курдюкова Г.Н., Курдюков В.В. Кластеризация Big Data для их анализа и
обработки // Сб. научных статей конференции «Направления и механизмы развития
науки нового времени: от теории до внедрения результатов». – 2017. – С. 150-162.
8. Паутов К.Г., Попов Ф.А. Метод кластеризации тематических профилей пользователей и
его применение для анализа интернет-трафика // Фундаментальные исследования.
– 2015. – № 74. – С. 765-769.
9. Кравченко Ю.А. Оценка когнитивной активности пользователя в системах поддержки
принятия решений // Известия ЮФУ. Технические науки. – 2009. – № 4 (93). – С. 113-117.
10. Курейчик В.М., Картиев С.Б. Алгоритм классификации, основанный на принципах слу-
чайного леса, для решения задачи прогнозирования // Программные продукты и систе-
мы. – 2016. – № 2. – С. 11-15.
11. Сарин К.С., Ворожцов С.А., Аримпилов С.Н. Построение ансамблей нечетких классифи-
каторов на основе метаэвристики "кукушкин поиск" и горной кластеризации // Элек-
тронные средства и системы управления. – 2017. – № 1-2. – С. 26-29.
12. Картиев С.Б., Курейчик В.М. Разработка и исследование алгоритма решения задачи
кластеризации для осуществления вопросно-ответного поиска в информационно-
аналитической системе прогнозирования // Известия ЮФУ. Технические науки. – 2016.
– № 7 (180). – С. 18-28.
13. Марков В.В., Кравченко Ю.А., Кузьмина М.А. Развитие методов семантической фильтра-
ции на основе решения задачи кластеризации биоинспирированными алгоритмами //
Известия ЮФУ. Технические науки. – 2018. – № 4 (198). – С. 175-185.
14. Ходашинский И.А., Анфилофьев А.Е., Бардамова М.Б., Ковалев В.С., Мех М.А., Сонич
О.К. Метаэвристические методы оптимизации параметров нечетких классификаторов //
Информационные и математические технологии в науке и управлении. – 2016. – № 1.
– С. 73-81.
15. Jalalirad A., Tjalkens T. Using feature-based models with complexity penalization for selecting
features // Journal of Signal Processing Systems. – 2018. – Vol. 90, Issue 2. – P. 201-210.
16. Guo G., Zhang J., Thalmann D. Merging trust in collaborative filtering to alleviate data
sparsity and cold start // Knowledge-Based Systems. – 2014. – No. 57. – P. 57-68.
17. Авдеенко Т.В., Макарова Е.С. Метод определения релевантности прецедентов на основе не-
четких лингвистических правил // Научный вестник НГТУ. – 2016. – Т. 62, № 1. – С. 17-34.
18. Бова В.В., Щеглов С.Н., Лещанов Д.В. Модифицированный алгоритм EM-кластеризации
для задач интегрированной обработки больших данных // Известия ЮФУ. Технические
науки. – 2018. – № 4 (198). – С. 154-166.
19. Харченко А.М. Адаптивный расчет функции для динамического ЕМ-алгоритма // Мате-
матика. – 2015. – С. 134.
20. Курейчик В.М., Каланчук С.А. Обзор и состояние проблемы роевых методов оптимиза-
ции // Информатика, вычислительная техника и инженерное образование. – 2016.
– № 1 (25). – С. 1-13.
21. Карпенко А.П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохнов-
ленные природой: учеб. пособие. – М.: МГТУ им. Н.Э. Баумана, 2014. – 446 с.
22. Yang X.S., Deb S. Multiobjective cuckoo search for design optimization // Comput. Oper. Res.
– 2013. – No. 40 (6). – P. 1616-1624.
23. Chifu V.R., Pop C.B., Salomie I., Niculici A.N. Optimizing the semantic web service composition
process using cuckoo search // Intelligent Distributed Computing. – 2012. – No. 5. – P. 93-102.
24. Coelho L.S., Guerra F.A., Batistela N.J., Leite J.V. Multiobjective cuckoo search algorithm
based on duffings oscillator applied to jiles-atherton vector hysteresis parameters estimation //
IEEE Trans. Magn. – 2013. – No. 49 (5). – P. 1745.
25. Репозиторий машинного обучения. – URL: http://www.ics.uci.edu/~mlearn/
MLRepository.html (дата обращения: 24.06.2019).
Опубликован
2019-11-12
Выпуск
Раздел
Раздел II. Анализ данных и управление знаниями