Статья

Название статьи МОДИФИЦИРОВАННЫЙ АЛГОРИТМ EM-КЛАСТЕРИЗАЦИИ ДЛЯ ЗАДАЧ ИНТЕГРИРОВАННОЙ ОБРАБОТКИ БОЛЬШИХ ДАННЫХ
Автор В. В. Бова, С. Н. Щеглов, Д. В. Лещанов
Рубрика РАЗДЕЛ IV. АНАЛИЗ ДАННЫХ И УПРАВЛЕНИЕ ЗНАНИЯМИ
Месяц, год 04, 2018
Индекс УДК 004.822
DOI
Аннотация Приводится возможное решение проблем структуризации данных большого объема, а также их интегрированного хранения в структурах, обеспечивающих целостность, непротиворечивость их представления, высокую скорость и гибкость процессов обработки неструктурированной информации. Для решения указанных проблем предложен метод построения многоуровневой онтологической структуры, обеспечивающей решение взаимосвязанных задач выявления, структуризации и обработки больших массивов данных, преимущественно естественно-языковых форм представления. Разработанная на основе методов семантического анализа и онтологического моделирования многоуровневая модель, пригодна для интерпретации и эффективной интегрированной обработки неструктурированных данных, полученных из распределенных источников информации. Многоуровневое представление модели структуризации данных большого объема определяет способы и механизмы унифицированного метаописания элементов данных на логическом уровне, поиска закономерностей и классификации признакового пространства на семантическом уровне и лингвистический уровень реализации процедур выявления, консолидации и обогащения данных. В качестве возможного решения данной задачи предлагается метод и алгоритм кластерного анализа, который позволяет сократить размерность исходного набора данных и выявить семантические ареалы терминологического покрытия. Модификация данного метода заключается в применении масштабируемого и вычислительно эффективного генетического алгоритма поиска и генерации весовых коэффициентов, которые соответствуют разным мерам подобия множества наблюдаемых признаков, использующихся при формировании модели кластеризации данных. Полученные данные в серии вычислительных экспериментов подтвердили теоретическую значимость и перспективность применения метода кластеризации с ГА оценки семантической близости элементов данных, представленных в онтологии.

Скачать в PDF

Ключевые слова Семантическая близость; онтология; семантическая сеть; нестуктурированные данные; большие данные; семантический анализ; семантическая метамодель; генетический алгоритм; кластеризация.
Библиографический список 1. Bova V.V., Kureichik V.V., Leshchanov D.V. The model of semantic similarity estimation for the problems of big data search and structuring // Application of Information and Communication Technologies - AICT 2017. – P. 27-32.
2. Кравченко Ю.А., Марков В.В., Новиков А.А. Семантический поиск в SemanticWeb // Известия ЮФУ. – 2016. – № 6 (179). – С. 65-75.
3. Mumford C., Jain L. Computational Intelligence. Collaboration, Fuzzyand Emergence. – Berlin: Springer-Verlag, 2009. – 726 p.
4. Kureichik V., Zaporozhets D., Zaruba D. Generation of bioinspired search procedures for optimization problems // Application of Information and Communication Technologies, AICT 2016 - Conference Proceedings 10. – 2016. – C. 7991822.
5. Кулиев Э.В., Кравченко Ю.А., Логинов О.А., Запорожец Д.Ю. Метод интеллектуального принятия эффективных решений на основе биоинспирированного подхода // Известия Кабардино-Балкарского научного центра РАН. – 2017. – № 62 (80). – С. 162-169.
6. Бова В.В., Кулиев Э.В., Лещанов Д.В. Концептуальные основы автоматизированной обработки неструктурированной информации в системах управления проблемно-ориентированными знаниями // В сб. "IS&IT'17". – 2017. – С. 341-350.
7. Бова В.В., Лежебоков А.А., Лещанов Д.В. Моделирование семантической сети представления знаний на основе онтологического подхода // Информатизация и связь. – 2018.
– № 4. – С. 78-88.
8. Kureychik V., Semenova A. Сombined method for integration of heterogeneous ontology models for big data processing and analysis // Advances in Intelligent Systems and Computing.
– 2017. – Vol. 573. – P. 302-311.
9. Kureichik V., Safronenkova I. Integrated algorithm of the domain ontology development // Advances in Intelligent Systems and Computing. – 2017. – Vol. 573. – P. 146-155.
10. Харченко А.М. Адаптивный расчет функции для динамического ЕМ-алгоритма // Математика. – 2015. – С. 134.
11. Хоанг В.К., Тузовский А.Ф. Методы определения уровней безопасности элементов онтологии // Известия Томского политехнического университета. – 2013. – Т. 322, № 5.
– С. 148-152.
12. Loukachevitch N., Dobrov B. Ontological resources for representing security domain in information-analytical system // Открытые семантические технологии проектирования интеллектуальных систем. – 2018. – Т. 2, № 8. – С. 185-191.
13. Копайгородский А.Н., Семичева О.А Семантическая информационная система для представления научной деятельности в сети интернет // Вестник Иркутского государственного технического университета. – 2014. – № 12. – С. 23-29.
14. Кулиев Э.В., Лежебоков А.А., Лещанов Д.В., Шкаленко Б.И. Механизмы роевого интеллекта и эволюционной адаптации на основе виртуального набора популяций для решения задач управления проблемно-ориентированными знаниями // Информатика, вычислительная техника и инженерное образование. – 2017. – № 1 (29). – С. 34-45.
15. Gladkov L.A., Sheglov S.N., Gladkova N.V. The application of bioinspired methods for solving vehicle routing problems // Procedia Computer Science, 120 (2017). 9th International Conference on Theory and Application of Soft Computing, Computing with Words and Perception, ICSCCW 2017. – P. 39-46.
16. Кулиев Э.В., Шеглов С.Н., Пантелюк Е.А., Логинов О.А. Адаптивный алгоритм стаи серых волков для решения задач проектирования // Известия ЮФУ. Технические науки.
– 2017. – № 7 (192). – С. 28-38.
17. Логинов О.А., Лежебоков A.A., Бова В.В., Щеглов С.Н. Интеллектуальный анализ данных на основе биоинспирированного подхода // Информатизация и связь. – 2018. – № 4. – С. 66-71.
18. Щеглов С.Н. Использование онтологий в системах поддержки принятия решений // Конгресс по интеллектуальным системам и информационным технологиям IS-IT’17: Труды конгресса. – 2017. – Т. 1. – С. 242-252.
19. Кравченко Ю.А., Коваленко М.С. Разработка инструментальной среды обработки данных // Конгресс по интеллектуальным системам и информационным технологиям
IS-IT’17: Труды конгресса. – 2017. – Т. 3. – С. 211-218.
20. Esfandani Gholamreza, Abolhassani Hassan. MSDBSCAN: multidensity scale-independent clustering algorithm based on DBSCAN // In: Advanceddata mining and applications. Chongqing, China: Springer, 2010. – P. 202-13.
21. Carmelo Cassisi, Alfredo Ferro, Rosalba Giugno, Giuseppe Pigola, Alfredo Pulvirenti. Enhancing density-based clustering: parameter reduction andoutlier detection // In: Syst. – 2013. – Vol. 38 (3). – P. 317-30.
22. Макаров И.Е. Автоматизация анализа проектных решений с применением методов интеллектуальной обработки // Интеллектуальные системы. – 2014. – № 10. – С. 26-27.
23. Bernhard Pfahringer. Data stream mining: a practical approach. – Режим доступа: http://voxel.dl.sourceforge.net/project/moadatastream/ StreamMining.pdf.
24. Газиев Г.З., Курдюкова Г.Н., Курдюков В.В. Кластеризация Big Data для их анализа и обработки // Сб. научных статей конференции «Направления и механизмы развития науки нового времени: от теории до внедрения результатов». – 2017. – С. 150-162.

Comments are closed.