Найти

Поиск статей

Расширенные фильтры

Опубликовано послеГодМесяцДень

Опубликовано доГодМесяцДень

По автору

Заголовок

Аннотация

Ключевые слова

Результаты поиска

Найдено результатов: 6.

АНАЛИТИЧЕСКИЙ ОБЗОР АЛГОРИТМА ДЕРЕВА РЕШЕНИЙ В ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

Э.В. Кулиев , В.А. Семенов, А.В. Котельва , С.В. Игнатьева

2022-05-26

Аннотация ▼

Алгоритм дерева решений является распространенным алгоритмом классификации в
технологии интеллектуального анализа данных, и его результаты обычно выражаются в
виде правил «если-то». Алгоритм C4.5 является одним из алгоритмов дерева решений, ко-
торый обладает преимуществами простоты понимания и высокой точности, а также
усовершенствован добавлением скорости прироста информации по сравнению с его пред-
шественником - алгоритмом ID3. После теоретического анализа информации выбирается
алгоритм C4.5 для анализа результатов служебной аттестации, и создается дерево ре-
шений для служебной аттестации путем сбора данных, предварительной обработки дан-
ных, расчета коэффициента прироста информации и определения атрибутов разделения.
Система разработана в архитектуре B/S, а платформа управления проектом R&D, кото-
рый может выполнять анализ оценки эффективности с помощью инструментов визуали-
зации алгоритма дерева решений и динамических веб-страниц. Система включает в себя
хранение информации, управление задачами, формирование отчетов, контроль полномочий
и ролей, визуализацию информации и другие функциональные модули управленческой ин-
формационной системы. Они могут реализовать функции управления проектом, такие как
создание и управление проектом, поток задач, заполнение и управление информацией о
сотрудниках, создание системы оценки эффективности, создание отчетов различных
размеров, построение управления. Используя алгоритм дерева решений в качестве основ-
ной технологии, система получает научную надежную информацию об управлении проек-
тами с высокой точностью и реализует визуализацию данных, что может помочь пред-
приятиям создать хорошую систему управления в эпоху больших данных. Рассмотрены
управление задачами, формирование отчетов, контроль полномочий ролей, визуализация
информации и другие функциональные модули управленческой информационной системы
АЛГОРИТМЫ АГЛОМЕРАТИВНОЙ КЛАСТЕРИЗАЦИИ ПРИМЕНИТЕЛЬНО К ЗАДАЧАМ АНАЛИЗА ЛИНГВИСТИЧЕСКОЙ ЭКСПЕРТНОЙ ИНФОРМАЦИИ

Ф. С. Булыга , В.М. Курейчик

2022-01-31

Аннотация ▼

Рассмотрены и представлены основные проблемы и принципы функционирования
процесса кластеризации данных, в частности принципы и задачи кластеризации тексто-
вых массивов лингвистической экспертной информации. В ходе выполнения данной работы
были обозначены основные трудности возникающие при проектировании подобного рода
систем, например: необходимость предварительной обработки данных, сокращение раз-
мерности исходной выборки и т.п. Для эффективного выполнения представленных задач
реализованное решение должно обладать комплексным подходом учитывающим показате-
ли эффективности методов направленных на решение отдельных подзадач, а также спо-
собностью обеспечить высокие показатели эффективности реализации каждого этапа
процесса кластеризации. В представленной работе рассматриваются различные группы
алгоритмов иерархической кластеризации, в частности была рассмотрена подгруппа ал-
горитмов агломеративной кластеризации применительно к задачам кластеризации лин-
гвистической экспертной информации. В описываемой работе приведена формальная по-
становка задачи кластеризации текстов, а также определена основная группа реализо-
ванных решений основанных на принципах агломеративной кластеризации: ROCK, CURE,
CHAMELEON. Проведен детальный обзор каждого из представленных алгоритмов, а
также сформулированы основные достоинства и недостатки каждого из них. Преимуще-
ством данной работы можно считать совокупность представленных данных об алгорит-
мах, а также результаты сравнительного анализа, позволяющие в дальнейшем оценить
целесообразность и потенциальную вероятность применения указанных решения из пред-
ставленной группы алгоритмов агломеративной кластеризации. Новизна данной работы
заключается в формировании обзорного анализа существующих подходов в области иерар-
хической кластеризации для решения задач кластерного анализа лингвистической эксперт-
ной информации, а также формирование результатов проведенного сравнительного ана-
лиза рассмотренных алгоритмов
РЕШЕНИЕ ЗАДАЧИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ НА ОСНОВЕ БИОИНСПИРИРОВАННОГО АЛГОРИТМА

Э.В. Кулиев , Д. Ю. Запорожец, Ю.А. Кравченко , М.М. Семенова

2022-01-31

Аннотация ▼

Рассматривается биоинспирированный алгоритм для решения задач интеллектуаль-
ного анализа. Интеграция биоинспирированных алгоритмов для решения задач интеллек-
туального анализа данных является перспективным направлением исследований. В качест-
ве биоинспирированного алгоритма, рассмотрен алгоритм, основанный на адаптивном
поведении муравьиной колонии. Алгоритм муравьиной колонии позволяет производить ка-
чественный поиск перспективных решений для получения оптимальных и квазиоптималь-
ных решений. Алгоритм обладает способностью выполнять поиск подходящей логических
условий. Алгоритм муравьиной колонии основан на примере поведения живых муравьев в
природе. Муравьи способны находить кратчайшее решение адаптируясь к изменениям
окружающей среды. Авторами предложен модифицированный алгоритм муравьиной коло-
нии для решения задачи интеллектуального анализа данных. В качестве задачи интеллек-
туального анализа данных выбрана задача кластеризации. Кластеризация – объединение в
группы схожих объектов – является одной из фундаментальных задач в области анализа
данных и Data Mining. Список прикладных областей, где она применяется, широк: сегмен-
тация изображений, маркетинг, борьба с мошенничеством, прогнозирование, анализ тек-
стов и многие другие. Решение данной задачи приобретает особую актуальность в услови-
ях постоянно растущего объема генерируемых, передаваемых и обрабатываемых данных.
Классические методы кластеризации оптимизированы путем объединения с предложен-
ным алгоритмом биоинспирированной оптимизации – муравьиным алгоритмом. Предло-
женный метод представляет собой модель, в которой муравьи представлены в виде аген-
тов, которые случайным образом перемещаются в пространстве решений с некоторыми
ограничений (например, препятствия на их пути). Для определения эффективности разра-
ботанного модифицированного муравьиного алгоритма (АСО) с алгоритмом кластериза-
ции, авторами была проведена серия вычислительных экспериментов. Для сравнения были
взять генетический алгоритм, алгоритм обезьян и алгоритм волков. Результаты модели-
рования доказывают, что муравьиный алгоритм на основе кластеризации дает лучшие
результаты, чем другие предлагаемые алгоритмы.
ВЕКТОРИЗАЦИЯ ТЕКСТА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

Али Махмуд Мансур , Жуман Хуссайн Мохаммад , Ю. А. Кравченко

2021-07-18

Аннотация ▼

В задачах интеллектуального анализа текста текстовое представление должно
быть не только эффективным, но и интерпретируемым, поскольку это позволяет понять
операционную логику, лежащую в основе моделей интеллектуального анализа данных. Тра-
диционные методы векторизации текста, такие как TF-IDF и Bag-of-words, эффективны
и имеют интуитивно понятную интерпретируемость, но страдают от «проклятия раз-
мерности» и не могут понимать смысл слов. С другой стороны, современные распределен-
ные методы эффективно определяют скрытую семантику, но требуют больших вычисли-
тельных ресурсов и времени, а также им не хватает интерпретируемости. В этой ста-
тье предлагается новый метод векторизации текстов под названием Bag of weighted Concepts
BoWC, который представляет документ в соответствии с содержащейся в нем ин-
формацией о концептах. Предлагаемый метод создает концепты посредством кластери-
зации векторов слов (т.е. встраивания слов), и использует частоты этих кластеров концептов для представления векторов документов. Чтобы обогатить итоговое представле-
ние документа, предлагается модифицированная весовая функция для взвешивания кон-
цептов на основе статистики, извлеченной из информации вложений слов. Векторы, сге-
нерированные с помощью предложенного метода, характеризуются интерпретируемо-
стью, низкой размерностью, высокой точностью, а также низкими вычислительными
затратами при использовании в задачах классификации и кластеризации. Предлагаемый
метод протестирован на пяти различных наборах эталонных данных для кластеризации и
классификации текстовых документов и сравнивается с несколькими базовыми методами,
включая Bag-of-words, TF-IDF, Averaged GloVe, Bag-of-Concepts и VLAC. Результаты пока-
зывают, что BoWC превосходит большинство базовых методов и дает в среднем на 7 %
лучшую точность.
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ В УПРАВЛЕНИИ ПРЕДПРИЯТИЕМ НА ОСНОВЕ АЛГОРИТМА ИМИТАЦИИ ОТЖИГА

Э.В. Кулиев , А.В. Котельва , М.М. Семенова , С.В. Игнатьева , А.П. Кухаренко

2022-11-01

Аннотация ▼

Рассмотрен аналитический обзор алгоритма имитации отжига для задачи эффек-
тивного управления предприятием. Проведена оптимизация алгоритма имитации отжига
для задачи эффективного управления предприятием. Для анализа случаев использовалась
оптимизация графика работы рабочих в организации. Установлена модель планирования
рабочих с сильными и слабыми ограничениями. Смоделированный алгоритм отжига ис-
пользуется для оптимизации стратегии решения модели планирования рабочего графика
персонала. Алгоритм имитации отжига представляет собой алгоритм, пригодный для
решения крупномасштабных задач комбинаторной оптимизации. Он также оценивает и
получает оптимальную стратегию планирования. Алгоритм имитации отжига хорошо
влияет на интеллектуальный анализ данных управления человеческими ресурсами. Интел-
лектуальный анализ больших данных может помочь компаниям проводить динамическийанализ при наборе талантов, а план набора талантов выполняется качественно и стан-
дартно, чтобы проанализировать характеристики различных талантов со многих сторон
и повысить уровень управления человеческими ресурсами. Разработан алгоритм реализую-
щий процесс работы алгоритма имитации отжига. Алгоритм имитации отжига прини-
мает новые решения по критерию Метрополиса, поэтому помимо принятия оптимизиро-
ванного решения он также принимает ослабленное решение в ограниченном диапазоне.
Алгоритм Метрополиса – алгоритм семплирования, использующийся, в основном, для
сложных функций распределения. Он отчасти похож на алгоритм выборки с отклонением,
однако здесь вспомогательная функция распределения меняется со временем. Проведены
экспериментальные исследования, которые показывают, что модель планирования рабо-
чих, основанная на сильных и слабых ограничениях, значительно лучше, чем модель ручного
планирования, достигая эффективного баланса между контролем затрат на зарплату в
организации и повышением удовлетворенности персонала. Успешное применение модели
планирования персонала, основанной на моделируемом алгоритме отжига, приносит новые
идеи и идеи для решения крупномасштабных задач планирования рабочих. Приведенные
результаты могут служить отправной точкой для изучения систем управления персона-
лом, основанных на технологии интеллектуального анализа данных.
МОНИТОРИНГ КАЧЕСТВА ОБРАЗОВАНИЯ И ВНЕДРЕНИЕ ИНДИВИДУАЛЬНОГО ОБУЧЕНИЯ: ДЕМОНСТРАЦИЯ ПОДХОДОВ И АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ОБРАЗОВАТЕЛЬНЫХ ДАННЫХ

Ясс Кхудейр Салал , С. М. Абдуллаев

2020-10-11

Аннотация ▼

Как показывает анализ данных международных тестирований знаний учащихся,
среднее и высшее образование многих странах переживает кризис, который в том числе
вызван не адекватностью системы мониторинга качества традиционного и дистанцион-
ного образования. В свою очередь, развитие такой системы мониторинга требует разра-
ботки методов классификации и квантификации, необходимых для прогноза индивидуаль-
ных и коллективных успехов учащихся. В этой статье теоретически и экспериментально
показано, что наиболее перспективным подходом, решающим одновременно обе задачи
прогноза, является создание гетерогенных ансамблей, состоящих из нечетного числа раз-
личных базовых классификаторов, таких как деревья решений, простейшие нейронные се-
ти, наивный байесовский классификатор и другие. Проведя обучение и тестирование
11 различных бинарных классификаторов на шести различных выборках образовательных
данных, нами показано, что индивидуальный детерминированный прогноз таких ансамблей
превосходит по точности прогнозы как отдельных базовых классификаторов, так и одно-
родных ансамблей созданных по технологиям бэггинга и бустинга. Преимущество гетеро-
генных ансамблей созданных из трех, пяти и семи классификаторов становится опреде-
ляющим, если учесть, что при естественном дисбалансе выборки образовательных дан-
ных, полезным прогнозом классификатора может считаться только такой прогноз, точ-
ность которого превосходит относительную частоту класса объектов имеющих наи-
большую повторяемость в выборке данных. Главным преимуществом гетерогенного ан-
самбля является возможность трансформации детерминированного прогноза в вероятно-
стный прогноз, когда вместо отнесения объекта к тому или иному классу, даются вероят-
ности его принадлежности к отдельным классам. На основе этого нами предложен новый
метод бинарной квантификации, когда индивидуальные вероятности принадлежности к
каждому из классов объектов суммируются по отдельности, а полученные в итоге суммар-
ные вероятности интерпретируются как относительные частоты объектов в выборке.
В результате экспериментов показано, что такая бинарная ансамблевая квантификация по
точности заметно превосходит традиционный метод «классифицируй и считай».

1 - 6 из 6 результатов

Найти

Результаты поиска

АНАЛИТИЧЕСКИЙ ОБЗОР АЛГОРИТМА ДЕРЕВА РЕШЕНИЙ В ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

АЛГОРИТМЫ АГЛОМЕРАТИВНОЙ КЛАСТЕРИЗАЦИИ ПРИМЕНИТЕЛЬНО К ЗАДАЧАМ АНАЛИЗА ЛИНГВИСТИЧЕСКОЙ ЭКСПЕРТНОЙ ИНФОРМАЦИИ

РЕШЕНИЕ ЗАДАЧИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ НА ОСНОВЕ БИОИНСПИРИРОВАННОГО АЛГОРИТМА

ВЕКТОРИЗАЦИЯ ТЕКСТА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ В УПРАВЛЕНИИ ПРЕДПРИЯТИЕМ НА ОСНОВЕ АЛГОРИТМА ИМИТАЦИИ ОТЖИГА

МОНИТОРИНГ КАЧЕСТВА ОБРАЗОВАНИЯ И ВНЕДРЕНИЕ ИНДИВИДУАЛЬНОГО ОБУЧЕНИЯ: ДЕМОНСТРАЦИЯ ПОДХОДОВ И АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ОБРАЗОВАТЕЛЬНЫХ ДАННЫХ

links

journal

index