Найти
Результаты поиска
-
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ ВОССТАНОВЛЕНИЯ ПРОПУЩЕННЫХ ДАННЫХ
А. А. Сорокин , А. В. Дагаев , И. М. Бородянский2020-11-22Аннотация ▼В последние десятилетия качественно развиваются методы системного анализа,
что связано с увеличением скорости технического развития, уплотнением временных про-
цессов, быстрым ростом накапливаемой информации и новыми возможностями вычисли-
тельной техники. К этим методам относятся методы анализа большого объема данных,
методы добычи данных, методы аналитического моделирования, методы параллельной
обработки данных, нейросетевые методы, методы прогнозирования и другие. Представ-
ленные методы позволяют быстро и качественно обрабатывать разнородные кластеры
информации, аккумулировать и синтезировать данные, обобщать и классифицировать
информацию. К последним из представленных методов относятся методы интерполяции и
экстраполяции потерянной, поврежденной или неполученной информации. Данные методы
позволяют структурировать, восстанавливать и моделировать информацию на основе
статистических данных, математических и алгоритмических методов. Таким образом в
статье рассматривается проблема восстановления пропущенных данных в графических и
сложных объектах. Приводятся литературные источники по рассматриваемым задачам.
В них приводится обширная информация по рассматриваемой тематике: представлены
генетические алгоритмы используемые для пространственной интерполяции; рассмотре-
но решение задач неоднородности интерполяции сейсмических данных; описано использование сплайн-аппроксимации для расчета характеристик нелинейных электронных компо-
нентов; разобран метод построения модели трехмерных параметрических рациональных
тел с помощью обобщенной интерполяции Безье, что позволяет моделировать форму тела
и анизотропное пространство; описаны методы применяющие нечеткие линейные уравне-
ния, которые широко распространены в компьютерном зрении; исследован метод адап-
тивной интерполяции на основе градиента учитывающий локальный градиент исходного
изображения. В статье выполняется сравнение нескольких распространенных методов
интерполяции и реставрации данных, таких как: билинейная интерполяция, поверхность
Безье. Кратко описывается каждый метод и особенности его применения в рамках прове-
денного эксперимента. Приводится результат серии экспериментов с представленными
методами с различным количеством испытаний. В заключении делаются выводы о рацио-
нальности выбора одного из предложенных методов без применения длительного натурно-
го эксперимента в каждом случае -
РЕШЕНИЕ ЗАДАЧИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ НА ОСНОВЕ БИОИНСПИРИРОВАННОГО АЛГОРИТМА
Э.В. Кулиев , Д. Ю. Запорожец, Ю.А. Кравченко , М.М. Семенова2022-01-31Аннотация ▼Рассматривается биоинспирированный алгоритм для решения задач интеллектуаль-
ного анализа. Интеграция биоинспирированных алгоритмов для решения задач интеллек-
туального анализа данных является перспективным направлением исследований. В качест-
ве биоинспирированного алгоритма, рассмотрен алгоритм, основанный на адаптивном
поведении муравьиной колонии. Алгоритм муравьиной колонии позволяет производить ка-
чественный поиск перспективных решений для получения оптимальных и квазиоптималь-
ных решений. Алгоритм обладает способностью выполнять поиск подходящей логических
условий. Алгоритм муравьиной колонии основан на примере поведения живых муравьев в
природе. Муравьи способны находить кратчайшее решение адаптируясь к изменениям
окружающей среды. Авторами предложен модифицированный алгоритм муравьиной коло-
нии для решения задачи интеллектуального анализа данных. В качестве задачи интеллек-
туального анализа данных выбрана задача кластеризации. Кластеризация – объединение в
группы схожих объектов – является одной из фундаментальных задач в области анализа
данных и Data Mining. Список прикладных областей, где она применяется, широк: сегмен-
тация изображений, маркетинг, борьба с мошенничеством, прогнозирование, анализ тек-
стов и многие другие. Решение данной задачи приобретает особую актуальность в услови-
ях постоянно растущего объема генерируемых, передаваемых и обрабатываемых данных.
Классические методы кластеризации оптимизированы путем объединения с предложен-
ным алгоритмом биоинспирированной оптимизации – муравьиным алгоритмом. Предло-
женный метод представляет собой модель, в которой муравьи представлены в виде аген-
тов, которые случайным образом перемещаются в пространстве решений с некоторыми
ограничений (например, препятствия на их пути). Для определения эффективности разра-
ботанного модифицированного муравьиного алгоритма (АСО) с алгоритмом кластериза-
ции, авторами была проведена серия вычислительных экспериментов. Для сравнения были
взять генетический алгоритм, алгоритм обезьян и алгоритм волков. Результаты модели-
рования доказывают, что муравьиный алгоритм на основе кластеризации дает лучшие
результаты, чем другие предлагаемые алгоритмы. -
АЛГОРИТМЫ АГЛОМЕРАТИВНОЙ КЛАСТЕРИЗАЦИИ ПРИМЕНИТЕЛЬНО К ЗАДАЧАМ АНАЛИЗА ЛИНГВИСТИЧЕСКОЙ ЭКСПЕРТНОЙ ИНФОРМАЦИИ
Ф. С. Булыга , В.М. Курейчик2022-01-31Аннотация ▼Рассмотрены и представлены основные проблемы и принципы функционирования
процесса кластеризации данных, в частности принципы и задачи кластеризации тексто-
вых массивов лингвистической экспертной информации. В ходе выполнения данной работы
были обозначены основные трудности возникающие при проектировании подобного рода
систем, например: необходимость предварительной обработки данных, сокращение раз-
мерности исходной выборки и т.п. Для эффективного выполнения представленных задач
реализованное решение должно обладать комплексным подходом учитывающим показате-
ли эффективности методов направленных на решение отдельных подзадач, а также спо-
собностью обеспечить высокие показатели эффективности реализации каждого этапа
процесса кластеризации. В представленной работе рассматриваются различные группы
алгоритмов иерархической кластеризации, в частности была рассмотрена подгруппа ал-
горитмов агломеративной кластеризации применительно к задачам кластеризации лин-
гвистической экспертной информации. В описываемой работе приведена формальная по-
становка задачи кластеризации текстов, а также определена основная группа реализо-
ванных решений основанных на принципах агломеративной кластеризации: ROCK, CURE,
CHAMELEON. Проведен детальный обзор каждого из представленных алгоритмов, а
также сформулированы основные достоинства и недостатки каждого из них. Преимуще-
ством данной работы можно считать совокупность представленных данных об алгорит-
мах, а также результаты сравнительного анализа, позволяющие в дальнейшем оценить
целесообразность и потенциальную вероятность применения указанных решения из пред-
ставленной группы алгоритмов агломеративной кластеризации. Новизна данной работы
заключается в формировании обзорного анализа существующих подходов в области иерар-
хической кластеризации для решения задач кластерного анализа лингвистической эксперт-
ной информации, а также формирование результатов проведенного сравнительного ана-
лиза рассмотренных алгоритмов -
ТРАНСФОРМАЦИЯ И АНАЛИЗ ИНФОРМАЦИИ ПРИ СОЗДАНИИ БАЗЫ ДАННЫХ УЧАСТНИКОВ ВЕЛИКОЙ ОТЕЧЕСТВЕННОЙ ВОЙНЫ 1941–1945 ГОДОВ МЕМОРИАЛЬНОГО КОМПЛЕКСА «ДОРОГА ПАМЯТИ» ГЛАВНОГО ХРАМА ВООРУЖЕННЫХ СИЛ РОССИЙСКОЙ ФЕДЕРАЦИИ НА ОСНОВЕ КОМПЬЮТЕРНЫХ МЕТОДОВ ОБРАБОТКИ ИНФОРМАЦ
С.А. Боцвин С.А., В.А. Хватков2021-11-14Аннотация ▼Сохранение исторической памяти об участниках Великой Отечественной войны
1941–1945 годов является задачей мирового уровня, которая должна сберечь правду о са-
мой страшной войне и подвиге нашего народа. В современных условиях привлечение инте-
реса к истории, традициям и наконец признанию своего долга перед ушедшими поколения-
ми требует современных методов. Одним из таких методов является трансформация
информация, которая позволяет представить эту информацию в таком виде, чтобы она
могла быть использована наиболее эффективно. При этом основной целью при трансфор-
мации исторических данных заключается в оптимизации их представлений и форматов и
не изменении информационного содержания. Представленные алгоритмы трансформации
и анализа информации при создании базы данных участников Великой Отечественной вой-
ны были направлены на максимальное сохранение исторической ценности и достоверности
информации. Для достижения этой цели рассмотрены компьютерные методы обработки
информации для нормализации и консолидации персональных данных, полученных из различ-
ных источников. Проведен анализ содержания сведений в архивных документах с пред-
ставлением статистических данных по количеству документов (записей) из различных
источников (архивов, базах данных, информационных ресурсов и т.п.) и описан порядок
перевода информации из архивных документов в электронный вид, который был применен
на практике. На основании анализа сведений построены диаграммы содержания
персональных сведений в архивных источниках, представлены этапы систематизации и
приведения к единому формату записей обобщенного информационного массива, а также
порядок объединения и удаления дублирующих записей. Для возможности использования
вдругих проектах подробно изложен алгоритм консолидации данных, полученных из
различных источников, и постороена его блок-схема. Кроме того описаны примененные
алгоритмы нечеткого поиска, которые позволили минимизировать ошибки в записях, а
также алгоритмы сравнения изображений для поиска дубликатов по фотографиям. Все
приведенные алгоритмы позволили собрать воедино информацию, содержащуюся на раз-
личных носителях, имеющую разные структуры и географическое положение. Созданный
информационный ресурс позволяет колоссально сократить ресурсы необходимые для поиска нужных сведений, в том числе доступ к которым был ограничен или вообще отсутст-
вовал. Дальнейшее усовершенствование алгоритмов нормализации и консолидации инфор-
мации может послужить основой для миграции данных из устаревших в перспективные
системы, а также для формирования информационных ресурсов из имеющихся разнород-
ных архивных фондов. -
ВЕКТОРИЗАЦИЯ ТЕКСТА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
Али Махмуд Мансур , Жуман Хуссайн Мохаммад , Ю. А. Кравченко2021-07-18Аннотация ▼В задачах интеллектуального анализа текста текстовое представление должно
быть не только эффективным, но и интерпретируемым, поскольку это позволяет понять
операционную логику, лежащую в основе моделей интеллектуального анализа данных. Тра-
диционные методы векторизации текста, такие как TF-IDF и Bag-of-words, эффективны
и имеют интуитивно понятную интерпретируемость, но страдают от «проклятия раз-
мерности» и не могут понимать смысл слов. С другой стороны, современные распределен-
ные методы эффективно определяют скрытую семантику, но требуют больших вычисли-
тельных ресурсов и времени, а также им не хватает интерпретируемости. В этой ста-
тье предлагается новый метод векторизации текстов под названием Bag of weighted Concepts
BoWC, который представляет документ в соответствии с содержащейся в нем ин-
формацией о концептах. Предлагаемый метод создает концепты посредством кластери-
зации векторов слов (т.е. встраивания слов), и использует частоты этих кластеров концептов для представления векторов документов. Чтобы обогатить итоговое представле-
ние документа, предлагается модифицированная весовая функция для взвешивания кон-
цептов на основе статистики, извлеченной из информации вложений слов. Векторы, сге-
нерированные с помощью предложенного метода, характеризуются интерпретируемо-
стью, низкой размерностью, высокой точностью, а также низкими вычислительными
затратами при использовании в задачах классификации и кластеризации. Предлагаемый
метод протестирован на пяти различных наборах эталонных данных для кластеризации и
классификации текстовых документов и сравнивается с несколькими базовыми методами,
включая Bag-of-words, TF-IDF, Averaged GloVe, Bag-of-Concepts и VLAC. Результаты пока-
зывают, что BoWC превосходит большинство базовых методов и дает в среднем на 7 %
лучшую точность. -
МЕТОД ПОИСКА ПОСЛЕДОВАТЕЛЬНЫХ ПАТТЕРНОВ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ В ИНТЕРНЕТ-ПРОСТРАНСТВЕ
В.В. Курейчик, В.В. Бова, Ю.А. Кравченко2020-11-22Аннотация ▼Одной из важных задач интеллектуального анализа данных является выделение зако-
номерностей и обнаружение связанных событий в последовательных данных на основе
анализа последовательных паттернов. В статье исследуются возможность применения
последовательных паттернов для анализа событий поисково-познавательной деятельно-
сти пользователей при взаимодействии с Интернет-ресурсами открытой информационно-
образовательной среды. Поиск последовательных паттернов является сложной вычисли-
тельной задачей, цель которой состоит в извлечении всех частых последовательностей,
отражающих потенциальные связи внутри элементов из транзакционной базы данных
последовательностей событий поисковой активности при заданной минимальной под-
держке. Для ее решения в статье предлагается метод поиска закономерностей в последо-
вательностях событий для обнаружения скрытых закономерностей, указывающих с воз-
можные уровни уязвимости при выполнении задач информационного поиска в Интернет-
пространстве. Описана математическая модель поведения пользователей в поисковой
сессии, основанная на теории последовательных паттернов. Для повышения вычислитель-
ной эффективности метода разработан модифицированный алгоритм генерации последо-
вательных паттернов, на первом этапе которого выполняется AprioriAll, формирующий
частые последовательности-кандидаты всевозможных длин, а на втором - генетический
алгоритм оптимизации входных параметров признакового пространства сгенерированного
множества для поиска максимальных паттернов. Проведены серии вычислительных экс-
периментов на тестовых данных корпуса MSNBC, библиотеки интеллектуального анализа
данных с открытым исходным кодом SPMF. Сравнительной анализ проводился с алгорит-
мами VMSP и GSP. Результаты исследований подтвердили эффективность поиска макси-
мальных последовательных паттернов предложенным алгоритмом с точки зрения времени
выполнения и количества извлеченных паттернов. Результаты проведенных эксперимен-
тальных исследований метода показали, что для увеличения стабильности и точности
работы размер выборки, полученной в результате работы ГА, позволит сократить необ-
ходимое число сканирований базы данных паттернов, обеспечивая приемлемые вычисли-
тельные затраты, сопоставимые с алгоритмом VMSP и превосходящий по времени поиска
последовательных паттернов алгоритм GSP в среднем более чем на 150%. -
МОНИТОРИНГ КАЧЕСТВА ОБРАЗОВАНИЯ И ВНЕДРЕНИЕ ИНДИВИДУАЛЬНОГО ОБУЧЕНИЯ: ДЕМОНСТРАЦИЯ ПОДХОДОВ И АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ОБРАЗОВАТЕЛЬНЫХ ДАННЫХ
Ясс Кхудейр Салал , С. М. Абдуллаев2020-10-11Аннотация ▼Как показывает анализ данных международных тестирований знаний учащихся,
среднее и высшее образование многих странах переживает кризис, который в том числе
вызван не адекватностью системы мониторинга качества традиционного и дистанцион-
ного образования. В свою очередь, развитие такой системы мониторинга требует разра-
ботки методов классификации и квантификации, необходимых для прогноза индивидуаль-
ных и коллективных успехов учащихся. В этой статье теоретически и экспериментально
показано, что наиболее перспективным подходом, решающим одновременно обе задачи
прогноза, является создание гетерогенных ансамблей, состоящих из нечетного числа раз-
личных базовых классификаторов, таких как деревья решений, простейшие нейронные се-
ти, наивный байесовский классификатор и другие. Проведя обучение и тестирование
11 различных бинарных классификаторов на шести различных выборках образовательных
данных, нами показано, что индивидуальный детерминированный прогноз таких ансамблей
превосходит по точности прогнозы как отдельных базовых классификаторов, так и одно-
родных ансамблей созданных по технологиям бэггинга и бустинга. Преимущество гетеро-
генных ансамблей созданных из трех, пяти и семи классификаторов становится опреде-
ляющим, если учесть, что при естественном дисбалансе выборки образовательных дан-
ных, полезным прогнозом классификатора может считаться только такой прогноз, точ-
ность которого превосходит относительную частоту класса объектов имеющих наи-
большую повторяемость в выборке данных. Главным преимуществом гетерогенного ан-
самбля является возможность трансформации детерминированного прогноза в вероятно-
стный прогноз, когда вместо отнесения объекта к тому или иному классу, даются вероят-
ности его принадлежности к отдельным классам. На основе этого нами предложен новый
метод бинарной квантификации, когда индивидуальные вероятности принадлежности к
каждому из классов объектов суммируются по отдельности, а полученные в итоге суммар-
ные вероятности интерпретируются как относительные частоты объектов в выборке.
В результате экспериментов показано, что такая бинарная ансамблевая квантификация по
точности заметно превосходит традиционный метод «классифицируй и считай». -
ПЕРСПЕКТИВЫ ПРИМЕНЕНИЯ КРУПНОРАЗМЕРНЫХ БПЛА ПРИ РЕШЕНИИ ЗАДАЧ КОМПЛЕКСНОГО ОБСЛЕДОВАНИЯ ТЕРРИТОРИЙ
А. М. Федулин, Д.М. Дрягин2021-04-04Аннотация ▼Целью приведенного в настоящей работе исследования является оценка перспектив-
ности применения крупноразмерных беспилотных летательных аппаратов (БПЛА) боль-
шой продолжительности полета для решения задачи регулярного комплексного обследова-
ния территорий большой площади относительно других применяемых для этого средств,
таких как: малоразмерные БПЛА, космические аппараты для дистанционного зондирова-
ния Земли и пилотируемые летательные аппараты. Рассмотрен вопрос практического
построения программно-аппаратного комплекса бортовой системы технического зрения
на основе крупноразмерного БПЛА «Орион» взлетной массой более тонны, обеспечивающе-
го аэрофотографическую съемку в видимом и ближнем инфракрасном диапазоне и воздуш-
ное лазерное сканирование подстилающей поверхности с автоматической обработкой
получаемых данных на борту в режиме времени, близком к реальному, с целью выявления
произошедших с предыдущего обследования интересующих изменений. Определены ключе-
вые составные части системы технического зрения, включая требуемую для решения
функциональных задач программно-аппаратную платформу для обеспечения высокопроиз-
водительных вычислений и хранения больших объемов данных. В работе приведена пер-
спективная архитектура построения такой системы, даны расчетные оценки по ее поис-
ковой производительности, массе и потребляемой мощности, определена типовая высота
выполнения полетов, обеспечивающая пространственное разрешения получаемой видовой
информации, необходимое для надлежащей работы алгоритмов объектно-
ориентированного распознавания интересующих изменений, построенных на машинном
обучении сверточных нейронных сетей. Предложены организационно-технические решения
по ускорению цикла обработки данных, с учетом требований законодательства в части
рассекречивания данных аэросъемки. Полученные в ходе выполнения работы результаты
подтверждают, что после выдачи БПЛА «Орион» Федеральным агентством воздушного
транспорта сертификата типа воздушного судна, дающего право выполнения коммерче-
ских полетов в общем воздушном пространстве Российской Федерации, на его базе с ис-
пользованием современных технологий съемки и интеллектуальной обработки данных
можно будет реализовать аэросъемочный комплекс высокой производительности и сте-
пени автономности, тактико-технические и экономические характеристики которого
будут на порядки превосходить существующие на данный момент решения, особенно для
труднодоступных районов страны. -
СОВРЕМЕННЫЕ ПОДХОДЫ К МОНИТОРИНГУ И ПРОГНОЗИРОВАНИЮ ПРИРОДНЫХ ПОЖАРОВ: ОБЗОР И КОНЦЕПЦИЯ АВТОНОМНОЙ СИСТЕМЫ НА БАЗЕ БПЛА
Н.Д. Болдырев , В. В. Гилка , А.С. Кузнецова , Д.А. Морозов58-802025-12-30Аннотация ▼Природные пожары ежегодно наносят серьёзный урон экосистемам, экономике и безопасности населения, а своевременное обнаружение возгораний и прогнозирование их развития повышает оперативность реагирования на угрозу и позволяет оптимально распределять ресурсы при ликвидации чрезвычайных ситуаций (ЧС). Существующие методы мониторинга ограничены скоростью обнаружения очагов возгорания и оперативностью их дальнейшего распростанения, что снижает эффективность действий спасательных служб. Для решения данной проблемы могут использоваться гетерогенные источники данных, включая беспилотные летательные аппараты (БПЛА), распределённые датчиковые сети, мобильные комплексы полевого наблюдения, наземные тепловизионные станции и т.д., которые могут способствовать проведению более точного анализа текущей обстановки и повышению достоверности прогнозных моделей распространения пожаров. Целью исследования стала разработка концепции автоматизированного подхода к мониторингу и прогнозированию природных пожаров на основе беспилотных летательных аппаратов. Мы считаем, что такой подход сумеет повысить оперативность обнаружения очагов возгорания и точность прогнозирования их распространения. Задачи включают анализ существующих методов мониторинга, формирование концепции системы, интегрирующей многоспектральную съёмку, оптимизированную передачу данных, автоматическую сегментацию и прогнозирование на основе машинного обучения, а также обеспечивающей взаимодействие оператора и специалистов по оповещению. В работе использовались методы сбора, анализа и передачи данных с БПЛА, обработка многоспектральных изображений, машинное обучение и нейронные сети для детекции очагов возгорания, алгоритмы сегментации изображений и имитационное моделирование для прогнозирования распространения огня, визуализация данных для поддержки принятия решений оператором и администратором, логирование и анализ результатов для обучения моделей, программная инженерия и технологии человеко-машинного взаимодействия. Система сократит время обнаружения и прогнозирования пожаров, предоставит возможность оператору запускать несколько дронов одновременно и автоматизирует обработку получаемых с них данных. Автоматизация процессов позволит сократить время реакции на ЧС и численность персонала, улучшить распределение ресурсов, повысить точность прогнозов и своевременность информирования экстренных служб. Это поможет снизить ущерб от природных пожаров и повысить безопасность населения и экосистем. Несмотря на существующие успехи, достигнутые в решении этой задачи, комплексная система, концепция которой описывается в данной статье, пока не существует в полной мере ни в России и странах СНГ, ни в западных и азиатских странах. Хотя отдельные компоненты, такие как БПЛА для мониторинга и искусственный интеллект (ИИ) для анализа данных, уже активно используются, интегрированного решения, которое бы объединяло все элементы (управление дронами, прогнозирование распространения огня в режиме, приближенном к реальному времени, передача данных и взаимодействие с экстренными службами), на данный момент нет. Эта концепция представляет собой новый подход, который может стать прорывной технологией для борьбы с природными катастрофами
-
МЕТОДЫ И АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ ТЕКСТОВЫХ ДАННЫХ (ОБЗОР)
В.В. Бова , Ю.А. Кравченко , С.И. Родзин2022-11-01Аннотация ▼Рассматривается одна из важных задач искусственного интеллекта – машинная об-
работка естественного языка. Решение данной задачи на основе кластерного анализа по-
зволяет выявлять, формализовывать и интегрировать большие объемы лингвистической
экспертной информации в условиях информационной неопределенности и слабой структу-
рированности исходных текстовых ресурсов, полученных из различных предметных облас-
тей. Кластерный анализ является мощным средством разведочного анализа текстовых
данных, позволяющий провести объективную классификацию любых объектов, которые
охарактеризованы рядом признаков и имеют скрытые закономерности. Проведен обзор и
анализ современных модифицированных алгоритмов агломеративной кластеризации CURE,
ROCK, CHAMELEON, неиерархической кластеризации PAM, CLARA и алгоритма аффинно-
го преобразования, используемых на различных этапах кластеризации текстовых данных,
эффективность которых проверяется экспериментальными исследованиями. В работе
обоснованы требования к выбору наиболее эффективного метода кластеризации для ре-
шения задачи повышения эффективности интеллектуальной обработки лингвистической
экспертной информации. Также в работе рассмотрены способы визуализации результатов
кластеризации для интерпретации кластерной структуры и зависимостей на множестве
элементов текстовых данных и графические средства их представления в виде дендо-
грамм, диаграмм рассеивания, диаграмм сходства VOS и карт интенсивности. Для сравне-
ния качества работы алгоритмов использовались внутренние и внешние метрики эффек-
тивности: «V-мера», «Adjusted Rand index», «Силуэт». На основании проведенных экспери-
ментов выявлено, что необходимо использовать гибридный подход, в котором для перво-
начального выбора числа кластеров и распределения их центров использовать иерархиче-
ский подход, основанный на последовательном объединении и максимизации близости дан-
ных ограниченной выборки, когда нет возможности выдвинуть гипотезу о начальном ко-
личестве кластеров. Далее подключать алгоритмы итерационной кластеризации, обеспе-
чивающие высокую устойчивость по отношению к шумовым признакам и наличию выбро-
сов. За счет гибридизации повышается эффективность работы алгоритмов кластериза-
ции. Результаты исследований показали, что для повышения вычислительной эффективно-
сти и преодоления чувствительности при инициализации параметров алгоритмов класте-
ризации для оптимизации параметров модели обучения и поиска глобального оптимального
решения необходимо использовать метаэвристические подходы. -
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ В УПРАВЛЕНИИ ПРЕДПРИЯТИЕМ НА ОСНОВЕ АЛГОРИТМА ИМИТАЦИИ ОТЖИГА
Э.В. Кулиев , А.В. Котельва , М.М. Семенова , С.В. Игнатьева , А.П. Кухаренко2022-11-01Аннотация ▼Рассмотрен аналитический обзор алгоритма имитации отжига для задачи эффек-
тивного управления предприятием. Проведена оптимизация алгоритма имитации отжига
для задачи эффективного управления предприятием. Для анализа случаев использовалась
оптимизация графика работы рабочих в организации. Установлена модель планирования
рабочих с сильными и слабыми ограничениями. Смоделированный алгоритм отжига ис-
пользуется для оптимизации стратегии решения модели планирования рабочего графика
персонала. Алгоритм имитации отжига представляет собой алгоритм, пригодный для
решения крупномасштабных задач комбинаторной оптимизации. Он также оценивает и
получает оптимальную стратегию планирования. Алгоритм имитации отжига хорошо
влияет на интеллектуальный анализ данных управления человеческими ресурсами. Интел-
лектуальный анализ больших данных может помочь компаниям проводить динамическийанализ при наборе талантов, а план набора талантов выполняется качественно и стан-
дартно, чтобы проанализировать характеристики различных талантов со многих сторон
и повысить уровень управления человеческими ресурсами. Разработан алгоритм реализую-
щий процесс работы алгоритма имитации отжига. Алгоритм имитации отжига прини-
мает новые решения по критерию Метрополиса, поэтому помимо принятия оптимизиро-
ванного решения он также принимает ослабленное решение в ограниченном диапазоне.
Алгоритм Метрополиса – алгоритм семплирования, использующийся, в основном, для
сложных функций распределения. Он отчасти похож на алгоритм выборки с отклонением,
однако здесь вспомогательная функция распределения меняется со временем. Проведены
экспериментальные исследования, которые показывают, что модель планирования рабо-
чих, основанная на сильных и слабых ограничениях, значительно лучше, чем модель ручного
планирования, достигая эффективного баланса между контролем затрат на зарплату в
организации и повышением удовлетворенности персонала. Успешное применение модели
планирования персонала, основанной на моделируемом алгоритме отжига, приносит новые
идеи и идеи для решения крупномасштабных задач планирования рабочих. Приведенные
результаты могут служить отправной точкой для изучения систем управления персона-
лом, основанных на технологии интеллектуального анализа данных. -
АНАЛИТИЧЕСКИЙ ОБЗОР АЛГОРИТМА ДЕРЕВА РЕШЕНИЙ В ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
Э.В. Кулиев , В.А. Семенов, А.В. Котельва , С.В. Игнатьева2022-05-26Аннотация ▼Алгоритм дерева решений является распространенным алгоритмом классификации в
технологии интеллектуального анализа данных, и его результаты обычно выражаются в
виде правил «если-то». Алгоритм C4.5 является одним из алгоритмов дерева решений, ко-
торый обладает преимуществами простоты понимания и высокой точности, а также
усовершенствован добавлением скорости прироста информации по сравнению с его пред-
шественником - алгоритмом ID3. После теоретического анализа информации выбирается
алгоритм C4.5 для анализа результатов служебной аттестации, и создается дерево ре-
шений для служебной аттестации путем сбора данных, предварительной обработки дан-
ных, расчета коэффициента прироста информации и определения атрибутов разделения.
Система разработана в архитектуре B/S, а платформа управления проектом R&D, кото-
рый может выполнять анализ оценки эффективности с помощью инструментов визуали-
зации алгоритма дерева решений и динамических веб-страниц. Система включает в себя
хранение информации, управление задачами, формирование отчетов, контроль полномочий
и ролей, визуализацию информации и другие функциональные модули управленческой ин-
формационной системы. Они могут реализовать функции управления проектом, такие как
создание и управление проектом, поток задач, заполнение и управление информацией о
сотрудниках, создание системы оценки эффективности, создание отчетов различных
размеров, построение управления. Используя алгоритм дерева решений в качестве основ-
ной технологии, система получает научную надежную информацию об управлении проек-
тами с высокой точностью и реализует визуализацию данных, что может помочь пред-
приятиям создать хорошую систему управления в эпоху больших данных. Рассмотрены
управление задачами, формирование отчетов, контроль полномочий ролей, визуализация
информации и другие функциональные модули управленческой информационной системы -
ОЦЕНКА ВОЗДЕЙСТВУЮЩИХ ФАКТОРОВ И ПРОГНОЗИРОВАНИЕ ЭЛЕКТРОПОТРЕБЛЕНИЯ В РЕГИОНАЛЬНОЙ ЭНЕРГОСИСТЕМЕ С УЧЕТОМ РЕЖИМА ЕЕ ЭКСПЛУАТАЦИИ
Н. К. Полуянович , М. Н. Дубяго2022-05-26Аннотация ▼Статья посвящена исследованиям вопросов оценки воздействующих факторов и про-
гнозирования электропотребления в региональной энергосистеме с учетом режимов ее
эксплуатации. Проведен анализ существующих методов прогнозирования энергопотребле-
ния. Обоснован выбор метода прогнозирования с использованием искусственной нейронной
сети. Рассмотрен алгоритм создания нейросети для краткосрочного прогноза электриче-
ской нагрузки. Актуальность работы обусловлена требованиями действующего законода-
тельства к прогнозированию электропотребления для решения задачи поддержания балан-
са мощностей между генерирующей стороной и потреблением электрической энергии.
При этом одной из основных задач, связанных с генерацией электрической энергии и ее
потреблением, является задача поддержания баланса мощностей. С одной стороны, при
увеличении плановой нагрузки могут возникнуть перебои в поставке электроэнергии, с дру-
гой стороны, уменьшение электропотребления приведет так же к уменьшению КПД элек-
тростанций, и в конечном счете – к повышению стоимости на электроэнергию как для
субъекта оптового рынка электроэнергии, так и для конечного потребителя. Разработан-
ная нейросетевая модель (НС) модель сводит задачу краткосрочного прогнозирования
электропотребления к поиску матрицы свободных коэффициентов посредством обучения
на имеющихся статистических данных (активная и реактивная мощность, температура
окружающей среды, дата и индекс дня). Полученная НС модель краткосрочного прогнози-
рования электропотребления участка районной электрической сети 10 кВ, учитывает
факторы: – времени, – метеорологических условий, – отключений отдельных питающих
линий электропередач, – режима работы потребителей электроэнергии. Получены про-
гнозные оценки электропотребления энергосистемы по данным потребляемой электро-
энергии наружной температуры, типу дня и т.д. Модель прогнозирования величины, по-
требляемой активной и реактивной мощности вполне работоспособна, однако на данном
этапе все еще имеет довольно высокий уровень погрешности прогнозирования. Для повы-
шения точности прогнозирования необходимо увеличить базу данных, составляющих обу-
чающую выборку, т.к. на данный момент имеющиеся данные охватывают временной про-
межуток длиной лишь 3–4 месяца. Результаты анализа показали, что наибольшие трудно-
сти вызывает прогнозирование потребления реактивной мощности.








