Найти
Результаты поиска
-
КАСКАДНЫЙ АЛГОРИТМ КЛАССИФИКАЦИИ ДЛЯ ОБНАРУЖЕНИЯ ВРЕДОНОСНОГО ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ МЕТОДОМ СТАТИЧЕСКОГО АНАЛИЗА
А.В. Козачок , А. В. Козачок , С.С. Матовых18-352025-11-10Аннотация ▼Представлено исследование, посвященное разработке и экспериментальной валидации двухуровневой каскадной архитектуры статической классификации исполняемых файлов формата Portable Executable (PE). Целью работы является разработка и экспериментальная оценка каскадного алгоритма статической классификации, направленного на снижение вычислительных затрат при сохранении качества обнаружения вредоносного программного обеспечения. На первом уровне каскада применяется модель дерево решений, обученная на десяти наиболее информативных признаках, обеспечивающая высокую полноту обнаружения Recall 0,990 при приемлемой ошибке 1 рода. Второй уровень реализован моделью случайный лес на сорока признаках и предназначен для уточняющей классификации, достигая метрик Precision 0,988 и Recall 0,987 при
F1-мере 0,988. Порог классификации на первом уровне был установлен эмпирически с учётом минимизации ошибок второго рода, тогда как на втором уровне оптимальное значение порога определялось по индексу Юдена, обеспечивающему сбалансированное соотношение чувствительности и специфичности. Эксперименты на репрезентативной выборке показали, что при доле вредоносного трафика ≤ 20 % предложенный каскад сокращает среднее время анализа одного объекта на 5–12 % по сравнению с моделью на 40 признаках при сохранении сопоставимого качества классификации. Аналитически выведена граница применимости каскада по времени = 20,6 %, подтвержденная эмпирическими данными. Практическая значимость работы заключается в возможности интеграции предложенного алгоритма в антивирусные шлюзы и средства защиты конечных точек, где требуются быстрый отклик и высокая полнота обнаружения при массовом сканировании преимущественно легитимного кода. -
ГРУППИРОВКА ПРЕДИКТОРОВ В КОМБИНИРОВАННОЙ КУСОЧНО-ЛИНЕЙНОЙ РЕГРЕССИИ
С.И. Носков , С.В. Беляев120-1272025-10-01Аннотация ▼Дан краткий обзор публикаций по применению при математическом моделировании сложных систем комбинированных конструкций, содержащих в качестве составных элементов известные модельные формы. В частности, рассмотрены: алгоритм оценки параметров для создания математических моделей динамических систем; структурированные математические модели кислородного электрода и биологической очистки сточных вод; комбинированная модель, включающая ионный обмен между кальцием и медью; объединение нестандартных конечно-разностных схем и метода экстраполяции Ричардсона для получения численных решений двух моделей биологических систем; математическая формулировка задачи и эвристический подход к оптимальному планирования маршрутов доставки в мультимодальной системе; математическая модель оптимизации стратегических и тактических решений во всех видах цепочек поставок на основе биомассы; метод разработки моделей различных типов для элементов химико-технологических систем с учетом различных видов имеющейся информации и объединении этих моделей в единый комплекс. Сформулированы два варианта постановки задачи вычисления оценок параметров комбинированной кусочно-линейной регрессии – при непустом и пустом пересечении индексных множеств, задающих состав независимых переменных в линейной и кусочно-линейной компонентах модели. Показано, что в обоих случаях при выборе в качестве функции потерь суммы абсолютных отклонений ошибок аппроксимации эти варианты сводятся к задачам линейно-булева программирования. Построены две версии комбинированной кусочно-линейной регрессионной модели выручки горно-металлургической компании «Северсталь». В качестве независимых переменных модели использованы объемы производства: горячекатанного, холоднокатанного и оцинкованого листа, листа с другим металлическим покрытием, листа с полимерным покрытием, сортового проката, метизной продукции
-
ОСНОВНЫЕ ПОДХОДЫ К ИЗВЛЕЧЕНИЮ ТЕКСТОВОЙ ИНФОРМАЦИИ (ОБЗОР)
В.В. Курейчик , П. С. Герасименко2024-10-08Аннотация ▼Данная статья посвящена обзору известных и современных подходов, методов и алгорит-
мов полнотекстового поиска. Описана краткая история решения задачи поиска в неструктуриро-
ванных текстовых данных, её развитие и актуальность. Сформулирована основная задача поиска
в текстовых данных. Приведено определение индекса базы данных. В общем виде определена целе-
вая функция поисковой информационной системы и описаны возможные компромиссные вариации
её параметров при решения различных прикладных задач. Приведена обобщённая архитектура
современной поисковой информационной системы с разделением задачи поиска на две фазы: пер-
вичное извлечение релевантных записей и их последующее ранжирование для формирования окон-
чательных результатов поиска. Даны базовые описания основных алгоритмов и методов полно-
текстового поиска, таких как: поиск по термам (логический поиск), поиск с помощью деревьев и
их разновидностей (B-деревья, UB-деревья, tries), поиск на основе n-грамм (в том числе поиск на
основе частотного представления), использование векторной модели пространства (VSM), поиск
на основе инвертированного (обратного) индекса, поиск с использованием аппарата нечёткой
логики и биоинспирированных методов. Приведены основные достоинства и недостатки этих
методов, описана их применимость в различных условиях, а также рассмотрены возможные ме-
тоды оптимизации поиска текстовых данных для улучшения точности, скорости поиска и эф-
фективности использования ресурсов. Представлены возможные перспективные направления в
области решения задачи первичного извлечения информации. Приведены некоторые способы опре-
деления сходства текстовых записей для решения задачи ранжирования на основе аппарата не-
чёткой логики. Затронуты вопросы повышения релевантности первичного извлечения с помощью
методов искусственного интеллекта, нейронных сетей, аппарата нечёткой логики и биоинспири-
рованных методов, в частности методы расширения поискового запроса и/или расширения обра-
батываемых текстовых записей. Описано влияние граничных условий построения поисковой сис-
темы на повышение её эффективности. В заключение статьи подводятся итоги обзора и обсуж-
даются перспективы дальнейшего развития различных методов полнотекстового поиска. -
АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИНТЕРФЕЙСА УПРАВЛЕНИЯ РОБОТ-ЧЕЛОВЕК ПРИ ВЫДЕЛЕНИИ ЗРИТЕЛЬНЫХ ВЫЗВАННЫХ ПОТЕНЦИАЛОВ НА ОСНОВЕ МНОГОМЕРНОГО ИНДЕКСА СИНХРОНИЗАЦИИ
Я. А. Туровский, С.С. Харченко, Р. В. Мещеряков, А.О. Исхакова, А.Ю. Исхаков2020-07-10Аннотация ▼Целью исследования является построения систем человеко-машинного управле-ния. Основные способы построения таких систем, способы выделения вызванных по-тенциалов в электроэнцефалограммах. В статье приведены исследования сигналов электроэнцефалограмм с устоявшимися зрительными вызванными потенциалами для разных частот фотостимуляции, на основе метода многомерного индекса синхрони-зации. Рассматривается влияние длины обрабатываемого окна на точность распозна-вания частоты исследуемого сигнала. Так же в ходе исследований авторы проверяют необходимость предобработки исходных сигналов посредством полосовой фильтрации сигнала. Кроме того, рассматривается возможность использования многомерного индекса синхронизации в многоканальном режиме. Результатом исследования авторов является рекомендации по используемым параметрам для выделения устоявшихся зри-тельных вызванных потенциалах в методе многомерного индекса синхронизации. Пока-зана возможность использования алгоритмов на основе многомерного индекса синхронизации в режиме реального времени. Полученные результаты имеют практическую значимость, так как могут применяться для построения нейрокомпьютерных интерфейсов на основе зрительных вызванных потенциалов и могут быть в дальнейшем использованы в формировании теории управления робототехнических систем различного назначения и в реализации решений по организации взаимодействия человека и машины в узких практических задачах.








