Найти
Результаты поиска
-
РАЗРАБОТКА ЧАТ-БОТА ДЛЯ КЛАССИФИКАЦИИ И АНАЛИЗА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ С ИСПОЛЬЗОВАНИЕМ ЛОКАЛЬНЫХ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ
Али Махмуд Мансур , Жуман Хуссайн Мохаммад , Ю.А. Кравченко159-1712025-07-24Аннотация ▼Исследуются локальные большие языковые модели (Local large language models, Local LLM) и их применение в задачах классификации текста, а также проводится сравнение их производительности с традиционными методами. Статья предоставляет всесторонний обзор ряда ключевых локальных LLM, уделяя особое внимание их архитектурным преимуществам, характеристикам и областям применения. В частности, рассматриваются модели с различным количеством параметров, их способность адаптироваться к специализированным доменам, а также требования к вычислительным ресурсам при их развертывании на локальном оборудовании. Особый акцент делается на компромиссах между производительностью и эффективностью использования ресурсов. В качестве практического вклада разработан чат-бот, использующий локальные LLM (такие как DeepSeek, Gemma и Llama2 через Ollama) для классификации входящих текстов по заранее заданным категориям, демонстрируя работу этих моделей без использования облачных вычислений. Система реализована с модульной архитектурой, позволяющей легко интегрировать новые модели и сравнивать их эффективность. Вычислительный эксперимент включает оценку точности и скорости вывода локальных LLM в сравнении с более простыми методами, такими как Sentence-BERT, TF-IDF и BoWC, выделяя сценарии, в которых локальные модели превосходят традиционные подходы или уступают им. Тестирование проводилось на основе эталонного набора данных BBC. Результаты показывают, что языковые модели (включая модели с 7 миллиардами параметров) демонстрируют сильную и логически обоснованную классификационную производительность при обработке текстов на естественном языке, однако их результаты не являются идеальными для эталонных наборов данных. В частности, обнаружены случаи, когда все тестируемые модели, включая традиционные методы, ошибочно классифицировали документы, что указывает на возможные проблемы в разметке данных. Полученные результаты указывают на необходимость пересмотра эталонных меток в стандартных наборах данных. Это особенно важно для доменов с субъективными категориями, где экспертные оценки могут значительно расходиться. С другой стороны, хотя локальные LLM уступают облачным в скорости, их преимущества в конфиденциальности данных и оффлайн-работе делают их пригодными для специализированных задач.
-
МЕТОДИКА ПОСТРОЕНИЯ И ОЦЕНКИ ОНТОЛОГИЧЕСКОГО ПРОФИЛЯ ДЛЯ СИСТЕМ ПЕРСОНАЛИЗАЦИИ КОНТЕНТА
Ж.Х. Мохаммад248-2622025-12-30Аннотация ▼Данная статья посвящена разработке и апробации методики построения онтологического профиля, предназначенного для использования в системах персонализации контента. В работе детально описана модульная архитектура веб-системы персонализации, иллюстрирующая методы и алгоритмы обработки и анализа текста на каждом этапе, а также представлен пошаговый алгоритм создания онтологии. Методика включает первичную обработку данных: извлечение ключевых слов и словосочетаний, их иерархическую кластеризацию для выявления семантической структуры предметной области. Далее следует этап определения пороговых значений для отсева малозначимых связей, извлечения и формализации взаимосвязей между концептами с использованием методов обработки естественного языка, таких, как разрешение лексической неоднозначности и извлечение связей на основе семантического сходства. Для реализации этого процесса был разработан интегрированный конвейер (pipeline), объединяющий усовершенствованные алгоритмы, предложенные автором в предыдущих исследованиях, а именно: алгоритм извлечения ключевых фраз из отдельного текста на основе семантического сходства и модифицированный алгоритм разрешения лексической многозначности слов. В рамках данного конвейера также были оптимально интегрированы все необходимые инструменты обработки естественного языка, обеспечивающие эффективную работу указанных методов в процессе автоматического построения онтологии из текста. Особое внимание в исследовании уделяется комплексной оценке полученной онтологии с использованием специализированного набора критериев, позволяющих объективно оценить качество, полноту и непротиворечивость построенного профиля. Важной частью работы является проведение вычислительного эксперимента, который наглядно демонстрирует влияние каждого из этапов обработки данных на итоговое качество и эффективность онтологии. Показано, что предложенная методика позволяет построить практичную, масштабируемую и релевантную онтологию, готовую к промышленному внедрению и интеграции в системы персонализации для повышения их точности и адаптивности.
-
ИЗВЛЕЧЕНИЕ КЛЮЧЕВЫХ ФРАЗ НА ОСНОВЕ БОЛЬШИХ ЯЗЫКОВЫХ МОДЕЛЕЙ
Мохаммад Жуман Хуссайн2024-11-10Аннотация ▼Статья посвящена актуальной проблеме извлечения ключевых фраз из текстов на естест-
венном языке, что является критически важной задачей в области обработки естественного
языка и интеллектуального анализа текста. В ней подробно рассматриваются основные подходы
к извлечению ключевых фраз (ключевых слов), включая как традиционные методы, так и совре-
менные подходы на основе искусственного интеллекта. В статье рассматривается набор широко
используемых методов в этой области, таких как TF-IDF, RAKE, YAKE и методы, основанные на
лингвистических анализаторах (парсерах). Эти методы опираются на статистические принципы
и графовые структуры, но часто сталкиваются с проблемами, связанными с недостаточной спо-
собностью учитывать контекст текста. Большая языковая модель GPT-3 демонстрирует пре-
восходное понимание контекста по сравнению с традиционными методами извлечения ключевых
фраз. Эта продвинутая способность позволяет GPT-3 более точно идентифицировать и извле-
кать релевантные ключевые фразы из текста. Сравнительный анализ с использованием эталон-
ного набора данных Inspec показывает значительно более высокую производительность GPT-3 с
точки зрения средней точности (Mean Average Precision, MAP). Однако следует отметить, что,
несмотря на высокую точность и качество извлечения, использование больших языковых моделей
может быть ограничено в реальном времени из-за их более длительного времени отклика по срав-
нению с классическими статистическими методами. Таким образом, статья подчеркивает необ-
ходимость дальнейших исследований в этой области для оптимизации алгоритмов извлечения
ключевых фраз с учетом требований реального времени и контекста текстов -
К ОЦЕНКЕ ОБЛАСТИ ПРИТЯЖЕНИЯ ПОЛОЖЕНИЯ РАВНОВЕСИЯ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ
Мохаммад Джалаль Алмашаал2023-02-27Аннотация ▼Синтез нелинейных систем управления, по-прежнему, является сложной задачей, поэто-
му многие исследователи пытаются найти эффективные способы и методы решения этой
проблемы. В результате таких исследований было разработано несколько методов синтеза
систем управления для нелинейных объектов, каждый из которых даёт системы с различными
свойствами. Поэтому возникла необходимость сравнить некоторые методы, чтобы опреде-
лить, какой из них является достаточно простым и позволяет найти нелинейную систему с
лучшими свойствами. С этой целью, в данной работе сравниваются допустимые области на-
чальных условий, при которых созданные различными методами нелинейные системы управле-
ния являются работоспособными. Рассматриваются два аналитических метода проектирова-
ния систем управления различными нелинейными техническими объектами, такими как мо-
бильные роботы и многие другие объекты. Это алгебраический полиномиально-матричный
метод, использующий квазилинейную модель, и метод линеаризации обратной связью, исполь-
зующий приведение заданных нелинейных уравнений объекта к форме Бруновского. Оба рас-
смотренных метода дают ограниченную область притяжения положения равновесия получен-
ных систем управления, поэтому эти системы могут работать только с ограниченными на-
чальными условиями. В статье приведен численный пример проектирования систем управления
для одного объекта этими двумя методами. Оценки областей притяжения равновесия этих
систем определяются с помощью MATLAB. В результате установлено, что алгебраической
полиномиально-матричной метод позволяет обеспечить большую область допустимых на-
чальных условий, по сравнению с методом линеаризации обратной связью. Кроме того, алго-
ритм синтеза нелинейных систем управления алгебраическим полиномиально-матричным ме-
тодом является более простым и полностью выполняется на компьютере. Это позволяет
считать, что решение задач проектирования систем управления нелинейными объектами целе-
сообразнее выполнять алгебраическим полиномиально-матричным методом. -
К ОЦЕНКЕ ОБЛАСТИ ПРИТЯЖЕНИЯ ПОЛОЖЕНИЯ РАВНОВЕСИЯ НЕЛИНЕЙНЫХ СИСТЕМ УПРАВЛЕНИЯ
Алмашаал Мохаммад Джалаль6-142025-07-31Аннотация ▼Синтез нелинейных систем управления, по-прежнему, является сложной задачей, по-
этому многие исследователи пытаются найти эффективные способы и методы решения
этой проблемы. В результате таких исследований было разработано несколько методов
синтеза систем управления для нелинейных объектов, каждый из которых даёт системы с
различными свойствами. Поэтому возникла необходимость сравнить некоторые методы,
чтобы определить, какой из них является достаточно простым и позволяет найти нели-
нейную систему с лучшими свойствами. С этой целью, в данной работе сравниваются до-
пустимые области начальных условий, при которых созданные различными методами не-
линейные системы управления являются работоспособными. Рассматриваются два ана-
литических метода проектирования систем управления различными нелинейными техниче-
скими объектами, такими как мобильные роботы и многие другие объекты. Это алгебраи-
ческий полиномиально-матричный метод, использующий квазилинейную модель, и метод
линеаризации обратной связью, использующий приведение заданных нелинейных уравнений
объекта к форме Бруновского. Оба рассмотренных метода дают ограниченную область
притяжения положения равновесия полученных систем управления, поэтому эти системы
могут работать только с ограниченными начальными условиями. В статье приведен чис-
ленный пример проектирования систем управления для одного объекта этими двумя мето-
дами. Оценки областей притяжения равновесия этих систем определяются с помощью
MATLAB. В результате установлено, что алгебраической полиномиально-матричной ме-
тод позволяет обеспечить большую область допустимых начальных условий, по сравнению
с методом линеаризации обратной связью. Кроме того, алгоритм синтеза нелинейных
систем управления алгебраическим полиномиально-матричным методом является более
простым и полностью выполняется на компьютере. Это позволяет считать, что решение
задач проектирования систем управления нелинейными объектами целесообразнее выпол-
нять алгебраическим полиномиально-матричным методом -
МОДИФИЦИРОВАННЫЙ МЕТОД УСТРАНЕНИЯ НЕОДНОЗНАЧНОСТИ СМЫСЛА СЛОВ, ОСНОВАННЫЙ НА МЕТОДАХ РАСПРЕДЕЛЕННОГО ПРЕДСТАВЛЕНИЯ
Ю.А. Кравченко , Мансур Али Махмуд, Мохаммад Жуман Хуссайн2021-08-11Аннотация ▼В задачах интеллектуального анализа текста текстовое представление должно
быть не только эффективным, но и интерпретируемым, поскольку это позволяет понять
операционную логику, лежащую в основе моделей интеллектуального анализа данных. В
этой статье предлагается модифицированный метод устранения неоднозначности слов
(WSD), который, по сути, имитирует хорошо известный вариант подхода Леска WSD. Для
выбранного слова и его контекста алгоритм Леска проводит свои вычисления на основе
проверки совпадений контекста слова и каждого определения его смыслов (глосс), для того
чтобы выбрать правильное значение. Основным преимуществом данного метода является
применение концепции сходства между определением и контекстом вместо «перекры-
тия», для каждого смысла целевого слова в дополнение к расширению определения приме-
рами предоставленными WordNet. Предлагаемый метод также характеризуется исполь-
зованием функций измерения схожести текстов, определенных в распределенном семан-
тическом пространстве. Предлагаемый метод протестирован на пяти различных наборах
эталонных данных для задачи устранения неоднозначности смысла слов и сравнивался с
несколькими базовыми методами, включая Lesk, расширенный Lesk, WordNet 1st sense,
Babelfy и UKB. Результаты показывают, что предлагаемый метод превосходит большин-
ство известных аналогов, за исключением методов Babelfy и WN 1st sense. -
ВЕКТОРИЗАЦИЯ ТЕКСТА С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
Али Махмуд Мансур , Жуман Хуссайн Мохаммад , Ю. А. Кравченко2021-07-18Аннотация ▼В задачах интеллектуального анализа текста текстовое представление должно
быть не только эффективным, но и интерпретируемым, поскольку это позволяет понять
операционную логику, лежащую в основе моделей интеллектуального анализа данных. Тра-
диционные методы векторизации текста, такие как TF-IDF и Bag-of-words, эффективны
и имеют интуитивно понятную интерпретируемость, но страдают от «проклятия раз-
мерности» и не могут понимать смысл слов. С другой стороны, современные распределен-
ные методы эффективно определяют скрытую семантику, но требуют больших вычисли-
тельных ресурсов и времени, а также им не хватает интерпретируемости. В этой ста-
тье предлагается новый метод векторизации текстов под названием Bag of weighted Concepts
BoWC, который представляет документ в соответствии с содержащейся в нем ин-
формацией о концептах. Предлагаемый метод создает концепты посредством кластери-
зации векторов слов (т.е. встраивания слов), и использует частоты этих кластеров концептов для представления векторов документов. Чтобы обогатить итоговое представле-
ние документа, предлагается модифицированная весовая функция для взвешивания кон-
цептов на основе статистики, извлеченной из информации вложений слов. Векторы, сге-
нерированные с помощью предложенного метода, характеризуются интерпретируемо-
стью, низкой размерностью, высокой точностью, а также низкими вычислительными
затратами при использовании в задачах классификации и кластеризации. Предлагаемый
метод протестирован на пяти различных наборах эталонных данных для кластеризации и
классификации текстовых документов и сравнивается с несколькими базовыми методами,
включая Bag-of-words, TF-IDF, Averaged GloVe, Bag-of-Concepts и VLAC. Результаты пока-
зывают, что BoWC превосходит большинство базовых методов и дает в среднем на 7 %
лучшую точность.








