Найти
Результаты поиска
-
ИДЕНТИФИКАЦИЯ КЛЮЧЕВЫХ ТЕХНОЛОГИЙ НА ОСНОВЕ СБОРА И АНАЛИЗА ДАННЫХ ИЗ ОТКРЫТЫХ РУССКОЯЗЫЧНЫХ ИСТОЧНИКОВ
А.Г. Бондаренко , А.Г. Кравец144-1592025-07-24Аннотация ▼Данная статья посвящена разработке и апробации нового подхода к сбору, обработке и анализу открытых данных на русском языке для идентификации ключевых технологических направлений. Для решения задачи формирования и последующего анализа структурированных датасетов разработаны и программно реализованы методы веб-скрейпинга, обработки естественного языка и анализа временных рядов. Описанный в статье подход впервые применен для извлечения и структурирования информации из научных статей, новостных ресурсов и патентной документации на русском языке. В результате анализа полученного датасета научных публикаций выделены 30 наиболее часто упоминаемых биграмм и столько же триграмм технологических терминов.
На основе анализа частотности биграмм и триграмм выделены ключевые технологические термины, которые затем использованы для комплексной фильтрации по ключевым технологиям. Комплексная фильтрация позволила осуществить поиск русскоязычных патентов и их сбор для дальнейшего анализа. В результате предварительной обработки полученной патентной информации сформированы временные ряды патентной активности. Программная система идентификации ключевых технологий реализована на JavaScript и Python с использованием библиотек Selenium и BeautifulSoup для веб-скрейпинга, NLTK и Scikit-learn для обработки и анализа текстовых данных. Исследование динамики развития ключевых технологий во времени позволило выявить периоды интенсивной патентной деятельности и снижения интереса к той или иной технологии. Результаты, изложенные в статье, создают основу для дальнейшей разработки методов машинного обучения с целью прогнозирования технологического развития и выявления перспективных направлений прикладных исследований. -
АНАЛИЗ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА, ПРИМЕНЯЕМЫХ ДЛЯ РЕШЕНИЯ ЗАДАЧ ПСИХИАТРИИ
Е. С. Подоплелова2022-05-26Аннотация ▼Использование методов искусственного интеллекта в области медицины получило
широкое распространение, помогая диагностировать, анализировать и давать рекоменда-
ции по лечению. Психиатрия – это область медицины, изучающая психические расстрой-
ства, методы их диагностики и лечения. В спектр ее задач входит не только диагностика
и лечение, но также наблюдение, мониторинг и последующая реабилитация пациентов.
Эта предметная область имеет существенные проблемы, такие как объективность, про-
тиворечивость диагноза, сложность классификации болезней, непредсказуемость течения
заболевания. С рядом этих проблем помогает справиться использование методов машин-
ного обучения и алгоритмы искусственного интеллекта. Данная работа посвящена обзору
исследований методов искусственного интеллекта, применяемых для решения задач в об-
ласти психиатрии. Актуальность темы обусловлена высокой потребностью данной пред-
метной области в улучшениях. Конкретные проблемы представлены в данной статье.
Среди них были выделены основные направления: деидентификация данных, классификация
тяжести симптомов, точность прогнозирования состояния. Для их решения авторами
были применены такие методы как латентный семантический анализ для обработки ес-
тественного языка, методы классификации, сверточные нейронные сети для прогнозиро-
вания, когнитивное моделирование. Отдельно отмечена эффективность гибридных сис-
тем, включающих реализацию сразу нескольких метолов машинного обучения. Целью ис-
следования было выделить основные направления развития исследований научного сообще-
ства, которые демонстрируют успешную интеграцию искусственного интеллекта в пси-
хиатрию, а также сравнение их между собой по полученным оценкам точности моделей.
Что, в свою очередь, подразумевает разбор и анализ конкретных алгоритмов, их произво-
дительность для конкретных задач. -
МЕТОДЫ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
В. В. Курейчик , С. И. Родзин , В.В. Бова2022-05-26Аннотация ▼Представлен анализ подходов, основанных на глубоком обучении (DL), к задачам об-
работки естественного языка (NLP). Исследование охватывает различные задачи NLP,
реализованные с помощью искусственных нейронных сетей (ANNs), сверточных нейронных
сетей (CNNs) и рекуррентных нейронных сетей (RNNs). Эти архитектуры позволяют ре-
шать широкий спектр задач обработки естественного языка, ранее не поддававшихся
эффективному решению: моделирование предложений, маркировка семантической роли,
распознавание именованных сущностей, ответы на вопросы, категоризация текста, ма-
шинный перевод. Наряду с преимуществами использования CNN для решения задач NLP
имеются проблемы, связанные с большим числом варьируемых параметров сети и выбором
ее архитектуры. Мы предлагаем для оптимизации архитектур сверточных нейронных
сетей эволюционный алгоритм. Алгоритм инициализирует случайную популяцию из малого
числа агентов (не более 5) и с помощью фитнесс функции получает оценки каждого агента
в популяции. Затем проводится турнирная селекция между всеми агентами и применяется
оператор кроссинговера между выбранными агентами. Алгоритм обладает таким пре-
имуществом как малый размер популяции сетей, он использует несколько типов слоев
CNN: сверточный слой, максимальный слой пулинга (субдискретизации), средний слой пу-
линга и полносвязный слой. Алгоритм тестировался на локальном компьютере с графиче-
ским процессором ASUS Cerberus GeForce ® GTX 1050 Ti OC Edition 4 ГБ GDDR5, 8 ГБ
оперативной памяти и процессором Intel(R) Core(TM) i5-4670. Результаты экспериментов
показали, что предлагаемый нейроэволюционный подход способен достаточно быстро
найти оптимизированную архитектуру CNN для заданного набора данных с приемлемым
значением точности. Для завершения выполнения алгоритма потребовалось около 1 часа.
Для создания и обучения CNN был использован популярный фреймворк TensorFlow.
Для оценки алгоритма использовались общедоступные наборы данных: MNIST и MNIST-RB.
Наборы содержали черно-белые изображения рукописных букв и цифр с 50000 обучающими
образцами и 10000 тестовыми образцами.








