Перейти к основному контенту Перейти к главному меню навигации Перейти к нижнему колонтитулу сайта
##common.pageHeaderLogo.altText##
Известия ЮФУ
Технические науки
  • Текущий выпуск
  • Предыдущие выпуски
    • Архив
    • Выпуски 1995 – 2019
  • Редакционный совет
  • О журнале
    • Официально
    • Основные задачи
    • Основные рубрики
    • Специальности ВАК РФ
    • Главный редактор
English
ISSN 1999-9429 print
ISSN 2311-3103 online
  • Вход
  1. Главная /
  2. Найти

Найти

Расширенные фильтры
Опубликовано после
Опубликовано до

Результаты поиска

Найден один результат.
  • МЕТОДЫ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ ОБРАБОТКИ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ

    В. В. Курейчик , С. И. Родзин , В.В. Бова
    2022-05-26
    Аннотация ▼

    Представлен анализ подходов, основанных на глубоком обучении (DL), к задачам об-
    работки естественного языка (NLP). Исследование охватывает различные задачи NLP,
    реализованные с помощью искусственных нейронных сетей (ANNs), сверточных нейронных
    сетей (CNNs) и рекуррентных нейронных сетей (RNNs). Эти архитектуры позволяют ре-
    шать широкий спектр задач обработки естественного языка, ранее не поддававшихся
    эффективному решению: моделирование предложений, маркировка семантической роли,
    распознавание именованных сущностей, ответы на вопросы, категоризация текста, ма-
    шинный перевод. Наряду с преимуществами использования CNN для решения задач NLP
    имеются проблемы, связанные с большим числом варьируемых параметров сети и выбором
    ее архитектуры. Мы предлагаем для оптимизации архитектур сверточных нейронных
    сетей эволюционный алгоритм. Алгоритм инициализирует случайную популяцию из малого
    числа агентов (не более 5) и с помощью фитнесс функции получает оценки каждого агента
    в популяции. Затем проводится турнирная селекция между всеми агентами и применяется
    оператор кроссинговера между выбранными агентами. Алгоритм обладает таким пре-
    имуществом как малый размер популяции сетей, он использует несколько типов слоев
    CNN: сверточный слой, максимальный слой пулинга (субдискретизации), средний слой пу-
    линга и полносвязный слой. Алгоритм тестировался на локальном компьютере с графиче-
    ским процессором ASUS Cerberus GeForce ® GTX 1050 Ti OC Edition 4 ГБ GDDR5, 8 ГБ
    оперативной памяти и процессором Intel(R) Core(TM) i5-4670. Результаты экспериментов
    показали, что предлагаемый нейроэволюционный подход способен достаточно быстро
    найти оптимизированную архитектуру CNN для заданного набора данных с приемлемым
    значением точности. Для завершения выполнения алгоритма потребовалось около 1 часа.
    Для создания и обучения CNN был использован популярный фреймворк TensorFlow.
    Для оценки алгоритма использовались общедоступные наборы данных: MNIST и MNIST-RB.
    Наборы содержали черно-белые изображения рукописных букв и цифр с 50000 обучающими
    образцами и 10000 тестовыми образцами.

1 - 1 из 1 результатов

links

Для авторов
  • Подать статью
  • Требования к рукописи
  • Редакционная политика
  • Рецензирование
  • Этика научных публикаций
  • Политика открытого доступа
  • Сопроводительные документы
Язык
  • English
  • Русский

journal

* не является рекламой

index

Индексация журнала
* не является рекламой
Информация
  • Для читателей
  • Для авторов
  • Для библиотек
Адрес редакции: 347900, г. Таганрог, ул. Чехова, д. 22, А-211 Телефон: +7 (8634) 37-19-80 Электронная почта: iborodyanskiy@sfedu.ru
Публикация в журнале бесплатна
Больше информации об этой издательской системе, платформе и рабочем процессе от OJS/PKP.
logo Сайт разработан командой ЦИИР