Найти
Результаты поиска
-
ПРОЕКТИРОВАНИЕ МОДУЛЕЙ НЕЙРОСЕТЕЙ MLP И CNN НА ПЛИС ДЛЯ ЗАДАЧ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ
Э. В. Мельник , Д.Е. Блох , А.И. Безмельцев , В.С. Панищев , С.Н. Полторацкий214-2292025-11-10Аннотация ▼Актуальность. Развитие методов машинного обучения и архитектур нейронных сетей, а также их распространение в различные сферы промышленности обуславливают актуальность решения задач по их аппаратной реализации. Использование программируемых логических интегральных схем в этой области позволит повысить скорость обработки данных и адаптивность реализуемых алгоритмов. Однако проектирование нейросетевых архитектур на программируемых логических интегральных схемах сопряжено с рядом методологических и технических сложностей, включая оптимизацию параллельных вычислений, управление аппаратными ресурсами и обеспечение работы в условиях ограниченных вычислительных ресурсов. Цель работы – анализ и сравнение двух архитектур нейронных сетей, многослойного перцептрона (MLP) и сверточной нейронной сети (CNN), в контексте их аппаратной реализации на программируемых логических интегральных схемах (ПЛИС). Особое внимание уделяется компромиссу между точностью классификации и эффективностью использования ограниченных аппаратных ресурсов ПЛИС. Методы исследования. Для достижения цели была проведена разработка и симуляция двух модулей на ПЛИС
Virtex 7, перцептронного и сверточного. Использовался набор данных MNIST, уменьшенный до 20×20 пикселей. Реализация включала этапы квантования параметров до фиксированного формата 16:16, оптимизацию гиперпараметров, применение табличных вычислений для нелинейных функций и оценку использования ресурсов ПЛИС. Результаты и обсуждения. MLP достиг точности 93% при использовании 11% логических элементов, в то время как CNN обеспечила точность 98%, но потребовала существенно больше ресурсов. Использование внутренних буферов для хранения промежуточных данных в CNN привело к превышению допустимых ресурсов. Вынужденный переход к внешней памяти увеличил задержки и объем портов ввода-вывода. Выводы. Исследование показало, что выбор архитектуры зависит от приоритетов: CNN обеспечивает лучшую точность, но менее эффективна в ресурсах. Для embedded-систем с ограничениями по памяти и потреблению энергии предпочтительна упрощенная MLP-реализация. Основными проблемами остаются нехватка внутренней памяти и высокая ресурсоемкость операций, что требует дальнейших исследований в области аппаратной оптимизации и адаптивного управления вычислениями -
МЕТОД РЕШЕНИЯ ГРАФОВЫХ NP-ПОЛНЫХ ЗАДАЧ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ НА ОСНОВЕ ПРИНЦИПА РАСПАРАЛЛЕЛИВАНИЯ ПО ИТЕРАЦИЯМ
А. В. Касаркин2021-02-25Аннотация ▼При решении графовых NP-полных задач на многопроцессорных системах рост обо-
рудования не приводит к пропорциональному росту производительности системы, поэто-
му не всегда удается решить задачу за приемлемое время. Целью работы, описанной в
статье, является минимизация времени решения задачи поиска максимальных клик графа с
использованием реконфигурируемых вычислительных систем (РВС). При решении задачи
на РВС методом распараллеливания по слоям рост производительности также замедля-
ется, несмотря на лучшую степень масштабируемости по сравнению с многопроцессор-
ными реализациями. В статье предложен метод создания параллельно-конвейерных про-
грамм для реконфигурируемых вычислительных систем на основе распараллеливания по
итерациям для решения графовых NP-полных задач. Рассмотрено, что использовать би-
товый способ представления множеств (как в методе распараллеливания по слоям) для
метода распараллеливания по итерациям не является эффективным. Новый метод отли-
чается организацией вычислений, а именно – обработкой неупорядоченных множеств,
доступ к элементам которых осуществляется не по адресам (как в массивах), а по значе-
ниям (именам вершин и именам дуг графа). Показано, что новый метод на основе распа-
раллеливания по итерациям, несмотря на более низкую удельную производительность, свя-
занную с тем, что вычислительным подструктурам из-за символьного представления
множеств необходимо обработать большее число промежуточных данных, обеспечивает
практически линейный рост реальной производительности РВС при значительно большем
количестве вычислительного ресурса по сравнению с методом распараллеливания по слоям. -
СПОСОБ ИСПОЛЬЗОВАНИЯ СРЕДСТВ БЫСТРОГО ПРОТОТИПИРОВАНИЯ ДЛЯ РЕАЛИЗАЦИИ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ НА ПЛИС
В.В. Бахчевников , В. А. Деркачев , А. Н. Бакуменко2020-10-11Аннотация ▼Исследования в области искусственного интеллекта ведутся с возрастающим и н-
тересом с каждым годом. Области применения искусственного интеллекта довольно
обширны: автоматизация, анализ большого объема данных, технологии умного дома,
машинное зрение и т.д. Технологии искусственного интеллекта базируются на использ о-
вании искусственных нейронных сетей, имеющие в своей основе принципы нервной сис-
темы животных. При этом актуальным вопросом является реализация искусственных
нейронных сетей на различных программно-аппаратных платформах: программируемых
логических интегральных схемах (ПЛИС) типа FPGA (Field Programmable Gate Array), на
интегральных схемах специального назначения (Application-Specific Integrated Circuit,
ASIC), GPU, CPU и т.д. ПЛИС наилучшим образом проявляют себя в маломощных мо-
бильных системах. ASIC демонстрируют наибольшую производительность с н едостат-
ком: высокая цена разработки. Проблема быстрого прототипирования проектов, осн о-
ванных на использовании искусственных нейронных сетей, для ПЛИС привычными мет о-
дами (c помощью HDL-языков, HDL-кодеров, графического программирования) заключа-
ется в том, что либо такой проект сложен и длителен в отладке (HDL-языки), либо не
оптимален получающийся код (HDL-кодеры), либо высока длительность разработки
проекта и сложность реконфигурации нейронной сети (графическое программирование).
Поэтому в рамках данной работы рассматривается эффективный метод проектирова-
ния полносвязных и сверточноых нейронных сетей для их реализации на ПЛИС использ о-
ванием пакета Xilinx System Generator for DSP и Matlab/Simulink. Генерируемые таким
образом искусственные нейросети легко реконфигурируемы и позволяют решать сле-
дующие задачи: распознавание изображений, оптимальная фильтрация (например, для
задач подповерхностной радиолокации).








