Найти
Результаты поиска
-
ФОРМИРОВАНИЕ ИМПУЛЬСНОЙ ХАРАКТЕРИСТИКИ РЕКУРСИВНОГО ФИЛЬТРА НИЖНИХ ЧАСТОТ С КОНЕЧНОЙ ИМПУЛЬСНОЙ ХАРАКТЕРИСТИКОЙ В ВИДЕ СУММЫ КВАЗИГАРМОНИК УСЕЧЕННОГО РЯДА ФУРЬЕ
Д.И. Бакшун , И.И. Турулин221-2282025-12-30Аннотация ▼Задача сокращения количества арифметических операций в алгоритмах цифровой фильтрации является актуальной, поскольку это напрямую влияет на энергопотребление, быстродействие и аппаратные затраты. В условиях жестких требований к энергопотреблению мобильных и встраиваемых устройств сокращение операций умножения и сложения становится важным фактором проектирования. В статье рассмотрена методика реализации рекурсивного фильтра с конечной импульсной характеристикой (КИХ) в виде усеченной функции sinc, сглаженной окном (весовой функцией), которая представляет собой сумму квазигармонических функций. Квазигармонические функции с разными частотами представляют собой полиномы степени . За основу взят полином второй степени и предложен численный метод повышения степени полинома для улучшения точности аппроксимации. Анализ точности аппроксимации показал, что при использовании полиномов 4-ой и 6-ой степени достигается погрешность аппроксимации менее 1%. Коэффициенты нерекурсивной части фильтра вычисляются через нахождение обратных конечных разностей исходной КИХ. Коэффициентами являются целые числа, значения которых зависят от числа отсчетов (длины) полупериода квазисинусной функции, что упрощает реализацию подобного РКИХ-фильтра на базе программируемой логической интегральной схемы (ПЛИС). Результаты численного анализа конечных разностей для каждой квазисинусоиды показали, что при использовании квадратичной аппроксимации требуется всего 16 отсчетов, однако при этом будет относительно высокий уровень боковых лепестков
(–30 дБ). Переход к аппроксимации 4-го порядка увеличивает количество ненулевых коэффициентов до 20-ти и приводит к существенному (на 13 дБ) уменьшению уровня частотной характеристики в полосе заграждения, который достигает -43 дБ -
МЕТОД ГЕНЕРАЦИИ ТОПОЛОГИЧЕСКИХ ОГРАНИЧЕНИЙ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР ДЛЯ РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
А.А. Диченко , И. И. Левин , Д.А. Сорокин33-462025-12-30Аннотация ▼Для реконфигурируемых вычислительных систем на базе ПЛИС эффективными прикладными программами являются параллельно-конвейерные программы, обеспечивающие реальную производительность более 50% от пиковой. Статья посвящена решению проблемы сокращения времени их разработки. Вычислительные структуры таких программ используют большой объём вычислительного ресурса ПЛИС, функционирующих на высокой тактовой частоте. Однако одновременная максимизация объёма задействованного ресурса ПЛИС и тактовой частоты находится в некотором противоречии, поскольку при большом заполнении снижается вариативность размещения функциональных узлов вычислительных структур и коммутационная матрица ПЛИС при трассировке информационных каналов между ними не обеспечивает требуемых характеристик по времени распространения сигналов. Более того в современных САПР алгоритмы размещения и трассировки учитывают только архитектурные и геометрические особенности ПЛИС. Поэтому при использовании большого числа специализированных примитивов, вариативность размещения которых крайне мала, достижение высоких тактовых частот в автоматическом режиме синтеза практически невозможно. Для решения этой проблемы также необходимо учитывать информационные зависимости между функциональными узлами вычислительных структур, но характер информационных зависимостей решаемых задач различных предметных областей может существенно отличаться. Поэтому разработчики вынуждены каждый раз вручную размещать на ПЛИС функциональные узлы путём создания скриптовых инструкций топологических ограничений. Время формирования топологических ограничений для ПЛИС прежних поколений было приемлемым, поскольку они содержали, как правило, до нескольких сотен специализированных примитивов. Однако в современных ПЛИС их количество достигает нескольких тысяч и даже десятков тысяч штук, что приводит к значительному увеличению времени разработки эффективных прикладных программ. Предлагаемый метод позволяет автоматизировать процесс разработки топологических ограничений вычислительных структур. Исследования были проведены при разработке прикладных программ решения ряда задач на основе алгоритмов БПФ, AES и
LU-разложения для реконфигурируемого компьютера «Tertius-2». В результате значительного сокращения временных затрат, обусловленных числом итераций оптимизации вычислительных структур, общее время синтеза было сокращено до трех раз -
ПРОЕКТИРОВАНИЕ МОДУЛЕЙ НЕЙРОСЕТЕЙ MLP И CNN НА ПЛИС ДЛЯ ЗАДАЧ КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ
Э. В. Мельник , Д.Е. Блох , А.И. Безмельцев , В.С. Панищев , С.Н. Полторацкий214-2292025-11-10Аннотация ▼Актуальность. Развитие методов машинного обучения и архитектур нейронных сетей, а также их распространение в различные сферы промышленности обуславливают актуальность решения задач по их аппаратной реализации. Использование программируемых логических интегральных схем в этой области позволит повысить скорость обработки данных и адаптивность реализуемых алгоритмов. Однако проектирование нейросетевых архитектур на программируемых логических интегральных схемах сопряжено с рядом методологических и технических сложностей, включая оптимизацию параллельных вычислений, управление аппаратными ресурсами и обеспечение работы в условиях ограниченных вычислительных ресурсов. Цель работы – анализ и сравнение двух архитектур нейронных сетей, многослойного перцептрона (MLP) и сверточной нейронной сети (CNN), в контексте их аппаратной реализации на программируемых логических интегральных схемах (ПЛИС). Особое внимание уделяется компромиссу между точностью классификации и эффективностью использования ограниченных аппаратных ресурсов ПЛИС. Методы исследования. Для достижения цели была проведена разработка и симуляция двух модулей на ПЛИС
Virtex 7, перцептронного и сверточного. Использовался набор данных MNIST, уменьшенный до 20×20 пикселей. Реализация включала этапы квантования параметров до фиксированного формата 16:16, оптимизацию гиперпараметров, применение табличных вычислений для нелинейных функций и оценку использования ресурсов ПЛИС. Результаты и обсуждения. MLP достиг точности 93% при использовании 11% логических элементов, в то время как CNN обеспечила точность 98%, но потребовала существенно больше ресурсов. Использование внутренних буферов для хранения промежуточных данных в CNN привело к превышению допустимых ресурсов. Вынужденный переход к внешней памяти увеличил задержки и объем портов ввода-вывода. Выводы. Исследование показало, что выбор архитектуры зависит от приоритетов: CNN обеспечивает лучшую точность, но менее эффективна в ресурсах. Для embedded-систем с ограничениями по памяти и потреблению энергии предпочтительна упрощенная MLP-реализация. Основными проблемами остаются нехватка внутренней памяти и высокая ресурсоемкость операций, что требует дальнейших исследований в области аппаратной оптимизации и адаптивного управления вычислениями -
МЕТОДИКА СОЗДАНИЯ ТОПОЛОГИЧЕСКИХ ОГРАНИЧЕНИЙ ПРИ ВЫСОКОЙ УТИЛИЗАЦИИ РЕСУРСОВ ПЛИС
К.Н. Алексеев , Д.А. Сорокин , А.Л. Леонтьев2022-11-01Аннотация ▼Рассмотрена проблема достижения высокой реальной производительности реконфи-
гурируемых вычислительных систем при решении вычислительно трудоёмких задач различ-
ных предметных областей. Величину реальной производительности реконфигурируемых сис-
тем определяют параметры выполняемых на них программ, основной компонентой которых
являются вычислительные структуры обработки данных, реализованные в виде конфигура-
ционных файлов ПЛИС. При этом одним из ключевых параметров любой вычислительной
структуры является тактовая частота ее работы, которая непосредственно влияет на её
производительность. Однако достижение высоких тактовых частот сопряжено с рядом
проблем, которые современные средства САПР не решают. Причина кроется в неоптималь-
ном топологическом размещении функциональных узлов вычислительной структуры на поле
примитивов ПЛИС, особенно при высокой утилизации ресурсов. Это приводит к повышенной
нагрузке на коммутационную матрицу ПЛИС и, как следствие, связи между примитивами
ПЛИС, имеющими функциональную зависимость, оказываются значительно длиннее, чем
это допустимо. Кроме того, излишняя длина связей наблюдается при трассировке соедине-
ний между примитивами, которые расположены на разных кремниевых кристаллах ПЛИС
или же физически разделены встроенными периферийными устройствами. В настоящей
статье описывается методика, которая позволяет рационализировать размещение элемен-
тов вычислительной структуры на поле примитивов ПЛИС, минимизировать длину трасс
между примитивами, а также минимизировать число трасс между физически разделенны-
ми топологическими областями ПЛИС. Работоспособность предложенной методики пока-
зана на примере решения тестовой задачи «КИХ-фильтр» на реконфигурируемом компьюте-
ре «Терциус». Проиллюстрированы основные проблемы при достижении целевой тактовой
частоты и описан способ их преодоления. Применение методики позволило увеличить так-
товую частоту и тем самым поднять производительность «Терциус» на 25% без перера-
ботки функциональной схемы вычислительной структуры задачи. Текущие исследованияэффективности предложенной методики позволяют утверждать, что автоматизирован-
ные средства создания топологических ограничений на её основе позволят существенно со-
кратить время разработки программ с требуемыми характеристиками для реконфигури-
руемых вычислительных систем. -
РЕАЛИЗАЦИЯ В БАЗИСЕ ПЛИС РЕЛЯТОРНЫХ КОНТРОЛИРУЮЩИХ ОПРОСНЫХ УСТРОЙСТВ ЦИФРОВЫХ СИГНАЛОВ
С.А. Панычев , А.И. Панычев , А.В. Максимов270-2802025-07-31Аннотация ▼Сформулированы требования к современным средствам технического контроля и функ-
циональной диагностики оборудования для ответственных применений, одним из которых яв-
ляется обработка диагностической информации в темпе реального времени. Отмечено, что
для работы с цифровыми диагностическими сигналами перспективными являются реляторные
контролирующие опросные устройства, основанные на аппарате порядковой логики, дающей
существенный временной выигрыш перед традиционной двоичной логикой. Аппаратная реали-
зация порядково-логических опросных устройств в базисе ПЛИС наряду с очевидными преиму-
ществами этапа разработки позволит осуществлять оперативную реконфигурацию внутрен-
ней структуры для адаптации к изменяющимся условиям функционирования объекта контроля.
Рассмотрена аппаратная реализация двух известных устройств. Устройство переменного
приоритета использовано для выявления зафиксировавшего отказ или сбой датчика с возмож-
ностью установки номера датчика, с которого начнется опрос, и направления обхода датчи-
ков. Устройство централизованного контроля группы объектов применено для поиска экстре-
мального (максимального или минимального) цифрового диагностического сигнала с одновре-
менным определением номера соответствующего датчика за один такт работы системы
контроля и диагностики. Разработка комбинационных схем данных контролирующих опросных
устройств выполнена средствами ISE Design Suite 14.7. Представлены положительные резуль-
таты тестирования алгоритмов работы созданных моделей, сведенные в таблицы состояний
входов и выходов схем и иллюстрируемые временными диаграммами двоичных сигналов на вы-
водах схем. Дана оценка требуемых затрат ресурсов ПЛИС, выраженная в количестве логиче-
ских элементов и пользовательских контактов. Также на примере приборов низкой интеграции
и наиболее ресурсоемких образцов даны верхняя и нижняя оценки количество ПЛИС различных
типов семейств Xilinx Spartan-6, Xilinx Virtex-4 и отечественной серии 5576/5578 АО «КТЦ
«Электроника». Установлено, что при количестве диагностических датчиков до 200 в зависи-
мости от семейства ПЛИС для реализации одного контролирующего опросного устройства
требуется до 17 микросхем низкой интеграции и до 7 ресурсоемких микросхем -
МОДИФИКАЦИЯ РЕАЛИЗАЦИИ МЕТОДА ЯКОБИ ПРИ МОДЕЛИРОВАНИИ СУПЕРДИФФУЗИИ РАДОНА НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
М.Д. Чекина198-2062021-10-05Аннотация ▼При исследовании природных объектов часто возникает проблема моделирования сложных систем, обладающих структурой, не поддающейся описанию посредством инструментов евклидовой геометрии, поэтому для их представления используют фрактальную геометрию и соответствующей ей математический аппарат. Так модель переноса радона в неоднородной среде, использующая супердиффузию, отображает реальные данные точнее классической. Повышение концентрации радона в воздухе является одним из признаков приближающихся землетрясений, что обусловливает необходимость моделирования распространения этого радиоактивного инертного газа в реальном времени. Реконфигурируемые вычислительные системы обладают большим потенциалом для решения задач в реальном времени, но существующие на данных момент средства решения систем линейных алгебраических уравнений имеют низ-кую эффективность из-за нерегулярной структуры матриц, полученных при дискретизации модели супердиффузии радона с применением адаптивных сеток. Базовый подграф метода Якоби преобразуется следующим образом: входные данные векторизуются, структура кадра, в котором производится вычисление значения одного неизвестного, разделяется на несколько микрокадров, распараллеливая вычисления в первом микрокадре, где производится сумма произведений коэффициентов матрицы и значений неизвестных с предыдущей итерации. Полученные результаты буферизируются для последующей выдачи на второй микрокадр, где происходит окончательная обработка и выдача результата итерации. Описанные подход позволяет сократить простой оборудования при решении системы линейных алгебраических уравнений (СЛАУ) с разреженными нерегулярными матрицами, и дает выигрыш по скорости в 5–15 раз по сравнению с существующими методами решения СЛАУ на реконфигурируемых вычисли-тельных системах.
-
АНАЛИЗ ВОЗМОЖНОСТЕЙ СОВРЕМЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ ТЕХНОЛОГИЙ ДЛЯ РАСЧЕТА ТОЧНЫХ ПРИБЛИЖЕНИЙ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ ЗНАЧЕНИЙ СТАТИСТИК
А.К. Мельников , И.И. Левин , А.И. Дордопуло , И.В. Писаренко6-192021-10-05Аннотация ▼В статье рассматривается решение вычислительно-трудоемкой задачи – расчета распределений вероятностей значений статистик – с помощью современных вычисли-тельных технологий. Для сокращения вычислительной сложности при обеспечении достаточного уровня эффективности критериев не ниже заданного порога предложено использование Δ-точных приближений. Для расчета точных приближений используется метод второй кратности, основанный на решении системы линейных уравнений, который позволяет при заданном вычислительном ресурсе рассчитывать точные приближения для максимальных значений параметров выборок. Наиболее трудоемкая часть метода второй кратности состоит в процедуре последовательного получения векторов возможных решений и их проверки на принадлежность к самим решениям. Проверка векторов возможных решений на принадлежность к решениям системы информационно независима, поэтому алгоритм расчета можно распараллелить по данным. Приведена формула определения алгоритмической сложности расчета точных приближений распределений вероятностей значений статистик, на основе которой получены оценки сложности современных практических задач для выборок со следующими значениями (N, n) мощности алфавита и объёма выборки: (256,1280), (128,640), (128, 320) и (192,3200) при точности расчета =10-5. Вычислительная сложность расчета составляет от 9,68·1022 до 1,60·1052 операций, средняя порядка 4,55·1025 операций, число проверяемых векторов – от 6,50·1023 до 1,39·1050, а число решений – от 4,67·1012 до 5,60·1025 соответственно. Общее время решения при круглосуточном режиме вычислений не должно превышать 30 дней или 2,592·106 сек. Для полученных оценок сложности проанализированы возможности современных кластерных вы-числительных систем на основе универсальных процессоров, графических ускорителей и реконфигурируемых вычислительных систем на основе программируемых логических интегральных схем. Для каждой технологии определено число вычислительных узлов, требуемых для расчета точных приближений с указанными параметрами в заданное время. Показано, что ни одна из рассмотренных вычислительных технологий на современном уровне развития техники не позволяет получить решение для необходимых параметров расчета точных приближений распределений вероятностей значений статистик. В заключении сделан вывод о необходимости анализа возможностей перспективных вычислительных технологий на основе квантовых и фотонных компьютеров, а также гибридных вычисли-тельных систем для расчета точных приближений распределений вероятностей значений статистик с заданными параметрами в оперативно-приемлемое время
-
МЕТОД РЕШЕНИЯ ГРАФОВЫХ NP-ПОЛНЫХ ЗАДАЧ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ НА ОСНОВЕ ПРИНЦИПА РАСПАРАЛЛЕЛИВАНИЯ ПО ИТЕРАЦИЯМ
А. В. Касаркин2021-02-25Аннотация ▼При решении графовых NP-полных задач на многопроцессорных системах рост обо-
рудования не приводит к пропорциональному росту производительности системы, поэто-
му не всегда удается решить задачу за приемлемое время. Целью работы, описанной в
статье, является минимизация времени решения задачи поиска максимальных клик графа с
использованием реконфигурируемых вычислительных систем (РВС). При решении задачи
на РВС методом распараллеливания по слоям рост производительности также замедля-
ется, несмотря на лучшую степень масштабируемости по сравнению с многопроцессор-
ными реализациями. В статье предложен метод создания параллельно-конвейерных про-
грамм для реконфигурируемых вычислительных систем на основе распараллеливания по
итерациям для решения графовых NP-полных задач. Рассмотрено, что использовать би-
товый способ представления множеств (как в методе распараллеливания по слоям) для
метода распараллеливания по итерациям не является эффективным. Новый метод отли-
чается организацией вычислений, а именно – обработкой неупорядоченных множеств,
доступ к элементам которых осуществляется не по адресам (как в массивах), а по значе-
ниям (именам вершин и именам дуг графа). Показано, что новый метод на основе распа-
раллеливания по итерациям, несмотря на более низкую удельную производительность, свя-
занную с тем, что вычислительным подструктурам из-за символьного представления
множеств необходимо обработать большее число промежуточных данных, обеспечивает
практически линейный рост реальной производительности РВС при значительно большем
количестве вычислительного ресурса по сравнению с методом распараллеливания по слоям. -
РЕАЛИЗАЦИЯ ФРАКТАЛЬНОГО СЖАТИЯ И ДЕКОМПРЕССИИ ИЗОБРАЖЕНИЙ ПАРАЛЛЕЛЬНО-КОВЕЙЕРНЫМ СПОСОБОМ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
М.Д. Чекина2021-02-25Аннотация ▼Фрактальные алгоритмы находят все большее количество областей применения –
от компьютерной графики до моделирования сложных физических процессов, но для их
программной реализации требуются значительные вычислительные мощности. Фрак-
тальное сжатие изображений отличается высокой степенью компрессии данных при хо-
рошем качестве восстановленного изображения. Целью данной работы является повыше-
ние производительности реконфигурируемых вычислительных систем (РВС) при реализа-
ции фрактального сжатия и декомпрессии изображений. В работе описаны разработан-
ные методы фрактального сжатия и последующей декомпрессии изображений, реализо-
ванные параллельно-конвейерным способом для РВС. Основная идея параллельной реализа-
ции фрактального сжатия изображений сводится к параллельному выполнению попарного
сравнения доменных и ранговых блоков. Для достижения наилучшей производительности
необходимо одновременно сравнивать максимальное количество пар. При практической
реализации фрактального сжатия изображений на РВС учитываются такие критические
ресурсы, как количество входных каналов и количество логических ячеек ПЛИС. Для задачи
фрактального сжатия изображения критическим ресурсом являются каналы данных, по-
этому параллельная организация вычислений заменяется параллельно-конвейерной после
выполнения редукцию производительности параллельной вычислительной структуры. По-
дача каждого операнда в вычислительную структуру осуществляется последовательно
(побитово), что экономит вычислительный ресурс и уменьшает простой оборудования.
Для хранения коэффициентов системы итерируемых функций, кодирующих изображение,
введена структура данных, задающая отношения между номерами ранговых и доменных
блоков и соответствующими параметрами. Для удобства последующей декомпрессии
элементы массива, кодирующего сжатое изображение, упорядочены по номерам ранговых
блоков, что позволяет избежать двойной косвенной адресации в вычислительной структу-
ре. Представленный подход позволяет масштабировать параллельно-конвейерную про-
грамму на любое количество программируемых логических интегральных схем (ПЛИС).
Практическая реализация фрактального сжатия изображений, выполненная на реконфи-
гурируемом компьютере Терциус-2, содержащем восемь ПЛИС, обеспечивает ускорение в
15000 раз по сравнению с универсальным многоядерным процессором и в 18–25 раз по срав-
нению с существующими решениями для ПЛИС. Реализация декомпрессии изображения на
реконфигурируемом компьютере показывает ускорение в 380 раз по сравнению с аналогич-
ной реализацией для многоядерного универсального процессора. -
МОДЕЛИРОВАНИЕ СТРУКТУРЫ КУБАТУРНЫХ ФОРМУЛ ДЛЯ ПРОЕКТИРОВАНИЯ ЭФФЕКТИВНЫХ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР НА ПЛИС
Н. С. Кривша , В. В. Кривша , С.А. Бутенков2021-01-19Аннотация ▼Предлагается метод построения вычислительных моделей для исследования и опти-
мизации универсальных вычислительных структур, выполняющих вычисление вычисления
сложных кубатурных формул. Теоретической базой для введенных моделей служит теория
пространственной грануляции, методы которой разработаны коллективом авторов. Ме-
тодология пространственной грануляции позволяет переходить от вычислений в точечном
метрическом пространстве данных (которое не всегда существует) к вычислениям в аф-
финном многомерном пространстве, содержащем укрупненные единицы данных (про-
странственные гранулы). Такое преобразование данных основано на использовании аффин-
но-инвариантных моделей декартовых гранул и основывается на оптимальных процедурах
покрытия точечного пространства выпуклыми гранулами. Такие полезные вычислитель-
ные свойства введенных моделей данных позволяют построить вычислительно эффектив-
ные процедуры для манипулирования многомерными данными, одним из приложений кото-
рых является вычисление многомерных кубатурных формул. Новые модели позволяют соз-
давать наглядные матричные модели данных произвольной размерности для целей плани-
рования структуры вычислительных процессов и построения информационных графов
таких процессов. Эффективное и наглядное представление сложных вычислительных
формул позволяет выполнять эквивалентные (с численной точки зрения) преобразования
таких формул с целью выбора эффективных схемных решений для построения высокопро-
изводительных вычислительных блоков вычисления кубатур высокой размерности на базе
ПЛИС. На основе оптимизированных моделей вычислительных структур строятся схем-
ные решения, реализующие кубатурные формулы на реконфигурируемых вычислительных
системах. Сложность решения задачи проектирования на ПЛИС связана с тем, что ис-
пользуемые вычислительные средства содержать поля ПЛИС, проектирование вычисли-
тельных структур для которых является вычислительно сложной задачей. Авторы ис-
пользовали разработанные в организации автоматизированные средства проектирования
на полях ПЛИС, такие как язык высокого уровня COLAMO, язык низкого уровня Fire Constructor
и сопутствующие программные средства для реализации полученных информаци-
онных графов многомерных кубатур и экспериментальной оценки качества полученных
результатов. Предлагаемый в работе теоретический подход к моделированию и оптими-
зации информационных графов вычислительных структур может быть распространен на
широкий круг задач вычислительной математики. -
МЕТОДЫ ЛОГИЧЕСКОГО РЕСИНТЕЗА ДЛЯ ТОПОЛОГИЧЕСКОГО ПРОЕКТИРОВАНИЯ МИКРОЭЛЕКТРОННЫХ СХЕМ
Н. О. Васильев , П. И. Фролова , Г. А. Иванова , А. Н. Щелоков2020-11-22Аннотация ▼С уменьшением технологических норм возрастает число правил проектирования.
Для сокращения временных затрат на проверку правил проектирования для технологий 22
нм и ниже переходят к использованию регулярных структур в нижних слоях топологии.
При проектировании схем на основе регулярного шаблона становится возможным совме-
щение логического и топологического этапов проектирования. Данная задача также ак-
туальна для проектирования схем на ПЛИС. В данной работе рассматривается метод
структурной оптимизации логических схем на этапе топологического проектирования.
Метод адаптирован для применения в маршруте проектирования схем с регулярными
структурами в нижних слоях топологии, а также для ресинтеза технологических ото-
бражений на ПЛИС. Для схем с применением регулярных структур предлагается метод
логического синтеза в базисе элементов, для которых построены компактные топологиче-
ские шаблоны. Это позволяет упростить этап топологического проектирования, а также
ведет к дополнительному снижению площади проектируемого устройства. Оптимизация
логических схем для ПЛИС проводится при помощи алгоритма моделирования отжига,
производящего логические операции над специальной графовой моделью, учитывающей
особенности ПЛИС. Учет особенностей различных технологий в предлагаемом методе
позволяет добиться хороших результатов по необходимым параметрам, в частности по
занимаемой проектируемой схемой площади. -
СПОСОБ ИСПОЛЬЗОВАНИЯ СРЕДСТВ БЫСТРОГО ПРОТОТИПИРОВАНИЯ ДЛЯ РЕАЛИЗАЦИИ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ НА ПЛИС
В.В. Бахчевников , В. А. Деркачев , А. Н. Бакуменко2020-10-11Аннотация ▼Исследования в области искусственного интеллекта ведутся с возрастающим и н-
тересом с каждым годом. Области применения искусственного интеллекта довольно
обширны: автоматизация, анализ большого объема данных, технологии умного дома,
машинное зрение и т.д. Технологии искусственного интеллекта базируются на использ о-
вании искусственных нейронных сетей, имеющие в своей основе принципы нервной сис-
темы животных. При этом актуальным вопросом является реализация искусственных
нейронных сетей на различных программно-аппаратных платформах: программируемых
логических интегральных схемах (ПЛИС) типа FPGA (Field Programmable Gate Array), на
интегральных схемах специального назначения (Application-Specific Integrated Circuit,
ASIC), GPU, CPU и т.д. ПЛИС наилучшим образом проявляют себя в маломощных мо-
бильных системах. ASIC демонстрируют наибольшую производительность с н едостат-
ком: высокая цена разработки. Проблема быстрого прототипирования проектов, осн о-
ванных на использовании искусственных нейронных сетей, для ПЛИС привычными мет о-
дами (c помощью HDL-языков, HDL-кодеров, графического программирования) заключа-
ется в том, что либо такой проект сложен и длителен в отладке (HDL-языки), либо не
оптимален получающийся код (HDL-кодеры), либо высока длительность разработки
проекта и сложность реконфигурации нейронной сети (графическое программирование).
Поэтому в рамках данной работы рассматривается эффективный метод проектирова-
ния полносвязных и сверточноых нейронных сетей для их реализации на ПЛИС использ о-
ванием пакета Xilinx System Generator for DSP и Matlab/Simulink. Генерируемые таким
образом искусственные нейросети легко реконфигурируемы и позволяют решать сле-
дующие задачи: распознавание изображений, оптимальная фильтрация (например, для
задач подповерхностной радиолокации).








