Найти
Результаты поиска
-
МЕТОД ОРГАНИЗАЦИИ ДИСКРЕТНО-СОБЫТИЙНЫХ ВЫЧИСЛЕНИЙ ДЛЯ ОБРАБОТКИ БОЛЬШИХ РАЗРЕЖЕННЫХ НЕСТРУКТУРИРОВАННЫХ МАТРИЦ НА РВС
А.В. Подопригора189-1972021-10-05Аннотация ▼С усложнением моделей исследуемых объектов и процессов в разных областях науки и техники появляется большое количество задач, для которых необходимо применять вы-сокопроизводительные вычислительные системы. Так, для обработки матричных массивов используют кластерные многопроцессорные вычислительные системы с применением специальных методов, направленных на организации параллельных вычислений, и в большинстве случаев производительность вычислительной системы является достаточно высокой. Однако такая эффективность вычислений наблюдается не на всех видах матриц. Матричная структура может содержать большое количество незначимых элементов, большую размерность, и ее портрет может быть неструктурированным. Решение такого рода матриц на кластерных МВС не позволяет получить производительность, близкую к пиковой, поскольку методы обработки никак не учитывают такую сложную структуру обрабатываемой матрицы, в результате чего производительность системы многократно снижается. Разработка методов для кластерных МВС не позволяет в полной мере обеспечить высокую производительность на классе задач, посвященной обработке больших раз-реженных неструктурированных матриц. Жесткая архитектура связей процессоров не учитывает особенности таких матриц, что приведёт к неоднородности загрузки вычис-лительного процессора. Для обеспечения производительности, близкой к пиковой на зада-чах обработки больших разряженных неструктурированных матриц, необходимо приме-нять реконфигурируемые вычислительные системы, архитектура которых позволяет адаптироваться под структуру решаемой задачи. Это позволяет организовывать конвейерную обработку так, чтобы вычислительный ресурс РВС был использован только на информационно значимые операции. Помимо использования общепринятых методов структурной организации высокопроизводительных вычислений для РВС, необходимо разработать формат хранения и передачи больших разреженных неструктурированных матриц, определить принципы построения базовых матричных макроопераций и возможность организации составных дискретно-событийных матричных функций для решения прикладных задач. В результате проведенных исследований положено начало метода, позволяющего организовать вычисления, операндами которых являются большие разреженные не-структурированные матрицы. Применение этого метода для организации вычислений позволяет существенно повысить производительность и обеспечить повышение эффективности работы такой системы.
-
ПЕРСПЕКТИВНЫЕ ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ РЕКОНФИГУРИРУЕМЫЕ ВЫЧИСЛИТЕЛИ С ИММЕРСИОННЫМ ОХЛАЖДЕНИЕМ
И.И. Левин, А. М. Федоров, Ю. И. Доронченко, М. К. Раскладкин2021-02-25Аннотация ▼Рассматриваются перспективны создания высокопроизводительных реконфигурируемых
вычислительных устройств на основе современных ПЛИС фирмы Xilinx семейства UltraScale+.
Целью работы является достижение в одном изделии с конструктивом 3U 19’ вычислительной
плотности до 128 ПЛИС высокой степени интеграции при обеспечении соответствующих
электропитания и охлаждения вычислительных элементов системы для решения вычислитель-
но трудоемких задач. Обеспечение требуемых характеристик изделия в заданном конструкти-
ве потребовало усложнения топологии печатных плат и технологии изготовления его состав-
ных частей. Для охлаждения компонентов вычислительной системы используется иммерсион-
ная (погружная) технология. Особенностью разрабатываемых вычислительных систем явля-
ется широкие возможности информационного обмена внутри блока и между блоками для ре-
шения сильносвязанных задач, в которых количество пересылок данных между функциональ-
ными устройствами больше, чем количество таких устройств. В качестве основных связей
между ПЛИС используются дифференциальные линии с подключенными к ним мульти-
гигабитными трансиверами (MGT). Разработанная на основе оптических каналов система
информационного обмена между блоками обеспечивает пропускную способность более
2 Тбит/с. Разработан и изготовлен опытный образец вычислительного модуля на основе ПЛИС
UltraScale+. На его основе изготовлен прототип реконфигурируемого вычислительного блока.
Вычислительный блок содержит в своем составе универсальный процессор и необходимые ин-
терфейсы ввода-вывода, являясь функционально законченным устройством. На вычислитель-
ном модуле нового поколения был реализован ряд алгоритмов различных научно-технических
задач, что подтвердило возможность широкого применения вычислителей. Разработана мо-
дернизированная иммерсионная подсистема охлаждения, которая обеспечивает отвод выде-
ляемой суммарной тепловой мощности до 20 кВт. Для достижения такого уровня теплоотво-
да реализованы технические решения по всем компонентам системы охлаждения: хладагенту,
радиаторам, насосу, теплообменнику. Объединение множества блоков в единый вычислитель-
ный контур позволит создавать вычислительные комплексы с производительностью до не-
скольких десятков петафлопс. Такие комплексы требуют наличия соответствующей инже-
нерной инфраструктуры. -
ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ НЕКОТОРЫХ ВИДОВ РЕКУРСИВНЫХ НЕЛИНЕЙНЫХ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР ДЛЯ ЭФФЕКТИВНОЙ РЕАЛИЗАЦИИ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
С. А. Дудко2021-02-25Аннотация ▼Рассматриваются методы информационно-эквивалентных преобразований некото-
рых видов нелинейных вычислительных структур с обратными связями: квадратичных,
дробных и условных. Наличие обратных связей в конвейерной вычислительной структуре,
решаемых на реконфигурируемых вычислительных системах прикладных задач, приводит к
замедлению скорости формирования данных, так как для вычисления очередного значения
требуется дождаться результата по обратной связи. При этом замедление происходит
не только на участке с обратной связью, но и во всей вычислительной структуре, что
приводит к увеличению времени, за которое данная задача может быть решена. Преды-
дущие фрагменты вынуждены задерживать свои данные перед подачей в обратную связь,
а последующие вынуждены простаивать, ожидая данные на выходе обратной связи. На
сегодняшний день не существует средств автоматического проектирования прикладных
задач для реконфигурируемых вычислительных систем, которые оптимизировали бы та-
кие вычислительные структуры в автоматическом режиме. Поэтому пользователь вы-
нужден самостоятельно изучать текст исходной программы и искать в нем выражения,
содержащие обратные связи, а затем оптимизировать их. Это приводит к увеличению
времени, требующегося для создания эффективных прикладных программ. Предложенные
методы преобразований позволяют сократить интервал обработки данных (в лучшем
случае до единицы) при решении прикладных задач на реконфигурируемых вычислительных
системах. Для реализации информационно-эквивалентных преобразований необходимо,
чтобы в вычислительной системе имелся дополнительный аппаратный ресурс. Реализация
данных преобразований в оптимизирующем синтезаторе схемотехнических решений по-
зволяет проводить оптимизацию вычислительной структуры с обратными связями авто-
матически. Это позволяет сократить время разработки эффективных прикладных про-
грамм, содержащих обратные связи, с нескольких дней до нескольких минут. -
МЕТОДИКА СОЗДАНИЯ ТОПОЛОГИЧЕСКИХ ОГРАНИЧЕНИЙ ПРИ ВЫСОКОЙ УТИЛИЗАЦИИ РЕСУРСОВ ПЛИС
К.Н. Алексеев , Д.А. Сорокин , А.Л. Леонтьев2022-11-01Аннотация ▼Рассмотрена проблема достижения высокой реальной производительности реконфи-
гурируемых вычислительных систем при решении вычислительно трудоёмких задач различ-
ных предметных областей. Величину реальной производительности реконфигурируемых сис-
тем определяют параметры выполняемых на них программ, основной компонентой которых
являются вычислительные структуры обработки данных, реализованные в виде конфигура-
ционных файлов ПЛИС. При этом одним из ключевых параметров любой вычислительной
структуры является тактовая частота ее работы, которая непосредственно влияет на её
производительность. Однако достижение высоких тактовых частот сопряжено с рядом
проблем, которые современные средства САПР не решают. Причина кроется в неоптималь-
ном топологическом размещении функциональных узлов вычислительной структуры на поле
примитивов ПЛИС, особенно при высокой утилизации ресурсов. Это приводит к повышенной
нагрузке на коммутационную матрицу ПЛИС и, как следствие, связи между примитивами
ПЛИС, имеющими функциональную зависимость, оказываются значительно длиннее, чем
это допустимо. Кроме того, излишняя длина связей наблюдается при трассировке соедине-
ний между примитивами, которые расположены на разных кремниевых кристаллах ПЛИС
или же физически разделены встроенными периферийными устройствами. В настоящей
статье описывается методика, которая позволяет рационализировать размещение элемен-
тов вычислительной структуры на поле примитивов ПЛИС, минимизировать длину трасс
между примитивами, а также минимизировать число трасс между физически разделенны-
ми топологическими областями ПЛИС. Работоспособность предложенной методики пока-
зана на примере решения тестовой задачи «КИХ-фильтр» на реконфигурируемом компьюте-
ре «Терциус». Проиллюстрированы основные проблемы при достижении целевой тактовой
частоты и описан способ их преодоления. Применение методики позволило увеличить так-
товую частоту и тем самым поднять производительность «Терциус» на 25% без перера-
ботки функциональной схемы вычислительной структуры задачи. Текущие исследованияэффективности предложенной методики позволяют утверждать, что автоматизирован-
ные средства создания топологических ограничений на её основе позволят существенно со-
кратить время разработки программ с требуемыми характеристиками для реконфигури-
руемых вычислительных систем. -
МОДИФИКАЦИЯ РЕАЛИЗАЦИИ МЕТОДА ЯКОБИ ПРИ МОДЕЛИРОВАНИИ СУПЕРДИФФУЗИИ РАДОНА НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
М.Д. Чекина198-2062021-10-05Аннотация ▼При исследовании природных объектов часто возникает проблема моделирования сложных систем, обладающих структурой, не поддающейся описанию посредством инструментов евклидовой геометрии, поэтому для их представления используют фрактальную геометрию и соответствующей ей математический аппарат. Так модель переноса радона в неоднородной среде, использующая супердиффузию, отображает реальные данные точнее классической. Повышение концентрации радона в воздухе является одним из признаков приближающихся землетрясений, что обусловливает необходимость моделирования распространения этого радиоактивного инертного газа в реальном времени. Реконфигурируемые вычислительные системы обладают большим потенциалом для решения задач в реальном времени, но существующие на данных момент средства решения систем линейных алгебраических уравнений имеют низ-кую эффективность из-за нерегулярной структуры матриц, полученных при дискретизации модели супердиффузии радона с применением адаптивных сеток. Базовый подграф метода Якоби преобразуется следующим образом: входные данные векторизуются, структура кадра, в котором производится вычисление значения одного неизвестного, разделяется на несколько микрокадров, распараллеливая вычисления в первом микрокадре, где производится сумма произведений коэффициентов матрицы и значений неизвестных с предыдущей итерации. Полученные результаты буферизируются для последующей выдачи на второй микрокадр, где происходит окончательная обработка и выдача результата итерации. Описанные подход позволяет сократить простой оборудования при решении системы линейных алгебраических уравнений (СЛАУ) с разреженными нерегулярными матрицами, и дает выигрыш по скорости в 5–15 раз по сравнению с существующими методами решения СЛАУ на реконфигурируемых вычисли-тельных системах.
-
МЕТОДЫ ПРЕОБРАЗОВАНИЯ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР С ОБРАТНЫМИ СВЯЗЯМИ ДЛЯ ЭФФЕКТИВНОЙ РЕАЛИЗАЦИИ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
С.А. Дудко , И.И. Левин2021-12-24Аннотация ▼В настоящее время для решения задач на реконфигурируемых вычислительных системах
используются различные системы автоматизированного проектирования. В большинстве слу-
чаев они состоят из двух основных компонент: компилятора (транслятора), переводящего
текст исходной программы в графовую информационно-вычислительную структуру, и синте-
затора, размещающего ее в архитектуре программируемых логических интегральных схем.
Существующие синтезаторы, как правило, обрабатывают информационно-вычислительную
структуру без комплексной оптимизации. Поэтому полученное решение прикладной задачи
может содержать неэффективные фрагменты, снижающие быстродействие прикладной
программы. Наиболее распространёнными примерами неэффективных вычислительных
структур являются фрагменты, реализующие рекурсивные выражения, так как они снижают
быстродействие прикладной программы. В статье предложены методы преобразования ре-
курсивных выражений (фрагментов с обратными связями), которые позволяют в автоматиче-
ском режиме сократить интервал обработки данных при решении прикладных задач на рекон-
фигурируемых вычислительных системах. В основе методов лежат информационно-
эквивалентные преобразования информационно-вычислительной структуры исходной задачи.
Для каждого преобразования определен набор правил, которым должны удовлетворять опера-
ционные вершины вычислительной структуры. Применение правил позволяет выполнять экви-
валентные преобразования не только над простыми структурами данных, такими как числа,
но также и над более сложными структурами (матрицами, векторами, тензорами и т.п.).
По результатам моделирования разработанные методы преобразования информационно-
вычислительных структур с обратными связями позволяют сократить время решения при-
кладных задач примерно в 2–5 раз, за счет сокращения интервала обработки данных. Предло-
женные методы реализованы в прототипе оптимизирующего синтезатора информационно-
вычислительных структур. -
РЕАЛИЗАЦИЯ ФРАКТАЛЬНОГО СЖАТИЯ И ДЕКОМПРЕССИИ ИЗОБРАЖЕНИЙ ПАРАЛЛЕЛЬНО-КОВЕЙЕРНЫМ СПОСОБОМ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
М.Д. Чекина2021-02-25Аннотация ▼Фрактальные алгоритмы находят все большее количество областей применения –
от компьютерной графики до моделирования сложных физических процессов, но для их
программной реализации требуются значительные вычислительные мощности. Фрак-
тальное сжатие изображений отличается высокой степенью компрессии данных при хо-
рошем качестве восстановленного изображения. Целью данной работы является повыше-
ние производительности реконфигурируемых вычислительных систем (РВС) при реализа-
ции фрактального сжатия и декомпрессии изображений. В работе описаны разработан-
ные методы фрактального сжатия и последующей декомпрессии изображений, реализо-
ванные параллельно-конвейерным способом для РВС. Основная идея параллельной реализа-
ции фрактального сжатия изображений сводится к параллельному выполнению попарного
сравнения доменных и ранговых блоков. Для достижения наилучшей производительности
необходимо одновременно сравнивать максимальное количество пар. При практической
реализации фрактального сжатия изображений на РВС учитываются такие критические
ресурсы, как количество входных каналов и количество логических ячеек ПЛИС. Для задачи
фрактального сжатия изображения критическим ресурсом являются каналы данных, по-
этому параллельная организация вычислений заменяется параллельно-конвейерной после
выполнения редукцию производительности параллельной вычислительной структуры. По-
дача каждого операнда в вычислительную структуру осуществляется последовательно
(побитово), что экономит вычислительный ресурс и уменьшает простой оборудования.
Для хранения коэффициентов системы итерируемых функций, кодирующих изображение,
введена структура данных, задающая отношения между номерами ранговых и доменных
блоков и соответствующими параметрами. Для удобства последующей декомпрессии
элементы массива, кодирующего сжатое изображение, упорядочены по номерам ранговых
блоков, что позволяет избежать двойной косвенной адресации в вычислительной структу-
ре. Представленный подход позволяет масштабировать параллельно-конвейерную про-
грамму на любое количество программируемых логических интегральных схем (ПЛИС).
Практическая реализация фрактального сжатия изображений, выполненная на реконфи-
гурируемом компьютере Терциус-2, содержащем восемь ПЛИС, обеспечивает ускорение в
15000 раз по сравнению с универсальным многоядерным процессором и в 18–25 раз по срав-
нению с существующими решениями для ПЛИС. Реализация декомпрессии изображения на
реконфигурируемом компьютере показывает ускорение в 380 раз по сравнению с аналогич-
ной реализацией для многоядерного универсального процессора. -
ПРЕОБРАЗОВАНИЕ НЕКОТОРЫХ ВИДОВ ПОСЛЕДОВАТЕЛЬНЫХ ИНФОРМАЦИОННЫХ ГРАФОВ В ПАРАЛЛЕЛЬНО-КОНВЕЙЕРНУЮ ФОРМУ
Д. В. Михайлов2021-02-25Аннотация ▼Многие задачи цифровой обработки сигналов могут быть представлены в виде информа-
ционных графов. Реконфигурируемые вычислительные системы, построенные на основе ПЛИС,
могут иметь структуру, непосредственно соответствующую информационному графу ре-
шаемой задачи. Построение графа задачи и последующее создание вычислительной структуры
может занимать значительное время при выполнении их вручную. В связи с этим возникает
необходимость создания алгоритмов преобразования информационных графов, которые могут
выполняться автоматически. В статье предложены алгоритмы преобразования однородных
графов, содержащих ассоциативные операции, и смешанных графов, содержащих два типа
операций, один из которых является дистрибутивным по отношению к другому. Преобразова-
ния графов первого типа (состоящих из операций одного типа) сводятся к переходу от после-
довательной формы графа к пирамидальной для ускорения выполнения всех операций графа.
В случае если имеющегося количества оборудования недостаточно для реализации всех опера-
ций графа, применяется преобразование, разбивающее исходный граф на изоморфные подгра-
фы. Размер подграфа зависит от имеющегося вычислительного ресурса. В этом случае вычис-
лительная структура будет соответствовать такому подграфу. Преобразования графов вто-
рого типа (состоящих из операций двух типов, одни из которых являются дистрибутивными
по отношению к другим) сводятся к разделению графа на подграфы, содержащие операции
одного типа, соединённые особым образом. После этого эти подграфы могут быть преобра-
зованы в пирамидальную форму для ускорения выполнения всех операций графа. При этом
количество вершин с дистрибутивными операциями может значительно возрасти, в связи с
чем может потребоваться сокращение их числа. Отсюда следует, что при преобразовании
графов второго типа не обходимо выбирать конкретную форму, к которой будет приведён
граф, исходя из соотношения его размера и имеющегося вычислительного ресурса. Таким
образом, предложенные алгоритмы преобразования информационных графов различных типов
могут быть эффективно использованы при разработке вычислительных структур, основанных
на ПЛИС. -
КОМПЛЕКС СРЕДСТВ ТРАНСЛЯЦИИ ПРОГРАММ НА ЯЗЫКЕ C В ПРОГРАММЫ НА ЯЗЫКЕ ПОТОКА ДАННЫХ COLAMO
А. И. Дордопуло, A.A. Гуленок, А.В. Бовкун, И.И. Левин, В. А. Гудков, С.А. Дудко2021-02-25Аннотация ▼Рассматриваются программные средства трансляции последовательных программ
на языке C в масштабируемые параллельно-конвейерные программы на языке программи-
рования реконфигурируемых вычислительных систем COLAMO. В отличие от существую-
щих средств высокоуровневого синтеза, результатом трансляции является не IP-ядро
фрагмента задачи, а комплексное решение задачи для многокристальных реконфигурируе-
мых вычислительных систем с автоматической синхронизацией информационных и управ-
ляющих сигналов. Рассмотрены основные этапы трансляции последовательной программы
на языке C: преобразование в информационный граф, анализ информационных зависимо-
стей и выделение функциональных подграфов, преобразование в масштабируемую ресурсо-
независимую параллельно-конвейерную форму и масштабирование программы на языке
COLAMO для заданной многокристальной реконфигурируемой вычислительной системы.
Масштабирование программы осуществляется с помощью методов редукции производи-
тельности абсолютно-параллельной формы задачи – информационного графа, который
адаптируется под архитектуру реконфигурируемой вычислительной системы. Разрабо-
тан ряд правил, позволяющих существенно сократить число шагов преобразований при
масштабировании задачи и обеспечить плотный поток обработки данных в функциональ-
ных подграфах задачи. Созданный комплекс средств трансляции программ на языке C в
конфигурационные файлы ПЛИС позволяет существенно сократить время синтеза вычис-
лительной структуры задачи для многокристальных РВС и обеспечить сокращение общего
времени решения задачи. -
МЕТОД РЕШЕНИЯ ГРАФОВЫХ NP-ПОЛНЫХ ЗАДАЧ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ НА ОСНОВЕ ПРИНЦИПА РАСПАРАЛЛЕЛИВАНИЯ ПО ИТЕРАЦИЯМ
А. В. Касаркин2021-02-25Аннотация ▼При решении графовых NP-полных задач на многопроцессорных системах рост обо-
рудования не приводит к пропорциональному росту производительности системы, поэто-
му не всегда удается решить задачу за приемлемое время. Целью работы, описанной в
статье, является минимизация времени решения задачи поиска максимальных клик графа с
использованием реконфигурируемых вычислительных систем (РВС). При решении задачи
на РВС методом распараллеливания по слоям рост производительности также замедля-
ется, несмотря на лучшую степень масштабируемости по сравнению с многопроцессор-
ными реализациями. В статье предложен метод создания параллельно-конвейерных про-
грамм для реконфигурируемых вычислительных систем на основе распараллеливания по
итерациям для решения графовых NP-полных задач. Рассмотрено, что использовать би-
товый способ представления множеств (как в методе распараллеливания по слоям) для
метода распараллеливания по итерациям не является эффективным. Новый метод отли-
чается организацией вычислений, а именно – обработкой неупорядоченных множеств,
доступ к элементам которых осуществляется не по адресам (как в массивах), а по значе-
ниям (именам вершин и именам дуг графа). Показано, что новый метод на основе распа-
раллеливания по итерациям, несмотря на более низкую удельную производительность, свя-
занную с тем, что вычислительным подструктурам из-за символьного представления
множеств необходимо обработать большее число промежуточных данных, обеспечивает
практически линейный рост реальной производительности РВС при значительно большем
количестве вычислительного ресурса по сравнению с методом распараллеливания по слоям. -
МАСШТАБИРОВАНИЕ ЦЕЛОЧИСЛЕННЫХ ДАННЫХ В РВС ПРИ ВЫЧИСЛЕНИИ РАДИОЛОКАЦИОННОГО ДАЛЬНОСТНО-СКОРОСТНОГО ПОРТРЕТА
О.В. Ершова, Е. В. Кириченко, М.С. Кочерга, E.A. Семерников2021-02-25Аннотация ▼Данная статья посвящена вопросу предотвращения переполнений разрядной сетки в
высокопроизводительных реконфигурируемых вычислительных системах (РВС) на основе
ПЛИС, приводящих к фатальным ошибкам обработки данных в процессе получения
радиолокационного дальностно-скоростного портрета (ДСП) цели. Кратко рассмотрены
существующие способы решения данной проблемы, и предложена методика априорного оп-
ределения количества точек масштабирования в конвейерно-параллельных вычислительных
структурах, формирующих радиолокационный ДСП цели. Данная методика позволяет зара-
нее определить необходимое количество масштабирований на всех этапах обработки цело-
численных данных и предотвратить переполнения при вычислении БПФ (ОБПФ) во всех
возможных ситуациях. Рассмотрен алгоритм получения ДСП из исходной сигнальной мат-
рицы (ИСМ) на примере радиолокационной системы (РЛС) непрерывного излучения с
линейной частотной модуляцией (ЛЧМ). Приведены формулы, позволяющие рассчитать
максимально допустимое значение (в используемой разрядной сетке) амплитуды
преобразумых сигналов на всех этапах получения ДСП и количество итераций с
масштабированием в процедурах БПФ (ОБПФ). Представлен численный пример расчета
количества масштабирований для всех этапов алгоритма формирования ДСП, в котором
определено необходимое число итераций с масштабированием при вычислении быстрой
свертки и доплеровской скорости (с учетом умножения на оконную функцию), позволяющее
предотвратить возможный выход значений сигнала за пределы разрядной сетки. В резуль-
тате установлено, что предлагаемый способ расчета количества масштабирований
позволяет избежать чрезмерного падения уровня сигнала на выходе обработки и снизить
отношение ошибок цифровой обработки к уровню сигнала дальностно-скоростной матрицы -
ПОВЫШЕНИЕ РЕАЛЬНОЙ ПРОИЗВОДИТЕЛЬНОСТИ РВС ПРИ РЕШЕНИИ ЗАДАЧ ЦИФРОВОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ БЫСТРОГО ПРЕОБРАЗОВАНИЯ ФУРЬЕ
А.В. Чкан2021-02-25Аннотация ▼Рассматриваются вопросы цифровой обработки изображений больших размерно-
стей в реальном масштабе времени с помощью реконфигурируемых вычислительных сис-
тем (РВС) на базе ПЛИС. РВС относятся к классу высокопроизводительных многопроцес-
сорных вычислительных систем, но при этом обладают программируемой архитектурой,
позволяющей конфигурировать структуру вычислительной системы, оптимально под-
страивая её под алгоритмы решаемой задачи. В то же время оптимизация вычислитель-
ной структуры задачи сводится к разработке и реализации параллельных алгоритмов,
соответствующих специфике используемой архитектуры РВС. Всё это позволяет эффек-
тивно использовать РВС для решения широкого класса задач цифровой обработки сигна-
лов. Предложены способы повышения удельной и реальной производительности РВС при
решении задач цифровой обработки изображений с использованием быстрого преобразо-
вания Фурье (БПФ). На примере процедуры фильтрации изображений в частотной облас-
ти рассмотрены основные вычислительные этапы и способы их оптимизации, основанные
на свойствах алгоритма БПФ. Применение оптимизации позволяет существенно сокра-
тить как объем вычислений, так и объем задействованных аппаратных ресурсов ПЛИС, и
повысить производительность РВС для задач обработки изображений. Освобожденные в
результате оптимизации вычислительной структуры ресурсы ПЛИС могут быть исполь-
зованы для дополнительного распараллеливания вычислений и ускорения обработки посту-
пающих данных. Показаны преимущества представления данных в формате с фиксирован-
ной запятой при выполнении расчётов на РВС. Использование фиксированной запятой по-
зволяет не только повысить удельную и реальную производительность вычислительной
системы по сравнению с плавающей запятой в силу свойств формата, но и использовать
произвольную разрядность данных, что является актуальным для большинства задач циф-
ровой обработки сигналов. Рассмотрено решение проблемы переполнения разрядной сетки
при использовании формата с фиксированной запятой с помощью масштабирования раз-
рядности данных. -
МОДЕЛИРОВАНИЕ СТРУКТУРЫ КУБАТУРНЫХ ФОРМУЛ ДЛЯ ПРОЕКТИРОВАНИЯ ЭФФЕКТИВНЫХ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР НА ПЛИС
Н. С. Кривша , В. В. Кривша , С.А. Бутенков2021-01-19Аннотация ▼Предлагается метод построения вычислительных моделей для исследования и опти-
мизации универсальных вычислительных структур, выполняющих вычисление вычисления
сложных кубатурных формул. Теоретической базой для введенных моделей служит теория
пространственной грануляции, методы которой разработаны коллективом авторов. Ме-
тодология пространственной грануляции позволяет переходить от вычислений в точечном
метрическом пространстве данных (которое не всегда существует) к вычислениям в аф-
финном многомерном пространстве, содержащем укрупненные единицы данных (про-
странственные гранулы). Такое преобразование данных основано на использовании аффин-
но-инвариантных моделей декартовых гранул и основывается на оптимальных процедурах
покрытия точечного пространства выпуклыми гранулами. Такие полезные вычислитель-
ные свойства введенных моделей данных позволяют построить вычислительно эффектив-
ные процедуры для манипулирования многомерными данными, одним из приложений кото-
рых является вычисление многомерных кубатурных формул. Новые модели позволяют соз-
давать наглядные матричные модели данных произвольной размерности для целей плани-
рования структуры вычислительных процессов и построения информационных графов
таких процессов. Эффективное и наглядное представление сложных вычислительных
формул позволяет выполнять эквивалентные (с численной точки зрения) преобразования
таких формул с целью выбора эффективных схемных решений для построения высокопро-
изводительных вычислительных блоков вычисления кубатур высокой размерности на базе
ПЛИС. На основе оптимизированных моделей вычислительных структур строятся схем-
ные решения, реализующие кубатурные формулы на реконфигурируемых вычислительных
системах. Сложность решения задачи проектирования на ПЛИС связана с тем, что ис-
пользуемые вычислительные средства содержать поля ПЛИС, проектирование вычисли-
тельных структур для которых является вычислительно сложной задачей. Авторы ис-
пользовали разработанные в организации автоматизированные средства проектирования
на полях ПЛИС, такие как язык высокого уровня COLAMO, язык низкого уровня Fire Constructor
и сопутствующие программные средства для реализации полученных информаци-
онных графов многомерных кубатур и экспериментальной оценки качества полученных
результатов. Предлагаемый в работе теоретический подход к моделированию и оптими-
зации информационных графов вычислительных структур может быть распространен на
широкий круг задач вычислительной математики.








