Найти
Результаты поиска
-
МЕТОД ОРГАНИЗАЦИИ ДИСКРЕТНО-СОБЫТИЙНЫХ ВЫЧИСЛЕНИЙ ДЛЯ ОБРАБОТКИ БОЛЬШИХ РАЗРЕЖЕННЫХ НЕСТРУКТУРИРОВАННЫХ МАТРИЦ НА РВС
А.В. Подопригора189-1972021-10-05Аннотация ▼С усложнением моделей исследуемых объектов и процессов в разных областях науки и техники появляется большое количество задач, для которых необходимо применять вы-сокопроизводительные вычислительные системы. Так, для обработки матричных массивов используют кластерные многопроцессорные вычислительные системы с применением специальных методов, направленных на организации параллельных вычислений, и в большинстве случаев производительность вычислительной системы является достаточно высокой. Однако такая эффективность вычислений наблюдается не на всех видах матриц. Матричная структура может содержать большое количество незначимых элементов, большую размерность, и ее портрет может быть неструктурированным. Решение такого рода матриц на кластерных МВС не позволяет получить производительность, близкую к пиковой, поскольку методы обработки никак не учитывают такую сложную структуру обрабатываемой матрицы, в результате чего производительность системы многократно снижается. Разработка методов для кластерных МВС не позволяет в полной мере обеспечить высокую производительность на классе задач, посвященной обработке больших раз-реженных неструктурированных матриц. Жесткая архитектура связей процессоров не учитывает особенности таких матриц, что приведёт к неоднородности загрузки вычис-лительного процессора. Для обеспечения производительности, близкой к пиковой на зада-чах обработки больших разряженных неструктурированных матриц, необходимо приме-нять реконфигурируемые вычислительные системы, архитектура которых позволяет адаптироваться под структуру решаемой задачи. Это позволяет организовывать конвейерную обработку так, чтобы вычислительный ресурс РВС был использован только на информационно значимые операции. Помимо использования общепринятых методов структурной организации высокопроизводительных вычислений для РВС, необходимо разработать формат хранения и передачи больших разреженных неструктурированных матриц, определить принципы построения базовых матричных макроопераций и возможность организации составных дискретно-событийных матричных функций для решения прикладных задач. В результате проведенных исследований положено начало метода, позволяющего организовать вычисления, операндами которых являются большие разреженные не-структурированные матрицы. Применение этого метода для организации вычислений позволяет существенно повысить производительность и обеспечить повышение эффективности работы такой системы.
-
ПЕРСПЕКТИВНЫЕ ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ РЕКОНФИГУРИРУЕМЫЕ ВЫЧИСЛИТЕЛИ С ИММЕРСИОННЫМ ОХЛАЖДЕНИЕМ
И.И. Левин, А. М. Федоров, Ю. И. Доронченко, М. К. Раскладкин2021-02-25Аннотация ▼Рассматриваются перспективны создания высокопроизводительных реконфигурируемых
вычислительных устройств на основе современных ПЛИС фирмы Xilinx семейства UltraScale+.
Целью работы является достижение в одном изделии с конструктивом 3U 19’ вычислительной
плотности до 128 ПЛИС высокой степени интеграции при обеспечении соответствующих
электропитания и охлаждения вычислительных элементов системы для решения вычислитель-
но трудоемких задач. Обеспечение требуемых характеристик изделия в заданном конструкти-
ве потребовало усложнения топологии печатных плат и технологии изготовления его состав-
ных частей. Для охлаждения компонентов вычислительной системы используется иммерсион-
ная (погружная) технология. Особенностью разрабатываемых вычислительных систем явля-
ется широкие возможности информационного обмена внутри блока и между блоками для ре-
шения сильносвязанных задач, в которых количество пересылок данных между функциональ-
ными устройствами больше, чем количество таких устройств. В качестве основных связей
между ПЛИС используются дифференциальные линии с подключенными к ним мульти-
гигабитными трансиверами (MGT). Разработанная на основе оптических каналов система
информационного обмена между блоками обеспечивает пропускную способность более
2 Тбит/с. Разработан и изготовлен опытный образец вычислительного модуля на основе ПЛИС
UltraScale+. На его основе изготовлен прототип реконфигурируемого вычислительного блока.
Вычислительный блок содержит в своем составе универсальный процессор и необходимые ин-
терфейсы ввода-вывода, являясь функционально законченным устройством. На вычислитель-
ном модуле нового поколения был реализован ряд алгоритмов различных научно-технических
задач, что подтвердило возможность широкого применения вычислителей. Разработана мо-
дернизированная иммерсионная подсистема охлаждения, которая обеспечивает отвод выде-
ляемой суммарной тепловой мощности до 20 кВт. Для достижения такого уровня теплоотво-
да реализованы технические решения по всем компонентам системы охлаждения: хладагенту,
радиаторам, насосу, теплообменнику. Объединение множества блоков в единый вычислитель-
ный контур позволит создавать вычислительные комплексы с производительностью до не-
скольких десятков петафлопс. Такие комплексы требуют наличия соответствующей инже-
нерной инфраструктуры. -
ОСОБЕННОСТИ ПРИМЕНЕНИЯ АГЕНТНО-МОДУЛЬНОГО ПОДХОДА ПРИ ПОСТРОЕНИИ И РЕАЛИЗАЦИИ ИНФОРМАЦИОННО-ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
А.Ф. Зайцев179-1892025-12-30Аннотация ▼Информационно-вычислительные системы играют ключевую роль в обработке и анализе больших объемов данных, обеспечивая эффективное функционирование производства, предоставления, а также получения различных цифровых товаров и услуг. В условиях интеллектуализации и увеличения разнообразия функциональных требований, предъявляемых к информационным системам, возникает потребность в разработке новых подходов для их построения и реализации.
В работе рассмотрены основные особенности применения предложенного агентно-модульного подхода, предполагающего построение гибких и масштабируемых информационно-вычислительных систем, способных функционировать в распределенной среде. Агентно-модульный подход представляет собой методологический подход к построению информационно-вычислительных систем, на основе интеграции методов системного анализа, а также агентного и модульного принципов организации систем. Цель работы – исследовать теоретические и практические аспекты использования предложенного агентно-модульного подхода, проанализировать его преимущества в сравнении с другими существующими подходами (объектным, компонентным, сервисным), а также представить пример построения информационной системы на основе его применения. Для достижения поставленной цели необходимо решить следующие задачи: – исследовать теоретические основы и выявить специфику практического применения предложенного агентно-модульного подхода; – выполнить анализ отличий и описать преимущества предложенного подхода при его сравнении с другими подходами; – представить пример построения информационно-вычислительной системы с использованием предложенного подхода. В процессе исследования были использованы следующие общенаучные методы: декомпозиция, анализ, синтез, сравнение, описание, формализация, структуризация, моделирование, проектирование, а также основные принципы модульного и агентного подходов. В качестве материалов исследования использовались компьютеры, инструментальные средства и программное обеспечение вычислительных систем.
В результате исследования были рассмотрены основные теоретические и практические аспекты применения предложенного подхода. Агентно-модульный подход может быть использован для построения различных информационных систем на этапах, связанных с их моделированием и проектированием. Предложенный подход позволяет описывать структуру, функционирование, а также взаимодействие различных составных частей информационно-вычислительных систем -
ЭКВИВАЛЕНТНЫЕ ПРЕОБРАЗОВАНИЯ НЕКОТОРЫХ ВИДОВ РЕКУРСИВНЫХ НЕЛИНЕЙНЫХ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР ДЛЯ ЭФФЕКТИВНОЙ РЕАЛИЗАЦИИ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
С. А. Дудко2021-02-25Аннотация ▼Рассматриваются методы информационно-эквивалентных преобразований некото-
рых видов нелинейных вычислительных структур с обратными связями: квадратичных,
дробных и условных. Наличие обратных связей в конвейерной вычислительной структуре,
решаемых на реконфигурируемых вычислительных системах прикладных задач, приводит к
замедлению скорости формирования данных, так как для вычисления очередного значения
требуется дождаться результата по обратной связи. При этом замедление происходит
не только на участке с обратной связью, но и во всей вычислительной структуре, что
приводит к увеличению времени, за которое данная задача может быть решена. Преды-
дущие фрагменты вынуждены задерживать свои данные перед подачей в обратную связь,
а последующие вынуждены простаивать, ожидая данные на выходе обратной связи. На
сегодняшний день не существует средств автоматического проектирования прикладных
задач для реконфигурируемых вычислительных систем, которые оптимизировали бы та-
кие вычислительные структуры в автоматическом режиме. Поэтому пользователь вы-
нужден самостоятельно изучать текст исходной программы и искать в нем выражения,
содержащие обратные связи, а затем оптимизировать их. Это приводит к увеличению
времени, требующегося для создания эффективных прикладных программ. Предложенные
методы преобразований позволяют сократить интервал обработки данных (в лучшем
случае до единицы) при решении прикладных задач на реконфигурируемых вычислительных
системах. Для реализации информационно-эквивалентных преобразований необходимо,
чтобы в вычислительной системе имелся дополнительный аппаратный ресурс. Реализация
данных преобразований в оптимизирующем синтезаторе схемотехнических решений по-
зволяет проводить оптимизацию вычислительной структуры с обратными связями авто-
матически. Это позволяет сократить время разработки эффективных прикладных про-
грамм, содержащих обратные связи, с нескольких дней до нескольких минут. -
МОДЕЛИРОВАНИЕ СТРУКТУРЫ КУБАТУРНЫХ ФОРМУЛ ДЛЯ ПРОЕКТИРОВАНИЯ ЭФФЕКТИВНЫХ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР НА ПЛИС
Н. С. Кривша , В. В. Кривша , С.А. Бутенков2021-01-19Аннотация ▼Предлагается метод построения вычислительных моделей для исследования и опти-
мизации универсальных вычислительных структур, выполняющих вычисление вычисления
сложных кубатурных формул. Теоретической базой для введенных моделей служит теория
пространственной грануляции, методы которой разработаны коллективом авторов. Ме-
тодология пространственной грануляции позволяет переходить от вычислений в точечном
метрическом пространстве данных (которое не всегда существует) к вычислениям в аф-
финном многомерном пространстве, содержащем укрупненные единицы данных (про-
странственные гранулы). Такое преобразование данных основано на использовании аффин-
но-инвариантных моделей декартовых гранул и основывается на оптимальных процедурах
покрытия точечного пространства выпуклыми гранулами. Такие полезные вычислитель-
ные свойства введенных моделей данных позволяют построить вычислительно эффектив-
ные процедуры для манипулирования многомерными данными, одним из приложений кото-
рых является вычисление многомерных кубатурных формул. Новые модели позволяют соз-
давать наглядные матричные модели данных произвольной размерности для целей плани-
рования структуры вычислительных процессов и построения информационных графов
таких процессов. Эффективное и наглядное представление сложных вычислительных
формул позволяет выполнять эквивалентные (с численной точки зрения) преобразования
таких формул с целью выбора эффективных схемных решений для построения высокопро-
изводительных вычислительных блоков вычисления кубатур высокой размерности на базе
ПЛИС. На основе оптимизированных моделей вычислительных структур строятся схем-
ные решения, реализующие кубатурные формулы на реконфигурируемых вычислительных
системах. Сложность решения задачи проектирования на ПЛИС связана с тем, что ис-
пользуемые вычислительные средства содержать поля ПЛИС, проектирование вычисли-
тельных структур для которых является вычислительно сложной задачей. Авторы ис-
пользовали разработанные в организации автоматизированные средства проектирования
на полях ПЛИС, такие как язык высокого уровня COLAMO, язык низкого уровня Fire Constructor
и сопутствующие программные средства для реализации полученных информаци-
онных графов многомерных кубатур и экспериментальной оценки качества полученных
результатов. Предлагаемый в работе теоретический подход к моделированию и оптими-
зации информационных графов вычислительных структур может быть распространен на
широкий круг задач вычислительной математики. -
РЕАЛИЗАЦИЯ ФРАКТАЛЬНОГО СЖАТИЯ И ДЕКОМПРЕССИИ ИЗОБРАЖЕНИЙ ПАРАЛЛЕЛЬНО-КОВЕЙЕРНЫМ СПОСОБОМ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
М.Д. Чекина2021-02-25Аннотация ▼Фрактальные алгоритмы находят все большее количество областей применения –
от компьютерной графики до моделирования сложных физических процессов, но для их
программной реализации требуются значительные вычислительные мощности. Фрак-
тальное сжатие изображений отличается высокой степенью компрессии данных при хо-
рошем качестве восстановленного изображения. Целью данной работы является повыше-
ние производительности реконфигурируемых вычислительных систем (РВС) при реализа-
ции фрактального сжатия и декомпрессии изображений. В работе описаны разработан-
ные методы фрактального сжатия и последующей декомпрессии изображений, реализо-
ванные параллельно-конвейерным способом для РВС. Основная идея параллельной реализа-
ции фрактального сжатия изображений сводится к параллельному выполнению попарного
сравнения доменных и ранговых блоков. Для достижения наилучшей производительности
необходимо одновременно сравнивать максимальное количество пар. При практической
реализации фрактального сжатия изображений на РВС учитываются такие критические
ресурсы, как количество входных каналов и количество логических ячеек ПЛИС. Для задачи
фрактального сжатия изображения критическим ресурсом являются каналы данных, по-
этому параллельная организация вычислений заменяется параллельно-конвейерной после
выполнения редукцию производительности параллельной вычислительной структуры. По-
дача каждого операнда в вычислительную структуру осуществляется последовательно
(побитово), что экономит вычислительный ресурс и уменьшает простой оборудования.
Для хранения коэффициентов системы итерируемых функций, кодирующих изображение,
введена структура данных, задающая отношения между номерами ранговых и доменных
блоков и соответствующими параметрами. Для удобства последующей декомпрессии
элементы массива, кодирующего сжатое изображение, упорядочены по номерам ранговых
блоков, что позволяет избежать двойной косвенной адресации в вычислительной структу-
ре. Представленный подход позволяет масштабировать параллельно-конвейерную про-
грамму на любое количество программируемых логических интегральных схем (ПЛИС).
Практическая реализация фрактального сжатия изображений, выполненная на реконфи-
гурируемом компьютере Терциус-2, содержащем восемь ПЛИС, обеспечивает ускорение в
15000 раз по сравнению с универсальным многоядерным процессором и в 18–25 раз по срав-
нению с существующими решениями для ПЛИС. Реализация декомпрессии изображения на
реконфигурируемом компьютере показывает ускорение в 380 раз по сравнению с аналогич-
ной реализацией для многоядерного универсального процессора. -
ПРЕОБРАЗОВАНИЕ НЕКОТОРЫХ ВИДОВ ПОСЛЕДОВАТЕЛЬНЫХ ИНФОРМАЦИОННЫХ ГРАФОВ В ПАРАЛЛЕЛЬНО-КОНВЕЙЕРНУЮ ФОРМУ
Д. В. Михайлов2021-02-25Аннотация ▼Многие задачи цифровой обработки сигналов могут быть представлены в виде информа-
ционных графов. Реконфигурируемые вычислительные системы, построенные на основе ПЛИС,
могут иметь структуру, непосредственно соответствующую информационному графу ре-
шаемой задачи. Построение графа задачи и последующее создание вычислительной структуры
может занимать значительное время при выполнении их вручную. В связи с этим возникает
необходимость создания алгоритмов преобразования информационных графов, которые могут
выполняться автоматически. В статье предложены алгоритмы преобразования однородных
графов, содержащих ассоциативные операции, и смешанных графов, содержащих два типа
операций, один из которых является дистрибутивным по отношению к другому. Преобразова-
ния графов первого типа (состоящих из операций одного типа) сводятся к переходу от после-
довательной формы графа к пирамидальной для ускорения выполнения всех операций графа.
В случае если имеющегося количества оборудования недостаточно для реализации всех опера-
ций графа, применяется преобразование, разбивающее исходный граф на изоморфные подгра-
фы. Размер подграфа зависит от имеющегося вычислительного ресурса. В этом случае вычис-
лительная структура будет соответствовать такому подграфу. Преобразования графов вто-
рого типа (состоящих из операций двух типов, одни из которых являются дистрибутивными
по отношению к другим) сводятся к разделению графа на подграфы, содержащие операции
одного типа, соединённые особым образом. После этого эти подграфы могут быть преобра-
зованы в пирамидальную форму для ускорения выполнения всех операций графа. При этом
количество вершин с дистрибутивными операциями может значительно возрасти, в связи с
чем может потребоваться сокращение их числа. Отсюда следует, что при преобразовании
графов второго типа не обходимо выбирать конкретную форму, к которой будет приведён
граф, исходя из соотношения его размера и имеющегося вычислительного ресурса. Таким
образом, предложенные алгоритмы преобразования информационных графов различных типов
могут быть эффективно использованы при разработке вычислительных структур, основанных
на ПЛИС. -
КОМПЛЕКС СРЕДСТВ ТРАНСЛЯЦИИ ПРОГРАММ НА ЯЗЫКЕ C В ПРОГРАММЫ НА ЯЗЫКЕ ПОТОКА ДАННЫХ COLAMO
А. И. Дордопуло, A.A. Гуленок, А.В. Бовкун, И.И. Левин, В. А. Гудков, С.А. Дудко2021-02-25Аннотация ▼Рассматриваются программные средства трансляции последовательных программ
на языке C в масштабируемые параллельно-конвейерные программы на языке программи-
рования реконфигурируемых вычислительных систем COLAMO. В отличие от существую-
щих средств высокоуровневого синтеза, результатом трансляции является не IP-ядро
фрагмента задачи, а комплексное решение задачи для многокристальных реконфигурируе-
мых вычислительных систем с автоматической синхронизацией информационных и управ-
ляющих сигналов. Рассмотрены основные этапы трансляции последовательной программы
на языке C: преобразование в информационный граф, анализ информационных зависимо-
стей и выделение функциональных подграфов, преобразование в масштабируемую ресурсо-
независимую параллельно-конвейерную форму и масштабирование программы на языке
COLAMO для заданной многокристальной реконфигурируемой вычислительной системы.
Масштабирование программы осуществляется с помощью методов редукции производи-
тельности абсолютно-параллельной формы задачи – информационного графа, который
адаптируется под архитектуру реконфигурируемой вычислительной системы. Разрабо-
тан ряд правил, позволяющих существенно сократить число шагов преобразований при
масштабировании задачи и обеспечить плотный поток обработки данных в функциональ-
ных подграфах задачи. Созданный комплекс средств трансляции программ на языке C в
конфигурационные файлы ПЛИС позволяет существенно сократить время синтеза вычис-
лительной структуры задачи для многокристальных РВС и обеспечить сокращение общего
времени решения задачи. -
МЕТОД РЕШЕНИЯ ГРАФОВЫХ NP-ПОЛНЫХ ЗАДАЧ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ НА ОСНОВЕ ПРИНЦИПА РАСПАРАЛЛЕЛИВАНИЯ ПО ИТЕРАЦИЯМ
А. В. Касаркин2021-02-25Аннотация ▼При решении графовых NP-полных задач на многопроцессорных системах рост обо-
рудования не приводит к пропорциональному росту производительности системы, поэто-
му не всегда удается решить задачу за приемлемое время. Целью работы, описанной в
статье, является минимизация времени решения задачи поиска максимальных клик графа с
использованием реконфигурируемых вычислительных систем (РВС). При решении задачи
на РВС методом распараллеливания по слоям рост производительности также замедля-
ется, несмотря на лучшую степень масштабируемости по сравнению с многопроцессор-
ными реализациями. В статье предложен метод создания параллельно-конвейерных про-
грамм для реконфигурируемых вычислительных систем на основе распараллеливания по
итерациям для решения графовых NP-полных задач. Рассмотрено, что использовать би-
товый способ представления множеств (как в методе распараллеливания по слоям) для
метода распараллеливания по итерациям не является эффективным. Новый метод отли-
чается организацией вычислений, а именно – обработкой неупорядоченных множеств,
доступ к элементам которых осуществляется не по адресам (как в массивах), а по значе-
ниям (именам вершин и именам дуг графа). Показано, что новый метод на основе распа-
раллеливания по итерациям, несмотря на более низкую удельную производительность, свя-
занную с тем, что вычислительным подструктурам из-за символьного представления
множеств необходимо обработать большее число промежуточных данных, обеспечивает
практически линейный рост реальной производительности РВС при значительно большем
количестве вычислительного ресурса по сравнению с методом распараллеливания по слоям. -
МАСШТАБИРОВАНИЕ ЦЕЛОЧИСЛЕННЫХ ДАННЫХ В РВС ПРИ ВЫЧИСЛЕНИИ РАДИОЛОКАЦИОННОГО ДАЛЬНОСТНО-СКОРОСТНОГО ПОРТРЕТА
О.В. Ершова, Е. В. Кириченко, М.С. Кочерга, E.A. Семерников2021-02-25Аннотация ▼Данная статья посвящена вопросу предотвращения переполнений разрядной сетки в
высокопроизводительных реконфигурируемых вычислительных системах (РВС) на основе
ПЛИС, приводящих к фатальным ошибкам обработки данных в процессе получения
радиолокационного дальностно-скоростного портрета (ДСП) цели. Кратко рассмотрены
существующие способы решения данной проблемы, и предложена методика априорного оп-
ределения количества точек масштабирования в конвейерно-параллельных вычислительных
структурах, формирующих радиолокационный ДСП цели. Данная методика позволяет зара-
нее определить необходимое количество масштабирований на всех этапах обработки цело-
численных данных и предотвратить переполнения при вычислении БПФ (ОБПФ) во всех
возможных ситуациях. Рассмотрен алгоритм получения ДСП из исходной сигнальной мат-
рицы (ИСМ) на примере радиолокационной системы (РЛС) непрерывного излучения с
линейной частотной модуляцией (ЛЧМ). Приведены формулы, позволяющие рассчитать
максимально допустимое значение (в используемой разрядной сетке) амплитуды
преобразумых сигналов на всех этапах получения ДСП и количество итераций с
масштабированием в процедурах БПФ (ОБПФ). Представлен численный пример расчета
количества масштабирований для всех этапов алгоритма формирования ДСП, в котором
определено необходимое число итераций с масштабированием при вычислении быстрой
свертки и доплеровской скорости (с учетом умножения на оконную функцию), позволяющее
предотвратить возможный выход значений сигнала за пределы разрядной сетки. В резуль-
тате установлено, что предлагаемый способ расчета количества масштабирований
позволяет избежать чрезмерного падения уровня сигнала на выходе обработки и снизить
отношение ошибок цифровой обработки к уровню сигнала дальностно-скоростной матрицы -
ПОВЫШЕНИЕ РЕАЛЬНОЙ ПРОИЗВОДИТЕЛЬНОСТИ РВС ПРИ РЕШЕНИИ ЗАДАЧ ЦИФРОВОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ БЫСТРОГО ПРЕОБРАЗОВАНИЯ ФУРЬЕ
А.В. Чкан2021-02-25Аннотация ▼Рассматриваются вопросы цифровой обработки изображений больших размерно-
стей в реальном масштабе времени с помощью реконфигурируемых вычислительных сис-
тем (РВС) на базе ПЛИС. РВС относятся к классу высокопроизводительных многопроцес-
сорных вычислительных систем, но при этом обладают программируемой архитектурой,
позволяющей конфигурировать структуру вычислительной системы, оптимально под-
страивая её под алгоритмы решаемой задачи. В то же время оптимизация вычислитель-
ной структуры задачи сводится к разработке и реализации параллельных алгоритмов,
соответствующих специфике используемой архитектуры РВС. Всё это позволяет эффек-
тивно использовать РВС для решения широкого класса задач цифровой обработки сигна-
лов. Предложены способы повышения удельной и реальной производительности РВС при
решении задач цифровой обработки изображений с использованием быстрого преобразо-
вания Фурье (БПФ). На примере процедуры фильтрации изображений в частотной облас-
ти рассмотрены основные вычислительные этапы и способы их оптимизации, основанные
на свойствах алгоритма БПФ. Применение оптимизации позволяет существенно сокра-
тить как объем вычислений, так и объем задействованных аппаратных ресурсов ПЛИС, и
повысить производительность РВС для задач обработки изображений. Освобожденные в
результате оптимизации вычислительной структуры ресурсы ПЛИС могут быть исполь-
зованы для дополнительного распараллеливания вычислений и ускорения обработки посту-
пающих данных. Показаны преимущества представления данных в формате с фиксирован-
ной запятой при выполнении расчётов на РВС. Использование фиксированной запятой по-
зволяет не только повысить удельную и реальную производительность вычислительной
системы по сравнению с плавающей запятой в силу свойств формата, но и использовать
произвольную разрядность данных, что является актуальным для большинства задач циф-
ровой обработки сигналов. Рассмотрено решение проблемы переполнения разрядной сетки
при использовании формата с фиксированной запятой с помощью масштабирования раз-
рядности данных. -
БИОИНСПИРИРОВАННЫЙ МЕТОД КЛАССИФИКАЦИИ РАСПРЕДЕЛЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ДИСПЕТЧИРОВАНИЯ В ГРИД-СИСТЕМАХ
Д.Ю. Кравченко , Ю.А. Кравченко, В. В. Марков , А.Э. Саак2021-11-14Аннотация ▼Статья посвящена решению задачи диспетчирования распределенных вычислитель-
ных ресурсов на основе их классификации методом биоинспирированного поиска для повы-
шения эффективности функционирования грид-систем. Актуальность задачи обоснована
значительным ростом востребованности парадигмы распределенных вычислений в услови-
ях информационного переполнения и неопределенности. В статье рассмотрены проблемы
диспетчирования гетерогенных вычислительных ресурсов при решении сложных профес-
сиональных и научных задач, поступающих в различные моменты времени, на основе клас-
сификации по значимым признакам соответствия и готовности ресурса. Проведен срав-
нительный обзор существующих аналогов. Сформулирована постановка решаемой задачи вконтексте выбранной тематики исследования. Обоснована стратегия выбора биоинспи-
рированного моделирования для решения поставленной задачи. Проанализированы аспекты
эффективности применения различных децентрализованных биоинспирированных мето-
дов. Предложено решать задачу диспетчирования вычислительных ресурсов на основе
определения соответствия ресурса необходимому классу. Классификация проводиться на
основе применения биоинспирированного метода оптимизации, построенного на основе
алгоритма поиска косяком рыб. Использование популяционного биоинспирированного ме-
тода позволяет обеспечить беспрецедентный параллелизм получения альтернативных
решений и оптимизировать распределение имеющихся вычислительных ресурсов в зависи-
мости от наборов значимых признаков. Объектом исследования являются процессы клас-
сификации данных, включающие в себя упорядоченные последовательности действий, на-
правленных на распределение вычислительных ресурсов по классам решаемых задач. Предме-
том исследования являются биоинспирированные методы решения задачи классификации
данных в грид-системах. Для оценки эффективности предложенного метода разработано
программное приложение и проведен вычислительный эксперимент с разным количеством
сформированных классов вычислительных ресурсов. Каждый вычислительный ресурс имеет
определенный набор атрибутов, являющийся вектором его признаков. Косинусная мера сход-
ства вектора признаков ресурса и вектора признаков определенного класса является крите-
рием классификации. Для повышения качества процесса диспетчирования задача классифи-
кации вычислительных ресурсов решена для множества вариантов организации потоков
сложных решаемых задач в грид-системах. Полученные количественные оценки демонстри-
руют экономию времени при решении задач диспетчирования распределенных вычислитель-
ных ресурсов на основе их классификации методом биоинспирированного поиска не менее
7 %. Временная сложность в рассмотренных примерах составила . Описанные ис-
следования имеют высокий уровень теоретической и практической значимости и напря-
мую связаны с решением классических задач искусственного интеллекта. -
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ДЛЯ РАСЧЕТА ПОКАЗАТЕЛЕЙ НАДЕЖНОСТИ МАСШТАБИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ С УЧЕТОМ ВРЕМЕНИ ПЕРЕКЛЮЧЕНИЯ
В.А. Павский, К. В. Павский2020-07-20Аннотация ▼Основной особенностью масштабируемых вычислительных систем является мо-
дульность. Наращивание производительности в таких системах достигается за счет уве-
личения однотипных элементов, элементарных машин (например, вычислительный узел).
В результате отказов, производительность системы изменяется. Таким образом, мас-
штабируемость вычислительных систем (ВС), с одной стороны, увеличивает производи-
тельность, но с другой стороны, наращивание ресурса обостряет проблему надежности и
увеличивает сложность организации эффективного функционирования. Анализ надежно-
сти и потенциальных возможностей вычислительных систем по-прежнему остается ак-
туальной задачей. Для количественного анализа функционирования масштабируемых вы-
числительных систем используют показатели живучести, связанные с надежностью. На-
пример, показатели потенциальной живучести ВС учитывают то обстоятельство, что
при решении задач используются все исправные элементарные машины, количество кото-
рых изменяется во времени в результате отказов и восстановлений. При анализе надежно-
сти популярными в теории вычислительных систем, являются модели, основанные на тео-
рии марковских процессов и теории массового обслуживания (ТМО). Большинство анали-
тических моделей ТМО не учитывают время переключения (реконфигурации) в отдельном
параметре, ввиду сложности решения. Обычно ограничиваются тем, что время восста-
новления и переключения объединяют в один параметр. В работе, на примере одной модели
ТМО, получены аналитические решения системы дифференциальных уравнений с тремя
параметрами (отказ, восстановление и переключение) для расчета показателей надежно-
сти и потенциальной живучести. Тем самым предоставляется возможность пользовате-
лю самому определить, стоит ли учитывать временя переключения. Показано, что реше-
ния трехпараметрической модели сводятся к решениям двух параметрической модели,
если время переключения не берется в рассмотрение. -
МОДИФИКАЦИЯ РЕАЛИЗАЦИИ МЕТОДА ЯКОБИ ПРИ МОДЕЛИРОВАНИИ СУПЕРДИФФУЗИИ РАДОНА НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
М.Д. Чекина198-2062021-10-05Аннотация ▼При исследовании природных объектов часто возникает проблема моделирования сложных систем, обладающих структурой, не поддающейся описанию посредством инструментов евклидовой геометрии, поэтому для их представления используют фрактальную геометрию и соответствующей ей математический аппарат. Так модель переноса радона в неоднородной среде, использующая супердиффузию, отображает реальные данные точнее классической. Повышение концентрации радона в воздухе является одним из признаков приближающихся землетрясений, что обусловливает необходимость моделирования распространения этого радиоактивного инертного газа в реальном времени. Реконфигурируемые вычислительные системы обладают большим потенциалом для решения задач в реальном времени, но существующие на данных момент средства решения систем линейных алгебраических уравнений имеют низ-кую эффективность из-за нерегулярной структуры матриц, полученных при дискретизации модели супердиффузии радона с применением адаптивных сеток. Базовый подграф метода Якоби преобразуется следующим образом: входные данные векторизуются, структура кадра, в котором производится вычисление значения одного неизвестного, разделяется на несколько микрокадров, распараллеливая вычисления в первом микрокадре, где производится сумма произведений коэффициентов матрицы и значений неизвестных с предыдущей итерации. Полученные результаты буферизируются для последующей выдачи на второй микрокадр, где происходит окончательная обработка и выдача результата итерации. Описанные подход позволяет сократить простой оборудования при решении системы линейных алгебраических уравнений (СЛАУ) с разреженными нерегулярными матрицами, и дает выигрыш по скорости в 5–15 раз по сравнению с существующими методами решения СЛАУ на реконфигурируемых вычисли-тельных системах.
-
ЦЕНТРАЛЬНО-КОЛЬЦЕВОЙ ПОЛИНОМИАЛЬНЫЙ АЛГОРИТМ РАСПРЕДЕЛЕНИЯ ВЫЧИСЛИТЕЛЬНО-ВРЕМЕННЫХ РЕСУРСОВ В ГРИД-СИСТЕМАХ
Д.Ю. Кравченко , Ю.А. Кравченко , Э. В. Кулиев , А.Э. Саак2022-08-09Аннотация ▼Статья посвящена решению задачи распределения вычислительно-временных ресурсов в
грид-системах на основе адаптации используемых полиномиальных алгоритмов к квадратич-
ным типам заявок пользователей. Актуальность задачи обоснована значительным ростом
востребованности парадигмы распределенных вычислений в условиях информационного пере-
полнения и неопределенности. В статье рассмотрены проблемы диспетчирования гетероген-
ных вычислительных ресурсов при решении сложных профессиональных и научных задач, по-
ступающих в различные моменты времени, на основе классификации по значимым признакам
соответствия и готовности ресурса. Проведен сравнительный обзор существующих аналогов.
Сформулирована постановка решаемой задачи в контексте выбранной тематики исследова-
ния. Обоснована проблема диспетчирования грид-систем с централизованной архитектурой,
которая использует технологию мульти-сайтного выполнения задач. Применение данной архи-
тектуры требует разработки эвристических алгоритмов распределения вычислительных ре-
сурсов с функцией учета свойств массивов заявок пользователей и оценки соответствия распи-
сания. Исключение возникновения ошибок диспетчирования требует разработки формального
аппарата, который будет выявлять закономерности множества заявок, введет их типизацию
и построит эвристические алгоритмы с оценкой качества, адаптированные под соответст-
вующие типы. Разработка такого формального аппарата несомненно является актуальной
задачей. Не менее важной задачей в рамках создания данного аппарата является построение
модели паритетности ресурсов и моделей взаимодействия пользователей и вычислительнойсистемы. Авторами предложено решать задачу диспетчирования вычислительных ресурсов на
основе разработки и исследования полиномиальных алгоритмов диспетчирования массивами
заявок гиперболического типа. Основной теоретической значимостью данного исследования
является создание формального аппарата среды диспетчирования, включающего определение
ресурсного прямоугольника, как модели заявки пользователя, на основе выполнения операций в
среде диспетчирования над этими ресурсными прямоугольниками. Научная новизна исследова-
ния заключается в разработке центрально-кольцевого полиномиального алгоритма распределе-
ния вычислительно-временных ресурсов в грид-системах, который отличается от существую-
щих алгоритмов диспетчирования вычислительных систем адаптацией к квадратичным типам
заявок пользователей и позволяет повысить эффективность распределения вычислительно-
временных ресурсов. Для оценки эффективности предложенного алгоритма разработано про-
граммное приложение и проведен вычислительный эксперимент с разным количеством сфор-
мированных классов вычислительных ресурсов. Полученные сравнительные результаты прове-
денных экспериментальных исследований подтверждает эффективность предложенного ал-
горитма распределения вычислительно-временных ресурсов. Описанные исследования имеют
высокий уровень теоретической и практической значимости и напрямую связаны с решением
классических задач искусственного интеллекта. -
МЕТОДИКА СОЗДАНИЯ ТОПОЛОГИЧЕСКИХ ОГРАНИЧЕНИЙ ПРИ ВЫСОКОЙ УТИЛИЗАЦИИ РЕСУРСОВ ПЛИС
К.Н. Алексеев , Д.А. Сорокин , А.Л. Леонтьев2022-11-01Аннотация ▼Рассмотрена проблема достижения высокой реальной производительности реконфи-
гурируемых вычислительных систем при решении вычислительно трудоёмких задач различ-
ных предметных областей. Величину реальной производительности реконфигурируемых сис-
тем определяют параметры выполняемых на них программ, основной компонентой которых
являются вычислительные структуры обработки данных, реализованные в виде конфигура-
ционных файлов ПЛИС. При этом одним из ключевых параметров любой вычислительной
структуры является тактовая частота ее работы, которая непосредственно влияет на её
производительность. Однако достижение высоких тактовых частот сопряжено с рядом
проблем, которые современные средства САПР не решают. Причина кроется в неоптималь-
ном топологическом размещении функциональных узлов вычислительной структуры на поле
примитивов ПЛИС, особенно при высокой утилизации ресурсов. Это приводит к повышенной
нагрузке на коммутационную матрицу ПЛИС и, как следствие, связи между примитивами
ПЛИС, имеющими функциональную зависимость, оказываются значительно длиннее, чем
это допустимо. Кроме того, излишняя длина связей наблюдается при трассировке соедине-
ний между примитивами, которые расположены на разных кремниевых кристаллах ПЛИС
или же физически разделены встроенными периферийными устройствами. В настоящей
статье описывается методика, которая позволяет рационализировать размещение элемен-
тов вычислительной структуры на поле примитивов ПЛИС, минимизировать длину трасс
между примитивами, а также минимизировать число трасс между физически разделенны-
ми топологическими областями ПЛИС. Работоспособность предложенной методики пока-
зана на примере решения тестовой задачи «КИХ-фильтр» на реконфигурируемом компьюте-
ре «Терциус». Проиллюстрированы основные проблемы при достижении целевой тактовой
частоты и описан способ их преодоления. Применение методики позволило увеличить так-
товую частоту и тем самым поднять производительность «Терциус» на 25% без перера-
ботки функциональной схемы вычислительной структуры задачи. Текущие исследованияэффективности предложенной методики позволяют утверждать, что автоматизирован-
ные средства создания топологических ограничений на её основе позволят существенно со-
кратить время разработки программ с требуемыми характеристиками для реконфигури-
руемых вычислительных систем. -
ОЦЕНКА ОСУЩЕСТВИМОСТИ РЕШЕНИЯ ЗАДАЧ НА ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ ПРИ ГРУППОВОМ ОБСЛУЖИВАНИИ
В.А. Павский , К.В. Павский2022-11-01Аннотация ▼Рост производительности вычислительных систем (ВС) связан как с масштабируе-
мостью, так и с развитием архитектуры вычислительных элементов системы. Кластер-
ные ВС, которые являются масштабируемыми, составляют 93% суперкомпьютеров спи-
ска Top500 и относятся к высокопроизводительным. При этом по – прежнему остается
проблема эффективного и полного использования всего имеющегося вычислительного ре-
сурса суперкомпьютера и ВС для решения пользовательских задач. Отказы элементарных
машин (узлов, вычислительных модулей) снижают технико-экономическую эффектив-
ность вычислительных систем и эффективность решения пользовательских задач. По-
этому при планировании процесса решения задач, уменьшение потерь времени на восста-
новление ВС от сбоев, отказов является важной задачей. Для количественной оценки по-
тенциальных возможностей вычислительных систем используются показатели осущест-
вимости решения задач. Эти показатели характеризуют качество работы систем с уче-
том надежности, временных характеристик и параметров обслуживания поступающих
задач. В работе предлагается математическая модель функционирования вычислительной
системы с накопителем при групповом обслуживании потока задач. Математическая
модель использует методы теории массового обслуживания, основанных на теории веро-
ятностей и системах дифференциальных уравнений. Следует заметить, что методика
составления систем дифференциальных уравнений достаточна проста, если представлена
соответствующая им граф-схема. Однако точное решение систем уравнений и, как прави-
ло, в элементарных функциях, не существует, либо формулы труднообозримы. Здесь реше-
ние получено в стационарном режиме функционирования системы массового обслужива-
ния. Рассчитаны показатели, позволяющие оценить наполненность накопителя. Получен-
ные аналитические решения просты, могут быть использованы для экспресс-анализа
функционирования вычислительных систем. -
ОЦЕНКА АППАРАТНОГО СОСТАВА БОРТОВЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ РОБОТОТЕХНИЧЕСКИХ КОМПЛЕКСОВ НА ОСНОВЕ РЕШАЕМЫХ ЗАДАЧ
K. А. Суминов , Н. А. Бочаров, М. А. Кирилюк2025-04-27Аннотация ▼При создании современных робототехнических комплексов (РТК) наблюдается значитель-
ное разнообразие как аппаратных, так и программных решений, что создаёт дополнительные
сложности при подборе рационального аппаратного и программного состава для обеспечения
требуемой вычислительной мощности и эффективного решения поставленных задач. С одной
стороны, зачастую приходится работать с уже установленным набором вычислительных ком-
плексов (ВК), составляющих бортовую вычислительную систему (БВС) РТК, что существенно
ограничивает возможности изменения программного состава и вынуждает адаптировать алго-
ритмы под фиксированные аппаратные ресурсы. С другой стороны, при наличии возможности
изменения или создания нового аппаратного состава возникает задача выбора такой аппаратной
компоновки, которая сможет удовлетворить вычислительным потребностям решаемых задач.
В данной статье предлагается методика оценки аппаратного состава БВС РТК на основе ре-
шаемых задач, опирающаяся на использование многоверсионного программирования и построение
паспортов решений. Каждый из вариантов программных решений для конкретной задачи допол-
няется в виде структурированного паспорта, содержащего как количественные, так и качест-
венные характеристики, что позволяет проводить их детальный сравнительный анализ. На осно-
ве этих паспортов решений разрабатывается математическая модель, позволяющая подобрать
набор вычислителей, способных обеспечить выполнение всех поставленных задач при одновремен-
ной минимизации суммарной стоимости, энергопотребления или других эксплуатационных харак-
теристик БВС. Математически рассматриваемая задача сводится к обобщённой задаче о муль-
типликативном многомерном рюкзаке с мультивыбором и дополнительными ограничениями, что
позволяет учитывать как ресурсные, так и топологические зависимости между решаемыми за-
дачами. Приведены результаты экспериментов, выполненных с использованием разработанного
экспериментального стенда, которые демонстрируют практическую применимость методики и
подтверждают возможность её использования для получения количественных оценок вариантов
аппаратного состава БВС РТК. Данный подход может быть адаптирован для различных типов
РТК, что позволяет использовать его в смежных исследованиях в области оптимизации вычисли-
тельных систем для робототехнических комплексов -
ПЕРСПЕКТИВЫ ПРИМЕНЕНИЯ КВАНТОВЫХ ВЫЧИСЛЕНИЙ ДЛЯ БОРТОВЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ РОБОТОТЕХНИЧЕСКИХ КОМПЛЕКСОВ
Н.А. Бочаров , Н.Б. Парамонов229-2392025-12-30Аннотация ▼Современные робототехнические комплексы решают всё более сложные задачи, что предъявляет повышенные требования к быстродействию и эффективности бортовых вычислительных систем. Традиционные методы наращивания производительности (масштабирование аппаратуры, параллельные вычисления и др.) уже приближаются к своим пределам, поэтому возникает необходимость поиска принципиально новых подходов. Квантовые вычисления рассматриваются как перспективное направление, способное значительно превзойти классические вычислительные мощности в ряде задач. В этой связи целью данного исследования является изучение применимости квантовых вычислений для бортовых вычислительных систем робототехнических комплексов (РТК). Для достижения поставленной цели проведён всесторонний анализ требований (производительность, энергопотребление, массогабаритные показатели, надёжность и др.), предъявляемых к бортовым вычислительным системам РТК. Оценён потенциал квантовых алгоритмов в решении типовых задач робототехники, в том числе оптимизационных задач и задач машинного обучения, и проведено их имитационное моделирование с последующим сравнением результатов с классическими методами. Кроме того, рассмотрены текущие ограничения современных квантовых компьютеров (например, ограниченное число кубитов и проблемы декогеренции) и на основе тенденций развития технологий сделан прогноз их совершенствования в ближайшие годы. Проведённое исследование подтверждает перспективность применения квантовых вычислений для решения задач оптимизации и машинного обучения, которые являются ключевыми для интеллектуальных РТК. Однако текущие технологические ограничения (габариты, требования к условиям работы и нестабильность квантовых процессоров) пока не позволяют использовать квантовые компьютеры непосредственно на борту. Тем не менее, предложены направления дальнейших исследований и рассмотрены возможные сценарии постепенного внедрения квантовых вычислений в архитектуру РТК в ближайшие 5–15 лет, например, по мере миниатюризации квантовых процессоров и развития методов их интеграции в бортовые системы. Таким образом, по мере устранения существующих барьеров квантовые вычислители могут со временем стать неотъемлемой частью бортовых систем управления РТК, обеспечивая качественный скачок в их производительности.
-
МЕТОДЫ ПРЕОБРАЗОВАНИЯ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР С ОБРАТНЫМИ СВЯЗЯМИ ДЛЯ ЭФФЕКТИВНОЙ РЕАЛИЗАЦИИ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
С.А. Дудко , И.И. Левин2021-12-24Аннотация ▼В настоящее время для решения задач на реконфигурируемых вычислительных системах
используются различные системы автоматизированного проектирования. В большинстве слу-
чаев они состоят из двух основных компонент: компилятора (транслятора), переводящего
текст исходной программы в графовую информационно-вычислительную структуру, и синте-
затора, размещающего ее в архитектуре программируемых логических интегральных схем.
Существующие синтезаторы, как правило, обрабатывают информационно-вычислительную
структуру без комплексной оптимизации. Поэтому полученное решение прикладной задачи
может содержать неэффективные фрагменты, снижающие быстродействие прикладной
программы. Наиболее распространёнными примерами неэффективных вычислительных
структур являются фрагменты, реализующие рекурсивные выражения, так как они снижают
быстродействие прикладной программы. В статье предложены методы преобразования ре-
курсивных выражений (фрагментов с обратными связями), которые позволяют в автоматиче-
ском режиме сократить интервал обработки данных при решении прикладных задач на рекон-
фигурируемых вычислительных системах. В основе методов лежат информационно-
эквивалентные преобразования информационно-вычислительной структуры исходной задачи.
Для каждого преобразования определен набор правил, которым должны удовлетворять опера-
ционные вершины вычислительной структуры. Применение правил позволяет выполнять экви-
валентные преобразования не только над простыми структурами данных, такими как числа,
но также и над более сложными структурами (матрицами, векторами, тензорами и т.п.).
По результатам моделирования разработанные методы преобразования информационно-
вычислительных структур с обратными связями позволяют сократить время решения при-
кладных задач примерно в 2–5 раз, за счет сокращения интервала обработки данных. Предло-
женные методы реализованы в прототипе оптимизирующего синтезатора информационно-
вычислительных структур.








