Найти
Результаты поиска
-
НЕКОТОРЫЕ МЕТОДЫ СИНХРОНИЗАЦИИ ИНФОРМАЦИОННЫХ ПОТОКОВ В СИСТЕМАХ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ
И.И. Левин , И.И. Левин , Д. С. Буряков2024-11-10Аннотация ▼Предложены некоторые методы обеспечения когерентной обработки данных в системах
радиолокации и связи, включающих фазированные антенные решетки (ФАР). Разработан подход
для сбора оцифрованных данных от антенных элементов ФАР и передачи информации между
распределенными узлами, которые выполняют цифровую обработку сигналов. Для обеспечения
когерентной обработки и передачи данных предлагается использовать сигнал опорной тактовой
частоты и единое машинное время, которые генерируются в центральном узле и распространя-
ются по каналам с одинаковой задержкой. Все управляющие воздействия в узлах обработки осно-
ваны на данных сигналах. Для передачи оцифрованных данных от антенных элементов ФАР в ра-
боте предлагается использовать передачу фрагментами операндов с контролем целостности
информации и привязкой ко времени оцифрованных данных. Проведенные эксперименты на реаль-
ном устройстве формирования диаграммы направленности подтвердили эффективность данного
метода и его пригодность для практического использования. Развитие систем цифровой обра-
ботки сигналов (ЦОС) с ФАР постоянно движется вперед, требуется создание новых радиолока-
ционных систем с высокой разрешающей способностью и достаточной чувствительностью.
Обычно для повышения разрешающей способности увеличивают количество антенных элементов
ФАР. Однако это приводит к увеличению размеров антенны и, следовательно, длины линий связи.
При увеличении длины линии связи могут возникать различия в путях распространения сигнала из-
за разброса характеристик оптических линий связи и воздействия внешних факторов на сигнал
при его передаче через более длинные линии. Это может привести к неоднородности в задержках
между каналами синхронизации и нарушению работы системы когерентной обработки. В связи с
этим в работе предложен новый метод динамической компенсации задержек в каналах системы
единого машинного времени для корректной работы с большими длинами линий связи -
МЕТОД ГЕНЕРАЦИИ ТОПОЛОГИЧЕСКИХ ОГРАНИЧЕНИЙ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР ДЛЯ РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ
А.А. Диченко , И. И. Левин , Д.А. Сорокин33-462025-12-30Аннотация ▼Для реконфигурируемых вычислительных систем на базе ПЛИС эффективными прикладными программами являются параллельно-конвейерные программы, обеспечивающие реальную производительность более 50% от пиковой. Статья посвящена решению проблемы сокращения времени их разработки. Вычислительные структуры таких программ используют большой объём вычислительного ресурса ПЛИС, функционирующих на высокой тактовой частоте. Однако одновременная максимизация объёма задействованного ресурса ПЛИС и тактовой частоты находится в некотором противоречии, поскольку при большом заполнении снижается вариативность размещения функциональных узлов вычислительных структур и коммутационная матрица ПЛИС при трассировке информационных каналов между ними не обеспечивает требуемых характеристик по времени распространения сигналов. Более того в современных САПР алгоритмы размещения и трассировки учитывают только архитектурные и геометрические особенности ПЛИС. Поэтому при использовании большого числа специализированных примитивов, вариативность размещения которых крайне мала, достижение высоких тактовых частот в автоматическом режиме синтеза практически невозможно. Для решения этой проблемы также необходимо учитывать информационные зависимости между функциональными узлами вычислительных структур, но характер информационных зависимостей решаемых задач различных предметных областей может существенно отличаться. Поэтому разработчики вынуждены каждый раз вручную размещать на ПЛИС функциональные узлы путём создания скриптовых инструкций топологических ограничений. Время формирования топологических ограничений для ПЛИС прежних поколений было приемлемым, поскольку они содержали, как правило, до нескольких сотен специализированных примитивов. Однако в современных ПЛИС их количество достигает нескольких тысяч и даже десятков тысяч штук, что приводит к значительному увеличению времени разработки эффективных прикладных программ. Предлагаемый метод позволяет автоматизировать процесс разработки топологических ограничений вычислительных структур. Исследования были проведены при разработке прикладных программ решения ряда задач на основе алгоритмов БПФ, AES и
LU-разложения для реконфигурируемого компьютера «Tertius-2». В результате значительного сокращения временных затрат, обусловленных числом итераций оптимизации вычислительных структур, общее время синтеза было сокращено до трех раз -
СУММАТОР С ПЛАВАЮЩЕЙ ЗАПЯТОЙ В ЦИФРОВЫХ ФОТОННЫХ ВЫЧИСЛИТЕЛЬНЫХ УСТРОЙСТВАХ
Д.А. Сорокин , И.И. Левин168-1782025-11-10Аннотация ▼В рамках предлагаемой авторами концепции структурной организации вычислений в цифровых фотонных вычислительных устройствах необходимо использовать последовательную обработку информации, что позволяет минимизировать скважность подачи операндов из внешней памяти или других электронных источников на фотонное устройство. Это становится возможным, когда обработка операндов не превышает число тактов, равное их разрядности. Кроме того, при последовательной поразрядной обработке значительно снижаются аппаратные затраты на синхронизацию потоков данных. Устранение скважности и снижение накладных расходов на реализацию вычислительных структур в значительной степени способны повысить эффективность цифровых фотонных вычислительных устройств относительно электронных. Однако для создания фотонных вычислительных структур, ориентированных на решение различных трудоёмких задач из таких областей, как математическая физика, линейная алгебра, нейросетевая обработка и многих других, необходимы устройства, реализующие базовые арифметические функции в формате плавающей запятой. Большинство таких арифметических функций содержит элементарную операцию целочисленного сложения. При последовательной обработке операндов младшими разрядами вперёд в двоичной форме представления устройства целочисленного сложения не могут начать выдавать результат до тех пор, пока не будут обработаны все биты информации для учёта переноса, что увеличивает в два раза скважность подачи операндов и латентность устройства. Поэтому для устранения скважности и сокращения латентности предлагается использовать четверичную знакоразрядную форму представления чисел и подавать операнды старшими разрядами вперёд. Применение знакоразрядной формы представления чисел позволяет выполнять немедленную передачу старших разрядов результата операции для дальнейшей обработки в следующие устройства, не дожидаясь получения младших разрядов. В статье рассматриваются вопросы построения всех компонент знакоразрядного сумматора с плавающей запятой: блока определения разности порядков, блока денормализации мантиссы меньшего числа, сумматора мантисс, блока нормализации мантиссы результата и блока коррекции порядка результата. Приведены алгоритмы функционирования данных блоков. Оценка эффективности предлагаемого знакоразрядного сумматора выполнена на макете, разработанном в базисе цифровой фотонной логики на реконфигурируемом компьютере «Терциус». Показано, что за счёт величины тактовой частоты работы цифровые фотонные вычислительные устройства способны обеспечить производительность почти на два десятичных порядка больше по сравнению с микроэлектронными устройствами
-
РЕАЛИЗАЦИЯ МЕТОДОВ СИНХРОНИЗАЦИИ ИНФОРМАЦИОННЫХ ПОТОКОВ В СИСТЕМАХ ЦИФРОВОЙ ОБРАБОТКИ СИГНАЛОВ
И.И. Левин, Д.С. Буряков119-1342025-07-24Аннотация ▼В задачах цифровой обработки сигналов, предполагающих когерентную обработку данных от фазированной антенной решетки, важно обеспечить согласованное поступление оцифрованных данных от антенных элементов в узлы обработки. С ростом числа каналов передачи данных в комплексах ЦОС существенно возрастает вероятность возникновения ошибок в каналах передачи данных, что выдвигает повышенные требования к обеспечению гарантоспособности программного комплекса изохронной передачи данных. В статье представлены результаты разработки и реализации методов, повышающих гарантоспособность изохронной передачи данных. Предложен комбинированный метод изохронной передачи данных, отличающийся применением служебных промежутков при передаче массивов операндов и динамической компенсацией задержек в каналах данных. Выделены наиболее вероятные ошибки, возникающие при передаче данных и предложены способы их парирования. Описан программный комплекс, реализующий комбинированный метод. Используя атрибутивную модель гарантоспособности, проведен анализ гарантоспособности программного комплекса. Анализ показал, что использование комбинированного метода позволит в четыре раза увеличить количество каналов передачи данных в комплексе ЦОС при заданном уровне гарантоспособности и фиксированном времени доверительной работы по сравнению с базовым методом. При значительном увеличении количества каналов передачи данных возникает необходимость сохранения заданного уровня гарантоспособности. В этой связи предложен модернизированный метод изохронной передачи данных, в котором были усовершенствованы алгоритмы проверки целостности данных, проверки допустимого диапазона рассогласования задержек в каналах данных и добавлен алгоритм переключения опорных каналов. Оценка гарантоспособности реализации модернизированного метода показала его способность обеспечить двукратное увеличение числа каналов данных по сравнению с комбинированным методом.
-
СТРУКТУРНАЯ МОДИФИКАЦИЯ МЕТОДА ХАФФМАНА ДЛЯ СЖАТИЯ ПЛОТНЫХ ПОТОКОВ ДАННЫХ БЕЗ ПОТЕРЬ НА РВС
И.И. Левин , Е.А. Дудников2024-11-10Аннотация ▼Современные запросы общества требуют решения целого ряда вычислительно трудоемких
задач в режиме реального времени. Для подобных решений необходимы огромные вычислительные
мощности, широкополосные высокоскоростные каналы передачи данных и внушительные объемы
памяти. Обеспечить подобные запросы можно за счет разработки и внедрения новых технологий,
наращивания технической инфраструктуры, что потребует значительных финансовых и временных
затрат. Облегчить подобный переход, используя существующую техническую базу, можно за счет
использования алгоритмов сжатия данных в реальном времени. Средства сжатия данных в темпе
поступления могут повысить скорость вычислений, передачи данных, снизить занимаемый объем
при хранении, используя имеющуюся инфраструктуру. Современные технические платформы на
базе CPU не способны обеспечить потоковую обработку данных в темпе их поступления, реальная
производительность подобных систем не превышает 10 % от пиковой. Новой платформой для сис-
тем сжатия данных без потерь в темпе поступления могут стать реконфигурируемые вычисли-
тельные системы (РВС) на базе программируемых логических интегральных схем (ПЛИС). Однако
для эффективной работы подобных систем требуется разработка новых методов с применением
структурных вычислений, позволяющих полностью раскрыть потенциал ресурса ПЛИС. В данной
работе представляется реализация на РВС модификации динамического алгоритма кодирования
Хаффмана, которая позволяет создавать префиксные коды оптимальной длины и обрабатывать
плотные потоки данных в темпе поступления с пропускной способностью не менее 128 Гбит\с. Про-
изводительность разработанной модификации в 5 раз превосходит наилучшую известную компле-
ментарную реализацию на базе FPGA на один вычислительный конвейер -
ПРЕОБРАЗОВАНИЕ ПРОСТЕЙШИХ СОРТИРУЮЩИХ СЕТЕЙ К НЕЧЕТНО-ЧЕТНОЙ СЕТИ БАТЧЕРА
И.И. Левин , К. Н. Алексеев , А.А. Гуленок2024-10-08Аннотация ▼Все алгоритмы сортировки являются информационно-эквивалентными, поэтому выбор наи-
более эффективного алгоритма обычно зависит от скорости его работы и от количества ис-
пользуемой памяти. При параллельной, аппаратной реализации на эффективность алгоритмов
сортировки также влияют: степень утилизации аппаратных ресурсов; латентность результи-
рующей вычислительной структуры; количество и разрядность сортируемых элементов. Задача
сортировки или упорядочивания данных не формализована в виде математических преобразова-
ний, поэтому каждый из известных алгоритмов ее решения принято рассматривать как атомар-
ную, независимую единицу. Переход от одного алгоритма решения задачи к другому возможен при
описании задачи в виде информационного графа, вершины которого отражают элементарные
выполняемые операции, а дуги – информационные зависимости между ними. Имея набор элемен-
тарных преобразований, можно влиять на функциональную регулярность связей информационного
графа, латентность вычислительной структуры, коэффициент параллелизма и т.д. К преимуще-
ствам работы с информационным графом задачи также можно отнести сравнительную про-
стоту используемого понятийного аппарата. Информационный граф задачи сортировки «пузырь-
ком» представляет собой простейшую сортирующую сеть, построенную по принципу объедине-
ния ступеней «голова-хвост». В данной работе показана и обоснована функциональная избыточ-
ность подобных сортирующих сетей; приведены способы оптимизации числа операций и измене-
ния порядка их следования. Основным результатом работы является методика преобразования
сортирующих сетей в нечетно-четную сеть слияния Батчера. Разработана программа, автома-
тически выполняющая преобразование сортирующих сетей и позволяющая подстраивать тополо-
гию информационного графа под наиболее эффективный вид в зависимости от результирующей
степени параллелизма вычислительной структуры. Обобщая полученные результаты, можно
отметить, что автоматизированное приведение известных алгоритмов к «быстрым» может
обеспечить получение оптимальной параллельно-конвейерной программы при заданных ограниче-
ниях, что позволит значительно ускорить процесс их разработки. -
АРХИТЕКТУРА ФУНКЦИОНАЛЬНЫХ УСТРОЙСТВ ЦФВМ
И.И. Левин , Д.А. Сорокин , А.В. Касаркин2024-01-05Аннотация ▼Статья посвящена проблемам развития цифровых фотонных вычислительных ма-
шин, которые наряду с квантовыми компьютерами являются одним из возможных спосо-
бов преодоления кризиса производительности вычислительной техники. Реализация обра-
ботки данных в цифровых фотонных вычислительных машинах на частотах терагерцово-
го уровня потенциально обеспечивает производительность, превосходящую на два и болеедесятичных порядков производительность самых современных вычислительных систем.
Современные исследования говорят о перспективности развития цифровой фотоники, спо-
собной обеспечить производительность, существенно превосходящую производительность
микроэлектронных вычислителей при одинаковой точности вычислений. При этом в большей
степени усилия исследователей направлены на создание цифровых фотонных логических эле-
ментов, в то время как вопросы архитектуры рассматриваются весьма поверхностно. Ав-
торы рассматривают проблемы разработки архитектуры цифровой фотонной вычисли-
тельной машины, которая могла бы обеспечить решение широкого класса вычислительно
трудоёмких задач в структурной парадигме. Показано, что для использования данной пара-
дигмы вычислений подсистема синхронизации и коммутации должна иметь иерархичекую
топологию с возможностью настройки информационных связей как в процессе программи-
рования фотонной машины, так и в процессе решения задач. Рассматриваются принципы
обеспечения быстродействия и точности решения задач на цифровой фотонной вычисли-
тельной машине при выбранном способе представления данных. Авторы разработали в бази-
се фотонной логики модели функциональных устройств основных арифметических операций:
сложения и умножения в стандарте IEEE 754. Устройства реализованы по схеме линейного
конвейера с обработкой младшими разрядами вперёд. В отличие от традиционной микро-
электроники предлагаемый подход к построению конвейерных функциональных устройств
не предполагает использование регистров-защёлок, реализация которых в цифровой фотон-
ной логике приводит к избыточным аппаратным затратам. Также при построении вычис-
лительных схем ограничен коэффициент разветвления аппаратных информационных связей
между логическими элементами, что позволит снизить проблему затухания сигналов.
На ПЛИС выполнено макетирование разработанных функциональных устройств сложения и
умножения и оценена производительность реализуемых на ЦФВМ вычислительных струк-
тур, подобных структурам, возникающим в задачах математической физики при выполне-
нии операций типа «умножение матрицы на вектор». -
ПРЕОБРАЗОВАНИЕ СОРТИРУЮЩИХ СЕТЕЙ ДЛЯ РАЗНОЙ СТЕПЕНИ ПАРАЛЛЕЛИЗМА
И.И. Левин , К.Н. Алексеев2023-12-11Аннотация ▼Одни известные алгоритмы сортировки могут быть эффективнее других по какому-
либо из основных критериев: число выполняемых операций, время выполнения элементар-
ных операций, объем используемой памяти, степень параллелизма, функциональная регу-
лярность связей в информационном графе алгоритма и т.д. При этом, имеется возмож-
ность выбрать такой алгоритм сортировки, который после выполнения операции редук-
ции производительности вычислительной структуры, будет занимать минимум аппарат-
ного ресурса. Выбор конкретного алгоритма напрямую зависит степени его распараллели-
вания, заданного временем обработки данных, коэффициента редукции и латентности
вычислительной структуры, количества и разрядности сортируемых элементов. Алго-
ритмы сортировки являются информационно-эквивалентными, так как они выполняют
одну и ту же математическую функцию. Однако каждый из алгоритмов рассматривает-
ся как автономный и независимый подход к решению задачи упорядочивания данных. Из-
вестно, что алгоритмам сортировки «пузырьком», «вставками» и «выбором» соответст-
вует одна и та же сортирующая сеть, однако переход от одного алгоритма к другому до
сих пор не описан в виде математических преобразований. Можно утверждать, что в
настоящее время математический аппарат для описания различных алгоритмов сорти-
ровки и сортирующих сетей не формализован в полной мере, из-за чего не существует ме-
тодологических основ перехода от одного алгоритма к другому. Иным способом описания
алгоритма решения задачи является его представление в виде информационного графа, где
выполняемые операции являются вершинами, которые объединены дугами, отражающими
информационную зависимость между операциями. Преобразование информационного гра-
фа может приводить к получению иных информационно-эквивалентных алгоритмов. Преимуществом подобного подхода к описанию алгоритмов является сравнительная просто-
та используемого понятийного аппарата. В данной работе рассмотрены правила преобра-
зования сортирующих сетей, на основе которых выполнен переход от одной сети к другой.
Каждая из полученных сортирующих сетей может быть эффективна при разных коэф-
фициентах распараллеливания и разном темпе обработки данных, от которых напрямую
зависит коэффициент редукции производительности реализуемой вычислительной струк-
туры. Автоматизация предложенных методов преобразования может позволить исполь-
зовать разные алгоритмы сортировки, полученные из единого описания задачи в виде ин-
формационного графа, и зависящие от заданной скорости обработки данных. -
ПЕРСПЕКТИВНАЯ АРХИТЕКТУРА ЦИФРОВОЙ ФОТОННОЙ ВЫЧИСЛИТЕЛЬНОЙ МАШИНЫ
И.И. Левин , Д. А. Сорокин , А. В. Касаркин2023-02-27Аннотация ▼Высокоэффективное решение современных трудоёмких задач математической фи-
зики требует постоянного наращивания производительности используемых вычислитель-
ных средств. Однако в настоящее время развитие их элементной базы замедляется в силу
ограничений, накладываемых технологическими, производственными и эксплуатационными
процессами. Один из вариантов преодоления кризиса роста производительности вычисли-
тельной техники заключается в развитии цифровых фотонных вычислительных машин
(ЦФВМ). Предлагаемая авторами архитектура ЦФВМ состоит из функциональной под-
системы, подсистем синхронизации и коммутации потоков данных и фотонно-
электронных интерфейсов обмена данными с внешними устройствами. Изложены принци-
пы работы каждой подсистемы. Функциональная подсистема представляет собой сово-
купность устройств ЦФВМ, обеспечивающих выполнение арифметико-логических опера-
ций в формате 64-разрядной плавающей запятой стандарта IEEE754 и реализованных по
схеме линейного конвейера с обработкой младшими разрядами вперёд. Подсистема син-
хронизации обеспечивает единый темп потоков данных между различными функциональ-
ными устройствами ЦФВМ, объединёнными в вычислительную структуру. Подсистема
коммутации на этапе программирования ЦФВМ или в процессе решения задачи при выпол-
нении условных переходов управляет потоками данных в соответствии с топологией вы-
числительной структуры. Для обмена данными ЦФВМ с внешними устройствами предла-
гается применение технологии сериализации низкочастотных параллельных каналов и де-
сериализации высокочастотных последовательных каналов. Приведены теоретические
оценки производительности реализуемых на ЦФВМ вычислительных структур, подобных
структурам, возникающим в задачах математической физики при обработке специальных
матриц. Показано, что ЦФВМ за счёт величины тактовой частоты работы способны
обеспечить производительность на два и боле десятичных порядка больше по сравнению с
микроэлектронными устройствами. -
МЕТОД РАСПАРАЛЛЕЛИВАНИЯ ПО БАЗОВЫМ МАКРООПЕРАЦИЯМ ДЛЯ ОБРАБОТКИ БОЛЬШИХ РАЗРЕЖЕННЫХ НЕСТРУКТУРИРОВАННЫХ МАТРИЦ НА РВС
И.И. Левин , А.В. Подопригора2023-02-27Аннотация ▼Анализ методов и средств обработки больших разреженных неструктурированных
матриц кластерными вычислительными системами с традиционной архитектурой пока-
зал, что для большинства задач обработки матриц с числом строк порядка 105 произво-
дительность снижается в 5-7 раз по сравнению с пиковой производительностью, при этом
пиковая производительность вычислительных систем, главным образом, оценивается
тестом LINPAC, который предполагает выполнение матричных операций. Основной целью
работы является повышение эффективности обработки больших разреженных неструк-
турированных матриц, для чего целесообразно использовать реконфигурируемые вычисли-
тельные системы на основе ПЛИС как основной тип вычислительных средств. Для эф-
фективной обработки больших разреженных неструктурированных матриц на реконфигу-
рируемых вычислительных системах используется ряд ранее описанных в работах методов
и подходов, такие как структурная организация вычислений, формат представления боль-
ших разреженных неструктурированных матриц «ряд строк», парадигма дискретно-
событийной организации потоков данных, метод распараллеливание по итерациям.
В статье рассматривается метод распараллеливания по базовым макрооперациям для
решения задачи обработки больших разреженных неструктурированных матриц на РВС,
который предполагает получение постоянной эффективности вычислений независимо от
портрета обрабатываемых больших разреженных неструктурированных матриц. Исполь-
зование для реконфигурируемых вычислительных систем разработанных методов обра-
ботки больших разреженных неструктурированных матриц позволяют обеспечивать эф-
фективность вычислений на уровне 50%, что в несколько раз превосходит эффективность
традиционных вычислительных систем. -
ОЦЕНКА ВОЗМОЖНОСТЕЙ ПЕРСПЕКТИВНЫХ ВЫЧИСЛИТЕЛЬНЫХ ТЕХНОЛОГИЙ ДЛЯ РАСЧЕТА ТОЧНЫХ ПРИБЛИЖЕНИЙ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ ЗНАЧЕНИЙ СТАТИСТИК
А.К. Мельников , И.И. Левин , А.И. Дордопуло , Л.М. Сластен2022-11-01Аннотация ▼Статья посвящена оценке аппаратного ресурса вычислительных систем для решения
вычислительно-трудоемкой задачи – расчета распределений вероятностей значений ста-
тистик методом второй кратности на основе Δ-точных приближений для выборок объе-
мом от 320 до 1280 знаков при мощности алфавита от 128 до 256 символов с точностью
=10-5. Общее время решения не должно превышать 30 дней или 2,592·106 секунд при круг-
лосуточном режиме вычислений. Использование свойств метода второй кратности позво-
ляет привести вычислительную сложность расчета к диапазону 9,68·1022–1,60·1052 опера-
ций с числом проверяемых векторов – от 6,50·1023 до 1,39·1050. Решение этой задачи для
указанных параметров выборок в заданное время с помощью современных вычислительных
средств (процессоров, графических ускорителей, программируемых логических интеграль-
ных схем) требует недостижимого на практике аппаратного ресурса. Поэтому в статье
анализируются возможности перспективных квантовых и фотонных технологий для ре-
шения задачи с заданными параметрами. Основным преимуществом квантовых вычисли-
тельных систем является высокая скорость вычислений для всех возможных значений па-
раметров. Однако, для расчета распределений вероятностей значений статистик кванто-
вое ускорение не будет достигнуто из-за необходимости проверки всех полученных реше-
ний, число которых соответствует размерности задачи. Кроме того, текущий уровень
развития элементной базы не позволяет создавать и использовать квантовые вычислите-
ли с разрядностью 120 кубитов, необходимой для решения рассматриваемой задачи. Фо-
тонные вычислители могут обеспечить высокую скорость вычислений при низком энерго-
потреблении и для решения рассматриваемой задачи требуют наименьшее число узлов.
Однако, нерешенные проблемы с физической реализацией элементов оперативного хране-
ния данных и отсутствием доступной элементной базы не позволяют в обозримой пер-
спективе (5–7 лет) использовать фотонные вычислительные технологии для расчета рас-
пределений вероятностей значений статистик, поэтому наиболее целесообразно примене-
ние гибридных вычислительных систем, содержащих узлы различных архитектур.
Для реализации задачи на различных аппаратных платформах (универсальные процессоры,
графические ускорители, программируемые логические интегральные схемы) и конфигура-
циях гибридных вычислительных систем предложено использование архитектурно-
независимого языка программирования высокого уровня SET@L, объединяющего представ-
ление вычислений в виде множеств и совокупностей с помощью альтернативной теории
множеств П. Вопенка с абсолютным параллелизмом информационного графа и парадиг-
мами аспектно-ориентированного программирования. -
АНАЛИЗ ВОЗМОЖНОСТЕЙ СОВРЕМЕННЫХ ВЫЧИСЛИТЕЛЬНЫХ ТЕХНОЛОГИЙ ДЛЯ РАСЧЕТА ТОЧНЫХ ПРИБЛИЖЕНИЙ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ ЗНАЧЕНИЙ СТАТИСТИК
А.К. Мельников , И.И. Левин , А.И. Дордопуло , И.В. Писаренко6-192021-10-05Аннотация ▼В статье рассматривается решение вычислительно-трудоемкой задачи – расчета распределений вероятностей значений статистик – с помощью современных вычисли-тельных технологий. Для сокращения вычислительной сложности при обеспечении достаточного уровня эффективности критериев не ниже заданного порога предложено использование Δ-точных приближений. Для расчета точных приближений используется метод второй кратности, основанный на решении системы линейных уравнений, который позволяет при заданном вычислительном ресурсе рассчитывать точные приближения для максимальных значений параметров выборок. Наиболее трудоемкая часть метода второй кратности состоит в процедуре последовательного получения векторов возможных решений и их проверки на принадлежность к самим решениям. Проверка векторов возможных решений на принадлежность к решениям системы информационно независима, поэтому алгоритм расчета можно распараллелить по данным. Приведена формула определения алгоритмической сложности расчета точных приближений распределений вероятностей значений статистик, на основе которой получены оценки сложности современных практических задач для выборок со следующими значениями (N, n) мощности алфавита и объёма выборки: (256,1280), (128,640), (128, 320) и (192,3200) при точности расчета =10-5. Вычислительная сложность расчета составляет от 9,68·1022 до 1,60·1052 операций, средняя порядка 4,55·1025 операций, число проверяемых векторов – от 6,50·1023 до 1,39·1050, а число решений – от 4,67·1012 до 5,60·1025 соответственно. Общее время решения при круглосуточном режиме вычислений не должно превышать 30 дней или 2,592·106 сек. Для полученных оценок сложности проанализированы возможности современных кластерных вы-числительных систем на основе универсальных процессоров, графических ускорителей и реконфигурируемых вычислительных систем на основе программируемых логических интегральных схем. Для каждой технологии определено число вычислительных узлов, требуемых для расчета точных приближений с указанными параметрами в заданное время. Показано, что ни одна из рассмотренных вычислительных технологий на современном уровне развития техники не позволяет получить решение для необходимых параметров расчета точных приближений распределений вероятностей значений статистик. В заключении сделан вывод о необходимости анализа возможностей перспективных вычислительных технологий на основе квантовых и фотонных компьютеров, а также гибридных вычисли-тельных систем для расчета точных приближений распределений вероятностей значений статистик с заданными параметрами в оперативно-приемлемое время
-
МЕТОДЫ ПРЕОБРАЗОВАНИЯ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР С ОБРАТНЫМИ СВЯЗЯМИ ДЛЯ ЭФФЕКТИВНОЙ РЕАЛИЗАЦИИ НА РЕКОНФИГУРИРУЕМЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ
С.А. Дудко , И.И. Левин2021-12-24Аннотация ▼В настоящее время для решения задач на реконфигурируемых вычислительных системах
используются различные системы автоматизированного проектирования. В большинстве слу-
чаев они состоят из двух основных компонент: компилятора (транслятора), переводящего
текст исходной программы в графовую информационно-вычислительную структуру, и синте-
затора, размещающего ее в архитектуре программируемых логических интегральных схем.
Существующие синтезаторы, как правило, обрабатывают информационно-вычислительную
структуру без комплексной оптимизации. Поэтому полученное решение прикладной задачи
может содержать неэффективные фрагменты, снижающие быстродействие прикладной
программы. Наиболее распространёнными примерами неэффективных вычислительных
структур являются фрагменты, реализующие рекурсивные выражения, так как они снижают
быстродействие прикладной программы. В статье предложены методы преобразования ре-
курсивных выражений (фрагментов с обратными связями), которые позволяют в автоматиче-
ском режиме сократить интервал обработки данных при решении прикладных задач на рекон-
фигурируемых вычислительных системах. В основе методов лежат информационно-
эквивалентные преобразования информационно-вычислительной структуры исходной задачи.
Для каждого преобразования определен набор правил, которым должны удовлетворять опера-
ционные вершины вычислительной структуры. Применение правил позволяет выполнять экви-
валентные преобразования не только над простыми структурами данных, такими как числа,
но также и над более сложными структурами (матрицами, векторами, тензорами и т.п.).
По результатам моделирования разработанные методы преобразования информационно-
вычислительных структур с обратными связями позволяют сократить время решения при-
кладных задач примерно в 2–5 раз, за счет сокращения интервала обработки данных. Предло-
женные методы реализованы в прототипе оптимизирующего синтезатора информационно-
вычислительных структур. -
ПЕРСПЕКТИВНЫЕ ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ РЕКОНФИГУРИРУЕМЫЕ ВЫЧИСЛИТЕЛИ С ИММЕРСИОННЫМ ОХЛАЖДЕНИЕМ
И.И. Левин, А. М. Федоров, Ю. И. Доронченко, М. К. Раскладкин2021-02-25Аннотация ▼Рассматриваются перспективны создания высокопроизводительных реконфигурируемых
вычислительных устройств на основе современных ПЛИС фирмы Xilinx семейства UltraScale+.
Целью работы является достижение в одном изделии с конструктивом 3U 19’ вычислительной
плотности до 128 ПЛИС высокой степени интеграции при обеспечении соответствующих
электропитания и охлаждения вычислительных элементов системы для решения вычислитель-
но трудоемких задач. Обеспечение требуемых характеристик изделия в заданном конструкти-
ве потребовало усложнения топологии печатных плат и технологии изготовления его состав-
ных частей. Для охлаждения компонентов вычислительной системы используется иммерсион-
ная (погружная) технология. Особенностью разрабатываемых вычислительных систем явля-
ется широкие возможности информационного обмена внутри блока и между блоками для ре-
шения сильносвязанных задач, в которых количество пересылок данных между функциональ-
ными устройствами больше, чем количество таких устройств. В качестве основных связей
между ПЛИС используются дифференциальные линии с подключенными к ним мульти-
гигабитными трансиверами (MGT). Разработанная на основе оптических каналов система
информационного обмена между блоками обеспечивает пропускную способность более
2 Тбит/с. Разработан и изготовлен опытный образец вычислительного модуля на основе ПЛИС
UltraScale+. На его основе изготовлен прототип реконфигурируемого вычислительного блока.
Вычислительный блок содержит в своем составе универсальный процессор и необходимые ин-
терфейсы ввода-вывода, являясь функционально законченным устройством. На вычислитель-
ном модуле нового поколения был реализован ряд алгоритмов различных научно-технических
задач, что подтвердило возможность широкого применения вычислителей. Разработана мо-
дернизированная иммерсионная подсистема охлаждения, которая обеспечивает отвод выде-
ляемой суммарной тепловой мощности до 20 кВт. Для достижения такого уровня теплоотво-
да реализованы технические решения по всем компонентам системы охлаждения: хладагенту,
радиаторам, насосу, теплообменнику. Объединение множества блоков в единый вычислитель-
ный контур позволит создавать вычислительные комплексы с производительностью до не-
скольких десятков петафлопс. Такие комплексы требуют наличия соответствующей инже-
нерной инфраструктуры. -
КОМПЛЕКС СРЕДСТВ ТРАНСЛЯЦИИ ПРОГРАММ НА ЯЗЫКЕ C В ПРОГРАММЫ НА ЯЗЫКЕ ПОТОКА ДАННЫХ COLAMO
А. И. Дордопуло, A.A. Гуленок, А.В. Бовкун, И.И. Левин, В. А. Гудков, С.А. Дудко2021-02-25Аннотация ▼Рассматриваются программные средства трансляции последовательных программ
на языке C в масштабируемые параллельно-конвейерные программы на языке программи-
рования реконфигурируемых вычислительных систем COLAMO. В отличие от существую-
щих средств высокоуровневого синтеза, результатом трансляции является не IP-ядро
фрагмента задачи, а комплексное решение задачи для многокристальных реконфигурируе-
мых вычислительных систем с автоматической синхронизацией информационных и управ-
ляющих сигналов. Рассмотрены основные этапы трансляции последовательной программы
на языке C: преобразование в информационный граф, анализ информационных зависимо-
стей и выделение функциональных подграфов, преобразование в масштабируемую ресурсо-
независимую параллельно-конвейерную форму и масштабирование программы на языке
COLAMO для заданной многокристальной реконфигурируемой вычислительной системы.
Масштабирование программы осуществляется с помощью методов редукции производи-
тельности абсолютно-параллельной формы задачи – информационного графа, который
адаптируется под архитектуру реконфигурируемой вычислительной системы. Разрабо-
тан ряд правил, позволяющих существенно сократить число шагов преобразований при
масштабировании задачи и обеспечить плотный поток обработки данных в функциональ-
ных подграфах задачи. Созданный комплекс средств трансляции программ на языке C в
конфигурационные файлы ПЛИС позволяет существенно сократить время синтеза вычис-
лительной структуры задачи для многокристальных РВС и обеспечить сокращение общего
времени решения задачи. -
ПРЕДСТАВЛЕНИЕ ГРАФОВ С АССОЦИАТИВНЫМИ ОПЕРАЦИЯМИ НА ЯЗЫКЕ ПРОГРАММИРОВАНИЯ SET@L
И.И. Левин , И. В. Писаренко, Д.В. Михайлов , А. И. Дордопуло2020-10-11Аннотация ▼Как правило, информационный граф с ассоциативными операциями реализуется в
виде последовательной («голова/хвост») или параллельной («разбиение пополам») топ о-
логии, причем обе структуры содержат одинаковое число операционных вершин. Реду к-
ционные преобразования графов с представленными топологиями при недостатке в ы-
числительного ресурса не обеспечивают создание эффективной ресурсонезависимой пр о-
граммы: вариант «разбиение пополам» характеризуется нерегулярной межитерацион-
ной коммутацией, а структура «голова/хвост» – увеличенной скважностью данных при
редукции. В данной статье предлагается преобразовать топологию графа с ассоци а-
тивными операциями в один из комбинированных вариантов с последовательными и па-
раллельными фрагментами вычислений, синтезированный в соответствии с заданным
вычислительным ресурсом. Это позволяет повысить удельную производительность в ы-
числений при редукции. Модифицированная топология включает изоморфные подграфы с
топологией «разбиение пополам», содержащие максимальное число аппаратно реализу е-
мых операционных вершин, а обработка промежуточных данных осуществляется по
принципу «голова/хвост». Вычислительная структура для рассмотренной топологии
имеет минимальную латентность и состоит из одного базового подграфа и одной вер-
шины, в которую редуцируется блок обработки промежуточных данных с топологией
«голова/хвост». Разработан алгоритм, позволяющий в зависимости от доступного а п-
паратного ресурса перейти от базового последовательного варианта реализации к раз-
личным комбинированным топологиям вплоть до предельного случая топологии «разби е-
ние пополам». Поскольку традиционные методы параллельного программирования могут
описать множество топологий только в виде набора отдельных подпрограмм, для соз-
дания ресурсонезависимого описания графов с ассоциативными операциями предлагае т-
ся использовать язык архитектурно-независимого программирования Set@l. Принципы
построения топологий «голова/хвост» и «разбиение пополам» описаны в виде признаковметода обработки множеств на языке Set@l, а ресурсонезависимая программа оперирует
этими типами и типами параллелизма для модификации топологии графа и последующей
редукции производительности в соответствующих аспектах программы.








