Опубликован: 01.10.2013 | Уровень: для всех | Доступ: платный
Лекция 9:

Оценка производительности и живучести МКМД-БИТ-потокового предпроцессора системы астронавигации

8.4. Анализ характеристик качества работы МКМД-бит-потокового субпроцессора слежения за центром масс астроориентира

Качество работы МКМД-бит-потокового субпроцессора слежения за "центром масс" астроориентира оценим по четырем основным показателям: пропускной способности по потокам инструкций (производительности) и данных, вычислительной устойчивости и отказоустойчивости.

Оценка пропускной способности по потокам команд и данных

Согласно данным предыдущего раздела, средневзвешенная по разрядности потоковая производительность МКМД-бит-потокового субпроцессора слежения за "центром масс" астроориентира с учетом дублирующих модулей SMM d и CMM d составляет: V_{I}(субпроцессора) = V _{I}(INNS16) + V_{I}(DTM) + V_{I}(SWM25) + V_{I}(MMF25) + V_{I}(CMZ 4(128)) + V_{I}(LHM) + 2*V_{I}(SMM) + 2*V_{I}(CMM) + V_{I}(ICLM) = (1,4375 + 3,125 + 542 + 159 + 1,75 + 4,75 + 2*1,4375 + 2*0,5 +2)*F_{t} \approx 718*F_{t}.

Отсюда следует: при комплектации МКМД-бит-потоковых субпроцессоров слежения за "центром масс" астроориентира отечественными СБИС Н1841 ВФ1, работающими на тактовой частоте 5*106 Гц, достигается потоковая производительность порядка 3,6*103 MIPS, в которую решающий вклад вносят модули "скользящего окна" и медианной фильтрации. Остальные функциональные модули фактически по максимуму используют тактовую частоту работы комплектующих СБИС, что характерно для RISC -архитектур с постоянным, однотактным циклом исполнения всех ассемблерных инструкций.

В отличие от RISC -архитектур, в МКМД-бит-потоковых субпроцессорах цикл исполнения каждой ассемблерной слов-инструкции зависит от разрядности данных, которая в нашем случае варьирует по ходу вычислений в достаточно широких пределах от 1 до 128 бит. Тем не менее цикл исполнения всех слов-инструкций остается постоянным и согласованным друг с другом благодаря использованию требуемого коэффициента векторизации, поддерживающего единый темп обработки по всему макроконвейеру из 11 специализированных процессоров RISC -подобной архитектуры.

Использование варьируемого коэффициента векторизации приводит к тому, что пропускная способность по потокам данных падает по мере их распространения по операционным модулям субпроцессора, в данном случае от 25 F_{t} в модуле "скользящего окна" и 100 F_{t} в модуле медианной фильтрации до (2-4) F_{t} в модуле "свертки". Для субпроцессора на СБИС Н1841 ВФ1 пропускная способность по потокам данных составляет соответственно 125, 500 и (10-20) Мбит/с. Такая пропускная способность по потокам команд и данных более характерна для современных персональных ЭВМ, работающих на частотах порядка единиц ГГц. Это позволяет говорить о том, что МКМД-бит-потоковые вычислительные технологии способны компенсировать в проблемно-ориентированных областях применения (200-300)-кратное технологическое отставание за счет более эффективной организации вычислений на уровне слов- и поток-инструкций. С экономических позиций это значит, ч то использование таких вычислительных технологий позволяет снизить на (1-2) порядка стоимость (Б)ВС за счет снижения стоимости комплектующих СБИС с простейшей архитектурой, которая аппаратно поддерживается несколькими сотнями логических вентилей. Именно схемотехническая "прозрачность" архитектуры бит-матричных СБИС резко снижает стоимость их бездефектного проектирования и стоимость их промышленного контроля. Более того, она позволяет достичь на широко доступных субмикронных микроэлектронных технологиях предельно высоких (не ниже 80 %) и недостижимых в других изделиях показателей выхода годных СБИС, который служит основным индикатором их цены.

Приведенные значения пропускной способности по потокам инструкций являются пиковыми, так как они не учитывают издержек на вхождение МКМД-бит-потокового субпроцессора в стационарный режим работы конвейера из составляющих его операционных модулей. Поэтому имеет смысл оценить пропускную способность субпроцессора слежения за "центром масс" астроориентира с учетом издержек на его вхождение в достаточно глубокий конвейер, на выходе которого первая вычисленная координата x^{0}_{1} появляется начиная с 17698 такта. Такое время задержки превосходит на 8 % время экспозиции одного кадра размером 214 = 16384 тактов, если считать равными такты формирования и ввода пикселей в бит-матрицу. После вхождения в конвейер обработка каждого следующего кадра, а значит, и вычисление каждой следующей координаты обходится в 16384 тактов, так как согласно одному из базовых принципов МКМД-бит-потоковой организации вычислений скорости обработки и передачи данных равны. Поэтому в самом ху дшем случае общее время вычисления десяти ортогональных координат для всех пяти фотоприемников (время 1-го цикла обработки) равно (17 698+16 384*9)*\tau. В СБИС Н1841 ВФ1 F_{t} = 5 МГц, то есть \tau = 2*10^{-7} сек, а в современной бит-матрице с далеко не рекордной тактовой частотой 250 МГц \tau = 4*10^{-9} сек. Поэтому время обработки составляет соответственно в первом случае \approx 33 мсек, а во втором случае \approx 0,66 мсек.

Полученные численные значения позволяют утверждать:

  1. Отечественная СБИС Н1841 ВФ1 разработки 1985 г. до сих пор способна поддержать темп реального времени в специализированном МКМД-бит-потоковом субпроцессоре слежения за "центром масс" астроори-ентира при частоте формирования изображения до 60 кадров/с.
  2. Бит-матричная СБИС той же архитектуры, но работающая на тактовой частоте 250 МГц, позволяет перейти от алгоритмически ориентированных к проблемно-ориентированным субпроцессорам, которые способны решить широкий круг задач контура реального времени аэрокосмических ЛА. Действительно, на один цикл вычисления координат "центра масс" пяти астроориентиров такой субпроцессор израсходует только 2 % своего рабочего времени, а оставшиеся 98 % временного ресурса можно использовать как для решения других функциональных задач, так и для принудительного тестирования (сверх)многопроцессорной бит-матрицы.
  3. При работе на тактовой частоте 250 МГц можно достичь пропускной способности по потокам данных порядка 25 Гбит/с, что даже по современным меркам соответствует рекордным требованиям к интерфейсам, поддерживающим темп реального времени при обработке высокоскоростных изображений.

Оценка вычислительной устойчивости

В вычислительной технике [227] принято считать вычислительный процесс устойчивым, если абсолютная или относительная погрешность вычислений не превосходит соответствующей погрешности представления исходных данных.

С таких позиций выполняемые ЭВМ арифметико-логические действия над данными не должны вносить дополнительных погрешностей по отношению к погрешности представления, которая появляется не в самой ЭВМ, а на ее входе.

Основным источником погрешностей в цифровой вычислительной технике является ограниченная разрядная сетка передаваемых и преобразуемых операндов, что обусловлено ограниченной разрядностью регистров временного хранения, аккумуляторов и шин передачи данных. В инженерной практике принято считать, что максимальная абсолютная погрешность представления исходного числа не превосходит "веса" младшего значащего разряда 2^{-n}, где n - разрядность операнда.

Среди арифметико-логических операций основной вклад в погрешность вычислений вносят две:

  • денормализация чисел, которая интенсивно используется при сложении операндов в формате плавающей запятой;
  • пересылка промежуточных результатов, которая случайным образом стимулирует округление промежуточных результатов вычислений (см. раздел 6.6 курса "Задачи и модели вычислительных наноструктур") при их перезаписи из регистра-аккумулятора, обладающего максимальной для данной ЭВМ разрядностью, в ОЗУ, для чего используются шины данных, разрядность которых обычно в 1,5-2 раза меньше чем у аккумулятора.

Формат плавающей запятой является компромиссом между необходимостью обеспечения высокой точности вычислений (разрядность мантиссы) в широком динамическом диапазоне изменения преобразуемых величин (разрядность порядка). С точки зрения сохранения вычислительной устойчивости только варьируемый по ходу вычислений формат фиксированной запятой способен полностью удовлетворить требования приведенного выше определения, так как в нем отсутствуют операции денормализации, а округление с требуемой точностью можно провести один раз и только над результирующими данными.

Как видно из данных предыдущего раздела, в МКМД-бит-потоковом субпроцессоре слежения за "центром масс" астроориентира все арифметико-логические действия выполняются с требуемой на данном этапе вычислений точностью, то есть с нулевой абсолютной погрешностью.

Так, в модуле формирования построчной гистограммы обрабатываемого изображения ( LHM ) без потери темпа реального времени осуществлен переход от однобитных к 16-битным операндам, в которых только 7 младших бит могут быть значащими, так как после медианной фильтрации накопленная сумма "единиц" не может превышать значения 124.

Аналогично в модуле "свертки" ( SMM ) при умножении операндов разрядность удвоена и доведена до 32 бит, что сохраняет и все биты произведения, и все биты накапливаемой впоследствии суммы. Такое увеличение разрядной сетки без потери темпа реального времени оказалось возможным потому, что в модуле LHM один выходной операнд вырабатывается на каждую строку обрабатываемого изображения, длина которой равна 128 бит, а в модуле свертки SMM оба выходных операнда вырабатываются на один кадр обрабатываемого изображения, "длина" которого равна 16384 битам. В данном случае именно размеры строки и кадра регламентируют минимальную погрешность промежуточных и окончательных результатов, соответственно 2-128 и 2-16384. Тем не менее, результат деления представлен операндом из 7 значащих бит, так как координата "центра масс" астроориентира на изображении 128*128 пикселей не выходит за пределы этой разрядной сетки.

Таким образом, можно утверждать, что МКМД-бит-потоковый субпроцессор слежения за "центром масс" астроориентира является вычислительно устойчивым и не вносит дополнительных погрешностей в общий тракт обработки видеосигналов.

Единственное негативное последствие использования МКМД-бит-потоковой вычислительной технологии в тракте управления (К)ЛА - это ощутимое время задержки, которое на 8 % превосходит время формирования, а значит, и время обработки любыми другими вычислительными средствами 1 кадра входного видеоизображения. Однако эти издержки можно минимизировать, повысив частоту формирования и обработки исходного видеоизображения до 100-1000 кадров/с, для чего имеется временной запас при использовании бит-матричных СБИС, работающих на тактовой частоте 250 МГц.

Оценка отказоустойчивости

Отказоустойчивость МКМД-бит-потокового субпроцессора слежения за "центром масс" астроориентира будет проведена раздельно для подсистемы обнаружения и подсистемы парирования отказов.

Из приведенных в предыдущем разделе данных видно, что в темпе реального времени функциональный контроль работоспособности субпроцессора слежения за "центром масс" астроориентира осуществляется двумя способами:

  • по классической схеме мажоритарного резервирования, в которой использовано дублирование микропрограмм арифметических блоков схемы и сравнение полученных результатов в микропрограммном блоке принятия решений, который реализован на той же бит-матрице, что и контролируемые модули;
  • по схеме информационной избыточности, в которой разделены во времени циклы подачи пользовательских и тестирующих эталонных данных, что требует временной селекции реакций на эталонные данные.

В данной схеме использован не сверхнадежный, а равнонадежный блок принятия решений, отказ которого воспринимается как отказ всего субпроцессора, что увеличивает вероятность "ложной тревоги", которая при гипотезе равновероятного распределения отказов пропорциональна "площади" данного микропрограммного модуля. Если в состав этого модуля включить и БП, обеспечивающие доставку тестового признака до периферии бит-матрицы, то и в этом случае его "площадь" не превысит 100 БП, то есть вероятность "ложной тревоги" ниже вероятности отказа одного БП в (44*80 = 3520)/100 = 35,2 раза.

Главная специфика функционального контроля состоит в том, что с его помощью вырабатываются тестовые реакции не на все, а только на функционально значимые отказы, которые проявляются в содержимом промежуточных или окончательных результатов вычислений. По сравнению с прямым аппаратным резервированием, выполненным на уровне узлов каждого БП, такая схема обнаружения отказов обладает меньшим уровнем "ложной тревоги" по отношению к решаемой задаче пользователя. Однако при этом в бит-матрице накапливаются функционально "незначимые" аппаратные отказы, карта которых оказывает существенно влияние на эффективность работы подсистем локализации и парирования отказов (см. раздел 7.6).

Отсюда встает задача оценки среднего количества реально существующих, но тем не менее "индифферентных" по отношению к решаемой задаче аппаратных отказов. Для получения такой оценки используем схему декомпозиции, рассмотренную в разделе 6.4 (см. рис. 6.48 и 6.49), согласно которой поток-оператор слежения за "центром масс" астроори-ентира разбивается на составляющие слов-инструкции, которые и служат объектом диагностики.

Цель исследований - определить устойчивость к отказам как самого поток-оператора слежения за "центром масс" астроориентира, так и составляющих его слов-инструкций. В качестве показателя устойчивости к отказам использовано количество индифферентных отказов, не нарушающих условия правильной работы объекта диагностики. Разбиение поток-оператора на составляющие его слов-инструкции и отвечающие им операционные, управляющие и коммутационные блоки необходимо проводить для корректного синтеза тестовых последовательностей, позволяющих достаточно полно обнаружить отказы, нарушающие правила функционирования составляющих слов-инструкций и поток-инструкции в целом. Как и ранее, считается, что отказ любого вентиля бит-матрицы равновероятен.

Из приведенной в предыдущем разделе структурно-функциональной схемы субпроцессора видно, что для исследования его устойчивости к индифферентным отказам достаточно оценить отказоустойчивость следующих слов-инструкций (рис. 8.24):

  • генераторов циклических констант, как основных блоков устройств управления;
  • медианного фильтра, как основного устройства однобитной обработки;
  • умножителя, сумматора-накопителя и делителя совместно с преобразователем из прямого кода в дополнительный, как основных устройств арифметической обработки.

Тестовая последовательность для каждой слов-инструкции выбиралась по методике, изложенной в разделе 6.4, и по критерию максимально полного обнаружения отказов в исследуемом функциональном модуле.

Здесь Р - вероятность сохранения работоспособности; N - количество одновременных отказов вентилей в теле слов-инструкции;1 - кривая для генераторов циклических констант и медианного фильтра, 2 - для умножителя, 3 - для делителя и преобразователя из прямого кода в дополнительный, 4 - для сумматора-накопителя.

Из приведенных данных видно, что в 40 % случаев система обеспечения живучести МКМД-бит-потоковых субпроцессоров "поднимает тревогу", прерывает функциональную обработку и включается в работу только тогда, когда классическая схема мажоритарного резервирования фон Неймана уже исчерпала свой 3-кратный аппаратный ресурс.

Сопоставив графики рис. 8.24 и топологические схемы отвечающих им операционных блоков, можно убедиться: чем более "рыхлая" структура микропрограммы, тем выше ее нечувствительность к отказам. Объясняется это тем, что в более "рыхлых" топологиях ресурсы БП используются по минимуму и неравномерно, что предопределено МКМД-режимом распараллеливания вычислений. В результате запрограммированная бит-матрица по используемому аппаратному ресурсу является существенно неоднородной, что усложняет задачу нарушения условий правильного функционирования именно этого БП и именно в этой микропрограмме. Сами микропрограммы исследуемых слов-инструкций синтезированы по критерию максимального использования ресурсов каждого БП или, что одно и то же, по минимуму использования площади всей бит-матрицы.

Вероятность сохранения работоспособности слов-инструкций

Рис. 8.24. Вероятность сохранения работоспособности слов-инструкций

Поэтому "рыхлость" их топологии в данном случае можно охарактеризовать тремя показателями:

  • уровнем неоднородности термального состава микропрограммы или, что одно и то же, степенью использования МКМД-фактора при выборе термального состава для каждой слов-инструкции;
  • степенью использования в каждом БП аппаратного ресурса или, что одно и то же, уровнем скрытой структурно-функциональной избыточности бит-матрицы, определяемой принципами и методами МКМД-бит-потоковой организации вычислений;
  • количеством неиспользуемых БП или топологическими издержками компоновки как отдельных слов-инструкций, так и всей микропрограммы поток-оператора; в нашем случае эти издержки составляют 3520-2776 = 744 БП, или почти 27 % по отношению к рабочей "площади" бит-матрицы (см. табл. 8.1 - 2776 БП).

В результате проведенных исследований подтвердилась применимость соотношения (3.5), которое предполагает, что вероятность сохранения работоспособности при k отказах равна вероятности сохранения работоспособности при одном отказе в степени k. Более того, оказалось, что вероятность сохранения работоспособности операционных модулей, реализующих конкретные слов-инструкции, можно оценить как сумму (по составляющим термам) произведений вероятности сохранения работоспособности терма и вероятности попадания отказа в этот терм.

Наиболее наглядно это можно показать на примере умножителя, микропрограмма которого приведена на рис. 8.25. Здесь практически все столбцы бит-матрицы однородны по своей структуре, а вероятность сохранения работоспособности БП из каждой строки (при одном неисправном вентиле) равна:

  • для первой строки, в БП которой используется только канал транзита WTR: p = 0,804 ;
  • для второй строки, в БП которой используется только функция St1: p = 0,668 ;
  • для третьей строки, в БП которой используется только функция AND: p = 0,72 ;
  • для четвертой последней строки, в БП которой используется только функция ADD: p = 0,663.

При равновероятной гипотезе отказ 1 вентиля в БП любой из четырех строк одного столбца p_{v} = 1/4 = 0,25. Поэтому общая вероятность сохранения работоспособности умножителя при одном отказавшем вентиле p(ML) = 0,25*0,804 + 0,25*0,668 + 0,25*0,72 + 0,25*0,663 = 0,71375.

На графике 2 рис. 8.24 этот показатель находится на уровне 0,718, что всего лишь на 0,4 % выше расчетного. Такое расхождение можно объяснить некоторым неравномерным распределением функциональной нагрузки между БП, которые принадлежат разным термам (столбцам бит-матрицы рис. 8.25). Например, БП с координатами (4, 2) фактически выполняет операцию транзита, так как второй операнд в реализуемой им бит-инструкции ADD всегда равен нулю. Поэтому отказ типа "тождественный ноль" во втором входном коммутаторе канала АЛУ БП практически не влияет на выполнение им функции ADD, что и повышает его работоспособность по сравнению с соседями в этой строке.

Микропрограмма конвейерного умножителя

Рис. 8.25. Микропрограмма конвейерного умножителя

Приемлемое для инженерной практики совпадение теоретических и экспериментальных данных позволяет распространить соотношение (3.5) на все уровни иерархии имитационного моделирования. Это кардинальным образом снижает затраты на оценку работоспособности МКМД-бит-потоковых субпроцессоров, которую можно осуществить достаточно достоверно и полно, не прибегая к анализу полного гиперпространства отказов на бит-матрице. Для этого моделирование и экспериментальную оценку последствий одиночных отказов можно ограничить отдельными блоками и узлами БП, содержащими не более 100 транзисторов, и на этой основе провести по формуле (3.5) расчеты отказоустойчивости отдельных БП, термов, слов-инструкций и всего поток-оператора.

Только МКМД-бит-потоковым субпроцессорам свойственно повышение работоспособности с ростом уровня иерархии в организации вычислительного процесса, что является следствием реализации принципа "одна (бит)инструкция - один (бит)процессор", который поддерживается на всех уровнях организации вычислений. В результате с ростом уровня иерархии возрастает и естественная структурно-функциональная избыточность субпроцессоров, которая на уровне бит-матриц уже поддерживается не только недоиспользованием коммутационных и операционных возможностей отдельных БП, но и полным их неиспользованием в топологии микропрограмм. По этой причине даже при пяти отказах вентилей, распределенных по матрице по равномерному закону, вероятность сохранения работоспособности субпроцессора слежения за "центром масс" астроориентира оказывается на уровне 0,5 (рис. 8.26).

Евгений Акимов
Евгений Акимов

Добрый день!

 

Скажите, пожалуйста,планируется ли продолжение курсов по нанотехнологиям?

Спасибо,

Евгений

 

Nozimjon Fayziev
Nozimjon Fayziev
Таджикистан, Душанбе
Анна Волкова
Анна Волкова
Россия, г. Новосибирск