Опубликован: 01.10.2013 | Уровень: для всех | Доступ: платный
Лекция 8:

Методы и средства обеспечения живучести и восстановления работоспособности МКМД-бит-потоковых субпроцессоров

7.2. Системотехнические факторы, определяющие динамику парирования идентифицированных карт отказов

Достижимый темп реального времени в работе системы обеспечения живучести МКМД-бит-потоковых субпроцессоров зависит от двух факторов:

  • времени выбора топологии микропрограмм, толерантной действующей карте отказов;
  • времени трансформации исходной топологии в толерантную.

При этом в качестве ограничений выступают: топология действующей карты отказов, размеры и конструкция "горячего" резерва, а также требование по полному сохранению пространственно-временных соотношений между потоками преобразуемых данных, которые были заданы в процессе относительно медленного и достаточно трудоемкого интерактивного синтеза "рабочего тела" микропрограммы для полностью исправной бит-матрицы.

Принятая для МКМД-бит-потоковых субпроцессоров стратегия работы подсистемы парирования действующей карты отказов нацелена на то, чтобы задачи трансформации "рабочего тела" микропрограммы пользователя решались в процессе ее загрузки в бит-матрицу.

В таких условиях основная интеллектуальная нагрузка ложится на задачи выбора толерантных преобразований исходного "рабочего тела", а задачи его трансформации превращаются в достаточно простые и рутинные, что позволяет их распараллелить как минимум до разрядности P-шины МКМД-бит-потокового субпроцессора.

На выбор типа преобразований, обеспечивающих в (квази)реальном масштабе времени парирование действующей в бит-матрице карты отказов, решающее влияние оказывают 2 фактора:

МКМД-бит-потоковая технология, как и любая синхронная конвейерная или систолическая технология, критична к нарушениям даже на 1 такт требуемых фазовых соотношений между потоками данных, поступающими на входы каждого бит-процессора из сверх- или гипербольшого коллектива, что видно из соотношений "1.1"-"5.1" раздела 4.1.

Централизованная система резервирования (см. рис. 7.3) обеспечивает максимальное использование структурно-функциональных возможностей всей системы, если средства коммутации и средства управления коммутацией обеспечивают дифференцированное, полнодоступное "перемещение" по всей рабочей области матрицы любого бит-процессора из существенно меньшего по площади "горячего" аппаратного резерва.

При наличии отказов формализованный синтез критичной к фазовым сдвигам топологической схемы поток-оператора пользователя усугубляется еще и тем, что в этом случае приходится искать практически индивидуальное решение на каждую систему ограничений из гиперкомбинаторного пространства, генерируемого допустимыми в бит-матрице картами частичных или полных отказов бит-процессоров.

В технике подобного рода задачи обычно решаются адаптивными методами, по максимуму сохраняющими критичные характеристики исходной "сложной" системы, затрагиваемые используемыми в процессе адаптации преобразованиями.

Описанным условиям и динамическим требованиям в достаточной мере удовлетворяют локальные и глобальные аффинные преобразования " рабочего тела" тестовых или пользовательских микропрограмм (рис. 7.4-7.6). В этом случае:

  • исходным объектом преобразований служит топологическая схема микропрограммы, полученная дорогостоящим эмпирическим путем;
  • полностью сохраняются фазовые соотношения между пространственно-временными потоками данных внутри преобразуемых микропрограммных модулей;
  • для восстановления информационных связей и фазовых соотношений по потокам данных между перемещаемыми и неподвижными микропрограммными модулями (рис. 7.7-7.9) используются бит-процессоры, способные выполнить требуемые коммутационные функции.

Аффинные преобразования в геометрии сохраняют линейные соотношения между объектами преобразований, а при их использовании в системе парирования отказов в МКМД-бит-процессорных матрицах, кроме преобразования координат размещения бит-операций на матрице, в ряде случаев требуют еще и преобразования содержимого адресной части перемещаемых по бит-матрице микропрограммных модулей (см. раздел 6.3 [298, 299]).

Топология микропрограммы DCC с вращением вокруг оси Х 180

Рис. 7.4. Топология микропрограммы DCC с вращением вокруг оси Х 180
Топология микропрограммы DCC, повернутая на 90 вокруг центральной оси симметрии

Рис. 7.5. Топология микропрограммы DCC, повернутая на 90 вокруг центральной оси симметрии
Топология микропрограммы DCC с вращением вокруг каждой оси X и Y на 180

Рис. 7.6. Топология микропрограммы DCC с вращением вокруг каждой оси X и Y на 180
Отказ всех каналов АЛУ в 4-м столбце бит-матрицы парируется растяжением топологии микропрограммы

Рис. 7.7. Отказ всех каналов АЛУ в 4-м столбце бит-матрицы парируется растяжением топологии микропрограммы
Отказ 2-х каналов АЛУ в 3-м столбце, 1-го канала АЛУ и полный отказ бит-процессора в 4-м столбце парируются кручением топологии микропрограммы

Рис. 7.8. Отказ 2-х каналов АЛУ в 3-м столбце, 1-го канала АЛУ и полный отказ бит-процессора в 4-м столбце парируются кручением топологии микропрограммы

"Сложность" аффинных преобразований микропрограмм не зависит от содержимого этих микропрограмм, и поэтому время выполнения таких преобразований определяется только размерами используемой МКМД-бит-процессорной матрицы. Поэтому основные временные затраты ложатся на этап выбора системы локальных аффинных преобразований, обеспечивающих минимум расходования централизованного аппаратного резерва при парировании заданной карты отказов.

При выборе системы локальных аффинных преобразований необходимо решить две взаимосвязанные задачи:

  • разбиения "рабочего тела" микропрограммы как минимум на 2 модуля, один из которых неподвижен, а другой - перемещаем;
    Полный отказ пяти бит-процессоров 1-й строке, 4 отказа АЛУ с разными последствиями для WTR в 3-м столбце парируются одним срезом топологии микропрограммы

    Рис. 7.9. Полный отказ пяти бит-процессоров 1-й строке, 4 отказа АЛУ с разными последствиями для WTR в 3-м столбце парируются одним срезом топологии микропрограммы
  • выбора для такого разбиения системы локальных, толерантных, аффинных преобразований.

Конфигурация локально преобразуемых микропрограммных модулей обычно считается прямоугольной, а линейные размеры каждого из них можно получить, взяв за основу либо топологию действующей карты отказов, либо топологию исходного поток-оператора пользователя.

В последнем случае размеры модулей можно задать по критерию минимума информационной связности, что, как правило, совпадает с проектным разбиением поток-оператора пользователя на составляющие его слов-инструкции и что практически гарантирует минимальный расход "горячего" резерва на согласующие коммутационные блоки.

Более того, согласно технологии восходящего микропрограммного конструирования поток-процессоров (см. рис. 7.7), такое "семантическое" разбиение "рабочего тела" микропрограммы пользователя известно заранее и неизменно, что упрощает задачу и снижает затраты времени на выбор системы локальных аффинных преобразований, парирующих действующую карту отказов с априори неизвестной конфигурацией.

Задача выбора такой системы преобразований, строго говоря, является нелинейной, так как каждое аффинное преобразование предшествующего модуля порождает в общем случае двумерный сдвиг всех топологически связанных с ним последующих модулей. В результате изменяются структурно-функциональные требования к используемому аппаратному ресурсу бит-матрицы, а значит, изменяется и последействие карты отказов, часть из которых может перейти в разряд индифферентных.

Наибольший сдвиг по "горячему" аппаратному резерву вызывают кручения локальных микропрограммных модулей (см. рис. 7.8), в которых площадь согласующих коммутационных блоков зависит от количества ( d_{1} ) строк в преобразуемом модуле и от количества ( d_{2} ) его информационных связей с предшествующим по топологии функциональным модулем:

d_{1}*d_{2}/2 \le A \le d_{1}*d _{2}.

Но именно этот вид аффинных преобразований дает (при прочих равных условиях) максимальное количество вариантов (пере)размещения "рабочего тела" микропрограммы: M = 2^{b}, где b - количество независимо вращаемых на 180о вдоль оси Х микропрограммных модулей, связанных единым потоком обрабатываемых данных.

Таким образом, на основе приведенных данных можно заключить:

  1. Основную проблему парирования карт отказов составляет выбор системы локальных аффинных преобразований, обеспечивающий толерантное размещение микропрограммы на избыточной бит-матрице. Размерность такой задачи зависит от размеров микропрограммных модулей, подвергаемых локальным аффинным преобразованиям, от конфигурации и размеров аппаратного резерва и от топологии действующей карты отказов.
  2. В процессе получения загрузочного кода микропрограммы, подвергнутой локальным аффинным преобразованиям, основную проблему составляет редактирование связей между "неподвижными" и "подвижными" фрагментами микропрограммы. Особенно остро такая проблема встает при редактировании пространственно-временных FIFO- регистровых связей между операционными и управляющими модулями.
  3. С позиций поддержания темпа реального времени в подсистеме парирования отказов наиболее перспективным можно считать фиксированное разбиение всего субпроцессора на составляющие его процессоры с локальными операционными, интерфейсными и управляющими блоками. Это сохраняет семантику разбиения, которая играет решающую роль в редактировании пространственно-временных FIFO-регистровых связей, но делает перемещаемые фрагменты микропрограммы существенно неравномерными по занимаемой площади бит-матрицы, что приводит к неоправданно большим затратам резерва при парировании отказов в темпе реального времени.
Евгений Акимов
Евгений Акимов

Добрый день!

 

Скажите, пожалуйста,планируется ли продолжение курсов по нанотехнологиям?

Спасибо,

Евгений

 

Nozimjon Fayziev
Nozimjon Fayziev
Таджикистан, Душанбе
Анна Волкова
Анна Волкова
Россия, г. Новосибирск