Добрый день!
Скажите, пожалуйста,планируется ли продолжение курсов по нанотехнологиям? Спасибо, Евгений
|
Термальный синтез микропрограмм алгоритмически ориентированных МКМД-бит-потоковых субпроцессоров
5.3. Термальный синтез алгоритмически ориентированного субпроцессора подстановки данных со встроенными PD-ассоциативными конструкциями
В поток-инструкции с подстановкой в фазе чтения (рис. 5.7) используется PD -ассоциативный блок , который обеспечивает поступление сигнала "чтение" ( - рис. 5.7-б) на выходные вентили FIFO -регистров в порядке, отвечающем реализуемой подстановке.
Основная особенность со встроенными PD -ассоциативными блоками состоит в том, что в них удается совместить во времени этапы реализации слов-инструкций и . В этом случае линейная последовательность слов-инструкций принимает вид: . Здесь перестановка порядка выполнения слов-инструкций и сопровождается зеркальным отражением их топологических схем по отношению к вертикальной оси (ср. рис. 5.6 и рис. 5.7).
В результате из (5.1)-(5.5) исключается функциональная задержка в тактов на дешифрацию, а сами преобразования принимают вид:
-
- выходы бит-процессоров 4-го столбца рис. 5.7-а:
( 5.7) где:
- такта - начальная задержка до входа -й слов-инструкции ;
- тактов и ;
- - эквивалентна по содержимому в (5.4).
- 2. - выходы "монтажного ИЛИ" бит-процессоров 4-го столбца рис. 5.7-а:
( 5.8) -
- выходы каналов АЛУ бит-процессоров 7-го столбца рис. 5.6-а и 1-го столбца при зеркальном отражении для рис. 5.7:
( 5.9)
увеличить изображение
Рис. 5.7. Топологическая схема микропрограммы TRANS_DD с подстановкой при чтениигде тактов,а - совмещение во времени этапов записи и дешифрации потоков и , в которых знача-щие части смещены друг по отношению к другу на тактов, то есть считается, что в потоке первые тактов - "нули" а остальные тактов - значащие, а в потоке - наоборот.
-
- выходы каналов АЛУ бит-процессоров 1-го столбца рис. 5.7-б:
( 5.10) где:
- тактов, а ;
- - поток управляющих операндов, который формируется в данном случае бит-процессорами 2-го и 3-го столбцов рис. 5.7-б и имеет циклический по вид: и для всех .
- 5. - выход вертикального канала транзита бит-процессоров 1-го столбца рис. 5.7-б:
( 5.11)
В переменных и параметрах (5.1)-(5.5) и (5.7)-(5.11) отражен тот факт, что каждая -я линейная последовательность слов-инструкций выполняется над всем потоком данных из -битных слов, из кото-рых только одна реализует необходимую пользователю транспозицию ( ). В результате объем работы, выполняемой на каждом -м цикле, составляет -разрядных слов-инструкций.
При использовании ЗУПВ объем работы минимален и составляет разделенных во времени 2-цикловых слов-инструкций "чтения-записи", то есть физически исполняемых слов-инструкций. Такое более чем -кратное превышение фактически выполняемого объема работ над минимально необходимым обусловлено последовательным характером распространения потоков и через линейные цепочки слов-инструкций, что является неотъемлемым атрибутом MIMD-бит-потоковой, а не ассоциативной организации вычислений.
Как и в случае (5.1)-(5.5), из (5.7)-(5.11) невозможно определить вид выполняемой подстановки, который зависит не от переменных и параметров этих соотношений, а от содержимого потока , которое и задает "момент времени" , когда в -й линейной цепочке выполняется условие или .
Структурно адаптируемый под параметры конкретной перестановки PD -ассоциативный порт вывода рис. 5.7-б позволяет:
- исключить слов-инструкции из (5.7)-(5.11), заменив их специфической для каждой подстановки FIFO -регистровой схемы распространения сигнала "чтение" ( ) вида: первых бит - "единица", а остальные бит - "ноль";
- в явном виде идентифицировать порядок чтения циклических FIFO -регистров, который определяется сдвигами во времени по отношению к входам схем "И" 1-го столбца рис. 5.7-б и который вычисляется согласно:
( 5.12) где - начальная задержка на запись .
При значении переменных и параметров рис. 5.7 поток-инструкция выполняет подстановку (5.6), что, согласно (5.12), дает: ; ; ; ; .
Для больших значений синтез таких древообразных, FIFO -регистровых топологических схем под каждую подстановку (то есть по заданным ) представляет достаточно сложную задачу, решение которой требует более чем шагов.
Особенности согласования параметров поток-инструкции . В (5.1)-(5.5) и (5.7)-(5.11) считается, что , то есть "глубина" адре-сации равняется количеству переставляемых данных , а вид исполняемой подстановки может изменяться на каждом цикле выполнения поток-инструкции , то есть .
Однако на практике приходится решать задачи, в которых:
- и все биты - значащие, что характерно для систем криптографической защиты видеоинформации, где "структура" исходного изображения наиболее эффективно разрушается при перестановке малоразрядных данных ( ) бит по всему изображению: пикселей, а не по строкам или столбцам, то есть бит;
- , но признак результата сравнения или надо сформировать на время , что характерно для систем криптографической защиты речевой информации, где блочно-групповая , а не пословная подстановка данных лучше разрушает "структуру" сообщения, то есть одному соответствует подмножество и , а и ;
- что характерно для систем криптографической защиты телеметрической информации, где объектом подстановки являются блоки малоразрядных данных, измеряемых с разной частотой, что приводит к изменению состава блоков как внутри одной подстановки, так и на разных циклах ее выполнения, то есть , и
- цикл изменения вида подстановки больше цикла изменения преобразуемых данных: , что характерно для систем защиты слабо коррелированной информации, то есть для всех
Все перечисленные ограничения создают определенные пробле-мы согласования темпов передачи и обработки потоков в слов-инструкциях и потоков в слов-инструкциях и , которые при можно решить двумя способами:
- Разбиением потока псевдослучайных адресов (при )
на "старшую" ( ) и "младшую" ( ) половины таким образом, чтобы и , из которых в только младших бит являются значащими, а остальные биты заполнены "нулями". В результате поток псевдослучайных адресов распадается на два составляющих потока и : , которые обрабатыва-ются двумя параллельными поток-инструкциями и (соответственно четные и нечетные строки бит-матрицы рис. 5.8,где считается, что бит, а бит).
Общий признак результата сравнения или формируется бит-процессорами 8-го столбца бит-матрицы рис. 5.8, где на 1-й вход бит-инструкции подается объединенный по "И" результат дешифрации в "четном" и "нечетном" терме. Двустрочные термы дешифрации выравнивают темпы обработки потоков преобразуемых данных и адресов , но удваивают аппаратные затраты на дешифрацию. При этом в (5.1)- (5.5) и (5.7)-(5.11) надо использовать не , а .
- Прореживанием нулями потока псевдослучайных адресов по правилу:
- при - в каждом псевдослучайном адресе младших бит - значащие и старших бит - нулевые,а в (5.1)-(5.5) и (5.7)-(5.11) надо использовать ; при этом функциональная задержка в каждой слов-инструкции составляет не , а тактов;
- при и не кратно - в каждом псевдослучайном адресе младших бит - значащие, а старших бит - нулевые, где