Опубликован: 01.10.2013 | Уровень: для всех | Доступ: платный
Лекция 1:

Введение

Лекция 1: 12 || Лекция 2 >

Междисциплинарный характер разработок средств вычислительной техники наиболее четко проявляется в проектах суперкомпьютеров всех поколений, требования к которым постоянно ужесточались. Последняя в этой области программа DARPA HPCS (high productivity computing systems) предусматривает, что перспективные суперкомпьютеры должны обеспечить реальную производительность в несколько петафлопc, а их глобально адресуемая оперативная память должна на 7-8 порядков превосходить существующую по интегральному показателю качества, из которой на пропускную способность приходится 4-5 порядков, а на емкость 3 порядка, которая должна быть доведена до нескольких пета-байт. При этом ужесточаются и требования к технологиям разработки параллельных программ и к простоте поддерживающих их платформ.

Данная программа должна позволить США:

  • устранить нарушенный паритет с Японией в области высокопроизводительных вычислений;
  • создать суперкомпьютеры с перспективной архитектурой для решения стратегически важных государственных задач обеспечения национальной безопасности;
  • продвинуть на военный и коммерческий рынок качественно новые технологии изготовления элементной базы и аппаратуры.

В современных условиях в России невозможно воспроизвести подобного рода глобальный междисциплинарный проект, требующий скоординированных усилий сотен проектных, научных и промышленных организаций и предприятий. Но у России не менее стратегически важные и масштабные государственные задачи обеспечения национальной безопасности, которые невозможно решить без создания программно-аппаратных платформ с сопоставимыми характеристиками.

Аналогичная ситуация складывалась в середине 80-х годов прошлого столетия в рамках программ СОИ и анти-СОИ, когда СССР вынужден был компенсировать технологическое отставание от США за счет гибких вычислительных технологий проектирования и работы алгоритмически ориентированных субпроцессоров с микропрограммным уровнем доступа, который обеспечивал (сверх)высокие по тем временам коэффициенты распараллеливания вычислений и повышал почти на порядок "время жизни" системы по сравнению с комплектующими СБИС.

Полученный в этот период опыт раскрывается в этой книге, где вскрыты основные источники повышения производительности, отказоустойчивости и эффективного микропрограммного конструирования алгоритмически ориентированных субпроцессоров. В рамках этих проектов пришлось отказаться от целого ряда традиционных подходов и оценок. В частности, пришлось перейти:

  • от оценки производительности к расчету пропускной способности (сверх)многопроцессорной системы по потокам команд и данных;
  • от традиционных системных платформ программирования к платформам микропрограммного конструирования, сходным с системными средствами кремниевой компиляции;
  • от традиционных систем подстановки "горячего резерва" к системам перераспределения исполняемых (бит)инструкций согласно действующей в бит-матрице карте отказов.

В "лекции 1" проанализированы апробированные на практике методы оценки вычислительных характеристик задач предметной области, которые служат базой разработки (Б)ВС, ориентированных на решение "критических" задач. Этот класс задач по своим требованиям превосходит не менее чем на порядок физические возможности существующей вычислительной техники, что вынуждает разработчиков (Б)ВС:

  • задействовать в информационных технологиях "собственных нужд" комплекс интенсивных и экстенсивных факторов повышения производительности;
  • снижать системные аппаратно-временные издержки на управление ходом вычислительного процесса, в том числе и за счет выбора или модификации вычислительных алгоритмов и их параметров.

Показано:

  1. Метрологические проблемы вычислительной техники носят как фундаментальный, так и чисто методический характер, и они неразрешимы в принципе. Фундаментальная составляющая связана с отсутствием единой метрики, определяющей количество информации, а значит, и объем выполненной ЭВМ работы. Методическая составляющая связана с отсутствием эталонных ЭВМ, эталонных алгоритмов преобразования данных и стандартных процедур пересчета реальных алгоритмических затрат в затраты эталонного алгоритма. В итоге нарушается базовый принцип любого измерения, когда измерительный прибор является неотъемлемой частью измеряемого объекта (в данном случае операционной системы) и поэтому постоянно изменяет свою структурно-функциональную схему.
  2. Все без исключения инженерные методики оценки производительности фактически отталкиваются от измерения времени, затраченного на решение "хорошо известной пользователю" задачи. В результате сопоставление двух ЭВМ весьма и весьма субъективно, так как и замер времени, и оценка выполненных машиной инструкций, и распределение времени между системными и прикладными задачами носят достаточно субъективный характер.
  3. Стандартные программные платформы оценки производительности и пропускной способности ЭВМ предоставляют пользователю только возможность создания тестовых программ, которые способны воспроизвести стабильную вычислительную нагрузку реальных задач только при использовании в них циклов for, так как при использовании циклов if вычислительная нагрузка зависит от содержимого преобразуемых данных.
  4. Дальнейшее развитие программных платформ оценки производительности ЭВМ, скорее всего, будет связано с созданием адаптивных средств, оперативно реагирующих и на специфику алгоритма решения задачи, и на специфику архитектуры ЭВМ, и на содержимое преобразуемых потоков данных.
  5. Снижение трудозатрат на адаптацию испытательных и исследовательских программ требует структурного подхода, в рамках которого программные модули представительных задач выступают в качестве неделимых единиц. Совокупность таких структурных единиц инструментальной платформы оценки качества ВС должна обеспечить управляемое перераспределение вычислительной нагрузки на операционные, коммутационные и управляющие ресурсы, а также ресурс памяти исследуемой ВС, для чего требуется точная априорная оценка этих же видов ресурсов, затребованных вычислительными алгоритмами представительных задач. Поэтому операционное ядро каждой представительной задачи должно быть алгоритмически прозрачным, чтобы на его основе можно было априорно и достоверно оценить требуемую нагрузку на все виды используемых ресурсов.

В "лекции 2" раскрыты особенности построения и использования программных инструментальных платформ параллельных вычислительных систем общего назначения. Показано, что методы и средства конструирования программ являются не только прерогативой параллельных ней-рокомпьютерных технологий и технологий с микропрограммным уровнем поддержки, но и широко используются при создании программных продуктов для ВС общего назначения. При этом надо отличать инструментальные платформы, которые ориентированы на использование уже существующих аппаратных платформ, от инструментальных платформ, ориентированных на их создание. В первом случае допускается только специфицированная реконфигурация аппаратной платформы под требования вычислительного алгоритма пользователя, что было апробировано в транспьютерных и многопроцессорных ЦПОС -проектах, а во втором случае вычислительный алгоритм известен и требуется методами и средствами (полу)заказного проектирования синтезировать аппаратуру его поддержки, что характерно для систолических матриц.

Центральная проблема создания таких инструментальных платформ - это формализованные средства представления и поддержки параллелизма, использование которых требует углубленного знания возможностей целевой аппаратной платформы, призванной воплотить в жизнь затребованный программным конструктором параллелизм. Решить в общем виде задачу формализованного представления параллелизма пока не удалось, что вынуждает:

  • использовать интерактивный режим (микро)программного конструирования либо на всех стадиях проекта, как это имеет место в систолических и бит-потоковых технологиях, либо на отдельных, но самых ответственных этапах декомпозиции проекта и распределения (конфигурирования) затребованных ресурсов между коллективом вычислителей, как это имеет место в транспьютерных и многопроцессорных ЦПОС- и RISC-технологиях;
  • инструментальные платформы "собственных нужд" строить по иерархическому принципу, поэтапно решая задачи извлечения из вычислительного алгоритма потенциально достижимого коэффициента распараллеливания вычислений, представления граф-потока сигнала в "терминах" целевой аппаратной платформы, устранения синонимии, возникающей из-за ограниченных размеров целевой аппаратной платформы.

В "лекции 3" раскрыты особенности работы одной из возможных аппаратных платформ ВС с микропрограммным уровнем доступа. За основу взята МКМД-бит-потоковая СБИС Н1841 ВФ1, которая была разработана в СССР в 1988 году и планировалась к использованию в широком спектре субпроцессорных трактов, ориентированных на решение "критических" задач аэрокосмических (Б)ВС двойного назначения. На ее основе показано:

  1. Широко разрекламированные на Западе (возможно, и с подрывной целью) систолические вычислительные структуры ориентированы на ОКМД-режим распараллеливания вычислений и требуют интеллектуальных оболочек для приведения алгоритма пользователя к систолическому виду и кремниевых компиляторов для быстрого бездефектного проектирования специализированных систолических СБИС достаточно широкой номенклатуры, покрывающей потребности (Б)ВС во всем спектре решаемых задач. Поэтому в рамках систолических технологий преимущество получал не тот, кто разрабатывал алгоритмы систолического типа, а тот, кто имел более эффективную СБИС-реализацию. (ОКМД - организация вычислений по типу "одиночный поток команд - множественный поток данных".)
  2. Структурно-функциональный и схемотехнический синтез МКМД-бит-процессорных матричных СБИС, УБИС и систем на кремниевой пластине по сложности проекта и вытекающим из него требованиям к поддерживающим инструментальным программно-аппаратным платформам находится на уровне схем средней степени интеграции, содержащих не более 1000 логических вентилей. Это делает прозрачным процесс проектирования аппаратных платформ для таких вычислительных технологий как в структурно-функциональной, так и в диагностической плоскости. Такое кардинальное снижение размерности задач быстрого бездефектного проектирования и изготовления бит-матричных структур, давно уже не уступающих по уровню функциональной интеграции УБИС, приводит к существенному возрастанию сложности задач микропрограммного конструирования алгоритмически ориентированных субпроцессоров на их основе.
  3. Различные варианты построения бит-процессорных матричных СБИС в основном разнятся средствами управления и коммутации, которые играют решающую роль в обеспечении отказоустойчивости СБИС и субпроцессоров на их основе. При этом зависящая от области применения система реализуемых бит-инструкций мало влияет на структурно-функциональную схему бит-процессора, которая в большей степени определяется принципами и методами организации вычислений.
  4. Принципы и методы МКМД-бит-потоковой организации вычислений таковы, что их реализация приводит к естественной структурно-функциональной избыточности бит-процессоров, которая повышает отказоустойчивость аппаратных платформ. Во-первых, отказавший вентиль может оказаться неиспользуемым при реализации заданной бит-инструкции, а во-вторых, под воздействием отказа в бит-процессоре все же реализуется некоторая бит-инструкция, которая может принадлежать системе ее бит-операций и при сдвигах микропрограмм на бит-матрице может оказаться востребованной именно в данном месте бит-матрицы.
  5. Одну из центральных проблем технологии прототипирования в рамках МКМД-бит-потоковых технологий можно решить на основе методов и средств многоуровневого имитационного моделирования, что позволяет уже на самых ранних этапах проектирования оценить влияние принимаемых конструктивных и технических решений на отказоустойчивость создаваемого программно-аппаратного продукта.

В результате удается сделать весь процесс проектирования полностью отечественных субпроцессорных трактов управляемым по фактору отказоустойчивости. При этом появляется достаточно уникальная возможность сбалансированного управления вводимой на этапе проектирования и используемой в процессе эксплуатации естественной структурно-функциональной и топологической избыточностью бит-процессоров и соответственно матриц на их основе. Это увеличивает степень связности проекта (суб)про-цессорного тракта в структурно-функциональной и диагностической плоскостях, так как с ростом структурно-функциональной избыточности возрастает и устойчивость к отказам бит-матриц, а значит, и накапливаемая в латентном периоде карта отказов, что негативно сказывается на эффективности работы подсистем диагностики и парирования карт отказов. Отсюда следует, что с ростом отказоустойчивости бит-матриц необходимо увеличивать частоту принудительного тестового контроля, что негативно сказывается на пропускной способности МКМД-бит-потоковых субпроцессорных трактов.

В "лекции 4" раскрыты особенности микропрограммного конструирования МКМД-бит-потоковых субпроцессоров или, что одно и то же, особенности перехода с микрокомандного на ассемблерный уровень организации вычислений в (Б)ВС с микрокомандным уровнем доступа, которые сводятся к следующему.

  1. Какие бы методы и средства распараллеливания вычислений ни применялись на различных уровнях управления ходом вычислительного процесса, рано или поздно архитектура (Б)ВС или ее отдельных компонент будет сведена к фон-неймановскому типу, который предполагает последовательный характер перечисления (микро) программных конструкций, описывающих либо бит-инструкцию, либо слов-инструкцию, либо поток-оператор, либо подпрограмму, либо программу, либо задачу, либо комплекс задач и т. д. В таких условиях МКМД-бит-потоковые вычислительные технологии удобны тем, что позволяют в едином операционном и аппаратном базисе оценить аппаратно-временные затраты на организацию вычислений на всех уровнях начиная со слов-командного.
  2. Принципиальное отличие МКМД-бит-потоковых вычислительных технологий состоит в том, что обработка в них осуществляется в распределенной, PD -ассоциативной памяти (бит)инструкций, а не данных, как это имеет место в классических ассоциативных архитектурах, и не в сосредоточенных операционных устройствах с фиксированной системой ассемблерных инструкций, как это имеет место в наиболее распространенных современных RISC -архитектурах.
  1. Основным источником повышения пропускной способности МКМД-бит-потоковых субпроцессоров по потокам команд и данных является совмещение во времени и пространстве процессов передачи и обработки данных, что позволяет создавать структурно-функциональные схемы, адекватные графу связности операторов решаемой задачи, причем на всех уровнях организации вычислений начиная с бит-процессорного.
  2. Технология микропрограммного конструирования МКМД-бит-потоковых субпроцессоров по объективным причинам носит итеративный и интерактивный характер. В таком процессе структурно-функциональная схема субпроцессора синтезируется декомпозицией задач пользователя, нисходящей до микропрограммных алгоритмов реализации отдельных операционных, управляющих, адресных и интерфейсных процедур, а оценку качества принятого технического решения можно получить на основе восходящего конструирования топологии всей микропрограммы, реализующей поток-оператор пользователя.
  3. В процессе микропрограммного конструирования МКМД-бит-потоковых субпроцессоров можно применять практически все известные алгоритмические, структурно-функциональные, конструктивно-технологические и т. д. методы и средства компенсации системных временных издержек с той разницей, что в этом случае в качестве неделимой единицы проекта служит пространственно фиксированный поток бит-инструкций и пространственно-временной поток данных.
  4. Несмотря на определенные неудачи в области оптоэлектронной вычислительной техники, исследования в этой области показали принципиальную возможность создания нетрадиционных вычислительных технологий, которые по максимуму используют функциональные возможности физических процессов, используемых в качестве вычислительных. В частности, в оптоэлектронных вычислителях можно отказаться от "священной коровы" традиционной вычислительной техники в виде регистровых схем управления, передачи и хранения информации и весь вычислительный процесс реализовать на основе распределенной ассоциативной памяти данных, связанной с произвольно коммутируемой вентильной матрицей разветвленной системой связей прямого доступа.
Лекция 1: 12 || Лекция 2 >
Евгений Акимов
Евгений Акимов

Добрый день!

 

Скажите, пожалуйста,планируется ли продолжение курсов по нанотехнологиям?

Спасибо,

Евгений

 

Nozimjon Fayziev
Nozimjon Fayziev
Таджикистан, Душанбе
Анна Волкова
Анна Волкова
Россия, г. Новосибирск