НОУ ИНТУИТ | Параллельное программирование. Лекция 1: Параллельные технологии решения информационно-логических задач

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 22.12.2006 | Доступ: свободный | Студентов: 1244 / 139 | Оценка: 4.73 / 4.45 | Длительность: 18:17:00

ISBN: 978-5-94774-546-7

Темы: Программирование, Суперкомпьютерные технологии

Специальности: Программист

|

Вам нравится? Нравится 13 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Как говорилось выше, для организации параллельной обработки целесообразно использовать образ R списка — массив информации об элементах списка, содержащий сведения о его структуре и преемственности элементов. Отметим, что упорядоченность элементов массива R в памяти в общем случае может не совпадать с логической упорядоченностью элементов списка, задаваемой ссылками. Это позволяет достаточно просто интерпретировать выполнение операций над списками. Например, при добавлении новых элементов в список L нет необходимости вставлять новый элемент массива R в какую-либо конкретную позицию - можно просто добавить его в конец массива. Аналогично, при исключении элемента из L вместо уплотнения массива R на освободившееся место можно записать его последний элемент.

Обработку списка, таким образом, мы сводим к обработке массива, представляющего его образ. Этот массив, в свою очередь, может описываться дескриптором.

Дескриптор D_R массива R={V,C,D}₁^N в полной комплектации, как рассматривалось ранее, состоит из восьми элементов: D_R={D_RO , ..., D_R7}. Дескрипторный элемент D_RO содержит адрес a₀ первого элемента массива, D_R1 — шаг h = 3 переадресации, D_R2 — количество N элементов массива, в D_R3 находится адрес последнего элемента массива. Элемент D_R4 служит для переадресации при последовательном обращении к данному массиву. В нем хранится адрес a_Q+jh для выработки элемента массива при j -м (j = 0,1 , ..., n-1) обращении к массиву. При каждом обращении к массиву по некоторым командам этот адрес увеличивается на шаг h (т.е. выполняется операция j := h+!). Остальные дескрипторы предназначены для организации распределения элементов массива между процессорами. D_R5 содержит значение адреса a_Q+ih, i = 0,1 , ..., n-1, т.е. каждый процессор П_i формирует и использует свое значение (D_R5), располагая адресом регистра, содержащего значение номера i процессора, для начального обращения к "своему" элементу массива. D_R6 содержит значение nh, используемое для переадресации к следующему "своему" элементу массива с учетом числа процессоров в ВС. В D_R7 содержится значение адреса a_Q+ih+jnh=(D_R5)+j(D_R6), используемое для возможности переадресации при последовательном (j = 0,1,...) обращении к массиву. Если нет необходимости, могут формироваться не все дескрипторные элементы.

Предположим, как и ранее, что в ВС реализована трехадресная система команд вида: $\theta I_{1} A_{1} 1_{2} A_{2} I_{3} A_{3}$ , где $\theta$ — код операции, I₁, I₂, I₃ — адреса модификаторов, дескрипторных элементов или дескрипторов, A₁, A₂, A₃ — смещения. При выполнении команд формируются исполнительные адреса: A'_r =(I_r)+ A_r, r = 1,2,3.

Для упрощения операций над дескрипторами в систему команд введены специальные команды, обеспечивающие переадресацию для различных дисциплин выбора "своих" элементов обрабатывающим процессором, анализ выхода за пределы массива, инвариантность программы относительно размера массива.

Монопрограмма нахождения последнего элемента списка представлена в табл. 1.2.

Таблица 1.2.
№_k	КОП	I₁	A₁	I₃	A₃
0	СИНХ
1	ЗАГ	K
2	ПРАД	D_R7			012
3	УП $\ne$ 0	K			012
4	ЗАПК	D_R7	0003		M
5	УП=0		M		011
6	ЗАПК		M	D_R7	0003
7	ИЗМАД	D_R7			009
8	БП		003
9	ЗАГ	D_R7	D_R5
10	БП		0003
11	ЗАП	D_R7	0003		K
12	В

Команда O (СИНХ) синхронизирует процессоры для одновременного начала выполнения программы (это не влияет на правильность работы ВС, а лишь упрощает контроль выполнения). Каждый процессор посылает сигнал на устройство СИНХ; после поступления сигналов от всех процессоров выдается обратный сигнал, по которому процессоры приступают к выполнению следующей команды.

Команда 1 (ЗАГрузка модификатора) обнуляет модификатор K, в который впоследствии одним из процессоров будет записан адрес последнего элемента списка.

Команда 2 (ПРоверка АДреса) сравнивает значение дескрипторного элемента D_R7, первоначально равное a₀+3i, с адресом последнего элемента массива, записанным в дескрипторном элементе D_R3. Этим устанавливается возможность загрузки i -го процессора (возможен случай i>N ). Если процессор не будет занят обработкой списка, то управление передается команде 12 на Выход из процедуры. В противном случае с команды 3 начинается цикл обработки элементов списка, а точнее — его последовательности ссылок. Команда 3 осуществляет Условный Переход на выход из процедуры по отличному от нуля значению K.

Команда 4 выполняется при нулевом значении K, она осуществляет ЗАПись по Косвенному адресу. При этом производится косвенное считывание по первому адресу (D_R7) + 0003, т.е. по адресу (( D_R7 )+0003), и запись по адресу модификатора M.

Команда 5 проверяет, пуста ли выбранная ссылка. Если пуста, то анализируемый элемент списка - последний; управление передается команде 11, записывающей адрес этой ссылки в K. Если не пуста, т.е. (M)\neq 0, то выполняется команда 6 и ее значение записывается вместо значения текущей ссылки.

Команда 7 ИЗМенение АДреса задает операцию (D_R7):=(D_R7)+(D_R6) и если полученное значение превышает (D_R3), передает управление команде 9. Таким образом, каждый процессор осуществляет переадресацию для последующей выборки "своего" адреса ссылки из массива таких адресов. Если при этом массив не исчерпан, то команда 8 (Быстрый Переход) передает управление на команду 3 — продолжение цикла подстановки ссылок. Если переадресация выводит из массива, то команда 9 восстанавливает дескрипторный элемент D_R7, т.е. выполняется операция (D_R7):= (D_R5) = a₀+3i. По команде 10 управление передается на следующий цикл подстановки ссылок.

Команда 11 выполняется, если при выполнении команды 5 обнаружилось, что найдена пустая ссылка, адрес которой записывается в K. После выполнения в последующем команды 3 всеми процессорами закончится и выполнение программы.

Рассмотрим процесс счета программы нахождения последнего элемента списка L, содержащего семь элементов, на ВС, имеющей в составе три процессора — П₀, П₁ и П₂.

Каждый процессор выполняет свою копию программы, обладая при этом собственным набором дескрипторов, отличающихся друг от друга только значениями дескрипторных элементов D_R5 и D_R7. Согласно принятому нами представлению образа списка и порядку его обработки, процессор П₀ будет обрабатывать элементы списка A, F и I, процессор П₁ — B и G, и процессор П₂ — элементы E и H. Пусть каждая команда программы выполняется за одинаковое время — условный такт, и при обращении к памяти не возникает конфликтов (все элементы образа списка расположены в разных блоках памяти).

На рис. 1.4 показана диаграмма потактового выполнения программы на каждом из процессоров, полученная при справедливости этих предположений. Некоторое время все процессоры работают синхронно: такты 1—3 — начальные действия; такты 4—9 — первый цикл подстановки ссылок, во время которого изменяются поля D элементов A, B и E ; такты 10—12 — начало второго цикла подстановки ссылок.

Рис. 1.4. Временная диаграмма выполнения программы нахождения последнего элемента списка

Во время второго цикла подстановки ссылок процессор П₂ обнаруживает пустую ссылку (т.е. последний элемент списка) в такте 12 и, записав его адрес в модификатор K (такт 13), заканчивает свою работу в следующем такте командой Возврат.

Процессор П₀ заканчивает второй цикл подстановки ссылок (такты 13—15), не обнаружив пустой ссылки, но завершает свою работу в тактах 16 и 17, поскольку модификатор K получил уже к этому времени ненулевое значение.

Процессор П₁ в такте 14 изменяет значение дескрипторного элемента D_R7 и, так как оно выводит за границы обрабатываемого массива, в такте 15 восстанавливает его исходное значение. Далее следует переход на начало третьего цикла обработки ссылок (такт 16), но, обнаружив ненулевое значение модификатора K (такт 17), в следующем такте процессор П₁ также завершает свою работу. Результатом совместной работы трех процессоров является адрес ссылки на последний элемент списка, записанный в модификаторе K.

Заметим, что детерминированный — при синхронной работе процессорных элементов — процесс выполнения алгоритма при реализации на локально-асинхронной ВС приобретает некоторую неопределенность. Дело в том, что мы не можем быть уверены в порядке выполнения процессорами операций замены значений ссылок (команда 6), поскольку в принципе не исключены обращения к одним и тем же модулям общей памяти. В результате какой-либо процессор может "подхватить" уже обновленную ссылку. Однако очевидно, что это только приблизит окончание работы алгоритма, который в таком случае как бы "перескакивает" через некоторые шаги. Например, элемент A, обрабатываемый процессором П₀, после первого выполнения процессором команды 6 должен содержать ссылку на элемент E. Но если процессор П₁ успел по какой-либо причине выполнить свою аналогичную операцию раньше, элемент A будет содержать ссылку на более "удаленный" от него элемент F. Поэтому появляется возможность более раннего достижения условия окончания работы программы.

Здесь иллюстрируется не всегда ясно сознаваемый факт, что принципы параллельной обработки информации могут быть использованы для нахождения самого общего решения задач, по своей природе, казалось бы, не распараллеливаемых. Эффективность параллельной обработки списков в данном случае достигается двумя встречными путями: дополнением традиционного подхода концепцией обработки массивов и использованием архитектурных особенностей ВС, реализующей SPMD-технологию.

Дальше >>

Авторизоваться

Параллельное программирование

Параллельные технологии решения информационно-логических задач

Вопросы и ответы