Здравствуйте. Сейчас я прохожу данный курс, и пришел к выводу, что без практики толку будет мало. Собственно, хотелось бы получить какие-либо задания для самостоятельной работы, которые мельком упоминаются в этом курсе, но нет ни слова о том, что это за задачи и где их брать. |
Опубликован: 15.04.2009 | Уровень: специалист | Доступ: свободно
В рамках курса проводится изучение основных возможностей стандарта OpenMP, необходимых для создания эффективных параллельных программ для многоядерных и многопоточных процессоров. Рассматриваются подходы для функциональной отладки OpenMP-программ, а также отладки эффективности.
В рамках курса рассматриваются современные направления развития параллельных вычислительных систем (многоядерность и многопоточность), OpenMP – модель параллелизма по управлению, конструкции распределения работы, конструкции для синхронизации нитей, система поддержки выполнения OpenMP-программ, переменные окружения, управляющие выполнением OpenMP-программы, вложенный параллелизм, наиболее часто встречаемые ошибки в OpenMP-программах, функциональная отладка OpenMP-программ, отладка эффективности OpenMP-программ, использование OpenMP на кластере.
Цель: Цель курса состоит в изложении основных возможностей стандарта OpenMP, необходимых для создания эффективных параллельных программ для многоядерных и многопоточных процессоров.
Необходимые знания: При изложении учебного материала курса у обучаемых предполагается наличие общих (начальных) знаний в области программирования.
План занятий
Занятие | Заголовок << | Дата изучения |
---|---|---|
- | ||
Лекция 1 | Введение
Современные направления развития параллельных вычислительных систем (многоядерность и многопоточность). SMP (Symmetric Multiprocessing) и DSM (Distributed Shared Memory)-системы. Процессы и нити. Модель общей памяти. Стандарт POSIX (Portable Operating System Interface for UNIX) для создания параллельных программ для мультипроцессоров.
Оглавление | - |
Лекция 2 | OpenMP - модель параллелизма по управлению
Выполнение OpenMP-программы (Fork and Join Model). Модель памяти. Понятие консистентности памяти. Консистентность памяти в OpenMP (weak ordering). Классы переменных (клаузы SHARED, PRIVATE; директива THREADPRIVATE).
Оглавление | - |
Тест 115 минут | - | |
Лекция 3 | Основные понятия
Директивы и клаузы. Понятие структурного блока. Компиляция OpenMP-программы. Параллельная область (директива PARALLEL). Понятие задачи (директива TASK).
Оглавление | - |
Тест 215 минут | - | |
Лекция 4 | Конструкции распределения работы
Распределение витков циклов. Циклы с зависимостью по данным. Организация конвейерного выполнения для циклов с зависимостью по данным. Распределение нескольких структурных блоков между нитями (директива SECTION). Редукционные операторы (клауза REDUCTION). Выполнение структурного блока одной нитью (директива SINGLE). Распределение операторов одного структурного блока между нитями (директива WORKSHARE). Копирование значений приватных переменных (клаузы FIRSTPRIVATE, LASTPRIVATE, COPYIN, COPYPRIVATE).
Оглавление | - |
Тест 315 минут | - | |
Лекция 5 | Конструкции для синхронизации нитей. Система поддержки выполнения OpenMP-программ. Часть 1
Директивы MASTER, CRITICAL, BARRIER, TASKWAIT, ATOMIC, FLUSH, ORDERED.
Оглавление | - |
Тест 415 минут | - | |
Лекция 6 | Конструкции для синхронизации нитей. Система поддержки выполнения OpenMP-программ. Часть 2
Директивы MASTER, CRITICAL, BARRIER, TASKWAIT, ATOMIC, FLUSH, ORDERED.
Оглавление | - |
Тест 515 минут | - | |
Лекция 7 | Наиболее часто встречаемые ошибки в OpenMP-программах. Функциональная отладка OpenMP-программ
Создание вложенной параллельной области. Распределение витков тесно-вложенных циклов (с использованием вложенных параллельных областей и клаузы COLLAPSE). Задание количества нитей для вложенной параллельной области. Задание/опрос максимального уровня вложенности для параллельных областей. Задание максимального количества создаваемых нитей (переменная OMP_THREAD_LIMIT).
Оглавление | - |
Тест 615 минут | - | |
Лекция 8 | Отладка эффективности OpenMP-программ
Стратегии распределения витков цикла между нитями (клауза SCHEDULE). Отмена барьерной синхронизации по окончании выполнения цикла (клауза NOWAIT). Локализация данных. Задание поведения нитей во время ожидания (переменная OMP_WAIT_POLICY). Оптимизация OpenMP-программы при помощи Intel Thread Profiler.
Оглавление | - |
Тест 715 минут | - | |
Лекция 9 | Использование OpenMP на кластере
Технология Intel Cluster OpenMP. Программная реализация DSM. Директива SHARABLE. Гибридная модель параллельного программирования MPI/OpenMP.
Оглавление | - |
Тест 815 минут | - | |
5 часов | - |