НОУ ИНТУИТ | Введение в программирование на Intel Cilk Plus. Лекция 1: Программные инструменты параллелизма

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Санкт-Петербургский государственный университет

Опубликован: 11.10.2012 | Доступ: свободный | Студентов: 754 / 331 | Длительность: 01:50:00

Тема: Программирование

Специальности: Программист, Системный архитектор

|

Вам нравится? Нравится 3 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Парадигмы параллельного программирования

Параллелизм данных

одна операция применяется сразу к нескольким элементам массива данных. Различные фрагменты такого массива обрабатываются на векторном процессоре или на разных процессорах параллельной машины;
обработкой данных управляет одна программа;
пространство имен является глобальным;
параллельные операции над элементами массива выполняются одновременно на всех доступных данной программе процессорах.

От программиста требуется:

задание опций векторной или параллельной оптимизации транслятору;
задание директив параллельной компиляции;
использование специализированных языков параллельных вычислений, а также библиотек подпрограмм, специально разработанных с учетом конкретной архитектуры компьютера и оптимизированных для этой архитектуры.

Параллелизм задач

вычислительная задача разбивается на несколько относительно самостоятельных подзадач. Каждая подзадача выполняется на своем процессоре (ориентация на архитектуру MIMD);
для каждой подзадачи пишется своя собственная программа на обычном языке программирования (чаще всего это Fortran или С);
подзадачи должны обмениваться результатами своей работы, получать исходные данные. Практически такой обмен осуществляется вызовом процедур специализированной библиотеки. Программист при этом может контролировать распределение данных между различными процессорами и различными подзадачами, а также обмен данными.

Программные инструменты параллелизма

Низкоуровневые средства

Системные вызовы операционной системы (UNIX/Linux)

IPC (InterProcess Communications)

именованные каналы;
общая память;
сообщения;
семафоры.

IPC. Сообщения. Пример

Клиент

#include <sys/types.h>
    #include <sys/ipc.h>
        #include <sys/msg.h>
            #include "mesg.h"
            main()
            {
            message  message;
            key_t	key;
            int msgid, length, n;
            
            if ((key = ftok("server", 'A')) < 0){
            printf("Невозможно получить ключ\n"); exit(1); }
            message.mtype=1L;
            if ((msgid = msgget(key, PERM | IPC_CREAT)) < 0){
            printf("Невозможно создать очередь\n"); exit(1); }
            n = msgrcv(msgid, &message, sizeof(message), message.mtype, 0);
            if (n > 0) {
            if (write(1, message.buff, n) != n) {
            printf("Ошибка вывода\n"); exit(1); }
            }
            else { printf("Ошибка чтения сообщения\n"); exit(1); }
            
            exit(0);
            }

Сервер

#include <sys/types.h>
    #include <sys/ipc.h>
        #include <sys/msg.h>
            #include "mesg.h"
            main()
            {
            Message	message;
            key_t	key;
            int	msgid, length;
            message.mtype = 1L;
            if ((key = ftok("server", 'A')) < 0){
            printf("Невозможно получить ключ\n"); exit(1); }
            if ((msgid = msgget(key, 0)) < 0){
            printf("Невозможно получить доступ к очереди\n"); exit(1); }
            if ((length = sprintf(message.buff, "Здравствуй, Мир!\n")) < 0){
            printf("Ошибка копирования в буфер\n"); exit(1); }
            if (msgsnd(msgid, (void *) &message, length, 0) !=0){
            printf("Ошибка записи сообщения в очередь\n");
            exit(1); }
            if (msgctl(msgid, IPC_RMID, 0) < 0){
            printf("Ошибка удаления очереди\n"); exit(1); }
            exit(0);
            }

POSIX Threads

POSIX Threads - стандарт POSIX реализации потоков (нитей) выполнения, определяющий API для создания и управления ими.

Ссылка http://www.opengroup.org/onlinepubs/009695399/basedefs/pthread.h.html

POSIX Threads. Пример

#include <stdio.h>
    #include "gettimeofday.h"
    #include <pthread.h>
        
        #define gNumThreads 1
        #define N 100000000
        
        double a[N + 1], b[N + 1], sum;   
        int i, j;   
        double start, stop;   
        
        const int gNumSteps = N;
        double gVectorSum = 0;
        
        void *threadFunction(void *arg) 
        { 
        int i;
        int myNum = *((int *)arg);
        
        double partialSum = 0;  // local to each thread
        
        for ( i = myNum; i < gNumSteps; i += gNumThreads )  // use every gNumThreads-th step
        {
        partialSum += a[i] * b[i];   //compute partial sums at each thread
        }
        gVectorSum += partialSum;   // add partial to global final answer
        
        return 0;
        }
        int main() 
        {	
        pthread_t tid[gNumThreads];
        int      tNum[gNumThreads], i, j;
        
        // initialize vector   
        for (j = 0; j < N; j++) 
        {	   
        a[j] = 1.031; b[j] = 1.057;
        }
        
        printf("Computed value of vector sum: ");
        start = wcgettimeofday();   
        
        for (i = 0; i < gNumThreads; i++)
        {
        tNum[i] = i;
        pthread_create(&tid[i], NULL, threadFunction, &tNum[i]);
        }
        
        for (i = 0; i < gNumThreads; i++)
        pthread_join(tid[i], NULL);
        
        stop = wcgettimeofday();   
        
        printf("sum = %f\n", gVectorSum);   
        
        printf("time = %g\n", stop - start); 
        
        }

Windows API

В Microsoft Windows имеется возможность разработки многопоточных приложений на C++ с помощью "стандартных" системных средств – прикладного программного интерфейса операционной системы.

Ссылка http://msdn.microsoft.com

Windows API. Пример

#include <windows.h>
    #include <stdio.h>
        #define N 100000000
        
        double a[N + 1], b[N + 1], sum;   
        int i, j;   
        double start, stop;   
        
        const int gNumSteps = N;
        const int gNumThreads = 1;
        double gVectorSum = 0;
        CRITICAL_SECTION gCS;
        
        DWORD WINAPI threadFunction(LPVOID pArg)
        {
        int i;
        int myNum = *((int *)pArg);
        double partialSum = 0;  // local to each thread
        for ( i = myNum*(gNumSteps / gNumThreads); i < (myNum+1)*(gNumSteps /gNumThreads); i++ )  
           // use every gNumThreads-th step
        {
        partialSum += a[i] * b[i];   //compute partial sums at each thread
        }
        
        EnterCriticalSection(&gCS);
        gVectorSum += partialSum;   // add partial to global final answer
        LeaveCriticalSection(&gCS);
        return 0;
        }
        int main()
        {
        HANDLE threadHandles[gNumThreads];
        int tNum[gNumThreads], i, j;
        
        for (j = 0; j < N; j++) 
        {	   
        a[j] = 1.031; b[j] = 1.057;
        }
        
        printf("Computed value of dot product: ");
        start = wcgettimeofday();   
        InitializeCriticalSection(&gCS);
        for ( i = 0; i < gNumThreads; ++i )
        {
        tNum[i] = i;
        threadHandles[i] = CreateThread( NULL,  // Security attributes
        0,               // Stack size
        threadFunction,  // Thread function
        (LPVOID)&tNum[i],      // Data for thread func()
        0,               // Thread start mode
        NULL);           // Returned thread ID
        }
        WaitForMultipleObjects(gNumThreads, threadHandles, TRUE, INFINITE);
        DeleteCriticalSection(&gCS);
        stop = wcgettimeofday();   
        printf("sum = %f\n", gVectorSum);   
        printf("time = %g\n", stop - start); 
        }

Open Multi-Processing (OpenMP)

OpenMP - стандарт программного интерфейса приложений для параллельных систем с общей памятью. Поддерживает языки C, C++, Fortran.

Первая версия появилась в 1997 (Fortran) / 1998 (C/C++) годах. Последняя версия OpenMP 3.0 (2008 год). Разработкой стандарта занимается OpenMP ARB (Architecture Board).

Ссылка http://openmp.org

OpenMP. Пример

#include <windows.h>
    #include <stdio.h>
        #define N 100000000
        
        double a[N + 1], b[N + 1];   
        int i;   
        double start, stop;   
        double gDotProduct = 0;
        
        int main()
        {
        // initialize vectors   
        for (i = 0; i < N; i++) 
        {	   
        a[i] = 1.034; b[i] = 1.057;
        }
        printf("Computed value of vector sum: ");
        start = omp_get_wtime();

Программные инструменты Intel разработки параллельных приложений для вычислительных систем с общей памятью

Intel® TBB – библиотека шаблонов параллельных алгоритмов и контейнеров на языке С++

Intel® CilkTM Plus - расширение C/C++, упрощающее реализацию параллелизма для систем с общей памятью

Компиляторы – автоматическая оптимизация, автоматическое распараллеливание, векторизация.

Анализаторы производительности.

"Экспериментальные" технологии

Дальше >>

Авторизоваться

Введение в программирование на Intel Cilk Plus

Программные инструменты параллелизма

Парадигмы параллельного программирования

Параллелизм данных

От программиста требуется:

Параллелизм задач

Программные инструменты параллелизма

Низкоуровневые средства

IPC. Сообщения. Пример

Клиент

Сервер

POSIX Threads

POSIX Threads. Пример

Windows API

Windows API. Пример

Open Multi-Processing (OpenMP)

OpenMP. Пример

Программные инструменты Intel разработки параллельных приложений для вычислительных систем с общей памятью

Вопросы и ответы