Математические библиотеки*
Презентацию к лекции Вы можете скачать здесь.
Обзор
Intel ® Math Kernel Library Основная математическая библиотека
Производительность (для больших задач)! |
Параллельное выполнение! |
Оптимизирована под процессоры Intel®! |
IMSL International Mathematical and Statistical Library Международная математическая библиотека подпрограмм.
Компоненты IMSL
- Процедуры линейной алгебры;
- Решение систем линейных уравнений;
- Преобразования Фурье и Лапласа;
- Решение нелинейных уравнений;
- Задачи оптимизации;
- Сортировка и поиск данных;
- Интерполяция и аппроксимация;
- Интегрирование и дифференцирование;
- Решение ОДУ;
- Решение ДУЧП.
Компоненты MKL
BLAS | - базовые подпрограммы линейной алгебры; |
Sparse BLAS | - BLAS для разреженных матриц; |
LAPACK | - решатели задач линейной алгебры; |
ScaLAPACK | - параллельное расширение LAPACK; |
DFT | – дискретные преобразования Фурье; |
Cluster DFT | – кластерные DFT; |
Sparse Solvers | - решатели систем линейных уравнений с невырожденной разреженной матрицей; |
VML (Vector Math Library) | – математические функции над векторами; |
VSL (Vector Statistical Library) | – библиотека статистики; |
PDEs (Partial Differential Equations) | – решатели уравнений в частных производных; |
Optimization Solvers | – подпрограммы нелинейной оптимизации. |
Настройка MS Visual Studio 2010
Расположение модулей (*.mod файлы) | C:\Program Files\Intel\ComposerXE-2011\mkl\include\ia32 |
Библиотеки | mkl_intel_c.lib mkl_intel_thread.lib libiomp5md.lib + mkl_blas95.lib mkl_lapack95.lib и др. |
Расположение библиотек (*.lib файлы) | C:\Program Files\Intel\ComposerXE-2011\mkl\lib\ia32 |
Настройки проекта
Используем MKL Parallel
Библиотеки (в зависимости от процедур)
Документация и примеры
Документация пользователя (User guide) | C:\Program Files\Intel\ComposerXE-2011 \Documentation\en_US\mkl\mkl_userguide\ index.htm |
Справочные страницы (Manual pages) | C:\Program Files\Intel\ComposerXE-2011\Documentation\en_US\mkl\mkl_manual\ index.htm |
Примеры | C:\Program Files\Intel\ComposerXE- 2011\mkl\examples |
Возможности на примере BLAS
Уровень 1 : Векторные операции
Уровень 2 : Векторно-матричные операции
Уровень 3 : Матричные операции
Хранение векторов
Элементы хранятся в одномерном массиве
incx > 0 | - хранение по возрастанию; |
incx < 0 | - хранение по убыванию; |
incx = 0 | - все элементы равны значению x(1) |
x = (1.0, 3.0, 5.0, 7.0, 9.0, 11.0, 13.0)
Если
incx = 2, n = 3 --> (1.0, 5.0, 9.0) |
incx = -2,n = 4 --> (13.0, 9.0, 5.0, 1.0) |
incx = 0, n = 5 --> (1.0, 1.0, 1.0, 1.0, 1.0) |
Хранение матриц
Full Storage – элементы матрицы хранятся в двумерном массиве arr(i,j).
Для треугольных, симметричных или Эрмитовых матриц задание элементов массива определяется параметром uplo.
Остальные элементы необязательны.
character :: uplo = 'L' real a(3,3) a(1,:) = (/1,0,0/) a(2,:) = (/2,5,0/) a(3,:) = (/3,0,9/)
Packed Storage – хранение симметричных, Эрмитовых или треугольных матриц : верхняя или нижняя треугольные части упаковываются по столбцам в одномерный массив.
uplo ='U', ---> arr(i+j*(j-1)/2), i <= j uplo ='L', ---> arr(i+(2*n-j)*(j-1)/2), i >= j
Band Storage - ненулевые диагонали, матрицы размером (m x n), хранятся построчно в двумерном массиве arrB размером (kl+ku+1 x n), где
При выполнении LU-факторизации над ленточными матрицами в массиве arrB следует добавить kl дополнительных строк.
После LU-факторизации входной массив arrB будет изменён следующим образом:
Пример. Подготовить матрицу для LU-факторизации.
ku = 1, kl = 1, m = 900, n=900. arrB(2*kl+ku+1 x n) = (4 х 900).
integer, parameter :: m = 900 real :: arrB(4,m) = 0, a,b,c arrB(2,3:m) = c ! вторая, первую строку пропускаем arrB(3,2:m-1) = b ! третья arrB(4,1:m-2) = a ! четвертая arrB(3,1)=1; arrB(3,m)=1
Именование функций
Шаблон:
<character> <name> <mod> ( ) <character>
s - real, single precision (вещественные данные одинарной точности) |
c - complex, single precision (комплексные данные одинарной точности) |
d - real, double precision (вещественные данные двойной точности) |
z - complex, double precision (комплексные данные двойной точности) |
Примеры
ddot <d> <dot> | - скалярное произведение двух векторов двойной точности |
sgemv <s> <ge> <mv> | - матрично-векторное произведение, матрица обычная, одинарная точность |
ztrmm <z> <tr> <mm> | - матрично-матричное произведение, треугольная матрица, комплексные числа двойной точности |
Пример
Вычисление скалярного умножения
program prog use mkl95_blas integer, parameter :: n = 5 ! количество элементов real :: a(n) = (/1,2,3,4,5/),& ! векторы b(n) = (/2,4,6,8,9/) real res res = dot(a,b) ! скалярное произведение write(*,*) "Scalar product = ", res end
Результат вычислений
Scalar product = 105.0000 Для продолжения нажмите любую клавишу . . .
Пример
Решить одномерное уравнение теплопроводности методом конечных разностей.
Самостоятельно разобрать процедуры gbtrf, gbtrs.
Пример
Вариант программы (1)
program teplo_1D use lapack95 use f95_precision integer, parameter :: N = 64 integer k real DL(N-1), D(N), DU(N-1) ! DL - нижняя, D - основная, DU - верхняя real AB(4,N) real :: UN(N) = 0 real :: dt = 0.01 ! --- шаг по времени real, parameter :: H = 1.0 ! --- длина области real :: dh = H/(N-1) ! шаг по области integer IPIV(N), INFO !====================================================================== open(1,file = "res1.txt") open(3,file = "res2.txt") open(5,file = "res3.txt") !------ заполняем диагонали !------ так как на границах Г.У. первого рода DL = -dt/dh**2; DL(N-1) = 0 ! --- нижняя D = 2*dt/dh**2+1; D(1) = 1; D(N) = 1 ! --- основная DU = -dt/dh**2; DU(1) = 0 ! --- верхняя
Вариант программы (2)
!----- формируем AB-матрицу AB(1,:) = 0 ! не заполняем, нужна для процедур AB(2,2:N) = DU AB(3,1:N) = D AB(4,1:N-1) = DL call gbtrf(AB, ipiv = IPIV) ! ---- делаем факторизацию do k = 1,500 UN(N) = 5*k*dt ! ----- правая часть call gbtrs(AB, UN, IPIV, info = INFO) ! --- вызываем решатель if ((k == 100).OR.(k == 300).OR.(k == 500)) then do i = 1,N x = (i-1)*dh write(k/100,*) x, UN(i) end do close(k/100) end if end do close(1) close(3) close(5) end