Лекция 7: Нелинейное программирование. Классификация методов нелинейного программирования. Классический метод определения условного экстремума. Метод множителей Лагранжа
2. Классификация методов нелинейного программирования
Для решения задачи нелинейного программирования было предложено много методов, которые можно классифицировать по различным признакам.
По количеству локальных критериев в целевой функции методы нелинейного программирования делятся на:
- однокритериальные,
- многокритериальные.
По длине вектора методы делятся на:
- однопараметрические или одномерные (n=1),
- многопараметрические или многомерные (n>1).
По наличию ограничений методы нелинейного программирования делятся на:
По типу информации, используемой в алгоритме поиска экстремума методы делятся на:
- методы прямого поиска, т.е. методы, в которых при поиске экстремума целевой функции используются только ее значения;
- градиентные методы первого порядка, в которых при поиске экстремума функции используются значения ее первых производных;
- градиентные методы второго порядка, в которых при поиске экстремума функции наряду с первыми производными используются и вторые производные.
Ни один метод нелинейного программирования не является универсальным. В каждом конкретном случае необходимо приспосабливать применяемый метод к особенностям решаемой задачи.
3. Классический метод определения условного экстремума
Задача нелинейного программирования (задача НП) в общем виде формулируется так:
при ограничениях где функции нелинейны.В отличие от задачи ЛП для задач НП нет универсального метода решения.
В задаче ЛП допустимое множество R всегда является выпуклым с конечным числом крайних точек. Поэтому воспользовавшись симплекс-методом и перебрав только крайние точки, можно за конечное число шагов найти оптимальное решение. В задачах НП, наоборот, выпуклость допустимого множества и конечность числа его крайних точек совсем необязательны. Это и служит причиной основной трудности решения задач НП.
Для определения условного экстремума (то есть экстремума при ограничениях) можно воспользоваться методами дифференциального исчисления, когда функция имеет не ниже второй производной. Рассмотрим некоторые важные понятия и теоремы классического анализа, которые лежат в основе классических методов поиска условного экстремума .
Теорема 3.1 (теорема существования экстремума). Если - непрерывная функция, определенная на замкнутом и ограниченном множестве, то она достигает на этом множестве, по крайней мере один раз, своих максимального и минимального значений>.
Следующая теорема определяет возможные местоположения максимума (или минимума).
Теорема 3.2. Если является непрерывной функцией нескольких переменных, определенной на допустимом множестве R, то максимальное значение , если оно существует, достигается в одной или нескольких точках, которые принадлежат одному из следующих множеств: 1) S1 - множество стационарных точек ; 2) S2 - множество точек границы ; 3) S3 - множество точек, где функция недифференцируема.
Определение 3.1. Множество точек S1(x1, x2, ..., xn) функции f(x) называется множеством стационарных точек, если они удовлетворяют условию
( 3.1) |
Определение 3.2. Функция f(x) достигает локального максимума в точке , если для всех точек x, лежащих в малой окрестности точки имеет место неравенство
( 3.2) |
Определение 3.3. Функция f(x) достигает глобального (абсолютного) максимума в точке x0, если для всех точек справедливо неравенство
Для нахождения стационарных точек функции f(x) можно использовать следующую теорему.
Теорема 3.3. Пусть дифференцируема в некоторой допустимой области R. Если в некоторой внутренней точке области R функция f(x) достигает относительного максимума, то
( 3.3) |
Для того чтобы определить, являются ли найденные стационарные точки точками максимума или минимума, необходимо исследовать функцию в окрестности стационарных точек и определить, является она выпуклой или вогнутой.
Определение 3.4. Пусть R - выпуклое множество точек n - мерного пространства. Функция f, определенная на R, называется выпуклой вверх, если для любой пары точек и произвольного выполняется неравенство
( 3.4) |
Если
( 3.5) |
Если (3.4) или (3.5) выполняются как строгие неравенства, то функция называется строго вогнутой или строго выпуклой соответственно.
Критерий выпуклости и вогнутости функции n - переменных можно сформулировать в виде следующей теоремы.
Теорема 3.4. Дифференцируемая функция f(x) строго вогнутая в некоторой окрестности точки , если выполняются следующие условия:
( 3.6) |
И так далее, то есть если знаки определителей чередуются начиная с < 0, где
Функция f(x) строго выпукла в окрестности точки x0, если все определители (выписанные выше) положительные.
Имеет место следующая теорема.
Теорема 3.5. Для того чтобы в точке x0 достигался внутренний относительный минимум, достаточно, чтобы эта точка была стационарной, а самая функция в окрестности точки x0 была строго выпуклой.
Справедливо следующее утверждение: если f(x) строго выпуклая (вогнутая) функция на всем множестве решений R, то f имеет только один относительный минимум (максимум), который является и абсолютным.