Московский физико-технический институт
Опубликован: 25.10.2007 | Доступ: свободный | Студентов: 3914 / 1195 | Оценка: 4.50 / 4.33 | Длительность: 24:00:00
ISBN: 978-5-9556-0065-9
Специальности: Программист, Математик
Лекция 5:

Численные методы решения экстремальных задач

Можно показать, что покоординатный спуск реализуется (сходится к точке минимума) при условии существования вторых производных \Phi^{\prime\prime}_{u_1}, \Phi^{\prime\prime}_{u_2}, \Phi^{\prime\prime}_{u_1 u_2}, причем \Phi^{\prime\prime}_{u_1} \ge a_1  > 0, \Phi^{\prime\prime}_{u_2} \ge a_2 > 0, \left| {\Phi^{\prime\prime}_{u_1 u_2}}\right| \le a_3, {a_1 a_2 > a_3^2}. Изломы приводят к подъему. Этот метод сходится достаточно медленно, а при наличии так называемых "оврагов", очень медленно. Разделим "рельефы", образуемые линиями уровня — на два типа: "котловинный" и "овражный". В первом случае линии уровня похожи на эллипсы, а функция вблизи своего минимума практически не изменяется при изменении переменных. Этот случай можно назвать простым (рис. 4.4).

Рельеф овражного типа имеет либо точки излома (рис. 4.4), либо участки с большей кривизной ("разрешимый овраг"). Если линии уровня — кусочно - гладкие, то выделим на них точки излома, геометрическое место которых назовем истинным "оврагом", если угол направлен в сторону возрастания функции — и "гребнем", если в сторону убывания (рис. 4.5).\vspace{- 4mm}


Рис. 4.4.

Примером разрешимого оврага является функция \Phi (u_1,u_2) = 10(u - \sin {u_1})^2 + 0,1u_1^2 (рис. 4.6 ).


Рис. 4.5.

Рис. 4.6.

Неупорядоченный тип рельефа характеризуется наличием многих экстремумов; примером может служить функция \Phi (u_{1},u_{2}) = (1 + \sin 2u_{1})x (1 + \sin 2u_{2}) (рис. 4.7).


Рис. 4.7.

Рис. 4.8.

Метод оврагов используется в случае, если "дно" оврага узкое, а "склоны" крутые. В этом случае спустимся из двух точек P0 и P1, например, с помощью метода координатного или градиентного спуска на "дно" оврага (или в его окрестность) в точки с координатами r0 или r1, не требуя высокой точности сходимости. Проведем через эти две точки прямую и выберем на ней новую точку

P_{2} = r_{1} \pm  h(r_{1} - r_{0}),

где h = const > 0 — "овражный шаг", который выбирается для каждой функции путем расчета (рис. 4.8). Точка лежит на "склоне" оврага. Из нее спускаемся на "дно" и попадаем в некую точку r2, через точки r1 и r2 проводим прямую и находим точку P3, из которой возможно опуститься в точку r3.

Процесс продолжается до тех пор, пока значения целевой функции на "дне" оврага убывают, т.е. пока

\Phi (r_{n + 1}) > \Phi (r_{n}).