Метод максимума понтрягина кратко

Обновлено: 03.07.2024

Суть принципа максимума Понтрягина можно пояснить на примере задачи о максимальном быстродействии. Пусть требуется за минимальное время перевести изображающую точку из начального положения Н фазового пространства в конечное положение К (рис. 11.14, а). Для каждой точки фазового пространства около точки К существуют оптимальная фазовая траектория и соответствующее минимальное время перехода в точку К. Вокруг точки К можно построить изохроны — поверхности, являющиеся геометрическим местом точек с одинаковым минимальным временем перехода в эту точку. Оптимальная по быстродействию траектория из точки Н в точку К в идеальном случае должна совпадать с нормалями к изохронам (на движение вдоль изохрон затрачивается время без уменьшения отрезка времени до момента достижения конечной точки). На практике ограничения, налагаемые на координаты объекта, не всегда позволяют реализовать идеальную, оптимальную по быстродействию, траекторию. Поэтому оптимальной траекторией будет та, которая максимально, насколько это позволяют ограничения, близка к нормалям к изохронам. Это условие математически означает, что на протяжении всей траектории скалярное произведение Н вектора скорости движения изображающей точки на вектор обратный (по направлению) градиенту времени перехода в конечную точку, должно быть максимально:

где вектор, обратный градиенту времени перехода; координаты векторов Так как скалярное произведение двух векторов равно произведению их модулей на косинус между ними, то условием оптимальности является максимум проекции вектора скорости V на направление Данное условие оптимальности и есть принцип максимума Понтрягина.

В рассматриваемом примере критерием оптимальности является время. Однако условие оптимальности (11.10) справедливо и для общего случая, т. е. для любого критерия оптимальности Поверхности постоянного значения этого критерия в общем случае называются изоповерхностями, а в условии максимума (11.10) вектор представляет собой взятый со знаком минус градиент принятого критерия оптимальности.

В общем случае уравнения объекта (11.2) дополняются уравнением (11.9), содержащим координату соответствующую критерию оптимальности, и условие оптимальности (11.10) принимает вид уравнения Гамильтона

где скалярная величина Н называется гамильтонианом.

Таким образом, возникает задача определения такого управления и, под влиянием которого вектор скорости V движения изображающей точки в каждый момент времени максимально совпадал бы с нормалью к изоповерхностям, т. е. с вектором направленным в каждой точке фазового пространства в сторону наибыстрейшего убывания функции

Имеем уравнений объекта:

где т. е. правая часть уравнений не зависит от

При оптимальном управлении

что дает еще соотношений между неизвестными переменными.

Для определения координат вектора на оптимальной траектории используются так называемых сопряженных уравнений. Для определения этих уравнений вначале найдем частные производные

Методику определения частных производных рассмотрим на примере

Для случая переменные являются независимыми, поэтому и

Подставив в последнее выражение значение получим

В точках оптимальной траектории частные производные Н по согласно условию (11.11), равны нулю. Приравняв из выражения (11.14) получаем сопряженное уравнение

В общем случае сопряженные уравнения, справедливые для оптимальной траектории, имеют вид

Так как дополнительная координата вектора всегда равна

Из системы сопряженных уравнений (11.15) совместно с уравнением (11.16) определяют значения текущих координат вектора на оптимальной траектории.

Таким образом, с учетом сопряженных уравнений (11.15) и (11.16) общее число соотношений равно т. е. соответствует числу искомых переменных.

Выражение (11.14) для общего случая принимает вид

Учитывая, что для данной точки х оптимальной траектории задано и в явном виде от х зависит лишь вектор V, частная производная Н по

Из сравнения выражений (11.15) и (11.17) видно, что их правые части равны и поэтому выражение (11.15) можно записать в компактной форме

Из формулы (11.11) следует, что поскольку V не зависит от Подставив в последнюю формулу значение получим уравнение движения объекта в виде

Уравнения (11.18) и (11.19) называются канонически сопряженными.

Можно принять следующий план решения задачи оптимизации с помощью принципа максимума.

1. Записываем уравнения объекта в виде системы уравнений первого порядка, включая в них уравнение для функционала качества,

2. Составляем функцию Гамильтона

3. Записываем систему сопряженных уравнений

из которой определяет вспомогательные функции

4. Найденные значения и значения подставляет в выражение для Н и из системы уравнений

находим значение управляющего воздействия и максимизирующего функцию Н. Максимум функции Н возможно и на границе допустимых управлений, где отдельные производные не обращаются в нуль.

5. Полученное значение и подставляем в уравнение объекта

решаем его и находим т. е. значение функционала качества и оптимальную траекторию

Таким образом, при использовании принципа максимума вариационная задача нахождения функции и, экстремизирующей функционал

заменяется более простой задачей определения управления и, доставляющего максимум вспомогательной функции — функции Гамильтона Н. Отсюда следует и название метода — принцип максимума.

Основная сложность при применении принципа максимума состоит в том, что не известны начальные значения вспомогательной функции Обычно задаются произвольными начальными значениями , решают совместно уравнения объекта и сопряженные уравнения и получают оптимальную траекторию, которая, как правило, проходит мимо заданной конечной точки (см. рис. 11.14, б). Методом последовательных приближений посредством задания различных начальных значений находят оптимальную траекторию, проходящую через заданную конечную точку.

Принцип максимума является необходимым и достаточным условием только для линейных объектов. Для нелинейных объектов он представляется только необходимым условием. В этом случае с его помощью находится суженная группа допустимых управлений, среди которых, например перебором, находится оптимальное управление, если вообще оно существует.

Читайте также: