Теория оптимального управления доклад
Обновлено: 15.05.2024
ОПТИМА́ЛЬНОЕ УПРАВЛЕ́НИЕ, 1) в автоматизации – управление, которое обеспечивает достижение цели при следующих условиях: получение экстремального значения заданного критерия (показателя) качества управления и соблюдение ограничений на управляющие воздействия и выходные величины (фазовые координаты). О. у. широко применяется для решения прикладных технических (напр., космич. навигация, регулирование технологич. процессов), экономических (формирование оптимального плана развития предприятия и др.), транспортных (напр., выбор наиболее экономичных маршрутов перевозки грузов) и др. задач. При постановке задачи О. у. необходимо учитывать ряд особенностей. О. у. применяется при управлении динамич. процессами в объекте, а именно процессами перевода значений заданных фазовых координат объекта из некоторого начального в заданное конечное состояние. О. у. может быть реализовано только при задании одного критерия качества. Это, как правило, характеристика траектории изменения фазовых координат (заданная функционалом), зависящая от параметров управляющих воздействий. Задача О. у. заключается в нахождении среди множества возможных траекторий движения фазовых координат (соответствующих достижению цели управления) такой траектории (экстремали), на которой критерий качества принимает экстремальное (миним. или макс.) значение. Показателями качества функционирования объектов управления могут быть, напр., среднее или макс. отклонение параметров технич. системы от заданных значений, объём выхода готовой продукции, затраты материалов, энергии и др. ресурсов на единицу готовой продукции. Кроме того, при постановке задачи О. у. должны быть указаны ограничения на изменения управляющих воздействий и фазовых координат. Различают безусловные и условные ограничения. К безусловным относят ограничения таких координат, которые не могут быть нарушены в силу конструктивных и/или физич. особенностей объекта управления. Чаще всего к ним относят ограничения на управляющие воздействия. Напр., для электропривода это напряжение электросети, для самолётов – углы поворота рулевых устройств. К условным ограничениям относят ограничения, которые могут, но не должны быть по к.-л. условиям нарушены при управлении объектом. Напр., применяя электропривод для перемещения кабины лифта, необходимо ограничивать ускорение разгона и торможения кабины с учётом физиологич. возможностей пассажиров. О. у. также требует знания математич. модели объекта, т. е. математич. зависимостей, связывающих управляющие воздействия, выходные и ограничиваемые координаты.
Становление и развитие теории оптимального управления, её успешные применения в самых различных областях науки, техники и промышленности в немалой степени связаны с фундаментальным вкладом сотрудников Института проблем управления.
Ещё в 1949 г. А.А. Фельдбаум впервые в мире построил и теоретически исследовал нелинейную (квадратичную по скорости) обратную связь, доказав, что она обеспечивает предельную величину быстродействия в системе следящего электропривода.
Несколько позже, в 1952 г., А.Я. Лернер опубликовал две работы, в которых было продемонстрировано, что можно существенно улучшить динамические свойства автоматических компенсаторов. В 1955 г. он же высказал идею о том, что в фазовом многомерном пространстве можно выделить особые области, которые характеризуют предельное быстродействие, и построить отвечающие этим областям оптимальные режимы. Такие области получили наименование областей изохрон. Впоследствии, когда Ричард Беллман сформулировал и развил метод динамического программирования, выяснилось, что между областями изохрон и беллмановскими конструкциями существует тесная и органичная связь.
В 1953 г. А.А. Фельдбаум доказал свою знаменитую теорему об n - интервалах. Несколько позже именно этот фундаментальный результат стал отправным пунктом в разработке теории открытого Л.С. Понтрягиным принципа максимума (в общем виде строгое доказательство принципа максимума принадлежит В.Г. Болтянскому).
В 1955 г. на нескольких семинарах в Математическом институте АН СССР, которые шли под руководством Л.С. Понтрягина, Александр Аронович подробно рассказывал о полученных им результатах.
В том же 1955 г. А.А. Фельдбаум рассмотрел общую задачу синтеза оптимальных систем, введя фундаментальное понятие поверхности переключения в фа зовом пространстве. Несколько позже Сун Цзянь, китайский аспирант А.А. Фельд баума, впервые в мире промоделировал эту поверхность переключения на электронно-вычислительной машине. Впоследствии эта модель была использована в быстродействующем следящем устройстве, предназначенном для ведения стрельбы.
В 1959 г. вышла работа А.Г. Бутковского и С.М. Дома ницкого, в которой впервые была исследована и построена система оптимального управления с запаздыванием, предназначенная для управления летучими ножницами прокатного стана.
В 1960 г. в докладах АН СССР и журнале “Автоматика и телемеханика” были опубликованы две работы А.Г. Бутковского и А.Я. Лернера, в которых был предложен широкий класс задач управления, в том числе и оптимального, для случая систем с распределёнными параметрами.
1961 г. был ознаменован выходом в свет двух основополагающих работ В.Ф. Кротова, в которых впервые в теории управления рассматривались разрывные решения и скользящие режимы. Помимо того, что это вносило существенный вклад в развитие аппарата и идеологии самого вариационного исчисления и теории оптимального управления, предложенные В.Ф. Кротовым подходы позволили решить конкретные прикладные задачи, связанные с управлением летательными аппаратами.
В 1962–1963 гг. В.Ф. Кро тов в статьях, опубликованных в журнале “Автоматика и телемеханика”, сформулировал оригинальные достаточные условия абсолютного минимума в вариационном исчислении и в теории оптимального управления для сосредоточенных и распределённых систем. Это был фундаментальный и красивый результат, который позволил предложить оригинальные методы решения вариационных задач.
В 1961 г. вышла работа А.Г. Бутковского, в которой впервые была решена (“до числа”) проблема оптимального управления системой с распределёнными параметрами на примере технической задачи управления многозонной проходной нагревательной печью для нагрева слябов перед прокаткой на лист.
В том же году А.Г. Бутковский сформулировал и доказал принцип максимума для случая систем с распределёнными параметрами, описываемых нелинейными интегральными уравнениями с ограничениями на управления.
В 1963 г. А.Г. Бутковский применил метод бесконечномерной l -проблемы моментов для построения точного и приближённого (в том числе и численного) методов решения задач оптимального управления распределёнными системами. Кроме того, им был сформулирован и доказан так называемый расширенный принцип максимума для задач оптимального управления.
В том же году А.Г. Бутковский впервые построил пример, опровергающий справедливость “естественного” обобщения принципа максимума Понтрягина на дискретные конечномерные системы. Вместо этого был сформулирован и доказан “локальный принцип максимума”. Все эти результаты нашли непосредственное применение в металлургии при разработке систем оптимального управления процессом нагрева. В частности, были разработаны:
система оптимального управления проходными печами;
система оптимального управления режимом прогрева кассовых слитков в колодцах цеха блюминга.
В 1965 г. была опубликована монография А.Г. Бутковского “Теория оптимального управления системами с распределёнными параметрами”, которая, по предложению Р. Беллмана, была переиздана в США на английском языке.
В 1998 г. на Х III Всемирном конгрессе ИФАК в США этот цикл работ был назван наиболее значительным вкладом в теорию управления в период после 1960 г.
Из других результатов А.Г. Бутковского по теории оптимального управления системами с распределёнными параметрами следует отметить циклы работ и монографии по структурной теории распределённых систем, по теории подвижного управления, по теории управления квантовыми системами и процессами, по фазовому портрету дифференциальных включений.
В 90-е годы прошлого столетия А.Г. Бутковский приступил к созданию “Единойгеометрической теории управления”. Результаты этих работ подытожены им в книге “К единой геометрической теории управления”, М.: “Наука”, 2001, написанной в соавторстве с А.В. Бабичевым и С. Похйолайненом (Финляндия).
Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.
Содержание
1.Постановка задачи теории оптимального управления 3
2.Принцип максимума Понтрягина. 4
2.1Формулировка принципа максимума. 4
3.Теорема (принцип максимума Понтрягина). 5
4.Примеры применения принципа максимума. 6
4.1. Простейшая задача оптимального быстродействия. 6
5.О методах решения задач оптимального управления 9
Список литературы 12
Прикрепленные файлы: 1 файл
ehmm.docx
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Государственное образовательное учреждение высшего профессионального образования
КАФЕДРА БУХГАЛТРЕСКОГО УЧЕТА, АНАИЗА И АУДИТА
должность, уч. степень, звание
МАТЕМАТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
по дисциплине: Методы оптимальных решений
Оглавление
1.Постановка задачи теории оптимального управления
Предметом математической теории оптимального управления является методы решения задач, в которых учитываются изменения изучаемых объектов и систем во времени и пространстве при поиске оптимального управления.
Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.
Объектом можно управлять изменяя управляемые параметры ). Состояние объекта изменяется во времени по закону, который связывает функции и :
- некоторая заданная функция, непрерывная вместе со своими частными производными.
Это система обыкновенных дифференциальных уравнений в векторной форме. Она описывает скорость изменения каждой фазовой координаты.
Управление объектом происходит за интервал времени , поэтому параметр .
На управление обычно накладываются условия
где - множество допустимых управлений;
- функции кусочно-непрерывные, т.е. имеют конечное число разрывов первого рода.
Начальное состояние объекта задается функцией .
Критерий качества управления объектом имеет вид (задача Больца):
где и - заданные непрерывно – дифференцируемые функции.
Интегральная часть критерия качества (первое слагаемое) характеризует качество функционирования объекта за весь период управления . Терминальный член (второе слагаемое) характеризует только конечный результат воздействия управления.
Если в задаче моменты времени и известны, то она называется задачей с фиксированным временем. Иначе, это задача с нефиксированным моментом начала и окончания управления.
В задаче необходимо найти такое решение , что ,
где - оптимальный момент окончания процесса;
Задача Лагранже (интегральный критерий).
Рассмотрим ситуацию, когда функционал качества имеет вид
Пусть - новая переменная, тогда (**).
Тогда задача нахождения минимума критерия качества становится задачей определения минимума фазовой координаты в момент времени расширенного векторного пространства по отношению к управлению u.
На конечное положение объекта могут накладываться ограничения вида:
где - дифференцируемые функции.
Воспользуемся методом множителей Лагранжа и составим функцию:
где - неопределенные множители Лагранжа .
Итак, необходимо найти , при котором функционал будет оптимален.
2.Принцип максимума Понтрягина.
Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.
2.1Формулировка принципа максимума.
Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше
При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим
Функция Н называется функцией Гамильтона.
Система линейных дифференциальных уравнений относительно переменных называется сопряженной системой, соответствующей управлению и и траектории х. Здесь
>В более подробной покоординатной записи сопряженная система принимает вид
Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .
Следующая теорема выражает необходимые условия оптимальности в задаче
3.Теорема (принцип максимума Понтрягина).
Пусть функции и, Ф, g1, . gm имеют частные производные по переменным х1, . Хn и непрерывны вместе с этими производными по совокупности аргументов х , и U, t [to. Т]. Предположим, что (и, х)-решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению и и траектории х, и константа такие, что
| | + || (t) || при t [to, Т], и выполняются следующие условия:
а) (условие максимума) при каждом t [to. Т] функция Гамильтона , достигает максимума по при v=u (t), т. е.
H(x(t), u(t), =max H(x(t), v(t), (2.4)
б)(условие трансверсальности на левом конце траектории) существуют числа , такие, что
в) (условие трансверсальности на правом конце траектории) существуют числа такие, что
Центральным в теореме является условие максимума -(2.4).
Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием
и добавить еще одно условие трансверсальности на правом конце траектории:
4.Примеры применения принципа максимума.
4.1. Простейшая задача оптимального быстродействия.
Пусть точка движется по прямой в соответствии с законом
где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию
Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка:
при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.
В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид
Общее решение сопряженной системы
легко выписывается в явном виде
где С, D - постоянные.
Очевидно, что максимум функции Н по и U достигается при
Таким образом, оптимальное управление и может принимать лишь два значения +1 .
2.Определить управление u(t) , которое дает минимум интегралу
, в процессе, описываемом уравнением (1).
Решение.
Введем дополнительную переменную
Для этой переменной имеем дифференциальное уравнение (
с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, можно записать в виде I[T]=x2(T).
Построим функцию Гамильтона
Запишем сопряженную систему
Из поэтому Y2(е)=-1. Теперь функция Гамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2 .
По принципу максимума функция Н при фиксированных х1 и и1 достигает максимума по u : , , откуда .
Осталось решить систему уравнений при условии , и2(Т)=-1,
, с граничными условиями
Сведем данную систему к одному уравнению относительно U.
Добавим к этому уравнению граничные условия и решим его. Составим характеристическое уравнение к2 - (а2+1) =0, к1,2=+(-)
Найдем С1 и С2. С2=-с2е . Тогда
Используя граничные условия найдем С2
Таким образом, определено оптимальное решение
5.О методах решения задач оптимального управления
Убедимся вначале, что необходимые условия оптимальности в форме принципа максимума дают, вообще говоря, достаточную информацию для решения задачи оптимального управления (2.1), (2.2).
Условие максимума (2.4) позволяет, в принципе, найти управление и как функцию параметров х, t,
Рассмотрим систему дифференциальных уравнений
объединяющюю систему уравнений движения объекта и сопряженную систему.
Как известно, общее решение системы (2.8), состоящей из 2n обыкновенных дифференциальных уравнений первого порядка, зависит от 2п параметров. Кроме того, система необходимых условий оптимальности содержит т параметров и параметр y0. Таким образом, общее число неизвестных равно 2n+m+1.
Для их определения мы имеем 2п условий (2.5), (2.6) и т условий (2.2). Еще одно условие определяется из следующих соображений.
Легко понять, что, в силу линейности функции Н по переменным принцип максимума Понтрягина определяет вектор ( ) с точностью до положительного постоянного множителя. Поэтому если в конкретной задаче удается показать, что , то полагают обычно == - 1. В противном случае накладывают какое-либо условие нормировки, например,
Таким образом, общее число условий равно 2n+m+1 и совпадает с числом неизвестных параметров, что, в принципе, позволяет определить эти параметры. Изложенные соображения дают возможность в простейших случаях решить задачу оптимального управления в явном виде.
Опишем численный метод, основанный на тех же соображениях. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5), (2.6), а также выписанными на основе (2.2) краевыми условиями
Эта задача называется краевой задачей принципа максимума.
Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти х(Т), (Т). При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр задан и равен либо 0, либо -1).
Значения х (Г), являются очевидно, некоторыми функциями от а и Ь:
). Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений
Эта система содержит 2п+т неизвестных а, Ь, и состоит из 2п+т уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.
Отметим, что вычисление значений весьма трудоемко, так как требует при каждом (а, b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов .
При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т. п.
Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно).
Авторстудент группы ПС–192
Оглавление
ВВЕДЕНИЕ 4
1.РОЛЬ МЕТОДОВ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ 5
1.1 Методы автоматического управления 6
1.2Общая задача оптимального управления и ее математическая 16
модель 16
1.3Классификация методов теории оптимальных процессов 19
1.4 Необходимые условия оптимальностиуправления, достаточные условия оптимальности и проблема существования оптимального управления 21
1.5 Общая характеристика результатов, которые могут быть получены методами теории оптимального управления 23
1.6 Условие рационального применения методов оптимизации 24
2. РЕШЕНИЕ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДЛЯ ДИНАМИЧЕСКИХ СИСТЕМ 26
2.1 Инженерный подход подбора для решения задачи 27
2.2Аналитический подход определения оптимального управления 29
2.2.1 Метод неопределенных множителей Лагранжа 29
2.2.2 Принцип оптимальности Понтрягина 32
2.2.3 Принцип оптимальности Беллмана 33
2.3 Метод динамического программирования 34
ЗАКЛЮЧЕНИЕ 39
Список литературы 40
ВВЕДЕНИЕ
Развитие теории оптимального управления связано с ростом требований как к быстродействию иточности систем регулирования, так и переходом к рыночной экономике. Увеличение быстродействия возможно лишь при правильном распределении ограниченных ресурсов управления, и поэтому учет ограничений на управление стал одним из центральных в теории оптимального управления. С другой стороны, построение систем регулирования высокой точности привело к необходимости учета при синтезе регуляторов взаимовлиянияотдельных частей (каналов) системы. Синтез таких сложных многомерных (многосвязных) систем также составляет предмет теории оптимального управления.
К настоящему времени построена математическая теория оптимального управления. На ее основе разработаны способы построения оптимальных по быстродействию систем и процедуры аналитического конструирования оптимальных регуляторов. Аналитическоеконструирование регуляторов вместе с теорией оптимальных наблюдателей (оптимальных фильтров) образуют совокупность методов, которые широко используются при проектировании современных сложных систем регулирования.
Задачи оптимального управления для моделей сложного теплообмена в рассеивающих средах с отражающими границами представляют интерес в связи с инженерными приложениями. Большое число работ посвященоисследованию задач управления для нестационарных моделей сложного теплообмена, в которых для описания температурного поля используется нестационарное уравнение теплопроводности, а для моделирования излучения — стационарное диффузионное приближение уравнения переноса излучения.
1.РОЛЬ МЕТОДОВ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ
В общем процессе проектирования технических систем можно видеть проблемыдвух типов.
1 Проектирование системы управления, направленной на достижение поставленной задачи (формирование траекторий, режимов, выбор методов управления, реализующих траектории и т.д.). Этот круг задач можно назвать проектированием движений.
2 Проектирование конструктивных и прочностных схем (выбор геометрических, аэродинамических, конструктивных и других параметров), обеспечивающих выполнениеобщих характеристик и конкретных режимов работы. Этот круг задач проектирования связан с выбором ресурсов, необходимых для реализации поставленных задач.
Проектирование движений (изменение технологических параметров) тесно связано с группой проблем второго типа, так как получаемая при проектировании движений информация является исходной (во многом.
Читайте также: