Теория оптимального управления доклад

Обновлено: 15.05.2024

ОПТИМА́ЛЬНОЕ УПРАВЛЕ́НИЕ, 1) в ав­то­ма­ти­за­ции – управ­ле­ние, ко­то­рое обес­пе­чи­ва­ет дос­ти­же­ние це­ли при сле­дую­щих ус­ло­ви­ях: по­лу­че­ние экс­тре­маль­но­го зна­че­ния за­дан­но­го кри­те­рия (по­ка­за­те­ля) ка­че­ст­ва управ­ле­ния и со­блю­де­ние ог­ра­ни­че­ний на управ­ляю­щие воз­дей­ст­вия и вы­ход­ные ве­ли­чи­ны (фа­зо­вые ко­ор­ди­на­ты). О. у. ши­ро­ко при­ме­ня­ет­ся для ре­ше­ния при­клад­ных тех­ни­че­ских (напр., кос­мич. на­ви­га­ция, ре­гу­ли­ро­ва­ние тех­но­ло­гич. про­цес­сов), эко­но­ми­че­ских (фор­ми­ро­ва­ние оп­ти­маль­но­го пла­на раз­ви­тия пред­при­ятия и др.), транс­порт­ных (напр., вы­бор наи­бо­лее эко­но­мич­ных мар­шру­тов пе­ре­воз­ки гру­зов) и др. за­дач. При по­ста­нов­ке за­да­чи О. у. не­об­хо­ди­мо учи­ты­вать ряд осо­бен­но­стей. О. у. при­ме­ня­ет­ся при управ­ле­нии ди­на­мич. про­цес­са­ми в объ­ек­те, а имен­но про­цес­са­ми пе­ре­во­да зна­че­ний за­дан­ных фа­зо­вых ко­ор­ди­нат объ­ек­та из не­ко­то­ро­го на­чаль­но­го в за­дан­ное ко­неч­ное со­стоя­ние. О. у. мо­жет быть реа­ли­зо­ва­но толь­ко при за­да­нии од­но­го кри­те­рия ка­че­ст­ва. Это, как пра­ви­ло, ха­рак­те­ри­сти­ка тра­ек­то­рии из­ме­не­ния фа­зо­вых ко­ор­ди­нат (за­дан­ная функ­цио­на­лом), за­ви­ся­щая от па­ра­мет­ров управ­ляю­щих воз­дей­ст­вий. За­да­ча О. у. за­клю­ча­ет­ся в на­хож­де­нии сре­ди мно­же­ст­ва воз­мож­ных тра­ек­то­рий дви­же­ния фа­зо­вых ко­ор­ди­нат (со­от­вет­ст­вую­щих до­сти­же­нию це­ли управ­ле­ния) та­кой тра­ек­то­рии (экс­тре­ма­ли), на ко­то­рой кри­те­рий ка­че­ст­ва при­ни­ма­ет экс­тре­маль­ное (ми­ним. или макс.) зна­че­ние. По­ка­за­те­ля­ми ка­че­ст­ва функ­цио­ни­ро­ва­ния объ­ек­тов управ­ле­ния мо­гут быть, напр., сред­нее или макс. от­кло­не­ние па­ра­мет­ров тех­нич. сис­те­мы от за­дан­ных зна­че­ний, объ­ём вы­хо­да го­то­вой про­дук­ции, за­тра­ты ма­те­риа­лов, энер­гии и др. ре­сур­сов на еди­ни­цу го­то­вой про­дук­ции. Кро­ме то­го, при по­ста­нов­ке за­да­чи О. у. долж­ны быть ука­за­ны ог­ра­ни­че­ния на из­ме­не­ния управ­ляю­щих воз­дей­ст­вий и фа­зо­вых ко­ор­ди­нат. Раз­ли­ча­ют без­ус­лов­ные и ус­лов­ные ог­ра­ниче­ния. К без­ус­лов­ным от­но­сят ог­ра­ни­че­ния та­ких ко­ор­ди­нат, ко­то­рые не мо­гут быть на­ру­ше­ны в си­лу кон­ст­рук­тив­ных и/или фи­зич. осо­бен­но­стей объ­ек­та управ­ле­ния. Ча­ще все­го к ним от­но­сят ог­ра­ни­че­ния на управ­ляю­щие воз­дей­ст­вия. Напр., для элек­тро­при­во­да это на­пря­же­ние элек­тро­се­ти, для са­мо­лё­тов – уг­лы по­во­ро­та ру­ле­вых уст­ройств. К ус­лов­ным ог­ра­ни­че­ни­ям от­но­сят ог­ра­ни­че­ния, ко­то­рые мо­гут, но не долж­ны быть по к.-л. ус­ло­ви­ям на­ру­шены при управ­ле­нии объ­ек­том. Напр., при­ме­няя элек­тро­при­вод для пе­ре­ме­ще­ния ка­би­ны лиф­та, не­об­хо­ди­мо ог­ра­ни­чи­вать ус­ко­ре­ние раз­го­на и тор­мо­же­ния ка­би­ны с учё­том фи­зио­ло­гич. воз­мож­но­стей пас­са­жи­ров. О. у. так­же тре­бу­ет зна­ния ма­те­ма­тич. мо­де­ли объ­ек­та, т. е. ма­те­ма­тич. за­ви­си­мо­стей, свя­зы­ваю­щих управ­ляю­щие воз­дей­ст­вия, вы­ход­ные и ог­ра­ни­чи­вае­мые ко­ор­ди­на­ты.

Становление и развитие теории оптимального управления, её успешные применения в самых различных областях науки, техники и промышленности в немалой степени связаны с фундаментальным вкладом сотрудников Института проблем управления.

Ещё в 1949 г. А.А. Фельдбаум впервые в мире построил и теоретически исследовал нелинейную (квадратичную по скорости) обратную связь, доказав, что она обеспечивает предельную величину быстродействия в системе следящего электропривода.

Несколько позже, в 1952 г., А.Я. Лернер опубликовал две работы, в которых было продемонстрировано, что можно существенно улучшить динамические свойства автоматических компенсаторов. В 1955 г. он же высказал идею о том, что в фазовом многомерном пространстве можно выделить особые области, которые характеризуют предельное быстродействие, и построить отвечающие этим областям оптимальные режимы. Такие области получили наименование областей изохрон. Впоследствии, когда Ричард Беллман сформулировал и развил метод динамического программирования, выяснилось, что между областями изохрон и беллмановскими конструкциями существует тесная и органичная связь.

В 1953 г. А.А. Фельдбаум доказал свою знаменитую теорему об n - интервалах. Несколько позже именно этот фундаментальный результат стал отправным пунктом в разработке теории открытого Л.С. Понтрягиным принципа максимума (в общем виде строгое доказательство принципа максимума принадлежит В.Г. Болтянскому).

В 1955 г. на нескольких семинарах в Математическом институте АН СССР, которые шли под руководством Л.С. Понтрягина, Александр Аронович подробно рассказывал о полученных им результатах.

В том же 1955 г. А.А. Фельдбаум рассмотрел общую задачу синтеза оптимальных систем, введя фундаментальное понятие поверхности переключения в фа зовом пространстве. Несколько позже Сун Цзянь, китайский аспирант А.А. Фельд баума, впервые в мире промоделировал эту поверхность переключения на электронно-вычислительной машине. Впоследствии эта модель была использована в быстродействующем следящем устройстве, предназначенном для ведения стрельбы.

В 1959 г. вышла работа А.Г. Бутковского и С.М. Дома ницкого, в которой впервые была исследована и построена система оптимального управления с запаздыванием, предназначенная для управления летучими ножницами прокатного стана.

В 1960 г. в докладах АН СССР и журнале “Автоматика и телемеханика” были опубликованы две работы А.Г. Бутковского и А.Я. Лернера, в которых был предложен широкий класс задач управления, в том числе и оптимального, для случая систем с распределёнными параметрами.

1961 г. был ознаменован выходом в свет двух основополагающих работ В.Ф. Кротова, в которых впервые в теории управления рассматривались разрывные решения и скользящие режимы. Помимо того, что это вносило существенный вклад в развитие аппарата и идеологии самого вариационного исчисления и теории оптимального управления, предложенные В.Ф. Кротовым подходы позволили решить конкретные прикладные задачи, связанные с управлением летательными аппаратами.

В 1962–1963 гг. В.Ф. Кро тов в статьях, опубликованных в журнале “Автоматика и телемеханика”, сформулировал оригинальные достаточные условия абсолютного минимума в вариационном исчислении и в теории оптимального управления для сосредоточенных и распределённых систем. Это был фундаментальный и красивый результат, который позволил предложить оригинальные методы решения вариационных задач.

В 1961 г. вышла работа А.Г. Бутковского, в которой впервые была решена (“до числа”) проблема оптимального управления системой с распределёнными параметрами на примере технической задачи управления многозонной проходной нагревательной печью для нагрева слябов перед прокаткой на лист.

В том же году А.Г. Бутковский сформулировал и доказал принцип максимума для случая систем с распределёнными параметрами, описываемых нелинейными интегральными уравнениями с ограничениями на управления.

В 1963 г. А.Г. Бутковский применил метод бесконечномерной l -проблемы моментов для построения точного и приближённого (в том числе и численного) методов решения задач оптимального управления распределёнными системами. Кроме того, им был сформулирован и доказан так называемый расширенный принцип максимума для задач оптимального управления.

В том же году А.Г. Бутковский впервые построил пример, опровергающий справедливость “естественного” обобщения принципа максимума Понтрягина на дискретные конечномерные системы. Вместо этого был сформулирован и доказан “локальный принцип максимума”. Все эти результаты нашли непосредственное применение в металлургии при разработке систем оптимального управления процессом нагрева. В частности, были разработаны:

система оптимального управления проходными печами;

система оптимального управления режимом прогрева кассовых слитков в колодцах цеха блюминга.

В 1965 г. была опубликована монография А.Г. Бутковского “Теория оптимального управления системами с распределёнными параметрами”, которая, по предложению Р. Беллмана, была переиздана в США на английском языке.

В 1998 г. на Х III Всемирном конгрессе ИФАК в США этот цикл работ был назван наиболее значительным вкладом в теорию управления в период после 1960 г.

Из других результатов А.Г. Бутковского по теории оптимального управления системами с распределёнными параметрами следует отметить циклы работ и монографии по структурной теории распределённых систем, по теории подвижного управления, по теории управления квантовыми системами и процессами, по фазовому портрету дифференциальных включений.

В 90-е годы прошлого столетия А.Г. Бутковский приступил к созданию “Единойгеометрической теории управления”. Результаты этих работ подытожены им в книге “К единой геометрической теории управления”, М.: “Наука”, 2001, написанной в соавторстве с А.В. Бабичевым и С. Похйолайненом (Финляндия).

Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.

Содержание

1.Постановка задачи теории оптимального управления 3
2.Принцип максимума Понтрягина. 4
2.1Формулировка принципа максимума. 4
3.Теорема (принцип максимума Понтрягина). 5
4.Примеры применения принципа максимума. 6
4.1. Простейшая задача оптимального быстродействия. 6
5.О методах решения задач оптимального управления 9
Список литературы 12

Прикрепленные файлы: 1 файл

ehmm.docx

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего профессионального образования

КАФЕДРА БУХГАЛТРЕСКОГО УЧЕТА, АНАИЗА И АУДИТА

должность, уч. степень, звание

МАТЕМАТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

по дисциплине: Методы оптимальных решений

Оглавление

1.Постановка задачи теории оптимального управления

Предметом математической теории оптимального управления является методы решения задач, в которых учитываются изменения изучаемых объектов и систем во времени и пространстве при поиске оптимального управления.

Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.

Объектом можно управлять изменяя управляемые параметры ). Состояние объекта изменяется во времени по закону, который связывает функции и :

- некоторая заданная функция, непрерывная вместе со своими частными производными.

Это система обыкновенных дифференциальных уравнений в векторной форме. Она описывает скорость изменения каждой фазовой координаты.

Управление объектом происходит за интервал времени , поэтому параметр .

На управление обычно накладываются условия

где - множество допустимых управлений;

- функции кусочно-непрерывные, т.е. имеют конечное число разрывов первого рода.

Начальное состояние объекта задается функцией .

Критерий качества управления объектом имеет вид (задача Больца):

где и - заданные непрерывно – дифференцируемые функции.

Интегральная часть критерия качества (первое слагаемое) характеризует качество функционирования объекта за весь период управления . Терминальный член (второе слагаемое) характеризует только конечный результат воздействия управления.

Если в задаче моменты времени и известны, то она называется задачей с фиксированным временем. Иначе, это задача с нефиксированным моментом начала и окончания управления.

В задаче необходимо найти такое решение , что ,

где - оптимальный момент окончания процесса;

Задача Лагранже (интегральный критерий).

Рассмотрим ситуацию, когда функционал качества имеет вид

Пусть - новая переменная, тогда (**).

Тогда задача нахождения минимума критерия качества становится задачей определения минимума фазовой координаты в момент времени расширенного векторного пространства по отношению к управлению u.

На конечное положение объекта могут накладываться ограничения вида:

где - дифференцируемые функции.

Воспользуемся методом множителей Лагранжа и составим функцию:

где - неопределенные множители Лагранжа .

Итак, необходимо найти , при котором функционал будет оптимален.

2.Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

2.1Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

Функция Н называется функцией Гамильтона.
Система линейных дифференциальных уравнений относительно переменных называется сопряженной системой, соответствующей управлению и и траектории х. Здесь

>В более подробной покоординатной записи сопряженная система принимает вид

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче

3.Теорема (принцип максимума Понтрягина).

Пусть функции и, Ф, g1, . gm имеют частные производные по переменным х1, . Хn и непрерывны вместе с этими производными по совокупности аргументов х , и U, t [to. Т]. Предположим, что (и, х)-решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению и и траектории х, и константа такие, что

| | + || (t) || при t [to, Т], и выполняются следующие условия:

а) (условие максимума) при каждом t [to. Т] функция Гамильтона , достигает максимума по при v=u (t), т. е.

H(x(t), u(t), =max H(x(t), v(t), (2.4)

б)(условие трансверсальности на левом конце траектории) существуют числа , такие, что

в) (условие трансверсальности на правом конце траектории) существуют числа такие, что

Центральным в теореме является условие максимума -(2.4).
Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием

и добавить еще одно условие трансверсальности на правом конце траектории:

4.Примеры применения принципа максимума.

4.1. Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом

где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию

Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка:

при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.

В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид

Общее решение сопряженной системы

легко выписывается в явном виде

где С, D - постоянные.

Очевидно, что максимум функции Н по и U достигается при

Таким образом, оптимальное управление и может принимать лишь два значения +1 .

2.Определить управление u(t) , которое дает минимум интегралу

, в процессе, описываемом уравнением (1).
Решение.
Введем дополнительную переменную

Для этой переменной имеем дифференциальное уравнение (

с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, можно записать в виде I[T]=x2(T).

Построим функцию Гамильтона

Запишем сопряженную систему

Из поэтому Y2(е)=-1. Теперь функция Гамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2 .

По принципу максимума функция Н при фиксированных х1 и и1 достигает максимума по u : , , откуда .

Осталось решить систему уравнений при условии , и2(Т)=-1,

, с граничными условиями

Сведем данную систему к одному уравнению относительно U.

Добавим к этому уравнению граничные условия и решим его. Составим характеристическое уравнение к2 - (а2+1) =0, к1,2=+(-)

Найдем С1 и С2. С2=-с2е . Тогда

Используя граничные условия найдем С2

Таким образом, определено оптимальное решение

5.О методах решения задач оптимального управления

Убедимся вначале, что необходимые условия оптимальности в форме принципа максимума дают, вообще говоря, достаточную информацию для решения задачи оптимального управления (2.1), (2.2).

Условие максимума (2.4) позволяет, в принципе, найти управление и как функцию параметров х, t,

Рассмотрим систему дифференциальных уравнений

объединяющюю систему уравнений движения объекта и сопряженную систему.

Как известно, общее решение системы (2.8), состоящей из 2n обыкновенных дифференциальных уравнений первого порядка, зависит от 2п параметров. Кроме того, система необходимых условий оптимальности содержит т параметров и параметр y0. Таким образом, общее число неизвестных равно 2n+m+1.

Для их определения мы имеем 2п условий (2.5), (2.6) и т условий (2.2). Еще одно условие определяется из следующих соображений.

Легко понять, что, в силу линейности функции Н по переменным принцип максимума Понтрягина определяет вектор ( ) с точностью до положительного постоянного множителя. Поэтому если в конкретной задаче удается показать, что , то полагают обычно == - 1. В противном случае накладывают какое-либо условие нормировки, например,

Таким образом, общее число условий равно 2n+m+1 и совпадает с числом неизвестных параметров, что, в принципе, позволяет определить эти параметры. Изложенные соображения дают возможность в простейших случаях решить задачу оптимального управления в явном виде.

Опишем численный метод, основанный на тех же соображениях. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5), (2.6), а также выписанными на основе (2.2) краевыми условиями

Эта задача называется краевой задачей принципа максимума.

Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти х(Т), (Т). При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр задан и равен либо 0, либо -1).

Значения х (Г), являются очевидно, некоторыми функциями от а и Ь:

). Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений

Эта система содержит 2п+т неизвестных а, Ь, и состоит из 2п+т уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.

Отметим, что вычисление значений весьма трудоемко, так как требует при каждом (а, b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов .

При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т. п.

Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно).

Авторстудент группы ПС–192

Оглавление
ВВЕДЕНИЕ 4
1.РОЛЬ МЕТОДОВ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ 5
1.1 Методы автоматического управления 6
1.2Общая задача оптимального управления и ее математическая 16
модель 16
1.3Классификация методов теории оптимальных процессов 19
1.4 Необходимые условия оптимальностиуправления, достаточные условия оптимальности и проблема существования оптимального управления 21
1.5 Общая характеристика результатов, которые могут быть получены методами теории оптимального управления 23
1.6 Условие рационального применения методов оптимизации 24
2. РЕШЕНИЕ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДЛЯ ДИНАМИЧЕСКИХ СИСТЕМ 26
2.1 Инженерный подход подбора для решения задачи 27
2.2Аналитический подход определения оптимального управления 29
2.2.1 Метод неопределенных множителей Лагранжа 29
2.2.2 Принцип оптимальности Понтрягина 32
2.2.3 Принцип оптимальности Беллмана 33
2.3 Метод динамического программирования 34
ЗАКЛЮЧЕНИЕ 39
Список литературы 40


ВВЕДЕНИЕ
Развитие теории оптимального управления связано с ростом требований как к быстродействию иточности систем регу­лирования, так и переходом к рыночной экономике. Увеличение быстродействия возможно лишь при правильном распреде­лении ограниченных ресурсов управления, и поэтому учет ограничений на управление стал одним из центральных в теории оптимального управления. С другой стороны, построение систем регулирования высокой точности привело к необходимости учета при синтезе регуляторов взаимовлиянияотдельных частей (каналов) системы. Синтез таких сложных многомерных (многосвязных) систем также составляет предмет теории оптимального управления.
К настоящему времени построена математическая теория оптимального управления. На ее основе разработаны способы построения оптимальных по быстродействию систем и процедуры аналитического конструирования оптимальных регулято­ров. Аналитическоеконструирование регуляторов вместе с теорией оптимальных наблюдателей (оптимальных фильтров) образуют совокупность методов, которые широко используются при проектировании современных сложных систем регули­рования.
Задачи оптимального управления для моделей сложного теплообмена в рассеивающих средах с отражающими границами представляют интерес в связи с инженерными приложениями. Большое число работ посвященоисследованию задач управления для нестационарных моделей сложного теплообмена, в которых для описания температурного поля используется нестационарное уравнение теплопроводности, а для моделирования излучения — стационарное диффузионное приближение уравнения переноса излучения.


1.РОЛЬ МЕТОДОВ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ
В общем процессе проектирования технических систем можно видеть проблемыдвух типов.
1 Проектирование системы управления, направленной на достижение поставленной задачи (формирование траекто­рий, режимов, выбор методов управления, реализующих траектории и т.д.). Этот круг задач можно назвать проектированием движений.
2 Проектирование конструктивных и прочностных схем (выбор геометрических, аэродинамических, конструктивных и других параметров), обеспечивающих выполнениеобщих характеристик и конкретных режимов работы. Этот круг задач проектирования связан с выбором ресурсов, необходимых для реализации поставленных задач.
Проектирование движений (изменение технологических параметров) тесно связано с группой проблем второго типа, так как получаемая при проектировании движений информация является исходной (во многом.

Читайте также: