Реферат теория оптимального управления

Обновлено: 05.07.2024

Актуальность работы обусловлена тем, что вопросами изучения оптимального управления организацией в современных условиях развития общества занимается множество ученых на сегодняшний день.
Современной теории и практике оптимального управления посвящены исследования широкого круга ученых, таких как Мильор Р. Г., Веснин В. Р., Алехина О. Ф., Кибанов А. Я.. Зарубежный опыт современного управления анализируется в трудах Шиверской М. Р., Попова А. В., Коно Т., Губенко М.. Тем не менее необходимым является поиск перспективных концептуальных подходов к улучшению управления, которые способствовали бы ликвидации стереотипов в управлении и мышлении


1.Понятие и принципы оптимального управления

Под оптимальным управлением понимается применение такого управляющего воздействия xY(t), которое обеспечивает достижение наилучшего значения какого-либо заранее обусловленного показателя качества управления объектом. Чаще всего такими показателями бывают быстродействие (время, затрачиваемое на перевод объекта в заданное состояние, являющееся целью управления), минимум энергетических затрат (суммарной энергии, затрачиваемой управляющим устройством на перевод объекта в заданное состояние) или минимальная погрешность воспроизведения следящей системой заданного сигнала при наличии мешающих возмущений (помех)
Оптимальное управление строится на ряде принципов, среди которых:
1.рациональность
2.комплексный охват
3.целевая направленность и т.д.
В соответствии с этим принципом управление должно быть наилучшим. Можно выделить два типа задач оптимального управления:
· оптимизация конечного состояния объекта управления. Исследуется и оптимизируется конечное состояние объекта, каким "путем" объект пришел в это состояние не учитывается. Задачи этого типа получили распространение в системах организационного и социально – экономического управления. Например, задача планирования выпуска продукции. Решаются такие задачи с использованием методов математического программирования (метода исследования операций).
· оптимизация динамики (переходного процесса) состояния объекта управления. Рассматривается траектория переходного процесса, а конечный результат не представляет интереса. Эти задачи наиболее применимы в технике и при управлении технологическими процессами. Решаются они на основе вариационного исчисления, таких методов, как принцип максимума Понтрягина, Беллмана и др.

2.Применение принципов оптимального управления в решении производственных задач

Существует большое количество задач, в которых нужно найти условный экстремум

Зарегистрируйся, чтобы продолжить изучение работы

Актуальность работы обусловлена тем, что вопросами изучения оптимального управления организацией в современных условиях развития общества занимается множество ученых на сегодняшний день.
Современной теории и практике оптимального управления посвящены исследования широкого круга ученых, таких как Мильор Р. Г., Веснин В. Р., Алехина О. Ф., Кибанов А. Я.. Зарубежный опыт современного управления анализируется в трудах Шиверской М. Р., Попова А. В., Коно Т., Губенко М.. Тем не менее необходимым является поиск перспективных концептуальных подходов к улучшению управления, которые способствовали бы ликвидации стереотипов в управлении и мышлении


1.Понятие и принципы оптимального управления

Под оптимальным управлением понимается применение такого управляющего воздействия xY(t), которое обеспечивает достижение наилучшего значения какого-либо заранее обусловленного показателя качества управления объектом. Чаще всего такими показателями бывают быстродействие (время, затрачиваемое на перевод объекта в заданное состояние, являющееся целью управления), минимум энергетических затрат (суммарной энергии, затрачиваемой управляющим устройством на перевод объекта в заданное состояние) или минимальная погрешность воспроизведения следящей системой заданного сигнала при наличии мешающих возмущений (помех)
Оптимальное управление строится на ряде принципов, среди которых:
1.рациональность
2.комплексный охват
3.целевая направленность и т.д.
В соответствии с этим принципом управление должно быть наилучшим. Можно выделить два типа задач оптимального управления:
· оптимизация конечного состояния объекта управления. Исследуется и оптимизируется конечное состояние объекта, каким "путем" объект пришел в это состояние не учитывается. Задачи этого типа получили распространение в системах организационного и социально – экономического управления. Например, задача планирования выпуска продукции. Решаются такие задачи с использованием методов математического программирования (метода исследования операций).
· оптимизация динамики (переходного процесса) состояния объекта управления. Рассматривается траектория переходного процесса, а конечный результат не представляет интереса. Эти задачи наиболее применимы в технике и при управлении технологическими процессами. Решаются они на основе вариационного исчисления, таких методов, как принцип максимума Понтрягина, Беллмана и др.

2.Применение принципов оптимального управления в решении производственных задач

Существует большое количество задач, в которых нужно найти условный экстремум . Они получаются при появлении в теореме Ферма дополнительных условий или ограничений. Принцип оптимальности Лагранжа является развитием задачи нахождения условного и безусловного экстремумов, в которой отыскивается вид оптимальной функции управления. Пусть в рассматриваемой системе функция u(t) характеризует управляющий сигнал от времени, y(t) – выходной сигнал системы, характеризующий в определенном смысле ее траекторию. Пусть критерий оптимальности имеет вид
(1)

Формула (1) характеризует тенденцию к минимизации энергетических затрат наведения при управлении объектом по времени от t0 до tk. Требуется определить такие значения u(t), y(t), которые при подстановке в интеграл (1) дадут минимальное значение функции I(u(t), y(t)).
В задаче заданы два ограничения или дополнительные условия конечных состояний системы
(2)
В такой задаче нельзя ограничиваться конечным состоянием функций (2). Так как определяется вид оптимальной функции, то необходимо задать ограничения на скорость изменения функций рассматриваемого функционала. Таким образом, задаются ограничения по скорости изменения функций в виде дифференциальных уравнений.

Для решения дифференциальных уравнений необходимо задать дополнительные условия. Пусть заданы начальные условия
(4)
Рассмотрим алгоритм решения задачи Лагранжа в общем виде.
Составляется функция Лагранжа. Очень часто эту функцию называют - функционалом:
(5)
Составляется функционал Гамильтона H, который учитывает ограничения по скорости изменения рассматриваемых функций
(6)
где - неизвестные функции от времени, которые называются неопределенными множителями. Для определения этих функций воспользуемся модифицированной теоремой Ферма:
Пусть функционал H( ,y, u) дифференцируем по u , существует экстремум функционала в точке и соответствующий вектор y ˆ(t) является оптимальным, т.е. доставляет экстремум гамильтониану H . Тогда можно найти такие оптимальные значения что экстремум функционала H совпадет с минимальным значением функционала I(y, u).
Иначе говоря, у этих функционалов оптимальный вид функций y ˆ(t) и u ˆ(t) совпадают

Авторстудент группы ПС–192

Оглавление
ВВЕДЕНИЕ 4
1.РОЛЬ МЕТОДОВ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ 5
1.1 Методы автоматического управления 6
1.2Общая задача оптимального управления и ее математическая 16
модель 16
1.3Классификация методов теории оптимальных процессов 19
1.4 Необходимые условия оптимальностиуправления, достаточные условия оптимальности и проблема существования оптимального управления 21
1.5 Общая характеристика результатов, которые могут быть получены методами теории оптимального управления 23
1.6 Условие рационального применения методов оптимизации 24
2. РЕШЕНИЕ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДЛЯ ДИНАМИЧЕСКИХ СИСТЕМ 26
2.1 Инженерный подход подбора для решения задачи 27
2.2Аналитический подход определения оптимального управления 29
2.2.1 Метод неопределенных множителей Лагранжа 29
2.2.2 Принцип оптимальности Понтрягина 32
2.2.3 Принцип оптимальности Беллмана 33
2.3 Метод динамического программирования 34
ЗАКЛЮЧЕНИЕ 39
Список литературы 40


ВВЕДЕНИЕ
Развитие теории оптимального управления связано с ростом требований как к быстродействию иточности систем регу­лирования, так и переходом к рыночной экономике. Увеличение быстродействия возможно лишь при правильном распреде­лении ограниченных ресурсов управления, и поэтому учет ограничений на управление стал одним из центральных в теории оптимального управления. С другой стороны, построение систем регулирования высокой точности привело к необходимости учета при синтезе регуляторов взаимовлиянияотдельных частей (каналов) системы. Синтез таких сложных многомерных (многосвязных) систем также составляет предмет теории оптимального управления.
К настоящему времени построена математическая теория оптимального управления. На ее основе разработаны способы построения оптимальных по быстродействию систем и процедуры аналитического конструирования оптимальных регулято­ров. Аналитическоеконструирование регуляторов вместе с теорией оптимальных наблюдателей (оптимальных фильтров) образуют совокупность методов, которые широко используются при проектировании современных сложных систем регули­рования.
Задачи оптимального управления для моделей сложного теплообмена в рассеивающих средах с отражающими границами представляют интерес в связи с инженерными приложениями. Большое число работ посвященоисследованию задач управления для нестационарных моделей сложного теплообмена, в которых для описания температурного поля используется нестационарное уравнение теплопроводности, а для моделирования излучения — стационарное диффузионное приближение уравнения переноса излучения.


1.РОЛЬ МЕТОДОВ ТЕОРИИ ОПТИМАЛЬНЫХ ПРОЦЕССОВ
В общем процессе проектирования технических систем можно видеть проблемыдвух типов.
1 Проектирование системы управления, направленной на достижение поставленной задачи (формирование траекто­рий, режимов, выбор методов управления, реализующих траектории и т.д.). Этот круг задач можно назвать проектированием движений.
2 Проектирование конструктивных и прочностных схем (выбор геометрических, аэродинамических, конструктивных и других параметров), обеспечивающих выполнениеобщих характеристик и конкретных режимов работы. Этот круг задач проектирования связан с выбором ресурсов, необходимых для реализации поставленных задач.
Проектирование движений (изменение технологических параметров) тесно связано с группой проблем второго типа, так как получаемая при проектировании движений информация является исходной (во многом.

Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.

Содержание

1.Постановка задачи теории оптимального управления 3
2.Принцип максимума Понтрягина. 4
2.1Формулировка принципа максимума. 4
3.Теорема (принцип максимума Понтрягина). 5
4.Примеры применения принципа максимума. 6
4.1. Простейшая задача оптимального быстродействия. 6
5.О методах решения задач оптимального управления 9
Список литературы 12

Прикрепленные файлы: 1 файл

ehmm.docx

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего профессионального образования

КАФЕДРА БУХГАЛТРЕСКОГО УЧЕТА, АНАИЗА И АУДИТА

должность, уч. степень, звание

МАТЕМАТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

по дисциплине: Методы оптимальных решений

Оглавление

1.Постановка задачи теории оптимального управления

Предметом математической теории оптимального управления является методы решения задач, в которых учитываются изменения изучаемых объектов и систем во времени и пространстве при поиске оптимального управления.

Рассмотрим динамический объект, состояние которого в каждый момент времени t описывается несколькими величинами , которые называются фазовыми координатами, т.е. имеем вектор . Пример, положение самолета как твердого тела в пространстве полностью определяет шестимерная вектор-функция времени. Три координаты определяют положение центра масс, а три – определяют вращение вокруг центра масс.

Объектом можно управлять изменяя управляемые параметры ). Состояние объекта изменяется во времени по закону, который связывает функции и :

- некоторая заданная функция, непрерывная вместе со своими частными производными.

Это система обыкновенных дифференциальных уравнений в векторной форме. Она описывает скорость изменения каждой фазовой координаты.

Управление объектом происходит за интервал времени , поэтому параметр .

На управление обычно накладываются условия

где - множество допустимых управлений;

- функции кусочно-непрерывные, т.е. имеют конечное число разрывов первого рода.

Начальное состояние объекта задается функцией .

Критерий качества управления объектом имеет вид (задача Больца):

где и - заданные непрерывно – дифференцируемые функции.

Интегральная часть критерия качества (первое слагаемое) характеризует качество функционирования объекта за весь период управления . Терминальный член (второе слагаемое) характеризует только конечный результат воздействия управления.

Если в задаче моменты времени и известны, то она называется задачей с фиксированным временем. Иначе, это задача с нефиксированным моментом начала и окончания управления.

В задаче необходимо найти такое решение , что ,

где - оптимальный момент окончания процесса;

Задача Лагранже (интегральный критерий).

Рассмотрим ситуацию, когда функционал качества имеет вид

Пусть - новая переменная, тогда (**).

Тогда задача нахождения минимума критерия качества становится задачей определения минимума фазовой координаты в момент времени расширенного векторного пространства по отношению к управлению u.

На конечное положение объекта могут накладываться ограничения вида:

где - дифференцируемые функции.

Воспользуемся методом множителей Лагранжа и составим функцию:

где - неопределенные множители Лагранжа .

Итак, необходимо найти , при котором функционал будет оптимален.

2.Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

2.1Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

Функция Н называется функцией Гамильтона.
Система линейных дифференциальных уравнений относительно переменных называется сопряженной системой, соответствующей управлению и и траектории х. Здесь

>В более подробной покоординатной записи сопряженная система принимает вид

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче

3.Теорема (принцип максимума Понтрягина).

Пусть функции и, Ф, g1, . gm имеют частные производные по переменным х1, . Хn и непрерывны вместе с этими производными по совокупности аргументов х , и U, t [to. Т]. Предположим, что (и, х)-решение задачи (2.1). Тогда существует решение сопряженной системы (2.3), соответствующей управлению и и траектории х, и константа такие, что

| | + || (t) || при t [to, Т], и выполняются следующие условия:

а) (условие максимума) при каждом t [to. Т] функция Гамильтона , достигает максимума по при v=u (t), т. е.

H(x(t), u(t), =max H(x(t), v(t), (2.4)

б)(условие трансверсальности на левом конце траектории) существуют числа , такие, что

в) (условие трансверсальности на правом конце траектории) существуют числа такие, что

Центральным в теореме является условие максимума -(2.4).
Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием

и добавить еще одно условие трансверсальности на правом конце траектории:

4.Примеры применения принципа максимума.

4.1. Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом

где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию

Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка:

при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.

В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид

Общее решение сопряженной системы

легко выписывается в явном виде

где С, D - постоянные.

Очевидно, что максимум функции Н по и U достигается при

Таким образом, оптимальное управление и может принимать лишь два значения +1 .

2.Определить управление u(t) , которое дает минимум интегралу

, в процессе, описываемом уравнением (1).
Решение.
Введем дополнительную переменную

Для этой переменной имеем дифференциальное уравнение (

с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, можно записать в виде I[T]=x2(T).

Построим функцию Гамильтона

Запишем сопряженную систему

Из поэтому Y2(е)=-1. Теперь функция Гамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2 .

По принципу максимума функция Н при фиксированных х1 и и1 достигает максимума по u : , , откуда .

Осталось решить систему уравнений при условии , и2(Т)=-1,

, с граничными условиями

Сведем данную систему к одному уравнению относительно U.

Добавим к этому уравнению граничные условия и решим его. Составим характеристическое уравнение к2 - (а2+1) =0, к1,2=+(-)

Найдем С1 и С2. С2=-с2е . Тогда

Используя граничные условия найдем С2

Таким образом, определено оптимальное решение

5.О методах решения задач оптимального управления

Убедимся вначале, что необходимые условия оптимальности в форме принципа максимума дают, вообще говоря, достаточную информацию для решения задачи оптимального управления (2.1), (2.2).

Условие максимума (2.4) позволяет, в принципе, найти управление и как функцию параметров х, t,

Рассмотрим систему дифференциальных уравнений

объединяющюю систему уравнений движения объекта и сопряженную систему.

Как известно, общее решение системы (2.8), состоящей из 2n обыкновенных дифференциальных уравнений первого порядка, зависит от 2п параметров. Кроме того, система необходимых условий оптимальности содержит т параметров и параметр y0. Таким образом, общее число неизвестных равно 2n+m+1.

Для их определения мы имеем 2п условий (2.5), (2.6) и т условий (2.2). Еще одно условие определяется из следующих соображений.

Легко понять, что, в силу линейности функции Н по переменным принцип максимума Понтрягина определяет вектор ( ) с точностью до положительного постоянного множителя. Поэтому если в конкретной задаче удается показать, что , то полагают обычно == - 1. В противном случае накладывают какое-либо условие нормировки, например,

Таким образом, общее число условий равно 2n+m+1 и совпадает с числом неизвестных параметров, что, в принципе, позволяет определить эти параметры. Изложенные соображения дают возможность в простейших случаях решить задачу оптимального управления в явном виде.

Опишем численный метод, основанный на тех же соображениях. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5), (2.6), а также выписанными на основе (2.2) краевыми условиями

Эта задача называется краевой задачей принципа максимума.

Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти х(Т), (Т). При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр задан и равен либо 0, либо -1).

Значения х (Г), являются очевидно, некоторыми функциями от а и Ь:

). Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений

Эта система содержит 2п+т неизвестных а, Ь, и состоит из 2п+т уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.

Отметим, что вычисление значений весьма трудоемко, так как требует при каждом (а, b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов .

При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т. п.

Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно).

Гост

ГОСТ

Теория оптимального управления — это теория, которая направлена на проектирование систем, обеспечивающих для заданных объектов управления управляющую последовательность воздействий, которые позволяют достичь максимума или минимума заданного набора критериев качества системы.

Введение

Важнейшей характеристикой управления, которая отличает его от взаимодействия, считается несоразмерность масштабов деятельности объекта и управляющих воздействий. Как и любое количественное отличие, которое представлено малым масштабом деятельности управления по сравнению с объектом, является в некоторой степени условным. К примеру, несомненно, что один или два пастуха способны управлять передвижением стада овец. Но если число пастухов соизмеримо с числом овец, то это уже становится аналогом взаимодействие двух популяций. Подобные примеры могут бы найдены и в технической сфере.

Последствием указанного отличия в масштабах считается фактическое отсутствие обратного воздействия управляемого объекта на управляющее устройство. В отдельных человеко-машинных системах проектировщики вынуждены искусственно создавать подобное влияние.

Теория оптимального управления

Ниже приведена структурно-функциональная схема процесса управления.

Структурно-функциональная схема процесса управления. Автор24 — интернет-биржа студенческих работ

Рисунок 1. Структурно-функциональная схема процесса управления. Автор24 — интернет-биржа студенческих работ

Готовые работы на аналогичную тему

  • X (t) является желаемой траекторией управляемого объекта.
  • U(t) является управляющим сигналом или стратегией управления, обеспечивающим необходимое передвижение объекта.
  • y(t) является доступной непосредственному наблюдению
  • выходной величиной объекта.
  • x(t) является оценкой текущего состояния объекта, которая позволяет сравнить её с требуемым состоянием.
  • u(t) является дополнительным корректирующим воздействием при отклонении текущего состояния от требуемого.

На основании цели управления и сведений о характеристиках управляемого объекта (обозначено как Модель управляемого объекта), может быть сформировано представление о его требуемом поведении X (t) на определённом интервале времени, а также о том, какими средствами управления U (t) это поведение можно достигнуть. Формирование этих вектор-функций выполняется в блоке Вычисление траектории и управления. Управляющие сигналы направляются в исполнительные устройства Управляемого динамического объекта. Реакцией на управляющие воздействия, станет изменение объектом своего состояния.

Достаточно часто непосредственно будет наблюдаться не изменение состояния объекта, а изменение некоторых выходных величин, которые зависят от состояния объекта, а также от управляющих и возмущающих воздействий. Эти выходные величины определяются вектор-функцией y(t). Поэтому должна быть поставлена задача восстановления состояния объекта, которая выполняется в блоке Измерение состояния объекта. Оценка текущего состояния объекта x(t) затем должна вычитаться из его требуемого состояния, и сигналы рассогласования передаются в блок Коррекции отклонений фактического поведения от требуемого. В данном модуле формируется дополнительный сигнал управление u(t), предназначенный для возвращения объекта на требуемую траекторию.

Следует отметить, что управление по рассогласованию между требуемым и фактическим состоянием объекта называется замкнутым или управлением, использующем принцип отрицательной обратной связи. Когда замкнутого контура нет, то такое управление называется разомкнутым или программным управлением.

Основным недостатком разомкнутого управления считается в отсутствии реакции на непредвиденные возмущающие воздействия. Как следует из приведённой выше схемы, возмущения подразделяются на измеряемые и не измеряемые. Учёт измеряемых возмущений в дополнительном управлении способен исключить их воздействие на поведение управляемого объекта. Причём системы с обратной связью способны существенно уменьшить и влияние не измеряемых возмущений.

Необходимо обратить также внимание на тот факт, что процессы управления подразделяется на следующие этапы:

  1. Этап предварительного формирования траектории и управляющих воздействий.
  2. Этап реализации траектории и управления.

Причём на первом этапе требуется выстроить траекторию, которая самым лучшим образом соответствует цели. На втором этапе также желательно самым лучшим образом вернуть объект на требуемую траекторию. Наилучшие в данном смысле траектории и управляющие воздействия именуются оптимальными.

В набор задач проектировщика систем управления входят следующие проблемы:

  1. Расчёт оптимальной траектории и оптимальной стратегии управления.
  2. Формирование замкнутой системы управления, способной поддерживать объект на оптимальной траектории.
  3. Формирование и уточнение модели управляемого объекта.
  4. Проектирование устройств, предназначенных для измерения состояния объекта, а также возмущающих воздействий.

Теория оптимального управления появилась в середине двадцатого века как методика разрешения практических задач управления техническими, экономическими, организационными и, вообще, динамическими системами различной природы. Теория оптимального управления считается прямой наследницей стандартных дисциплин математики, а именно:

Актуальность работы. Создание в середине 50-х годов прошлого столетия математической теории оптимального управления было связано с потребностями решения технических и экономических задач. Проблемы управления, в частности проблемы отыскания наилучшего, оптимального управления, возникают всюду. Наиболее яркие примеры таких задач – это задачи управления летательными аппаратами, управления технологическим процессом на производстве и т. п. В настоящее время оптимальное управление выросло в обширную самостоятельную теорию, использующую в своих исследованиях аппарат высшей алгебры, математического и функционального анализа, дифференциальных уравнений. [1]
Целью работы является изучением функционала и критериев качества управления. Для достижения цели поставлены следующие задачи:
- изучить теории по оптимальному управлению;
- что такое функционал;
- критерий качества управления.

Глава 1. Функционал

При исследовании систем управления, моделирующих различные явления в науке, технике, экономике, часто возникает проблема оптимизации, или задача оптимального управления изучаемым процессом.
Задачи оптимального управления относятся к наиболее сложным в теории оптимизации. Самая же простая в этой теории – задача нахождения экстремума (минимума или максимума) функции одной переменной. Ее естественным обобщением является задача нахождения экстремума функции многих переменных. Решение этой задачи представляет собой конечный вектор, элемент векторного пространства, поэтому задачи такого характера называются задачами конечномерной оптимизации.
Дальнейшее обобщение и усложнение в теории оптимизации составляет исследование экстремума функционала. Существенным отличием здесь от предшествующих задач является то, что решение представляет собой не конечный вектор, а функцию, элемент бесконечномерного функционального пространства. Отсюда вытекает вся сложность таких задач, и к ним относятся задачи оптимального управления. [2]

1.1. Задача оптимизации функционала
Рассмотрим множество M произвольной природы. Говорят, что на множестве M задан функционал F, если известно правило, по которому каждому элементу v∈M ставится в соответствие определенное действительное число c. При этом пишут: F(v) =c. Множество M называется областью задания, или областью определения функционала F. Элементы множества M называют аргументами функционала. Функционал осуществляет отображение множества M на множество действительных чисел и является обобщением понятия функции. Приведем примеры функционалов.
Пример 1. Пусть M – это множество плоских фигур, ограниченных замкнутыми кривыми. Каждой фигуре v∈M поставим в соответствие ее площадь S= F(v). Тем самым будет определен функционал F с областью задания M.
Пример 2. Пусть M – это множество функций, заданных и непрерывных на отрезке [a, b]. Каждой функции y = y(x) из M поставим в соответствие действительное число F(y), равное ее интегралу на отрезке [a, b]:

Это соотношение определяет функционал F с областью задания M .
Приведем основные сведения из теории экстремума функционалов. Будем рассматривать в качестве области задания функционалов пространство непрерывных функций, определенных на отрезке [a,b], которое обозначается C [a, b].
Расстоянием между двумя функциями называется число

ε -окрестностью функции называется совокупность функций x (t), расстояние которых от x0(t)меньше ε :

Функционал F (x) называется непрерывным при x= x0(t), если для любого ε >0 существует δ >0 такое, что для всех функций x (t), удовлетворяющих условию ρ(x,x 0) 0 существует δ >0 такое, что для всех функций x (t), удовлетворяющих условию ρ(x,x 0) ε найдется точка xε ∈U, для которой F(x ε) ε найдется точка xε∈U, для которой F(xε)>M−ε.
Верхняя грань обозначается

Последовательность xk∈U называется минимизирующей для функционала F(x) на множестве U, если

Последовательность xk∈U называется максимизирующей для функционала F(x) на множестве U, если
.
Легко показать, что из существования нижней грани вытекает существование минимизирующей последовательности, а из существования верхней грани вытекает существование максимизирующей последовательности. Нижняя грань существует не для всякого функционала. Чтобы существовала нижняя грань, функционал должен быть ограничен снизу. Имеет место следующая теорема.
Пусть на множестве U задан ограниченный снизу функционал J(x). Тогда реализуется одна из двух возможностей:
1) существует элемент x0(t)∈U, на котором достигается минимум функционала J(x),
2) существует нижняя грань функционала J(x).
Аналогичная теорема имеет место для ограниченного сверху функционала и его верхней грани.
Теорема имеет важное значение. Она говорит о том, что задача отыскания наименьшего значения ограниченного снизу функционала всегда имеет смысл. А именно или мы можем найти точное решение задачи (когда существует минимум), или можем найти приближенное решение (когда существует нижняя грань). Во втором случае в качестве приближенного решения можно взять любой член минимизирующей последовательности с достаточно большим номером, так как он будет мало отличаться от нижней грани.
Задачи отыскания экстремума функционала относятся к теории вариационного исчисления, где устанавливаются условия, при которых функционал достигает минимального или максимального значения, а также исследуются методы отыскания точек экстремума. Примером задачи вариационного исчисления является так называемая простейшая задача вариационного исчисления, которая состоит в нахождении экстремума функционала
(1.6)
на множестве непрерывно дифференцируемых функций, удовлетворяющих граничным условиям
x(a) = A, x(b) = B.
Если будем рассматривать функционал (1.6) на функциях, которые удовлетворяют дифференциальному уравнению

то простейшая задача вариационного исчисления будет задачей оптимальногоуправления.

Глава 2. Критерий качества управления

Рассмотрим процесс управления
(2.1)
(2.2)
и рассмотрим множество пар (x,u) в которых u=u(t) (t∈[t0,t1]) – допустимое управление, x= x(t) – соответствующая этому допустимому управлению траектория при начальном условии x(t0) = x0, т.е. решение задачи Коши (2.1), (2.2). Такие пары будем называть допустимыми. В каждый заданный момент времени t пара (x(t),u(t)) полностью характеризует исследуемый процесс. При этом естественно возникает вопрос: как найти такое допустимое управление, при котором изучаемый объект обладал бы необходимыми свойствами, чтобы весь процесс управления был в некотором смысле наилучшим, оптимальным? Для определения качества процесса на множестве пар (x,u) задается функционал J(x,u), который называется критерием качества управления. Таким образом, каждой паре (x,u) ставится в соответствие число J(x,u) – значение функционала. Следует отметить, что критерий качества в каждой конкретной прикладной задаче имеет вполне определенный смысл, например J(x,u) может определять величину расхода топлива, величину различных энергетических затрат, может означать время перемещения траектории из одной точки фазового пространства в другую и т.д.
Цель задачи оптимального управления объектом – это нахождение экстремума (минимума или максимума) критерия качества J(x,u). В дальнейшем будем рассматривать задачи нахождения минимума J(x,u), поскольку отыскание максимума может быть сведено к отысканию минимума. Теперь дадим точную постановку одной достаточно простой задачи оптимального управления (ЗОУ). Задача оптимального управления состоит в нахождении такого допустимого управления u(t) и соответствующей траектории x(t), удовлетворяющей задаче Коши
(2.3)
(2.4)
при которых критерий качества J(x,u), рассматриваемый на множестве допустимых пар, достигает минимального значения.
В краткой форме эта ЗОУ обычно записывается следующим образом:
(2.5)
(2.6)
(2.7)
(2.8)
Решение сформулированной задачи называется оптимальным управлением и оптимальной траекторией. Эта задача является задачей с закрепленным левым концом траектории, поскольку задано начальное условие (2.6). В то же время – это задача со свободным правым концом траектории, поскольку на x (t1) не наложено никаких ограничений.
Рассмотрим обобщение задачи (2.5) – (2.8). Пусть в фазовом пространстве En заданы множества X0, X1. Предположим, что за начальное состояние x0 системы (2.5) можно брать любую точку из X0, и будем рассматривать те допустимые управления, при которых правые концы соответствующих траекторий будут принадлежать множеству X1. В этом случае можно сформулировать ЗОУ с подвижными концами, а именно, задача оптимального управления с подвижными концами состоит в отыскании допустимого управления и соответствующей траектории, выходящей из множества X0 и заканчивающейся в множестве X1, которые доставляют минимум критерию качества J(x,u). В краткой форме эта задача записывается следующим образом:
(2.9)
(2.10)
(2.11)
(2.12)
(2.13)
В том случае, когда множество X1 состоит из одной точки (X1=), мы будем иметь задачу с закрепленным правым концом траектории. Если множество X0 (или X1) совпадает со всем фазовым пространством En, то говорят, что левый (или правый) конец траектории свободен. В этом случае мы имеем задачу со свободным левым (или со свободным правым) концом.
Задачу оптимального управления (2.9) – (2.13) можно рассматривать как задачу оптимизации функционала J(x,u) при ограничениях (2.9) – (2.13). Характерным для ЗОУ является наличие дифференциальной связи (2.9) (уравнение процесса). Изменяя ограничения (2.10) – (2.12), можно получать различные ЗОУ для системы (2.9) и критерии качества (2.13). Так, например, кроме условий (2.10), (2.11), или вместе с ними можно задать граничные условия в виде

где ϕ – заданная функция переменных (x1,…xn, y1,…yn). Получим более сложные для исследования задачи, если добавим ограничение на управление в виде

где g – заданная функция переменных (u1,…um,t), или ограничение на фазовые переменные

где h – заданная функция переменных (x1,…xn,t), или смешанные ограничения

где q – заданная функция переменных (x1,…xn, u1,…um,t).
В рассмотренных задачах предполагалось, что t0, t1– фиксированные числа. Вместе с тем возможны ситуации, когда начальный и конечный моменты времени t0, t1 неизвестны и подлежат определению

Читайте также: