Главная страница Системы автоматического управления Уравнение (14.776) означает, что (t) =--- . Полученный их t~t2 ВЫВОД сформулируем в виде теоремы. Теорема 14.5. Рассмотрим задачу нахождения оптимального управления * (О на интервале [t t,], которое минимизирует критерий Р {х (t, tz) для системы х = f (х, и, t). Предположим, что начальное состояние X (tj) = Xi задано и функция управления и (t) подчиняется ограничению типа неравенства (О , где U - постоянный вектор. Принцип максимума в этом случае формулируется относительно гамильтониана = = фа/, где удвлетворяет векторному уравнению ib = - dHJdx с крае- вым условием Ч (g) =-- . Даже после формулировки теоремы 14.5 задача оптимизации по-прежнему связана с решением краевой задачи с закрепленными концами, как это можно видеть из следующего. Пример 14.7. Найдем оптимальное управление и* (t) с учетом ограничения ы < 1, которое переводит объект управления с передаточной функцией 1/s из начала координат в точку X (Г) в течение интервала времени [О, Т] таким образом, чтобы расстояние от конечной точки X (Т) до области цели jCg бьшо минимальньш. В формулировке Майера критерий качества определяется выражением Р {X (Г) = {X, (Г) - xi) + {Х2 (Т) ~ х.,2Г. Заметим, что задача имеет смысл только в том случае, если точка х не может быть достигнута за время меньшее или равное Т сек. Предположим, что это так. Используя теорему 14.5, имеем (опустив индекс а ) Я = ifiXa + ifau; il = 0; ijia = *(0= sign №2(01- Краевые условия будут: Xi (0) = X2 (0) =0; 1 (Т) = дх, дР dXf. =-2[x,{T)-X2i]; =-21Х2(Т)-Х22]. Решение сопряженной системы, удовлетворяющее приведенньш выше краевым условиям, имеет вид i(f)=2[x2i-x,{T)h XP2{t)=2lX22-X2(T)] + 2 [x2i-x,(T)]{T~t). Сопряженный вектор зависит от неизвестных конечных значений вектора состояния. Ясно видно существование релейного решения. Поскольку конечный момент времени Т фиксирован, это дает нам представление о том, как следует решать задачу. Предположим, например, что точка х лежит в первом квадранте и располагается вправо от траектории, которая исходит из начала координат и обусловлена управлением и = +1. Управление ы* (t) должно быть первоначально равно +1; кроме того, возможно самое большее одно переключение. Предположим, что ы* (t) = +1 для 0< t<i t, и и* {t) = -1 для t, f 1 Г. Тогда можно найти конечную точку оптимальной траектории х (Т) как функции от в интервале 0< Т с помощью уравнения системы и начального условиях (0) = 0. Затем, подставив полученное выражение для х* (Т) в критерий Р (х (Т), следует найти минимум этого выражения как функции от t,. Подробные вьнисления предлагаем читателю проделать в качестве упражнений (см. задачу 14.11). Когда мы пишем dP/dx, то это означает, что функция Р {х (t), получена исходя из функции вида Р (x(t), t). Если область достижимых состояний G {Т) мойно йайти графически (предполагается, что рассматривается система второго порядка), то решение задачи управления конечным значением можно найти графически. Для объекта с двойным интегрирующим звеном зона G (Т) имеет вид, представленный на рис. 14.9. Радиус наибольшей окружности с центромв точке х, которая касается множества G (Т), определяет минимальное расстояние в момент времени t. Точка, в которой окружность и С (Т) касаются друг друга, представляет собой конечную точку оптимальной траектории. На рис. 14.9а и б приведены случаи, когда и* (t) соответственно не имеет ни одного переключения или имеет только одно переключение (почему?). Заметим, что для линейной (даже нестационарной) системы форма и размеры G (t) не зависят от начальной точки х (покажите это). Это позволяет найти решение для широкого класса задач управления конечным состоянием. 14.7. РАСШИРЕНИЕ ОБЛАСТИ ПРИМЕНЕНИЯ ПРИНЦИПА МАКСИМУМА Кратко остановимся на двух областях, в которых принцип максимума используется для решения задач необычного типа. Рис. 14.9: а) Геометрия задачи из примера 14.7, в которой не требуется переключение управления и* ((); б) Геометрия задачи из примера 14.7, в которой требуется одно переключение управления и* (О 1. Задачи с ограничениями типа неравенства на переменные состояния Иногда пространство состояний, в котором необходимо найти оптимальную траекторию, ограничивается замкнутым подпространством евклидова п-мерного пространства. Это ограничение определяется неравенством g (х) 0. Если оптимальная траектория находится внутри ограниченного подпространства, то принцип максимума в том виде, в каком он приведен выше, удовлетворяется. Однако, если часть оптимальной траектории проходит по границе g- (л:) = О подпространства, то канонические уравнения необходимо модифицировать путем введения в них дополнительного члена. В точке, в которой оптимальная траектория соприкасается с границей g (х) = О, выполняется условие скачка для вектора if (t). Это условие скачка впервые доказал Р. В. Гамкрелидзе (см. работу [161]). На прак тике часто приходится сталкиваться с задачами, где наложены ограничения типа неравенств на фазовые координаты. Так, например, при осуществлении посадки реактивный самолет не должен снижаться ниже уровня поверхности Земли, а, как правило, антенны радиолокационных станций сопровождения имеют ограничения по скорости и ускорению, которые не позволяют им осуществлять сопровождение быстродвижущихся целей. В тех случаях, когда приходится иметь дело с подобными задачами, необходимо следить за тем, чтобы не нарушить соответствующие ограничения. . > Один из возможных способов обойти упомянутые выше трудности снова сводится к использованию функций штрафов . Основной принцип использования функций штрафа применительно к ограничениям типа неравенства на управляющие воздействия был рассмотрен в гл. 13. Этот метод можно легко распространить на случай ограничения переменных состояния. В критерий, подлежащий минимизации, снова введем дополнительные члены, которые сильно возрастают при нарушении ограничений типа неравенств на переменные состояния. При соответствующем выборе функций штрафа следует ожидать, что решение будет близким к точному. Ряд результатов, указывающих на целесообразность использования метода функции штрафа, можно найти в работах [1721 и [1521. 2. Дифференциальные игры * Интересным классом задач, применительно к которому можно иногда использовать принцип максимума, является класс, включающий в себя два ряда переменных управления (а иногда и две дифференциальные системы). Целью одного из рядов переменных управления (или системы) является минимизация какого-то определенного показателя, тогда как задача второго ряда сводится к максимизации этого показателя. В качестве конкретного примера рассмотрим задачу преследования эсминцем подводной лодки. В момент сбрасывания глубинных бомб эсминец должен находиться как можно ближе к подводной лодке, тогда как последняя - как можно дальше от эсминца. Предположим, что эта составная система описывается векторным дифференциальным уравнением вида x = f{x, и, V, о, где и к V - переменные управления, располагаемые соответственно двумя сторонами. Далее, примем в данной задаче обычные виды краевых условий и ограничений. Рассмотрим показатель качества в форме Лагранжа f =\ь{х,и, V, t) dt. Предположим, что сторона А, контролирующая и (t), желает минимизировать показатель f, тогда как сторона Б, контролирующая v (t), стремится максимизировать тот же показатель. Если и Л и £ прекрасно осведомлены о местонахождении друг друга, то с точки зрения А обоснованная стратегия сводится к выбору такой и* (t), чтобы минимизировать f, несмотря на все усилия, предпринимаемые стороной Б. Это значит, что А стремится найти такое управление и* (t), что величина /* удовлетворяет условию fi . = min max L {х, и, V, t) dt. Последнее означает управление по минимаксному критерию. * Дифференциальным играм посвящена работа [84]. Ввиду индивидуальной точки зрения автора этой работы и принятой им необычной системы обозначений читателю рекомендуем обратиться к исчерпывающему обзору, приведенному в книге [75].
|
© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования. |