Главная страница Системы автоматического управления Добавив формулу (14.20) к уравнению (14.19), определим два (п+1)-мер-ных вектора х и / соответственно с составляющими Хо, х . . ., x и L, /и /г. fn- Уравнения для расширенной системы можно записать в таком виде: x = f{x,n,t). (14.22) Рассмотрим координату х, начальным условием для которой с учетом формулы (14.20) является х (tj) = 0; при f = имеем Хд {t = f. Задачу оптимизации, рассматриваемую в расширенном пространстве состояний размерности п -(- 1, можно теперь сформулировать таким образом: В (я + 1)-мерном пространстве состояний с координатами Хд, х . . .x найти допустимое управление и* (t) (i t £ t), которое переводит систему из начального положения х = 0,х = Xi в конечное таким образом, что Xi (tz) = Sj при I = 1, . . . , m, а Хо (г) принимает наименьшее возможное значение. С помощью использованного выше приема была преобразована задача оптимального управления в задачу, которую можно рассматривать топологически. Кроме того, в подобные задачи можно преобразовывать теперь также и другие типы задач. В приведенной выше формулировке время может присутствовать в явном, так и неявном виде. В качестве примера рассмотрим задачу оптимального быстродействия. Здесь L = +1, так что f становится -t но присутствует лишь в неявном виде. 3. Формулировка принципа максимума Введем (п+1)-мерный вектор -ф () и образуем следующую функцию Гамильтона от четырех переменных х, и, t, -ф. H{x,n,t,)A,{t)f{x, и, t). (14.23) Принцип максимума можно теперь сформулировать следующим образом. Теорема 14.3. (Принцип максимума Понтрягина). Если функция и* (t) определяет оптимальное управление, а л * (t) - оптимальная траектория, соответствующая и* (f), согласно уравнению (14.22), то имеется ненулевая непрерывная векторная функция -ф (t) такая, что: 1) в любой момент времени / (за исключением, возможно, точек, в которых/ ИЛИИ являются разрывными) функция Гамильтона вдоль оптимальной траектории х* (f) достигает максимума. Иначе говоря, H{xu*,t,)H{x*,u,t,y, 2) в любой момент времени t (за исключением, возможно, точек, в которых / или и являются разрывными) вектор -ф (t) удовлетворяет системе 3) фг (2) = О при I = m -Ь 1, . . ., п; 4) я1)о (2) 0. Из соотношений (14.24) видно, что уравнение для д имеет вид фд = О, так как ни одна из функций Д- не зависит от координаты Хд- Таким образом, в соответствии с приведенным выше условием (4) принципа максимума фо (О будет представлять собой константу с отрицательным или нулевым значением. Вектор )})(t) называют сопряженным вектором. в том случае, когда конечный момент времени заранее не определен, для получения решения необходимо наложить дополнительное условие: Н (л:*, и*, 2. ф) = О (для 2, не известного заранее). (14.25) Другими словами, функцияТамильтона, соответствующая оптимальному управлению, должна равняться нулю в момент времени t. Можно сделать еще один интересный вывод для случая, когда Н не зависит от времени. Это означает, что управляемая система и функция критерия L не зависят от времени. Обозначим функцию Гамильтона, соответствующую оптимальному управлению и, через Я * (л:,-ф, f) и рассмотрим dH* (л:,-ф, t)ldt вдоль оптимальной траектории йя* йя* , ая* , ая SdH* I* , у ая* , ая* /ы 9к\ dt ~ dxi - at j=0 j=0 Из выражений (14.23) и (14.24) следует дН* : дН* * , . Подставляя соотношение (14.27) в уравнение (14.26), получим в общем виде -=. (14.28) Если L и / не являются явными функциями времени, то dH*ldt = 0; заметим, что для подобных систем Н* представляет собой константу. Кроме того, для класса систем, в которых конечное время не задано, известно, что-Я* = О в конечный момент времени. Таким образом, если эти системы, кроме того, стационарны, то имеем Я* = О ). Суммируем сказанное вьш1е в виде следствий: 1) для расширенных систем Я* является константой; 2) для стационарных систем с незаданным заранее конечным моментом времени t. Я* тождественно равна нулю. Важный класс задач оптимального по быстродействию управления стационарными объектами удовлетворяет следствию 2. 4. Замечания и пояснения Рассмотрим сначала вектор -ф. Из выражения (14.24) видно, что уравнения, определяющие -ф, представляют собой систему линейных однородных дифференциальных уравнений. Составляющие -ф {{) определяются с точностью до постоянного множителя. Таким образом, без потери общности можно произвольно зафиксировать любую из них. Из формулировки принципа максимума следует, что проще всего это сделать по отношению к составляющей i5o, которая всюду постоянна. Из- пункта 4) формулировки принципа максимума известно, что i5o 0. Согласно общепринятой практике зададим следующее значение фо ): я1; = -1. (14.29> ) Это другой метод получения уравнения (13.71) для класса задач, рассматриваемых в § 13.3. ) Последнее возможно при ijJq =f= 0. При ijJq s о соответствующая траектория назьшается. особой (гл. 16). Для линейного управляемого объекта вида х = Ах + Вп, x{tj) = Xi, (14.30а) Xo = L{x,n), xo(i) = 0 (14.306) условия (14.24) вдоль оптимальной траектории л:* (f) принимают вид % = 0; (14.31а) = -Л-%, (14.316) где -ф - вектор с составляющими . . ., 4l) . Заметим, что при фц = -с уравнение (14.316) то же, что и уравнения для множителей Лагранжа в уравнениях Эйлера-Лагранжа в гл. 13. Таким образом, величины tp, i - = 1 . . . , n отождествляются с множителями Лагранжа в классической формулировке. Можно сделать еще один шаг в поисках тождества для ipi. Рассмотрим задачу оптимального быстродействия применительно к линейным системам. Здесь L (дг;- и) = 1, и, таким образом, управление (14.316) сводится к виду -ф = - Aii что, как можно видеть, представляет собой систему, сопряженную с системой (14.30а) в соответствии с определением, принятым в гл. 13. Отсюда видно, что множители Лагранжа оказываются ничем иным, как сопряженными переменными. Далее, ввиду отождествления вектора -ф с сопряженным вектором расширенный вектор ч]; для нелинейной системы, определяемой уравнением (14.24), также будем называть сопряженным вектором. Теперь можно установить смысл вектора ij, появившегося в выражении для оптимального по быстродействию управления в предыдущих параграфах. Функция Гамильтона для системы (14.30) имеет вид H= - L{x,n)-i->f{Ax + Bn). (14.32) Для задачи оптимального быстродействия L (х, и) =1, и, следовательно, Н = -1-\-,{Ах + Ви). В соответствии с пунктом 1) формулировки принципа максимума Я должна быть максимизирована путем выбора и. Теперь единственной частью Я, содержащей и в. явном виде, является часть \fBn. Так как ГВп = S 41), t bijUi = tu,-t bifi, (14.33) t=i /=1 /=1 1=1 TO при I Wj-1 Ui для нахождения максимума этой величины необходимо иметь *()=sign[fi4j,] (14.34) всякий раз, когда величина S не равняется нулю на каком-либо конечном интервале. Если последнее условие выполнено, то каждая составляющая Ui будет релейной, причем моменты переключения определяются выбором сопряженных переменных. Это, по-видимому, в известной мере отражает результаты Ла-Салля, изложенные в § 14.2.
|
© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования. |