Главная страница  Системы автоматического управления 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 [ 130 ] 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

Добавив формулу (14.20) к уравнению (14.19), определим два (п+1)-мер-ных вектора х и / соответственно с составляющими Хо, х . . ., x и L, /и /г. fn- Уравнения для расширенной системы можно записать в таком виде:

x = f{x,n,t). (14.22)

Рассмотрим координату х, начальным условием для которой с учетом формулы (14.20) является х (tj) = 0; при f = имеем Хд {t = f.

Задачу оптимизации, рассматриваемую в расширенном пространстве состояний размерности п -(- 1, можно теперь сформулировать таким образом:

В (я + 1)-мерном пространстве состояний с координатами Хд, х . . .x найти допустимое управление и* (t) (i t £ t), которое переводит систему из начального положения х = 0,х = Xi в конечное таким образом, что Xi (tz) = Sj при I = 1, . . . , m, а Хо (г) принимает наименьшее возможное значение.

С помощью использованного выше приема была преобразована задача оптимального управления в задачу, которую можно рассматривать топологически. Кроме того, в подобные задачи можно преобразовывать теперь также и другие типы задач.

В приведенной выше формулировке время может присутствовать в явном, так и неявном виде. В качестве примера рассмотрим задачу оптимального быстродействия. Здесь L = +1, так что f становится -t но присутствует лишь в неявном виде.

3. Формулировка принципа максимума

Введем (п+1)-мерный вектор -ф () и образуем следующую функцию Гамильтона от четырех переменных х, и, t, -ф.

H{x,n,t,)A,{t)f{x, и, t). (14.23)

Принцип максимума можно теперь сформулировать следующим образом.

Теорема 14.3. (Принцип максимума Понтрягина). Если функция и* (t) определяет оптимальное управление, а л * (t) - оптимальная траектория, соответствующая и* (f), согласно уравнению (14.22), то имеется ненулевая непрерывная векторная функция -ф (t) такая, что:

1) в любой момент времени / (за исключением, возможно, точек, в которых/ ИЛИИ являются разрывными) функция Гамильтона вдоль оптимальной траектории х* (f) достигает максимума. Иначе говоря,

H{xu*,t,)H{x*,u,t,y,

2) в любой момент времени t (за исключением, возможно, точек, в которых / или и являются разрывными) вектор -ф (t) удовлетворяет системе

3) фг (2) = О при I = m -Ь 1, . . ., п;

4) я1)о (2) 0.

Из соотношений (14.24) видно, что уравнение для д имеет вид фд = О, так как ни одна из функций Д- не зависит от координаты Хд- Таким образом, в соответствии с приведенным выше условием (4) принципа максимума фо (О будет представлять собой константу с отрицательным или нулевым значением.

Вектор )})(t) называют сопряженным вектором.



в том случае, когда конечный момент времени заранее не определен, для получения решения необходимо наложить дополнительное условие:

Н (л:*, и*, 2. ф) = О (для 2, не известного заранее). (14.25)

Другими словами, функцияТамильтона, соответствующая оптимальному управлению, должна равняться нулю в момент времени t.

Можно сделать еще один интересный вывод для случая, когда Н не зависит от времени. Это означает, что управляемая система и функция критерия L не зависят от времени.

Обозначим функцию Гамильтона, соответствующую оптимальному управлению и, через Я * (л:,-ф, f) и рассмотрим dH* (л:,-ф, t)ldt вдоль оптимальной траектории

йя* йя* , ая* , ая

SdH* I* , у ая* , ая* /ы 9к\

dt ~ dxi - at

j=0 j=0

Из выражений (14.23) и (14.24) следует

дН* : дН* * , .

Подставляя соотношение (14.27) в уравнение (14.26), получим в общем

виде

-=. (14.28)

Если L и / не являются явными функциями времени, то dH*ldt = 0; заметим, что для подобных систем Н* представляет собой константу. Кроме того, для класса систем, в которых конечное время не задано, известно, что-Я* = О в конечный момент времени. Таким образом, если эти системы, кроме того, стационарны, то имеем Я* = О ). Суммируем сказанное вьш1е в виде следствий:

1) для расширенных систем Я* является константой;

2) для стационарных систем с незаданным заранее конечным моментом времени t. Я* тождественно равна нулю.

Важный класс задач оптимального по быстродействию управления стационарными объектами удовлетворяет следствию 2.

4. Замечания и пояснения

Рассмотрим сначала вектор -ф. Из выражения (14.24) видно, что уравнения, определяющие -ф, представляют собой систему линейных однородных дифференциальных уравнений. Составляющие -ф {{) определяются с точностью до постоянного множителя. Таким образом, без потери общности можно произвольно зафиксировать любую из них. Из формулировки принципа максимума следует, что проще всего это сделать по отношению к составляющей i5o, которая всюду постоянна. Из- пункта 4) формулировки принципа максимума известно, что i5o 0. Согласно общепринятой практике зададим следующее значение фо ):

я1; = -1. (14.29>

) Это другой метод получения уравнения (13.71) для класса задач, рассматриваемых в § 13.3.

) Последнее возможно при ijJq =f= 0. При ijJq s о соответствующая траектория назьшается. особой (гл. 16).



Для линейного управляемого объекта вида

х = Ах + Вп, x{tj) = Xi, (14.30а)

Xo = L{x,n), xo(i) = 0 (14.306)

условия (14.24) вдоль оптимальной траектории л:* (f) принимают вид

% = 0; (14.31а)

= -Л-%, (14.316)

где -ф - вектор с составляющими . . ., 4l) . Заметим, что при фц = -с уравнение (14.316) то же, что и уравнения для множителей Лагранжа в уравнениях Эйлера-Лагранжа в гл. 13. Таким образом, величины tp, i - = 1 . . . , n отождествляются с множителями Лагранжа в классической формулировке.

Можно сделать еще один шаг в поисках тождества для ipi. Рассмотрим задачу оптимального быстродействия применительно к линейным системам. Здесь L (дг;- и) = 1, и, таким образом, управление (14.316) сводится к виду -ф = - Aii что, как можно видеть, представляет собой систему, сопряженную с системой (14.30а) в соответствии с определением, принятым в гл. 13. Отсюда видно, что множители Лагранжа оказываются ничем иным, как сопряженными переменными. Далее, ввиду отождествления вектора -ф с сопряженным вектором расширенный вектор ч]; для нелинейной системы, определяемой уравнением (14.24), также будем называть сопряженным вектором.

Теперь можно установить смысл вектора ij, появившегося в выражении для оптимального по быстродействию управления в предыдущих параграфах.

Функция Гамильтона для системы (14.30) имеет вид

H= - L{x,n)-i->f{Ax + Bn). (14.32)

Для задачи оптимального быстродействия L (х, и) =1, и, следовательно,

Н = -1-\-,{Ах + Ви).

В соответствии с пунктом 1) формулировки принципа максимума Я должна быть максимизирована путем выбора и. Теперь единственной частью Я, содержащей и в. явном виде, является часть \fBn. Так как

ГВп = S 41), t bijUi = tu,-t bifi, (14.33)

t=i /=1 /=1 1=1

TO при I Wj-1 Ui для нахождения максимума этой величины необходимо иметь

*()=sign[fi4j,] (14.34)

всякий раз, когда величина S не равняется нулю на каком-либо

конечном интервале. Если последнее условие выполнено, то каждая составляющая Ui будет релейной, причем моменты переключения определяются выбором сопряженных переменных. Это, по-видимому, в известной мере отражает результаты Ла-Салля, изложенные в § 14.2.



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 [ 130 ] 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования.