Главная страница  Системы автоматического управления 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 [ 144 ] 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

Таким образом, сопряженный вектор, соответствующий оптимальной траектории, представляет собой вектор, направленный в сторону, противоположную направлению градиента критерия оптимальности /*. Так как вектор градиента направлен в сторону быстрейшего изменения функции, то вектор ф располагается в каждый момент времени в направлении быстрейшего изменения критерия оптимальности.

Для {засширенной системы, рассмотренной в § 14,3, мы имеем Н = = х. При этом принцип оптимальности дает -dfldx = я]:. Ита,к, условие max Я в принципе максимума означает, что в расширенном п + 1-

мерном пространстве управлений и* % следует выбирать таким образом, чтобы в любой момент времени составляющая вектора х в направлении наискорейшего убывания величины f* была максимально большой.

Из выражения (15.616) видно, что оптимальная функция Гамильтона Н* равна скорости изменения критерия оптимальности при отсчете времени от выбранной начальной точки.

Поэтому ясно, почему в случае оптимального по быстродействию управления стационарным объектом функция Я* должна обязательно равняться нулю. Последнее видно из рассмотрения величины df* {х, t)ldt. Напомним что t ъ f* [х, t) представляет собой начальное время. При фиксированной начальной точке (л: в /* (л:, t)) оптимальное время достижения любой данной точки не зависит от начального времени для стационарного объекта управления; следовательно. Я* = 0.

Действительно, рассуждая, как и в приведенном выше случае, видно, что всякий раз, когда управляемый объект и функция стоимости L не зависят явно от времени, а конечное время не фиксировано, то dfldt будет всегда равняться нулю и, следовательно, во всех этих случаях Я* = 0.

Выражая уравнение Беллмана через гамильтониан Я, можно записать

-Я (л:*, и\ t, )=0. (15.62)

Это уравнение совпадает с уравнением Гамильтона-Якоби Зная зависимость между принципом максимума и динамическим программированием, можно развить дальше результат, полученный в предыдущем параграфе.

Предположим, требуется найти оптимальное линейное управление с обратной связью для системы с точно определенным входным сигналом z (t). Цель управления состоит в том, чтобы удерживать выходной сигнал близким к входному, не затрачивая при этом чрезмерно много энергии. Задачу можно сформулировать следующим образом.

Пусть выходной сигнал объекта х = А {fjx + В (t) и определяется как у (t) = С (t) X (t), где векторы л: и у соответственно п- и /п-мерны. Пусть входной сигнал есть /п-мерный вектор z (t), а ошибка системы равна е (t) = Z (t) - у (t). Соответствующий показатель качества имеет вид

f = e ih) Me ih) + \ {e (т) Q (т) e (т) + и (t) R (т) и (т)) dx;

(15.63)

его необходимо минимизировать, найдя оптимальное управление и* (х, t).

) По этой причине некоторые авторы часто называют уравнение Беллмана уравнением Гамильтона-Якоби.



Используя результаты данного параграфа, определим гамильтониан H==~-{z{t)-C{t)x {t)Y Q it) (z {t) ~C{t)x (t)) - (tt {tf R it) и it)) +

+ {Ait)xit))\it) + {Bit)uit)yit). (15.64)

Оптимальную функцию управления и* {t) найдем из уравнения = О, откуда

uit)= ~Rr\t)B\t)it)R-it)BiO , (15.65)

что имеет смысл при условии существования обратной матрицы R it) для всех t.

Линейный блок

Рис. 15.3 : а) Конфигурация общей оптимальной системы управления линейным объектом.. Задача этой системы заключается в том, чтобы минимизировать показатель качества в виде (15.53), где е (О = 2 (О -C{t)x {ty, 6) структура блока L; приведенного на рис. 15.3а

m)x(t)

P(t)

wm=-[(t)-BWR-4mmp(t)fw(t)

-C(t)Q<t)zH)

w(t)

u*im-4m(i)

[wlt)-p(t)xlt)]

u*(t)

P(t)x(t)

>

Линейный блок

Если предполагать управление линейным, то исходя из принципа суперпозиции, разумно ожидать, что оптимальное линейное управление * (л:, t) будет представлять собой сумму двух частей, одна из которых зависит только от входного сигнала (и от структуры системы), а вторая - от выходного. Это предполагает структуру системы, которая показана на рис. 15.3а.

В частности, исходя из структуры системы для случая z it) = О в общем случае структуру линейного блока L (рис. 15.3а) можно принять следующей:

и it) = R-\t)B\t) (wit)-Pit) xit)), (15.66)

где w it) - п-мерный вектор, который является результатом выполнения линейной операции над /п-мерным вектором z if). При и* it), имеющем форму (15.66), /* (л , t) принимает вид

Г (X, t) = -x it) Рit) X it) + it) л: (/) + 4 6>

где V it) - скалярная функция, определяющая явную зависимость функции /* (л:, t) от времени. ,



Из выражений (15.25) и (15.28) следует, что граничное условие для /* (л:, О имеет вид

г{х, h) = e{tMe{t. (15.68)

После подстановки выражений (15.67) и (15.68) в уравнение Беллмана (15.62) и выполнения некоторых алгебраических операций приходим к выводу о том, что оптимальное линейное управление вида (15.66) возможно, если:

1) симметричная матрица Р (t) размерности п X п удовлетворяет матричному уравнению Риккати (15.46);

2) п-мерный вектор W (t) удовлетворяет линейному векторно-матрич-ному дифференциальному уравнению

[A{t)~B{t)R-\t)B{t)P{t)\-w{t)-C{t)Q{t)z{t) (15.69) с граничным условием в момент времени t-

w{U) = Citz)Mih); (15.70)

3) скалярная функция v (t) есть решение дифференциального уравнения

гг = () - () ()) () ()) (1-71)

с граничным условием в момент времени t,

v{tz) = 2z{tz)Mz{tz). (15.72)

Калману удалось показать, что приведенные выше результаты 1-3 не только являются достаточными условиями сушествования линейного оптимального управления, но и необходимы

Реализация этого оптимального управления показана на рис. 15.36.

Сделаем ряд замечаний относительно оптимальных линейных законов управления. Хотя теория, относящаяся к данному классу систем, по-видимому, хорошо разработана, это не означает, что во всех конкретных случаях удается свести системы к стандартной форме и применить формулы, приведенные в § 15.4 и § 15.5: С этим классом задач связан ряд серьезных трудностей.

Во первых,-критерий (15.40) вызывает иногда сомнения в целесообразности применения, И к тому же не существует обоснованного способа выбора нужных весовых матриц М, Q (t) и R (/). Очень часто соответствующие М, Q (t) и R (t) находят методом проб и ошибок, причем наиболее удовлетворительную переходную характеристику определяют на глаз.

Во-вторых, закон оптимального управления с обратной связью использует все переменные состояния, а это обычно означает, что выход и п - 1 его производных необходимо измерять без ошибок. В большинстве реальных систем это вообще невозможно.

В-третьих, при отсутствии входного сигнала матрицу обратной связи Р (t) необходимо получить путем решения нелинейной системы уравнений (15.46). Обычно это выполняется численными методами. С инженерных позиций этот метод малоудовлетворителен не только потому, что для систем высокого порядка трудоемкость и объем вычислений существенно возрастают, но также потому, что полученный результат представляет собой совокуп-

См. в § 15.7 теорему 15.2, которая обобщает результат Калмана. , ...



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 [ 144 ] 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования.