Главная страница  Системы автоматического управления 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 [ 143 ] 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

где Q я R- симметричные, положительно определенные постоянные матрицы, справедливо условие lim/ (7. = О и,.таким образом, матричное

Г-Уоэ

уравнение Риккати (15.46) сводится к нелинейному матричному алгебраическому уравнению

(15.49)

-PBRTBP + РЛ + АР + С? 0.

Решение этого уравнения определяет постоянную матрицу Р. Оптимальное управление имеет вид и {х, t) = -R~BPx. Приведенный выше результат совпадает с результатом, полученным в § 13.2, хотя все требуемые свойства можно получить и непосредственно из уравнения (15.49).


m 200

1,сек

Рис. 15.2: о) Оптимальные функции усиления обратной связи для системы, рассматриваемой в примере 15.2; б) оптимальная траектория для системы, рассматриваемой в примере 15.2

Уравнение и* (х, t) = -R~BPx означает, что все переменные состояния должны быть известны. Это означает, что должны точно измеряться выходной сигнал и (п - 1) его производная. Это очень жесткое требование.

По существу, применительно к случаю одного управляющего воздействия Калман [97] показал, что если в приведенной выше задаче уравнение (15.49) определяет постоянную матрицу Р, получается строгое решение в частотной области.

Пусть объект, определяемый уравнением х = Ах Ьи, полностью управляем (см. § 3, 6), а показатель качества имеет вид

{хЦ1) Qx{t) + mHt))dt,

* Т Т

управление - суть и = -(1/г) b Рх = -k х, когда к = ЬР/г. Тогда передаточная функция разомкнутой оптимальной системы управления равна (см. § 3.5)

а оптимальное

r{s)=k (sI - Ar Ь.

(15.50)

Предполагается, что Q является положительно определенной, а г > 0.



Покажем, что функция (s) обладает тем свойством, что при всех частотах ш

1 + *(/ш)>1. (15.51)

Для доказательства заметим, что в нашем случае

при этом / можно нормировать так, что г = 1.

Таким образом, уравнение (15.49) принимает вид i>

~PA-AP=Q - PbbP. (15.52)

Прибавляя и вычитая sP, получим

/>(8/ - Л) + (-8/ - Л)/>=е -(15.53)

Передаточна! функция объекта от и до л: определяется выражением Н(&) = (s/ -Л)-! Ь.

Если обе стороны уравнения (15.53) предварительно умножить на

tf (-s), а затем на Н (s), то найдем

(-S) РЬ + ЬРН (S) = (-S) \Q - РЬЬР\ Н (S)

(-S) РЬ + (-S) PbbPH (s) + г;>Я (s) = (-s) (s), (15.54)

так как положительно определенную матрицу Q можно представить в виде

Q = DKD,

где матрица D - действительная, а матрица Л - действительная, положительно определенная и диагональная

Уравнение (15.54) можно записать (с учетом того, что k = РЬ) следующим образом:

[\+H\-s)k)[\+kH{s)) = \H\-s)DADH{s). (15.55)

. Ввиду того, что kH (s) = F (s), имеем при s = уш

\l+F* (/со) Р 1 -Ь (-/ш) DADH (/ш). (15.56)

Так как последний член уравнения (15.53) всегда положителен, то условие (15.51), очевидно, выполняется. Его можно представить в виде единичной окружности с центром в точке -1 + /О, которую годограф F* (/со) не должен касаться или входить в нее. Это значит, что какой бы ни была первоначальная передаточная функция объекта G (s), оптимальный линейный регулятор путем компенсации будет превращать ее в F* (/со) с указанными выше свойствами. Нет необходимости говорить, что вследствие строгости условия (15.51) оптимальное управление трудно будет осуществить в случае нетривиальных управляемых объектов.

Хотя приведенные выше результаты применимы лишь к системам без элемента сравнения, их можно очень легко распространить на системы

) В случае одного управляющего воздействия вектор R в уравнении (15.49) переходит в скаляр г.

2) См. работу [12]. .



с элементами сравнения и входными сигналами, принадлежащими к какому-то определенному классу.

Рассмотрим линейный стационарный объект с одним входом и выходом, -определяемый уравнениями х = Ах + Ьи и у = сх.

Обозначим через z (t) входной сигнал, поступающий на элемент сравнения. В частности, желательно найти такую функцию управления и, чтобы минимизировать функционал

/ = j (9 (О + ru (0) dt, . (l5.57)

где eit) = z (t) - у (t).

Ввиду того, что функция Z (t) зависит от времени, следует ожидать, что управление и (х, t) будет нестационарным даже в том случае, когда верхний предел интегрирования в показателе качества равен бесконечности и управляемый объект является полностью управляемым и наблюдаемым (см. § 3, 6), и описывается передаточной функцией G (s) = [М {s)/L (8)] или операторным уравнением L (р) у (t) = М{р) и (t) (см. §2.3). Если z (t) подчиняется соотношению

L (р) z{t) = 0, . (15.58)

то можно написать

L (р) е (t) = -М (р) и (0; . (15.59)

последнее можно рассматривать как уравнение эквивалентного объекта -с входным сигналом -и (t) и выходным сигналом е (t). Можно выбрать подходящий набор переменных состояния, чтобы охарактеризовать эквивалентный управляемый объект (15.59) (например, е () и ее п - 1 производных). Таким образом, задачу, рассмотренную в § 12.2 в частотной области, теперь можно полностью рассмотреть во временной области.

15.5. СВЯЗЬ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ С ПРИНЦИПОМ МАКСИМУМА

Внимательный читатель, возможно, обратил внимание на заметное сходство выражений (15.22) или (15.24) и выражения, связанного с максимизацией функции Гамильтона в формулировке задачи оптимального управления на основе принципа максимума. Так как для любой функции F шах (-F) = = -min F, то выражение (15.24) можно записать в виде

= max

~L (х (и, t), и, t) - [Щр /] . (15.60)

Если вдоль оптимальной траектории вектор -df*ldx отождествить с сопряженным вектором -ф, то величина, заключенная в квадратных Скобках в уравнении (15.60), является гамильтонианом Я для принципа максимума. Заметим, что в этом случае величина df*ldt представляет собой величину Я (л:*, и*, t, 1) и выполняется условие 2 принципа максимума (теорема 14.3) (см. упражнение 15.13). При этих условиях имеем

-чКО; (15.61а)

. = Я* = Я(л:*, и*, t, ф). (15.616)



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 [ 143 ] 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования.