Главная страница Системы автоматического управления в том случае, когда время Т является бесконечньш, напомним, ссылаясь на гл. 13, что оптимальная функция управления с обратной связью представляет собой постоянную матрицу, умноженную на текущее состояние. В рассматриваемом здесь одномерном случае следует ожидать, что оптимальное управление с обратной связью будет представлять собой константу, умноженную на выходной сигнал. При 7 оо состояние х и функция управления и должны стремиться к нулю, так как в противном случае функционал / будет бесконечньш. Однако, когда Итх (t) = О, то зна- чение р (О невозможно определить краевьм условием lim f* (х, t) = р (t) x = О и необхо- димо искать другие пути. Из уравнения (15.38) следует, что если Pi> р, то при Т оо k 0; уравнение (15.36) указывает на то, что р {t) = р,. Таким образом, lim р (f) = max (р р), а этот предел пред- ставляет собой постоянную величину. Отсюда следует, что dp/dt= 0. Следовательно, при Т оо оптимальное управление равно и* (t) = рх (t), где постоянная р есть больший из двух корней многочлена р + (2с2а/6) р - Cicjb = 0. Общую задачу приведенного выше типа, которую можно назвать задачей о синтезе регулятора, рассматривали Мерриэм Л139], Калман [92]. [96] и другие. Она формулируется следующим образом. Дан линейный нестационарный объект управления, который описывается уравнением. X = А (t) X + В (t) и с начальным условием л: (t,) = х, я с незаданным конечным состоянием л:(2)- Необходимо найти оптимальную функцию управления и* {t) на интервале [t tz], минимизирующую функционал х\х) Q (т) X (т) + и (т) R (т) (т)] dx, (15.40) где М, Q (t) и R (t) - симметричные матрицы, причем Q (t) и R (t) являются положительно определенными и обладают непрерывными вторыми производными по t; М - знакоположительная постоянная матрица (чтобы гарантировать единственный минимум). Сформулированная задача есть задача Больца; материала § 15.3 вполне достаточно для того, чтобы решить поставленную задачу. Выполним те же операции, что и в примере 15.1. Уравнение Беллмана имеет вид х (t) Q (О x{t) + и* (О R (t) * (О + + {-yiA{t)x + B{t)u*)]. (15.41) Граничное условие, вытекаюптее из уравнений (15.25) и (15.28в), сводится к Umf*{x,t) = -xit2)Mx{t. Процесс минимизации приводит к условию где L - подынтегральное выражение в уравнении (15.40). Из последнего условия следует и*(0 = -/?-Ч05Ч0(-£)- (15.42) (15.43) (15.44) Если хотим синтезировать линейное управление как функцию координат, то следует в качестве критерия качества /* принять квадратичную форму nx,t) = ~xP{t)x, (15.45) где Р (t) - симметричная матрица размерности п X п. Подставив выражения (15.44) и (15.45) в уравнение Беллмана (15.41), получим матричное уравнение Риккати - Т- = - (О it) В (t) P{t) + P ф A{t) + A (t) P (t) + + Qit) (15.46) с граничным условием P{h) = M. (15.47) Матрицу P (t) теоретически можно найти, интегрируя уравнение (15.46) в обратном времени с начальным условием (15.47). После нахождения матрицы Р (t), так как она симметрична, с помощью выражений (15.44) и (15.45) получим u4x.t) = - R-{t)B(t)P{t)x{t). . (15.48) Таким образом, единственный абсолютный минимум функционала (15.40) получается только в том случае, если матричное уравнение Риккати имеет одно решение. В отношении последнего Калман доказал следующую теорему Теорема 15.1 [96]. В соответствии с предположениями, принятыми в данном параграфе, уравнение (15.46) с граничным условием (15.47) имеет единственное решение для матрицы Р (t), при этом управление (15.48) является оптимальным по отношению к критерию оптимальности (15.45). Другими словами, уравнение Беллмана (15.41) обеспечивает для этого случая достаточное условие оптимальности. ПолучёЦные в данном параграфе результаты могут быть с успехом использованы при расчете контуров наведения с малыми возмущениями, например, при выводе на орбиту искусственного спутника. В подобных задачах ракета-носитель должна следовать по номинальной траектории. Но из-за нестационарности параметров ракеты-носителя она не следует точно по номинальной траектории. Для коррекции небольших отклонений относительно заданной траектории можно, например, линеаризовать динамику ракеты-носителя относительно заданной траектории. После этого, если выбран критерий оптимизации типа (15.40)), можно приступить к расчету в соответствии с методикой, изложенной в данном параграфе. Пример 15.2 3). Динамику линеаризованного контура наведения ракеты можно выразить в форме . 1 1 - х,; - Хз> Xg - и, где х, - боковое отклонение от номинальной траектории ; х, - скорость этого отклонения; Хз - угол направления вектора тяги. 1) Доказательство этой теоремы станет очевидным в § 15.7. ) Необходимость использовать критерий (15.40) возникает в тех случаях, когда требуется существование второй вариации от заданного функционала. Более подробно этот вопрос освещен в следующих главах. 8) Этот пример предоставили X. Хеффёс, Дж. М. Хольцман и С. Хоринг, сотрудники фирмы Белл Телефон. В проведенном ими исследовании учигьшалось влияние шума. Зависимость между боковой тягой и боковым ускорением нестационарна и определяется коэффициентом k,l(k2 - t), который учитьшает потерю массы при действии тяги. Интегрируемая связь между к и представляет собой линеаризованное уравнение привода. Если исходить из предположения о возможности точного измерения х, (t), х (О и х (t), то можно разработать такую систему управления с обратной связью, чтобы обеспечить оптимальное наведение ракеты, удовлетворив при этом заданному показателю качества. Предположим, что используется функционал вида / = 4- f (х (т) <? (т) X (т) + т) dt. где / = 10; Т = 250 сек, и <?(0 = (300 - tf
и пусть начальные условия представляют собой х, (0) = 3000 футов (~915 м); х (0) = = 800 фут/сек (~244 м/сек) и Xg (0) = 12 мрад. Тогда в принятой в данном параграфе системе обозначений имеем О О .1. нам необходимо решить матричное уравнение Риккати (15.46) с граничньм условием Р (Т) = 0. Рассмотрим решение (15.48). Ввиду того, что гЬ= [0,0, Viol, используем лишь последнюю строку симметричной матрицы P(t) = [pcj (t)], (i, j = 1, 2, 3). В этом случае имеем и* (X, О = -/ю) [Pi3. Ргз. Paslxif). Однако вследствие матричного характера уравнения (15.46) можно легко показать, что необходимо решить следующие шесть связанных нелинейных дифференциальных уравнений с граничивши условиями в одной точке: Ри(0 = 4тР?з(0-
(300-0 Pi2 (О = -Q Pi3 (О Ргз (О - Pii it); Pi3 = -Jq Pis (0 Рзз (0 - kZZJ Р22 = -Рз(0-2р12(0- 10-3 (300-0 1 R Раз = - jQ Ргз (t) Рзз (t) - Рга W - Pi3 (0; Йаггз (300-0 Эту систему можно решить численно, двигаясь в обратном времени от f = Т z граничньм условием Р(Т)= 0. Функции р, (t), р.23 ((), Рзз (О изображены графически для k, = 9380 и 2 = 315 (рис. 15.2а). На графике также нанесена оптимальная траектория х* (t) (рис. 15.26) [см. упражнение 15.8). Калман показал, что при Т оо для полностью управляемой линейной стационарной системы и показателя качества [х (т) Qx (т) + (т) Ни {%)) dx.
|
© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования. |