Главная страница Системы автоматического управления Результаты Ла-Салля позволяют найти общую форму решения для устойчивых, полностью управляемых систем с мнимыми собственными значениями. Напомним, что мы с трудом нашли решение этой задачи в гл. 12, когда использовали интуитивные представления. Пример 14.1. Рассмотрим оптимальное побыстродействию управление колебательным объектом при отсутствии демпфирования, т. е. у у = и. Так как здесь имеется только один вход и система полностью управляема, она также /--управляема. В качестве ограничения для и примем условие t/. При = уих2= у находим, что
и, таким образом, переходная матрица системы имеет вид cos sin i - sin t cos t Так как система устойчива, она имеет единственное релейное оптимальное по быстродействию управление вида (14.16). Так как g (i) = цФ~ (t, 0) b = -т)х sin t + т]2 cos t, где г] и т] - составляющие вектора i\, имеем и* (t)=.Usign[g(t)] -\-U, если - T)i sin ;+TI2C0S f > 0; если - T)i sin t +f]2 cos t (14.17) Условие (14.17), казалось бы, решает рассматриваемую здесь задачу оптимального управления, но так как форма 6 (t) в каждый момент времени t неизвестна, то также неизвестно значение составляющих t)i и вектора ц для каждого данного л: (0). Таким образом, полученный результат не столь завершен, как хотелось бы. Если требуется определить оптимальное по быстродействию управление и (0) как функцию времени при данном начальном состоянии X (0), то следует: 1) задаться значением tj; 2) использовать закон управления (14.17) для отыскания траектории движения системы из начальной точки х (0); 3) если найденная траектория проходит через начало координат, то управление и* (f) является оптимальным, и, следовательно, ц выбрано правильным; 4) если результирующая траектория не проходит через начало координат, то ц выбрано неверно, и необходимо сделать другой выбор. Закон управления (14.17) позволяет определить кривые переключения для рассматриваемой задачи, если использовать метод, изложенный в гл. 12, связанный с решением задачи в обратном времени ). Система в функции обратного времени (где т - аргумент обратного времени, т = - i) описывается следующими дифференциальными уравнениями:
(14.18) соответствующая функция оптимального управления выражается формулой ( - и, если т)! sin т + cos \т > 0; и f т) - I \ и, если T)i sin т -f- Т)2 cos т < 0. Если выбрать вначале ti\i<C О, 112 = О * при г= О, то тогда и* (0) = -ft/. Воздействуя на систему с обратным временем, получим последнюю часть кривой переключения, которая на рис. 14.3 изображена в виде кривой Г. Такая кривая уже была получена в гл. 12. Но в точке г = Jt, в которой изображающая точка достигает оси х sin т изменяет знак, и после этого ы* (т) переключается; в результате получается полуокружность а (рис. 14.3) с центром в точке (-U, 0). Принцип обращения времени особенно эффективен применительно к системам второго порядка, в которых все переключения определяется кривой переключения. По мере увеличения порядка системы эффективность метода снижается. Если выбрать г] т]2 <[ О, ila <С i. то вначале траектория системы будет следовать по кривой Ti, но прежде чем она достигнет оси х произойдет переключение. После первого переключения траектория будет напоминать траекторию б. Как и траектория а, траектория б представляет собой окружность с центром в точке (-U, 0). Анализируя формулу (14.18), можно сделать два следующих вывода: 1) интервал времени между переключениями и* (т) составляет я сек; 2) получаемая оптимальная траектория состоит из дуг окружности, центры которых расположены в точках (-ft/, 0) и (-U, 0). Сказанное позволяет построить кривую переключения. Вправо от оси кривая состоит из полуокружностей, которые целиком лежат ниже оси х,. Центрами этих окружностей являются точки (и, 0); (Зи, 0); (5U, 0) и т. д. Влево от оси Хг кривая переключения расположена целиком выше оси х, и состоит из полуокружностей с центрами в точках (-U, 0); (-3t/, 0),. . . Оптимальное управление таково, что если начальное состояние системы располагается выше границы переключения, то и* = -U; если же начальное состояние располагается ниже границы переключения, то и* = +t/. Ясно, что число переключений управления и* (f) зависит от начального состояния jc (0). Типичная оптимальная траектория, исходящая из точки JC (0), показана на рис. 14.3, е. Далее целесообразно рассмотреть вопрос об единственности оптимального по быстродействию управления, полученного с помощью выражения (14.17). Как бьшо сказано выше, рассматриваемая система полностью управляема к имеет только одну компоненту управления; следовательно, она L-управляема. Таким образом можно ожидать, что решение, определяемое выражением (14.17), является единственным. Посмотрим, действительно ли это так. Заметим, что и* {t)= U sign [g (/); g {f) = -r\, sin + ila cos t. Неясность в знаке g {ty может возникнуть лишь в том случае, если ( = О в течение конечного интервала времени. Но это возможно только в том случае, если t)i = tjj = О, что нарушает требование, согласно которому т) не может быть нулевым вектором.
Рис. 14.3. Три типичные оптимальные траектории а, б я в к примеру 14.1 14.3. ПРИНЦИП IVlAKCHJWyjWA 1. Предварительное обсуждение Топологические методы Беллмана и Ла-Салля позволяют оценить достоинства принципа максимума Понтрягина. Принцип максимума был постулирован Л. С. Понтрягиным в 1956 г. В дальнейшем в ряде работ Л. С. Понтрягина и его коллег В. Г. Болтянского и Р. В. Гамкрелидзе этот принцип был доказан. Полученные результаты обобщены в книге [162]. Принцип максимума прежде всего представляет ценность для инженера благодаря универсальности своей формулировки. Различные типы задач оптимизации изучаются с единой точки зрения. Это позволяет получить, некоторые достаточные условия существования оптимального управления. Вторая положительная особенность принципа максимума вытекает непосредственно из первой. Поскольку имеется общность формулировки то любую информацию, получаемую при рассмотрении какой-либо одной задачи, можно использовать применительно ко всему классу. В частности используя метод Беллмана-Ла-Салля-Галкина, мы выводим единый геометрический подход. Важным следствием этого является понимание существа сопряженной переменной, которое достигается благодаря принципу максимума. Теперь становится очевидным, например, что множители Лагранжа в вариационном исчислении и довольно таинственные векторы к); при формулировке задач оптимального быстродействия Беллманом и Ла-Саллем связаны с сопряженными векторами. Еще важнее то, что геометрическая ориентация сопряженных векторов в конце интервала управления обеспечивает требуемые граничные условия. И, наконец, поведение сопряженных векторов на интервале управления определяет вообще наличие вырожденных или особых управлений. Что касается результатов, то, строго говоря, здесь не сделано какого-либо существенного шага вперед по сравнению с классическим вариационным исчислением *. Однако, используя функции Гамильтона, принцип максимума позволяет более эффективно, по сравнению с классическим вариационным исчислением, следить за множеством необходимых условий и условий трансверсальности. Конечно, эффективность метода представляет для инженеров первостепенную важность. 2. Формулировка задачи Рассмотрим с самого начала несколько более общий вариант задачи по сравнению с тем, который был исследован в предыдущей главе. В частности, для системы п-го порядка k = f{x,uj); x{h)==Xi (14.19)* необходимо выбрать такую функцию управления п (t) на интервале t t, чтобы: 1) изображающая точка была переведена из состояния х в момент времени в такое состояние в момент времени t, чтобы первые т составляющих текущего вектора состояния х {х, . . . , совпадали с т составляющими заданного конечного состояния Si, . . ., ; т п vl чтобы функционал достигал минимума **; 2) были учтены все ограничения, наложенные на п {t); без потери общности можно считать, что п (t) принимает значения внутри г-мерного единичного куба, определяемого условием м,- ( 1; г = 1, . . ., г. В приведенной выше формулировке некоторые переменные состояния (а именно, х. , . . . , х ) остались свободными в конечный момент времени t. Как будет видно ниже, этот класс задач очень часто встречается на практике. Сформулированную задачу можно теперь сделать еще более общей, учитывая формулу (14.20) непосредственно в уравнении (14.19). Это достигается путем введения дополнительной переменной состояния Xq, где , xo=L{x,u,t), (14.21)*** * За исключением, возможно, некоторых упомянутых выше доказательств достаточности. ** Предполагается, что/(х, u,f)B уравнении (14.19) является непрерывной функцией от Ю, кусочно-непрерывной функцией по и дважды непрерывно дифференцируемой по х. Принцип максимума можно доказать даже в том случае, если / лишь непрерывно дифференцируема по jc; однако это доказательство будет более сложным по сравнению с приведенньш. *** Предполагается, что L обладает теми же свойствами, что и функция / в уравнении (14.19) (см. предыдущую сноску). **** Благодаря выражению (14.21) задачу Лагранжа удалось преобразовать в задачу Майера.
|
© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования. |