Главная > Разное > Геометрическая теория управления
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

20.6. Системы со скалярным управлением

В этом параграфе мы применим условия оптимальности первого и второго порядков к простейшему (и наиболее сложному для управления) случаю систем со скалярным управлением:

Система аффинна по управлению, и условие Лежандра автоматически вырождается. Далее, управление одномерно, поэтому условие Гоха тривиально. Впрочем, обобщенное условие Лежандра работает (мы выпишем его ниже). Сначала применим принцип максимума Понтрягина. Введем линейные на слоях кокасательного расслоения гамильтонианы

тогда гамильтониан системы равен

Мы будем рассматривать экстремали, соответствующие управлению

Гамильтонова система ПМП имеет вид

а условие максимума сводится к тождеству

Экстремали липшицевы, поэтому предыдущее тождество можно дифференцировать:

Равенства (20.44), (20.45), выполняющиеся тождественно вдоль любой экстремали которая удовлетворяет (20.42), не позволяют

определить соответствующее управление Чтобы получить равенство, содержащее продолжаем дифференцировать:

Введем обозначение для гамильтонианов:

Тогда любая экстремаль с ограничением (20.42) удовлетворяет тождествам

Если то экстремальное управление определяется однозначно точкой

Заметим, что условие регулярности тесно связано с обобщенным условием Лежандра. Действительно, для гамильтониана обобщенное условие Лежандра принимает вид

т. е.

Если же это неравенство становится строгим, то управление определяется соотношением (20.48).

Предположим, что и подставим управление определяемое равенством (20.48), в гамильтонову систему (20.43):

Любая экстремаль, на которой выполняются условия (20.42) и есть траектория этой системы.

Лемма 20.3. Многообразие

инвариантно для системы (20.49).

Доказательство. Прежде всего заметим, что условие регулярности гарантирует, что условия (20.50) определяют гладкое многообразие, так как линейно независимы. Введем гамильтониан

Соответствующее гамильтоново векторное поле

совпадает с полем (20.49) на многообразии поэтому достаточно показать, что касается этого многообразия. Вычислим производные вдоль поля

Линейная система с переменными коэффициентами для

имеет единственное решение. Поэтому для начальных условий получаем решение Следовательно, многообразие (20.50) инвариантно для поля а потому и для поля (20.49).

Теперь опишем все экстремали системы (20.41), удовлетворяющие условиям (20.42) и Любая такая экстремаль принадлежит многообразию и через любую точку этого многообразия, удовлетворяющую граничным условиям на управление

проходит единственная такая экстремаль — траектория системы (20.49).

В задачах, рассмотренных в гл. 13 и 18 (машина Дубинса, вращение вокруг двух осей в все особые экстремали возникали именно таким образом. В общем случае и все экстремали, удовлетворяющие (20.42), могут быть изучены, как это сделано выше. Но в некоторых важных примерах гамильтониан может обращаться в нуль. Например, рассмотрим механическую систему с управляемой силой

или, в стандартной форме,

Векторные поля в правой части равны

поэтому

Более общо, также обращается в нуль для систем вида

Интересный пример системы такого рода — машина Дубинса с управлением угловым ускорением:

Имея в виду такую мотивацию, рассмотрим теперь случай, когда

Тогда равенство (20.47) не содержит и мы продолжим дифференцирование, чтобы получить уравнение, определяющее управление

Оказывается, сомножитель при тождественно обращается в нуль при условии (20.52):

Поэтому получаем, в дополнение к (20.46), (20.47) и (20.52), еще одно тождество без

Продолжим дифференцирование:

Для машины Дубинса с управлением угловым ускорением и в случае общего положения (в классе систем это также верно. При условии можно выразить управление в виде из уравнения (20.53) и найти все экстремали так же, как в случае

Упражнение 20.7. Покажите, что для машины Дубинса с управлением угловым ускорением особые траектории суть прямые на плоскости

Впрочем, эта система устроена по-новому. Появляется новый тип оптимального управления, когда управление имеет бесконечное число переключений на компактных временных интервалах.

Для стандартной машины Дубинса (с управлением угловой скоростью) особые траектории могут сопрягаться с релейными траекториями следующим образом:

или

Покажем, что при управлении угловым ускорением такие управления не могут быть оптимальны.

Приведенное ниже рассуждение показывает, как наши методы могут применяться в ситуациях, не покрываемых формальной теорией. В ходе этого рассуждения мы докажем предложение 20.5, сформулированное на стр. 314.

Рассмотрим задачу быстродействия для нашей системы со скалярным управлением (20.41). Докажем, что не существует оптимальных по быстродействию траекторий, содержащих особый участок, за которым следует релейный участок. От противного: предположим, что такая траектория существует. Рассмотрим сужение этой траектории на особый и релейный участки:

Пусть экстремаль, соответствующая экстремальной траектории Предположим, что такая экстремаль единственна с точностью до ненулевого множителя (в типичном случае это так). Перепараметризуя управление (т. е. выбирая в качестве нового управления), получаем

без изменения структуры скобок Ли. Заметим, что сейчас мы изучаем оптимальную по быстродействию траекторию, а не геометрически оптимальную, как раньше. Впрочем, гамильтониан для задачи быстродействия такой же, как для геометрической задачи, поэтому проведенный выше анализ особых экстремалей применим. По сути ниже мы докажем, что особый и релейный участки не могут сопрягаться не только на оптимальной по быстродействию траектории, но также и на оптимальной по медленнодействию или геометрически оптимальной траектории.

Мы предполагаем, что поля удовлетворяют тождеству

а экстремаль удовлетворяет неравенству

Так как то из равенства (20.53) следует

Из условия максимума ПМП следует, что

т. е. вдоль всей экстремали

Но на особом участке поэтому

Первая отличная от нуля производная функции при положительна. Имея в виду, что на релейном участке мы вычислим эту производную. Так как то первые три производные обращаются в нуль:

Поэтому четвертая производная неотрицательна:

Так как получаем

Сейчас мы используем это неравенство с тем, чтобы получить противоречие благодаря теории второй вариации.

Напомним выражение (20.29) для гессиана отображения в конец:

Здесь

Первый член в выражении для гессиана (20.57) обращается в нуль:

Дважды интегрируя второй член по частям, получаем

где

Первый член в (20.58) доминирует на игольчатых вариациях

Вычислим главный член в гамильтоновой форме:

В силу неравенства (20.56)

где

для достаточно малых Это означает, что

для любой функции Тогда

т. е. кривая является гладкой при и имеет касательный вектор

Итак, вариация оптимального управления и в направлении порождает касательный вектор множеству достижимости принадлежащий полупространству

Так как экстремальная траектория есть проекция единственной с точностью до скалярного множителя экстремали то управление и является критической точкой коранга один отображения в конец:

Это означает, что существуют вариации управления, порождающие гиперплоскость касательных векторов к

Итак, вариации управления и на особом участке порождают неотрицательное подпространство ковектора Л:

Добавим игольчатую вариацию на релейном участке. Так как управление неособое, заключаем, что функция переключения Выберем любой момент

Добавим игольчатую вариацию, сосредоточенную на малых отрезках вблизи

Игольчатая вариация порождает касательный вектор

эта производная вычисляется, как в доказательстве принципа максимума (см. лемму 12.2). Определим расположение вектора

относительно гиперплоскости

Так как то из принципа максимума следует, что поэтому

Перенесем касательные векторы из

Неравенство (20.59) переносится в неравенство

помимо этого, конечно,

Неравенство означает, что игольчатая вариация на релейном участке порождает касательный вектор в полупространстве дополнительном к полупространству порожденному вариациями на особом участке. Подведем итоги. Отображение

удовлетворяет условию

По лемме 12.1 и замечанию после нее отображение локально открыто в точке Поэтому образ отображения содержит окрестность конечной точки По непрерывности остается в образе для достаточно малых Иными словами, точка достижима из до за время т. е. траектория неоптимальна по быстродействию, противоречие.

Мы доказали, что оптимальная по быстродействию траектория не может содержать особого участка, за которым следует релейный участок. Аналогично, особый участок не может следовать за релейным.

Получаем следующее утверждение о возможной структуре оптимального управления.

Предложение 20.5. Пусть векторные поля в правой части управляемой системы (20.41) удовлетворяют тождеству

Пусть оптимальная по быстродействию траектория этой системы является проекцией единственной с точностью до скалярного множителя экстремали А, и пусть

Тогда траектория не может содержать особого участка и релейного участка, прилегающих друг к другу.

Замечание. В этом рассуждении оптимальные по быстродействию управления можно заменить оптимальными по медленнодействию или геометрически оптимальными управлениями.

Что происходит вблизи особых траекторий при условии (20.60)? Предположим, что особая траектория оптимальна (как прямые для задачи Дубинса с управлением угловым ускорением). Заметим, что оптимальное управление существует, поэтому функция качества всюду определена. Для граничных условий, достаточно близких к особой траектории, есть два возможных типа оптимального управления:

(1) либо оно совершает бесконечное число переключений на компактном временном отрезке, прилегающем к особому участку, так что оптимальная траектория «сходит» с особой траектории с бесконечным числом переключений;

(2) либо оптимальное управление релейно, но число переключений бесконечно возрастает, когда конечная точка приближается к особой траектории.

В случае (1) говорят, что имеет место явление Фуллера. Оказывается, что явление Фуллера действительно возникает в задаче Дубинса с управлением угловым ускорением (рис. 20.1).

Рис. 20.1. Сопряжение особого участка и участка с явлением Фуллера

Приведенные выше рассуждения подсказывают, что это явление не патология, но неизбежность для некоторых классов систем (в частности, в приложениях). Это явление можно наблюдать, останавливая теннисный мячик между столом и опускающейся ракеткой. Теория явления Фуллера описана в книге [18]. Из этой теории следует, что в задаче Дубинса с управлением угловым ускорением действительно реализуется альтернатива (1).

<< Предыдущий параграф Следующий параграф >>
Оглавление