Главная > Разное > Геометрическая теория управления
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

13.5. Машина Дубинса

В этом параграфе мы изучим задачу быстродействия для системы, которая называется машиной Дубинса, см. уравнения (13.21) ниже. Первым эту систему рассматривал А.А. Марков в 1887 году [109].

Рассмотрим машину, движущуюся по плоскости. Машина может ехать вперед с постоянной линейной скоростью и одновременно поворачиваться с ограниченной угловой скоростью. Выберем начальное и конечное положение и ориентацию машины на плоскости. Задача состоит в том, чтобы перевести машину из начальной конфигурации в конечную за минимальное время.

Допустимые траектории машины — плоские кривые ограниченной кривизны. Параметризуя кривые длиной дуги, можно поставить данную задачу геометрически. Зафиксируем две точки на плоскости и два единичных вектора, приложенных соответственно в этих точках. Требуется найти кривую на плоскости, выходящую из первой точки с первым вектором скорости и входящую во вторую точку со вторым вектором скорости, имеющую кривизну, ограниченную сверху заданной константой, и кратчайшую среди всех таких кривых.

Замечание. Аналогичная задача с неограниченной кривизной, вообще говоря, не имеет решений. Действительно, точная нижняя грань длин всех кривых, удовлетворяющих граничным условиям без ограничения на кривизну, равна расстоянию между начальной и конечной точками: соединяющий эти точки отрезок можно приблизить гладкими кривыми, удовлетворяющими граничным условиям. Но эта нижняя грань не достигается, если граничные векторы скорости не сонаправлены вектору, соединяющему граничные точки.

После выбора подходящих единиц измерения получаем задачу быстродействия для нелинейной системы

Существование решений следует из теоремы Филиппова. Применяем принцип максимума Понтрягина.

Имеем обозначим через соответствующие координаты присоединенного вектора. Тогда

и зависящий от управления гамильтониан равен

Из гамильтоновой системы принципа максимума следует, что

а условия максимума записываются как

Уравнение (13.22) означает, что постоянно вдоль оптимальных траекторий, поэтому правую часть (13.23) можно переписать как

Итак, из гамильтоновой системы ИМИ (13.21)-(13.23) получена система

Из условия максимума (13.24) следует, что

Если то поэтому Следовательно, кривая есть дуга окружности радиуса 1.

Пусть тогда из (13.25) получаем Условия сохраняются при умножении присоединенного вектора на любое положительное число. Можно подобрать так, что Поэтому далее будем считать, что

Условие (13.26) означает, что поведение знака функции имеет решающее значение для структуры оптимального управления. Рассмотрим несколько возможностей для

(0) Если функция не обращается в нуль на отрезке то оптимальное управление постоянно:

а оптимальная траектория есть дуга окружности. Отметим, что оптимальная траектория не может содержать полной окружности: окружность можно исключить, при этом полученная траектория удовлетворяет граничным условиям и короче исходной. Поэтому управление (13.27) оптимально только при

Далее можно предполагать, что множество

отлично от всего отрезка Так как открыто, оно является объединением открытых интервалов на плюс, быть может, полуоткрытые интервалы вида

(1) Предположим, что множество содержит интервал вида

Можно считать, что интервал максимален по включению:

Из принципа максимума получаем неравенство

Поэтому

Это неравенство означает, что угол

удовлетворяет включению

Рассмотрим сначала случай

Тогда поэтому в момент управление переключается с —1 на +1, поэтому

Вычислим расстояние Так как

имеем поэтому

В случае

включение (13.29) доказывается аналогично, а в случае оптимальных управлений нет (кривая содержит полную окружность, которую можно удалить).

Включение (13.29) означает, что последовательные корни функции не могут быть сколь угодно близки между собой. Более

того, вышеприведенное рассуждение показывает, что в такие моменты оптимальное управление переключается с одного экстремального значения на другое, и вдоль любой оптимальной траектории расстояние между последовательными переключениями одно и то же.

Итак, в случае (1) оптимальное управление может быть только следующего вида:

Здесь не указаны значения и на интервалах до первого переключения, и после последнего переключения, На таких траекториях управление принимает только экстремальные значения и количество переключений конечно на любом компактном отрезке времени. Такое управление называется релейным.

Рис. 13.3. Исключение четырех переключений

Управления вида (13.30), (13.31) удовлетворяют принципу максимума для сколь угодно больших но они неоптимальны, если количество переключений Действительно, допустим, что такое управление имеет по крайней мере 4 переключения. Тогда кусок траектории [71,74], есть конкатенация трех дуг окружностей, соответствующих отрезкам времени [72,73], [73,74], причем

Проведем отрезок

общую касательную к первой и третьей окружностям через точки (рис. 13.3). Тогда кривая

есть допустимая траектория, более короткая, чем Мы доказали, что оптимальное релейное управление не может иметь более трех переключений.

(2) Осталось рассмотреть случай, когда множество не содержит интервалов вида (13.28). Тогда состоит из не более двух полуоткрытых интервалов

где один или оба интервала могут отсутствовать. Если то функция имеет единственный корень на отрезке [0, и соответствующее оптимальное управление определяется условием (13.26). Если же

то

В этом случае условие максимума ПМП (13.26) не определяет однозначно оптимальное управление так как максимум достигается для более чем одного значения управляющего параметра и. Такое управление называется особым. Тем не менее, особое управление в этой задаче можно определить из принципа максимума. Действительно, на интервале выполняются следующие тождества:

Следовательно, если оптимальная траектория имеет особый участок — прямолинейный отрезок, то оптимальное управление переключается только в моменты Тогда

и вся траектория есть конкатенация дуги окружности радиуса 1

прямой

и еще одной дуги окружности радиуса 1

Итак, оптимальные траектории в данной задаче имеют могут быть одного из следующих двух типов:

(1) конкатенация релейного участка (дуга окружности, особого участка (отрезок прямой, и релейного участка;

(2) конкатенация релейных участков с не более чем тремя переключениями, причем дуги окружностей между переключениями имеют один и тот же центральный угол

Если граничные точки достаточно далеки друг от друга, то их можно соединить только траекториями с особым участком. Для таких граничных точек получаем простой алгоритм построения оптимальной траектории. Через каждую из точек проведем пару окружностей радиуса 1, касающихся соответственно векторов скорости Затем

проведем общие касательные к окружностям в соответственно так, чтобы направление движения по этим касательным было совместимым с направлением вращения на окружностях, определенным граничными касательными векторами (рис. 13.4).

Рис. 13.4. Нахождение кратчайшей кривой для далеких граничных точек

Наконец, выберем из построенных кривых кратчайшую. Эта кривая и будет оптимальной траекторией.

<< Предыдущий параграф Следующий параграф >>
Оглавление