Главная > Разное > Геометрическая теория управления
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 12. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

В этой главе мы докажем фундаментальное необходимое условие оптимальности для задач оптимального управления — принцип максимума Понтрягина (ПМП). Чтобы получить бескоординатную формулировку принципа максимума, мы используем технику симплектической геометрии, изложенную в предыдущей главе. Первая классическая версия ПМП была получена Понтрягиным и его сотрудниками [15] для задач оптимального управления в евклидовом пространстве.

12.1. Геометрическая постановка и обсуждение принципа максимума

Рассмотрим задачу оптимального управления, поставленную в параграфе 10.1 для управляемой системы

с начальным условием

Определим семейство функций Гамильтона:

В терминах предыдущей главы

Зафиксируем произвольный момент времени

В параграфе 10.2 задача оптимального управления была сведена к исследованию границы множеств достижимости. Сформулируем необходимое условие оптимальности в этой геометрической постановке.

Теорема 12.1 (ПМП). Пусть есть допустимое управление, соответствующее решение задачи Коши (12.1), (12.2). Если

то существует такая липшицева кривая в кокасательном расслоении

что

для почти всех

Если допустимое управление, липшицева кривая в для которой выполняются условия (12.3)-(12.5), то говорят, что пара удовлетворяет ПМП. В этом случае кривая А называется экстремалью, а ее проекция экстремальной траекторией.

Замечание. Если пара удовлетворяет принципу максимума, то

Действительно, так как допустимое управление ограничено, максимум в правой части (12.5) можно брать по компакту Далее, функция

липшицева по Покажем, что производная этой функции равна нулю. Для любого допустимого управления

поэтому

Следовательно,

если функция дифференцируема в точке Аналогично,

поэтому

Итак,

и тождество (12.6) доказано.

Гамильтонова система принципа максимума

является расширением исходной системы (12.1) на кокасательное пространство. Действительно, в канонических координатах из гамильтоновой системы получаем

То есть решение системы (12.7) есть гамильтонов лифт решения системы (12.1):

Прежде чем доказать принцип максимума Понтрягина, обсудим это утверждение.

Дадим эвристическое объяснение того, что кривая ковекторов естественно возникает при изучении траекторий, приходящих на границу множества достижимости. Пусть

Рис. 12.1. Опорная гиперплоскость и нормальный ковектор ко множеству достижимости в точке

Идея состоит в том, чтобы рассмотреть нормальный ковектор ко множеству достижимости вблизи более точно — нормальный ковектор к некоторому выпуклому касательному конусу к . В силу включения (12.8) этот выпуклый конус должен быть собственным. Поэтому он имеет опорную гиперплоскость, т. е. линейную гиперплоскость в которая ограничивает полупространство, содержащее этот конус. Далее, эта опорная гиперплоскость есть ядро некоторого нормального ковектора (рис. 12.1). Ковектор — аналог множителей Лагранжа.

Чтобы построить всю кривую рассмотрим поток, порожденный управлением

Легко видеть, что

Действительно, если точка достижима из вдоль управления , то точка достижима из вдоль управления

Далее, диффеоморфизм удовлетворяет условию

Поэтому если то От противного из включения (12.8) следует, что

Касательный конус к в точке имеет нормальный ковектор По предложению 11.3 кривая есть траектория гамильтонова векторного поля т. е. гамильтоновой системы ПМП.

Несложно получить и условие максимума ПМП. Касательный конус к должен содержать инфинитезимальное множество достижимости из точки

т. е. множество векторов, получаемых вариациями управления и вблизи Поэтому ковектор должет задавать опорную гиперплоскость к этому множеству:

т. е.

Перенося ковектор потоком получаем условие максимума

Следующее утверждение демонстрирует силу принципа максимума.

Предложение 12.1. Предположим, что максимизированный гамильтониан принципа максимума

определен и -гладок на

Если пара удовлетворяет принципу максимума, то

Обратно: если липшицева кривая является решением гамильтоновой системы (12.9), то можно подобрать допустимое управление так, чтобы пара удовлетворяла ПМП.

Иными словами, в благоприятном случае, когда максимизированный гамильтониан является -гладким, принцип максимума сводит задачу к исследованию решений всего одной гамильтоновой системы (12.9). С точки зрения размерности это — лучшее, чего можно ожидать. Действительно, для полномерного множества достижимости имеем т.е. нам требуется -параметрическое семейство кривых для описания границы С другой стороны, семейство решений гамильтоновой системы (12.9) с начальным условием является n-мерным. Учитывая однородность гамильтониана Н:

получаем искомое -мерное семейство кривых. Докажем предложение 12.1.

Доказательство. Покажем, что если допустимое управление удовлетворяет условию максимума (12.5), то

По определению максимизированного гамильтониана

С другой стороны, в силу условия максимума вдоль экстремали это неравенство обращается в равенство:

Поэтому

Но гамильтоново векторное поле получается из дифференциала гамильтониана стандартным линейным преобразованием, поэтому равенство (12.10) доказано.

Обратно: пусть есть траектория гамильтоновой системы Так же, как в доказательстве теоремы Филиппова, выберем допустимое управление на котором достигается максимум вдоль А:

Мы показали выше, что тогда выполняется равенство (12.10). Поэтому пара удовлетворяет принципу максимума.

<< Предыдущий параграф Следующий параграф >>
Оглавление