Главная > Разное > Геометрическая теория управления
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

21.5. Достаточные условия оптимальности

В этом параграфе мы получим достаточные условия оптимальности для задачи с интегральным функционалом:

с закрепленным или свободным конечным временем. Отметим, что сейчас мы будем изучать оптимальную задачу, а не геометрическую, как раньше. Однако теория уравнения Якоби остается применимой, так как уравнение Якоби зависит только от гамильтониана и экстремальной пары

Для нормального гамильтониана принципа максимума

и регулярной экстремальной пары задачи оптимального управления рассмотрим уравнение Якоби

В параграфе 21.3 мы показали, что отсутствие сопряженных точек на интервале необходимо для геометрической оптимальности (по крайней мере в аналитическом случае коранга один).

Упражнение 21.1. Покажите, что отсутствие сопряженных точек на необходимо и для оптимальности (в аналитическом случае), сводя задачу оптимального управления к геометрической.

Покажем теперь, что отсутствие сопряженных точек также достаточно для оптимальности (в регулярном случае).

Траектория называется сильно оптимальной для задачи оптимального управления, если она реализует локальный минимум функционала качества относительно всех траекторий системы, близких к в равномерной топологии и имеющих те же граничные точки, что и Если этот минимум строгий, то траектория называется строго сильно оптимальной.

Теорема 21.3. Пусть есть регулярная нормальная экстремаль в задаче с интегральным функционалом и закрепленным временем, и пусть максимизированный гамильтониан гладок в окрестности

Если промежуток не содержит сопряженных точек, то экстремальная траектория строго сильно оптимальна.

Доказательство. Мы используем теорию полей экстремалей (см. параграф 17.1) и вложим в семейство экстремалей, хорошо проецирующееся на

Максимизированный гамильтониан

определен и гладок. Тогда по теореме 17.1 достаточно построить такую функцию что семейство многообразий

хорошо проецируется на М:

Иными словами, требуется, чтобы касательные пространства имели нулевое пересечение с вертикальными подпространствами

Это возможно благодаря отсутствию сопряженных точек (типичная ситуация для сопряженной точки — складка при проекции на изображена на рис. 21.1).

Рис. 21.1. Сопряженная точка — складка

Мы докажем ниже существование такого многообразия благодаря переходу к его касательному пространству лагранжеву подпространству в (см. определение в п. 11.5.3). Для любого лагранжева подпространства С X), трансверсального По, можно найти такую функцию что график ее дифференциала удовлетворяет условиям:

Действительно, в канонических координатах на определим функцию вида

с симметричной -матрицей А. Тогда

и остается только выбрать линейное отображение с графиком Заметим, что симметричность матрицы А соответствует лагранжевости подпространства Ниже мы используем аналогичную конструкцию для параметризации лагранжевых подпространств квадратичными формами.

Для завершения доказательства осталось найти такое лагранжево подпространство , что

В силу (21.29) гамильтонов поток с максимизированным гамильтонианом имеет разложение

Заметим, что поток на порожден потоком на поэтому он сохраняет семейство вертикальных подпространств:

Таким образом, остается доказать существование лагранжева подпространства для которого

Предложение 21.3 устанавливает связь между гамильтонианом уравнения Якоби и гамильтонианом

Следовательно, поле есть линеаризация поля в особой точке гамильтониан и гамильтоново поле суть соответственно главные

члены тейлоровского разложения в точке Линеаризация потока есть поток линеаризации, поэтому

Введем обозначение для потока уравнения Якоби:

Тогда

и равенство (21.31) переписывается в виде

Остается доказать существование лагранжева подпространства удовлетворяющего этому равенству.

Напомним, что отрезок не содержит сопряженных точек:

где пространство постоянных вертикальных решений уравнения Якоби на (см. (21.30)).

Для того чтобы прояснить основные идеи доказательства, рассмотрим сначала простой случай, когда

т. е.

Возьмем любое лагранжево подпространство являющееся горизонтальным, т. е. трансверсальным вертикальному подпространству Тогда пространство X распадается в прямую сумму:

Выберем такое что

В силу непрерывности потока существует такая окрестность вертикального подпространства По, что для любого лагранжева подпространства из этой окрестности

Для завершения доказательства остается найти такое лагранжево подпространство удовлетворяющее условию

Введем параметризацию множества лагранжевых подпространств , достаточно близких к Выберем координаты Дарбу

на в которых

Такие координаты можно выбрать многими способами. Действительно, симплектическая форма а задает невырожденное спаривание взаимно трансверсальных лагранжевых подпространств По и Н:

Возьмем любой базис в По и соответствующий базис в двойственный относительно этого спаривания, и мы получим базис Дарбу в В координатах Дарбу симплектическая форма записывается как

Любое n-мерное подпространство трансверсальное есть график линейного отображения

т. е.

Подпространство лагранжево тогда и только тогда, когда соответствующее отображение имеет симметрическую матрицу в симплектическом базисе (упражнение):

Введем квадратичную форму на с матрицей

Множество лагранжевых подпространств , трансверсальных горизонтальному пространству параметризовано квадратичными формами на Для такой параметризации лагранжевых подпространств будем использовать термин -параметризация.

Рассмотрим семейство квадратичных форм параметризующее семейство лагранжевых подпространств вида

т. е.

Лемма 21.2. Справедливо равенство

Доказательство. Возьмем любую траекторию гамильтонова поля Из равенства

получаем

т. е.

В силу квадратичности гамильтониана получаем

Но левую часть легко вычислить:

в силу симметричности

Так как гамильтониан достигает минимума в имеем поэтому

Выберем начальное подпространство с помощью частичного порядка на квадратичных формах, индуцированного положительными формами. Выбирая любое лагранжево подпространство с соответствующей квадратичной формой

достаточно близкой к нулевой форме, получаем

То есть

на а потому и на всем отрезке

Равенство (21.32) доказано в простом случае (21.33). Теперь рассмотрим общий случай. Сейчас пересечение (По) непусто, но от него можно избавиться, переходя к уравнению Якоби на факторпространстве

Семейство постоянных вертикальных решений не возрастает:

Имеем и положим по определению Семейство непрерывно слева, обозначим его точки разрыва:

(отметим, что в простом случае (21.33) было Семейство постоянно на промежутках

Построим такие подпространства что

Заметим, что при получаем разложение вертикального подпространства:

Для любого горизонтального лагранжева подпространства можно построить соответствующее разложение Н:

Зафиксируем любое начальное горизонтальное подпространство Следующее утверждение завершает доказательство теоремы 21.3 в общем случае.

Лемма 21.3. Для любого к существуют такие число и лагранжево подпространство что любое лагранжево подпространство имеющее -параметризацию удовлетворяет условиям:

(2) , и лагранжево подпространство имеет -параметризацию

Доказательство. Докажем лемму индукцией по

Пусть При утверждение тривиально, поэтому считаем, что Возьмем любое и любое лагранжево подпространство с квадратичной формой метризации.

Заметим, что т.е. при Далее,

В силу непрерывности потока существует горизонтальное лагранжево подпространство с такой -параметризацией что Легко видеть, что подпространство задается в -параметризации квадратичной формой Мы уже доказали, что поэтому

в - параметризации.

Базис индукции доказан.

Докажем шаг индукции. Зафиксируем предположим, что утверждение леммы 21.3 доказано для и докажем его для

Пусть тогда Введем разложение горизонтального подпространства как в (21.34):

Обозначим

Так как то косоортогональное дополнение также инвариантно относительно потока уравнения Якоби:

Для того чтобы доказать, что вычислим это пересечение. В силу включения получаем

Поэтому требуется доказать, что

Так как подпространства инвариантны относительно потока фактор-поток определен корректно:

В факторе поток не имеет постоянных вертикальных решений:

Из рассуждений, приведенных при доказательстве простого случая (21.33), следует, что

для достаточно близких к По, т.е. для достаточно малых Поэтому

Теперь легко доказать, что это пересечение пусто:

Учитывая цепочку (21.35), получаем

т. е. мы доказали условие (1) из формулировки леммы 21.3 для

Переходим к условию (2). Так же, как при доказательстве базиса индукции, показываем, что существует такое горизонтальное лагранжево подпространство , что кривая лагранжевых подпространств трансверсальна В -napaметризации начальное подпространство задается положительной квадратичной формой Так как получаем

Условие (2) доказано для

Шаг индукции доказан, и доказательство данной леммы завершено.

В силу этой леммы

для всех начальных подпространств задаваемых квадратичными формами для некоторого параметризации. Это означает, что мы построили семейство экстремалей, содержащее и хорошо проецирующееся на По теореме 17.1 экстремаль сильно оптимальна. Теорема 21.3 доказана.

Для задачи с интегральным функционалом и свободным конечным временем аналогичное рассуждение и теорема 17.2 дают следующее достаточное условие оптимальности.

Теорема 21.4. Пусть , есть регулярная нормальная экстремаль в задаче с интегральным функционалом и свободным временем, и пусть гамильтониан гладок в окрестности

Если на отрезке нет сопряженных точек, то экстремальная траектория строго сильно оптимальна.

<< Предыдущий параграф Следующий параграф >>
Оглавление