Главная > Разное > Геометрическая теория управления
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

ПРЕДИСЛОВИЕ

Перед Вами — учебник по математической теории управления, представленной с геометрической точки зрения. В основу книги легли курсы лекций, прочитанные старшим из соавторов в 2000-2001 гг. в Международной школе высших исследований в г. Триест (Италия). Предварительные знания, необходимые для чтения книги, сводятся к стандартным курсам математического анализа, линейной алгебры и обыкновенных дифференциальных уравнений, а также к некоторым начальным сведениям из теории функций действительного переменного и функционального анализа; не требуется предварительного знакомства ни с теорией управления, ни с дифференциальной геометрией.

О чем же эта книга? Детерминированный мир классической физики описывается гладкими динамическими системами. Будущее в такой системе полностью определено начальными условиями; более того, близкое будущее меняется гладко, если гладко менять начальные условия. Оставляя место для свободной воли (не для случая, а именно для свободной воли) в этой мрачноватой картине полной предопределенности, мы получаем управляемую систему. Мы просто разрешаем менять некоторые параметры системы: менять в известных пределах, но в любое время, когда вздумается. Собственно, это то, что мы постоянно проделываем со своим телом, автомобилями, летательными аппаратами, технологическими процессами и т. д. Мы управляем всеми этими динамическими системами!

Гладкие динамические системы описываются дифференциальными уравнениями. В этой книге мы имеем дело только с конечномерными системами: они описываются обыкновенными дифференциальными уравнениями на конечномерных гладких многообразиях. Управляемая система — это семейство обыкновенных дифференциальных уравнений. Семейство параметризовано управляющими параметрами. Все уравнения данного семейства определены на одном и том же многообразии, которое называется пространством состояний системы. Разрешается выбирать любые доступные значения управляющих параметров (т. е. любую динамическую систему из семейства), а также менять эти значения в произвольный момент времени. Таким образом, выбранные параметры, вообще говоря, зависят от времени. Эта зависимость называется управлением или функцией управления.

Выбрав управление, мы превращаем управляемую систему в неавтономное дифференциальное уравнение. Решение такого уравнения

однозначно определяется начальными условиями и называется допустимой траекторией системы, отвечающей данному управлению. Таким образом, допустимая траектория — это некоторая кривая в пространстве состояний. Начальные условия — это начальная точка кривой, называемая также начальным состоянием. Разным управлениям отвечают, вообще говоря, разные допустимые траектории, начинающиеся в одной и той же точке. Все эти траектории заполняют множество достижимости.

Одна из главных задач теории управления — задача управляемости — состоит в распознавании состояний, достижимых из данного начального. Впрочем, как правило, этого недостаточно. Выяснив, до каких состояний можно добраться, мы пытаемся найти наилучший путь. Пути можно сравнивать по времени перехода, длине допустимой траектории, затраченной энергии или значению какого-то другого функционала. Наилучшим считается путь, доставляющий минимум заранее выбранному функционалу. Поиск таких путей составляет предмет задачи оптимального управления. Две важные задачи — управляемости и оптимального управления — служат нам маяками на протяжении всей книги.

При чем здесь геометрия? Правая часть обыкновенного дифференциального уравнения есть векторное поле, а соответствующая динамическая система — поток, порожденный этим векторным полем. Таким образом, управляемая система — это семейство векторных полей. Интересующие нас свойства систем сохраняются при гладких заменах переменных в пространстве состояний. Кроме того, допускается обширный класс преобразований, перепараметризующих семейство полей; они называются преобразованиями обратной связи в теории управления и калибровочными преобразованиями в геометрии и математической физике. Наличие всех этих преобразований есть внешнее формальное основание для применения геометрических методов и бескоординатного геометрического языка в теории управления.

Имеется и более глубокое основание. Как уже отмечалось, динамическая система — это поток (т. е. однопараметрическая группа преобразований пространства состояний), порожденный векторным полем. Допустимая траектория, отвечающая постоянному управлению, есть траектория соответствующего потока. Траектория, отвечающая кусочно постоянному управлению, строится при помощи суперпозиции подходящих элементов потоков, соответствующих значениям функции управления. Произвольное управление можно сколь угодно хорошо приблизить кусочно постоянными. Следовательно, допустимые траектории и множества достижимости теснейшим образом связаны с группой преобразований, порожденной динамическими системами, из которых состоит изучаемая управляемая. В свою очередь группы преобразований — это сердце геометрии.

Какое же место предназначено языку, методам и образам теории управления в геометрии и, более общим образом, в изучении основных структур окружающего нас мира? Чтобы понять это, полезно

рассмотреть множества допустимых скоростей — первоначальный наивный способ описания множеств достижимости «в бесконечно малом». Множество допустимых скоростей в заданной точке состоит из скоростей всех допустимых траекторий, проходящих через эту точку. Как правило, у интересных управляемых систем размерность множеств достижимости намного больше, чем размерность множеств допустимых скоростей. Например, типичная пара векторных полей на n-мерном многообразии порождает n-мерные множества достижимости при сколь угодно большом n. Иными словами, ограничения на скорости, вообще говоря, не влекут ограничений на состояния. Такого рода ограничения на скорости обычно называют неголономными. Теория управления — это дисциплина, занимающаяся систематическим изучением возможных типов поведения при неголономных ограничениях и, в частности, исследованием вариационных задач с неголономными ограничениями, решения которых можно интерпретировать как «оптимальное поведение».

Глава 1 книги носит вводный характер: мы напоминаем, что такое гладкие многообразия и обыкновенные дифференциальные уравнения на гладких многообразиях, после чего определяем управляемые системы.

Глава 2 посвящена формальному исчислению, сильно облегчающему работу с нелинейными управляемыми системами.

В главе 3 вводится простой и чрезвычайно распространенный в приложениях класс линейных систем, а в главе 4 эффективно описаны системы, которые можно превратить в линейные гладкими преобразованиями пространства состояний.

Главы 5-7 посвящены фундаментальной теореме об орбите Нага-но и Суссмана и ее приложениям. Теорема об орбите утверждает, что любая орбита группы, порожденной семейством потоков, есть погруженное подмногообразие. При этом сама группа может быть совершенно необозримой.

Глава 8 содержит общие факты о структуре множеств достижимости, начиная с простого условия, гарантирующего их полномерность.

В главе 9 вводятся преобразования обратной связи, дана классификация линейных систем по отношению к этим преобразованиям, а также эффективно описаны системы, которые можно превратить в линейные, если наряду с гладкими заменами переменных в пространстве состояний использовать преобразования обратной связи.

Остальная часть книги в основном посвящена оптимальному управлению.

В главе 10 мы ставим задачу оптимального управления, даем ее геометрическую интерпретацию и обсуждаем вопрос о существовании решения.

Глава 11 содержит начальные сведения о дифференциальных формах и гамильтоновых системах, необходимые для квалифицированного исследования задач оптимального управления.

Глава 12 посвящена геометрической бескоординатной формулировке и детальному доказательству принципа максимума Понтрягина — ключевого результата теории оптимального управления.

Главы 13-16 содержат многочисленные приложения принципа максимума, включая одно любопытное свойство гамильтоновых систем с выпуклыми гамильтонианами и достаточно полные теории линейных задач быстродействия и регулярных линейно-квадратичных задач с конечным горизонтом.

В главе 17 обсуждается гамильтонова версия теории полей экстремалей, хорошо приспособленная для приложений к задачам оптимального управления, и вводится уравнение Гамильтона-Якоби.

Главы 18 и 19 посвящены методу подвижных реперов и задачам на группах Ли. Определение и необходимые сведения о группах Ли приведены в главе 18; все они легко выводятся из результатов о семействах векторных полей, полученных в предыдущих главах.

В главах 20 и 21 подробно изучается вторая вариация в задачах оптимального управления и выводятся необходимые и достаточные условия оптимальности второго порядка как для регулярных, так и для особых экстремалей.

В короткой главе 22 описана полезная процедура редукции, устанавливающая связь между особыми и регулярными экстремалями.

В главе 23 вводится и вычисляется (в простейших маломерных ситуациях) кривизна задачи оптимального управления: замечательный инвариант, обобщающий гауссову кривизну поверхности.

Наконец, в главе 24 обсуждается управление классической неголономной системой: одно тело катится по другому без проскальзываний и прокручиваний. В добавление отнесены доказательства некоторых результатов, сформулированных в главе 2.

Таково, кратко, содержание книги. В каждой главе мы стараемся оставаться на уровне учебника, т. е. приводить только первые достаточно простые результаты и некоторые приложения. Темы почти каждой главы уже получили серьезное развитие, и тому, кто желает изучить предмет глубже, придется после ознакомления с нашей книгой обратиться к журнальным статьям.

Геометрическая теория управления — весьма многогранный предмет, и многие важные темы в данной книге даже не упомянуты. Например, мы не рассматриваем важную задачу стабилизации при помощи обратной связи и не касаемся обширной теории управляемых систем «с выходом», включающей фундаментальные понятия наблюдаемости и реализации. Сведения по этим и другим темам можно найти в книгах по теории управления, приведенных в списке литературы.

Мы хотим поблагодарить наших учителей Реваза Валериановича Гамкрелидзе и Алексея Федоровича Филиппова за щедро переданное нам понимание математики и теории управления, а также за постоянную поддержку при работе над книгой.

Мы выражаем благодарность за поддержку этого проекта со стороны Международной школы высших исследований (г. Триест, Италия), Математического института им. В.А. Стеклова (г. Москва), а также Института программных систем РАН (г. Переславль-Залесский).

Мы благодарны участникам семинара по геометрической теории управления в Международной школе высших исследований в г. Триест, особенно Улиссу Серру, Игорю Зеленко и Сержио Родригесу, за ценные замечания, позволившие улучшить изложение.

Наконец, мы не смогли бы написать эту книгу без тепла и заботы наших жен Ирины и Елены.

Москва - Переславль-Залесский - Триест Октябрь 2003 г.

А.А. Аграчев, Ю.Л. Сачков

<< Предыдущий параграф Следующий параграф >>
Оглавление