П.А. Точилин. О построении кусочно-аффинной функции цены в задаче оптимального управления на бесконечном отрезке времени ... C. 223-238

УДК 517.977

MSC: 93D15, 93D30, 34H15, 49L20

DOI: 10.21538/0134-4889-2020-26-1-223-238

Работа выполнена при поддержке РФФИ (проекты 19–01–00613а, 16–29–04191офи_м).

Полный текст статьи (Full text)

Работа посвящена приближенному решению задачи оптимального управления нелинейной системой дифференциальных уравнений на бесконечном отрезке времени с интегральным функционалом качества. Для этого использована техника кусочной линеаризации (“гибридизации”) исходной нелинейной системы, с последующим анализом получившейся системы с переключениями. Далее применен аппарат кусочно-аффинных функций цены и управления в совокупности с методом динамического программирования и принципом сравнения. В работе последовательно рассмотрены два случая: с непрерывными кусочно-аффинными функциями цены и управления, а также с функциями, допускающими разрывы первого рода. В последнем варианте за счет допущения разрывов удается повысить эффективность предложенного подхода. Сформулированы и доказаны теоремы о достаточных условиях разрешимости поставленной задачи, дающие также верхние оценки минимизируемого функционала. Удалось получить простые с точки зрения вычислений алгоритмы построения оценок функции цены для указанной задачи, а также соответствующего управления в форме обратной связи. Действие разработанного алгоритма продемонстрировано на примере задачи управления колесным роботом на плоскости.

Ключевые слова: нелинейная динамика, линеаризация, система с переключениями, оптимальное управление, динамическое программирование, кусочно-аффинная функция цены

СПИСОК ЛИТЕРАТУРЫ

1.   Куржанский А.Б. Принцип сравнения для уравнения типа Гамильтона — Якоби в теории управления // Тр. Ин-та математики и механики УрО РАН. 2006. Т. 12, № 1. C. 173–183.

2.   Kurzhanski A.B., Varaiya P. Dynamics and control of trajectory tubes. Basel: Birkhauser, 2014. 445 p.

3.   Habets L.C.G.J.M., Collins P.J., van Schuppen J.H. Reachability and control synthesis for piecewise-affine hybrid systems on simplices // IEEE Trans Automatic Control. 2006. Vol. 51, no. 6. P. 938–948. doi: 10.1109/TAC.2006.876952 

4.   Girard A., Martin S. Synthesis of constrained nonlinear systems using hybridization and robust controllers on simplices // IEEE Trans Automatic Control. 2012. Vol. 57, no. 4. P. 1046–1051. doi: 10.1109/TAC.2011.2168874 

5.   Bardi M., Capuzzo-Dolcetta I. Optimal control and viscosity solutions of Hamilton–Jacobi–Bellman equations. Boston: Birkhauser, 2008. 570 p.

6.   Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. Ижевск: Институт компьютерных исследований, 2003. 336 c.

7.   Fleming W.H., Soner H.M. Controlled Markov processes and viscosity solutions. N Y: Springer, 2006. 429 p.

8.   Куржанский А.Б., Точилин П.А. Слабо инвариантные множества гибридных систем // Дифференц. уравнения. 2008. Т. 44, № 11. С. 1523–1533.

9.   Asarin E., Dang T., Girard A. Hybridization methods for the analysis of nonlinear systems // Acta Informatica. 2007. Vol. 43, iss. 7. P. 451–476. doi: 10.1007/s00236-006-0035-7 

10.   Точилин П.А. О построении невыпуклых аппроксимаций множеств достижимости кусочно-линейной системы // Дифференц. уравнения. 2015. Т. 51, № 11. С. 1503–1515.

11.   Mayantsev K.S., Tochilin P.A. The feedback control problem for switched system with uncertainties // IFAC Proceedings Volumes. 2017. Vol. 50, iss. 1. P. 2187–2192. doi: 10.1016/j.ifacol.2017.08.279

12.   Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985. 225 c.

13.   Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980. 319 с.

Поступила 20.10.2019

После доработки 22.01.2020

Принята к публикации 27.01.2020

Точилин Павел Александрович
канд. физ.-мат. наук
доцент факультета вычислительной математики и кибернетики
МГУ им. М.В.Ломоносова, г. Москва
e-mail: tochilin@cs.msu.ru

Ссылка на статью: П.А. Точилин. О построении кусочно-аффинной функции цены в задаче оптимального управления на бесконечном отрезке времени // Тр. Ин-та математики и механики УрО РАН. 2020. Т. 26, № 1. C. 223-238.

English

P.A. Tochilin. On the construction of a piecewise affine value function in an infinite-horizon optimal control problem

The paper is devoted to the approximate solution of an infinite-horizon optimal control problem for a nonlinear system of differential equations with an integral cost functional. We use the technique of piecewise linearization (“hybridization”) of the original nonlinear system followed by the analysis of the resulting switched system. Then the methods of piecewise affine value and control functions, the method of dynamic programming, and the comparison principle are applied. Two cases are considered sequentially: with continuous piecewise affine value and control functions and with functions admitting discontinuities. In the latter case, it is possible to increase the effectiveness of the proposed approach by allowing gaps. Theorems on sufficient conditions for the solvability of the control problem are formulated and proved. The theorems also provide upper estimates of the minimized functional. Computationally simple algorithms are derived for the construction of estimates of the value function for this problem and of the corresponding feedback control. The operation of the proposed algorithm is demonstrated for a problem of control of a wheeled robot on the plane.

Keywords: nonlinear dynamics, linearization, switched system, optimal control, dynamic programming, piecewise affine value function

Received October 20, 2019

Revised January 22, 2019

Accepted January 27, 2020

Funding Agency: This work was supported by the Russian Foundation for Basic Research (projects no. 19–01–00613a and no. 16–29–04191ofi_m).

Pavel Aleksandrovich Tochilin, Cand. Sci. (Phys.-Math.), Lomonosov Moscow State University, Faculty of Computational Mathematics and Cybernetics, Moscow, 119991 Russia, e-mail: tochilin@cs.msu.ru

Cite this article as: P.A. Tochilin. On the construction of a piecewise affine value function in an infinite-horizon optimal control problem, Trudy Instituta Matematiki i Mekhaniki URO RAN, 2020, vol. 26, no. 1, pp. 223–238.