logo search
Конспект лекцій

10.5 Аналітичне конструювання оптимальних регуляторів

Аналітичним конструюванням регуляторів (АКР) називається методика синтезу оптимального регулятора для заданого об’єкта при заданих обмеженнях і критерію оптимальності, що задається у квадратичній інтегральній формі вигляду (10.8):

.

Ця методика вперше була запропонована у роботах О.М.Льотова і Р.Калмана. Кожний з підходів має свої особливості, однак обидва рішення приводять до аналогічних результатів.

Суть задачі АКР полягає у визначенні варіаційними методами керуючої дії, яка мінімізує функціонал, що характеризує відхилення траєкторії справжнього руху системи від бажаної. У процесі аналітичного конструювання регуляторів відшукують закон керування у його аналітичній формі як деяку функцію фазових координат початкової системи. Таким чином, спочатку для заданого об’єкта керування при існуючих обмеженнях відшукують оптимальну траєкторію руху системи, а потім шляхом АКР визначають диференціальне рівняння (алгоритм керування) регулятора, що гарантує мінімальне відхилення траєкторії руху об’єкта керування від знайденої оптимальної траєкторії.

Узагалі рівняннями, що описують поведінку керуючого пристрою, можуть бути рівняння Ейлера, але вони не завжди виявляються такими, що реалізуються. Крім того, ці рівняння мають неприємну властивість: якщо час процесу керування у безперервній системі є скінченним, то рівняння Ейлера, що розглядають разом з рівняннями об’єкта, відповідають нестійкій системі регулювання. Так, у разі лінійного об’єкта і квадратичного функціоналу рівняння Ейлера є лінійними, причому серед коренів характеристичного рівняння обов’язково є як ліві, так і праві корені.

Якщо приєднання регулятора робить системи нестійкою, то це приєднання не може бути тривалим. Якщо відомо, що процес оптимального керування має спорадичний (одиничний, від випадку до випадку) характер, то можна піти на використання нестійкої системи, вмикаючи її лише на той момент, коли виникла потреба здійснити оптимальне керування, і обов’язково вимикаючи її після завершення керування. У тих випадках, коли регулятор має бути весь час підключеним до об’єкта, необхідно вжити заходів щодо забезпечення стійкості системи.

Цю задачу можна розв’язати шляхом відкидання у розв’язку рівняння складових, що відповідають додатним кореням. При цьому час керування стає нескінченно великим, проте функціонал набуває найменше з усіх можливих значення для різних Т.

Розглянемо окремі випадки такого роду систем і знайдемо рівняння екстремалі, що реалізує екстремум функціоналу (10.8) для цих випадків.

Нехай критерієм якості роботи системи слугує функціонал вигляду:

(10.71)

Для знаходження екстремалі складаємо рівняння Ейлера (10.14). У даному випадку , а значить:

(10.72)

Характеристичне рівняння має вигляд:

(10.73)

Для знаходження екстремалі необхідно враховувати тільки корені рівняння: інакше система буде нестійкою. Таким чином, розв’язок рівняння (10.72) для стійкої системи має вигляд:

Сталу С визначають із початкових умов: при t = 0, y = y0, тоді

(10.74)

Рівняння (10.74) є рівнянням екстремалі. Зазначимо, що екстремаль відповідає розв’язку диференціального рівняння першого порядку: з характеристичним рівнянням де Т – постійна часу. Вагову константу r1 можна подати через цю постійну часу Т, якщо дорівняти поліноми:

Звідси r1 = Т2, і тоді рівняння екстремалі матиме вигляд:

(10.75)

Т аким чином, при мінімізації функціоналу вигляду (10.71) структуру або параметри системи слід підбирати так, щоб перехідний процес у системі наближався до аперіодичного (10.75). Оскільки величина Т може бути взята різною, то маємо поле екстремалей (рис. 10.13), з яких вибираємо екстремаль, яка найбільш повно відповідає вимогам до системи.

Наприклад, якщо , то при t = 0:

. Тоді

де - припустиме значення похідної від вихідної координати.

Зазначимо, що при Т=0 отримуємо звичайний квадратичний інтегральний критерій:

(10.76)

У цьому випадку рівняння екстремалі: у = 0. Фізично це означає, що при ступінчастому змінюванні керуючої дії вихідна координата у повинна змінитися стрибком від значення у0 до у=0. Зрозуміло, що в інерційній системі такий режим не можна реалізувати. Зазначимо також, що прагнення прискорити змінювання вихідної координати призводить до різкого збільшення коефіцієнта підсилення у ланцюгу зворотного зв’язку, що, у свою чергу, сприяє збільшенню коливальності процесу.

З’ясуємо на конкретному прикладі різницю синтезу систем за критеріями (10.71) і (10.76).

Приклад 10.7 Розглянемо слідкуючу систему заданої структури (рис. 10.14), яка описується диференціальним рівнянням другого порядку. Для поліпшення якості перехідного процесу виконавчий механізм охоплений жорстким від’ємним зворотним зв’язком за швидкістю. Необхідно визначити оптимальне значення коефіцієнта зворотного зв’язку kз.з., при якому критерії І1 та І2 набувають мінімального значення.

Передавальна функція розімкнутої системи має вигляд:

а диференціальне рівняння буде:

(10.77)

Н ехай вхідний сигнал змінюється стрибком від u до 0, тоді,

вважаючи у(0)=1; і позначивши:

отримуємо:

(10.78)

Визначимо величини І1 та І2 через коефіцієнти диференціального рівняння. Для цього помножимо (10.78) почергово на у і . Тоді отримаємо:

(10.79)

Врахуємо, що і обчислимо такі інтеграли:

(інтегрування частинами);

Тоді після інтегрування системи (10.79) отримаємо:

Звідси

або

Для знаходження kз.з. , що відповідає І1= min, запишемо:

Звідси оптимальне значення kз.з.:

Коефіцієнт kз.з., що відповідає І2 = min, буде за умови r1=0, тобто

Візьмемо, наприклад, Т = 0,5 с; k1 = 200; k2 = 0,25 c-1; тоді k0 = 50 c-1; a0 = T/k0 = 0,5/50 = 0,01 c2.

Оцінку І1 знаходимо, задаючи r1. Поставимо вимогу, щоб перехідний процес наближався до експоненти з постійною часу Т = 0,1 с, тоді r1 = Т2 = 0,01 с2, і відповідні коефіцієнти зворотного зв’язку мають значення:

Якість перехідного процесу визначається коефіцієнтом демпфірування , який у даному випадку (10.78) дорівнює:

З урахуванням значень kз.з.1 і kз.з.2 отримуємо відповідні значення коефіцієнта демпфірування: 1 = 0,7; 2 = 0,5.

На рис. 10.15 наведені результати моделювання перехідного процесу за допомогою пакета Matlab для обох випадків.

З графіків видно, що перерегулювання у першому випадку (kз.з.1 = 0,03; 1 = 0,7; безперервна лінія) не перевищує 5%, а у другому (kз.з.1 = 0,02; 1 = 0,5; пунктирна лінія) – досягає майже 20%, тобто вибір kз.з. за критерієм І1 (10.71) забезпечує менше перерегулювання, ніж за критерієм І2 (10.76). Подальше збільшення r1 приведе до збільшення kз.з.1 і, відповідно, 1. При цьому зменшиться перерегулювання, але зросте час перехідного процесу.

Т

Рис. 10.15 – Перехідні процеси у системі при kз.з.1=0,03 (безперервна лінія) і kз.з.2 = 0,02 (пунктирна лінія)

аким чином, при заданій структурі об’єкта ми не можемо реалізувати оптимальний перехідний процес, що мінімізує критерії І1 та І2 при будь-яких kз.з.. Це обумовлено інерційністю об’єкта керування, що залишає можливість реалізації процесу, лише близького до оптимального.

Як зазначалося раніше, у реальних системах керуючий сигнал u(t) обмежений за потужністю і величиною. Для врахування цього часто застосовують критерій вигляду (10.9):

Мінімізація цього інтеграла мінімізує величини у і u з урахуванням вагового коефіцієнта с.

Приклад 10.8 Об’єкт керування описується лінійним диференціальним рівнянням вигляду:

(10.80)

Знайти закон керування u, який забезпечує мінімум функціоналу (10.9) під час переходу з початкового стану в кінцевий стан: .

Маємо варіаційну задачу Лагранжа на умовний екстремум – знаходження мінімуму функціоналу (10.9) за наявності рівняння зв’язку, що отримуємо з рівняння об’єкта:

(10.81)

Складемо допоміжну функцію:

де  - множник Лагранжа.

Оскільки допоміжна функція містить першу і другу похідні, а також маємо дві змінні y і u, то рівняння екстремалі знайдемо як розв’язок системи рівнянь Ейлера-Пуассона (10.19):

(10.82)

З другого рівняння отримуємо: u=k/(2c), тобто для визначення оптимального керування u необхідно знайти .

Додамо до рівнянь (10.82) рівняння зв’язку (10.81) і запишемо систему в зображеннях за Лапласом:

(10.83)

Виключивши з цієї системи  і u , отримаємо:

Характеристичне рівняння має вигляд:

(10.84)

Таке саме характеристичне рівняння отримаємо і при розв’язку системи (10.83) відносно .

Поліном (10.84) можна розкласти на два із симетричним розташуванням коренів у правій і лівій півплощинах. Оскільки система передбачається стійкою, то враховуємо тільки ліві корені s1 і s2. Тоді розв’язок для  і для у буде:

Диференціюємо останнє рівняння:

Тоді можна записати систему:

Із останніх двох рівнянь знаходимо як функції координат (ці функції є лінійними) і підставивши їх до першого рівняння, отримуємо лінійну залежність координати  від координат :

(10.85)

Тоді оптимальне керування має вигляд:

(10.86)

Відповідна передавальна функція керуючого пристрою буде:

(10.87)

Таким чином, квадратичному критерію оптимальності вигляду (10.9) відповідає лінійний оптимальний закон керування (10.86), для здійснення якого необхідно мати зворотні зв’язки за всіма змінними стану системи. При цьому замкнута система залишається лінійною (рис. 10.16). Це можливе тільки за невеликих відхиленнях координат системи від положення рівноваги. Саме тому метод синтезу регулятора за квадратичним критерієм іноді називають оптимальною стабілізацією.

Зазначимо також, що функціонали, відмінні від квадратичних, обумовлюють нелінійні закони керування.

В изначити коефіцієнти b1 і b2 можна так. Оскільки характеристичне рівняння замкнутої системи є рівнянням другого порядку і має корені s1 і s2 , то його можна подати у вигляді:

(10.88)

Тут s1 і s2 корені характеристичного рівняння об’єкта (10.80) з урахуванням закону оптимального керування u=k/(2c).

З іншого боку, розв’язавши разом рівняння об’єкта (10.80) і регулятора (10.86), отримаємо:

Тоді характеристичне рівняння матиме вигляд:

(10.89)

Дорівнюємо коефіцієнти при однакових степенях у рівняннях (10.88) і (10.89) і отримуємо:

Звідси знаходимо:

Визначивши з (10.84) корені s1 і s2 , можна знайти числові значення коефіцієнтів b1 і b2.

Аналогічно можна розв’язувати задачу і для об’єктів більш високих порядків, але обчислення стають більш громіздкими.

Методи аналітичного конструювання регуляторів з розповсюдженням на різні випадки обмежень останнім часом суттєво розширені. Розв’язок загальних задач АКР лінійних об’єктів доведено до рівнянь для визначення коефіцієнтів оптимальних керувань. Більш глибоко проблему аналітичного конструювання регуляторів розглядають у спеціальному курсі “Системи оптимального керування”.

Запитання для самоперевірки

  1. Яка система керування називається оптимальною?

  2. На які типи можна розділити обмеження координат і керувань?

  3. Що таке критерій оптимальності? Назвіть основні типи критеріїв оптимальності.

  4. Наведіть класифікацію задач оптимізації.

  5. Які задачі називаються задачами динамічної оптимізації?

  6. Назвіть класичні методи варіаційного числення.

  7. Наведіть рівняння Ейлера і рівняння Ейлера-Пуассона. Поясніть їх суть.

  8. Наведіть теорему Лежандра.

  9. Наведіть рівняння Ейлера-Лагранжа.

  10. Чим визначається кількість множників Лагранжа, що входять до функції Лагранжа?

  11. У чому полягає перевага сучасних методів варіаційного числення порівняно з класичними методами?

  12. Поясніть суть методу динамічного програмування.

  13. Який принцип лежить у основі методу динамічного програмування?

  14. Наведіть систему рівнянь Беллмана для системи першого порядку з однією керуючою дією.

  15. Сформулюйте принцип максимуму Понтрягіна у загальному випадку.

  16. Що таке функція Гамільтона?

  17. Наведіть математичний запис принципу максимуму.

  18. У чому полягає фізичний зміст оптимального керування?

  19. У якій послідовності розв’язують задачу про максимальну швидкодію за принципом максимуму Понтрягіна?

  20. Як визначаються моменти перемикання керувань у разі замкнутої системи? Розімкнутої системи?

  21. У чому полягає основний недолік принципу максимуму?

  22. Сформулюйте теорему про n-інтервалів.

  23. Що таке аналітичне конструювання регуляторів?