4. Optimal styrning. 4. Optimal styrning. Vad är optimal styrning?

Laboratoriet för reglerteknik Reglerteknik II / KEH

4. Optimal styrning

4. Optimal styrning Vad är optimal styrning? I allmänna termer kan (regler)tekniska problem formuleras på följande sätt: ”Välj styrsignaler så att systemet beter sig så bra som möjligt” Svårigheten ligger vanligtvis i att formulera vad som är ”så bra som möjligt”. Om man kan formulera detta matematiskt — samt har en representativ processmodell — kan man lösa reglerproblemet systematiskt: man löser helt enkelt det matematiska optimeringsproblemet. Exempel på praktiska problemställningar är att  bestämma optimal väg (genom ett nätverk) från en punkt A till en punkt B  beräkna optimal styrstrategi för en satsvis cellulosa- eller sockerkokare  minimera tiden det tar att byta papperskvalitet på en pappersmaskin  bestämma optimal styrstrategi vid tillverkning av halvledare (kan bestå av 300 delsteg)  designa en process bestående av flera delprocesser så att anläggnings- och driftskostnaderna minimeras Reglerteknik II – Tillståndsmetoder (419301)

4–1

Laboratoriet för reglerteknik Reglerteknik II / KEH

4. Optimal styrning

Öppen styrning Öppen styrning är en speciell typ av styrproblem där man inte utnyttjar återkoppling; den optimala strategin beräknas helt utgående från processmodellen och ett matematiskt godhetskriterium (även kostnadsfunktion, förlustfunktion). Typiska problem av denna typ är att  bestämma ”billigaste vägen”  minimera tiden för en verksamhet  allokera resurser Ofta kombineras öppen styrning med återkopplad reglering på en lägre nivå. T.ex. problemet att bestämma optimal temperaturprofil som funktion av tiden för en satsreaktor är ett öppet styrproblem, men temperaturen realiseras genom återkopplad reglering. I detta fall är problemet att  generera optimala börvärden

Reglerteknik II – Tillståndsmetoder (419301)

4–2

Laboratoriet för reglerteknik Reglerteknik II / KEH

4. Optimal styrning

Övning 4.1. Ett exempel på billigaste färdväg Vi skall resa från punkt A till punkt B i nedanstående schema, där vi skall välja en av flera möjliga resrutter så att resans totalkostnad minimeras. Kostnaderna för de möjliga delrutterna finns utmärkta i figuren. Vilken väg skall vi välja från punkt A till punkt B?

6 2

4 A

4

3 2

4 4

7

2 4

5

6 3

2 5 4 5

4 1

1

1

4 2 5

2

B

3

48

Reglerteknik II – Tillståndsmetoder (419301)

4–3

Laboratoriet för reglerteknik Reglerteknik II / KEH

4. Optimal styrning

4.1 Dynamisk programmering Dynamisk programmering, utvecklad av Richard Bellman i slutet av 1950-talet, är en optimeringsmetod som är speciellt lämplig för problem som kan uppdelas i en serie delproblem, som kan behandlas sekventiellt så att varje delproblem medför ett beslut (dvs en styråtgärd). Typiska problemställningar är att  bestämma ”billigaste vägen”  allokera resurser Dynamisk programmering bygger på optimalitetsprincipen: De optimala besluten (styråtgärderna) från och med ett godtyckligt steg i beslutsprocessen (dvs de efterföljande besluten) får inte bero på hur (tillståndet i) detta steg uppnåtts. Vad betyder detta? Vi kan också formulera optimalitetsprincipen på följande sätt: Oberoende av vad vi gjort fram till steg n i beslutsprocessen, skall vi i fortsättningen göra det som är optimalt för de efterföljande stegen i beslutsprocessen. Denna princip har som följd att det ofta är fördelaktigt att beräkna den optimala strategin startande från slutändan av den sekventiella beslutsprocessen. Reglerteknik II – Tillståndsmetoder (419301)

4–4

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1 Dynamisk Programmering

4.1.1 Exempel på öppen styrning utan begränsningar Ett dynamiskt system beskrivs av den tidsdiskreta ekvationen

xk 1   xk  u k , x0  10    Beräkna styråtgärderna u0  u0 , u1  u1 och u 2  u 2 som minimerar förlustfunktionen 3

J   x 2 (t ) dt 0

då tillståndet x(t ) antas förändras linjärt med tiden mellan samplingspunkterna. Samplingsintervallet är h  1 (tidsenhet) och inga begränsningar existerar för u k . Eftersom x (t ) förändras linjärt mellan samplingspunkterna gäller

x(t )  ( xk 1  xk ) (t  k )  xk , k  t  k  1 , k  0, 1, 2 vilket gör att förlustfunktionen kan skrivas

J

2

k 1

 k

k 0

4. Optimal styrning

( xk 1  xk )(t  k )  xk 

2

2



dt  13  xk2 1  xk 1 xk  xk2 k 0

 4–5

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.1 Öppen styrning utan begränsningar

Lösning genom ordinär optimering Eftersom styrsignalernas storlek i detta fall inte bidrar till förlustfunktionen kan man lika väl optimera direkt med avseende på x1, x2 och x3 och därefter beräkna de optimala styrsignalerna när de optimala tillstånden x1  x1 , x2  x2 och x3  x3 är kända.

Vi skall alltså bestämma

min J där x1 , x 2 , x3

2

J  13  ( xk2  xk xk 1  xk21 )  13 ( x02  x0 x1  2 x12  x1 x2  2 x22  x2 x3  x32 ) k 0

Eftersom variablerna saknar begränsningar gäller vid minimum

J J J 0 , 0 , 0 x1 x2 x3

4.1 Dynamisk programmering

4–6

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.1 Öppen styrning utan begränsningar

Vi får J x1

 13 ( x0  4 x1  x2 )  0 ,

J x 2

 13 ( x1  4 x2  x3 )  0 ,

J x3

 13 ( x2  2 x3 )  0

dvs (räknat från slutet)

 x3   1 x2  1 x1   1 x0  5 x3   12 x2  7 26 13 2   2 x0   10 4 x2  x3  4 x2  12 x2   x1  x2   72 x1    x2   72 x1  26 13  x   7 x  35 7 4 x1  x2  4 x1  72 x1   x0  x1   26 x0  13 26 0  1 samt

u0  x0  x1  19 x0   95 13 26     25 5 5  u1  x1  x2  7 x1   26 x0  13 u   x   x  1 x   1 x   1 x   5  2 2 3 13 26 0 7 1 2 2 2 375 min J  13 ( x02  x0 x1  2( x1 ) 2  x1 x2  2( x2 ) 2  x2 x3  ( x3 ) 2 )  15 x   28,85 0 52 13

4.1 Dynamisk programmering

4–7

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.1 Öppen styrning utan begränsningar

Lösning genom dynamisk programmering Vi skriver förlustfunktionen som

J

2

 J k  J 0  J1  J 2

k 0

, J k  1 ( xk2  xk xk 1  xk21 ) 3

och börjar med att minimera det sista steget (k = 2) J 2 x3

 13 x ( x22  x2 x3  x32 )  13 ( x2  2 x3 )  0  x3   12 x2 (samma som tidigare) 3

Därefter minimerar vi stegen k = 1+2. Vi har med x3   12 x2

J1 2  J1  J 2  13 ( x12  x1 x2  x22 )  13 ( x22  x2 x3  x32 )  13 ( x12  x1 x2  74 x22 ) J 1 2 x 2

 13 x ( x12  x1 x2  74 x22 )  13 ( x1  72 x2 )  0  x2   72 x1 (samma) 2

Alla steg med x3   12 x2 och x2   2 x1 ger 7 2 J  J 0  J1 2  13 ( x02  x0 x1  x12 )  13 ( x12  x1 x2  74 x22 )  13 ( x02  x0 x1  13 x ) 1 7

J x1

2  26 1 7  13 x ( x02  x0 x1  13 x )  ( x  x )  0  x   x (samma) 1 26 0 7 1 3 0 7 1 1

4.1 Dynamisk programmering

4–8

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.1 Öppen styrning utan begränsningar

Suboptimala lösningar På grund av förlustfunktionens form

J

2

2 1 2 J  J  J  J , J  ( x  x x  x  k 0 1 2 k 3 k k k 1 k 1 )

k 0

ligger det nära till hand att minimera varje steg var för sig, dvs att minimera lokalt: J k x k 1

 13 x ( xk2  xk xk 1  xk21 ) k 1

 13 ( xk  2 xk 1 )  0  xk 1   12 xk som är fel lösning (utom för sista steget k  2) . Denna suboptimala lösning (”optimal i varje steg”) ger

J sub  14 ( x02  x12  x22 )  14 ( x02  54 x12 ) 21 2  64 x0  525  32,81 16

En dead-beat strategi u0  x0 , u1  u 2  0 ger x1  x2  x3  0 och J dead  1 x02  100  33,33 . 3 3

4.1 Dynamisk programmering

4–9

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.1 Öppen styrning utan begränsningar

Kommentarer I detta mycket enkla fall var metoden med dynamisk programmering knappast enklare än ordinär optimering. Vi kan dock konstatera följande: – Om antalet steg varit större hade det dock varit besvärligt att optimera globalt med avseende på alla optimeringsvariabler samtidigt. Vid användning av dynamisk programmering blir de enskilda stegen inte besvärligare. – Om förlustfunktionen är mer komplicerad, inkluderande t.ex. styrsignaler, blir det också besvärligare att optimera globalt i ett steg. Vid användning av dynamisk programmering blir varje enskilt steg normalt inte nämnvärt svårare. – Ifall man har begränsningar på tillståndvariablerna (utsignalerna) och/eller styrsignalerna, blir traditionell optimering mycket besvärlig, kanske omöjlig. Begränsningar kan relativ enkelt beaktas vid dynamisk programmering då problemet löses stegvis. En nackdel med dynamisk programmering är det stora antal olika alternativ som måste ”sparas” ifall man inte kan uttrycka sambanden analytiskt (”the curse of dimensionality”).

4.1 Dynamisk programmering

4 – 10

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1 Dynamisk programmering

4.1.2 Exempel på öppen styrning med begränsningar Antag att styrsignalerna u0 , u1 och u 2 i det ovan behandlade exemplet endast kan anta jämna heltalsvärden. Då kan problemet i princip inte lösas analytiskt genom nollställning av partialderivator, varken genom ordinär optimering eller dynamisk programmering. En möjlighet är att avrunda den analytiska lösningens styrsignaler till närmaste jämna heltal, men det finns inget som garanterar att detta ger den optimala heltalslösningen. Det finns avancerade matematiska metoder för lösning av heltalsproblem som vi dock inte skall behandla här. En fördel med heltalsproblem är dock att det vanligtvis endast finns ett ändligt antal möjliga lösningar, vilket betyder att man i princip kan analysera alla tänkbara lösningar. Genom användning av dynamisk programmering, ev. kombinerad med någon fundamental analys av problemets natur och nödvändiga egenskaper för den optimala lösningen, kan man ofta lösa denna typ av problem förhållandevis enkelt.

4. Optimal styrning

4 – 11

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.2 Öppen styrning med begränsningar

Exempel med begränsningar Uppgiften är att minimera

J

2

 Jk

k 0

, J k  1 ( xk2  xk xk 1  xk21 ) 3

under bivillkoren (modellen) xk 1   xk  u k , x0  10 samt uk  0,  2,  4, . Det är enkelt att övertyga sig om att för den optimala lösningen måste gälla, ifall xk  0 , att xk 1  xk samt att xk 1 och xk inte har samma tecken (eftersom xk 1 xk  0 minimerar varje J k jämfört med xk 1 xk  0 ). Man inser då, med hjälp av modellen, att   de optimala styrsignalerna u k och tillstånden xk måste satisfiera

u0   2,  4,  6,  8,  10 , u1  0, 2, 4, 6, 8 , u 2  0,  2,  4,  6 x1  0, 2, 4, 6, 8 , x2  0,  2,  4,  6 , x3  0, 2, 4 Det vore möjligt att begränsa styrsignalerna ytterligare med en mer ingående inledande analys, vilket vi dock inte gör. 4.1 Dynamisk programmering

4 – 12

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.2 Öppen styrning med begränsningar

I stället utnyttjar vi dynamisk programmering för att hitta den slutliga lösningen. Med hjälp av modellen xk 1   xk  u k kan uttrycket för J k skrivas

J k  13 ( xk2  xk u k  u k2 ) Steget k = 2   Eftersom u 2  12 x2 gäller för lösningen av det obegränsade fallet, är det också en möjlig lösning i detta fall, ifall det finns en tillåten lösning som satisfierar sambandet.

a) Om x2  0,  4 , fås u2  12 x2 , som är ett jämnt heltal. Bidraget till förlustfunktionen blir J 2  1 ( x22  x2  1 x2  ( 1 x2 ) 2 )  1 x22 . 4 3 2 2 b) Om x2  2,  6 är u 2  1 x2 inte ett jämnt heltal. Närmast till hands ligger 2 lösningarna u2  12 x2  1, som är jämna heltal. Kontroll visar att både + och – ger samma bidrag J 2  1 x22  1 . Inget annat tillåtet u 2 ger här ett mindre J 2 . 3 4 4.1 Dynamisk programmering

4 – 13

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.2 Öppen styrning med begränsningar

Stegen k = 1 + 2

a) Vi har x2  0,  4. Modellsambandet x2   x1  u1 ger u1  x1  0,  4 och 7 2 7 2 5 J1 2  J1  J 2  13 ( x12  x1u1  u12 )  14 x22  12 x1  6 x1u1  12 u1

Möjligheterna är (i) u1  x1 och (ii) u1  x1  4 som ger (i) J1 2  1 x12 och (ii) J1 2  1 ( x12  4 x1  28) . 3 3 Här är (i) bättre (mindre) om x1  0, 2, 4, 6, (ii) bättre om x1  8 . b) Vi har x2   2,  6 och således u1  x1   2,  6 samt 7 2 1 7 2 5 J1 2  J1  J 2  13 ( x12  x1u1  u12 )  14 x22  13  12 x1  6 x1u1  12 u1  3

Möjligheterna är (i) u1  x1  2 och (ii) u1  x1  6 som ger (i) J1 2  1 ( x12  2 x1  8) och (ii) J1 2  1 ( x12  6 x1  64) . 3 3 Här är (i) bättre om x1  14 , dvs alltid.

x2   x1  u1  6 är således inte en möjlig optimal lösning. 4.1 Dynamisk programmering

4 – 14

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.2 Öppen styrning med begränsningar

Alla steg a) (i) Vi har x1  0, 2, 4, 6. Sambandet x1   x0  u0 ger u0  x0  0, 2, 4, 6 och då x0  10 , u0   4,  6,  8,  10 samt

J  J 0  J 1 2  13 ( x02  x0 u 0  u 02 )  13 x12  13 (2 x02  3 x0 u 0  2u 02 )  13 (200  30u 0  2u 02 ) Minimum J  88 fås för u0  8 . 3 a) (ii) Här är x1  8 . Sambandet x1   x0  u0 samt x0  10 ger u0  2 och

J  J 0  J1 2  13 ( x02  x0u0  u02 )  13 ( x12  4 x1  28)  13 ( 2 x02  3 x0u0  2u02  4 x0  4u0  28)  144 3 Detta fall är alltså sämre än a) (i).

4.1 Dynamisk programmering

4 – 15

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.2 Öppen styrning med begränsningar

b) (i) Här är x1  0, 2, 4, 6, 8. Sambandet x1   x0  u0 samt x0  10 ger u0   2,  4,  6,  8,  10 och

J  J 0  J1 2  13 ( x02  x0u0  u02 )  13 ( x12  2 x1  8)  13 (2 x02  3 x0u0  2u02  2 x0  2u0  8)  13 (188  28u0  2u02 ) Minimum J 

92 3

fås för u0  6 och u0  8 . Även detta är sämre än a) (i).

Den optimala lösningen Den optimala lösningen är fall a) (i) som för x0  10 ger J  88  29,33 med 3

u0  8 , u1  2 , u 2  0 x1  2 , x2  0 , x3  0

Obs att denna lösning (med denna förlustfunktion) är bättre än dead-beat strategin, som även satisfierar begränsningarna u k  0,  2,  4, .

4.1 Dynamisk programmering

4 – 16

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1 Dynamisk programmering

4.1.3 Allmän formulering av lösning med dynamisk programmering Sambandet mellan tillstånden xk 1 och xk samt en styråtgärd u k kan allmänt skrivas

xk 1  f k ( xk , u k ) , k  0, 1,  där f k är en godtycklig funktion, som inte behöver vara linjär och inte behöver vara densamma för alla k . Antag att man önskar styra systemet från tillståndet x0 till xN så att förlustfunktionen

J

N 1

 g k ( xk , u k )

k 0

minimeras. Här är g k en godtycklig funktion som anger kostnaden att gå från tillståndet xk till xk 1 med styrsignalen u k . Om man inledningsvis har en kostnad g k som är beroende av tillståndet xk 1 , kan detta elimineras med hjälp av modellsambandet. Därmed kan sluttillståndet x N alltid elimineras från förlustfunktionen 4. Optimal styrning

4 – 17

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.1.3 Allmän formulering av lösning

Låt J k ( xk ) beteckna kostnaden för den optimala vägen (dvs den minimala kostnaden) från tillståndet xk till sluttillståndet x N . Då gäller (uppenbarligen)

J N ( x N )  0

samt för successivt minskande k , k  N  1,  , 0 :







J k ( xk )  min g k ( xk , u k )  J k1 ( xk 1 )  min g k ( xk , u k )  J k1 ( f k ( xk , u k )) uk

uk



Minimering i varje steg (enligt valfri metod, med beaktande av ev. begränsningar) ger en * optimal styrsignal u k som funktion av xk , betecknad u k ( xk ) , matematiskt uttryckt:



u k ( xk )  arg min g k ( xk , u k )  J k1 ( f k ( xk , u k )) uk

 Till slut erhålles för k  0 min J  J 0 ( x0 ) och nelsetillståndet x0 är känt. Tillståndet x1  x1



u0 ( x0 ) , som kan bestämmas då begynkan därefter beräknas enligt modellsam-

bandet med u0  u0 ( x0 ) , varefter u1 ( x1 ) kan bestämmas, osv xk och uk ( xk* ) för alla k . Märk att beteckningarna här avviker från beteckningarna i de tidigare exemplen. 4.1 Dynamisk programmering

4 – 18

Laboratoriet för reglerteknik Reglerteknik II / KEH

4. Optimal styrning

4.2 Maximumprincipen Optimalitetsprincipen ger en strategi för att finna den optimala lösningen när ett problem kan delas upp i ett antal delsteg, som kan lösas sekventiellt. Detta förutsätter att också förlustfunktion kan uppdelas så, att en viss förlust är förknippad varje enskilt delsteg. Maximumprincipen ger villkor som den optimala lösningen bör uppfylla för mera allmänna optimeringsproblem, som inte nödvändigtvis kan uppdelas i ett antal delproblem som löses sekventiellt. Dessa villkor ger inte direkt den optimala lösningen, men de gör det (vanligtvis) möjligt att finna den. – Benämningen ”maximumprincipen” följer av att problemen tidigare formulerades som maximeringsproblem; nuförtiden minimerar vi hellre. – Principen benämnes ofta Pontryagins maximumprincip eller minimumprincip efter en av upphovsmännen. – Maximumprincipen ger optimalitetsvillkor för generella styrproblem; ett antal viktiga specialfall inkluderar var för sig stora klasser optimala styrproblem.

Reglerteknik II – Tillståndsmetoder (419301)

4 – 19

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.2 Maximumprincipen

4.2.1 Det optimala styrproblemet Det optimala styrproblemet kan i kontinuerlig tid formuleras på följande sätt: Minimera förlustfunktionen tf

J   (x(tf ))   L( x(t ), u(t )) dt

(4.2.1a)

0

under bivillkoren

x (t )  f ( x(t ), u(t )) u(t )  U , 0  t  tf x(0)  x0 , ψ ( x(tf ))  0

(4.2.1b) (4.2.1c) (4.2.1d)

Här är (4.2.1b) modellen för det dynamiska systemet, (4.2.1c) definierar ev. begränsningar på de tillgängliga styrsignalerna, (4.2.1d) ger begynnelsetillstånd och ett ev. bivillkor relaterat till sluttillståndet. Viktiga specialfall (som förenklar lösningen) fås när  sluttiden tf är given  inga bivillkor ψ ( x(tf ))  0 begränsar sluttillståndet x(tf )  förlustfunktionen J har speciellt enkel form 4. Optimal styrning

4 – 20

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.2 Maximumprincipen

4.2.2 Given sluttid, obegränsat sluttillstånd I det fall, att sluttiden tf är given och sluttillståndet x(tf ) är obegränsat, bör den optimala lösningen u (t ) , x (t ) uppfylla följande villkor:

min H (x (t ), u, p(t ))  H (x (t ), u (t ), p(t )) , 0  t  tf

(4.2.2a)

H ( x, u , p )  L ( x, u )  p T f ( x , u )

(4.2.2b)

uU

där

är den s.k. Hamiltonfunktionen och där p uppfyller den adjungerade ekvationen 

T

T  H (x, u (t ), p(t ))    ( x )   p (t )    , p(tf )       x  x   x  x ( tf )   x  x (t )

4. Optimal styrning

(4.2.2c)

4 – 21

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.2.2 Given sluttid, obegränsat sluttillstånd

Exempel 4.1. Styrning i strömmande vatten. En båt med lägeskoordinaten ( x1 , x2 ) rör sig i ett område med varierande ström. Styrvariabeln u1 är lika med båtens hastighet (relativt vattnet) i x1-riktning, styrvariabeln u2 dess hastighet i x2 -riktningen. Vattnets hastighet är v( x2 ) i x1-riktningen och 0 i x2 riktningen. Båten startar i origo och man vill förflytta sig så långt som möjligt i x1-led på T tidsenheter. Vilka är de optimala styråtgärderna då de är begränsade så att båtens fart relativt vattnet är konstant = 1? Detta ger optimeringsproblemet

min (  x1 (T )) u1 ,u2

under bivillkoren

x1  v( x2 )  u1 ,

x1 (0)  0

x2  u2 , x2 (0)  0 u12  u22  1

4.2 Maximumprincipen

4 – 22

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.2.2 Given sluttid, obegränsat sluttillstånd

Här är förlustfunktionens L  0 , vilket ger

v( x )  u1   p1 (v( x2 )  u1 )  p2 u2 H ( x, u , p )  p T f ( x , u )  p T  2  u   2 De adjungerade ekvationerna blir

  ( p1 (v( x2 )  u1 )  p2 u2 )   H (x, u (t ), p(t )  p1 (t )      0   x1 x1   x  x ( t )   x  x ( t )

  ( p1 (v( x2 )  u1 )  p2 u2 )   H (x, u (t ), p(t )  p 2 (t )        p1v( x2 )   x2 x2   x  x ( t )   x  x ( t )   (x)    ( x1 (T ))  p1 (T )     1   x1  x1 x  x (T )   x  x  (T )   (x)    ( x1 (T ))  p2 (T )    0   x2  x2 x  x (T )  x  x (T ) 4.2 Maximumprincipen

4 – 23

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.2.2 Given sluttid, obegränsat sluttillstånd

Enligt (4.2.2a) skall styrsignalerna väljas som lösningen till

min H (x (t ), u, p(t ))  2min2 ( p1 (v( x2 )  u1 )  p2 u2 )  p1v( x2 )  2min2 ( p1u1  p2 u2 ) uU

u1  u2 1

u1  u2 1

Man kan enkelt visa att

p1

u1  u1  

p12  p22

, u2  u2  

p2 p12  p22

satisfierar den optimala lösningen. Av uttrycken för de adjungerade ekvationerna följer t

t

t

0

0

0

p1 (t )  1 och p2 (t )   p 2 ( ) d    p1 ( )v( x2 ( )) d   v( x2 ( )) d Om vattnets hastighet v t.ex. varierar linjärt med x2 , så att v ( x2 )  k x2 , fås med beaktande av p2 (T )  0 , att

p2 (t )  k (t  T )

4.2 Maximumprincipen

 4 – 24

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.2 Maximumprincipen

4.2.3 Minimaltidsproblem I ett minimaltidsproblem vill man genom styråtgärder minimera den tid det tar att från ett givet utgångstillstånd uppnå ett visst sluttillstånd. I detta fall blir förlustfunktionen så enkel som tf

J   1  dt  tf 0

vilket i de tidigare uttrycken motsvaras av  (x(tf ))  0 och L(x(t ), u(t ))  1. I detta fall existerar alltid ett villkor ψ ( x(tf ))  0 , som sluttillståndet bör satisfiera. För ett linjärt system

x (t )  Ax(t )  Bu(t )

begränsat av

ui (t )  uimax , i  1, , dim(u)

x(0)  x0 , ψ (x(tf ))  0 4. Optimal styrning

4 – 25

Laboratoriet för reglerteknik Reglerteknik II / KEH

4.2.3 Minimaltidsproblem

kan man visa att den optimala styrstrategin i allmänhet har formen

ui (t )

uimax , p(t )T bi  0 max T   max   p bi ) u sign( ( t ) i T , p(t ) bi  0  ui

där bi är i :te kolonnen av B och p(t ) är en lösning till den adjungerade ekvationen. T Funktionen sign(p(t ) bi )  1 byter tecken vi något visst värde på t , som beror av systemet och de gällande begränsningarna.

Denna typ av styrning kallas bang-bang-styrning. Allmänt kan man säga att en styrsignal, som alltid antar sitt största eller minsta värde med ändligt många växlingar däremellan, är av bang-bang typ. Dead-beat-reglering, som egentligen är lösningen till ett minimaltidsproblem, leder vanligtvis till bang-bang-reglering.

4.2 Maximumprincipen

4 – 26

4. Optimal styrning. 4. Optimal styrning. Vad är optimal styrning?

Recommend Documents