Laboratoriet för reglerteknik Reglerteknik II / KEH
4. Optimal styrning
4. Optimal styrning Vad är optimal styrning? I allmänna termer kan (regler)tekniska problem formuleras på följande sätt: ”Välj styrsignaler så att systemet beter sig så bra som möjligt” Svårigheten ligger vanligtvis i att formulera vad som är ”så bra som möjligt”. Om man kan formulera detta matematiskt — samt har en representativ processmodell — kan man lösa reglerproblemet systematiskt: man löser helt enkelt det matematiska optimeringsproblemet. Exempel på praktiska problemställningar är att bestämma optimal väg (genom ett nätverk) från en punkt A till en punkt B beräkna optimal styrstrategi för en satsvis cellulosa- eller sockerkokare minimera tiden det tar att byta papperskvalitet på en pappersmaskin bestämma optimal styrstrategi vid tillverkning av halvledare (kan bestå av 300 delsteg) designa en process bestående av flera delprocesser så att anläggnings- och driftskostnaderna minimeras Reglerteknik II – Tillståndsmetoder (419301)
4–1
Laboratoriet för reglerteknik Reglerteknik II / KEH
4. Optimal styrning
Öppen styrning Öppen styrning är en speciell typ av styrproblem där man inte utnyttjar återkoppling; den optimala strategin beräknas helt utgående från processmodellen och ett matematiskt godhetskriterium (även kostnadsfunktion, förlustfunktion). Typiska problem av denna typ är att bestämma ”billigaste vägen” minimera tiden för en verksamhet allokera resurser Ofta kombineras öppen styrning med återkopplad reglering på en lägre nivå. T.ex. problemet att bestämma optimal temperaturprofil som funktion av tiden för en satsreaktor är ett öppet styrproblem, men temperaturen realiseras genom återkopplad reglering. I detta fall är problemet att generera optimala börvärden
Reglerteknik II – Tillståndsmetoder (419301)
4–2
Laboratoriet för reglerteknik Reglerteknik II / KEH
4. Optimal styrning
Övning 4.1. Ett exempel på billigaste färdväg Vi skall resa från punkt A till punkt B i nedanstående schema, där vi skall välja en av flera möjliga resrutter så att resans totalkostnad minimeras. Kostnaderna för de möjliga delrutterna finns utmärkta i figuren. Vilken väg skall vi välja från punkt A till punkt B?
6 2
4 A
4
3 2
4 4
7
2 4
5
6 3
2 5 4 5
4 1
1
1
4 2 5
2
B
3
48
Reglerteknik II – Tillståndsmetoder (419301)
4–3
Laboratoriet för reglerteknik Reglerteknik II / KEH
4. Optimal styrning
4.1 Dynamisk programmering Dynamisk programmering, utvecklad av Richard Bellman i slutet av 1950-talet, är en optimeringsmetod som är speciellt lämplig för problem som kan uppdelas i en serie delproblem, som kan behandlas sekventiellt så att varje delproblem medför ett beslut (dvs en styråtgärd). Typiska problemställningar är att bestämma ”billigaste vägen” allokera resurser Dynamisk programmering bygger på optimalitetsprincipen: De optimala besluten (styråtgärderna) från och med ett godtyckligt steg i beslutsprocessen (dvs de efterföljande besluten) får inte bero på hur (tillståndet i) detta steg uppnåtts. Vad betyder detta? Vi kan också formulera optimalitetsprincipen på följande sätt: Oberoende av vad vi gjort fram till steg n i beslutsprocessen, skall vi i fortsättningen göra det som är optimalt för de efterföljande stegen i beslutsprocessen. Denna princip har som följd att det ofta är fördelaktigt att beräkna den optimala strategin startande från slutändan av den sekventiella beslutsprocessen. Reglerteknik II – Tillståndsmetoder (419301)
4–4
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1 Dynamisk Programmering
4.1.1 Exempel på öppen styrning utan begränsningar Ett dynamiskt system beskrivs av den tidsdiskreta ekvationen
xk 1 xk u k , x0 10 Beräkna styråtgärderna u0 u0 , u1 u1 och u 2 u 2 som minimerar förlustfunktionen 3
J x 2 (t ) dt 0
då tillståndet x(t ) antas förändras linjärt med tiden mellan samplingspunkterna. Samplingsintervallet är h 1 (tidsenhet) och inga begränsningar existerar för u k . Eftersom x (t ) förändras linjärt mellan samplingspunkterna gäller
x(t ) ( xk 1 xk ) (t k ) xk , k t k 1 , k 0, 1, 2 vilket gör att förlustfunktionen kan skrivas
J
2
k 1
k
k 0
4. Optimal styrning
( xk 1 xk )(t k ) xk
2
2
dt 13 xk2 1 xk 1 xk xk2 k 0
4–5
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.1 Öppen styrning utan begränsningar
Lösning genom ordinär optimering Eftersom styrsignalernas storlek i detta fall inte bidrar till förlustfunktionen kan man lika väl optimera direkt med avseende på x1, x2 och x3 och därefter beräkna de optimala styrsignalerna när de optimala tillstånden x1 x1 , x2 x2 och x3 x3 är kända.
Vi skall alltså bestämma
min J där x1 , x 2 , x3
2
J 13 ( xk2 xk xk 1 xk21 ) 13 ( x02 x0 x1 2 x12 x1 x2 2 x22 x2 x3 x32 ) k 0
Eftersom variablerna saknar begränsningar gäller vid minimum
J J J 0 , 0 , 0 x1 x2 x3
4.1 Dynamisk programmering
4–6
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.1 Öppen styrning utan begränsningar
Vi får J x1
13 ( x0 4 x1 x2 ) 0 ,
J x 2
13 ( x1 4 x2 x3 ) 0 ,
J x3
13 ( x2 2 x3 ) 0
dvs (räknat från slutet)
x3 1 x2 1 x1 1 x0 5 x3 12 x2 7 26 13 2 2 x0 10 4 x2 x3 4 x2 12 x2 x1 x2 72 x1 x2 72 x1 26 13 x 7 x 35 7 4 x1 x2 4 x1 72 x1 x0 x1 26 x0 13 26 0 1 samt
u0 x0 x1 19 x0 95 13 26 25 5 5 u1 x1 x2 7 x1 26 x0 13 u x x 1 x 1 x 1 x 5 2 2 3 13 26 0 7 1 2 2 2 375 min J 13 ( x02 x0 x1 2( x1 ) 2 x1 x2 2( x2 ) 2 x2 x3 ( x3 ) 2 ) 15 x 28,85 0 52 13
4.1 Dynamisk programmering
4–7
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.1 Öppen styrning utan begränsningar
Lösning genom dynamisk programmering Vi skriver förlustfunktionen som
J
2
J k J 0 J1 J 2
k 0
, J k 1 ( xk2 xk xk 1 xk21 ) 3
och börjar med att minimera det sista steget (k = 2) J 2 x3
13 x ( x22 x2 x3 x32 ) 13 ( x2 2 x3 ) 0 x3 12 x2 (samma som tidigare) 3
Därefter minimerar vi stegen k = 1+2. Vi har med x3 12 x2
J1 2 J1 J 2 13 ( x12 x1 x2 x22 ) 13 ( x22 x2 x3 x32 ) 13 ( x12 x1 x2 74 x22 ) J 1 2 x 2
13 x ( x12 x1 x2 74 x22 ) 13 ( x1 72 x2 ) 0 x2 72 x1 (samma) 2
Alla steg med x3 12 x2 och x2 2 x1 ger 7 2 J J 0 J1 2 13 ( x02 x0 x1 x12 ) 13 ( x12 x1 x2 74 x22 ) 13 ( x02 x0 x1 13 x ) 1 7
J x1
2 26 1 7 13 x ( x02 x0 x1 13 x ) ( x x ) 0 x x (samma) 1 26 0 7 1 3 0 7 1 1
4.1 Dynamisk programmering
4–8
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.1 Öppen styrning utan begränsningar
Suboptimala lösningar På grund av förlustfunktionens form
J
2
2 1 2 J J J J , J ( x x x x k 0 1 2 k 3 k k k 1 k 1 )
k 0
ligger det nära till hand att minimera varje steg var för sig, dvs att minimera lokalt: J k x k 1
13 x ( xk2 xk xk 1 xk21 ) k 1
13 ( xk 2 xk 1 ) 0 xk 1 12 xk som är fel lösning (utom för sista steget k 2) . Denna suboptimala lösning (”optimal i varje steg”) ger
J sub 14 ( x02 x12 x22 ) 14 ( x02 54 x12 ) 21 2 64 x0 525 32,81 16
En dead-beat strategi u0 x0 , u1 u 2 0 ger x1 x2 x3 0 och J dead 1 x02 100 33,33 . 3 3
4.1 Dynamisk programmering
4–9
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.1 Öppen styrning utan begränsningar
Kommentarer I detta mycket enkla fall var metoden med dynamisk programmering knappast enklare än ordinär optimering. Vi kan dock konstatera följande: – Om antalet steg varit större hade det dock varit besvärligt att optimera globalt med avseende på alla optimeringsvariabler samtidigt. Vid användning av dynamisk programmering blir de enskilda stegen inte besvärligare. – Om förlustfunktionen är mer komplicerad, inkluderande t.ex. styrsignaler, blir det också besvärligare att optimera globalt i ett steg. Vid användning av dynamisk programmering blir varje enskilt steg normalt inte nämnvärt svårare. – Ifall man har begränsningar på tillståndvariablerna (utsignalerna) och/eller styrsignalerna, blir traditionell optimering mycket besvärlig, kanske omöjlig. Begränsningar kan relativ enkelt beaktas vid dynamisk programmering då problemet löses stegvis. En nackdel med dynamisk programmering är det stora antal olika alternativ som måste ”sparas” ifall man inte kan uttrycka sambanden analytiskt (”the curse of dimensionality”).
4.1 Dynamisk programmering
4 – 10
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1 Dynamisk programmering
4.1.2 Exempel på öppen styrning med begränsningar Antag att styrsignalerna u0 , u1 och u 2 i det ovan behandlade exemplet endast kan anta jämna heltalsvärden. Då kan problemet i princip inte lösas analytiskt genom nollställning av partialderivator, varken genom ordinär optimering eller dynamisk programmering. En möjlighet är att avrunda den analytiska lösningens styrsignaler till närmaste jämna heltal, men det finns inget som garanterar att detta ger den optimala heltalslösningen. Det finns avancerade matematiska metoder för lösning av heltalsproblem som vi dock inte skall behandla här. En fördel med heltalsproblem är dock att det vanligtvis endast finns ett ändligt antal möjliga lösningar, vilket betyder att man i princip kan analysera alla tänkbara lösningar. Genom användning av dynamisk programmering, ev. kombinerad med någon fundamental analys av problemets natur och nödvändiga egenskaper för den optimala lösningen, kan man ofta lösa denna typ av problem förhållandevis enkelt.
4. Optimal styrning
4 – 11
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.2 Öppen styrning med begränsningar
Exempel med begränsningar Uppgiften är att minimera
J
2
Jk
k 0
, J k 1 ( xk2 xk xk 1 xk21 ) 3
under bivillkoren (modellen) xk 1 xk u k , x0 10 samt uk 0, 2, 4, . Det är enkelt att övertyga sig om att för den optimala lösningen måste gälla, ifall xk 0 , att xk 1 xk samt att xk 1 och xk inte har samma tecken (eftersom xk 1 xk 0 minimerar varje J k jämfört med xk 1 xk 0 ). Man inser då, med hjälp av modellen, att de optimala styrsignalerna u k och tillstånden xk måste satisfiera
u0 2, 4, 6, 8, 10 , u1 0, 2, 4, 6, 8 , u 2 0, 2, 4, 6 x1 0, 2, 4, 6, 8 , x2 0, 2, 4, 6 , x3 0, 2, 4 Det vore möjligt att begränsa styrsignalerna ytterligare med en mer ingående inledande analys, vilket vi dock inte gör. 4.1 Dynamisk programmering
4 – 12
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.2 Öppen styrning med begränsningar
I stället utnyttjar vi dynamisk programmering för att hitta den slutliga lösningen. Med hjälp av modellen xk 1 xk u k kan uttrycket för J k skrivas
J k 13 ( xk2 xk u k u k2 ) Steget k = 2 Eftersom u 2 12 x2 gäller för lösningen av det obegränsade fallet, är det också en möjlig lösning i detta fall, ifall det finns en tillåten lösning som satisfierar sambandet.
a) Om x2 0, 4 , fås u2 12 x2 , som är ett jämnt heltal. Bidraget till förlustfunktionen blir J 2 1 ( x22 x2 1 x2 ( 1 x2 ) 2 ) 1 x22 . 4 3 2 2 b) Om x2 2, 6 är u 2 1 x2 inte ett jämnt heltal. Närmast till hands ligger 2 lösningarna u2 12 x2 1, som är jämna heltal. Kontroll visar att både + och – ger samma bidrag J 2 1 x22 1 . Inget annat tillåtet u 2 ger här ett mindre J 2 . 3 4 4.1 Dynamisk programmering
4 – 13
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.2 Öppen styrning med begränsningar
Stegen k = 1 + 2
a) Vi har x2 0, 4. Modellsambandet x2 x1 u1 ger u1 x1 0, 4 och 7 2 7 2 5 J1 2 J1 J 2 13 ( x12 x1u1 u12 ) 14 x22 12 x1 6 x1u1 12 u1
Möjligheterna är (i) u1 x1 och (ii) u1 x1 4 som ger (i) J1 2 1 x12 och (ii) J1 2 1 ( x12 4 x1 28) . 3 3 Här är (i) bättre (mindre) om x1 0, 2, 4, 6, (ii) bättre om x1 8 . b) Vi har x2 2, 6 och således u1 x1 2, 6 samt 7 2 1 7 2 5 J1 2 J1 J 2 13 ( x12 x1u1 u12 ) 14 x22 13 12 x1 6 x1u1 12 u1 3
Möjligheterna är (i) u1 x1 2 och (ii) u1 x1 6 som ger (i) J1 2 1 ( x12 2 x1 8) och (ii) J1 2 1 ( x12 6 x1 64) . 3 3 Här är (i) bättre om x1 14 , dvs alltid.
x2 x1 u1 6 är således inte en möjlig optimal lösning. 4.1 Dynamisk programmering
4 – 14
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.2 Öppen styrning med begränsningar
Alla steg a) (i) Vi har x1 0, 2, 4, 6. Sambandet x1 x0 u0 ger u0 x0 0, 2, 4, 6 och då x0 10 , u0 4, 6, 8, 10 samt
J J 0 J 1 2 13 ( x02 x0 u 0 u 02 ) 13 x12 13 (2 x02 3 x0 u 0 2u 02 ) 13 (200 30u 0 2u 02 ) Minimum J 88 fås för u0 8 . 3 a) (ii) Här är x1 8 . Sambandet x1 x0 u0 samt x0 10 ger u0 2 och
J J 0 J1 2 13 ( x02 x0u0 u02 ) 13 ( x12 4 x1 28) 13 ( 2 x02 3 x0u0 2u02 4 x0 4u0 28) 144 3 Detta fall är alltså sämre än a) (i).
4.1 Dynamisk programmering
4 – 15
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.2 Öppen styrning med begränsningar
b) (i) Här är x1 0, 2, 4, 6, 8. Sambandet x1 x0 u0 samt x0 10 ger u0 2, 4, 6, 8, 10 och
J J 0 J1 2 13 ( x02 x0u0 u02 ) 13 ( x12 2 x1 8) 13 (2 x02 3 x0u0 2u02 2 x0 2u0 8) 13 (188 28u0 2u02 ) Minimum J
92 3
fås för u0 6 och u0 8 . Även detta är sämre än a) (i).
Den optimala lösningen Den optimala lösningen är fall a) (i) som för x0 10 ger J 88 29,33 med 3
u0 8 , u1 2 , u 2 0 x1 2 , x2 0 , x3 0
Obs att denna lösning (med denna förlustfunktion) är bättre än dead-beat strategin, som även satisfierar begränsningarna u k 0, 2, 4, .
4.1 Dynamisk programmering
4 – 16
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1 Dynamisk programmering
4.1.3 Allmän formulering av lösning med dynamisk programmering Sambandet mellan tillstånden xk 1 och xk samt en styråtgärd u k kan allmänt skrivas
xk 1 f k ( xk , u k ) , k 0, 1, där f k är en godtycklig funktion, som inte behöver vara linjär och inte behöver vara densamma för alla k . Antag att man önskar styra systemet från tillståndet x0 till xN så att förlustfunktionen
J
N 1
g k ( xk , u k )
k 0
minimeras. Här är g k en godtycklig funktion som anger kostnaden att gå från tillståndet xk till xk 1 med styrsignalen u k . Om man inledningsvis har en kostnad g k som är beroende av tillståndet xk 1 , kan detta elimineras med hjälp av modellsambandet. Därmed kan sluttillståndet x N alltid elimineras från förlustfunktionen 4. Optimal styrning
4 – 17
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.1.3 Allmän formulering av lösning
Låt J k ( xk ) beteckna kostnaden för den optimala vägen (dvs den minimala kostnaden) från tillståndet xk till sluttillståndet x N . Då gäller (uppenbarligen)
J N ( x N ) 0
samt för successivt minskande k , k N 1, , 0 :
J k ( xk ) min g k ( xk , u k ) J k1 ( xk 1 ) min g k ( xk , u k ) J k1 ( f k ( xk , u k )) uk
uk
Minimering i varje steg (enligt valfri metod, med beaktande av ev. begränsningar) ger en * optimal styrsignal u k som funktion av xk , betecknad u k ( xk ) , matematiskt uttryckt:
u k ( xk ) arg min g k ( xk , u k ) J k1 ( f k ( xk , u k )) uk
Till slut erhålles för k 0 min J J 0 ( x0 ) och nelsetillståndet x0 är känt. Tillståndet x1 x1
u0 ( x0 ) , som kan bestämmas då begynkan därefter beräknas enligt modellsam-
bandet med u0 u0 ( x0 ) , varefter u1 ( x1 ) kan bestämmas, osv xk och uk ( xk* ) för alla k . Märk att beteckningarna här avviker från beteckningarna i de tidigare exemplen. 4.1 Dynamisk programmering
4 – 18
Laboratoriet för reglerteknik Reglerteknik II / KEH
4. Optimal styrning
4.2 Maximumprincipen Optimalitetsprincipen ger en strategi för att finna den optimala lösningen när ett problem kan delas upp i ett antal delsteg, som kan lösas sekventiellt. Detta förutsätter att också förlustfunktion kan uppdelas så, att en viss förlust är förknippad varje enskilt delsteg. Maximumprincipen ger villkor som den optimala lösningen bör uppfylla för mera allmänna optimeringsproblem, som inte nödvändigtvis kan uppdelas i ett antal delproblem som löses sekventiellt. Dessa villkor ger inte direkt den optimala lösningen, men de gör det (vanligtvis) möjligt att finna den. – Benämningen ”maximumprincipen” följer av att problemen tidigare formulerades som maximeringsproblem; nuförtiden minimerar vi hellre. – Principen benämnes ofta Pontryagins maximumprincip eller minimumprincip efter en av upphovsmännen. – Maximumprincipen ger optimalitetsvillkor för generella styrproblem; ett antal viktiga specialfall inkluderar var för sig stora klasser optimala styrproblem.
Reglerteknik II – Tillståndsmetoder (419301)
4 – 19
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.2 Maximumprincipen
4.2.1 Det optimala styrproblemet Det optimala styrproblemet kan i kontinuerlig tid formuleras på följande sätt: Minimera förlustfunktionen tf
J (x(tf )) L( x(t ), u(t )) dt
(4.2.1a)
0
under bivillkoren
x (t ) f ( x(t ), u(t )) u(t ) U , 0 t tf x(0) x0 , ψ ( x(tf )) 0
(4.2.1b) (4.2.1c) (4.2.1d)
Här är (4.2.1b) modellen för det dynamiska systemet, (4.2.1c) definierar ev. begränsningar på de tillgängliga styrsignalerna, (4.2.1d) ger begynnelsetillstånd och ett ev. bivillkor relaterat till sluttillståndet. Viktiga specialfall (som förenklar lösningen) fås när sluttiden tf är given inga bivillkor ψ ( x(tf )) 0 begränsar sluttillståndet x(tf ) förlustfunktionen J har speciellt enkel form 4. Optimal styrning
4 – 20
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.2 Maximumprincipen
4.2.2 Given sluttid, obegränsat sluttillstånd I det fall, att sluttiden tf är given och sluttillståndet x(tf ) är obegränsat, bör den optimala lösningen u (t ) , x (t ) uppfylla följande villkor:
min H (x (t ), u, p(t )) H (x (t ), u (t ), p(t )) , 0 t tf
(4.2.2a)
H ( x, u , p ) L ( x, u ) p T f ( x , u )
(4.2.2b)
uU
där
är den s.k. Hamiltonfunktionen och där p uppfyller den adjungerade ekvationen
T
T H (x, u (t ), p(t )) ( x ) p (t ) , p(tf ) x x x x ( tf ) x x (t )
4. Optimal styrning
(4.2.2c)
4 – 21
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.2.2 Given sluttid, obegränsat sluttillstånd
Exempel 4.1. Styrning i strömmande vatten. En båt med lägeskoordinaten ( x1 , x2 ) rör sig i ett område med varierande ström. Styrvariabeln u1 är lika med båtens hastighet (relativt vattnet) i x1-riktning, styrvariabeln u2 dess hastighet i x2 -riktningen. Vattnets hastighet är v( x2 ) i x1-riktningen och 0 i x2 riktningen. Båten startar i origo och man vill förflytta sig så långt som möjligt i x1-led på T tidsenheter. Vilka är de optimala styråtgärderna då de är begränsade så att båtens fart relativt vattnet är konstant = 1? Detta ger optimeringsproblemet
min ( x1 (T )) u1 ,u2
under bivillkoren
x1 v( x2 ) u1 ,
x1 (0) 0
x2 u2 , x2 (0) 0 u12 u22 1
4.2 Maximumprincipen
4 – 22
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.2.2 Given sluttid, obegränsat sluttillstånd
Här är förlustfunktionens L 0 , vilket ger
v( x ) u1 p1 (v( x2 ) u1 ) p2 u2 H ( x, u , p ) p T f ( x , u ) p T 2 u 2 De adjungerade ekvationerna blir
( p1 (v( x2 ) u1 ) p2 u2 ) H (x, u (t ), p(t ) p1 (t ) 0 x1 x1 x x ( t ) x x ( t )
( p1 (v( x2 ) u1 ) p2 u2 ) H (x, u (t ), p(t ) p 2 (t ) p1v( x2 ) x2 x2 x x ( t ) x x ( t ) (x) ( x1 (T )) p1 (T ) 1 x1 x1 x x (T ) x x (T ) (x) ( x1 (T )) p2 (T ) 0 x2 x2 x x (T ) x x (T ) 4.2 Maximumprincipen
4 – 23
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.2.2 Given sluttid, obegränsat sluttillstånd
Enligt (4.2.2a) skall styrsignalerna väljas som lösningen till
min H (x (t ), u, p(t )) 2min2 ( p1 (v( x2 ) u1 ) p2 u2 ) p1v( x2 ) 2min2 ( p1u1 p2 u2 ) uU
u1 u2 1
u1 u2 1
Man kan enkelt visa att
p1
u1 u1
p12 p22
, u2 u2
p2 p12 p22
satisfierar den optimala lösningen. Av uttrycken för de adjungerade ekvationerna följer t
t
t
0
0
0
p1 (t ) 1 och p2 (t ) p 2 ( ) d p1 ( )v( x2 ( )) d v( x2 ( )) d Om vattnets hastighet v t.ex. varierar linjärt med x2 , så att v ( x2 ) k x2 , fås med beaktande av p2 (T ) 0 , att
p2 (t ) k (t T )
4.2 Maximumprincipen
4 – 24
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.2 Maximumprincipen
4.2.3 Minimaltidsproblem I ett minimaltidsproblem vill man genom styråtgärder minimera den tid det tar att från ett givet utgångstillstånd uppnå ett visst sluttillstånd. I detta fall blir förlustfunktionen så enkel som tf
J 1 dt tf 0
vilket i de tidigare uttrycken motsvaras av (x(tf )) 0 och L(x(t ), u(t )) 1. I detta fall existerar alltid ett villkor ψ ( x(tf )) 0 , som sluttillståndet bör satisfiera. För ett linjärt system
x (t ) Ax(t ) Bu(t )
begränsat av
ui (t ) uimax , i 1, , dim(u)
x(0) x0 , ψ (x(tf )) 0 4. Optimal styrning
4 – 25
Laboratoriet för reglerteknik Reglerteknik II / KEH
4.2.3 Minimaltidsproblem
kan man visa att den optimala styrstrategin i allmänhet har formen
ui (t )
uimax , p(t )T bi 0 max T max p bi ) u sign( ( t ) i T , p(t ) bi 0 ui
där bi är i :te kolonnen av B och p(t ) är en lösning till den adjungerade ekvationen. T Funktionen sign(p(t ) bi ) 1 byter tecken vi något visst värde på t , som beror av systemet och de gällande begränsningarna.
Denna typ av styrning kallas bang-bang-styrning. Allmänt kan man säga att en styrsignal, som alltid antar sitt största eller minsta värde med ändligt många växlingar däremellan, är av bang-bang typ. Dead-beat-reglering, som egentligen är lösningen till ett minimaltidsproblem, leder vanligtvis till bang-bang-reglering.
4.2 Maximumprincipen
4 – 26