Identification of Non-Linear Differential-Algebraic Equations
Scalable and Consistent Parameter Estimation with Process Disturbances
Tid: Fr 2024-12-13 kl 10.00
Plats: D3, Lindstedtsvägen 5, Stockholm
Videolänk: https://kth-se.zoom.us/j/69456726748
Språk: Engelska
Ämnesområde: Elektro- och systemteknik
Licentiand: Robert Bereza-Jarocinski , Reglerteknik
Granskare: Professor Jonas Sjöberg, Chalmers Technical University, Gothenburg, Sweden
Huvudhandledare: Professor Håkan Hjalmarsson, Reglerteknik; Professor Cristian R. Rojas, Reglerteknik; Professor David Broman, Programvaruteknik och datorsystem, SCS
QC 20241120
Abstract
Denna avhandling handlar om identifiering av icke-linjära differential-algebraiska ekvationer som påverkas av processtörningar. Denna typ av modell är vald eftersom den är mer generell än ordinära differentialekvationer, och särskilt eftersom den är den underliggande modelltypen för objektorienterade ekvations-baserade modelleringsspråk så som Modelica eller VHDL-AMS, och är därför lämplig för att modellera en stor mängd olika fysikaliska system. Avhandlingen fokuserar särskilt på att modellera processtörningar och på att ta hänsyn till dem under identifieringen, för att åtgärda problem med att skattningar kan bli icke-väntevärdesriktiga när störningar annars försummas. Metoderna i denna avhandling är även utvecklade för att vara beräkningsmässigt gångbara och för att producera konsistenta parameterskattningar. Särskilt så undersöks sätt att förbättra metodernas skalbarhet då antalet okända parametrar växer. Detta är viktigt eftersom många konventionella identifieringsmetoder inte är gångbara för komplexa problemställningar så som den som betraktas i denna avhandling.
Som ett första steg så föreslår vi en suboptimal men konsistent skattare för att lösa problemet och visar hur den kan beräknas med hjälp av stokastiska approximationsmetoder. Framåtriktad känslighetsanalys för differential-algebraiska metoder studeras och appliceras för att beräkna väntevärdesriktiga skattningar av gradienten för den betraktade kostnadsfunktionen. Den beräkningsmässiga gångbarheten demonstreras genom ett simuleringsexperiment men en pendelmodell, där vi även visar fördelarna med att ta hänsyn till processtörningar. För att identifiera parametrar för störningsmodellen så krävs det att man har tillgång till derivatan av störningen med avseende på parametrarna.
Som ett andra steg så väljer vi att studera adjunkt känslighetsanalys, eftersom framåtriktad känslighetsanalys kan bli beräkningsmässigt svårhanterligt när antalet okända parametrar växer. Adjunkt känslighetsanalys för differential-algebraiska ekvationer är inte applicerbar till vår problemformulering, vilket är varför vi utökar metoden så att den även kan användas för att beräkna väntevärdesriktiga skattningar av gradienten på ett vis som, till skillnad från framåtriktad känslighetsanalys, undviker att genomföra vissa onödiga mellanliggande beräkningar. Utökningen av metoden kan även appliceras på att identifiera parametrar av störningsmodellen, om man har tillgång till derivator av störningarna med avseende på deras parametrar. De beräkningsmässiga fördelarna med den adjunkta metoden demonstreras genom ett simuleringsexperiment med en deltarobot, där vi även observerar vissa numeriska problem som kan uppstå vid lösningen av differential-algebraiska ekvationer.
I den tredje och sista delen av avhandlingen så studerar vi störningsmodeller mer i detalj. Specifikt så diskuterar vi nödvändigheten av och svårigheterna med att modellera störningar i kontinuerlig tid, och vi visar även hur derivatan av störningarna med avseende på deras parametrar kan beräknas. Vi använder insikter om stokastiska differentialekvationer för att hitta ett sätt att approximera dessa ekvationer med ordinära differentialekvationen. Denna approximation låter oss använda adjunkt känslighetsanalys utan att behöva beräkna derivator av störningarna som ett mellanliggande steg. Detta kan förbättra beräkningshastigheten av den adjunkta metoden, särskilt under ytterligare milda antaganden om störningsmodellens poler. Med detta så kan vi slutföra utvecklingen av den nödvändiga teorin för användningen av större och mer komplexa störningsmodeller.
Tillsammans så möjliggör dessa utvecklingar för beräkningsmässigt gångbara estimeringsmetoder som förväntas resultera i konsistenta skattare även när systemet påverkas utav processtörningar. När antalet okända parametrar växer så kommer den beräkningsmässiga gångbarheten till slut åter igen att vara ett problem, men metoderna i denna avhandling tillåter oss att tänja på gränserna för hur många okända parametrar som vi kan hantera. Detta, andra kvarstående utmaningar, och vidare möjligheter för fortsatt forskning diskuteras i slutet av avhandlingen.