Till innehåll på sidan
Till KTH:s startsida Till KTH:s startsida

Inverse and Forward Approaches for Optimal Control and Estimation in Agent-Based Systems

Tid: To 2022-06-02 kl 14.00

Plats: F3, Lindstedtsvägen 26 & 28, Stockholm

Språk: Engelska

Ämnesområde: Tillämpad matematik och beräkningsmatematik, Optimeringslära och systemteori

Respondent: Yibei Li , Optimeringslära och systemteori

Opponent: Professor Bijoy Ghosh, Texas Tech University

Handledare: Professor Xiaoming Hu, Optimeringslära och systemteori; Universitetslektor Per Enqvist, Optimeringslära och systemteori

Exportera till kalender

QC 220504

Abstract

Denna avhandling behandlar tre ämnen inom optimal styrteori och estimering för agentbaserade dynamiska system, med både ingenjörs- och samhälleliga tillämpningar. Först studeras det inversa problemet för optimal styrning. Där är målet att givet ett dynamiskt system återskapa den underliggande kostnadsfunktionen utifrån observationer av optimala trajektorier. Detta ger inte endast större förståelse för naturliga och samhälleliga fenomen, utan också kriterier för att bestämma optimala regulatorer för andra, liknande problem. Vidare studerar vi även framträdandet av emergens i system med flera agenter. Problemet behandlas utifrån ett spelteoretiskt ramverk som modellerar strategiska interaktioner mellan självinriktade agenter. I denna avhandling behandlas särskilt formering (immanent formationsreglering), där ett särskilt problem är att bestämma individuella kostnadsfunktioner för att uppnå optimal emergens. Slutligen behandlas även distribuerad samordning av samhälleliga, specifikt finansiella, system. Kreditvärderingsproblemet studeras genom att ta in information från ett dynamiskt nätverkssystem.

Det inversa problemet för optimal styrning av kontinuerliga system med finit tidshorisont studeras särskilt i artikel A och C, antingen med fullständiga eller partiella observationer av tillstånd. Trots att det linjärkvadratiska problemet med infinit tidshorisont har studerats omfattande, är motsvarande problem med finit tidshorisont till stor del olöst. Vad vi vet är vårt resultat det första fullständiga gällande nödvändiga och tillräckliga villkor för att ett sådant inverst problem ska vara lösbart. Vi behandlar lösningars unikhet och härleder kostnadsfunktionernas ekvivalensklass. Dessutom ställer vi, utifrån systemets inverterbarhet, upp ett välformulerat problem även för fallet då optimal syntes endast delvis kan observeras. För icke-optimala observationer löser vi minimeringsproblem av residualer för att ta bäst skatta kostnadsfunktionen.

Vidare behandlar artikel B the inversa problemet för optimal styrning utifrån en stokastisk modell, där partiella tillståndsobservationer görs med ett slumpmässigt mätfel. Först formuleras problemet som ett identifieringsproblem där de exakta initiala tillstånden (används att) excitera modellen, vars identifierbarhet motiveras under ett antagande om systemets relativa grad och vars statistiska konsistens visas vid empirisk estimering. Sedan anpassas problemet till maximum likelihoodestimering för att behandla mer praktiska scenarier med icke-exakta initiala tillstånd. Problemet löses då med en väntevärdesmaximerande algoritm under antaganden om Gaussiska sannolikhetsfördelningar.

I artikel D formuleras formeringsproblemet för system med flera agenter som ett differentiellt spel utan samarbete för både finit och infinit tidshorisont. Mångfalden av alla ekvivalenta konfigurationer av önskade formationer studeras genom att ta hänsyn till alla permutationer av riktningar och agenter, vars konvergens och stabilitet analyseras i båda fallen. Det nya i vårt arbete ligger framför allt i att den önskade formationen inte definieras i förväg i spelet, utan uppnås enbart genom valet av systemets kommunikationstopologi utan användning av formeringsfelet i regulatorn, vilket annars kan vara svårt att få information om. Regelbundna polyedrar och antipodiska formationer uppnås genom Nashjämvikt medan kollisioner agenter emellan undviks naturligt.

Artikel E berör nätverksbaserad kreditvärdering och fördelen av nätverksbaserad information studeras i två scenarier. Först, då kreditvärderingen endast är individberoende, bestäms ett optimalt Bayesiskt filter för riskpredicering vilket används som referens för långivaren för framtida finansiella beslut. Sedan föreslås en rekursiv Bayesisk estimator för att ytterligare förbättra kreditvärderingen genom att också ta hänsyn till den dynamiska nätverkstopologin. Vi visar att den föreslagna, icke-väntevärdesriktiga, estimatorn har högre precision än någon effektiv estimator i det föreslagna utvärderingsramverket (evolutionsramverket), och att de genomsnittliga kvadratfelen är strikt mindre än Cramér-Raos undre begränsning för kunder inom ett särskilt kreditvärdighetsintervall.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-311742