Till innehåll på sidan
Till KTH:s startsida

Simulation-Driven Parameter Estimation with a Focus on Control and Privacy

Tid: Fr 2026-05-08 kl 09.00

Plats: F3 (Flodis), Lindstedtsvägen 26 & 28

Videolänk: https://kth-se.zoom.us/s/67983919825

Språk: Engelska

Respondent: Braghadeesh Lakshminarayanan , Reglerteknik

Opponent: Associate Professor Maarten Schoukens, Department of Electrical Engineering, Eindhoven University of Technology, Netherlands

Handledare: Professor Cristian R. Rojas, Reglerteknik

Exportera till kalender

QC 20260409

Abstract

Parameterskattning är en central uppgift inom olika områden såsom systemidentifiering, statistik och maskininlärning. Bland befintlig litteratur finns många skattningsmetoder, varav flera har välstuderade asymptotiska egenskaper. Högteknologiska digitala tvillingar (DT) ger möjlighet att troget replikera verkliga system genom korrekt kalibrering. Genom att utnyttja dessa DT kan simuleringsbaserade skattare lösa problem utmaningar som är förknippade med traditionella metoder, framför allt deras beräkningskostnad och känslighet för initialvärden. Dessutom förlitar sig traditionella skattare ofta på känsliga data, vilket kräver skyddsåtgärder. I denna avhandling behandlar vi simuleringsbaserade och integritetsbevarande metoder för parameterskattning som övervinner många av dessa utmaningar.

Den första delen av avhandlingen utforskar moderna simuleringsbaserade skattningstekniker, med fokus på tvåstegsmetoden (TS). TS-metoden, som verkar under paradigmet invers övervakad inlärning, simulerar ett stort antal utfall över parametervariationer och använder övervakade inlärningsmetoder för att prediktera parametervärden. Metoden är uppdelad i två steg: det första steget komprimerar data till en mindre uppsättning hjälpstatistikor, och det andra steget använder dessa statistikor för att prediktera parametervärden. Enkelheten hos TS-skattaren understryker dess tolkningsbarhet, vilket motiverar en teoretisk underbyggnad som utgör en central motivation för denna avhandling. Vi etablerar statistiska ramverk för TS-skattaren, vilket ger upphov till dess Bayes- och minimaxversioner, samt utvecklar en förbättrad minimax-TS-variant baserad på gradientförstärkning som utmärker sig genom beräkningseffektivitet. Vi genomför både asymptotisk och icke-asymptotisk analys av TS-skattaren, och fastställer stark konsistens, asymptotisk normalitet och ändliga-sampel-gränser som karakteriserar skattningsfelet i termer av antalet datapunkter och observationslängd. Slutligen adresserar vi frågan om att generera diversifierad och informativ träningsdata genom att föreslå en Metropolis-justerad Langevin-algoritm (MALA)-baserad metod för att sampla träningsparametrar från Jeffreys prior, vilket återspeglar parameterrummets inneboende geometri via Fisher-informationsmatrisen.

Den andra delen av avhandlingen behandlar problemet att anpassa förtränade TS-skattare till situationer utanför träningsfördelningen. Vi introducerar två finjusteringsmetoder: en övervakad metod som kombinerar anomalidetektion i egenskapsrummet med Fisher-informationsstyrd omträning, och en självövervakad metod som minimerar diskrepansen mellan simulerade och observerade trajektorier utan att kräva märkt data.

Den tredje delen av avhandlingen introducerar tillämpningar av simuleringsbaserade skattningsmetoder för design av trimningsregler för PI-regulatorer. Genom att utnyttja syntetiska datamängder genererade från DT tränar vi maskininlärningsalgoritmer för att meta-lära trimningsregler, vilket effektiviserar kalibreringsprocessen utan manuellt ingripande. Vi utforskar både TS-baserade metoder med explicit parameterskattning och direkta inlärningsmetoder med neurala nätverksarkitekturer såsom faltningsneuronnät och WaveNet.

I den avslutande delen av avhandlingen behandlar vi scenarier där skattningsförfaranden måste hantera känsliga data. Här introducerar vi differentiell integritet som bivillkor i Bayes-punktskattningsproblemet för att skydda känslig information. Vi föreslår en enhetlig metod där skattningsproblemet och bivillkoren för differentiell integritet integreras i ett enda konvext optimeringsproblem, vilket optimerar avvägningen mellan noggrannhet och integritet. I fall där både observations- och parameterrummen är ändliga reduceras denna metod till ett lösbart linjärt program som kan lösas med standardverktyg.

Sammanfattningsvis syftar denna avhandling till att adressera teoretiska grunder, robusthet och integritetsfrågor inom området simuleringsbaserad parameterskattning.

Link to DiVA