Towards Reliable Diagnostics Under Data Scarcity - Machine Learning for Manufacturing Equipment
Tid: Fr 2026-06-05 kl 14.00
Plats: F3 , Lindstedtvägen 26-28
Videolänk: https://kth-se.zoom.us/j/62520529067
Språk: Engelska
Ämnesområde: Industriell produktion
Respondent: Eleonora Iunusova , Tillverknings- och mätsystem
Opponent: Professor Anders Skoogh, Chalmers University of Technology
Handledare: Professor Andreas Archenti, Design and Management of Manufacturing Systems, DMMS, Tillverknings- och mätsystem; Dr Robert Tomkowski, Tillverknings- och mätsystem
Abstract
Den pågående digitaliseringen av industriella system förändrar underhållspraxis genom att möjliggöra kontinuerlig övervakning och datainsamling. Detta skapar grunden för datadrivna metoder och möjliggör avancerad diagnostik genom användning av maskininlärning i underhållstillämpningar. För att uppnå tillförlitlig diagnostisk prestanda kräver övervakade maskininlärningsmetoder representativa träningsdata som täcker olika driftförhållanden och karakteristiska signaturer för olika feltyper, med tillräcklig datakvalitet, korrekta etiketter och korrekt annotering. I industriellt underhåll är dessa krav dock ofta inte uppfyllda på grund av heterogena driftregimer, svåra förhållanden vid datainsamling och den inneboende sällsyntheten av felförekomster. Samtidigt är underhållstillämpningar ofta säkerhetskritiska och förknippade med betydande operativa och ekonomiska risker, vilket motiverar behovet av tillförlitlig diagnostik även under databegränsade förhållanden.
Denna avhandling behandlar databrist som en inneboende och till stor del oundviklig begränsning inom industriellt underhåll och utvecklar ett strukturerat tillvägagångssätt för att karaktärisera den, bedöma dess effekter på diagnostisk tillförlitlighet och identifiera effektiva strategier för att hantera sådana begränsningar. Databrist definieras formellt som ett flerdimensionellt begrepp som omfattar fem dimensioner: tillgänglighet, täckning, representativitet, användbarhet och kvalitet, vilket etablerar ett ramverk för systematisk bedömning av datarelaterade begränsningar inom industriell övervakning. Diagnostisk tillförlitlighet karaktäriseras längs tre egenskaper: noggrannhet, generaliseringsförmåga och robusthet, vilka tillsammans utgör grunden för utvärdering av maskininlärningsbaserad diagnostik under databrist.
Effekterna av databrist på diagnostisk tillförlitlighet undersöks genom strukturerade empiriska studier som systematiskt varierar kontrollerade databristfaktorer, inklusive datavolym, andel felprover och mätningsdegradation, över tre överföringsscenarier med ökande domänskift. Inom dessa scenarier kombineras klassiska maskininlärningsmetoder och djupinlärningsmetoder med olika kunskapsöverföringsstrategier, inklusive domänanpassning, överföringsinlärning och gemensam inlärning, för att undersöka hur enskilda faktorer, deras interaktioner och valet av inlärningsstrategi gemensamt bestämmer diagnostisk prestanda. Detta faktoriella tillvägagångssätt kopplar den konceptuella karaktäriseringen av databrist direkt till empirisk utvärdering, vilket möjliggör kvantitativ bedömning och analytisk tolkning av modellbeteende under realistiska industriella begränsningar.
Resultaten fastställer att modelleffektivitet är regimberoende: ingen enskild inlärningsstrategi är universellt optimal, och diagnostisk prestanda styrs av interaktionen mellan dataegenskaper, domänförhållanden och den använda inlärningsstrategin. Resultaten sammanställs till praktiska insikter för databristmedveten maskininlärning, vilka ger handlingsorienterad vägledning för datainsamling, modellval och utformning av tillförlitliga feldetekteringssystem för tillståndsbaserat underhåll i industriella miljöer.