Till innehåll på sidan
Till KTH:s startsida

Optimering och anpassning av neurala nätverksmodeller för sjukvård och federerat lärande

Tid: On 2026-05-20 kl 13.00

Plats: F3, Lindstedtvägen 26-28

Videolänk: https://kth-se.zoom.us/j/68025809133

Språk: Engelska

Ämnesområde: Informations- och kommunikationsteknik

Respondent: Giacomo Verardo , Datatekniska och lärande system, Networked Systems Lab

Opponent: Professor Thomas Schön, Uppsala University, Uppsala, Sweden

Handledare: Professor Dejan Kostic, Datatekniska och lärande system; Associate Professor Marco Chiesa, Datatekniska och lärande system

Exportera till kalender

QC 20260427

Abstract

Neurala nätverk (NN) har visat god förmåga inom en mängd olika områden, inklusive Natural Language Processing (NLP), bildklassificering och regression. Användningen av allt större Deep Learning (DL)-modeller medför dock praktiska utmaningar, särskilt inom sjukvården: höga minnes- och beräkningskostnader samt ineffektiv träning när data är brusig eller korrupt. I denna avhandling utformar, utvärderar och analyserar vi nya AI-modeller för Federated Learning (FL) och EKG-relaterade uppgifter, vars gemensamma grundtanke är att inkorporera domänkunskap i modellstrukturen, och därigenom optimera träningspipelinen och minska modellkomplexiteten.

Som det första bidraget analyserar vi det distribuerade fallet med flera lättdrivna enheter i ett federerat scenario. Cross-device FL är en gren av Machine Learning (ML) där flera deltagare tränar en gemensam global modell utan att dela data på en central plats. I denna avhandling föreslås en ny teknik, Coded Federated Dropout (CFD), som delar upp den globala modellen i delmodeller på ett strukturerat sätt, vilket ökar kommunikationseffektiviteten och minskar belastningen på enheterna med endast en marginell ökning av träningstiden. Vi redovisar våra resultat för en bildklassificeringsuppgift.

Som det andra bidraget betraktar vi anomalidetektering på Elektrokardiogram (EKG)-registreringar och visar att inkludering av förkunskaper i NN-modeller drastiskt minskar modellstorlek, inferenstid och lagringsåtgång för flera moderna NN. Särskilt fokuserar vi på Autoencoders (AE), en delklass av NN som lämpar sig för anomalidetektering. Vi föreslår en ny metod, kallad FMM-Head, som inkorporerar grundläggande kunskap om EKG-vågformens utseende i en AE. Utvärderingen visar att vi förbättrar arean under ROC-kurvan (AUROC) för baslinjemodeller samtidigt som vi garanterar en inferenstid under 100 ms, vilket möjliggör realtidsövervakning av EKG-registreringar från inneliggande patienter.

Som det tredje bidraget föreslår vi en modell baserad på Graph Neural Networks (GNN) som utnyttjar de rumsliga sambanden mellan EKG-avledningar för att minska antalet elektroder som krävs för EKG-avbildning (ECGI), samtidigt som en högre rekonstruktionsnoggrannhet av hjärtats aktiveringsmönster uppnås jämfört med baslinjen. Detta arbete kan därmed bidra till att göra praktisk ECGI mer genomförbar, eftersom dess kliniska användning ofta begränsas av kostnaden för elektrodvästen och bördan av att placera ett stort antal sensorer.

Som det fjärde bidraget genomför vi den första omfattande retrospektiva multicenterstudien med DL för klassificering av hjärtstopp-etiologi från tidiga post-ROSC EKG, där flera DL- och grundmodeller utvärderas på två dataset. Vi visar experimentellt att modellprestandan minskar med den tid som förflutit sedan ROSC, och att de bäst presterande modellerna fokuserar på fysiologiskt relevanta EKG-segment, vilket påvisas genom saliency map-analys.

Slutligen presenteras flera riktningar för framtida arbete. Användningen av prototypiska nätverk för klassificering av hjärtstopp-etiologi från EKG kan ge exempelbaserade förklaringar, vilket hjälper kliniker att bättre tolka AI-modellers prediktioner när brusiga och störda indata används, såsom EKG registrerade efter hjärtstopp. Dessutom förespråkar denna avhandling vidare forskning kring tekniker för att integrera EKG-anomalidetektering i distribuerade och federerade miljöer.

Link to DiVA