Perspectives of Deep Learning for Neonatal Sepsis Detection
Tid: Fr 2023-08-25 kl 13.00
Plats: F3 (Flodis), Lindstedtsvägen 26 & 28, Stockholm
Videolänk: https://kth-se.zoom.us/j/63793229166
Språk: Engelska
Respondent: Antoine Honoré , Teknisk informationsvetenskap
Opponent: Professor Guy Carrault, Université de Rennes 1
Handledare: Saikat Chatterjee, Teknisk informationsvetenskap; Professor Eric Herlenius, Karolinska Institutet
QC 20230602
Abstract
Nyfödda, vare sig de är för tidigt födda eller inte, är mycket utsatta och står inför livshotande problem under sina första levnadsveckor varje år. Att identifiera infektionsrelaterade tillstånd som sepsis är svårt, även med intensivvård på en neonatalavdelning. Framsteg inom patientövervakningssystem har möjliggjort insamlingen av stora datamängder under sjukhusvistelsen. Dessa databaser är dock ofta distribuerade i oberoende delsystem, vilket gör det svårt att sammanställa en komplett patientjournal till vårdgivare. Även om en komplett journal finns är den svårtolkad på grund av de många och spridda tillfällen då datan samlades in. Flexibiliteten hos djupinlärningsmodeller har visat sig vara en lovande metod för tillförlitliga prediktioner från stora databaser i kliniska situationer, såsom en neonatalavdelning.
Denna avhandling introducerar och utvärderar prediktionsalgoritmer för neonatal sepsisdetektion (NSD). Vi studerar prestandan hos binära klassificeringsalgoritmer i retrospektiva kohortstudier med data från lokala sjukhus. Avhandlingens första del fokuserar på att introducera problemets kliniska och tekniska bakgrund. Den kliniska bakgrunden behandlar sambandet mellan prematuritet, sepsis, och kardiorespiratoriska interaktioner, vilka utgör en stor andel av problemen för NSD. Den tekniska bakgrunden introducerar de teoretiska verktygen som används för att träna och utvärdera binära klassificeringsalgoritmer. Avhandlingens andra del presenterar algoritmer utvärderade på NSD-data från från neonatala intensivvårdsavdelningar sjukhus i Stockholmsregionen.
Vi studerar först den toppmoderna naiva Bayes-algoritmen (NB), och dess prestanda och tillämplighet på NSD med vårt eget dataset. Vi studerar NB i flera situationer där både population och vitala tecken förändras. Vi extraherar 24 variabler från datan med väldigt olika statistiska fördelning, och trots att NB gör starka antaganden om datans statistiska fördelning uppnås goda resultat: upp till 0,82 medianarea under mottagande operationskurva (mAUROC) för neonatal sepsisdetektion. Vidare visar vi att normaliserande flöden (NF), vilket är artificiella neurala nätverksbaserade statistiska fördelningar, kan modellera datans statistiska fördelning mer tillförlitligt, och uppnår en mAUROC om 0,87. Dessa tillvägagångssätt gör det förenklande antagandet att på varandra följande variabler är okorrelerade. Därför undersöker vi prestandan hos återkommande neurala nätverk (RNN), vilka tar hänsyn till tidskorrelationen hos de extraherade variablerna. Vi visar att dessa modeller är användbara för NSD hos nyfödda med mycket låg födelsevikt, där vi visar att de ökar specificiteten från 0,77 med logistisk regression till 0,97 för ett lång-korttidsminnesbaserat RNN. Vi visar också att dessa modeller lider av degraderad hågkomst, vilket leder till liknande mAUROC som NB, utvärderat på data från NSD hos nyfödda med mycket låg födelsevikt.
Motiverat av behovet av att utveckla och utvärdera mer tillförlitliga algoritmer för NSD, studerar vi prestandan hos de hyllade dolda Markovmodellerna (HMM) och föreslår några påbyggnader. För det första, vi diskuterar resultaten för HMM:er kopplade till normaliserande flöden (FlowHMM) för att modellera emissionsfördelningarna. Vi använder väntevärde-maximering (EM) som träningsalgoritm och föreslår ett ytterligare diskriminativt inlärningssteg. Trots det visar vi att att klassiska HMM:er, där normalfördelade blandningsmodeller (GMM) modellerar emissionsfördelningarna, överträffar FlowHMM:er, både med och utan det extra diskriminerande inlärningssteget. Dessutom föreslår vi en faktoriserad HMM tränad med variationell inferens, vilken är kapabel att lära sig oberoende latenta processer från observationer som är modellerade med tillståndsbetingade normaliserande flödesmodeller. Modellen utvärderas på syntetiska data, vilket gör att vi kan visa empiriskt att modellen kan lära sig den underliggande latenta faktoriserade Markovmodellen. Till sist utvärderar vi modellen med en prestandajämförelse: att återskapa en diskret latent process från ett öppet dataset över elförbrukning i hushåll. Detta bereder vägen för vidare utvärdering av klassificeringsmodeller för fysiologiska dataset i mer komplicerade situationer. Specifikt ser vi att faktoriserade HMM:er möjliggör gemensam detektion av både relaterade och orelaterade sjukdomar från fysiologiska data. Detta motiverar insamlingen av data från en större patientkohort, för att täcka in flera sjukdomstillstånd hos för tidigt födda spädbarn.