A Further Step of Causal Discovery towards Real-World Impacts
Tid: To 2023-02-02 kl 09.00
Plats: F3, Lindstedtsvägen 26 & 28, Stockholm
Språk: Engelska
Ämnesområde: Datalogi
Respondent: Ruibo Tu , Robotik, perception och lärande, RPL
Opponent: Associate Professor Robin Evans, Department of Statistics, University of Oxford
Handledare: Professor Hedvig Kjellström, Robotik, perception och lärande, RPL; Doctor Cheng Zhang, Microsoft research, Cambridge
QC 20221217
Abstract
Målet för många vetenskapsområden är att hitta orsakssamband och förstå bakomliggande mekanismer. Som den gyllene standarden för att hitta orsakssamband kan slumpmässiga experiment vara svåra eller omöjliga i vissa tillämpningar; Därför har bestämning av underliggande orsakssamband enbart från observationsdata, d.v.s. kausal upptäckt, väckt mer och mer uppmärksamhet inom många områden, såsom geovetenskap, biologi och sjukvård. Å ena sidan har beräkningsmetoder för kausal upptäckt utvecklats och förbättrats avsevärt under de senaste tre decennierna. Å andra sidan finns det fortfarande många utmaningar kvar i både praktik och teori för att ytterligare uppnå verkliga effekter. Denna avhandling syftar till att introducera de typiska metoderna och utmaningarna för kausal upptäckt och sedan utveckla bidragen från de inkluderade artiklarna som tar kliv framåt för att uppnå fler verkliga effekter för kausal upptäckt. Den täcker huvudsakligen fyra utmaningar: praktiska frågor, förståelse och generalisering av de restriktiva antagandena, bristen på uppsättningar av referensdata och tillämpningar av kausalitet i maskininlärningsområden. Varje medföljande artikel bidrar till en av utmaningarna.
I den första artikeln, angående kausal upptäckt i närvaro av saknade data som en av de praktiska frågorna, studerar vi teoretiskt saknade värdens inverkan på metoder för kausal upptäckt och korrigerar sedan felen i deras resultat. Under milda antaganden ger vår föreslagna metod korrekta resultat.
I den andra artikeln undersöker vi förståelsen av antaganden i en klass av kausala upptäcktsmetoder. Sådana metoder lägger betydande begränsningar på funktionella klasser och fördelningar av kausala processer för att bestämma orsakssamband; dock är begränsningarna restriktiva och det saknas god förståelse. Därför introducerar vi en ny dynamisk systemvy för att förstå metoderna och deras begränsningar genom att koppla ihop optimal transport och kausal upptäckt. Dessutom tillhandahåller vi ett kausalt upptäcktskriterium och en robust optimal transport-baserad algoritm.
I den tredje artikeln diskuteras utvärderingen av kausala upptäcktsmetoder. Även om det är för förenklat att utvärdera kausala upptäcktsmetoder med syntetisk data genererad från slumpmässiga kausala grafer, så är uppsättningar av verklig referensdata med grund-sannings orsakssamband efterfrågade och inkluderar alltid praktiska frågor. Därför skapar vi en simulator för neuropatisk smärtdiagnos baserad på verkliga patientjournaler och domänkunskap. Simulatorn tillhandahåller sanna orsakssamband och genererar simuleringsdata som inte kan urskiljas av medicinska experter.
Slutligen undersökte vi en tillämpning av kausalitet: Rättvisa i maskininlärning. Många arbeten inom rättvisa är baserade på begränsningar av statiska statistiska mått över olika demografiska grupper. Det visar sig att beslut under sådana begränsningar kan leda till en skadlig långsiktig påverkan på den missgynnade gruppen. Därför tar vi hänsyn till de bakomliggande orsaksprocesserna, analyserar teoretiskt jämviktstillstånden i dynamiska system under olika rättvisa begränsningar, visar deras inverkan på jämviktstillstånd och introducerar potentiellt effektiva interventioner för att förbättra jämviktstillstånden.