Machine Learning Methods for Image-based Phenotypic Profiling in Early Drug Discovery

Tid: On 2024-06-12 kl 14.00

Plats: D3, Lindstedtsvägen 5, Stockholm

Språk: Engelska

Ämnesområde: Datalogi

Respondent: Johan Fredin Haslum , Beräkningsvetenskap och beräkningsteknik (CST)

Opponent: Professor Joakim Lindblad, Uppsala University; Department of Information Technology; Vi3; Image Analysis

Handledare: Associate Professor Kevin Smith, Science for Life Laboratory, SciLifeLab, Beräkningsvetenskap och beräkningsteknik (CST); Associate Professor Hossein Azizpour, Science for Life Laboratory, SciLifeLab, Robotik, perception och lärande, RPL, SeRC - Swedish e-Science Research Centre; Erik Müllers, AstraZeneca; Karl-Johan Leuchowius, AstraZeneca

Exportera till kalender

QC 20240520

Abstract

I jakten på nya mediciner är strategier för att effektivisera processen för läkemedelsupptäckt avgörande. Bildbaserad fenotypisk profilering, med sina miljontals bilder på fluorescent färgade celler, erbjuder ett rikt och effektivt sätt att fånga de morfologiska effekterna av potentiella behandlingar på levande system. Inom sådan komplex data kan okända biologiska insikter identifieras och nya läkemedelsbehandlingar upptäckas, men analysmetoder kapabla att extrahera informationen krävs för att urskilja dem.

Denna avhandling utforskar maskininlärningens roll i att förbättra användbarheten och analysen av fenotypisk data. Den tar sig an utmaningar specifika för denna typ av data, såsom bristen på tillförlitliga annoteringar som krävs för övervakad inlärning, samt förväxlingsfaktorer i datan som ofta är oundvikliga på grund av experimentell variation. Vi utforskar överföringsinlärning för att öka modellernas generaliseringsförmåga och robusthet, samt analyserar hur faktorer som domänavstånd, initialisering, datamängd och modellarkitektur påverkar effektiviteten i att tillämpa förtränade vikter från naturliga domäner på biomedicinska.

Vidare fördjupar vi oss i oövervakad inlärning för fenotypiska bilddata, men upptäcker att dess direkta tillämpning är otillräcklig i detta sammanhang eftersom den inte lyckas skilja mellan olika biologiska effekter. För att hantera detta utvecklar vi nya strategier för oövervakat lärande, designade för att modellen ska kunna ignorera experimentellt brus, vilket förbättrar dess förmåga att urskilja effekterna av olika behandlingar. Vi utvecklar även en teknik som gör det möjligt för en modell tränad för fenotypisk profilering att anpassas till ny data från en okänd källa utan behov av några annoteringar eller övervakat lärande. Med denna metod kan en generell fenotypisk profilmodell enkelt anpassas till data från olika källor utan annoteringar.

Utöver våra tekniska bidrag visar vi också att bioaktiva substanser identifierade med metoderna i denna avhandling har bekräftats experimentellt. Våra resultat tyder på att även om fenotypiska data och biomedicinsk bilddata utgör komplexa utmaningar, kan maskininlärning spela en avgörande roll i att göra den tidiga fasen av läkemedelsupptäckt mer effektiv.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-346574

Till kalendern

Utbildning

Forskning

Samverkan

Om KTH

Bibliotek

Machine Learning Methods for Image-based Phenotypic Profiling in Early Drug Discovery

Abstract

Kontakt