Till innehåll på sidan
Till KTH:s startsida Till KTH:s startsida

Machine Learning Methods for Image-based Phenotypic Profiling in Early Drug Discovery

Tid: On 2024-06-12 kl 14.00

Plats: D3, Lindstedtsvägen 5, Stockholm

Språk: Engelska

Ämnesområde: Datalogi

Respondent: Johan Fredin Haslum , Beräkningsvetenskap och beräkningsteknik (CST)

Opponent: Professor Joakim Lindblad, Uppsala University; Department of Information Technology; Vi3; Image Analysis

Handledare: Associate Professor Kevin Smith, Science for Life Laboratory, SciLifeLab, Beräkningsvetenskap och beräkningsteknik (CST); Associate Professor Hossein Azizpour, Science for Life Laboratory, SciLifeLab, Robotik, perception och lärande, RPL, SeRC - Swedish e-Science Research Centre; Erik Müllers, AstraZeneca; Karl-Johan Leuchowius, AstraZeneca

Exportera till kalender

QC 20240520

Abstract

I jakten på nya mediciner är strategier för att effektivisera processen för läkemedelsupptäckt avgörande. Bildbaserad fenotypisk profilering, med sina miljontals bilder på fluorescent färgade celler, erbjuder ett rikt och effektivt sätt att fånga de morfologiska effekterna av potentiella behandlingar på levande system. Inom sådan komplex data kan okända biologiska insikter identifieras och nya läkemedelsbehandlingar upptäckas, men analysmetoder kapabla att extrahera informationen krävs för att urskilja dem.

Denna avhandling utforskar maskininlärningens roll i att förbättra användbarheten och analysen av fenotypisk data. Den tar sig an utmaningar specifika för denna typ av data, såsom bristen på tillförlitliga annoteringar som krävs för övervakad inlärning, samt förväxlingsfaktorer i datan som ofta är oundvikliga på grund av experimentell variation. Vi utforskar överföringsinlärning för att öka modellernas generaliseringsförmåga och robusthet, samt analyserar hur faktorer som domänavstånd, initialisering, datamängd och modellarkitektur påverkar effektiviteten i att tillämpa förtränade vikter från naturliga domäner på biomedicinska.

Vidare fördjupar vi oss i oövervakad inlärning för fenotypiska bilddata, men upptäcker att dess direkta tillämpning är otillräcklig i detta sammanhang eftersom den inte lyckas skilja mellan olika biologiska effekter. För att hantera detta utvecklar vi nya strategier för oövervakat lärande, designade för att modellen ska kunna ignorera experimentellt brus, vilket förbättrar dess förmåga att urskilja effekterna av olika behandlingar. Vi utvecklar även en teknik som gör det möjligt för en modell tränad för fenotypisk profilering att anpassas till ny data från en okänd källa utan behov av några annoteringar eller övervakat lärande. Med denna metod kan en generell fenotypisk profilmodell enkelt anpassas till data från olika källor utan annoteringar.

Utöver våra tekniska bidrag visar vi också att bioaktiva substanser identifierade med metoderna i denna avhandling har bekräftats experimentellt. Våra resultat tyder på att även om fenotypiska data och biomedicinsk bilddata utgör komplexa utmaningar, kan maskininlärning spela en avgörande roll i att göra den tidiga fasen av läkemedelsupptäckt mer effektiv.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-346574