Till innehåll på sidan
Till KTH:s startsida

Deep Learning Methods in Transportation and Urban Planning

Advancing data collection and inference methods

Tid: Ti 2026-05-26 kl 08.00

Plats: F3 (Flodis), Lindstedtsvägen 26 & 28, Stockholm

Videolänk: https://kth-se.zoom.us/j/63381308713

Språk: Engelska

Ämnesområde: Transportvetenskap, Transportsystem

Respondent: Tanay Rastogi , Transport och systemanalys

Opponent: Docent Jonas Westin, Umeå universitet

Handledare: Professor Anders Karlström, Transport och systemanalys

Exportera till kalender

QC 20260511

Abstract

Snabb stadsutveckling och den överväldigande mängden data som tillhandahålls av uppkopplade sensorer, mobila enheter och dataset med öppen källkod utmanar traditionella metoder för transportanalys. Dessa metoder är till stor del beroende av stela matematiska modeller, statiska antaganden och glesa mätningar. Denna avhandling visar hur djupinlärning (DL) har potential att bygga en systematiskt bättre datainsamling och inferenskapacitet inom tre kritiska områden i LUTI-cykeln: trafikhantering, befolkningssyntes och val av arbetsplatsplats. Genom fem forskningsartiklar visar denna avhandling att DL-metoder kan komplettera eller överträffa traditionella metoder genom att extrahera mer omfattande data, bygga bättre prediktiva modeller och ge handlingsbara implikationer för planerare. Analysen är uppdelad i två huvudteman: datainsamling och analytisk inferens.

Temat datainsamling föreslår metoder för att omvandla förbisedd eller saknad data till värdefull input för transportmodeller. Artikel 1 använder gatuvideo från fordonsorienterade kameror för att integrera YOLOv5-objektdetektering, StrongSORT-spårning, fotogrammetri och geodesi, vilket automatiserar skapandet av länkomfattande tidsrumsdiagram. Analysen av metoden indikerar att vanliga fordon kan användas för att konstruera ett billigt virtuellt sensornätverk med betydligt större spatial täckning än fasta detektorer eller flytande GPS-bildata. Artikel 3 behandlar undersökningar av saknade attribut genom att inkludera en binär mask i en Wasserstein GAN (WGAN) träningsuppsättning. Den maskerade WGAN lär sig direkt från ofullständiga mikroprover och skapar syntetiska populationer som nära matchar marginal- och gemensamma fördelningar på liknande sätt som modeller tränade på fullständig data, och återställer därmed undersökningsposter som annars skulle vara bortkastade.

Det analytiska inferenstemat associerar de nya datakällorna med DL-aktiverade och hybridmodeller. Artikel 2 anpassar Cell Transmission Model (CTM) och en tvåstegs genetisk algoritm för att utföra fundamentaldiagramparameterkalibrering och randvillkorstilldelning från partiella kamerabanor. Den återställer fritt flödeshastighet och kritisk densitet över tre simulerade arteriella flöden och uppskattar oobserverade densiteter, vilket tyder på att gles syndata kan främja robust trafiktillståndsuppskattning på länknivå. Artikel 4 använder ett villkorligt tabellformat GAN (CT-GAN) för att konstruera syntetiska målårspopulationer direkt från marginaler, tillsammans med en hybrid CT-GAN och Fitness-Based Combinatorical Optimisation pipeline som finjusterar marginalanpassningen. Under experiment visar CT-GAN bättre prestanda för villkorade attribut jämfört med en baslinjemodell i IPF-stil, vilket uppnår högre konvergens och trohet över hela sekvensen. Artikel 5 presenterar ett anpassat djupt neuralt nätverk (DNN) med "zonblock" som tar in yrkestyp, socioekonomiska variabler och multimodal tillgänglighet för att förutsäga arbetsplatsval för över 1 000 jobbalternativ. DNN uppnår överlägsna prestandamått och reproducerar observerade avståndsfördelningar mer exakt än en tvånivås kapslad logitmodell, utan att behöva manuellt konstruera en verktygsspecifikation.

Sammantaget ger denna avhandling fyra huvudsakliga bidrag till litteraturen: (1) Identifiera fordonsmonterade kameror och ofullständiga undersökningar som giltiga, högupplösta datakällor i kombination med DL-pipelines; (2) Utvidga trafiktillståndsuppskattningen till att använda partiella banor extraherade från videosekvenser för att extrahera användbara trafiktillstånd med hjälp av GA-kalibrerade CTM:er; (3) Förbättra syntetisk populationsgenerering, ge bevis för att GAN:er kan uppfylla framtida marginalbegränsningar och lära av glesa, maskerade data; och (4) Generalisera djupinlärningsmodellering till tusentals alternativa exempel, vilket visar att DNN:er kan motsvara eller överträffa traditionella diskreta valmodeller i noggrannhet och beteendemässig realism.

Detta arbete undersöker också nackdelar såsom sensorkalibreringsfel, modelleringsantaganden och generaliserings- och skalbarhetsproblem med DL-modeller, och presenterar lösningar på dessa problem. Avhandlingen diskuterar också policyimplikationer av forskningen och ger rekommendationer för användningen av DL, med lärdomar som är överförbara till sektorer som energi, folkhälsa och rumsliga system.

Sammanfattningsvis för denna avhandling framåt genom att bädda in moderna djupinlärningsmetoder i kärnan av urban transportmodellering, vilket banar väg för mer datarika, flexibla och socialt drivna transportplaneringsverktyg i ett alltmer komplext samhälle. Slutligen visar det att genom att kombinera domänkunskap med skalbara DL-arkitekturer kan potentialen hos befintliga urbana data frigöras för att stödja mer effektiva, hållbara och rättvisa mobilitetssystem.

Link to DiVA