Till innehåll på sidan
Till KTH:s startsida

Joint Optimization of Pricing and Resource Allocation in Serverless Edge Computing

A Game-Theoretic Perspective

Tid: Ti 2025-06-10 kl 14.00

Plats: F3 (Flodis), Lindstedtsvägen 26 & 28, Stockholm

Videolänk: https://kth-se.zoom.us/j/68670265353?pwd=8TlxcxWOhQ3CT0WiBHXGPDHQjOgKnE.1

Språk: Engelska

Ämnesområde: Elektro- och systemteknik Datalogi

Respondent: Feridun Tütüncüoğlu , Nätverk och systemteknik

Opponent: Professor Xavier Costa-Perez,

Handledare: György Dán, Nätverk och systemteknik; Professor James Gross, Teknisk informationsvetenskap

Exportera till kalender

QC 20250514

Abstract

Den snabba utvecklingen av Internet of Things (IoT), Augmented Reality (AR), autonoma system och intelligent automation ger upphov till förändrade levnadsmönster och revolutionerar industriella processer. Dessa teknologier kräver betydande beräkningsresurser samtidigt som de ställer strikta krav på fördröjning (latens). Ett vanligt tillvägagångssätt för att möta behovet av beräkningsresurser är att utnyttja Cloud Computing (CC), som erbjuder skalbara bearbetningsmöjligheter genom centraliserade datacenter. Detta centraliserade tillvägagångssätt misslyckas dock ofta med att uppfylla strikta latenskrav på grund av kommunikationsfördröjningar orsakade av det geografiska avståndet mellan molnservrar och slutanvändare. Denna begränsning har lett till framväxten av det nya paradigmet Edge Computing (EC), som hanterar latensproblemet genom att placera beräkningsenheter närmare slutanvändarna.

EC-serverkluster förväntas vara mindre i skala och geografiskt mer spridda jämfört med CC-datacenter. Detta introducerar nya utmaningar, inklusive begränsad beräknings- och lagringskapacitet, vilket gör effektiv resursallokering avgörande. Dessutom måste nätverksoperatören som hanterar edge-infrastrukturen säkerställa en ekonomiskt hållbar drift, trots varierande arbetsbelastningar och applikationskrav från användare, vilket kräver gemensamma och anpassningsbara strategier för resursstyrning och prissättning. Function-as-a-Service (FaaS) är ett lovande tillvägagångssätt i detta avseende, eftersom dess betala-per-användning-prismodell gör det möjligt för användare att endast betala för de resurser de förbrukar, samtidigt som det möjliggör dynamisk resursstyrning genom att hela ansvaret för applikationsdistribution överförs till operatören. Denna flexibilitet gör dock att valet av beräkning, minne och bandbreddsresurser blir priskänsligt, vilket ytterligare komplicerar resursstyrning och prissättning.

Artiklarna som ingår i denna avhandling är organiserade i tre delar, där varje del behandlar olika utmaningar relaterade till prissättning, resursallokering och systemdynamik i edge computing. I den första delen av avhandlingen betraktar vi ett sammanhang där Wireless Devices (WD:er) minimerar energi- och penningkostnaderna för beräkningsuppgifter, medan operatören maximerar intäkterna genom att optimera prissättning och applikationscaching under minnesbegränsningar. Vi betraktar ett dynamiskt sammanhang där operatören inte har någon förkunskap om den varierande tillgängligheten av WD över tid. Vi modellerar detta som ett Stackelberg Game (SG) och visar att det finns ett jämviktsläge. För att hantera informationsasymmetri använder vi Bayesiansk optimering för att lära oss prissättningsstrategier, fastställer en övre gräns för dess asymptotiska ånger (en: regret), och föreslår en girig approximationsalgoritm för applikationscaching. Vi undersöker sedan att gemensamt optimera beräknings-, kommunikations- och minnesresurser i ett statiskt nätverkssammanhang, där WDs minimerar kostnaderna för att köra applikationsuppgifter, inklusive penning- och energikostnader. Vi modellerar denna interaktion som ett SG, visar existensen av ett jämviktsläge och bevisar att beräkningen av ett sådant är NP-svårt. Vi föreslår en effektiv approximationsalgoritm med en begränsad approximationskvot. En intressant egenskap hos vår lösning är att operatörens intäkter maximeras när WDs maximerar sina energibesparingar genom beräkningsavlastning. Vidare undersöker vi problemet med hastighetsanpassning, där WDs justerar sina avlastningshastigheter baserat på tillgängliga beräkningsresurser och prissättning. Vi modellerar interaktionen som ett SG och föreslår en Stackelberg gradient play-algoritm som beräknar operatörens implicita intäktsfunktion med avseende på WDs val av avlastningshastighet.

Den andra delen av denna avhandling undersöker en dynamisk nätverks- och prissättningsmodell där WDs anländer till edge-cellen enligt en icke-homogen stokastisk process. Operatören sätter priser baserat på tillgången på WDs och deras heterogena arbetsbelastningskarakteristiska. Vi formulerar problemet att maximera operatörens intäkter som ett sekventiellt beslutsproblem under osäkerhet, där operatörens pris kan vara styckvis linjära eller icke-linjära och kan variera över tid. I ett Markovskt stationärt tillstånd härleder vi analytiska resultat för den optimala prissättningsstrategin, denna fungerar också som en heuristik för det allmänna fallet. För att hantera det allmänna fallet introducerar vi en Generaliserad Markovbeslutsprocess med dolda parametrar och föreslår en dubbel Bayesiansk neurala nätverksapproximator som approximerar tillståndsövergångar och intäkter för att påskynda inlärningen av den optimala prissättningspolicyn. Detta tillvägagångssätt möjliggör förträning på syntetisk data samtidigt som det snabbt anpassar sig till nya belastningsmönster.

Den tredje delen tar upp förbisedda beräkningsutmaningar genom att undersöka påverkan av serverkonkurrens på både operatörens intäkter och applikationers latensbegränsningar. För att hantera detta föreslår vi en konkurrensmodell som valideras genom experiment över applikationer med varierande beräkningsbehov, inklusive L1/L2/L3-cache, I/O och minnesbussanvändning. Vi utvecklar en ny modellbaserad Bayesiansk optimeringsalgoritm för att maximera operatörens intäkter samtidigt som latens- och resurskapacitetskrav uppfylls. De algoritmiska bidragen inom området prissättning och resursstyrning är avsedda att fungera som effektiva, implementerbara och skalbara lösningar som förbättrar robustheten och effektiviteten i resursallokering och prissättning inom EC.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-363353