Topics on Machine Learning for Algorithmic Trading
Tid: Må 2024-12-16 kl 14.00
Plats: F3 (Flodis), Lindstedtsvägen 26 & 28, Stockholm
Språk: Engelska
Ämnesområde: Tillämpad matematik och beräkningsmatematik Matematisk statistik
Respondent: Hanna Hultin , Sannolikhetsteori, matematisk fysik och statistik
Opponent: Professor Olivier Guéant, Université Paris 1 Panthéon-Sorbonne
Handledare: Professor Henrik Hult, Sannolikhetsteori, matematisk fysik och statistik; Alexandre Proutiere, Reglerteknik
QC 2024-11-20
Abstract
Den senaste tidens framsteg inom maskininlärning har skapat nya förutsättningar för algoritmisk handel och möjliggjort optimering av handelsstrategier i komplexa miljöer. Syftet med denna avhandling är att förbättra metoder för algorithmisk handel genom att utveckla modeller baserade på maskininlärning för realistisk simulering av orderböcker samt för lärande av optimala strategier. Avhandlingen består av tre artiklar och kombinerar teoretiska insikter med praktiska tillämpningar.
Den första artikeln utvecklar en generativ modell för den dynamiska utvecklingen av en orderbok baserad på rekurrenta neurala nätverk. Modellen fångar orderbokens fullständiga dynamik genom att bryta ner sannolikheten för varje förändring av orderboken i en produkt av betingade sannolikheter för ordertyp, prisnivå, orderstorlek och tidsfördröjning. Var och en av dessa betingade sannolikheter modelleras med ett rekurrent neuralt nätverk. Dessutom introducerar artikeln flera evalueringsmetoder för generativa modeller relaterade till orderexekvering. Den generativa modellen tränas framgångsrikt både för syntetisk data, genererad av en Markovmodell, och verklig data från Nasdaq Stockholm.
Den andra artikeln föreslår en iterativ deterministisk policygradientmetod för stokastiska kontrollproblem inom finans, som inkluderar både temporär och permanent marknadspåverkan. Metoden är baserad på ett härlett policy gradient teorem och använder stokastisk gradientnedstigning för optimering. Den tillämpas framgångsrikt på både orderexekvering och optionshedging och visar konsekvent bra resultat för varierande objektiv och marknadsdynamik.
Den tredje artikeln studerar en policygradientmetod med parameterbaserad utforskning, där en enda deterministisk policy väljs slumpmässigt i början av en episod och används under hela episoden. En ekvivalens mellan parameterbaserad och handlingsbaserad utforskning visas, vilket möjliggör anpassning av tidigare etablerade konvergensresultat för policygradientmetoder med handlingsbaserad utforskning. Konvergenshastigheter till första ordningens stationära punkter härleds under milda antaganden, och global konvergens etableras under ett introducerat villkor gällande Fisher-icke-degenerering för parameterbaserad utforskning.