FDD3359 Reinforcement Learning 6,0 hp

Administrera Om kursen

Om kursomgång

Gäller för kursomgång

VT 2024 Start 2024-01-16 programstuderande

Målgrupp

Ingen information tillagd

Del av program

Ingen information tillagd

Perioder

P3 (6,0 hp)

Varaktighet

2024-01-16

2024-03-15

Studietakt

50%

Undervisningsform

Normal Dagtid

Undervisningsspråk

Engelska

Studielokalisering

KTH Campus

Antal platser

Ingen platsbegränsning

Planerade schemamoduler

Kurs-PM

Kurs-PM är inte publicerat

Schema

Schema är inte publicerat

Kursval

Gäller för kursomgång

VT 2024 Start 2024-01-16 programstuderande

Anmälningskod

60870

Kontakt

Gäller för kursomgång

VT 2024 Start 2024-01-16 programstuderande

Kontaktperson

Johannes Stork

Examinator

Ingen information tillagd

Kursansvarig

Ingen information tillagd

Lärare

Ingen information tillagd

Rubriker med innehåll från kursplan FDD3359 (VT 2019–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Följade områden kommer bland annat att behandlas:

Reinforcement learning med kända och okända modeller, diskreta och kontinuerliga dynamiska system, Markov process formalism, Bellman optimality principle, exakta och approximativa algoritmer, konvergens bevis, action policies, MDPs, discounted MDPs, POMDPs, reinforcement learning med temporal difference, Monte Carlo, och Q-learning.

I kursen ingår också moment där studeter ska förberedda en föreläsning samt utveckla en laboration där andra studenter medverkar.

Lärandemål

Kursen ger en introduktion till området reinforcement learning. Målet är att studenter ska bekantas med olika metoder som avänds för inlärning baserat pååterkoppling.

Efter genomförd kurs ska du kunna:

* identifiera grundläggande begrepp, terminologi, teorier, modeller och metoder inom reinforcement learning

* utveckla och systematiskt testa ett antal grundläggande metoder inom reinforcement learning

* experimentellt utvärdera olika inlärningsalgoritmer och tolka och dokumentera resultat av experimentella undersökningar

* välja lämplig metod för att automatiskt bearbeta olika typer av data som tex sensordata som används i styrningsalgoritmer

* redogöra för grundläggande metoder och begränsningar inom reinforcement learning

* bygga en verktygslåda av olika algoritmer och kunna tillämpa dessa på verkliga problem

för att

* känna till grundläggande möjligheter och begränsningar för reinforcement learning och därmed kunna bedöma vilka problem inom t.ex. robot rörelsereglering och automatiskt beslutsfattande som kan lösas med dessa tekniker

* kunna implementera, analysera och utvärdera enkla system baserat på reinforcement learning

* ha en bred kunskapsbas för att kunna läsa och tillgodogöra sig litteratur inom området.

Kurslitteratur och förberedelser

Särskild behörighet

Ingen information tillagd

Rekommenderade förkunskaper

Ingen information tillagd

Utrustning

Ingen information tillagd

Kurslitteratur

Ingen information tillagd

Examination och slutförande

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Betygsskala

P, F

Examination

EXA1 - Examination, 6,0 hp, betygsskala: P, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

SEM1 (4hp, P/F), PRO1 (2hp, P/F)

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Danica Kragic Jensfelt

Etiskt förhållningssätt

Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

EECS/Robotik, perception och lärande

Huvudområde

Denna kurs tillhör inget huvudområde.

Utbildningsnivå

Forskarnivå

Påbyggnad

Ingen information tillagd

Kontaktperson

Johannes Stork

Forskarkurs

Forskarkurser på EECS/Robotik, perception och lärande