Hoppa till huvudinnehållet
Till KTH:s startsida Till KTH:s startsida

SF1930 Statistisk inlärning och dataanalys 6,0 hp

Kursen ger en introduktion till teorin för modern statistisk inferens och inlärning.

Välj termin och kursomgång

Välj termin och kursomgång för att se aktuell information och mer om kursen, såsom kursplan, studieperiod och anmälningsinformation.

Kursval

Gäller för kursomgång

HT 2024 Start 2024-08-26 programstuderande

Anmälningskod

52123

Rubriker med innehåll från kursplan SF1930 (HT 2021–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Kursen ger en introduktion till teorin för statistisk inferens och prediktion, vilka utgör de grundläggande målen för modern statistisk dataanalys och maskininlärning. Stor vikt ges åt flerdimensionella sannolikhetsfördelningar och exponentialfamiljer, vilka är fundamentala verktyg för att modellera dataanalytiska problem, och med hjälp av grafiska modeller erhålls en kraftfull teori för att beskriva betingade beroenden med bäring på statistiska inferensproblem av hög dimension. Beslutsteori ger ett ramverk för att dels fatta optimala beslut under statistisk osäkerhet, dels väga olika statistiska tillvägagångssätt mot varandra. Speciellt spelar Bayesiansk beslutsteori – i vilken inferens- och inlärningsproblemen löses genom beräknandet av posteriorifördelningar respektive prediktiva fördelningar – idag en central roll inom statistisk dataanalys och används för att konstruera Bayesianska punktskattningar, hypotestest och kredibilitetsintervall. Parallellt med det Bayesianska synsättet diskuteras även likelihood-teori och i synnerhet maximum likelihood-skattningens asymptotiska egenskaper då mängden data växer mot oändligheten. I kursen introduceras även grundläggande statistiska beräkningsmetoder, såsom stokastiska gradientmetoder och Markovkedjemetoder (MCMC). Sådana metoder är av stor betydelse inom modern datorintensiv statistik och tillämpas i kursen på verkliga dataanalytiska problem inom ramen för ett datorbaserat projekt.

Lärandemål

Efter avslutad kurs ska studenten kunna:

  • formulera och tillämpa begrepp inom statistisk inferens och prediktion för att lösa teoretiska problem;
  • formulera och tillämpa metoder inom statistisk inferens och prediktion för att lösa problem inom dataanalys;
  • utforma och implementera metoder inom statistisk inlärning för dataanalys.

Kurslitteratur och förberedelser

Särskild behörighet

Slutförd grundkurs i sannolikhetsteori och statistik (SF1918, SF1922 eller motsvarande).

Rekommenderade förkunskaper

Ingen information tillagd

Utrustning

Ingen information tillagd

Kurslitteratur

Meddelas senast 4 veckor före kursstart på kursens hemsida.

Examination och slutförande

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Betygsskala

A, B, C, D, E, FX, F

Examination

  • INL1 - Inlämningsuppgift, 2,0 hp, betygsskala: P, F
  • TEN1 - Skriftlig tentamen, 4,0 hp, betygsskala: A, B, C, D, E, FX, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Etiskt förhållningssätt

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

Huvudområde

Teknik

Utbildningsnivå

Grundnivå

Påbyggnad

  • SF2930 Regressionsanalys
  • SF2935 Moderna metoder för statistisk inlärning
  • SF2955 Datorintensiva metoder inom matematisk statistik
  • SF2957 Statistisk maskininlärning

Kontaktperson

Joakim Andén-Pantera (janden@kth.se)