SF2955 Datorintensiva metoder inom matematisk statistik 7,5 hp

Computer Intensive Methods in Mathematical Statistics

Kursens övergripande mål är att ge grundläggande kunskap, förståelse och problem-lösningsfärdighet inom områden av statistisk inferens där ytterst få och enkla antaganden behöver göras om hur mätdata har genererats, samt att använda datorer för att utföra de beräkningsintensiva kalkyler som ofta krävs.

  • Utbildningsnivå

    Avancerad nivå
  • Huvudområde

    Matematik
  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

VT19 TTMAM m.fl. för programstuderande

VT19 SAP för Study Abroad Programme (SAP)

  • Perioder

    VT19 P4 (7,5 hp)

  • Anmälningskod

    20052

  • Kursen startar

    2019-03-18

  • Kursen slutar

    2019-06-04

  • Undervisningsspråk

    Engelska

  • Studielokalisering

    KTH Campus

  • Undervisningstid

    Dagtid

  • Undervisningsform

    Normal

  • Antal platser

    Ingen begränsning

  • Kursansvarig

    Jimmy Olsson <jimmyol@kth.se>

  • Lärare

    Jimmy Olsson <jimmyol@kth.se>

  • Målgrupp

    Study Abroad Programme

VT20 för programstuderande

Lärandemål

Efter fullgjord kurs förväntas studenten kunna

  • Simulera data från en-dimensionella sannolikhetsfördelningar samt flerdimensionella normalfördelningar.
  • Redogöra för principerna bakom bootstrap och jackknife.
  • Använda bootstrap och jackknife för att skatta systematiska fel och osäkerheter (medelfel) för skattningar baserade på oberoende likafördelade mätdata.
  • Använda bootstrap i mer komplicerade situationer som flera oberoende stickprov, regressionsmodeller och tidsserier.
  • Beräkna konfidensintervall med hjälp av bootstrap både med enkla percentilintervall samt baserade på (approximativa) pivot-storheter.
  • Redogöra för principerna bayesiansk statistik, a-priori- och a-posteriori-fördelning och i konkreta problem bestämma deras samband.
  • Redogöra för principerna bakom Markov Chain Monte Carlo och varför denna metod kan användas för att generera utfall av komplicerade fördelningar
  • Tillämpa Markov Chain Monte Carlo på praktiska problem samt kunna använda programpaket som BUGS.
  • Redogöra för principerna bakom modellval speciellt prediktionsförmåga som mått på en modells precision.
  • Relatera och jämföra olika metoder för modellval som korsvalidering, Akaike Information Criterion och Bayesian Information Criterion.

För att uppnå högsta betyg förväntas studenten dessutom kunna följande:

  • Kombinera samtliga ovannämnda begrepp och metoder för att lösa mer sammansatta problem.

Kursens huvudsakliga innehåll

Simulering är en teknik att analysera komplicerade funktioner av stokastiska variabler genom att lotta fram utfall av dem. Detta gör att man slipper besvärliga analytiska beräkningar t ex för fördelningen för stickprovsvariabler.

Markov Chain Monte Carlo (MCMC) är ett samlingsnamn för en klass av metoder som går ut på att använda listigt valda Markovkedjor för att generera utfall från komplicerade fördelningar. Dessa metoder har viktiga tillämpningar inom Bayesiansk inferens men även inom optimering och statistisk mekanik. De möjliggör simuleringslösningar av problem som är svåra att behandla analytiskt.

Bayesianska metoder i matematisk statistik möjliggör att inkludera förhanskunskap om parametrars värden i den statistiska analysen.

Bootstrap ("att lyfta sig själv i håret/stövelskaften") och jackknife ("fällkniv/ universalverktyg") är två moderna generella metoder som möjliggör att få en skattning av osäkerheten i en skattning av en parameter. Detta görs utan att man har någon som helst uppfattning om stickprovs-variablernas exakta (eller ens approximativa) fördelningar. Idén bygger på att man skaffar sig ett stort antal fingerade datauppsättningar ur de ursprungliga mätdata. Genom att studera hur skattningarna varierar mellan dessa olika fingerade data-uppsättningar får man information om spridningen i skattningarna. Dessa upprepade datagenereringar och därpå följande skattningar kräver ofta omfattande beräkningar som först med datorernas intåg blivit möjliga att utföra. Karaktäristiskt är alltså att man slipper att fundera så mycket på olika skattningars statistiska fördelningar och deras egenskaper.

Modellval handlar om det viktiga problemet att välja den "bästa" av ett antal föreslagna modeller.

Behörighet

Grundkurs i Matematisk statistik eller motsvarande kurs. Kunskaper i MATLAB.

Litteratur

Englund, Gunnar. Datorintensiva metoder i matematisk statistik. Kompendium från KTH

Kursmaterial från institutionen för matematik.

Examination

  • OVNA - Inlämningsuppgifter, 3,0, betygsskala: P, F
  • TENA - Tentamen, 4,5, betygsskala: A, B, C, D, E, FX, F

Krav för slutbetyg

Godkänd skriftlig tentamen (TEN1: 4,5 hp), godkända inlämningsuppgifter (3,0 hp).

Ges av

SCI/Matematik

Kontaktperson

Jimmy Olsson (jimmyol@kth.se)

Examinator

Jimmy Olsson <jimmyol@kth.se>

Övrig information

Ges endast vartannat år.

Versionsinformation

Kursplan gäller från och med VT2013.
Examinationsinformation gäller från och med VT2013.