SF2955 Datorintensiva metoder inom matematisk statistik 7,5 hp

Computer Intensive Methods in Mathematical Statistics

Kursens övergripande mål är att ge grundläggande kunskap, förståelse och problem-lösningsfärdighet inom områden av statistisk inferens där ytterst få och enkla antaganden behöver göras om hur mätdata har genererats, samt att använda datorer för att utföra de beräkningsintensiva kalkyler som ofta krävs.

Visa kursinformation utifrån vald termin och kursomgång:

Kursomgång och genomförande

Ingen kursomgång är vald

Välj termin och kursomgång ovan för att få information från rätt kursplan och kursomgång.

Kursinformation

Innehåll och lärandemål

Kursinnehåll *

Simulering är en teknik att analysera komplicerade funktioner av stokastiska variabler genom att lotta fram utfall av dem. Detta gör att man slipper besvärliga analytiska beräkningar t ex för fördelningen för stickprovsvariabler.

Markov Chain Monte Carlo (MCMC) är ett samlingsnamn för en klass av metoder som går ut på att använda listigt valda Markovkedjor för att generera utfall från komplicerade fördelningar. Dessa metoder har viktiga tillämpningar inom Bayesiansk inferens men även inom optimering och statistisk mekanik. De möjliggör simuleringslösningar av problem som är svåra att behandla analytiskt.

Bayesianska metoder i matematisk statistik möjliggör att inkludera förhanskunskap om parametrars värden i den statistiska analysen.

Bootstrap ("att lyfta sig själv i håret/stövelskaften") och jackknife ("fällkniv/ universalverktyg") är två moderna generella metoder som möjliggör att få en skattning av osäkerheten i en skattning av en parameter. Detta görs utan att man har någon som helst uppfattning om stickprovs-variablernas exakta (eller ens approximativa) fördelningar. Idén bygger på att man skaffar sig ett stort antal fingerade datauppsättningar ur de ursprungliga mätdata. Genom att studera hur skattningarna varierar mellan dessa olika fingerade data-uppsättningar får man information om spridningen i skattningarna. Dessa upprepade datagenereringar och därpå följande skattningar kräver ofta omfattande beräkningar som först med datorernas intåg blivit möjliga att utföra. Karaktäristiskt är alltså att man slipper att fundera så mycket på olika skattningars statistiska fördelningar och deras egenskaper.

Modellval handlar om det viktiga problemet att välja den "bästa" av ett antal föreslagna modeller.

Lärandemål *

Efter fullgjord kurs förväntas studenten kunna

  • Simulera data från en-dimensionella sannolikhetsfördelningar samt flerdimensionella normalfördelningar.
  • Redogöra för principerna bakom bootstrap och jackknife.
  • Använda bootstrap och jackknife för att skatta systematiska fel och osäkerheter (medelfel) för skattningar baserade på oberoende likafördelade mätdata.
  • Använda bootstrap i mer komplicerade situationer som flera oberoende stickprov, regressionsmodeller och tidsserier.
  • Beräkna konfidensintervall med hjälp av bootstrap både med enkla percentilintervall samt baserade på (approximativa) pivot-storheter.
  • Redogöra för principerna bayesiansk statistik, a-priori- och a-posteriori-fördelning och i konkreta problem bestämma deras samband.
  • Redogöra för principerna bakom Markov Chain Monte Carlo och varför denna metod kan användas för att generera utfall av komplicerade fördelningar
  • Tillämpa Markov Chain Monte Carlo på praktiska problem samt kunna använda programpaket som BUGS.
  • Redogöra för principerna bakom modellval speciellt prediktionsförmåga som mått på en modells precision.
  • Relatera och jämföra olika metoder för modellval som korsvalidering, Akaike Information Criterion och Bayesian Information Criterion.

För att uppnå högsta betyg förväntas studenten dessutom kunna följande:

  • Kombinera samtliga ovannämnda begrepp och metoder för att lösa mer sammansatta problem.

Kursupplägg

Ingen information tillagd

Kurslitteratur och förberedelser

Särskild behörighet *

Grundkurs i Matematisk statistik eller motsvarande kurs. Kunskaper i MATLAB.

Rekommenderade förkunskaper

Ingen information tillagd

Utrustning

Ingen information tillagd

Kurslitteratur

Englund, Gunnar. Datorintensiva metoder i matematisk statistik. Kompendium från KTH

Kursmaterial från institutionen för matematik.

Examination och slutförande

Betygsskala *

A, B, C, D, E, FX, F

Examination *

  • OVNA - Inlämningsuppgifter, 3,0 hp, betygsskala: P, F
  • TENA - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F

Examinator beslutar, baserat på rekommendation från KTH:s samordnare för funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Övriga krav för slutbetyg *

Godkänd skriftlig tentamen (TEN1: 4,5 hp), godkända inlämningsuppgifter (3,0 hp).

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Jimmy Olsson

Ytterligare information

Kurswebb

Ytterligare information om kursen kan hittas på kurswebben via länken nedan. Information på kurswebben kommer framöver flyttas till denna sida.

Kurswebb SF2955

Ges av

SCI/Matematik

Huvudområde *

Matematik

Utbildningsnivå *

Avancerad nivå

Påbyggnad

Ingen information tillagd

Kontaktperson

Jimmy Olsson (jimmyol@kth.se)

Etiskt förhållningssätt *

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Övrig information

Ges endast vartannat år.