SF2956 Topologisk dataanalys 7,5 hp

Topological Data Analysis

  • Utbildningsnivå

    Avancerad nivå
  • Huvudområde

    Matematik
  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

HT19 för programstuderande

HT18 för programstuderande

HT18 Doktorand för fristående studerande

  • Perioder

    HT18 P1 (7,5 hp)

  • Anmälningskod

    10170

  • Kursen startar

    2018-08-27

  • Kursen slutar

    2018-10-26

  • Undervisningsspråk

    Engelska

  • Studielokalisering

    KTH Campus

  • Undervisningstid

    Dagtid

  • Undervisningsform

    Normal

  • Antal platser *

    Max. 1

    *) Vid fler sökande än platser kommer urval att ske.

  • Kursansvarig

    Wojciech Chachólski <wojtek@kth.se>

  • Lärare

    Wojciech Chachólski <wojtek@kth.se>

  • Målgrupp

    För doktorander på KTH

Lärandemål

I den här kursen presenteras topologiska konstruktioner av stabila signaturer (s.k. streckkoder) av datamängder och hur dessa signaturer kan användas för att extrahera information ur utfall av olika hierarkiska klustringsalgoritmer. Dessa metoder används även som förbehandling för att transformera komplexa data till objekt som kan vara lämpliga för statistisk analys. Vi visar hur dessa metoder kan vara användbara för att visualisera olika aspekter av data. En del av kursen ägnas åt hur man kan extrahera homologier ur data, baserat på simpla komplex. Kursen innehåller både teoretiska och praktiska aspekter inom topologisk dataanalys. Datorbaserade projekt kommer integreras i kursen.

Efter fullgjord kurs förväntas studenten kunna:

  • förklara begreppen metriskt rum och ultrametriskt rum

  • visualisera ultrametriska rum som dendrogram

  • extrahera streckkoder ur dendogram

  • beräkna flaskhalsavstånd mellan streckkoder

  • använda streckkoder för att identifiera homologiska egenskaper i data

  • känna till grundläggande metoder för att extrahera homologier baserat på simpla komplex

  • känna till stabilitetsegenskaper i klassiska hierarkiska klustringsalgoritmer

För att uppnå högsta betyg förväntas studenten kunna

  • använda de presenterade metoder, som hierarkisk klustring och streckkoder för olika homologigrupper för att visualisera egenskaper för olika typer av data

Kursens huvudsakliga innehåll

Kursen behandlar foljande ämnen:

  • Kleinbergs teorem om omöjlighet av klustring,
  • metriska rum och dendrogram
  • klassiska hierakiska klustringsalgoritmer
  • begrepp inom simpla komplex
  • transformation av data till simpla komplex via Chech och Vietoris-Rips konstruktioner
  • extrakthera homologier av data baserat pa simpla komplex
  • moduler, streckkoder och visualisering av egenskaper hos data

Kursupplägg

Föreläsningar, presentationer och dataanalys

Behörighet

Kurser i linjär algebra, en- och flervariabelanalys, numeriska metoder, matematisk statistik, sannolikhetsteori, moderna metoder för statistisk inlärning.

Litteratur

Böcker, artiklar och föreläsningsanteckningar som presenteras på kursens hemsida.

Examination

  • TEN1 - Tentamen, 7,5, betygsskala: A, B, C, D, E, FX, F

Skriftlig tentamen.

Krav för slutbetyg

Godkänd skriftlig tentamen.

Ges av

SCI/Matematik

Kontaktperson

Wojtek Chacholski (wojtek@kth.se)

Examinator

Wojciech Chachólski <wojtek@kth.se>

Versionsinformation

Kursplan gäller från och med VT2017.
Examinationsinformation gäller från och med HT2017.