DD2437 Artificiella neuronnät och djupa arkitekturer 7,5 hp

Artificial Neural Networks and Deep Architectures

  • Utbildningsnivå

    Avancerad nivå
  • Huvudområde

    Datalogi och datateknik
    Informationsteknik
  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

VT19 annda19 för programstuderande

VT19 annda19 för programstuderande

  • Perioder

    VT19 P3 (7,5 hp)

  • Anmälningskod

    60747

  • Kursen startar

    2019-01-15

  • Kursen slutar

    2019-03-15

  • Undervisningsspråk

    Engelska

  • Studielokalisering

    KTH Campus

  • Undervisningstid

    Dagtid

  • Undervisningsform

    Normal

  • Antal platser

    Ingen begränsning

  • Kursansvarig

    Erik Fransén <erikf@kth.se>

    Pawel Herman <paherman@kth.se>

  • Lärare

    Pawel Herman <paherman@kth.se>

  • Målgrupp

    Sökbar för studenter från årskurs 3 och för studenter antagna på ett masterprogram.

VT19 annda19 för Study Abroad Programme (SAP)

  • Perioder

    VT19 P3 (7,5 hp)

  • Anmälningskod

    20075

  • Kursen startar

    2019-01-15

  • Kursen slutar

    2019-03-15

  • Undervisningsspråk

    Engelska

  • Studielokalisering

    KTH Campus

  • Undervisningstid

    Dagtid

  • Undervisningsform

    Normal

  • Antal platser

    Ingen begränsning

HT19 annda219 för programstuderande

VT20 annda120 för programstuderande

HT18 annda18 för programstuderande

HT18 SAP för Study Abroad Programme (SAP)

  • Perioder

    HT18 P1 (7,5 hp)

  • Anmälningskod

    10115

  • Kursen startar

    2018-08-27

  • Kursen slutar

    2018-10-26

  • Undervisningsspråk

    Engelska

  • Studielokalisering

    KTH Campus

  • Undervisningstid

    Dagtid

  • Undervisningsform

    Normal

  • Antal platser

    Ingen begränsning

  • Målgrupp

    Endast öppet för studenter från avtalsuniversitet inom programmet SAP.

Lärandemål

Efter kursen ska studenten kunna 

  • beskriva strukturen och funktionen hos de vanligaste artificiella neurala nätverkstyperna (ANN), t.ex. (framåtkopplade) multi-layer perceptron, rekurrenta nätverk, self-organising maps, Boltzmann-maskin, deep nelief networks, autoencoder, och ge exempel på deras tillämpningar
  • förklara mekanismer för övervakat(supervised)/oövervakat(unsupervised) lärande från data- och informationsbehandling i olika ANN-arkitekturer, samt redogöra för derivat av de grundläggande ANN-algoritmer som diskuteras i kursen
  • visa när och hur djupa arkitekturer leder till ökad prestanda i mönsterigenkänning och datautvinningsproblem
  • kvantitativt analysera processen och resultaten av lärandet i ANN, och redogöra för deras brister och begränsningar
  • tillämpa, validera och utvärdera föreslagna typer av ANN i typiska mindre problem inom regression, förutsägelse, mönsterigenkänning, schemaläggning och optimering
  • utforma och implementera ANN-metoder för utvalda problem i mönsterigenkänning, systemidentifikation eller prediktiv analys med hjälp av allmänt tillgängliga utvecklingsverktyg och kritiskt granska deras användbarhet

för att studenten ska

  • erhålla en förståelse för den tekniska potentialen samt fördelar och begränsningar i dagens lärande, adaptiva och självorganiserande system,
  • förvärva ANN-utövarens praktiska kompetens att tillämpa och utveckla ANN-baserade lösningar på dataanalysproblem.

Kursens huvudsakliga innehåll

Kursen berör beräkningsproblem i massivt parallella artificiella neurala nätverksarkitekturer (ANN), som bygger på distribuerade enkla beräkningsnoder och robusta inlärningsalgoritmer som iterativt anpassar ansutningarna mellan noderna genom att i stor utsträckning använda tillgängliga data. Inlärningsregeln och nätverksarkitekturen avgör ANNs specifika beräkningsegenskaper. Kursen erbjuder en möjlighet att utveckla den konceptuella och teoretiska förståelsen av beräkningsförmågan hos ANNs med utgångspunkt i enklare system för att sedan gradvis studera mer avancerade arkitekturer. Därmed studeras en stor bredd av inlärningstyper – från strikt övervakade till rent explorativt oövervakade lägen. Kursens innehåll inkluderar därför bl.a. multi-layer perceptrons (MLPs), self-organising maps (SOMs), Boltzmann-maskiner, Hopfield-nätverk och state-of-the-art djupa neurala nätverk (DNNs) tillsammans med motsvarade inlärningsalgritmer. Ett viktigt kursmål är att studenterna ska erhålla praktisk erfarenhet av att välja, utveckla, tillämpa och validera lämpliga nätverk och algoritmer för att effektivt kunna hantera en bred klass av regression, klassificering, temporal prediktion, datamodellering, explorativ dataanalys och klustringsproblem. Slutligen ger kursen avslöjande insikter i principerna om ANNs generaliseringskapacitet, vilka ligger till grund för dess prediktiva kraft.

Behörighet

Rekommenderade förkunskaper

Motsvarande de för D, E eller F obligatoriska kurserna i matematik, numeriska metoder och datalogi.

Litteratur

[1] Stephen Marsland. Machine Learning, an Algorithmic Perspective, 2009,CSC-Press. 

[2] Ian Goodfellow, Yoshua Bengio, and Aaron Courville. Deep learning., 2016, MIT press.

Ytterligare rekommenderad läsning kommer att tillkännages på kursens hemsida.

Examination

  • LAB2 - Laborationsuppgifter, 4,0, betygsskala: P, F
  • TEN2 - Tentamen, 3,5, betygsskala: A, B, C, D, E, FX, F

Ges av

EECS/Intelligenta system

Kontaktperson

Pawel Herman e-post: paherman@kth.se

Examinator

Erik Fransén <erikf@kth.se>

Pawel Herman <paherman@kth.se>

Versionsinformation

Kursplan gäller från och med VT2019.
Examinationsinformation gäller från och med VT2019.