DD1418 Språkteknologi med introduktion till maskininlärning 6,0 hp

Language Engineering with Introduction to Machine Learning

Kursen i språkteknologi på grundnivå behandlar olika metoder för analys, generering och filtrering av mänskligt språk med fokus på text. Regelbaserade och statistiska metoder används och undersöks till exempel för informationssökning, stavnings- och grammatikkontroll, och maskinöversättning. Den ger också en introduktion till maskininlärning och exempel på hur maskininlärning kan tillämpas inom språkteknologin.

Kursen går igenom såväl teori, tekniker som tillämpningsområden.

Visa kursinformation utifrån vald termin och kursomgång:

Kursomgång och genomförande

Ingen kursomgång är vald

Välj termin och kursomgång ovan för att få information från rätt kursplan och kursomgång.

Kursinformation

Innehåll och lärandemål

Kursinnehåll *

Teori:

Språkteknologins historiska utveckling och grunder, morfologi, syntax och semantik, vektorrumsmodeller, utvärderingsmetoder, maskininlärning, informationsteori och Markov-modeller.

Tekniker:

Morfologisk analys och generering, språkstatistik och korpusbearbetning, parsning, språkgenerering, ordklasstaggning, namnigenkänning och probabilistisk parsning, statistisk lexikal semantik.

Tillämpningsområden:

Stavnings- och grammatikkontroll, informationssökning, ordprediktion för smart textinmatning, textklustring och textkategorisering, datorstödd språkinlärning, dialogsystem, talteknologi och maskinöversättning.

Lärandemål *

Efter godkänd kurs ska studenten kunna

  1. förklara och använda grundläggande begrepp inom språkvetenskap, språkteknologi och maskininlärning,
  2. tillämpa språkteknologiska begrepp, metoder och verktyg för att bygga språkteknologiska system, samt kunna förklara uppbyggnaden av sådana system,
  3. implementera standardmetoder inom språkteknologi,
  4. utforma och genomföra enklare utvärderingar av ett språkteknologiskt system, samt kunna tolka resultaten,
  5. självständigt kunna lösa ett välavgränsat praktiskt språkteknologiskt problem

i syfte att kunna

  • göra ett kandidatexamensarbete med språkteknologisk eller maskininlärningsinriktning,
  • vara en viktig länk mellan systemarkitekter, programmerare och interaktionsdesigner i såväl arbetsliv som forskning.

Kursupplägg

Teoriföreläsningar och tillämpningsföreläsningar varvade med praktiska laborationer. Ett avslutande projektarbete som redovisas muntligt och skriftligt.

Kurslitteratur och förberedelser

Särskild behörighet *

Slutförd kurs i datalogi motsvarande DD1320/DD1321 Tillämpad datalogi, DD1327 Grundläggande datalogi eller DD1338 Algoritmer och datastrukturer.

Slutförd kurs i sannolikhetsteori och statistik motsvarande SF1918. 

Rekommenderade förkunskaper

Ingen information tillagd

Utrustning

Ingen information tillagd

Kurslitteratur

Uppgift om kurslitteratur meddelas i kurs-PM.

Examination och slutförande

Betygsskala *

A, B, C, D, E, FX, F

Examination *

  • LAB1 - Laborationsuppgifter, 1,5 hp, betygsskala: P, F
  • PRO1 - Projektuppgift, 1,5 hp, betygsskala: A, B, C, D, E, FX, F
  • TEN1 - Tentamen, 3,0 hp, betygsskala: A, B, C, D, E, FX, F

Examinator beslutar, baserat på rekommendation från KTH:s samordnare för funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Examinator beslutar, i samråd med KTH:s samordnare för funktionsnedsättning (Funka), om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning. Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Övriga krav för slutbetyg *

Godkänd labbkurs, projektuppgift och tenta.

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Johan Boye

Ytterligare information

Kurswebb

Ytterligare information om kursen kan hittas på kurswebben via länken nedan. Information på kurswebben kommer framöver flyttas till denna sida.

Kurswebb DD1418

Ges av

EECS/Intelligenta system

Huvudområde *

Teknik

Utbildningsnivå *

Grundnivå

Påbyggnad

Till exempel DD2476 Sökmotorer och informationssökningssystem, DT2112 Talteknologi.

Kontaktperson

Johan Boye jboye@kth.se

Etiskt förhållningssätt *

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Övrig information

Kursen överlappar med DD2418 Språkteknologi. DD1418 är på grundnivå och har ett mindre avancerat projekt än DD2418.

DD1418 kan inte kombineras med DD2418.

I denna kurs tillämpas EECS hederskodex, se:
http://www.kth.se/eecs/utbildning/hederskodex