Hoppa till huvudinnehållet
Till KTH:s startsida Till KTH:s startsida

DD1418 Språkteknologi med introduktion till maskininlärning 6,0 hp

Kursen i språkteknologi på grundnivå behandlar olika metoder för analys, generering och filtrering av mänskligt språk med fokus på text. Regelbaserade och statistiska metoder används och undersöks till exempel för informationssökning, stavnings- och grammatikkontroll, och maskinöversättning. Den ger också en introduktion till maskininlärning och exempel på hur maskininlärning kan tillämpas inom språkteknologin.

Kursen går igenom såväl teori, tekniker som tillämpningsområden.

Välj termin och kursomgång

Välj termin och kursomgång för att se aktuell information och mer om kursen, såsom kursplan, studieperiod och anmälningsinformation.

Kursval

Gäller för kursomgång

HT 2024 Start 2024-10-28 programstuderande

Anmälningskod

50639

Rubriker med innehåll från kursplan DD1418 (HT 2021–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Teori:

Språkteknologins historiska utveckling och grunder, morfologi, syntax och semantik, vektorrumsmodeller, utvärderingsmetoder, maskininlärning, informationsteori och Markov-modeller.

Tekniker:

Morfologisk analys och generering, språkstatistik och korpusbearbetning, parsning, språkgenerering, ordklasstaggning, namnigenkänning och probabilistisk parsning, statistisk lexikal semantik.

Tillämpningsområden:

Stavnings- och grammatikkontroll, informationssökning, ordprediktion för smart textinmatning, textklustring och textkategorisering, datorstödd språkinlärning, dialogsystem, talteknologi och maskinöversättning.

Lärandemål

Efter godkänd kurs ska studenten kunna

  1. förklara och använda grundläggande begrepp inom språkvetenskap, språkteknologi och maskininlärning,
  2. tillämpa språkteknologiska begrepp, metoder och verktyg för att bygga språkteknologiska system, samt kunna förklara uppbyggnaden av sådana system,
  3. implementera standardmetoder inom språkteknologi,
  4. utforma och genomföra enklare utvärderingar av ett språkteknologiskt system, samt kunna tolka resultaten,
  5. självständigt kunna lösa ett välavgränsat praktiskt språkteknologiskt problem

i syfte att kunna

  • göra ett kandidatexamensarbete med språkteknologisk eller maskininlärningsinriktning,
  • vara en viktig länk mellan systemarkitekter, programmerare och interaktionsdesigner i såväl arbetsliv som forskning.

Kurslitteratur och förberedelser

Särskild behörighet

  • Kunskaper och färdigheter i programmering, 6 hp, motsvarande slutförd kurs DD1310/DD1311/DD1312/DD1314/DD1315/DD1316/DD1318/DD1331/DD1337/DD100N/ID1018.
  • Kunskaper i grundläggande datalogi, 6 hp, motsvarande slutförd kurs DD1320/DD1321/DD1325/DD1327/DD1338/ID1020/ID1021.
  • Kunskaper i sannolikhetslära, 6 hp, motsvarande slutförd kurs SF1912/SF1914-SF1924.

Aktivt deltagande i kursomgång vars slutexamination ännu inte är Ladokrapporterad jämställs med slutförd kurs. Den som är registrerad anses vara aktivt deltagande. Med slutexamination avses både ordinarie examination och det första omexaminationstillfället.

Rekommenderade förkunskaper

Ingen information tillagd

Utrustning

Ingen information tillagd

Kurslitteratur

Ingen information tillagd

Examination och slutförande

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Betygsskala

A, B, C, D, E, FX, F

Examination

  • LAB1 - Laborationsuppgifter, 1,5 hp, betygsskala: P, F
  • PRO1 - Projektuppgift, 1,5 hp, betygsskala: A, B, C, D, E, FX, F
  • TEN1 - Tentamen, 3,0 hp, betygsskala: A, B, C, D, E, FX, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Etiskt förhållningssätt

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

Huvudområde

Teknik

Utbildningsnivå

Grundnivå

Påbyggnad

Till exempel DD2476 Sökmotorer och informationssökningssystem, DT2112 Talteknologi.

Kontaktperson

Johan Boye jboye@kth.se

Övrig information

Kursen överlappar med DD2417 Språkteknologi. DD1418 är på grundnivå och har ett mindre avancerat projekt än DD2417.

DD1418 kan inte kombineras med DD2417 eller DD2418.

I denna kurs tillämpas EECS hederskodex, se:
http://www.kth.se/eecs/utbildning/hederskodex