Visa version
Version skapad av Johan Boye 2014-10-21 12:28
Resurser
- Användbara verktyg hittar du bland annat bland Språkteknologigruppens verktyg.
- Weka är en bra verktygslåda för maskininlärning. Här är en testfil till Weka.
- Användbara korpusar, hittar du t.ex. hos Språkbanken, mer specifikt här.
- Det finns även ett korpus med svensk text (ca 3,3 miljoner ord) att kopiera från kurskatalogen: /info/sprakt12/korpus .
- Google har publicerat n-gram-statistik för engelska och några andra språk (tyvärr inte svenska).
- Natural Language ToolKit har en massa användbar Python-kod och en mängd (engelska) korpusar.
- Här finns ett användbart Java-bibliotek för Hidden Markov Models (HMMs).