Swedish Treebank


The Swedish Treebank is a syntactically annotated corpus. The annotation includes word and sentence boundaries, morphological information (word classes etc.), and syntactic information (phrases and grammatical functions, dependency structure). The Swedish Treebank is based on two previous corpora, Talbanken and SUC, which have been harmonised. The Swedish Treebank contains approx. 350,000 tokens.

Swedish Treebank är en syntaktiskt annoterad korpus. Annoteringen innebär ord- och meningsgränser, morfologisk information (ordklass m.m.), samt syntaktisk information (fraser och grammatiska funktioner, dependensstruktur). Swedish Treebank bygger på två redan befintliga korpusar, Talbanken och SUC, som har blivit harmoniserade. Swedish Treebank består av drygt 350.000 tokens.

DOI https://doi.org/
Metadata Access https://datacatalogue.cessda.eu/oai-pmh/v0/oai?verb=GetRecord&metadataPrefix=oai_ddi25&identifier=5ae01ce9ae8e236f166f02d5c45e3bb84c75dee780095682903ec7e7fd41a77f
Creator Nivre, Joakim; Megyesi, Beáta; Dahlqvist, Bengt; Sågvall Hein, Anna; Hall, Johan; Nilsson, Jens; Gustafson-Capková, Sofia
Publisher Swedish National Data Service; Svensk nationell datatjänst
Publication Year 2020
Rights Access to data through an external actor. Data are freely accessible.; Åtkomst till data via extern aktör. Data är fritt tillgängliga.
OpenAccess true
Contact https://snd.gu.se
Discipline Humanities; Linguistics
Spatial Coverage Sweden; Sverige